具有改良特征的植物及其制备方法
本发明一般地涉及分子生物学领域并涉及用于通过调节编码GRP(生长相关蛋白)的核酸在植物中表达而改进多种植物特征的方法。本发明还涉及具有编码GRP多肽的核酸的受调节表达的植物,其中所述植物相对于对应野生型植物或其他对照植物具有改良的特征。本发明还提供用于本发明方法中的构建体。
持续增长的世界人口和农业用可耕地供应萎缩刺激了有关增加农业效率的研究。常规的作物及园艺学改良手段利用选择育种技术以鉴定具有受欢迎特性的植物。然而,此类选择育种技术具有几个缺陷,即这些技术一般耗费很多劳动并且产生这样的植物,其经常含有异源性遗传组分,其可能不总是导致从亲代植物中传递的所希望性状。分子生物学进展已经允许人类改良动物及植物的种质。植物的遗传工程使得可以分离和操作遗传物质(一般处于DNA或RNA形式)并且随后引入该遗传物质至植物中。此类技术具有产生具备多种经济学、农学或园艺学改良性状的作物或植物的能力。
具有特殊经济意义的性状是增加的产量。产量通常定义为来自作物的经济价值的可测量结果。该结果可以就数量和/或品质方面进行定义。产量直接取决于几个因素,例如器官的数目和大小、植物构造(例如枝的数目)、种子产生、叶衰老等。根发育、营养物摄入量、胁迫耐受性和早期萌发势(early vigor)也可以是决定产量的重要因素。优化前述因素因而可以对增加作物产量有贡献。
种子产量是特别重要的性状,因为众多植物的种子对人与动物营养是重要的。作物如玉米、稻、小麦、卡拉诺油菜和大豆占超过一半的人类总热量摄入,无论通过直接消费种子本身或通过消费基于加工的种子而产生的肉产品。作物也是糖、油及工业加工中所用众多类型代谢物的来源。种子含有胚(新苗和新根的起源)和胚乳(萌发期间及幼苗早期生长期间用于胚生长的营养来源)。种子发育涉及多种基因并且需要代谢物从根、叶和茎转移至正在生长的种子中。胚乳尤其同化糖类、油和蛋白质的代谢前体并且将它们合成为贮藏大分子以灌满籽粒。
对于众多作物的另一个重要性状是早期萌发势。改进早期萌发势是现代稻育种计划在温带和热带稻品种上的重要目标。长根在水栽稻中对于正确土壤固定是重要的。在将稻直接播种至被淹没田地的情况下,以及在植物必须从水中迅速出苗的情况下,较长的苗与萌发势相关。在实施条播的情况下,较长的中胚轴和胚芽鞘对于良好出苗是重要的。将早期萌发势人工改造到植物内的能力将在农业中是极其重要的。例如,不良的早期萌发势已经限制了基于玉米带种质(Corn Belt germplasm)的玉米(Zea mayes L.)杂种在欧洲大西洋地区的引种。
另一个重要性状是改进的非生物胁迫耐受性。非生物胁迫是世界范围作物损失的主要原因,对于大多数主要作物植物而言降低平均产量超过50%(Wang等、Planta(2003)218:1-14)。非生物胁迫可以由干旱、盐度、极端温度、化学毒性和氧化胁迫引起。提高植物对非生物胁迫耐受性的能力将在世界范围对农民是极大经济优势并且会允许在不利条件期间及在作物栽培否则是不可能的陆地上栽培作物。
作物产量因而可以通过优化前述因素之一而增加。
取决于最终用途,对某些产量性状的改良可能优先于其他产量性状。例如对于应用如饲料或木材生产或生物燃料资源而言,增加植物营养体部分可能是希望的,而对于应用如面粉、淀粉或油生产而言,增加种子参数可能是尤其希望的。即便在种子参数当中,某些参数可以更优先于其他参数,这取决于应用。多种机制可以对增加种子产量有贡献,无论形式为增加的种子大小或是增加的种子数目。
增加植物中产量(种子产量和/或生物量)的一种方法可以是通过调节植物的内在生长机制如细胞周期或参与植物生长或参与防御机制的多种信号途径。
现已发现可以通过调节植物中编码GRP多肽的核酸在植物中表达而改进植物中的多种生长特征。GRP多肽可以是如下蛋白之一:锚定蛋白-锌指多肽(AZ)、SYT多肽,叶绿体果糖-1,6-二磷酸酶(cpFBPase)多肽,小诱导性激酶(SIK),II类同源域亮氨酸拉链(HD Zip)转录因子,和SYB1多肽。改良的特征包括产量相关性状,如增加的产量和/或增加的生长、或改良的储藏化合物物含量。
背景技术
锚定蛋白-锌指多肽
植物生物量为饲料作物如苜蓿、青贮谷物和干草的产量。在谷物作物中使用产量的许多替代参数。其中首要的是估算植物大小。根据物种以及发育阶段的不同,可以通过许多方法测量植物大小,但是包括植物总干重、地上干重、地上鲜重、叶面积、茎体积、植物高度、莲座植物直径、叶长、根长、根生物量、分蘖数和叶数。许多物种在给定的发育阶段维持植物不同部分大小间的保守比。利用这些异速生长关系而对这些有关大小的测量结果进行由此及彼的外推(如Tittonell等2005Agric Ecosys&Environ 105:213)。早期发育阶段的植物大小通常将与晚期发育阶段的植物大小有关。具有更大叶面积的较大植物通常能够比较小的植物吸收更多的光和二氧化碳,因此很可能在同期增重更多(Fasoula&Tollenaar 2005Maydica50:39)。除了植物所具有的最初达到较大大小的微环境或遗传优势的潜在延续,此为其附加效应。植物大小和生长速率存在着强遗传组件(如terSteege等2005 Plant Physiology 139:1078),且迄今为止,种种多样化基因型植物在一种环境条件下的大小很可能与另一种环境条件下的大小有关(Hittalmani等2003 Theoretical Applied Genetics 107:679)。以这种方式,使用标准环境作为田地中作物在不同时间和地点所遭遇的多样化动态环境的替代参数。
收获指数为种子产量与地上干重的比值,其在许多环境条件下相对稳定,因此在植物大小和谷物产量之间通常能够获得比较稳固的相关性(如Rebetzke等2002 Crop Science 42:739)。这些方法固有地联系在一起,因为大多数谷物生物量取决于植物叶和茎当前或贮存的光合作用生产力(Gardener等1985 Physiology of Crop Plants.Iowa State University Press,pp68-73)。因此,对植物大小的选择,甚至是在发育早期阶段的选择,已经用作为未来潜在产量的指标(如Tittonell等2005Agric Ecosys&Environ 105:213)。当测试遗传差异对胁迫耐受性的影响时,温室或植物培养室与田地相比具有固有的优势:即能够使土壤性能、温度、水和营养的可用性以及光强度标准化。不过,因缺乏风力或昆虫导致不良授粉,或由于空间不足以让成熟根或冠层生长等等,对产量造成的这些人工局限性会限制这些控制环境在测试产量差异中的应用。因此,在培养室或温室标准条件下测量早期发育阶段的植物大小,是提供潜在遗传产量优势指标的标准方法。
转录由RNA聚合酶进行。这些聚合酶通常与决定转录过程特异性的其他蛋白(转录因子)相关。转录因子与基因的顺式调控元件结合且也可介导其他调节蛋白的结合。Stegmaier等提出基于转录因子DNA结合结构域的转录因子的分类法。基于以下的存在,区分出5个超级类(supperclass):1)基础结构域、2)锌协同结构域、3)螺旋转角螺旋结构域、4)具有小沟接触的β支架结构域和0)其他结构域(Stegmaier等,Genome informatics 15,276-286,2004)。包括锌协同结构域的转录因子组极其多样且可根据其保守的半胱氨酸和组氨酸残基进一步分类,包括WRKY结构域、C6锌聚簇、DM和GCM结构域。
除了DNA结合基序,转录因子还可包括蛋白质-蛋白质相互作用基序。一种该基序是锚蛋白基序。其出现在各种各样的蛋白家族中,通常作为2到超过20个单位的重复。每个单位包含两个反向平行螺旋和β发夹。
尽管许多具有锌指结构域的植物蛋白质被充分表征,但对包含C3H1锌指基序的植物蛋白质所知很少。据报道PEI1是一种对胚胎发育起作用的转录因子,其具有与C3H1基序相似的锌指基序,但缺少锚蛋白基序(Li和Thomas,Plant Cell 10,383-398,1998)。WO02/44389描述了AtSIZ,一种从拟南芥(Arabidopsis)中分离出来的转录因子。发现在CaMV35S启动子控制下的AtSIZ表达促进胁迫诱导基因的转录,且据报道具有增加的AtSIZ表达的植物在盐胁迫下与对照植物相比具有较高的存活率,但没有提供有关种子产量的分析。推断AtSIZ可用于增加植物对渗透胁迫的抗性。
SYT
非生物胁迫,如干旱胁迫、盐胁迫、热胁迫和冷胁迫、或这些胁迫中一种或多种的组合,是植物生长和生长力的主要限制因素(Boyer(1982)Science 218:443-448)。干旱、热、冷和盐胁迫具有对于植物生长极为重要的共同主题,即水的可获得性。因为一些土壤中的高盐浓度将导致较少的可被细胞摄入的水,其效应与在干旱条件下观察到的相似。此外,在冰冻温度下,由于始于质外体(apoplast)中的冰的形成将导致水从共质体流出,由此造成植物细胞丧失水份(McKersie和Leshem,1994.Stress andStress Coping in Cultivated Plants,Kluwer Academic Publishers)。在热胁迫中,影响气孔孔径以通过蒸发蒸腾作用调节冷却,从而影响植物的水分含量。通常,植物对这些胁迫条件的每一种条件的分子反应机制是相似的。
植物在其整个生活史中会暴露于减少的环境含水量的条件。大多数植物已进化出保护它们自己免受这些条件的伤害的策略。然而,如果干旱条件的严重度和持续时间太大,对大多数农作物植物的植物发育、生长和产量的影响将是深远的。持续暴露于减少的环境水可用性下造成植物新陈代谢的重大改变。新陈代谢的这些重大改变最终将导致细胞死亡,因此而导致产量损失。由这些胁迫引起的主要农作物例如稻、玉米(corn)和小麦的农作物损失和农作物产量损失是重要的经济和政治因素并且在世界上许多地区造成了食物短缺。
非生物环境胁迫的另一实例是植物生长和发育需要吸收的一种或更多营养物的减少的可用性。由于营养利用效率对植物产量和产品质量的强力影响,大量的肥料施用到田间,以优化植物生长和质量。植物生产力受三种主要营养物限制:磷、钾和氮,它们通常是植物生长中的速率限制因素。植物生长所需的主要营养元素是氮(N)。它是生命细胞中发现的包括氨基酸、蛋白质(酶)、核酸和叶绿素的大量重要化合物的组分。植物干分的1.5%到2%是氮,且约所有植物蛋白质的16%是氮。因此,氮的可用性是植物生长和生产的主要限制因素(Frink等(1999)Proc Natl Acad Sci美国96(4):1175-1180),且对蛋白积累和氨基酸组成具有主要影响。因此,在氮限制条件下生长时具有增加的产量的谷物非常有利。
植物生物量为饲料作物如苜蓿、青贮谷物和干草的产量。在谷物作物中使用产量的许多替代参数。其中首要的是估算植物大小。根据物种以及发育阶段的不同,可以通过许多方法测量植物大小,但是包括植物总干重、地上干重、地上鲜重、叶面积、茎体积、植物高度、莲座植物直径、叶长、根长、根生物量、分蘖数和叶数。许多物种在给定的发育阶段维持植物不同部分大小间的保守比。利用这些异速生长关系而对这些有关大小的测量结果进行由此及彼的外推(如Tittonell等(2005)Agric Ecosys&Environ105:213)。早期发育阶段的植物大小通常将与晚期发育阶段的植物大小有关。具有更大叶面积的较大植物通常能够比较小的植物吸收更多的光和二氧化碳,因此很可能在同期增重更多(Fasoula&Tollenaar(2005)Maydica50:39)。除了植物所具有的最初达到较大大小的微环境或遗传优势的潜在延续,此为其附加效应。植物大小和生长速率存在着强遗传组件(如terSteege等(2005)Plant Physiology 139:1078),且迄今为止,种种多样化基因型植物在一种环境条件下的大小很可能与另一种环境条件下的大小有关(Hittalmani等(2003)Theoretical Applied Genetics 107:679)。以这种方式,使用标准环境作为田地中作物在不同时间和地点所遭遇的多样化动态环境的替代参数。
发展耐受胁迫的植物是可能解决或调解至少一些此类问题的策略(McKersie和Leshem,(1994)Stress and Stress Coping in CultivatedPlants,Kluwer Academic Publishers)。然而,发展对此类胁迫呈现抗性(耐受性)的新植物品系的常规植物育种策略是相对缓慢的且需要特定的抗性系以与希望的系进行杂交。有限的胁迫耐性种质资源以及远源植物物种之间的杂交不相容性是常规育种中遇到的重大问题。然而,这些技术通常是劳动密集型的,并且产生通常含有从亲本植物遗传的异源遗传组分的植物,这些遗传组分并非总是产生父系期望性状。分子生物学的进展已经允许人类改造动物和植物的生殖质(germplasm)。植物遗传工程需要分离和操作遗传物质(通常为DNA或RNA的形式)及随后将所述遗传物质引入植物。这样的技术能够提供具有多种改良的经济、农业或园艺性状的作物或植物。
SYT为转录共激活剂,在植物中,其与GRF(生长调控因子)家族蛋白质的转录激活剂形成功能复合物(Kim HJ,Kende H(2004)Proc Nat AcadSc 101:13374-9)。SYT在本文中也称为GIF,为GRF相互作用因子(GRF-interacting factor)的缩写,和AN3为angustifolia3的缩写,在Horiguchi等(2005)Plant J 43:68-78中。GRF转录激活剂与酵母染色质重塑复合物的SWI/SNF蛋白质共享结构域(在N末端区域)(van der Knaap E等,(2000)Plant Phys 122:695-704)。认为这些复合物的转录共激活剂参与将SWI/SNF复合物募集至增强子和启动子区域,以实现局部染色质重塑(
AM等综述,(2001)Annu Rev Biochem 70:475-501)。局部染色质结构的改变调节转录激活。更准确地说,认为SYT与植物SWI/SNF复合物相互作用,以实现GRF靶基因的转录激活(Kim HJ,Kende H(2004)Proc NatAcad Sc 101:13374-9)。
SYT属于拟南芥中由三个成员组成的基因家族。所述SYT多肽与人SYT具有同源性。已显示人SYT多肽为转录共激活剂(Thaete等(1999)Hum Molec Genet 8:585-591)。如下三个结构域表征了哺乳动物SYT多肽:
(i)N末端SNH(SYT的N末端同源)结构域,在哺乳动物、植物、线虫和鱼类中是保守的;
(ii)C末端QPGY富含结构域,主要由甘氨酸、脯氨酸、谷酰胺和酪氨酸组成,以不定的间隔出现;
(iii)位于前述两个结构域之间的甲硫氨酸富含(富含Met)结构域。
在植物SYT多肽中,SNH结构域充分保守。C末端结构域富含甘氨酸和谷酰胺,但并不富含脯氨酸或酪氨酸。因此其被命名为富含QG结构域,与哺乳动物的QPGY结构域形成对照。同哺乳动物SYT一样,在QG结构域N末端可以鉴定到富含Met结构域。富含QG结构域可视为基本上是多肽C末端的剩余部分(除去SHN结构域);富含Met结构域通常包含在富含QG结构域的头一半之内(从N末端到C末端的方向)。可能有第二富含Met结构域位于植物SYT多肽SNH结构域之前(见图1)。
据报道,丧失功能的SYT突变体以及SYT表达降低的转基因植物发育出小且窄的叶子和花瓣,它们具有较少的细胞(Kim HJ,Kende H(2004)Proc Nat Acad Sc 101:13374-9)。
拟南芥中AN3超量表达产生的植物具有的叶比野生型的叶大20-30%(Horiguchi等,(2005)Plant J 43:68-78)。
日本专利申请2004-350553中描述了通过控制AN3基因表达来控制水平方向上叶大小的方法。
cpFBPase
收获指数为种子产量与地上干重的比值,其在许多环境条件下相对稳定,因此在植物大小和谷物产量之间通常能够获得比较稳固的相关性(如Rebetzke等2002Crop Science 42:739)。这些方法本身联系在一起,因为大多数谷物生物量取决于植物叶和茎当前或贮存的光合作用生产力(Gardener等1985Physiology of Crop Plants.Iowa State University Press,pp68-73)。因此,对植物大小的选择,甚至是在发育早期阶段的选择,已经用作为未来潜在产量的指标(如Tittonell等2005Agric Ecosys&Environ 105:213)。当测试遗传差异对胁迫耐受性的影响时,温室或植物培养室与田地相比具有固有的优势:即能够使土壤性能、温度、水和营养的可用性以及光强度标准化。不过,因缺乏风力或昆虫导致不良授粉,或由于空间不足以让成熟根或冠层生长等等,对产量造成的这些人工局限性会限制这些控制环境在测试产量差异中的应用。因此,在培养室或温室标准条件下测量早期发育阶段的植物大小,是提供潜在遗传产量优势指标的标准方法。
高等植物中光合碳代谢是植物生长和谷物产量的主要过程。通过还原戊糖磷酸(卡尔文,Calvin)途径固定大气二氧化碳在高等植物中产生碳水化合物。此过程发生在叶绿体中,且新合成的丙糖磷酸可至于淀粉合成的基质区室中,或可输出到蔗糖形成的细胞胶质中。在光合作用中,新合成的碳水化合物根据植物的需要和环境条件形成(channel)一种或其他形式。
卡尔文循环是复杂的途径,包括由11种酶催化的13个反应的三个阶段。一种更重要的酶是叶绿体果糖-1,6-二磷酸酶(cpFBPase),其催化果糖-1,6-二磷酸至果糖-6-磷酸和Pi(无机P)的不可逆转化。与卡尔文循环的其他酶相比,cpFBPase多肽在叶绿体中的水平非常低。
借助铁氧化还原蛋白-硫氧化还原蛋白系统由氧化还原电位调控cpFBPase活性,所述系统根据光照/黑暗条件,和pH值和Mg2+水平上的光依赖性变化调节酶活性(Chiadmi等,(1999)EMBO 18(23):6809-6815)。更具体地,cpFBPase多肽在光照下是有活性的,且在黑暗中是无活性的,这通过硫氧化还原蛋白介导的酶分子SH组间还原-氧化互动且也借助叶绿体基质中pH值和Mg2+浓度受光线诱导升高而发生(Buchanan(1980)AnnuRev Plant Physiol 31:341-374;Jacquot(1984)Bot Acta 103:323-334)。
高等植物和藻类cpFBPase多肽执行同一酶催化步骤,但在酶催化活性调节中稍有不同。更具体地,藻类cpFBPase多肽严格要求还原而具有活性,但对还原剂特异性要求不太严格,即,它们可由不同质体硫氧化还原蛋白激活(Huppe和Buchanan(1989)Z Naturforsch 44(5-6):487-94).
光合(自养)细胞中,除了cpFBPase多肽,还有位于细胞溶胶(cyFBPase)中且参与蔗糖合成和糖异生的第二FBPase多肽(同种型)。与cpFBPase多肽相比,cyFBPase多肽具有非常不同的调控特性:其被过量底物抑制,通过AMP和果糖-2,6-二磷酸显示变构抑制,且呈现中性pH最适宜。在异养系统(如动物细胞)中发现cyFBPase多肽。cpFBPase多肽和cyFBPase多肽间的主要区别是前者中具有氨基酸插入,所述氨基酸插入至少具有两个保守半胱氨酸残基,所述半胱氨酸残基是硫氧化还原蛋白调控的目标。
在块茎特异性启动子的调控下表达马铃薯cyFBPase核酸序列的转基因马铃薯植物已有报道(Thorbjornsen等,(2002)Planta 214:616-624)。作者发现转基因块茎在淀粉含量方面、或中性糖和磷酸化hexoses方面与野生型块茎没有区别。
来自蓝细菌(cyanobacterium Synechococcus)(FBPase/SBPase和FBPaseII)的两个cyFBPase编码基因有效连接于叶绿体亚细胞靶向嵌合蛋白质的番茄rbcS转运肽编码序列(Miyagawa等,(2001)Nature Biotech 19:965-969;Tamoi等,(2006)Plant Cell Physiol 47(3):380-390)。没有发现FBPase/SBPase和FBPaseII多肽的活性由铁氧化还原蛋白/硫氧化还原蛋白系统的氧化还原条件调节,因为它们缺乏保守半胱氨酸残基。使用番茄rbcS启动子调控两个嵌合基因的表达。已报道用嵌合构建体转化的转基因烟草植物在大气条件下比野生型植物生长的明显更快且更大。
SIK
植物培育者通常根据所论作物或植物的改良产量的特定方面、和具有经济价值的植物或作物的部分感兴趣。例如,对特定植物、或特定最终用途,植物培育者可以特别地在植物一个或多个部分的植物生物量(重量)方面寻找改良,所述部分包括地上(可收获)部分和/或地下(可收获)部分。尤其有关的是供消费的是植物地上部分或地下部分。对许多作物而言,尤其是谷物,种子产量的改良是极其需要的。增加的种子产量本身可以表现为多种方式,取决于所论作物或植物和其最终用途,种子产量的每个独立方面对植物培育者具有变化的重要性。例如种子产量可以表现为或来自:a)种子生物量(种子总重量)增加,这可以基于单粒种子和/或每株植物和/或每平方米;b)每株植物增加的花数;c)增加的(饱满)种子数;d)增加的种子饱满率(其通常表述为饱满种子数与种子总数之间的比率);e)增加的收获指数,其通常表述为可收获部分(如种子)产量与总生物量的比率;和f)增加的千粒重(TKW),这通常从计数的饱满种子数及其总重量外推而来。
种子产量的增加也可以表现为种子大小和/或种子体积的增加。此外,种子产量的增加本身也可以自我表现为种子面积和/或种子长度和/或种子宽度和/或种子周长的增加。增加的产量也可以产生改良的结构,或可以因改良的结构而出现。
以玉米为例,产量增加可以表现为下列一种或多种指标:每平方米植物数的增加、每株植物穗数的增加、行数的增加、每行粒数、粒重、千粒重、穗长度/直径、种子饱满率的增加(其中种子饱满率是饱满种子数除以种子总数并乘以100)及其他。以稻为例,产量增加本身可以表现为下列一种或多种指标的增加:每平方米植物数、每株植物圆锥花序数、每圆锥花序小穗数、每圆锥花序花(小花)数(其表达为饱满种子数对原圆锥花序数之比)、种子饱满率的增加(其中种子饱满率是饱满种子数除以种子总数并乘以100)、千粒重的增加及其他。
对植物培育者来说,能够挑选到要被改变的种子产量的方面非常有利。非常期望能够非定制的挑出,即挑出适合改变种子产量的特定方面或组分的基因。例如与增加的千粒重组合的饱满率的增加对作物如玉米是非常期望的。对稻和小麦增加的饱满率、收获指数和增加的千粒重的组合是非常期望的。
Genomine Inc.的公开的国际专利申请WO 02/074801描述了来自拟南芥(Arabidopsis thaliana)的AtSIK蛋白质和编码所述蛋白质的基因。其提到可以通过抑制AtSIK的表达使植物对渗透胁迫具有抗性。然而没有提到通过抑制AtSIK的表达可以改良那些产量方面。
HD Zip
植物的研究和基因操纵具有长远历史,其甚至在著名的Gregor
Mendel研究之前就开始了。在完善该科学中,科学家完成了植物中特定性状的改良,所述性状涵盖具有增加的淀粉含量的马铃薯块茎和具有增加的或改变的脂肪酸含量的油籽植物如卡诺拉油菜和向日葵。随着增加的植物油消费和使用,种子油含量和种子油水平的改良日益普遍(如
等,,1995,Science 268:681-686)。在转基因植物中操纵生物合成途径为分子生物学家和植物生化学家提供了大量机会去影响植物新陈代谢,以引起特定更高价值产品的产生。种子油的产生或合成(composition)已在大量传统油籽植物如大豆(美国专利第5,955,650号)、卡诺拉油菜(美国专利第5,955,650号)、向日葵(美国专利第6,084,164号)、油菜(
等,1995,Science 268:681-686)、和非传统油子植物如烟草(Cahoon等,1992,Proc.Natl.Acad.Sci.美国89:11184-11188)中改变。
植物种子油包括中性和极性脂质(见表1)。中性脂质主要含有三酰甘油,其是在种子油体中积累的主要储藏脂质。极性脂质主要在种子细胞的各种膜中发现,如微粒体、质体、和线粒体膜和细胞膜。中性和极性脂质含有几种常见的脂肪酸(见表2)和一系列不太常见的脂肪酸。膜脂质的脂肪酸合成被高度调节且只有少量的脂肪酸在膜脂质中发现。另一方面,可将大量非常规脂肪酸整合到许多植物物种种子中的中性储藏脂质中(Van de Loo F.J.等,1993,Unusual Fatty Acids in Lipid Metabolism inPlants,第91-126页,TS Moore编著,Jr.CRC出版;Millar等,2000,Trends Plant Sci.5:95-101)。
表1 植物脂质的分类
中性脂质 三酰甘油(TAG)
二酰甘油(DAG)
单酰甘油(MAG)
极性脂质 单半乳糖二酰甘油(MGDG)
双半乳糖二酰甘油(DGDG)
磷脂酰甘油(PG)
磷脂酰胆碱(PC)
磷脂酰乙醇胺(PE)
磷脂酰肌醇(PI)
磷脂酰丝氨酸(PS)
硫代异鼠李糖二酰甘油
表2 常规植物脂肪酸
16:0 棕榈酸
16:1 棕榈油酸
16:3 hiragonic acid
18:0 硬脂酸
18:1 油酸
18:2 亚油酸
18:3 亚麻酸
γ-18:3 γ-亚麻酸*
20:0 花生酸
20:1 二十碳一烯酸
22:6 二十二碳六烯酸(DHA)*
20:2 二十碳二烯酸
20:4 花生四烯酸(AA)*
20:5 二十碳五烯酸(EPA)*
22:1 芥子酸
表2中,带有星号的脂肪酸通常不在植物种子油中出现,但它们在转基因植物种子油中的生产在植物生物技术中具有重要性。
植物中脂肪酸生物合成的主要位点是质体。脂肪酸生物合成以通过乙酰辅酶A羧化酶(ACCase)将乙酰辅酶A转化为丙二酸单酰辅酶A开始。然后丙二酸部分通过丙二酸单酰辅酶A:ACP转酰基酶转移至酰基载体蛋白(ACP)。酶β-酮脂酰-ACP-合酶III(KAS III)催化脂肪酸生物合成的最初缩合反应,其中在丙二酸-ACP脱羧后,得到的碳负离子通过羰基-碳的亲核攻击转移至乙酰辅酶A,生成3-丁酮酸-ACP(3-ketobutyryl-ACP)。该反应循环通过还原、脱水和再次减少丁酸的产生完成。该反应循环重复(具有KAS I或KAS II催化缩合反应)至酰基基团达到通常16-18个碳原子的链长。这些酰基-ACP通过硬脂酸-ACP去饱和酶去饱和,作为所谓的原核途径中脂质形成的质体酰基转移酶的底物,或通过硫酯酶的作用切除ACP后输出到胞质溶胶中。在胞质溶胶中它们进入乙酰辅酶A库(acyl-CoA pool)并用于在所谓的真核途径中,在内质网中合成脂质。
通过原核和真核途径的脂质合成均发生甘油-3-磷酸酰基转移酶(GPAT)和溶血磷脂酸酰基转移酶(LPAAT)的连续酰化(Browse等,1986,Biochemical J.235:25-31;Ohlrogge&Browse,1995,5Plant Ce117:957-970)。得到的磷脂酸(PA)是其他极性膜脂的前体,所述极性膜脂例如是质体中的单半乳糖二酰甘油(MGD)、双半乳糖二酰甘油(DGD)、磷脂酰甘油(PG)和硫代异鼠李糖二酰甘油(SQD),和内质网中的磷脂酰胆碱(PC)、磷脂酰乙醇胺(PE)、磷脂酰肌醇(PI)和磷脂酰丝氨酸(PS)。极性脂质也是酰基链进一步修饰(例如去饱和作用、乙炔化(acetylenation)和羟基化作用)的位点。在内质网中,PA也是生物合成三酰甘油(TAG)的中间产物、中性脂质的重要成分和本文中的籽油的重要成分。此外,存在TAGS生物合成的备选途径(即,通过磷脂酰胆碱:二酰甘油酰基转移酶发挥作用的转酰基作用)(Voelker,1996,Genetic Engineering,Setlow编著,18:111-113;Shanklin&Cahoon,1998,Annu.Rev.Plant Physiol.PlantMol.Biol.49:611-641;Frentzen,1998,Lipids 100:161-166;Millar等.,2000,Trends Plant Sci.5:95-101)。逆反应,三酰甘油至二酰甘油和脂肪酸的转化(breakdown)由脂肪酶催化。此类催化可看作种子发育的终点,导致籽油的一定还原(Buchanan等,2000)。
种子中的贮存脂从碳水化合物-衍生的前体合成。植物在胞质溶胶中具有完整的糖酵解途径(Plaxton,1996,Annu.Rev.Plant Physiol.Plant Mol.Biol.47:185-214),且已表明在油菜的质体中也存在完整的途径(Kang&Rawsthorne,1994,Plant J.6:795-805)。蔗糖是碳和能量的主要来源,从叶中转运到发育的种子中。在种子的贮存阶段,蔗糖在胞质溶胶中转化,以提供代谢前体果糖-6-磷酸和丙酮酸。这些前体转运至质体并转化为乙酰辅酶A,乙酰辅酶A是脂肪酸合成的主要前体。质体中的乙酰辅酶A是脂质生物合成的中心前体。乙酰辅酶A可通过不同的反应在质体中形成,每个反应的准确贡献仍有争论(Ohlrogge&Browse,1995,Plant Ce117:957-970)。然而,已接受的是大部分乙酰辅酶A衍生自果糖-6-磷酸和丙酮酸,所述果糖-6-磷酸和丙酮酸从细胞质输入质体。蔗糖在来源器官(叶,或任何光合作用发生的地方)中产生并转运至发育的种子,也称为库器官。在发育的种子中,蔗糖是所有储藏物的前体,所述储藏物即淀粉、脂质和部分脂质贮存蛋白质。因此,清楚的是,蔗糖起中心作用的碳水化合物的代谢对种子储藏物的积累是非常重要的。
虽然籽油的脂质和脂肪酸含量可通过植物育种的传统方法改变,重组DNA技术的出现允许更容易的操纵植物籽油的含量,并且在一些情况下,允许单独依靠育种所不能达到的籽油改变(参见,例如,
等,1995,Science 268:681-686)。例如,在转基因烟草中引入Δ12-羟化酶核酸序列,导致新脂肪酸(蓖麻油酸)在烟草籽油中的产生(Van de Loo等,1995,Proc.Natl.Acad.Sci美国92:6743-6747)。烟草植物也已通过引入和表达来自胡荽(coriander)的酰基-ACP去饱和酶,改造为产生低水平的岩芹酸(Cahoon等,1992,Proc.Natl.Acad.Sci美国89:11 184-1 1 188)。
植物籽油含量的修饰具有重要的医学、营养和经济结果。关于经济结果,在一些籽油中发现的长链脂肪酸(C18以及更长)已与高胆固醇血症和其他冠心病相关的临床疾病关联(Brenner,1976,Adv.Exp.Med.Biol.83:85-101)。因此,食用具有水平增加的这些类型的脂肪酸的植物可以降低心脏病的风险。提高籽油含量的水平也可用于提高籽油的大规模产生,由此降低这些油的成本。
如前所述,诸如Δ6-去饱和酶核酸、Δ12-去饱和酶核酸和酰基-ACP去饱和酶核酸的一些去饱和酶核酸已被克隆,并被证明编码多种植物物种中脂肪酸合成所需的酶。来自诸如芸苔属(Brassica)、大豆、胡萝卜、松树和拟南芥的物种的油质蛋白核酸序列已被克隆,并被证明编码与这些植物中油体磷脂单层膜相关的蛋白质。
现已发现编码II类同源域亮氨酸拉链(HD-Zip)转录因子的核酸序列用于改良种子中储藏物的含量。
转录因子通常定义为显示序列特异性DNA结合,和能够激活和/或抑制转录的蛋白质。拟南芥基因组编码至少1533个转录调节子,这占其估计的基因总数的~5.9%。报导大约45%的这些转录因子来自植物特异性家族(Riechmann等,2000(Science第290卷,2105-2109))。转录因子的此类植物特异家族的一个实例是HD-Zip转录因子家族。
同源框基因是出现在所有真核生物中的转录因子且构成拟南芥中至少89个成员的基因家族。其特征在于具有同源框,所述同源框通常包括60个保守氨基酸残基,形成结合DNA的螺旋-环-螺旋-转角-螺旋结构。该DNA结合位点通常是假回文结构。同源框基因在发育的许多方面具有重要且多样的作用,包括动物胚的早期发育、酵母中细胞类型特化、和开花植物中芽顶端分生组织的起始和维持(Sakakibara等,Mol.Biol.Evol.18(4):491-502,2001)。
基于其氨基酸相似性,已分离大量被子植物同源框基因且分为七个不同组。这些组包括KNOX、BELL、HD-PHD-指、HAT1、HAT 2、GL2、和ATHB8组。后四组中的基因-编码邻近同源域C末端的亮氨酸拉链基序,且一起形成同源域亮氨酸拉链(HD-Zip)基因家族。Aso等,Mol.Biol.Evol.16(4):544-552,1999。拟南芥中包括同源框基因家族的至少89个成员中的至少47个中包括同源域和亮氨酸拉链两者。尽管同源域和亮氨酸拉链基序的组合是植物特有的,但是除了维管植物之外,还已经在藓类植物(moss)中遇到(Sakakibara等,(2001)Mol Biol Evol 18(4):491-502)。
同源域亮氨酸拉链(HDZip)蛋白构成转录因子家族,其特征在于存在DNA结合结构域(HD)和邻近的亮氨酸拉链(Zip)基序。亮氨酸拉链邻近于同源域的C-末端,包括几个七肽重复单位(至少4个),其中通常每隔6个氨基酸就出现亮氨酸(偶尔为缬氨酸或异亮氨酸)。亮氨酸拉链对于蛋白质二聚化非常重要。二聚化是DNA结合的前提条件(Sessa等(1993)EMBO J12(9):3507-3517),并且可以发生在两个相同的HDZip蛋白之间(同源二聚体),或者两个不同的HDZip蛋白之间(异源二聚体)。
被子植物同源框基因HAT1、HAT 2、GL2、和ATHB8组的组重命名为HD-Zip I-IV亚家族。同源域和亮氨酸拉链基序的组合是高等植物特有的,这表明HD-Zip基因可以参与植物特有的发育过程的调节。Aso等,Mol.Biol.Evol.16(4):544-552,1999。不同亚家族中HD-Zip基因的功能不同。HD-Zip I和II基因类似地参与光、脱水作用诱导的ABA或生长素信号转导网络。这些信号转导网络与植物的整体生长调控相关。正义或反义HD-Zip I或II mRNA的超量表达通常改变生长速率和发育。HD-Zip III亚家族的大对数成员在中柱的细胞分化中发挥作用。HD-Zip IV基因与最外细胞层的分化相关。Sakakibara等,Mol.Biol.Evol.18(4):491-502,2001.
已证明不同的HDZip蛋白要么激活要么阻遏转录。已利用报告基因荧光素酶(Henriksson等(2005)Plant Phys 139:509-518)在拟南芥中证明:I类HDZip ATHB1、-5、-6和-16在拟南芥叶子的瞬时表达测定中作为转录激活因子起作用。利用另一报告基因(葡萄糖醛酸酶;Meijer等(2000)MolGen Genet 263:12-21),证明两种稻I类HDZip蛋白即Oshox4和Oshox5在稻细胞悬浮培养物的瞬时表达测定中作为激活因子起作用。相反,两种稻II类HDZip蛋白即Oshox1和Oshox3在相同的试验中作为转录阻遏物起作用(Meijer等(1997)Plant J 11:263-276;Meijer等(2000),同前)。
来自拟南芥的II类HD-Zip基因,HAT4,也称为ATHB-2,已被报道作为避荫反应调节物(Morelli和Ruberti TIPS,第7卷,第9期,2002年9月).
SYB1
Ran是动物细胞中的小的信号传导GTP酶(GTP结合蛋白质),其参与核质转运。核质转运已主要在动物系统中研究。几种Ran结合蛋白质是已知的,其中RanBP2也称为Nup358。假定RanBP2与核孔复合体的蛋白质的胞质侧相连,且假定的功能是作为SUMO E3连接酶,虽然其结构不是典型的E3连接酶。SUMO(泛素相关小修饰蛋白)是真核蛋白质,与其他蛋白质共价连接,由此调控大量细胞过程。与Ubc9(作为E2缀合蛋白质)相关,RanBP2用SUMO-1标记底物,所述底物与核输入受体连接,这和蛋白质的泛素化类似。SUMO化的底物之后通过核孔输入核。基于SUMO化的输入蛋白质的实例包括NFX1-p15(mRNA输出中的陪伴分子)和组蛋白脱乙酰酶HDAC-4。SUMO修饰和之后的RanBP2也表明在基因表达、细胞周期(在核被膜解体过程中)和诸如早幼粒细胞白血病小体的亚细胞结构中起作用。
这些研究中的大部分在模式动物系统中进行,而对对应的植物蛋白质和过程所知甚少。拟南芥中鉴定的RanBP2相关蛋白质具有锌指结构域,但在结构不相同。
发明概述
令人惊讶的是,现已发现调节GRP多肽的编码核酸的表达产生了相对于对照植物具有改良的特征的植物。
本发明的一个方面,现已发现调节编码来自拟南芥(AtAZ)的AZ多肽或其同源物的核酸在植物中的表达产生了相对于对照植物具有增加的产量的植物。根据本发明的一个实施方案,提供增加植物产量的方法,其包括调节编码AZ多肽或其同源物在植物中的表达。有利地,实施本发明的方法产生了相对于对应野生植物具有增加的产量的植物,特别是增加的种子产量的植物。本发明也提供用于实施此类方法的核酸序列和构建体。本发明的另一方面,现已发现调节编码SYT多肽的核酸序列在植物中的表达产生了在非生物胁迫下相对于对照植物具有增加的产量的植物。因此,本发明也提供在非生物胁迫下相对于对照植物增加植物产量的方法,其包括调节编码SYT多肽的核酸序列在植物中的表达。本发明也提供用于实施此类方法的核酸序列和构建体。
本发明的另一方面,现已发现增加编码叶绿体果糖-1,6-二磷酸酶(cpFBPase)多肽的核酸序列在植物地上部分中的表达相对于对照植物增加了植物产量。因此,根据本发明,提供相对于对照植物增加植物产量的方法,其包括增加编码cpFBPase多肽的核酸序列在植物地上部分中的表达。本发明也提供用于实施此类方法的核酸序列和构建体。
本发明的另一方面,现已发现调节编码SIK核酸和/或SIK多肽在植物中的表达产生了相对于对照植物具有多种改良的产量相关性状的植物,其中SIK编码核酸在植物中的超量表达产生了相对于对照植物增加的每株植物花数,且其中减少或基本去除SIK核酸产生了相对于对应的野生型植物增加的千粒重、增加的收获指数和增加的饱满率。本发明也提供用于实施此类方法的核酸序列和构建体。
本发明的另一方面,现已发现编码II类HD-Zip转录因子的核酸可用于改变种子中贮藏物的含量上有用。本发明因此提供通过调节编码II类HD-Zip转录因子在植物中的表达以相对于对照植物改变种子中贮藏物的含量的方法。本发明也提供用于实施此类方法的核酸序列和构建体。本发明还提供相对于对照植物具有改变的贮藏物含量的种子,所述种子具有编码II类HD-Zip转录因子的核酸的受调节表达。本发明提供相对于对照植物改变种子中贮藏物含量的方法,其包括调节编码II类HD-Zip转录因子在植物中的表达。
本发明的另一方面,现已发现调节编码SYB1多肽的核酸在植物中的表达产生了相对于对照植物具有增强的产量相关形状的植物。植物在无胁迫条件下(非胁迫条件)培育时,惊奇地发现了这种产量增加。因此,本发明也提供相对于对照植物增加植物增强产量相关性状的方法,其包括调节编码SYB1多肽的核酸在植物中的表达。本发明也提供用于实施此类方法的核酸序列和构建体。
定义
多肽/蛋白质
术语“多肽”和“蛋白质”在本文中可互换使用并且指处于任意长度聚合形式中通过肽键连接的氨基酸。
多核苷酸/核酸/核酸序列/核苷酸序列
术语″多核苷酸″、″核酸序列″、″核苷酸序列″、“核酸”、“核酸分子”在本文中可互换使用并且指处于任意长度非分支聚合形式中的核苷酸,即核糖核苷酸或脱氧核糖核苷酸或这二者组合。
对照植物
选择合适的对照植物是实验设置的惯用部分并且可以包括对应的野生型植物或无目的基因的对应植物。对照植物一般是与待评估植物相同的植物物种或甚至是相同的变种。对照植物也可以是待评估植物的失效合子。失效合子是由于分离丢失转基因的个体。如本文中所用的“对照植物”不仅指整株植物,还指植物部分,包括种子及种子部分。
同源物
蛋白质的“同源物”包括这样的肽、寡肽、多肽、蛋白质及酶,它们相对于非修饰的上述蛋白质具有氨基酸取代、缺失和/或插入并且与所述肽、寡肽、多肽、蛋白质及酶来源的非修饰蛋白质具有相似生物学活性和功能活性。
缺失指从蛋白质中移除一个或多个氨基酸。
插入指一个或多个氨基酸残基在蛋白质中预定位点内的引入。插入可以包含单个或多个氨基酸的氨基端融合和/或羧基端融合以及序列内插入。通常,在氨基酸序列内部的插入会比氨基端融合或羧基端融合更小,约1-10个残基级别。氨基端或羧基端融合蛋白或融合肽的实例包括如酵母双杂交系统中所用转录激活物的结合结构域或激活结构域、噬菌体外壳蛋白、(组氨酸)-6-标签、谷胱甘肽S-转移酶-标签、蛋白A、麦芽糖结合蛋白、二氢叶酸还原酶、Tag·100表位、c-myc表位、
-表位、lacZ、CMP(钙调蛋白结合肽)、HA表位、蛋白C表位和VSV表位。
取代指以具有相似特性(如相似疏水性、亲水性、抗原性、形成或破坏α-螺旋结构或β-折叠结构的倾向)的其他氨基酸替换蛋白质的氨基酸。氨基酸取代一般是单个残基的,不过可以是簇集性的,这取决于置于多肽的功能性约束;插入通常会是约1-10个氨基酸残基级别。氨基酸取代优选地是保守性氨基酸取代。保守性取代表是本领域众所周知的(见例如Creighton(1984)Proteins.W.H.Freeman and Company(编著)和下表3)。
表3:保守性氨基酸取代的实例
残基 保守性取代 残基 保守性取代
Ala Ser Leu Ile;Val
Arg Lys Lys Arg;Gln
Asn Gln;His Met Leu;Ile
Asp Glu Phe Met;Leu;Tyr
Gln Asn Ser Thr;Gly
Cys Ser Thr Ser;Val
Glu Asp Trp Tyr
Gly Pro Tyr Trp;Phe
His Asn;Gln Val Ile;Leu
Ile Leu,Val
氨基酸取代、缺失和/或插入可以使用本领域众所周知的肽合成技术如固相肽合成法等或通过重组DNA操作而轻易地进行。用于操作DNA序列以产生蛋白质的取代、插入或缺失变体的方法是本领域众所周知的。例如,用于在DNA中的预定位点处产生取代突变的技术是本领域技术人员众所周知的并且包括M13诱变法、T7-Gen体外诱变法(USB,Clevelaand,OH)、QuickChange位点定向诱变法(Stratagene,San Diego,CA)、PCR-介导的位点定向诱变或其他位点定向诱变法。
衍生物
“衍生物”包括这样的肽、寡肽、多肽,其中与天然发生形式的蛋白质(如目的蛋白)的氨基酸序列相比,它们包含以非天然发生的氨基酸残基对氨基酸的取代或非天然发生的氨基酸残基的添加。蛋白质的“衍生物”也包含这样的肽、寡肽、多肽,其中与多肽的天然发生形式的氨基酸序列相比,它们包含天然发生的改变(糖基化、酰化、异戊二烯化、磷酸化、肉豆蔻酰化、硫酸盐化等)氨基酸残基或非天然的改变氨基酸残基。与衍生物所来源的氨基酸序列相比,该衍生物可以也包含与所述氨基酸序列共价或非共价结合的一个或多个非氨基酸取代基或添加(例如报道分子或其他配体),如为促进检测该衍生物而结合的报道分子,和与天然发生的蛋白质的氨基酸序列相对比的非天然发生的氨基酸残基。另外,“衍生物”也包括蛋白质的天然发生形式和诸如FLAG、HIS6或硫氧还蛋白(标签肽的综述参见Terpe,Appl.Microbiol.Biotechnol.60,523-533,2003)的标签肽的融合物。
直向同源物/旁系同源物
直向同源物和旁系同源物包含用来描述基因祖先关系的进化概念。旁系同源物是相同物种内起源于先祖基因复制的基因,直向同源物是来自不同生物的起源于物种形成的基因,也源自相同的先祖基因。
结构域
术语”结构域″指沿进化相关蛋白质的序列比对结果而在特定位置处保守的一组氨基酸。尽管在其他位置处的氨基酸可以在同源物之间变动,然而在特定位置处的高度保守的氨基酸指示在蛋白质的结构、稳定性或功能方面可能是必需的氨基酸。结构域因通过在蛋白质同源物家族的比对序列中的高保守程度而被鉴定,它们可以用作鉴定物以确定任意的所讨论多肽是否属于先前已鉴定的多肽家族。
基序/共有序列/标签
术语”基序”或“共有序列”或“标签”指在进化相关蛋白质的序列中的短保守区。基序往往是结构域的高度保守部分,不过也可以仅包括结构域的部分,或可以位于保守结构域之外(若基序的全部氨基酸位于定义的结构域之外)。
杂交
如本文中所定义的术语”杂交″是其中基本上同源的互补核苷酸序列相互复性的过程。杂交过程可以完全在溶液中进行,即两种互补性核酸均处于溶液中。杂交过程也可以在互补性核酸之一固定到基质如磁珠、琼脂糖(Sepharose)珠或任何其他树脂的情况下发生。杂交过程也可以在互补性核酸之一固定至固相支持体如硝酸纤维素膜或尼龙膜上或通过例如照相平版印刷术固定至例如硅酸玻璃支持物(后者称作核酸阵列或微阵列或称作核酸芯片)上的情况下进行。为使杂交发生,通常将核酸分子热变性或化学变性以使双链解链成为两条单链和/或去除来自单链核酸的发夹或其他二级结构。
术语”严格性”指在其中发生杂交的条件。杂交的严格性受条件如温度、盐浓度、离子强度和杂交缓冲液组成影响。通常,将低严格性条件选择为在确定的离子强度及pH时低于特定序列热解链温度(Tm)约30℃。中等严格性条件是此时温度低于Tm约20℃并且高严格性条件是此时温度低于Tm约10℃。高严格性杂交条件一般用于分离与靶核酸序列具有高序列相似性的杂交序列。然而,核酸可以在序列上偏离并且因遗传密码子的简并性而依旧编码基本上相同的多肽。因而有时候可能需要中等严格性杂交条件以鉴定此类核酸分子。
Tm是在确定的离子强度及pH时的温度,在所述温度下50%的靶序列与完全匹配的探针杂交。Tm取决于溶液条件和探针的碱基组成及长度。例如,较长的序列在较高温度下特异性地杂交。从低于Tm约16℃直至32℃获得最大杂交速率。一价阳离子在溶液中的存在降低了两条核酸链间的静电排斥,因而促进杂交分子形成;这种作用对于高达0.4M的钠浓度是明显的(对于更高浓度,这种效应可以忽略)。甲酰胺降低DNA-DNA和DNA-RNA双链体的解链温度,每百分数甲酰胺降低0.6-0.7℃,并且添加50%甲酰胺允许在30-45℃进行杂交,虽然杂交速率会降低。碱基对错配降低了杂交速率及双链体的热稳定性。平均而言并且对于大的探针来说,每%碱基错配Tm下降约1℃。取决于杂交分子的类型,Tm可以使用下列等式计算:
1)DNA-DNA杂交体(Meinkoth和Wahl,Anal.Biochem.,138:267-284,1984):
Tm=81.5℃+16.6xlog10[Na+]a+0.41x%[G/Cb]-500x[Lc]-1-0.61x%甲酰胺
2)DNA-RNA或RNA-RNA杂交体:
Tm=79.8+18.5(log10[Na+]a)+0.58(%G/Cbb)+11.8(%G/Cb)2-820/Lc
3)寡DNA或寡RNAd杂交体:
对于<20个核苷酸:Tm=2(ln)
对于20-35个核苷酸:Tm=22+1.46(ln)
a或对于其他一价阳离子,但是仅在0.01-0.4M范围内是精确的。
b仅对于%GC在30%-75%范围内是精确的。
cL=双链体的长度(以碱基对计)。
doligo,寡核苷酸;ln,=引物的有效长度=2×(G/C数)+(A/T数)。
可以以众多已知技术的任何一种控制非特异性结合,例如用含蛋白质的溶液封闭薄膜、添加异源性RNA、异源性DNA及SDS至杂交缓冲液并且用RNA酶处理。对于非同源性探针,一系列杂交可以通过改变以下条件之一进行:(i)渐进地降低复性温度(例如从68℃至42℃)或(ii)渐进地降低甲酰胺浓度(例如从50%至0%)。技术人员了解杂交期间可以加以改变和将维持或改变严格性条件的多种参数。
除杂交条件之外,杂交特异性一般还取决于杂交后洗涤的功能。为除去因非特异性杂交所致的背景,样品用稀释的盐溶液洗涤。此类洗涤的关键因素包括最终洗涤溶液的离子强度及温度:盐浓度越低并且洗涤温度越高,则洗涤的严格性越高。洗涤条件一般在杂交严格性上或低于杂交严格性而进行。阳性杂交产生至少两倍于背景信号的信号。通常,用于核酸杂交分析法或基因扩增检测方法的合适严格性条件如上所述。也可以选择更严格或更不严格的条件。技术人员了解洗涤期间可以加以改变和将维持或改变严格性条件的多种参数。
例如,用于长度大于50个核苷酸的DNA杂交分子的常见高严格性杂交条件包括在65℃于1×SSC中或在42℃于1×SSC和50%甲酰胺中杂交,随后在65℃于0.3×SSC中洗涤。用于长度大于50个核苷酸的DNA杂交分子的中等严格性杂交条件的实例包括在55℃于4×SSC中或在40℃于6×SSC和50%甲酰胺中杂交,随后在50℃于2×SSC中洗涤。杂交分子的长度是杂交核酸的预期长度。当序列已知的核酸杂交时,可以通过比对序列并鉴定本文中所述的保守区而确定杂交分子长度。1×SSC是0.15M NaCl和15mM柠檬酸钠;杂交溶液和洗涤溶液可以额外地包含5×Denhardt试剂、0.5-1.0%SDS、100μg/ml变性的片段化鲑精DNA、0.5%焦磷酸钠。
为了定义严格性水平的目的,可以参考Sambrook等(2001)MolecularCloning:a laboratory manual,第三版,Cold Spring Harbor LaboratoryPress,CSH,New York或参考Current Protocols in Molecular Biology,John Wiley&Sons,N.Y.(1989和每年更新版本)。
剪接变体
如本文中所用的术语”剪接变体”包含其中已经切除、替换、移位或添加所选内含子和/或外显子或其中内含子已经缩短或加长的核酸序列的变体。此类变体将是其中基本上保留了蛋白质的生物学活性的一种变体;这可以通过选择性保留蛋白质的功能性片段而实现。此类剪接变体可以在自然界中找到或可以人工制造。用于预测和分离此类剪接变体的方法是本领域众所周知的(见例如Foissac和Schiex(2005),BMC Bioinformatics.6:25)。
等位变体
等位基因或等位变体是给定基因的替代形式,位于相同染色体位置内。等位变体包含单核苷酸多态性(SNP)和小插入/缺失多态性(INDEL)。INDEL的尺寸通常小于100bp。SNP和INDEL形成在大部分生物的天然发生性多态性株系中序列变体的最大集合。
基因改组/定向进化
基因改组或定向进化的组成为:反复DNA改组,随后适当筛选和/或选择以产生编码具有改良生物学活性的蛋白质的核酸或其部分的变体(Castle等,(2004)Science 304(5674):1151-4;美国专利5,811,238和6,395,547)。
调节元件/调控序列/启动子
术语“调节元件”、“调控序列”和“启动子”均在本文中可互换使用并且在广义上意指能够实现与之连接的序列表达的调节性核酸序列。术语”启动子”一般指位于基因转录起点上游并参与识别及结合RNA聚合酶和其他蛋白质,因而指导有效连接的核酸转录的核酸调控序列。前述术语包括从典型的真核基因组基因(包括对于精确转录启动所需的TATA框,具有或没有CCAAT框序列)中衍生的转录调节序列和应答发育刺激和/或外部刺激或以组织特异性方式改变基因表达的额外调节元件(如,上游激活序列、增强子和沉默子)。本术语还包括典型的原核基因的转录调节序列,在此情况下它可以包括-35框序列和/或-10框转录调节序列。术语“调节元件”也包含赋予、激活或增强核酸分子在细胞、组织或器官中表达的合成的融合分子或衍生物。
“植物启动子”包含介导编码序列区段在植物细胞中表达的调节元件。因此,植物启动子不需要是植物来源的,而是可以源自病毒或微生物,例如来自侵袭植物细胞的病毒。“植物启动子”也可以源自植物细胞,例如来自用待于本发明方法中表达及在本文中描述的核酸序列所转化的植物。这也适用于其他“植物”调节性信号,如“植物”终止子。用于本发明方法中的核苷酸序列的启动子上游可以由一个或多个核苷酸取代、插入和/或缺失而受到修饰,但不干扰启动子、可读框(ORF)或3′调节区如终止子或远离ORF的其他3′调节区的功能性或活性。启动子的活性还有可能因修饰该启动子的序列或由更活跃的启动子、甚至来自异源生物的启动子彻底替换该启动子而增加。为在植物中表达,如上所述,核酸分子必须有效连接至或包含合适的启动子,其中所述的启动子在正确时间点上并以所需要的空间表达模式表达基因。
为鉴定功能性等效启动子,候选启动子的启动子强度和/或表达模式可以通过将该启动子与报道基因有效连接并分析该报道基因在植物多种组织的表达水平和模式而进行分析。合适的公知报道基因包括例如β-葡糖醛酸糖苷酶或β-半乳糖苷酶。启动子活性通过测量β-葡糖醛酸糖苷酶或β-半乳糖苷酶的酶活性进行分析。启动子强度和/或表达模式随后可以与参考启动子(如本发明方法中所用的一种启动子)的启动子强度和/或表达模式比较。备选地,启动子强度可以使用本领域已知方法如Northern印迹法及放射自显影图的密度计分析法、定量实时PCR或RT-PCR(Heid等,1996GenomeMethods 6:986-994),通过定量mRNA水平或通过将本发明方法中所用核酸的mRNA水平与持家基因(如18S rRNA)的mRNA水平比较而分析。通常“弱启动子”意指驱动编码序列在低水平上表达的启动子。“低水平”意指在每个细胞约1/10,000转录物至约1/100,000转录物、至约1/500,0000转录物的水平上。相反,“强启动子”驱动编码序列在高水平、或在每个细胞约1/10转录物至约1/100转录物、至约1/1,000转录物上表达。
有效连接
如本文中所用的术语”有效连接”指启动子序列与目的基因之间功能性地连接,以至于启动子序列能够启动目的基因转录。
组成型启动子
“组成型启动子”指在生长和发育的大部分、但不必全部阶段期间和在大部分环境条件下在至少一个细胞、组织或器官内有转录活性的启动子。下表4a给出组成型启动子的实例。
表4a:组成型启动子的实例
基因来源 参考文献
肌动蛋白 McElroy等,Plant Cell,2:163-171,1990
HMGP WO 2004/070039
CAMV 35S Odell等,Nature,313:810-812,1985
CaMV 19S Nilsson等,Physiol.Plant.100:456-462,1997
GOS2 de Pater等,Plant J Nov;2(6):837-44,1992, WO 2004/065596
遍在蛋白 Christensen等,Plant Mol.Biol.18:675-689,1992
稻亲环蛋白 Buchholz等,Plant Mol Biol.25(5):837-43,1994
玉米H3组蛋白 Lepetit等,Mol.Gen.Genet.231:276-285,1992
苜蓿H3组蛋白 Wu等Plant Mol.Biol.11:641-649,1988
肌动蛋白2 An等,Plant J.10(1);107-121,1996
34S FMV Sanger等,Plant.Mol.Biol.,14,1990:433-443
Rubisco小亚基 US 4,962,028
OCS Leisner(1988)Proc Natl Acad Sci美国85(5):2553
SAD1 Jain等,Crop Science,39(6),1999:1696
SAD2 Jain等,Crop Science,39(6),1999:1696
nos Shaw等(1984)Nucleic Acids Res.12(20):7831-7846
V-ATP酶 WO 01/14572
超级启动子 WO 95/14098
G盒蛋白质 WO 94/12015
遍在启动子
遍在启动子在生物基本上所有组织或细胞内有活性。
发育调节性启动子
发育调节性启动子在某个发育期期间或在经历发育变化的植物部分内有活性。
诱导性启动子
诱导性启动子在应答化学品(综述见Gatz 1997,Annu.Rev.PlantPhysiol.Plant Mol.Biol.,48:89-108)、环境刺激或物理刺激时具有受诱导或增加的转录启动,或可以是“胁迫诱导性的”,即当植物暴露于多种胁迫条件时受到激活,或是“病原体诱导性的”,即当植物暴露于多种病原体时受到激活。
器官特异性/组织特异性启动子
器官特异性或组织特异性启动子是能够优先在某些器官或组织如叶、根、种子组织等内启动转录的启动子。例如,“根特异性启动子”是在植物根中优势地具有转录活性的启动子,在植物的任何其他部分内基本上无活性,尽管在植物的这些其他部分内允许任何泄露表达。能够仅在某些细胞中启动转录的启动子在本文中称作“细胞特异的”。
种子特异性启动子主要在种子组织中转录激活,但不必仅在种子组织中激活(渗漏表达的情况下)。种子特异性启动子可以在种子发育和/或萌发期间激活。种子特异性启动子可以是胚乳、糊粉、胚特异性的。种子特异性启动子的实例示于下表4b-4c。种子特异性启动子的其他实例由QingQu和Takaiwa(Plant Biotechnol.J.2,113-125,2004)给出,该文献的公开完整引入本文作为参考。
表4b:种子特异性启动子的实例
表4c:胚乳特异性启动子的实例
基因来源 参考文献
谷蛋白(稻) Takaiwa等,(1986)Mol Gen Genet 208:15-22 Takaiwa等,(1987)FEBS Letts.221:43-47
玉米醇溶蛋白 Matzke等,(1990)Plant Mol Biol 14(3): 323-32
小麦LMW和HMW麦谷 蛋白-1 Colot等,(1989)Mol Gen Genet 216:81-90 Anderson等,(1989)NAR 17:461-2
小麦SPA Albani等,(1997)Plant Cell 9:171-184
小麦麦醇溶蛋白 Rafalski等,(1984)EMBO 3:1409-15
大麦Itr1启动子 Diaz等,(1995)Mol Gen Genet 248(5):592-8
大麦B1,C,D,大麦醇溶蛋白 Cho等,(1999)Theor Appl Genet 98:1253-62 Muller等,(1993)Plant J 4:343-55 Sorenson等,(1996)Mol Gen Genet 250:750-60
大麦DOF Mena等,(1998)Plant J 116(1):53-62
blz2 Onate等,(1999)J Biol Chem 274(14):9175-82
合成启动子 Vicente-Carbajosa等,(1998)Plant J 13:629-640
稻谷醇溶蛋白NRP33 Wu等,(1998)Plant Cell Physiol 39(8) 885-889
稻球蛋白Glb-1 Wu等,(1998)Plant Cell Physiol 39(8) 885-889
稻球蛋白REB/OHP-1 Nakase等,(1997)Plant Molec Biol 33: 513-522
稻ADP-葡萄糖焦磷酸化酶 Russell等,(1997)Trans Res 6:157-68
玉米ESR基因家族 Opsahl-Ferstad等,(1997)Plant J 12:235-46
高粱醇溶蛋白 DeRose等,(1996)Plant Mol Biol 32:1029-35
表4d:胚特异性启动子的实例
基因来源 参考文献
稻OSH1 Sato等,Proc.Natl.Acad.Sci.美国,93:8117-8122,1996
KNOX Postma-Haarsma等,Plant Mol.Biol.39:257-71,1999
PRO0151 WO 2004/070039
PRO0175 WO 2004/070039
PRO005 WO 2004/070039
PRO0095 WO 2004/070039
表4e:糊粉特异性启动子的实例
基因来源 参考文献
α-淀粉酶 (Amy32b) Lanahan等,Plant Cell 4:203-211,1992; Skriver等,Proc Natl Acad Sci美国 88:7266-7270,1991
组织蛋白酶β- 样基因 Cejudo等,Plant Mol Biol 20:849-856,1992
大麦Ltp2 Kalla等,Plant J.6:849-60,1994
Chi26 Leah等,Plant J.4:579-89,1994
玉米B-Peru Selinger等,Genetics 149;1125-38,1998
如本文中所定义的绿色组织特异性启动子是主要在绿色组织中具有转录活性的启动子,在植物的任何其他部分内基本上无活性,尽管在植物的这些其他部分内允许任何泄露表达。
组织特异性启动子的另一个实例是分生组织特异性启动子,其主要在分生性组织中具有转录活性,在植物的任何其他部分内基本上无活性,尽管在植物的这些其他部分内允许任何泄露表达。
终止子
术语”终止子”包括这样的调控序列,其是在转录单位末端的DNA序列,发出对初级转录物进行3’加工并多聚腺苷化以及终止转录的信号。终止子可以衍生自天然基因、来自多种其他植物基因或来自T-DNA。待添加的终止子可以来自例如胭脂碱合酶或章鱼碱合酶基因或备选地来自其他植物基因或较不优选地来自任何其他真核基因。
调节
术语”调节”就表达或基因表达而言意指这样的过程,其中表达水平与对照植物相比因所述基因的表达而改变,表达水平可增加或降低。原先未受调节的表达可以是结构RNA(rRNA、tRNA)或mRNA的任何类型表达,随后是翻译。术语“调节活性”应当意指本发明核酸序列或所编码蛋白质的表达的任何变化,这导致植物增加的产量和/或增加的生长。
表达
术语“表达”或“基因表达”意指因特定一种或多种基因或基因构建体的转录。术语“表达”或“基因表达”尤其意指一种或多种基因或基因构建体转录成结构RNA(rRNA、tRNA)或mRNA,有或没有随后mRNA翻译成蛋白质。此过程包括DNA转录、加工得到的mRNA产物。
增加的表达/超量表达
如本文中所用的术语”增加的表达”或“超量表达”意指对于原有野生型表达水平是额外的任何形式表达。
在本领域内详细记载了用于增加基因或基因产物表达的方法并且它们包括例如,由适宜启动子驱动的超量表达、使用转录增强子或翻译增强子。可以在非异源形式的多核苷酸的适宜位置(一般是上游)内引入作为启动子或增强子元件的分离核酸,以便上调编码目的多肽的核酸的表达。例如,内源性启动子可以通过突变、缺失和/或取代而在体内改变(见Kmiec,美国5,565,350;Zarling等,WO9322443),或可以将分离的启动子以相对于本发明基因的正确方向及距离引入植物细胞,以便控制基因表达。
若需要多肽表达,通常希望在多核苷酸编码区的3’末端包括多聚腺苷化区。多聚腺苷化区可以来自天然基因、来自多种其他植物基因或来自T-DNA。待添加的3’末端序列可以来自例如胭脂碱合酶或章鱼碱合酶基因或备选地来自另一植物基因或更不优选来自任何其他真核基因。
内含子序列也可以添加至5′非翻译区(UTR)或部分编码性序列的编码序列上,以增加在胞浆内积累的成熟信息的量。已经证实可剪接内含子在植物表达构建体和动物表达构建体中转录单位内的包含在mRNA水平及蛋白质水平上增加基因表达至多达1000倍(Buchman和Berg(1988)Mol.Cell biol.8:4395-4405;Callis等(1987)Gens Dev 1:1183-1200)。基因表达的此类内含子增强作用一般在位于转录单位5′末端附近时最强烈。使用玉米内含子Adh1-S内含子1、2和6、Bronze-1内含子是本领域已知的。对于一般信息,见:The Maize Handbook,第116章,编者Freeling和Walbot,Springer,N.Y.(1994)。
内源基因
本文中提及的“内源”基因不仅仅指如在植物中以其天然形式(即没有任何人类干预)存在的所讨论基因,还指处于分离形式的随后(再)引入植物(转基因)的相同基因(或基本上同源的核酸/基因)。例如,含有这种转基因的转基因植物可以遭遇转基因表达大幅降低和/或内源基因表达的大幅降低。分离的基因可分离自生物体,或者是人造的,例如通过化学合成。
降低的表达
本文中提及的“降低的表达”或表达的“降低或基本去除”意指内源基因表达和/或多肽水平和/或多肽活性相对于对照植物的降低。与对照植物相比,降低或基本去除以递增优选顺序是至少10%、20%、30%、40%或50%、60%、70%、80%、85%、90%,或95%、96%、97%、98%、99%或更多的降低。
为了降低或基本去除内源基因在植物中的表达,需要核酸序列的足够长度的基本上连续的核苷酸。为了开展基因沉默,这个长度可以是少至20、19、18、17、16、15、14、13、12、11、10个或更少的核苷酸,或者该长度可以多至整个基因(包括5’和/或3’UTR,在部分或全长中)。基本上连续的核苷酸片段可以来自编码目的蛋白的核酸(靶基因)或来自能够编码目的蛋白的直向同源物、旁系同源物或同源物的任何核酸。优选地,基本上连续的核苷酸片段能够与靶基因(有义链或反义链)形成氢键,更优选地,基本上连续的核苷酸片段以递增优选顺序与靶基因(有义链或反义链)具有50%、60%、70%、80%、85%、90%、95%、96%、97%、98%、99%、100%的序列同一性。编码(功能性)多肽的核酸序列不是本文中所讨论用于降低或基本去除内源基因表达的多种方法所需的。
表达的这种降低或基本去除可以使用常规工具和技术完成。用于降低或基本去除内源基因表达的优选方法是在植物中引入并表达这样的遗传构建体,其中核酸(在此情况下是来自目的基因或任何核酸的一段基本上连续的核苷酸序列,其中所述的任何核酸能够编码任何一种目的蛋白的直向同源物、旁系同源物或同源物)克隆至所述的遗传构建体内作为由间隔区(非编码性DNA)隔开的(部分或完全的)反向重复序列。
在这种优选的方法中,使用核酸或其部分(在此情况下是从目的基因或从任何核酸中衍生的一段基本上连续的核苷酸序列,其中所述的任何核酸能够编码目的蛋白的直向同源物、旁系同源物或同源物)的反向重复序列(优选能够形成发夹结构),通过RNA介导的沉默作用而降低或基本上去除内源基因的表达。反向重复序列在包含调控序列的表达载体中克隆。非编码性DNA核酸序列(间隔序列,例如基质附着区片段(MAR)、内含子、多接头等)位于形成反向重复序列的两个反向核酸之间。在反向重复序列转录后,形成具有(部分或完全)自身互补结构的嵌合RNA。这种双链RNA结构称作发夹RNA(hpRNA)。hpRNA由植物加工成为siRNA,其被掺入RNA诱导性沉默复合物(RISC)中。RISC进一步切开mRNA转录物,因而大幅度降低待翻译成多肽的mRNA转录物的数目。对于其他一般细节,见例如Grierson等(1998)WO 98/53083;Waterhouse等(1999)WO 99/53050)。
本发明方法的实施不依赖在植物中引入并表达其中克隆入核酸作为反向重复序列的遗传构建体,而是几种公知“基因沉默”方法的任何一种或多种可以用来实现相同的效果。
一种用于降低内源基因表达的此类方法是RNA介导的基因表达沉默(下调)。沉默作用在这种情况下由基本上与内源性靶基因相似的双链RNA序列(dsRNA)在植物中触发。这种dsRNA被植物进一步加工成约20到约26个核苷酸,称作短干扰性RNA(siRNA)。siRNA被掺入RNA诱导性沉默复合物(RISC)内,其中所述的RISC进一步切割内源性靶基因的mRNA转录物,因而大幅度降低待翻译成多肽的mRNA转录物的数目。优选地,双链RNA序列对应于靶基因。
RNA沉默方法的另一个实例包括以有义方向引入核酸序列或其部分(在此情况下是从目的基因或从任何核酸中衍生的一段基本上连续的核苷酸,其中所述的任何核酸能够编码目的蛋白的直向同源物、旁系同源物或同源物)至植物内。“有义方向”指与其mRNA转录物同源的DNA序列。因而将向植物中引入该核酸序列的至少一个拷贝。这种额外的核酸序列会降低内源基因表达,产生已知为共抑制作用的现象。当核酸序列的几个额外拷贝引入植物时,基因表达的降低将更明显,因为高转录物水平与共抑制作用的触发之间存在正相关。
RNA沉默方法的另一个实例包括使用反义核酸序列。″反义″核酸序列包含与编码蛋白质的″有义″核酸序列互补,即与双链cDNA分子的编码链互补,或与mRNA转录物序列互补的核苷酸序列。反义核酸序列优选地与待沉默的内源基因互补。互补性可以位于基因的“编码区”和/或”非编码区”内。术语”编码区″指包含被翻译成氨基酸残基的密码子的核苷酸序列区。术语”非编码区″指分布在编码区两侧的被转录但不翻译成氨基酸的5’和3’序列(也称作5′和3′非翻译区)。
反义核酸序列可以根据Watson和Crick碱基配对规则设计。反义核酸序列可以与整个核酸序列互补(在此情况下是从目的基因或从任何核酸中衍生的一段基本上连续的核苷酸,其中所述的任何核酸能够编码目的蛋白的直向同源物、旁系同源物或同源物),不过也可以是仅与核酸序列的一部分(包括mRNA 5’和3’UTR)反义的寡核苷酸。例如,反义寡核苷酸序列可以与围绕编码多肽的mRNA转录物的翻译起点周围的区域互补。合适的反义寡核苷酸序列的长度是本领域已知的并且可以从长度约50、45、40、35、30、25、20、15或10个核苷酸或更少的核苷酸开始。本发明的反义核酸序列可以利用本领域已知方法,使用化学合成和酶连接反应而构建。例如,反义核酸序列(例如反义寡核苷酸序列)可以使用天然发生的核苷酸或多种修饰的核苷酸化学地合成,其中所述修饰的核苷酸被设计旨在增加分子的生物学稳定性或增加反义核酸序列与有义核酸序列之间所形成双链体的物理稳定性,例如,可以使用硫代磷酸酯衍生物和吖啶取代的核苷酸。可以用来产生反义核酸序列的修饰核苷酸的实例是本领域众所周知的。已知的核苷酸修饰包括甲基化、环化和′加帽′及用类似物(如肌苷)取代一个或多个天然发生的核苷酸。其他的核苷酸修饰是本领域众所周知的。
这种反义核酸序列可以使用其中核酸序列已经以反义方向加以亚克隆(即从插入的核酸中转录的RNA将与目的靶核酸呈反义方向)的表达载体以生物学方式产生。优选地,反义核酸序列在植物中的产生借助稳定整合的核酸构建体进行,其中所述的核酸构建体包含启动子、有效连接的反义寡核苷酸和终止子。
用于本发明方法中沉默作用的核酸分子(无论向植物中引入或在原位产生)与编码多肽的mRNA转录物和/或基因组DNA杂交或结合,以便例如通过抑制转录和/或翻译而抑制蛋白质表达。杂交可以通过形成稳定双链体的常规核苷酸互补性所致,或在结合于DNA双链体的反义核酸序列的情况下,因双螺旋大沟内特异性相互作用所致。反义核酸序列可以通过转化或在特定组织部位直接注射而引入植物。备选地,反义核酸序列可以为了靶向所选择的细胞而受到修饰并且随后系统性施用。例如,对于系统性施用,反义核酸序列可以被修饰以便它们特异结合表达在所选择的细胞表面上的受体或抗原,例如通过连接反义核酸序列至与细胞表面受体或抗原结合的肽或抗体。反义核酸序列也可以使用本文中所述的载体送递至细胞内。
根据另一个方面,反义核酸序列是α-异头核酸序列。α异头核酸序列与互补性RNA形成特定双链杂交分子,其中与惯常b-单元相反,所述链相互平行(Gaultier等(1987)Nucl Ac Res 15:6625-6641)。反义核酸序列也可以包含2′-o-甲基核糖核苷酸(Inoue等(1987)Nucl Ac Res 15,6131-6148)或嵌合RNA-DNA类似物(Inoue等(1987)FEBS Lett.215,327-330)。
内源基因表达的降低或基本去除也可以使用核酶而进行。核酶是具有核糖核酸酶活性的催化性RNA分子,能够切割与其具有互补区域的单链核酸序列,如mRNA。因此,核酶(例如锤头核酶(在Haselhoff和Gerlach(1988)Nature 334,585-591中描述)可以用来催化性地切割编码多肽的mRNA转录物,因而大幅度降低待翻译成多肽的mRNA转录物的数目。可以设计对核酸序列具特异性的核酶(见例如:Cech等美国专利号4,987,071;和Cech等美国专利号5,116,742)。备选地,对应于核酸序列的mRNA转录物可以用来从RNA分子库中选出具有特异性核糖核酸酶活性的催化性RNA(Bartel和Szostak(1993)Science 261,1411-1418)。核酶用于植物中基因沉默的用途是本领域已知的(例如Atkins等(1994)WO94/00012;Lenne等(1995)WO 95/03404;Lutziger等(2000)WO 00/00619;Prinsen等(1997)WO 97/13865和Scott等(1997)WO 97/38116)。
基因沉默也可以通过插入诱变(例如T-DNA插入或转座子插入)或通过如Angell和Baulcombe((1999)Plant J.20(3):357-62)、(Amplicon VIGSWO 98/36083)或Baulcombe(WO 99/15682)及其他人描述的策略而实现。
当在内源基因上存在突变和/或在随后引入植物的分离的基因/核酸上存在突变时,基因沉默也可以发生。降低或基本去除可以由无功能的多肽引起。例如,多肽可以与多种相互作用性蛋白质结合;一个或多个突变和/或截短因而可以提供仍能够结合相互作用性蛋白质(如受体蛋白质)但不能表现其正常功能的多肽(如起信号作用的配体)。
另一种基因沉默的方法是靶定与基因调节区(例如启动子和/或增强子)互补的核酸序列以形成阻止基因在靶细胞中转录的三螺旋结构。见Helene,C.,Anticancer Drug Res.6,569-84,1991;Helene等,Ann.N.Y.Acad.Sci.660,27-361992和Maher,L.J.Bioassays 14,807-15,1992。
其他方法,如使用针对内源性多肽的抗体以抑制此多肽在植物中的功能,或干扰所述多肽参与的信号途径,对于技术人员将是众所周知的。尤其,可以构思的是人造分子可以用于抑制靶多肽的生物学功能,或用于干扰靶多肽参与其中的信号途径。
备选地,可以建立筛选程序以鉴定在植物群体中基因的天然变体,其中所述的变体编码具有降低活性的多肽。此类天然变体也可以用于例如进行同源重组。
人工和/或天然的微RNA(miRNA)可以用来敲除基因表达和/或mRNA翻译。内源性miRNA是通常19-24个核苷酸长度的单链小RNA。它们的主要功能是调节基因表达和/或mRNA翻译。大多数的植物微RNA(miRNA)与其靶序列具有完全的或接近完全的互补性。然而,存在具有多达5个错配的天然靶标。它们由切酶家族的双链特异性RNA酶从具有特征性折回结构的较长的非编码性RNA中加工而来。在加工时,它们通过与RNA诱导性沉默复合物(RISC)的主要成分Argonaute蛋白质结合而掺入该复合体。MiRNA充当RISC的特异性成分,因此它们与细胞质中的靶核酸(大多是mRNA)碱基配对。后续的调节事件包括靶mRNA切割和破坏和/或翻译抑制。miRNA超量表达的作用因此在靶基因降低的mRNA水平上得到反映。
通常21个核苷酸长度的人工微RNA(amiRNAs)可以遗传改造以特异性地负调节单个或多个目的基因的基因表达。植物微RNA靶的选择的决定因素是本领域众所周知的。用于靶识别的经验参数已经确定并且可以用来辅助设计特定的amiRNA,(Schwab等,Dev.Cell 8,517-527,2005)。用于设计并产生amiRNA及其前体的便利工具也是公众可获得的(Schwab等,Plant Cell 18,1121-1133,2006)。
为最佳性能,用于降低内源基因在植物中表达的基因沉默技术需要使用来自单子叶植物的核酸序列以转化单子叶植物,和使用来自双子叶植物的核酸序列以转化双子叶植物。优选地,将来自任何给定植物物种的核酸序列引入同一个物种内。例如,将来自稻的核酸序列转化至稻植物。然而,并非绝对要求待引入的核酸序列起源于与该核酸序列将要引入的植物相同的植物物种。只要内源性靶基因与待引入的核酸之间存在相当大的同源性就足够了。
上文描述的是用于降低或基本去除内源基因在植物中表达的多种方法的实例。本领域技术人员会轻易地能够调整前述用于沉默的方法以至于例如通过利用合适启动子而实现降低内源基因在整株植物或在其部分中的表达。
选择性标记(基因)/报道基因
″选择性标记″、″选择性标记基因″或“报道基因”包括向细胞赋予表型的任何基因,其中在所述的细胞内表达所述基因以促进鉴定和/或选择用本发明的核酸构建体所转染或转化的细胞。这些标记基因能够通过一系列不同原理鉴定核酸分子的成功转移。合适的标记可以选自赋予抗生素耐药性或除草剂抗性、引入新代谢性状或允许目视选择的标记。选择性标记基因的实例包括赋予抗生素耐药性的基因(如使新霉素和卡那霉素磷酸化的nptII或使潮霉素磷酸化的hpt或赋予对例如博来霉素、链霉素、四环素、氯霉素、氨苄青霉素、庆大霉素、遗传霉素(Geneticin)(G418)、壮观霉素或杀稻瘟素的抗性的基因)、赋予除草剂抗性的基因(例如提供
抗性的bar;提供草甘膦抗性的aroA或gox或赋予对例如咪唑啉酮、膦丝菌素或磺脲类的抗性的基因)或提供代谢性状的基因(如允许植物使用甘露糖作为唯一碳源的manA或利用木糖的木糖异构酶或抗营养标记如2-脱氧葡萄糖抗性)。目视标记基因的表达导致形成颜色(例如β-葡糖醛酸糖苷酶、GUS或β-半乳糖苷酶与其有色底物例如X-Gal)、发光(如萤光素/萤光素酶系统)或荧光(绿色荧光蛋白GFP及其衍生物)。这个名单仅代表少数的可能标记。技术人员熟悉此类标记。取决于生物和选择方法,优选不同的标记。
已知当核酸稳定或瞬时整合至植物细胞时,仅小部分的细胞摄取外来DNA并且根据需要将其整合至细胞基因组,这取决于所用表达载体和使用的转染技术。为鉴定并选择这些整合子,通常将编码选择性标记(如上文所述之一)的基因连同目的基因一起引入宿主细胞。这些标记可以在其中这些基因因例如常规方法所致的缺失而无功能的突变体中使用。此外,编码选择性标记的核酸分子可以引入宿主细胞中,与在包含编码本发明多肽或本发明方法中所用多肽的序列在同一载体上,或在单独的载体上。已经用引入的核酸稳定转染的细胞可以通过选择进行鉴定(例如具有整合的选择性标记的细胞存活而其他细胞死亡)。
因为一旦已经成功引入了核酸,则转基因宿主细胞中不再需要或不希望有标记基因,尤其抗生素耐药性基因和除草剂抗性基因,因此用于引入核酸的本发明方法有利地使用能够去掉或切除这些标记基因的技术。一种如此方法称作共转化法。共转化法使用同时用于转化的两种载体,一种载体携带本发明的核酸而另一种载体携带标记基因。高比例的转化体接受,或在植物的情况下,包含(高达40%或更多的转化体)这两种载体。在用农杆菌(Agrobacterium)转化的情况下,转化体通常仅接受载体的一部分,即侧翼有T-DNA的序列,它通常代表表达盒。标记基因随后可以通过进行杂交而从转化的植物中去掉。在另一种方法中,整合至转座子的标记基因用来与想要的核酸一起进行转化(称作Ac/Ds技术)。转化体可以与转座酶来源植物杂交或转化体用导致转座酶表达的核酸构建体瞬时或稳定地转化。在一些情况下(大约10%),转座子在已经成功发生转化时跳出宿主细胞的基因组并丢失。在其他更多情况下,转座子跳至不同位置。在这些情况下,标记基因必须通过进行杂交而去除。在微生物学中,开发了实现或促进检测这类事件的技术。另一个有利的方法依赖于重组系统;此方法的优势在于不必通过杂交去除。该类型的最知名系统称作Cre/lox系统。Cre1是去掉位于loxP序列之间序列的重组酶。若标记基因整合于loxP序列之间,则通过重组酶表达已经成功发生转化时,标记基因被去除。其他重组系统是HIN/HIX、FLP/FRT和REP/STB系统(Tribble等,J.Biol.Chem.,275,2000:22255-22267;Velmurugan等,J.Cell Biol.,149,2000:553-566)。有可能将本发明核酸序列以位点特异性方式整合至植物基因组。这些方法自然也可以应用至微生物如酵母、真菌或细菌。
转基因的/转基因/重组
为本发明目的,″转基因的″、”转基因”或″重组″就核酸序列而言意指包含此核酸序列的表达盒、基因构建体或载体或用本发明的核酸序列、表达盒或载体转化的生物,这些构建均通过重组方法产生,其中
(a)编码用于本发明方法中的蛋白质的核酸序列,或
(b)与本发明核酸序列有效连接的遗传调控序列,例如启动子,或
(c)(a)和(b)
不处于其天然遗传环境中或已经通过遗传操作方法修饰,修饰有可能采用例如取代、添加、缺失、倒位或插入一个或多个核苷酸残基的形式。天然遗传环境理解为意指来源植物中的天然基因组基因座或染色体基因座或在基因组文库中存在。在基因组文库的情况下,核酸序列的天然遗传环境优选地得到保留,至少部分地得以保留。该环境分布在核酸序列的至少一侧并且具有至少50bp,优选至少500bp,特别优选至少1000bp,最优选至少5000bp的序列长度。天然发生的表达盒-例如核酸序列的天然启动子与编码本发明方法中所用多肽的对应核酸序列的天然发生的组合,如上文所定义-在这种表达盒通过非天然的合成(“人工”)方法(如诱变处理)而受到修饰时,变成转基因表达盒。合适方法例如在US 5,565,350或WO00/15815中描述。
为本发明目的,转基因植物因此如上理解为意指本发明方法中所用的核酸不位于所述植物基因组中该核酸的天然基因座内,所述核酸有可能同源或异源地表达。然而如所提及,转基因还意指尽管本发明核酸或在本发明方法中所用核酸处于植物基因组中该核酸的天然位置内,然而其序列相对于天然序列而言已经受到修饰,和/或所述天然序列的调节序列已经受到修饰。转基因优选地理解为意指本发明核酸在基因组中的非天然基因座内表达,即发生核酸的同源表达或优选异源表达。在本文中提到了优选的转基因植物。
转化
如本文中所提及的术语“引入”或“转化”包括外源性多核苷酸转移至宿主细胞内,无论用于转化的方法是什么。能够后续克隆性增殖(无论通过器官发生或胚胎发生)的植物组织可以用本发明的遗传构建体转化并且可以从中再生整株植物。选择的具体组织将取决于可用于并且最适于正进行转化的具体物种的克隆性增殖系统。示例性组织靶包括叶盘、花粉、胚、子叶、下胚轴、大配子体、愈伤组织、现存分生组织(例如顶端分生组织、腋芽和根分生组织)和诱导的分生组织(例如子叶分生组织和下胚轴分生组织)。多核苷酸可以瞬时或稳定地引入宿主细胞并且可以非整合地维持,例如作为质粒。备选地,多核苷酸可以整合至宿主基因组内。产生的转化植物细胞随后可以用来以本领域技术人员已知的方式再生出转化植物。
外来基因转化至植物基因组内称作转化。植物物种的转化现在是相当常规的技术。有利地,几种转化方法中的任一方法可以用来将目的基因引入合适的祖先细胞。用于从植物组织或植物细胞中转化并再生出植物所述的方法可以用于瞬时转化或用于稳定转化。转化方法包括使用脂质体、电穿孔法、增加游离DNA摄入的化学品、DNA直接注射至植物、粒子枪轰击法、使用病毒或花粉的转化法和显微投射法(microprojection)。转化方法可以选自用于原生质体的钙/聚乙二醇法(Krens,F.A.等,(1982)Nature296,72-74;Negrutiu I等(1987)Plant Mol Biol 8:363-373);原生质体的电穿孔法(Shillito R.D.等(1985)Bio/Technol 3,1099-1102);对植物材料的微量注射法(Crossway A等,(1986)Mol.Gen Genet 202:179-185);DNA或RNA涂布的粒子轰击法(Klein TM等,(1987)Nature 327:70)、(非整合性)病毒感染法等。转基因植物,包括转基因作物植物,优选地通过农杆菌介导的转化法产生。有利的转化方法是在植物中(in planta)的转化法。为此目的,例如有可能使农杆菌作用于植物种子或有可能用农杆菌接种植物的分生组织。根据本发明已经证明使转化的农杆菌混悬液作用于完整植物或至少作用于花原基是特别有利的。植物随后继续培育直至获得所处理植物的种子(Clough和Bent,Plant J.(1998)16,735-743)。用于农杆菌介导的稻转化的方法包括用于稻转化的公知方法,如在任一以下文献中描述的那些方法:欧洲专利申请EP 1198985 A1,Aldemita和Hodges(Planta199:612-617,1996);Chan等(Plant Mol Biol 22(3):491-506,1993),Hiei等(Plant J 6(2):271-282,1994),其公开内容在本文中引入作为参考,如同完全给出那样。在玉米转化的情况下,优选的方法如Ishida等(Nat.Biotechnol 14(6):745-50,1996)或Frame等(Plant Physiol 129(1):13-22,2002)描述,其公开内容在本文中如充分所述那样引入作为参考。所述方法通过举例方式进一步由B.Jenes等,Techniques for Gene Transfer,在:Transgenic Plants,第1卷,Engineering and Utilization,编者S.D.Kung和R.Wu,Academic Press(1993)128-143及在Potrykus Annu.Rev.PlantPhysiol.Plant Molec.Biol.42(1991)205-225)中描述。待表达的核酸或构建体优选地克隆至适于转化根癌农杆菌(Agrobacterium tumefaciens)的载体,例如pBin19(Bevan等,Nucl.Acids Res.12(1984)8711)。由这种载体转化的农杆菌随后可以按照已知方式用于转化植物,例如作为模型使用的植物,如拟南芥(拟南芥属于本发明的范围,不视为作物植物)或作物植物,例如烟草植物,通过在农杆菌溶液中浸泡擦伤的叶或切碎的叶并随后将它们在合适的培养基内培育。植物通过根癌农杆菌的转化例如由
和Willmitzer在Nucl.Acid Res.(1988)16,9877中描述或尤其从F.F.White,Vectors for Gene Transfer in Higher Plants;在Transgenic Plants,第1卷,Engineering and Utilization,编者S.D.Kung和R.Wu,AcademicPress,1993,第15-38页中获知。
除了转化体细胞(其随后必须再生成完整植物)之外,还有可能转化植物分生组织的细胞及特别转化发育成配子的那些细胞。在这种情况下,转化的配子遵循天然的植物发育过程,产生转基因植物。因此,例如拟南芥种子用农杆菌处理并且从发育植物中获得种子,其中一定比例的所述植物受到转化并且因此是转基因的[Feldman,KA和Marks MD(1987)Mol GenGenet 208:274-289;Feldmann K(1992)。在:编者C Koncz,N-H Chua和J Shell,Methods in Arabidopsis Research.Word Scientific,Singapore,第274-289页]。替代性方法基于反复去掉花序并使莲座叶丛中心中的切除部位与转化的农杆菌温育,因而转化的种子同样可以在较晚的时间点获得(Chang(1994)Plant J.5:551-558;Katavic(1994)Mol Gen Genet,245:363-370)。然而,尤其有效的方法是改良的真空渗入法,如“花浸染”法。在拟南芥真空渗入法的情况下,完整植物在减压下用农杆菌混悬液处理[Bechthold,N(1993)。C R Acad Sci Paris Life Sci,316:1194-1199],而在“花浸染法”的情况下,正在发育的花组织与表面活性剂处理的农杆菌混悬液短暂温育[Clough,SJ和Bent,AF(1998)The Plant J.16,735-743]。在两种情况下收获了一定比例的转基因种子,并且这些种子可以通过在如上所述的选择条件下培育而与非转基因种子区分。此外,质体的稳定转化是有利的,因为质体在大部分作物中以母体方式遗传,降低或消除了转基因经花粉流动风险。叶绿体基因组的转化一般通过已在Klaus等,2004[Nature Biotechnology 22(2),225-229]中示例性加以展示的方法实现。简而言之,待转化的序列连同选择性标记基因一起克隆至与叶绿体基因组同源的侧翼序列之间。这些同源的侧翼序列指导位点特异性整合至原质体系内。已经对众多不同植物物种描述了质体转化并且综述可以出自Bock(2001)在基础研究和植物生物技术中的转基因质体(Transgenicplastids in basic research and plant biotechnology).J Mol Biol.2001年9月21日;312(3):425-38或Maliga,P(2003)质体转化技术商业化进展(Progress towards commercialization of plastid transformationtechnology).Trends Biotechnol.21,20-28。进一步生物技术进展最近已经以无标记质体转化体的形式作了报道,所述无标记质体转化体可以通过瞬时共整合的标记基因产生(Klaus等,2004,Nature Biotechnology 22(2),225-229)。
T-DNA激活标注
T-DNA激活标注(Hayashi等,Science(1992)1350-1353)涉及在目的基因的基因组区域内或基因编码区上游或下游10kb处以如此结构插入T-DNA(通常含有启动子(也可以是翻译增强子或内含子)),使得启动子指导被靶定基因的表达。通常,由靶定基因的天然启动子对所述靶定基因表达的调节作用遭到破坏并且该基因处在新引入的启动子控制下。启动子一般嵌入在T-DNA中。这种T-DNA随机地插入植物基因组,例如通过农杆菌感染,并导致在所插入T-DNA附近的基因的改良表达。因靠近所引入启动子的基因的改良表达,产生的转基因植物表现显性表型。
TILLING
术语“TILLING”是“基因组内定向诱导的局部损伤”的缩写且意指用于产生和/或鉴定核酸诱变技术,其中所述的核酸编码具有修饰表达和/或活性的蛋白质。TILLING还允许选择携带此类突变变体的植物。这些突变变体可以显示在强度方面或在位置方面或在时间方面改良的表达(例如若突变影响启动子)。这些突变变体可以显示比由处于其天然形式的基因所显出活性更高的活性。TILLING将高密度诱变与高通量筛选方法组合。一般在TILLING中遵循的步骤是:(a)EMS诱变(Redei GP和Koncz C(1992)在Methods in Arabidopsis Research,Koncz C,Chua NH,Schell J,Singapore编著,World Scientific Publishing Co,第16-82页;Feldmann等,(1994)在Meyerowitz EM,Somerville CR编著,Arabidopsis.ColdSpring Harbor Laboratory Press,Cold Spring Harbor,NY,第137-172页;Lightner J和Caspar T(1998)在J Martinez-Zapater,J Salinas编者,Methods on Molecular Biology第82卷.Humana Press,Totowa,NJ,第91-104页);(b)个体的DNA制备和汇集;(c)PCR扩增目的区;(d)变性和复性以允许形成异源双链体;(e)DHPLC,其中将异源双链体是否在汇集物中的存在检测为色谱图中的一个额外峰;(f)鉴定突变个体;和(g)对突变PCR产物测序。用于TILLING的方法是本领域众所周知的(McCallum等,(2000)Nat Biotechnol 18:455-457;综述见Stemple(2004)Nat Rev Genet5(2):145-50)。
同源重组
同源重组允许选择的核酸于确定的选择位置上引入基因组中。同源重组是在生物科学中常规地用于低等生物如酵母或苔藓剑叶藓(Physcomitrella)的标准技术。用于在植物中开展同源重组的方法已经不仅对模式植物(Offringa等(1990)EMBO J 9(10):3077-84)而且对作物植物例如稻(Terada等(2002)Nat Biotech 20(10):1030-4;Iida和Terada(2004)Curr Opin Biotech 15(2):132-8)进行了描述。
产量
术语”产量”通常意指经济价值的可测量结果,一般与指定作物、与面积并与时间段有关。单个植物部分基于它们的数目、大小和/或重量而直接对产量有贡献,或实际产量是对于某作物和一年的每平方米产量,这通过总产量(包括收获的和评估的产量)除以种植的平方米数而确定。术语植物的“产量”涉及该植物的营养生物量(根和/或枝条生物量)、生殖器官和/或繁殖体(例如种子)。
早期萌发势
“早期萌发势”指尤其在植物生长早期期间活跃、健康、良好平衡的生长,且可以因植物适应性增加而产生,其原因在于例如植物更好地适应其环境(即优化能源的使用和苗与根之间的分配)。具有早期萌发势的植物也显示增加的幼苗存活和更好的作物建立,这往往导致高度均匀的田块(作物整齐地生长,即大多数植物在基本上相同的时间上达到发育的各阶段)和往往更好及更高的产量。因而,早期萌发势可以通过多种因子如千粒重、萌发百分数、出苗百分数、幼苗生长、幼苗高度、根长度、根及苗生物量和众多其他因素而确定。
增加/改善/增强
术语“增加”,”改善”或“增强”是可互换的并且应当在本申请含义上指与如本文中定义的对照植物相比至少3%、4%、5%、6%、7%、8%、9%或10%、优选至少15%或20%、更优选地25%、30%、35%或40%更多的产量和/或生长。
种子产量
增加的种子产量本身可以表现为下列一种或多种指标:a)种子生物量(种子总重量)增加,这可以基于单粒种子和/或每株植物和/或每平方米;b)每株植物增加的花数;c)增加的(饱满)种子数;d)增加的种子饱满率(其表述为饱满种子数与种子总数之间的比率);e)增加的收获指数,其表述为可收获部分(如种子)产量与总生物量的比率;和f)增加的千粒重(TKW),这从计数的饱满种子数及其总重量外推而来。增加的TKW可以因增加的种子大小和/或种子重量所致,并且也可以因胚和/或胚乳尺寸的增加所致。
种子产量的增加也可以表现为种子大小和/或种子体积的增加。此外,种子产量的增加本身也可以自我表现为种子面积和/或种子长度和/或种子宽度和/或种子周长的增加。增加的产量也可以产生改良的结构,或可以因改良的结构而出现。
绿度指数
文中所用的“绿度指数”计算自植物的数字图像。对于属于图像上对应的植物目标的每一像素,计算绿度值与红度值的比值(在编码颜色的RGB模式中)。绿度指数表示为绿与红的比值超过给定阈值的像素百分比。在正常生长条件下、在盐胁迫生长条件下以及在可获得营养物减少的生长条件下,植物的绿度指数在开花前的末次取像时测量。与之相反,在干旱胁迫生长条件下,植物的绿度指数在干旱前的初次取像时测量。
植物
如本文中所用的术语”植物”包含整株植物、植物的祖先及后代和植物部分,包括种子、枝条、茎、叶、根(包括块茎)、花和组织及器官,其中每种所提及对象包含目的基因/核酸。术语”植物”也包含植物细胞、悬浮培养物、愈伤组织、胚、分生组织区、配子体、孢子体、花粉和小孢子,同样每种提及的对象包含目的基因/核酸。
特别用于本发明方法中的植物包括属于植物界(Viridiplantae)超家族的全部植物,尤其单子叶植物和双子叶植物,包括选自以下的饲用或饲料豆类、观赏植物、粮食作物、树或灌木:槭树属物种(Acer spp.)、猕猴桃属物种(Actinidia spp.)、秋葵属物种(Abelmoschus spp.)、剑麻(Agavesisalana)、冰草属物种(Agropyron spp.)、匍匐剪股颖(Agrostisstolonifera)、葱属物种(Allium spp.)、苋属物种(Amaranthus spp.)、欧洲海滨草(Ammophila arenaria)、凤梨(Ananas comosus)、番荔枝属物种(Annona spp.)、芹菜(Apium graveolens)、落花生属物种(Arachis spp.)、木波罗属物种(Artocarpus spp.)、石刁柏(Asparagus officinalis)、燕麦属物种(Avena spp.)(例如燕麦(Avena sativa)、野燕麦(Avena fatua)、比赞燕麦(Avena byzantina)、Avena fatua var.sativa、杂种燕麦(Avena hybrida)、阳桃(Averrhoa carambola)、箣竹属(Bambusa sp.)、冬瓜(Benincasahispida)、巴西栗(Bertholletia excelsea)、甜菜(Beta vulgaris)、芸苔属物种(Brassica spp.)(例如欧洲油菜(Brassica napus)、芜青物种(Brassica rapassp.)[卡诺拉油菜、油菜(oilseed rape)、蔓青(turnip rape)])、Cadabafarinosa、茶(Camellia sinensis)、美人蕉(Canna indica)、大麻(Cannabissativa)、辣椒属物种(Capsicum spp.)、Carex elata、番木瓜(Carica papaya)、大果假虎刺(Carissa macrocarpa)、山核桃属物种(Carya spp.)、红花(Carthamus tinctorius)、栗属物种(Castanea spp.)、美洲木棉(Ceibapentandra)、苦苣(Cichorium endivia)、樟属物种(Cinnamomum spp.)、西瓜(Citrullus lanatus)、柑橘属物种(Citrus spp.)、椰子属物种(Cocos spp.)、咖啡属物种(Coffea spp.)、芋头(Colocasia esculenta)、非洲梧桐属物种(Colaspp.)、黄麻属(Corchorus sp.)、芫荽(Coriandrum sativum)、榛属物种(Corylus spp.)、山楂属物种(Crataegus spp.)、番红花(Crocus sativus)、南瓜属物种(Cucurbita spp.)、香瓜属物种(Cucumis spp.)、菜蓟属(Cynara spp.物种)、胡萝卜(Daucus carota)、山马蝗属物种(Desmodium spp.)、龙眼(Dimocarpus longan)、薯蓣属物种(Dioscorea spp.)、柿树属物种(Diospyrosspp.)、稗属物种(Echinochloa spp.)、油棕属(Elaeis)(例如油棕(Elaeisguineensis)、美洲油棕Elaeis(oleifera))、穇子(Eleusine coracana)、蔗茅属(Erianthus sp.)、枇杷(Eriobotrya japonica)、桉属(Eucalyptus sp.)、红仔果(Eugenia uniflora)、荞麦属物种(Fagopyrum spp.)、水青冈属物种(Fagusspp.)、苇状羊茅(Festuca arundinacea)、无花果(Ficus carica)、金桔属物种(Fortunella spp.)、草莓属物种(Fragaria spp.)、银杏(Ginkgo biloba)、大豆属(Glycine spp.)(例如大豆、大豆(Soja hispida)或大豆(Soja max))、陆地棉(Gossypium hirstum)、向日葵属(Helianthus spp.)(例如向日葵(Helianthusannuus))、长管萱草(Hemerocallis fulva)、木槿属物种(Hibiscus spp.)、大麦属(Hordeum spp.)(例如大麦(Hordeum vulgare))、甘薯(Ipomoeabatatas)、核桃属物种(Juglans spp.)、莴苣(Lactuca sativa)、山黧豆属物种(Lathyrus spp.)、兵豆(Lens culinaris)、亚麻(Linum usitatissimum)、荔枝(Litchi chinensis)、百脉根属物种(Lotus spp.)、棱角丝瓜(Luffa acutangula)、羽扇豆属物种(Lupinus spp.)、Luzula sylvatica、番茄属(Lycopersicon spp.)(例如番茄(Lycopersicon esculentum、Lycopersicon lycopersicum、Lycopersicon pyriforme))、硬皮豆属物种(Macrotyloma spp.)、苹果属物种(Malus spp.)、凹缘金虎尾(Malpighia emarginata)、牛油果(Mammeaamericana)、芒果(Mangifera indica)、木薯属物种(Manihot spp.)、人心果(Manilkara zapota)、苜蓿(Medicago sativa)、草木樨属物种(Melilotus spp.)、薄荷属物种(Mentha spp.)、芒(Miscanthus sinensis)、苦瓜属物种(Momordica spp.)、黑桑(Morus nigra)、芭蕉属物种(Musa spp.)、烟草属物种(Nicotiana spp.)、木犀榄属物种(Olea spp.)、仙人掌属物种(Opuntiaspp.)、鸟足豆属物种(Ornithopus spp.)、稻属(Oryza spp.)(例如稻、阅叶稻(Oryza latifolia))、稷(Panicum miliaceum)、柳枝稷(Panicum virgatum)、鸡蛋果(Passiflora edulis)、欧防风(Pastinaca sativa)、狼尾草属物种(Pennisetum sp.)、鳄梨属物种(Persea spp.)、芹菜(Petroselinum crispum)、虉草(Phalaris arundinacea)、菜豆属物种(Phaseolus spp.)、猫尾草(Phleumpratense)、刺葵属物种(Phoenix spp.)、南方芦苇(Phragmites australis)、酸浆属物种(Physalis spp.)、松属物种(Pinus spp.)、阿月浑子(Pistacia vera)、豌豆属物种(Pisum spp.)、早熟禾属物种(Poa spp.)、杨属物种(Populusspp.)、牧豆草属物种(Prosopis spp.)、李属物种(Prunus spp.)、番石榴属物种(Psidium spp.)、石榴(Punica granatum)、西洋梨(Pyrus communis)、栎属物种(Quercus spp.)、萝卜(Raphanus sativus)、波叶大黄(Rheumrhabarbarum)、茶藨子属物种(Ribes spp.)、蓖麻(Ricinus communis)、悬钩子属物种(Rubus spp.)、甘蔗属物种(Saccharum spp.)、柳属物种(Salixsp.)、接骨木属物种(Sambucus spp.)、黑麦(Secale cereale)、胡麻属物种(Sesamum spp.)、白芥属物种(Sinapis sp.)、茄属(Solanum spp.)(例如马铃薯(Solanum tuberosum)、红茄(Solanum integrifolium)或番茄(Solanumlycopersicum))、两色蜀黍(Sorghum bicolor)、菠菜属物种(Spinacia spp.)、蒲桃属物种(Syzygium spp.)、万寿菊属物种(Tagetes spp.)、酸豆(Tamarindus indica)、可可树(Theobroma cacao)、车轴草属物种(Trifoliumspp.)、Triticosecale rimpaui、小麦属(Triticum spp.)(例如普通小麦(Triticum aestivum)、硬粒小麦(Triticum durum)、圆柱小麦(Triticumturgidum)、Triticum hybernum、马卡小麦(Triticum macha)、普通小麦(Triticum sativum)或普通小麦(Triticum vulgare))、小金莲花(Tropaeolumminus)、金莲花(Tropaeolum majus)、越桔属物种(Vaccinium spp.)、野碗豆属物种(Vicia spp.)、豇豆属物种(Vigna spp.)、香堇(Viola odorata)、葡萄属物种(Vitis spp.)、玉蜀黍、Zizania palustris、枣属物种(Ziziphus spp.)等等。
发明详述
锚蛋白-Zn指多肽的详细描述
现已惊奇地发现调节编码来自拟南芥(AtAZ)的AZ多肽或其同源物的核酸在植物中的表达产生了相对于对照植物具有增加的产量的植物。根据本发明的一个实施方案,提供增加植物产量的方法,其包括调节编码AZ多肽或其同源物在植物中的表达。有利地,实施根据本发明的方法产生了相对于对应野生植物具有增加的产量的植物,特别是种子产量。
“参考”、“参考植物”、“对照”、“对照植物”、“野生型”或“野生型植物”尤其是这样的细胞、组织、器官、植物或其部分,其不是根据本发明方法产生的。因此,术语“野生型”、”对照”或“参考”是可相互交换的并且可以是未根据本文中所述的本发明方法加以修饰或处理的植物的细胞或一部分,如细胞器或组织、或植物。因此,用作野生型、对照或参考的植物的细胞或部分如细胞器或者植物尽可能地对应于细胞、植物或其部分,并且在除本发明方法的结果以外的其他任何特性上与本发明的主题尽可能相同。因此,将野生型、对照或参考相同地或尽可能相同地处理,也即仅如此条件或特性可以不同,其中所述的条件或特性不影响所测试特性的品质。换句话说,这意味野生型指这样的植物(1)其携带基因或等位基因的未改变或未调整形式,或指(2)用于得到本发明方法所产生植物的起始材料/植物。
优选地,在野生型植物与由本发明方法产生的植物之间的任何比较在相似的条件下进行。术语”相似的条件”意指全部条件,例如培养条件或生长条件、分析条件(如缓冲液组成、温度、底物、病原体株系、浓度等)在待比较的实验之间保持相同。
“参考”、“对照”或“野生型”优选是这样的对象,例如细胞器、细胞、组织、植物,其未根据本文中所述的本发明方法加以调整、修饰或处理并且在任何其他特性上尽可能与本发明的主题相似。参考、对照或野生型在其基因组、转录物组、蛋白质组或代谢物组上尽可能与本发明的主题相似。优选地,术语“参考-”、“对照-”或“野生型-”的细胞器、细胞、组织或植物涉及这样的细胞器、细胞、组织或植物,其与本发明细胞器、细胞、组织或植物或其部分遗传上几乎相同,优选95%,更优选98%、甚至更优选99.00%、尤其99.10%、99.30%、99.50%、99.70%、99.90%、99.99%、99.999%或更高,最优选地,“参考”、“对照”或“野生型”是这样的对象,例如细胞器、细胞、组织或植物,其与根据本发明方法使用的植物、细胞、细胞器在遗传上相同,除核酸分子或由所述核酸分子编码的基因产物根据本发明方法受到改变、调整或修饰之外。
优选如本文所定义的术语“表达”或“基因表达”导致因特定一种或多种基因转录所致的表型性状出现。
涉及多肽的活性在细胞、组织、细胞器、器官或生物或其部分中的增加与对照、参考或野生型相比优选地达到至少5%、优选至少10%或至少15%、特别优选至少20%、25%、30%或更高,极特别优选是至少40%、50%或60%,最优选是至少70%或更高。
本文所定义的术语“增加的产量”意指植物的一个或多个部分的生物量(重量)增加,所述的部分可以包括地上(可收获)部分和/或地下(可收获)部分。在优选实施方案中,增加的产量是增加的种子产量。
因此,此类可收获部分优选是种子,且本发明方法的实施产生相对于对照植物的种子产量具有增加的种子产量的植物。
种子产量的增加也可以表现为种子大小和/或种子体积的增加,其也可以影响种子的组分(包括油、蛋白和碳水化合物总含量和组分)。
以玉米为例,产量增加可以表现为下列一种或多种指标:每平方米植物数的增加、每株植物穗数的增加、行数的增加、每行粒数、粒重、千粒重、穗长度/直径、种子饱满率的增加(其中种子饱满率是饱满种子数除以种子总数并乘以100)及其他。以稻为例,产量增加本身可以表现为下列一种或多种指标的增加:每平方米植物数、每株植物圆锥花序数、每圆锥花序小穗数、每圆锥花序花(小花)数(其表达为饱满种子数对原圆锥花序数之比)、种子饱满率的增加(其中种子饱满率是饱满种子数除以种子总数并乘以100)、千粒重的增加及其他。增加的产量也可以产生改良的结构,或可以因改良的结构而出现。
根据本发明的优选特征,本发明方法的实施产生具有增加的产量的植物,优选是增加的种子产量的植物。因而根据本发明,提供增加植物产量的方法,所述方法包括调节编码AZ多肽或其同源物的核酸在植物中的表达。
由于本发明的转基因植物具有增加的产量,因而相对于对照植物的生长速率,这些植物有可能在其生活周期中的对应阶段上表现增加的生长速率(在其生活周期的至少部分期间)。增加的生长速率可以对于植物的一个或多个部分(包括种子)是特异性的,或可以基本上遍及整株植物。具有增加的生长速率的植物可以具备较短的生活周期。植物的生活周期可以视为意指从干燥成熟种子成长至植物已经产生与起始材料相似的干燥成熟种子的阶段所需要的时间。这个生活周期可以受下列因素影响,如早期萌发势、生长速率、绿度指数、开花时间和种子成熟速度。生长速率的增加可以在植物生活周期中的一个或多个阶段上或在基本上整个植物生活周期期间发生。在植物生活周期中的早期期间增加的生长速率可以反映增强的萌发势。生长速率的增加可以改变植物的收获周期,允许植物较晚播种和/或较早收获,否则这将不可能(相似的作用可以用较早的开花时间获得)。若生长速率充分地增加,可以允许进一步播种相同植物物种的种子(例如播种并收获稻植物,随后播种并收获其他稻植物,全部稻植物均在一个常规生长时段内)。类似地,若生长速率足够地增加,可以允许进一步播种不同植物物种的种子(例如播种并收获玉米植物,随后例如播种并任选收获大豆、马铃薯或任何其他合适植物)。从相同的根茎中收获额外次数在一些作物植物的情况中也是可能的。改变植物的收获周期可以导致每英亩的年生物量产量的增加(因任何特定植物可以生长并收获的次数(如在一年中)增加)。生长速率的增加也可以允许比其野生型对应物在更广泛的地理区域内培育转基因植物,因为对培育作物的区域限制往往由栽种时节(早季)或在收获时期(晚季)的不利环境条件所决定。若缩短收获周期,则可以避开这类不利条件。生长速率可以通过从生长曲线中得到多种参数而确定,此类参数可以是:T-Mid(植物达到其50%最大尺寸所花费的时间)和T-90(植物达到其90%最大尺寸所花费的时间),等等。
根据本发明的优选特征,本发明方法的实施产生与对照植物相比具有增加的生长速率或增加的产量的植物。因而根据本发明,提供增加植物产量和/或生长速率的方法,所述方法包括调节编码AZ多肽或其同源物的核酸在植物中的表达。与对照植物相比,无论植物处于非胁迫条件下还是植物暴露于多种胁迫下,都发生产量和/或生长速率的增加。植物一般通过生长得更慢而对暴露于胁迫作出应答。在严重胁迫条件下,植物甚至可以完全停止生长。另一方面,轻微胁迫在本文中定义为植物对其暴露的任何胁迫,其中所述的胁迫未导致植物完全停止生长而没有恢复生长的能力。与非胁迫条件下的对照植物相比,轻微胁迫在本发明意义中导致受胁迫植物生长降低小于40%、35%或30%,优选小于25%、20%或15%,更优选小于14%、13%、12%、11%或10%或更低。由于农业实践(灌溉、施肥、杀虫剂处理)上的进步,在栽培作物植物中并不经常遇到严重胁迫。因此,由轻微胁迫诱导的受损生长往往是农业上不希望的特征。轻微胁迫是植物暴露的常见生物性和/或非生物性(环境)胁迫。非生物胁迫可以因干旱或水涝、厌氧胁迫、盐胁迫、化学毒性、氧化胁迫和热、寒冷或冰冻温度所致。非生物胁迫可以是由水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。生物胁迫一般是由病原体如细菌、病毒、真菌和昆虫引起的那些胁迫。
尤其,本发明的方法可以在非胁迫条件下或在轻微干旱条件下实施以产生相对于对照植物而具有增加的产量的植物。如在Wang等(Planta(2003)218:1-14)中报道,非生物胁迫导致不利地影响植物生长及生产力的一系列形态学变化、生理学变化、生物化学变化和分子变化。已知干旱、盐度、极端温度和氧化胁迫是相互联系的并可以通过相似机制而诱导生长损害及细胞损害。Rabbani等(Plant Physiol(2003)133:1755-1767)描述了干旱胁迫与高盐度胁迫间极高程度的“串话”。例如,干旱和/或盐化作用主要表现为渗透胁迫,导致细胞内稳态和离子分布的破坏。经常伴随高温或低温、盐度或干旱胁迫的氧化胁迫可以造成功能性蛋白和结构蛋白变性。因此,这些多样的环境胁迫常常激活相似的细胞信号途径和细胞应答,如产生胁迫蛋白质、上调抗氧化物质、积累相容性溶质和生长抑制。本文中所用的术语”非胁迫”条件是不对植物施加如上述的胁迫的环境条件。非胁迫条件允许植物最佳生长。本领域技术人员清楚对于给定地点的正常土壤条件和气候条件。
本发明方法的实施相对于在可比条件下培育的对照植物,赋予在非胁迫条件下或在轻微干旱条件下培育的植物增加的产量。因而根据本发明,提供用于在非胁迫条件下或在轻微干旱条件下培育的植物中增加产量的方法,所述方法包括增加编码AZ多肽的核酸在植物中表达。
在本发明优选的实施方案中,根据本发明方法的产量和/或生长速率的增加在非胁迫条件下出现。
本发明方法的实施产生相对于在可比条件下培育的合适对照植物,在营养缺乏条件下、尤其在氮缺乏条件下培育的具有增加产量的植物。因而根据本发明,提供用于在营养缺乏条件下培育的植物中增加产量的方法,所述方法包括增加编码AZ多肽的核酸在植物中的表达。营养缺乏可以因营养物的缺乏所致,所述营养物例如是氮、磷酸盐及其他含磷化合物、钾、钙、镉、镁、锰、铁和硼等。
本发明方法有利地适用于任何植物。上面提到的生长特征可以有利地在任何植物中改变。特别用于本发明方法中的植物包括属于植物界超家族的全部植物,尤其单子叶植物和双子叶植物,包括选自以下的饲用或饲料豆类、观赏植物、粮食作物、树或灌木。根据本发明优选的实施方案,植物是作物植物。作物植物的实例包括大豆、向日葵、卡诺拉油菜、苜蓿、油菜、棉花、番茄、马铃薯和烟草。还优选地,植物是单子叶植物。单子叶植物的实例包括甘蔗。更优选地,植物是谷物。谷物的实例包括稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱和燕麦。
其他有利的植物选自菊科(Asteraceae)如向日葵属(Helianthus)、万寿菊属例如物种向日葵[向日葵(sunflower)]、香叶万寿菊(Tagetes lucida)、万寿菊(Tagetes erecta)或细叶万寿菊(Tagetes tenuifolia)[Marigold]、十字花科(Brassicaceae)如芸苔属(Brassica)、例如物种欧洲油菜、芜芜青[卡诺拉油菜、油菜、蔓青];豆科(Fabaceae)如大豆属例如物种大豆、大豆(Sojahispida)或大豆(Soja max)[大豆];亚麻科(Linaceae)如亚麻属(Linum)例如物种亚麻[亚麻(flax、linseed)];禾本科如大麦属(Hordeum)、黑麦属(Secale)、燕麦属(Avena)、高粱属(Sorghum)、稻属(Oryza)、玉蜀黍属(Zea)、小麦属(Triticum)例如物种大麦[大麦]、黑麦[rye]、燕麦、野燕麦、比赞燕麦、Avenafatua var.sativa、杂种燕麦[oat]、两色蜀黍[高粱、粟]、稻、阔叶稻[稻]、玉蜀黍[玉米、玉米]、普通小麦、硬粒小麦、圆柱小麦、Triticum hybernum、马卡小麦、普通小麦(Triticum sativum)或普通小麦(Triticum vulgare)[小麦、面包小麦、普通小麦];茄科(Solanaceae)如茄属(Solanum)、番茄属(Lycopersicon)例如马铃薯[马铃薯]、番茄(Lycopersicon esculentum、Lycopersicon lycopersicum、Lycopersicon pyriforme、Solanumintegrifolium或Solanum lycopersicum)[西红柿(tomato)]。
如本文所定义的术语“AtAZ多肽或其同源物”指包括至少一个锚蛋白重复和至少一个锌指C3H1结构域的蛋白质,所述锚蛋白重复位于C3H1结构域的上游。优选地,AZ蛋白质包括两个锚蛋白重复和两个C3H1结构域,所述AZ蛋白质如SEQ ID NO:2所示的蛋白质。还优选地,两个锚蛋白重复彼此靠近。更优选地,锌指C3H1结构域也彼此靠近且位于锚蛋白重复的C-末端。SEQ ID NO:2中,锚蛋白重复位于位置D90到R120,和D125到L157,两个锌指结构域位于位置H301到V327,和Q336到P359(图1)。
还优选地,AtAZ蛋白质包括至少一个下列共有序列:
(P/A)CSRAY(S/T)HDWTEC(基序1,SEQ ID NO:3)
HPGENARRRDPR(基序2,SEQ ID NO:4)
HG(V/I)FE(C/S)WLHP(A/S)QY(R/K)TRLCK(基序3,SEQ ID NO:5)
CFFAH(基序4,SEQ ID NO:6)
优选基序1为PCSRAYSHDWTEC,且优选基序3为HGVFECWLHPAQYRTRLCK。
更优选地,AtAZ蛋白质包含两个上述基序,尤其优选包含三个上述基序,最优选包含所有四个基序。
如Interpro数据库所述,锚蛋白重复(SMART SM00248,InterproIPR002110)本质上是最普通的蛋白质-蛋白质相互作用基序之一。锚蛋白重复(通常串联)是通常约33个氨基酸的重复组件。它们出现在大量功能多样的主要来自真核生物的蛋白质中。很少为人所知的自原核生物和病毒的实例可能是水平基因传递的结果。发现所述重复在蛋白质中具有多种功能,如转录启动子、细胞周期调节子、细胞骨架、离子转运蛋白和信号传导物。锚蛋白折叠似乎由其结构定义而不是其功能,因为其没有被普遍认可的特异的序列或结构。从几种晶体和溶液结构中已知锚蛋白重复单位的保守折叠。每个重复折叠成具有自螺旋以90度角投影出的β-发夹/环区的螺旋-环-螺旋结构。所述重复堆积在一起形成L形结构。
如Interpro数据库所述,认为锌指结构域ZnF_C3H1(也称为Znf_CCCH,SMART SM00356;Interpro IPR000571)参与了DNA结合。锌指以不同形式存在,取决于半胱氨酸的位置。含有C-x8-C-x5-C-x3-H型(其中x代表任何氨基酸,且数字8、5和3代表保守C或H残基之间的氨基酸数目)锌指结构域的蛋白质包括来自真核生物的参与细胞周期或生长阶段相关调节的锌指蛋白质,如人类TIS11B(丁酸盐响应因子1)、参与调节对生长因子的响应的可能调节蛋白质、和具有同样功能的小鼠TTP生长因子可诱导的核蛋白。小鼠TTP蛋白质由生长因子诱导。含有这种结构域的另一蛋白质是人类剪接因子U2AF 35kD亚基,其在组成型和增强子依赖的剪接中起关键作用,其通过介导3′剪接位点选择要求的主要蛋白质-蛋白质相互作用和蛋白质-RNA相互作用。已显示不同CCCH锌指蛋白质与不同mRNA的3′非翻译区相互作用。这类锌指很普遍地以两个拷贝出现。
图2描述了用于锚蛋白结构域和锌指结构域的SMART数据库中定义的共有序列;然而,应注意这些共有序列可能偏向动物蛋白序列。
术语“结构域”和“基序”如本文“定义”部分所定义。存在用于鉴定结构域的专业数据库。AZ蛋白质中的C3H1或锚蛋白结构域可使用如SMART(Schultz等(1998)Proc.Natl.Acad.Sci.美国95,5857-5864;Letunic等(2002)Nucleic Acids Res 30,242-244)、InterPro(Mulder等,(2003)Nucl.Acids.Res.31,315-318)、Prosite(Bucher和Bairoch(1994),用于生物分子序列基序的广义图谱语法及其在自动化序列判读中的功能,(在)ISMB-94;第二届分子生物学智能系统国际会议文集.Altman R.,Brutlag D.,Karp P.,Lathrop R.,Searls D.编著,第53-61页,AAAIPress,Menlo Park;Hulo等,Nucl.Acids.Res.32:D134-D137,(2004))或Pfam(Bateman等,Nucleic Acids Research 30(1):276-280(2002))鉴定。用于计算机芯片上分析蛋白质序列的一组工具可在ExPASY蛋白质组学服务器上获得(在Swiss Institute of Bioinformatics上驻留(Gasteiger等,ExPASy:用于深入认识和分析蛋白质的蛋白组学服务器,Nucleic AcidsRes.31:3784-3788(2003))。用SMART工具(版本4.1;Schultz等.(1998)Proc.Natl.Acad.Sci.美国95,5857-5864;Letunic等.(2002)NucleicAcids Res 30,242-244)分析AZ蛋白质序列,且使用AZ蛋白质序列筛选Pfam(版本17.0,2005年3月;Bateman等.(2004)Nucl.Acids Res.32,D138-141)和InterPro数据库(Release 11.0,26July 2005;Mulder等.(2005)Nucl.Acids.Res.33,D201-205)。
通过将其他蛋白质序列与SEQ ID NO:2比对,可容易地鉴定相应的共有序列、C3H1结构域、锚蛋白结构域或其他序列基序。这样,AZ多肽或其同源物(包括直向同源物和旁系同源物)使用本领域熟知的常规技术可以容易地鉴定,例如通过序列比对鉴定。用于比对序列用于比较的方法是本领域众所周知的,此类方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP使用Needleman和Wunsch算法((1970)J Mol Biol48:443-453)以找到使匹配数最大化并使空位数最小化的两个完整序列的比对。BLAST算法(Altschul等(1990)J Mol Biol 215:403-10)计算序列同一性百分数并执行对两个序列间相似性的统计分析。用于执行BLAST分析的软件是公众通过国家生物技术信息中心(NCBI)可获得的。同源物可以使用例如ClustalW多重序列比对算法(1.83版本)以默认配对比对参数和评分方法(以百分数计)而轻易地鉴定。相似性和同一性的全局百分数也可以使用在MatGAT软件包中可获得的方法之一而确定(Campanella等,BMCBioinformatics.2003年7月10日;4:29.MatGAT:an application thatgenerates similarity/identity matrices using protein or DNA sequences.)。可以进行细微手工编著以优化保守基序之间的比对,如本领域技术人员显而易见。此外除了使用全长序列以鉴定同源物,也可以使用特定结构域(如C3H1或锚蛋白结构域或上面定义的基序之一)。在下面以百分比描述的序列同一性值使用上述程序,利用默认参数,在完整保守结构域或核酸或氨基酸序列上确定。
AZ蛋白质或其同源物的实例包括实施例1的表1中所列的蛋白质序列。
应当理解落入“AZ多肽或其同源物”的定义内的序列不限于施例1的表1中所列的多肽序列,或SEQ ID NO:262或SEQ ID NO:275所列的同源物,而是任何包括至少一个锚蛋白重复、和至少一个C3H1锌指结构域和还优选至少一个如上所定义的SEQ ID NO:3、4、5或6共有序列的多肽可适用于本发明的方法中。优选地,该多肽是来自拟南芥的多肽。
术语“同源物”包括直向(orthologous)同源序列和旁系(paralogous)同源序列。可通过进行所谓的交互blast研究容易地发现直向同源物和旁系同源物。这可通过第一blast(包括针对任何序列数据库例如公众可获得的NCBI数据库实施查询序列(例如,SEQ ID NO:1或SEQ ID NO:2)的BLAST分析)来进行。当始于核苷酸序列时可使用BLASTN或TBLASTX(使用标准缺省值),当始于蛋白质序列时可使用BLASTP或TBLASTN(使用标准缺省值)。可任选地过滤BLAST结果。然后将过滤的结果或未过滤的结果的全长序列针对来自查询序列所来源于的生物的序列进行返回BLAST分析(第二BLAST)(当查询序列是SEQ ID NO:1或SEQ ID NO:2时,第二blast将针对拟南芥序列进行)。然后比较第一和第二BLAST的结果。如果来自第二blast的高级别命中事件与查询序列来自相同的物种,那么鉴定为旁系同源物;如果高级别命中事件与查询序列来自不同的物种,那么鉴定为直向同源物。优选直向同源物是SEQ ID NO:1或SEQID NO:2直向同源物。高级别命中事件是具有低E值的命中事件。E值越低,评分越显著(或换句话说,偶然发现该命中事件的概率越低)。E值的计算在本领域内是熟知的。除了E-值外,比较结果还由同一性百分数记分。同一性百分数指两个所比较核酸(或多肽)序列之间在特定长度范围内的相同核苷酸(或氨基酸)数目。优选分值大于50,更优选大于100;且优选E-值小于e-5,更优选小于e-6。在大型家族的情况下,可以使用ClustalW,随后使用邻接树法的产生以便帮助显示相关基因的聚类和以便鉴定直向同源物和旁系同源物。SEQ ID NO:2的直向同源序列的实例包括SEQ ID NO:11、SEQ ID NO:15和SEQ ID NO:17。SEQ ID NO:19是SEQ ID NO:2的旁系同源物的实例。
优选地,用于本发明方法中的AZ多肽除了具有至少一个锚蛋白重复和至少一个C3H1结构域,还与SEQ ID NO:2的蛋白质具有一定序列同一性,所述序列同一性按照增加的优选顺序为至少26%,30%,35%,40%,45%,50%,55%,60%,65%,70%,75%,80%,85%,90%,95%,96%,97%,98%或99%。图3中所示矩阵(矩阵A)显示不同AZ蛋白质全长相似性和同一性(粗体的)。如果只比较特定结构域,在不同蛋白质间同一性或相似性可能更高(矩阵B:锌指结构域序列的比较)。
可以实施测定法以确定AZ活性。DNA结合活性及蛋白质-蛋白质相互作用可以使用本领域众所周知的技术而轻易地在体外或在体内确定。用于DNA结合活性的体外测定法的实例包括:凝胶阻滞分析或酵母单杂交分析。用于蛋白质-蛋白质相互作用的体外测定法的实例是酵母双杂交分析(Fields和Song(1989)Nature 340:245-6)。
另外,AZ蛋白质或其同源物在植物中和在尤其稻中的表达具有增加转基因植物产量的效果,与对应野生型植物相比,其中增加的产量包括至少如下之一:种子总重量、种子总数和饱满种子数。
AZ多肽或其同源物由AZ核酸/基因编码。因此如本文所定义的术语“AZ核酸/基因”是编码如上文定义的AZ多肽或其同源物的任何核酸/基因。AZ核酸的实例包括但不限于实施例1的表A中表示的那些核酸。AZ核酸/基因和其变体可适合用于实施本发明的方法。优选地,AZ基因的变体源自拟南芥。AZ核酸/基因的变体包括AZ核酸/基因的部分、剪接变体、等位变体和/或能够与AZ核酸/基因杂交的核酸。
本文中对“核酸序列”的引用意指聚合形式的任一长度的双链或单链的脱氧核糖核苷酸聚合物或核糖核苷酸聚合物,或其类似物,其具有天然核糖核苷酸的本质特征,即它可以以类似于天然存在的多核苷酸的方式与核酸序列杂交。
如本文所定义的术语部分是指编码包含至少一个锚蛋白重复和至少一个C3H1结构域的多肽的DNA片段。例如,可以通过对AZ核酸进行一个或多个缺失来制备部分。部分可以以分离的形式使用,或者可将其与其他编码(或非编码)序列融合,以便,例如,生产组合了若干活性的蛋白质。当与其他编码序列融合时,经翻译后所产生的多肽可能比预测的AZ片段要大。部分通常长度至少为500、700或900个核苷酸,优选长度至少为1100、1300或1500个核苷酸,更优选长度至少为1700、1900或2100个核苷酸,且最优选长度至少为2300或2400个核苷酸。优选地,部分是实施例1的表1中表示的核酸的部分。最优选的部分是SEQ ID NO:1或SEQID NO:53表示的AZ核酸的部分。
术语“片段”、“序列片段”或“序列的一部分”、“部分”或“其部分”是指所参照原始序列的截短序列。截短序列(核酸或蛋白质序列)长度可变;最低长度为这样的序列,其大小足以提供具有与所参照原始序列相当的功能和/或活性的序列,或者在严格条件下与本发明的或本发明方法所用的核酸分子杂交,而最高长度并不重要。在有些应用中,最高长度通常并不比提供期望的原始序列活性和/或功能所需的大小长多少。相当的功能表示至少为原始序列的40%、45%或50%、优选至少60%、70%、80%或90%或以上。
AZ核酸/基因的其他变体为在降低的严格条件下、优选在严格条件下,能够与上文所定义的AZ核酸/基因或与上文所定义的部分杂交的核酸。杂交序列通常长度至少为300个核苷酸,优选长度至少为400个核苷酸,更优选长度至少为500个核苷酸,且最优选长度至少为600个核苷酸。
优选杂交序列能够与SEQ ID NO:1、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42或SEQ ID NO:53所示的核酸杂交,或与任一前述序列的上文所定义的部分杂交。最优选杂交序列能够与SEQ ID NO:1、SEQ ID NO:53、或其部分(或探针)杂交。设计探针的方法是本领域熟知的。探针通常在长度上小于1000bp、900bp、800bp、700bp、600bp,优选小于500bp、400bp、300bp、200bp或100bp。通常,对于DNA-DNA杂交,例如Southern印迹,探针长度在100-500bp之间变化,然而针对DNA-DNA杂交,例如在PCR扩增中,探针中的杂交区通常短于50个核苷酸,但是长于10个核苷酸,优选它们在长度上是15、20、25、30、35、40、45或50bp。
SEQ ID NO:2或其衍生物所表示的氨基酸序列的同源物(包括直向或旁系)的编码核酸在本发明方法中也是有用的。
用于本发明方法的另一核酸变体是编码如上文定义的AZ多肽的剪接变体。优选剪接变体是编码包括至少一个锚蛋白重复和至少一个C3H1结构域的多肽的核酸的剪接变体。优选地,由剪接变体编码的AZ多肽或其同源物与SEQ ID NO:2至少具有26%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的序列同一性。更优选由实施例1的表A中表示的核酸表示的剪接变体。例如,SEQ ID NO:25和SEQ ID NO:47是由同一基因的剪接变体编码的。最优选由SEQ ID NO:1或SEQ ID NO:53表示的剪接变体。
用于本发明方法的另一核酸变体是编码如上文定义的AZ多肽的核酸等位变体。优选地,由等位变体编码的多肽由实施例1的表A中所列多肽序列所示。最优选,编码AZ多肽的等位变体由SEQ ID NO:1所示。
用于本发明的方法中的另一核酸变体是通过基因改组而获得的核酸变体。另外,可使用位点定向诱变产生AZ核酸的变体。可用几种方法进行位点定向诱变;最常用的是基于PCR的方法(Current Protocols in MolecularBiology.Wiley编著)。
因此,本发明提供增加产量和/或植物生长速度的方法,其包括调节AZ核酸的变体在植物中的表达,所述AZ核酸选自:
(i)AZ核酸的部分;
(ii)与AZ核酸杂交的核酸;
(iii)编码AZ多肽的核酸的剪接变体;
(iv)编码AZ多肽的核酸的等位变体;和
(v)通过基因改组或位点定向诱变而获得的编码AZ多肽的核酸变体。
AZ核酸或其变体可以来自任何天然或人工的来源。可以通过仔细的人为操作在组成和/或基因组环境上修饰所述核酸的天然形式。核酸优选植物来源,又优选源自双子叶物种,又优选源自十字花科(Brassicaceae),更优选源自拟南芥。最优选,AZ核酸是SEQ ID NO:1表示的拟南芥序列,且AZ氨基酸序列如SEQ ID NO:2所示。备选地,SEQ ID NO:53所示的AZ核酸或SEQ ID NO:47所示的AZ氨基酸序列也可用于本发明的方法。
因此本文任何述及的AZ多肽应理解为表示上文所定义的AZ蛋白质。编码这样的AZ蛋白质的任何核酸均适用于实施本发明的方法。
根据本发明的优选方面,考虑AZ核酸或其变体调节的表达,优选增加的表达。增加基因表达或基因产物的方法在本领域有充分的记录。可以通过引入遗传修饰调节编码AZ多肽的核酸序列的表达,可以通过任一(或多种)如下方法引入所述遗传修饰:T-DNA激活、TILLING、位点定向诱变、定向进化和同源重组,或通过在植物中引入和表达编码AZ多肽或其同源物的核酸。引入遗传修饰之后的步骤是选择AZ多肽或其同源物的编码核酸受调节的表达,所述受调节的表达使植物产量增加。减少基因表达或基因产物的方法也是本领域公知的。
上文描述了T-DNA激活。也可以使用TILLING(靶向诱导的基因组局部突变)技术将遗传修饰引入AZ基因座。本文定义的基因座意指基因组区,所述基因组区包括目的基因和编码区上游或下游10kb。可获得几种方法进行位点定向诱变;最常用的是基于PCR的方法(Current Protocols inMolecular Biology.Wiley编著.)。也可以使用同源重组产生本发明的效果。
用于引入遗传修饰的优选方法是将编码如上文定义的AZ多肽或其同源物的核酸引入植物中且在其中表达。被引入植物中的核酸可以是全长核酸,或可以是如前文定义的部分或杂交序列。
本发明还提供遗传构建体和载体以促进引入和/或表达用于本发明方法中的核苷酸序列。
因而,提供基因构建体,其包含:
(i)如上文所定义的AZ核酸或其变体;
(ii)与(i)的核酸有效连接的一种或多种调控序列。
本发明方法中所用的构建体可以使用本领域技术人员众所周知的重组DNA技术构建。该基因构建体可以插入适于转化至植物内并适于在转化的细胞中表达目的基因的市售载体。本发明也提供如文中所定义的基因构建体在本发明方法中的用途。
植物用包含目的序列(即编码AZ多肽或其同源物的核酸)的载体转化。本领域技术人员非常了解为成功转化、选择和增殖含有目的序列的宿主细胞而必须于载体上存在的遗传元件。目的序列有效地与一种或多种调控序列(至少与启动子)连接。上面定义了术语“调节元件”、“调控序列”和“启动子”。有利地,任何类型的启动子可以用来驱动核酸序列的表达。
通常已知在植物中有功能的合适启动子。它们可以采取组成型或诱导性启动子的形式。合适的启动子可以使多细胞真核生物中的发育特异性和/或组织特异性表达成为可能;因此可以在植物中有利地使用叶-、根-、花-、种子-、气孔-、块茎-或果实特异性启动子。
可用于植物中的不同植物启动子是这样的启动子,例如USP、LegB4-、DC3启动子或来自欧芹(parsley)的遍在蛋白启动子。
“植物”启动子包含调控元件,其介导编码序列区段在植物细胞中的表达。从而,植物启动子无需为植物来源的,而是可以来源于病毒或微生物,例如,特别是来源于攻击植物细胞的病毒。
“植物”启动子也可以来源于植物细胞,例如,来源于经本文所述的欲在本发明方法中表达的核酸序列转化的植物。这对于其他“植物”调控信号同样适用,例如“植物”终止子的情况。
为在植物中表达,如上所述,核酸分子必须与合适启动子有效连接或包含此启动子,该启动子使基因在正确的时间点上并以细胞或组织特异性方式表达。可用的启动子是组成型启动子(Benfey等,EMBO J.8(1989)2195-2202),如源自植物病毒的那些组成型启动子,如35SCAMV(Franck等,Cell 21(1980)285-294)、19S CaMV(见also US 5352605和WO 84/02913)、34S FMV(Sanger等,Plant.Mol.Biol.,14,1990:433-443)、欧芹遍在蛋白启动子或如在US 4,962,028中描述的植物启动子如Rubisco小亚基启动子或植物启动子PRP1[Ward等,Plant.Mol.Biol.22(1993)]、SSU、PGEL1、OCS[Leisner(1988)Proc Natl Acad Sci美国85(5):2553-2557]、lib4、usp、mas[Comai(1990)Plant Mol Biol 15(3):373-381]、STLS1、ScBV(Schenk(1999)Plant Mol Biol 39(6):1221-1230)、B33、SAD1或SAD2(flax启动子,ain等,Crop Science,39(6)、1999:1696-1701)或nos[Shaw等(1984)Nucleic Acids Res.12(20):7831-7846]。组成型植物启动子的其他实例是甜菜V-ATP酶启动子(WO 01/14572)。合成的组成型启动子实例是超级启动子(WO 95/14098)和从G-盒中衍生的启动子(WO 94/12015)。根据需要,与EP-A 388186、EP-A 335528、WO 97/06268相比,还可以进一步使用化学诱导性启动子。本发明蛋白质在植物中的稳定组成型表达可以是有利的。然而,若例如在收获前的晚期表达是有利的,则本发明多肽的诱导性表达是有利的,因为代谢性操作可以导致植物生长迟缓。
也可以通过化学诱导性启动子促进植物基因的表达。当需要以时间特异性方式表达基因时,化学诱导性启动子是特别适用的。此类启动子的实例是水杨酸诱导性启动子(WO 95/19443)和脱落酸-诱导性启动子(EP 335 528)、四环素-诱导性启动子(Gatz等(1992)Plant J.2,397-404)、环己醇-或乙醇-诱导性启动子(WO 93/21334)或如本文中所述的其他化学诱导性启动子。
其他的合适启动子是对生物性胁迫或非生物性胁迫条件反应的那些启动子,例如病原体诱导性PRP1基因启动子(Ward等,Plant.Mol.Biol.22(1993)361-366)、番茄热诱导性hsp80启动子(US 5,187,267)、马铃薯寒冷诱导性α-淀粉酶启动子(WO 96/12814)或伤口诱导性pinII启动子(EP-A-0375 091)或如本文中所述的其他启动子。
优选的启动子尤其是在组织及器官中、在种子细胞如胚乳细胞及发育的胚细胞中引起基因表达的那些启动子。合适的启动子是油菜的油菜籽蛋白基因启动子(US 5,608,152)、蚕豆(Vicia faba)USP启动子(Baeumlein等,Mol Gen Genet,1991,225(3):459-67)、拟南芥油质蛋白启动子(WO98/45461)、菜豆(Phaseolus vulgaris)菜豆蛋白启动子(US 5,504,200)、芸苔属植物(Brassica)Bce4启动子(WO 91/13980)、豆类arc5启动子、胡萝卜DcG3启动子或豆科植物(Legumin)B4启动子(LeB4;Baeumlein等,1992,PlantJournal,2(2):233-9)和导致在单子叶植物如玉米、大麦、小麦、黑麦、稻等内的种子特异性表达的启动子。有利的种子特异性启动子是蔗糖结合蛋白启动子(WO 00/26388)、菜豆蛋白启动子和油菜籽蛋白启动子。必须加以考虑的合适启动子是大麦lpt2或lpt1基因启动子(WO 95/15389和WO 95/23230)和在WO 99/16890中描述的启动子(来自大麦的大麦醇溶蛋白基因、稻的谷蛋白基因、稻的水稻素基因、稻的谷醇溶蛋白基因、小麦的麦醇溶蛋白基因、小麦的谷蛋白基因、玉米的玉米醇溶蛋白基因、燕麦的谷蛋白基因、高粱kasirin基因和黑麦的裸麦醇溶蛋白基因的启动子)。其他合适的启动子是Amy32b、Amy 6-6和Aleurain[US 5,677,474]、Bce4(油菜)[US 5,530,149]、大豆球蛋白(大豆)[EP 571 741]、磷酸烯醇式丙酮酸羧化酶(大豆)[JP 06/62870]、ADR12-2(大豆)[WO 98/08962]、异柠檬酸裂合酶(油菜)[US 5,689,040]或α-淀粉酶(大麦)[EP 781 849]。可用于在植物中表达基因的其他启动子是叶特异性启动子,如在DE-A 19644478中描述的那些启动子或光调节启动子如,例如豌豆petE启动子。
其他合适的植物启动子是胞质溶胶FBP酶启动子或马铃薯ST-LSI启动子(Stockhaus等,EMBO J.8,1989,2445)、大豆磷酸核糖基焦磷酸酰胺转移酶启动子(GenBank登录号U87999)或在EP-A-0 249 676中描述的节特异性启动子。
根据本发明的一个优选特征,AZ核酸或其变体有效连接于种子特异性启动子。种子特异性启动子可以在种子发育和/或萌发期间激活。种子特异性启动在本领域众所周知。优选种子特异性启动子是胚特异性、胚乳特异性、糊粉特异性启动子。还优选种子特异性启动子驱动在至少胚、胚乳、糊粉之一中的表达。更优选启动子是WSI18或其功能等同的启动子。最优选启动子序列如SEQ ID NO:9或SEQ ID NO:55所表示。应当清楚,本发明的实用性不局限于SEQ ID NO:1或SEQ ID NO:53所示的AZ核酸,本发明的实用性也不局限于受种子特异性启动子驱动的AZ核酸的表达。上文提供了同样可用于驱动AZ核酸表达的其他种子特异性启动子的实例(胚特异性、胚乳特异性、糊粉特异性启动子)。
根据本发明的一个优选特征,AZ核酸或其变体有效连接于组成型启动子。优选的组成型启动子是也基本上遍在地表达的组成型启动子。还优选启动子来自植物,更优选来自单子叶植物。该启动子的一个实例是来自稻的GOS2启动子(SEQ ID NO:54 or SEQ ID NO:56)。应当清楚,本发明的实用性不局限于SEQ ID NO:1所示的AZ核酸,本发明的实用性也不局限于受组成型启动子和尤其受GOS2启动子驱动的AZ核酸的表达。上文显示了同样可用于驱动AZ核酸表达的其他组成型启动子的实例。
任选地,一种或多种终止子序列可以在引入植物的构建体中使用。额外的调节元件可以包括转录增强子以及翻译增强子。本领域技术人员会知道可以在实施本发明中适用的终止子序列和增强子序列。如定义部分所述,内含子序列也可以添加至5′非翻译区(UTR)或编码序列中,以增加在胞浆内积累的成熟信息的量。其他调控序列(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区之外)可以是蛋白质和/或RNA稳定化元件。本领域技术人员会知道或可以轻易地获得此类序列。
本发明的遗传构建体还可以包括在特定细胞类型中维持和/或复制所需的复制起点序列。一个实例是当需要将遗传构建体在细菌细胞中维持为附加型遗传元件(例如质粒或粘粒分子)时。优选的复制起点包括,但不限于f1-ori和colE 1。
为检测如在本发明方法中所用核酸序列的成功转移和/或选择包含这些核酸的转基因植物,使用标记基因(或报道基因)是有利的。因而,遗传构建体可以任选地包含选择性标记基因。文中的“定义”部分更加详细的描述了选择标记。该标记基因当其不再需要时,可从转基因细胞移除或切除。移除标记的技术是本领域已知的,有用的技术描述于上面的“定义”部分。
本发明也包含可用本发明的方法获得的植物、植物部分或植物细胞。本发明因此提供可用本发明的方法获得的植物,所述植物中引入如上面所定义的AZ核酸或其变体。
本发明也提供用于产生具有增加的产量的转基因植物的方法,其包括在植物中引入和表达如上文中所定义的AZ核酸或其变体。
宿主植物对于本发明方法中所用核酸或载体、表达盒或构建体或载体而言原则上有利地是能够合成本发明方法中所用多肽的全部植物。
更具体地,本发明提供用于产生具有增加产量的转基因植物的方法,所述方法包括:
(i)在植物或植物细胞中引入和表达AZ核酸或其变体;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
核酸可以直接引入植物细胞或引入植物本身(包括引入组织、器官或植物的任何其他部分)。根据本发明的优选特征,核酸优选地通过转化引入植物。定义部分更加详细的描述了术语“引入”或“转化”。通常在转化后,选择一种或多种标记存在的植物细胞或细胞群体,其中所述的标记由与目的基因一起共转移的植物可表达的基因编码,随后将转化的材料再生成整株植物。如所提到的那样,用本发明表达载体转化的农杆菌也可以以其自身已知的方法来转化植物,如用作模式植物,如拟南芥(拟南芥在本发明范围不视为作物植物)或作物植物,例如像谷类、玉米、燕麦、黑麦、大麦、小麦、大豆、稻、棉花、甜菜、芸苔、向日葵、亚麻、大麻、马铃薯、烟草、番茄、胡萝卜、甜椒、油菜籽油菜、木薯淀粉、木薯、竹芋、万寿菊、苜蓿、生菜和多种树木、坚果和葡萄藤物种,特别是含油作物植物,如大豆、花生、蓖麻油植物、向日葵、玉米、棉花、亚麻、油菜籽油菜、椰子、油椰、红花(Carthamus tinctorius)、可可豆,例如通过在农杆菌溶液中水浴划破的叶子或叶节,随后在合适的培养基中培养之。
遗传修饰的植物细胞可通过本领域技术人员熟悉的所有方法再生。合适的方法可见于S.D.Kung和R.Wu、Potrykus或
和Willmitzer的上述出版物。
通常在转化后,选择一种或多种标记存在的植物细胞或细胞群体,其中所述的标记由与目的基因一起共转移的植物可表达的基因编码,随后将转化的材料再生成整株植物。为了选择转化的植物,在转化中获得的植物材料原则上接受选择条件处理,以至于转化的植物可以与未转化的植物区分。例如,以上文所述方式获得的种子可以播种,在初始培育时期后,通过喷雾进行合适的选择。另一种可能性包括在使用合适选择剂的琼脂平板上生长种子(根据需要在消毒之后),使得仅转化的种子可以生长成植物。或者,转化的植物通过上述那些选择标记的存在筛选。
在DNA转移和再生后,推测的转化植物可以例如使用Southern分析对目的基因的存在、拷贝数和/或基因组构造进行评价。备选或额外地,新引入DNA的表达水平可以使用Northern和/或Western分析进行监测,这两种技术是本领域技术人员众所周知的。
产生的转化植物可以通过多种方法加以增殖,如通过克隆增殖法或经典育种技术。例如,第一代(或T1)转化植物可以进行自交,选择纯合的第二代(或T2)转化体,并且随后T2植物可以通过经典育种技术进一步增殖。
产生的转化生物可以采取多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆转化体(例如被转化以含有表达盒的全部细胞);转化组织和未转化组织的移植体(例如在植物中,与未转化嫩枝嫁接的转化的根状茎)。
本发明明确地扩展至通过文中所述的任意方法产生的任何植物细胞或植物,并扩展至全部植物部分及其繁殖体。本发明进一步扩展至包含已经通过任意前述方法产生的原代转化或转染细胞、组织、器官或整株植物的后代,唯一要求是后代表现与通过本发明方法中的亲代所产生的那些后代相同的一种或多种基因型特征和/或表型特征。本发明也包括宿主细胞,其含有分离的AZ核酸或其变体。本发明优选的宿主细胞是植物细胞。本发明也扩展至植物的可收获部分如,但不限于种子、叶、果实、花、茎、根、根状茎、块茎和球茎。本发明进一步涉及直接来自这种植物的可收获部分中的产物,如干燥颗粒或粉末、油、脂肪及脂肪酸、淀粉或蛋白质。
本发明也包括AZ核酸或其变体的用途,和AZ多肽或其同源物的用途。
这一用途涉及改良植物生长特征,特别涉及改良产量,尤其是种子产量。增加的种子产量优选包括增加的千粒重。
编码AZ多肽的核酸可以用于育种程序中,其中鉴定到可以遗传地与AZ基因连接的DNA标记。所述的核酸/基因可以用来定义分子标记。这种DNA或蛋白质标记随后可以在育种程序中用来选择具有增强的产量的植物。
AZ核酸/基因的等位变体也可以用于标记辅助的育种程序中。这种育种程序有时需要通过使用例如EMS诱变法对植物进行诱变处理而引入等位基因变异;备选地,该程序可以从非人为引起的所谓“自然”起源的一组等位变体开始。随后进行等位变体的鉴定,例如通过PCR法。此后是用于选择所讨论及导致增加产量的序列的优异等位变体的步骤。一般通过监测含有所讨论序列的不同等位变体的植物的生长性能而实施选择,如实施例1的表1中所列任一核酸的不同等位变体。可以在温室中或田间监测生长性能。其他任选步骤包括将鉴定了优异等位变体的植物与另一种植物杂交。这可以用来例如产生目标表型特征的组合。
AZ核酸也可以用作探针以便对基因进行遗传作图或物理作图,所述探针作为所述基因的一部分及与这些基因关联的性状的标记。此类信息可以用于植物育种中,以便开发具有想要表型的株系。AZ核酸或其变体的这种用途仅需要具有至少15个核苷酸长度的核酸序列。AZ核酸或其变体可以用作限制性片段长度多态性(RFLP)标记。限制性消化的植物基因组DNA的Southern印迹(Sambrook J,Fritsch EF和Maniatis T(1989)Molecular Cloning,A Laboratory Manual)可以用AZ核酸探测。产生的结合图式随后可以使用计算机程序如MapMaker(Lander等(1987)Genomics 1:174-181)进行遗传分析以构建遗传图。此外,该核酸可以用来探测含有经限制性内切核酸酶处理的一组个体的基因组DNA的Southern印迹,其中所述的一组个体代表具有确定的遗传杂交的亲代和后代。DNA多态性的分离被标出并用来计算AZ核酸在使用这个群体先前所获得的遗传图中的位置(Botstein等(1980)Am.J.Hum.Genet.32:314-331)。
在Bernatzky和Tanksley(1986)Plant Mol.Biol.Reporter 4:37-41中描述了植物基因衍生的探针的产生和其在遗传作图中的用途。众多出版物描述了使用以上所提及的方法学或其改良方法对特定cDNA克隆的遗传作图。例如,F2互交群、回交群、随机交配群、邻近纯合系和其他个体群体可以用于作图。此类方法学是本领域技术人员众所周知的。
所述核酸探针也可以用于物理作图(即序列在物理图上的排列;见Hoheisel等在:Non-mammalian Genomic Analyasis:A Practical Guide,Academic press 1996,第319-346页及其中引用的参考文献)。
在另一实施方案中,核酸探针可以在直接荧光原位杂交(FISH)作图法(Trask(1991)Trends Genet.7:149-154)中使用。尽管当前的FISH作图法支持使用大型克隆(几个kb至几百个kb;见Laan等(1995)Genome Res.5:13-20),然而灵敏度的改善可以允许使用更短探针进行FISH作图。
用于遗传作图及物理作图的多种基于核酸扩增的方法可以使用所述核酸而实施。实例可见于文中的“定义”部分。实例包括等位基因特异性扩增(Kazazian(1989)J.Lab.Clin.Med 11:95-96)、PCR扩增片段的多态性(CAPS;Sheffield等,(1993)Genomics 16:325-332)、等位基因特异性连接(Landegren等,(1988)Science 241:1077-1080)、核苷酸延伸反应(Sokolov(1990)Nucleic Acid Res.18:3671)、放射杂交作图(Walter等,(1997)Nat.Genet.7:22-28)和Happy作图(Dear和Cook,(1989)Nucleic Acid Res.17:6795-6807)。为实施这些方法,使用核酸序列设计和产生用于扩增反应或引物延伸反应的引物对。这类引物的设计是本领域技术人员众所周知的。使用基于PCR的遗传作图的方法,可能需要鉴定跨越相应于本发明核酸序列区域作图的亲本之间DNA序列的差异。然而,这对作图方法通常不是必要的。
本发明方法产生具有如前文所述的具有增强的产量的植物。这些有利的生长特征也可以与经济上有利的其他性状组合,如其他的产量增加性状,对多种胁迫的耐受性,调节多种构造性特征和/或生物化学特征和/或生理学特征的性状。
SYT多肽的详细描述
现已惊奇地发现调节编码SYT多肽的核酸序列的表达在非生物胁迫下相对于对照植物增加植物产量和/或早期萌发势。因而,本发明提供在非生物胁迫下相对于对照植物增加植物产量和/或早期萌发势的方法,其包括调节编码SYT多肽的核酸序列在植物中的表达。
在本文中对“对照植物”的引用意指任意合适的一种或多种对照植物或植物。
术语“野生型”、”对照”或“参考”在本文可互换地使用,且优选是这样的对象,例如细胞器、细胞、组织、植物,其尽可能与本发明的主题相似。参考、对照或野生型在其基因组、转录物组、蛋白质组或代谢物组上尽可能与本发明的主题相似。优选地,术语“参考-”、“对照-”或“野生型-”的细胞器、细胞、组织或植物涉及这样的细胞器、细胞、组织或植物,其与本发明细胞器、细胞、组织或植物或其部分遗传上几乎相同,以增加的优选顺序与本发明细胞器、细胞、组织或植物具有95%、98%、99.00%、99.10%、99.30%、99.50%、99.70%、99.90%、99.99%、99.999%或更高的遗传同一性。最优选地,“参考”、“对照”或“野生型”优选地是这样的对象,例如细胞器、细胞、组织或植物,其与根据本发明方法使用的植物、组织、细胞、细胞器在遗传上相同,除核酸序列或所讨论的基因产物根据本发明方法受到改变、调整或修饰之外。
优选地,在对照植物与由本发明方法产生的植物之间的任何比较在相似的条件下进行。术语”相似的条件”意指全部条件,例如培养条件或生长条件、分析条件(如缓冲液组成、温度、底物、病原体株系、浓度等)在待比较的实验之间保持相同。
在此之后“用于本发明方法中的蛋白质”的任何引用意指如本文中所定义的SYT多肽。在此之后“用于本发明方法中的核酸”的任何引用意指能够编码此类SYT多肽的核酸。待引入植物(并且因而用于实施本发明方法)的核酸是编码现在所述蛋白质类型的任意核酸,下文又称作“SYT核酸”或“SYT基因”。
术语“序列”涉及多核苷酸、核酸、核酸分子、肽、多肽和蛋白质,取决于使用术语“序列”的上下文。“编码序列”为核酸序列,当将其置于合适的调控序列的控制之下时,转录为mRNA和/或翻译为多肽。编码序列的边界确定为5’-末端的翻译起始密码子和3’-末端的翻译终止密码子。编码序列可以包括但不局限于:mRNA、cDNA、重组核酸序列或基因组DNA,而且在一定的情形下也可以存在内含子。术语“表达”或“基因表达”如上文定义。上文定义了术语“调节”且意指就基因或基因表达而言在表达上的增加。
本文定义的术语“SYT多肽”指这样的多肽,其从N末端到C末端包含:(i)按照增加的优选顺序,与SEQ ID NO:58的SNH结构域具有至少20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性的SNH结构域;和(ii)富含Met结构域;和(iii)富含QG结构域。优选地,SNH结构域包含图6中显示为黑色的残基。进一步优选地,SNH结构域为SEQ ID NO:57所代表。
另外,SYT多肽可以包含如下一个或多个序列:(a)SEQ ID NO:146;(b)SEQ ID NO:147;和(c)位于SNH结构域之前的N末端的富含Met结构域。
SYT多肽由SYT核酸序列编码。因此文中定义的术语“SYT核酸序列”是编码上文所定义的SYT多肽的任何核酸序列。
术语“基序”和“结构域”如定义部分所定义。存在用于鉴定结构域的专业数据库,如SMART(Schultz等(1998)Proc.Natl.Acad.Sci.美国95,5857-5864;Letunic等(2002)Nucleic Acids Res 30,242-244)、InterPro(Mulder等,(2003)Nucl.Acids.Res.31,315-318)、Prosite(Bucher和Bairoch(1994),用于生物分子序列基序的广义图谱语法及其在自动化序列判读中的功能,(在)ISMB-94;第二届分子生物学智能系统国际会议文集.Altman R.,Brutlag D.,Karp P.,Lathrop R.,Searls D.编著,第53-61页,AAAIPress,Menlo Park;Hulo等,Nucl.Acids.Res.32:D134-D137,(2004))或Pfam(Bateman等,Nucleic Acids Research 30(1):276-280(2002))鉴定。用于计算机芯片上分析蛋白质序列的一组工具可在ExPASY蛋白质组学服务器上获得(在Swiss Institute of Bioinformatics(Gasteiger等,ExPASy:用于深入认识和分析蛋白质的蛋白组学服务器,Nucleic Acids Res.31:3784-3788(2003))。也可以使用常规技术鉴定结构域和基序,如通过序列比对。可以利用本领域内众所周知的常规技术,如通过序列比对,容易地鉴定SYT多肽。序列比对的方法是本领域众所周知的,这类方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP应用Needleman和Wunsch的算法((1970)J.Mol.Biol.48:443-453)来寻找两个完整序列的比对,使匹配数最大化和空位数最小化。BLAST算法(Basic Local Alignment Search Tool;Altschul等(1990)J Mol Biol215:403-10)计算序列同一性的百分比(%),并对两序列(E-值)之间的相似性进行统计分析。同一性百分比指两个比较核酸(或多肽)序列之间在特定长度上的相同核苷酸(或氨基酸)数。两个序列之间的相似性越高,E-值越低(或换言之,偶然发现命中的机会越低)。E-值的计算是本领域公知的。执行BLAST分析的软件可从生物技术信息国家中心公开地获得。这样可以鉴定包括与SEQ ID NO:58的SNH结构域具有一定序列同一性的SNH结构域的SYT多肽,所述序列同一性按照增加的优选顺序为至少20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%。备选地,用于本发明方法的SYT多肽与多肽SEQ ID NO:60具有一定序列同一性,所述序列同一性按照增加的优选顺序为至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%。可以进行细微手工编著以优化保守基序之间的比对,如本领域技术人员显而易见。在一些情况下,可以调整默认参数以调节搜索的严格性。例如使用BLAST,可以提高用于报告针对数据库序列的匹配的统计显著性阈值(称作“期望”值)以显示严格性较低的匹配。这样,可以鉴定几乎精确的短匹配。这样可以鉴定均包含在用于本发明方法的SYT多肽中的SEQ ID NO:146和SEQ ID NO:147的存在。
此外,富含Met结构域或富含QG结构域的存在也可以容易地鉴定。如图7所示,富含Met结构域和富含QG结构域位于SNH结构域之后。富含QG结构域可视为基本上是多肽C末端剩余部分(除去SNH结构域);富含Met结构域通常包含在富含QG结构域的头一半之内(从N末端到C末端的方向)。决定多肽结构域是否富含特定氨基酸的一级氨基酸组成(以%表示)可以利用来自ExPASy服务器的软件程序,特别是ProtParam工具进行计算(Gasteiger E等(2003)ExPASy:the proteomics server for in-depth proteinknowledge and analysis.Nucleic Acids Res 31:3784-3788)。然后可以将目的多肽的组成与Swiss-Prot蛋白质序列数据库中的平均氨基酸组成(以%表示)进行比较(表5)。在该数据库内,平均Met(M)含量为2.37%,平均Gln(Q)含量为3.93%,而平均Gly(G)含量为6.93%(表5)。如本文所定义的那样,富含Met结构域或富含QG结构域具有高于Swiss-Prot蛋白质序列数据库平均氨基酸组成(以%表示)的Met含量(以%表示)或Gln和Gly含量(以%表示)。例如在SEQ ID NO:60中,位于SNH结构域之前的N末端的富含Met结构域(自氨基酸第1位至第24位)具有20.8%的Met含量、富含QG结构域(自氨基酸第71位至第200位)具有18.6%的Gln(Q)含量和21.4%的Gly(G)含量。优选地,本文定义的Met结构域具有Met含量(以%),所述Met含量至少是以所述蛋白序列类的平均氨基酸组成计为1.25、1.5、1.75、2.0、2.25、2.5、2.75、3.0、3.25、3.5、3.75、4.0、4.25、4.5、4.75、5.0、5.25、5.0、5.75、6.0、6.25、6.5、6.75、7.0、7.25、7.5、7.75、8.0、8.25、8.5、8.75、9.0、9.25、9.5、9.75、10或更高(以%),所述平均氨基酸组成包括在Swiss-Prot蛋白质序列数据库中。优选地,本文定义的QG结构域具有Gln(Q)含量和/或Gly(G)含量,所述Gln(Q)含量和/或Gly(G)含量至少是以所述蛋白序列类的平均氨基酸组成计为1.25、1.5、1.75、2.0、2.25、2.5、2.75、3.0、3.25、3.5、3.75、4.0、4.25、4.5、4.75、5.0、5.25、5.0、5.75、6.0、6.25、6.5、6.75、7.0、7.25、7.5、7.75、8.0、8.25、8.5、8.75、9.0、9.25、9.5、9.75、10或更高(以%),所述平均氨基酸组成包括在Swiss-Prot蛋白质序列数据库中。
表5:Swiss-Prot蛋白质序列数据库中平均氨基酸组成(%)(2004年7月):
残基 % 残基 %
A=Ala 7.80 M=Met 2.37
C=Cys 1.57 N=Asn 4.22
D=Asp 5.30 P=Pro 4.85
E=Glu 6.59 Q=Gln 3.93
F=Phe 4.02 R=Arg 5.29
G=Gly 6.93 S=Ser 6.89
H=His 2.27 T=Thr 5.46
I=Ile 5.91 V=Val 6.69
K=Lys 5.93 W=Trp 1.16
L=Leu 9.62 Y=Tyr 3.09
SYT多肽的实例包括(由括号中登录号所示的多核苷酸序列编码,参见表6和序列表中所提到的):拟南芥Arath_SYT1(AY102639.1)SEQ IDNO:60,拟南芥Arath_SYT2(AY102640.1)SEQ ID NO:62,拟南芥Arath_SYT3(AY102641.1)SEQ ID NO:64,Aspergillus offcinalisAspof_SYT(CV287542)SEQ ID NO:66,欧洲油菜(Brassica napus)Brana_SYT(CD823592)SEQ ID NO:68,甜橙(Citrus sinensis)Citsi_SYT(CB290588)SEQ ID NO:70,树棉(Gossypium arboreum)Gosar_SYT(BM359324)SEQ ID NO:72,蒺藜状苜蓿(Medicago trunculata)Medtr_SYT(CA858507.1)SEQ ID NO:74,稻(Oryza sativa)Orysa_SYT1(AK058575)SEQ ID NO:76,稻Orysa_SYT2(AK105366)SEQ ID NO:78,稻Orysa_SYT3(BP185008)SEQ ID NO:80,马铃薯Soltu_SYT(BG590990)SEQ ID NO:82,玉蜀黍(Zea mays)Zeama_SYT1(BG874129.1,CA409022.1)SEQ ID NO:84,玉蜀黍Zeama_SYT2(AY106697)SEQ IDNO:86,智人(Homo sapiens)Homsa_SYT(CAG46900)SEQ ID NO:88,洋葱(Allium cepa)Allce_SYT2(CF437485)SEQ ID NO:90,Aquilegiaformosa x Aquilegia pubescens Aqufo_SYT1(DT758802)SEQ ID NO:92,二穗短柄草(Brachypodium distachyon)Bradi_SYT3(DV480064)SEQ IDNO:94,欧洲油菜Brana_SYT2(CN732814)SEQ ID NO:96,甜橙Citsi_SYT2(CV717501)SEQ ID NO:98,乳浆大戟(Euphorbia esula)Eupes_SYT2(DV144834)SEQ ID NO:100,大豆(Glycine max)Glyma_SYT2(BQ612648)SEQ ID NO:102,野大豆(Glycine soya)Glyso_SYT2(CA799921)SEQ ID NO:104,陆地棉(Gossypium hirsutum)Goshi_SYT1(DT558852)SEQ ID NO:106,陆地棉Goshi_SYT2(DT563805)SEQ ID NO:108,大麦(Hordeum vulgare)Horvu_SYT2(CA032350)SEQID NO:110,野莴苣(Lactuca serriola)Lacse_SYT2(DW110765)SEQ IDNO:112,番茄(Lycopersicon esculentum)Lyces_SYT1(AW934450,BP893155)SEQ ID NO:114,驯化苹果(Malus domestica)Maldo_SYT2(CV084230,DR997566)SEQ ID NO:116,蒺藜状苜蓿Medtr_SYT2(CA858743,BI310799,AL382135)SEQ ID NO:118,柳枝稷(Panicumvirgatum)Panvi_SYT3(DN152517)SEQ ID NO:120,北美云杉(Piceasitchensis)Picsi_SYT1(DR484100,DR478464)SEQ ID NO:122,火炬松(Pinus taeda)Pinta_SYT1(DT625916)SEQ ID NO:124,欧洲山杨(Populustremula)Poptr_SYT1(DT476906)SEQ ID NO:126,甘蔗(Saccharumofficinarum)Sacof_SYT1(CA078249,CA078630,CA082679,CA234526,CA239244,CA083312)SEQ ID NO:128,甘蔗Sacof_SYT2(CA110367)SEQ ID NO:130,甘蔗Sacof_SYT3(CA161933,CA265085)SEQ ID NO:132,马铃薯Soltu_SYT1(CK265597)SEQ ID NO:134,两色蜀黍(Sorghumbicolor)Sorbi_SYT3(CX611128)SEQ ID NO:136,普通小麦(Triticumaestivum)Triae_SYT2(CD901951)SEQ ID NO:138,普通小麦Triae_SYT3(BJ246754,BJ252709)SEQ ID NO:140,葡萄(Vitis vinifera)Vitvi_SYT1(DV219834)SEQ ID NO:142,玉蜀黍Zeama_SYT3(CO468901)SEQ IDNO:144,欧洲油菜(Brassica napus)Brana_SYT SEQ ID NO:151,大豆(Glycine max)Glyma_SYT SEQ ID NO:153。
表6:编码SYT多肽的核酸序列的实例
名称 NCBI核苷酸 登录号 核酸序列 SEQ ID NO 翻译多肽 SEQ ID NO 来源
Arath_SYT1 AY102639.1 59 60 拟南芥
Arath_SYT2 AY102640.1 61 62 拟南芥
Arath_SYT3 AY102641.1 63 64 拟南芥
Aspof_SYT1 CV287542 65 66 Aspergillus officinalis
Brana_SYT1 CD823592 67 68 欧洲油菜
Citsi_SYT1 CB290588 69 70 甜橙
Gosar_SYT1 BM359324 71 72 树棉
Medtr_SYT1 CA858507.1 73 74 蒺藜状苜蓿
Orysa_SYT1 AK058575 75 76 稻
Orysa_SYT2 AK105366 77 78 稻
Orysa_SYT3 BP185008 79 80 稻
Soltu_SYT2 BG590990 81 82 马铃薯
Zeama_SYT1 BG874129.1 CA409022.1* 83 84 玉蜀黍
Zeama_SYT2 AY106697 85 86 玉蜀黍
Homsa_SYT CR542103 87 88 智人
Allce_SYT2 CF437485 89 90 洋葱
Aqufo_SYT1 DT758802.1 91 92 Aquilegia formosa x Aquilegia pubescens
Bradi_SYT3 DV480064.1 93 94 二穗短柄草
Brana_SYT2 CN732814 95 96 欧洲油菜
Citsi_SYT2 CV717501 97 98 甜橙
Eupes_SYT2 DV144834 99 100 乳浆大戟
Glyma_SYT2 BQ612648 101 102 大豆
Glyso_SYT2 CA799921 103 104 野大豆
Goshi_SYT1 DT558852 105 106 陆地棉
Goshi_SYT2 DT563805 107 108 陆地棉
Horvu_SYT2 CA032350 109 110 大麦
Lacse_SYT2 DW110765 111 112 野莴苣
Lyces_SYT1 AW934450.1 BP893155.1* 113 114 番茄
Maldo_SYT2 CV084230 DR997566* 115 116 驯化苹果
Medtr_SYT2 CA858743 BI310799.1 AL382135.1* 117 118 蒺藜状苜蓿
Panvi_SYT3 DN152517 119 120 柳枝稷
Picsi_SYT1 DR484100 DR478464.1 121 122 北美云杉
Pinta_SYT1 DT625916 123 124 火炬松
Poptr_SYT1 DT476906 125 126 欧洲山杨
Sacof_SYT1 CA078249.1 CA078630 CA082679 CA234526 CA239244 CA083312* 127 128 甘蔗
Sacof_SYT2 CA110367 129 130 甘蔗
Sacof_SYT3 CA161933.1 CA265085* 131 132 甘蔗
Soltu_SYT1 CK265597 133 134 马铃薯
Sorbi_SYT3 CX611128 135 136 两色蜀黍
Triae_SYT2 CD901951 137 138 普通小麦
Triae_SYT3 BJ246754 BJ252709* 139 140 普通小麦
Vitvi_SYT1 DV219834 141 142 葡萄
Zeama_SYT3 CO468901 143 144 玉蜀黍
Brana_SYT NA 150 151 欧洲油菜
Glyma_SYT NA 152 153 大豆
*由所引的登录号拼接
NA:不可得(私人拥有)
编码SYT多肽的核酸的实例在上表6中给出。这类核酸可用于实施本发明的方法。上表6中给出的氨基酸序列是SEQ ID NO:58所示的SYT多肽的直向同源物和旁系同源物的实例,术语“直向同源物”和“旁系同源物”如文中所定义。其他直向同源物和旁系同源物可以通过开展所谓交互性blast搜索而容易地鉴定。这通常涉及第一BLAST,其中所述的第一BLAST包括提交查询序列(例如使用上表6中列出的任一序列)用于针对任一序列数据库(如公众可用的NCBI数据库)的BLAST搜索。当从核苷酸序列开始时,一般使用BLASTN或TBLASTX(使用标准默认值),并且当从蛋白质序列开始时,可以使用BLASTP或TBLASTN(使用标准默认值)。任选地可以筛选BLAST结果。随后提交筛选结果和非筛选结果的全长序列以针对来自生物的序列进行反向BLAST(第二BLAST),其中查询序列来自所述的生物(其中在查询序列是SEQ ID NO:59或SEQ ID NO:60的情况下,第二BLAST因而将针对拟南芥序列)。随后比较第一和第二BLAST搜索的结果。若来自第一BLAST的高阶位命中源自与查询序列从其中衍生的物种相同的物种,反向BLAST随后理想地在最高命中的查询序列中产生,则鉴定到旁系同源物;若第一BLAST的中的高阶位命中不源自与查询序列从其中衍生的物种相同的物种,并且优选地在反向BLAST时产生属于最高命中之列的查询序列,则鉴定到直向同源物。
高阶位命中是具有低E-值的那些命中。E-值越低,评分越显著(或换句话说,此命中因偶然而发生的几率越低)。E-值的计算是本领域众所周知的。除了E-值外,比较结果还由同一性百分数记分。同一性百分数指两个所比较核酸(或多肽)序列之间在特定长度范围内的相同核苷酸(或氨基酸)数目。在大型家族的情况下,可以使用ClustalW,随后使用邻接树法以便帮助显示相关基因的聚类和以便鉴定直向同源物和旁系同源物。
应当理解落入“SYT多肽”的定义内的序列不限于表6中所列的多肽(和序列表中提到的),也不限于任何多肽,所述多肽从N末端到C末端包含:(i)与SEQ ID NO:58的SNH结构域具有至少20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性的SNH结构域;和(ii)富含Met结构域;和(iii)富含QG结构域。优选地,SNH结构域包含图6中显示为黑色的残基,均可用于执行本发明方法。另外,SYT多肽可以包含如下一个或多个序列:(a)SEQ ID NO:146;(b)SEQ ID NO:147;和(c)位于SNH结构域之前的N末端的富含Met结构域。最优选的SYT多肽如SEQ ID NO:60、SEQ ID NO:151或SEQ ID NO:153所示。
在酵母双杂交系统中,SYT多肽通常与GRF(生长调控因子)多肽相互作用。酵母双杂交相互作用测定在本领域众所周知(见Field等(1989)Nature 340(6230):245-246)。例如,SEQ ID NO:4所代表的SYT多肽能够与AtGRF5并与AtGRF9相互作用。
本发明另一实施方案为分离的核酸序列,其包含选自下组的核酸序列:
(a)分离的核酸序列,如SEQ ID NO:150和SEQ ID NO:152所示;
(b)分离的核酸序列,编码如SEQ ID NO:151和SEQ ID NO:153所示的多肽;
(c)分离的核酸序列,作为遗传密码简并性的结果,其序列能够从如SEQ ID NO:151和SEQ ID NO:153所示的多肽推断出来;
(d)分离的核酸序列,其编码的多肽与(a)至(c)中核酸序列所编码的多肽具有至少70%的同一性;
(e)分离的核酸序列,编码如SEQ ID NO:151和SEQ ID NO:153所示的多肽的同源物、衍生物或活性片段,所述同源物、衍生物或片段为植物来源,且有利地从N末端至C末端包含:
(i)与SEQ ID NO:58的SNH结构域具有一定序列同一性的SNH结构域,所述序列同一性按照增加的优选顺序为至少20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%。
(ii)富含Met结构域;
(iii)富含QG结构域;
(f)分离的核酸序列或其互补物,能够与上述(a)至(c)中核酸分子杂交,其中所述杂交序列或其互补物编码(a)至(e)中的植物蛋白质;其中,与对照植物相比,在非生物胁迫下该核酸序列的改变的表达在植物中增加产量和/或早期萌发势。
表6中给出的编码SYT多肽的核酸序列,或任何前述SEQ ID NO的直向同源物或旁系同源物不需要是全长核酸序列,因为本发明方法的实施不依赖于全长核酸序列的使用。
SYT核酸变体可适于实施本发明的方法。变体SYT核酸序列通常为与天然存在的SYT核酸序列具有相同功能的那些核酸序列,其可以是相同的生物学功能,或者是在非生物胁迫下,当所述核酸序列的表达植物中受到调节时相对于对照植物增加产量和/或早期萌发势的功能。这样的变体包括下文所述的SYT核酸序列的部分、SYT核酸序列的剪接变体、SYT核酸序列的等位变体、通过基因改组获得的SYT核酸序列的变体和/或能与SYT核酸序列杂交的核酸序列。优选地,核酸变体是如SEQ ID NO:59、SEQ IDNO:150或SEQ ID NO:152所表示的核酸序列的变体。术语杂交序列、剪接变体、等位变体和基因改组如文中所述。
编码SYT多肽的核酸不需要是全长核酸,因为本发明方法的实施不依赖全长核酸序列的使用。本发明提供在植物中在非生物胁迫下增强产量和/或早期萌发势的方法,其包括在植物中引入和表达的表6中给出的核酸序列中任一种的部分,或表6中给出的氨基酸序列中任一种的直向同源物、旁系同源物或同源物的编码核酸的部分。
本文所使用的术语“部分”指编码这样的多肽的DNA片段,所述多肽从N末端到C末端包含:(i)按照增加的优选顺序,与SEQ ID NO:58的SNH结构域具有至少20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性的SNH结构域;和(ii)富含Met结构域;和(iii)富含QG结构域。可以,例如,通过在SYT核酸序列中产生一个或多个缺失来制备部分。部分可以以分离的形式应用,或者它们可以与其他编码(或非编码)序列融合以,例如,产生组合数种活性的多肽。当与其他编码序列融合时,翻译产生的多肽可以大于预测的SYT片断。优选地,部分是由表6中给出的任一或任何前述SEQ ID NO的直向同源物或旁系同源物所表示核酸序列的部分。最优选的部分是如SEQ ID NO:59、SEQID NO:150或SEQ ID NO:152所表示核酸的部分。
SYT核酸序列的另一变体是在降低的严格条件下,优选在严格条件下,能够与上文所定义的SYT核酸序列杂交的核酸,该杂交序列编码SYT多肽或如上文定义的部分。
本发明提供在植物中在非生物胁迫下增强产量和/或早期萌发势的方法,其包括在植物中引入并表达能够与表6中给出的任何一种核酸杂交的核酸,或包括在植物中引入并表达如此核酸,其能够与表6中给出的任意核酸序列的直向同源物、旁系同源物或同源物的编码核酸杂交的核酸。
用于本发明方法的杂交序列编码这样的SYT多肽,所述多肽从N末端到C末端包含:(i)按照增加的优选顺序,与SEQ ID NO:58的SNH结构域具有至少20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性的SNH结构域;和(ii)富含Met结构域;和(iii)富含QG结构域。优选地,杂交序列是能够与表6中给出的核酸序列、或任何前述SEQ ID NO的直向同源物或旁系同源物、或如上文定义的任何前述序列的部分杂交的杂交序列。最优选的杂交序列是能与如SEQ ID NO:59、SEQ ID NO:150或SEQ ID NO:152所表示的核酸序列或其部分(或探针)杂交的杂交序列。设计探针的方法是本领域熟知的。探针通常在长度上小于1000bp,优选在长度上小于500bp。通常,对于DNA-DNA杂交,例如Southern印迹,探针长度在100-500bp之间变化,然而针对DNA-DNA杂交,例如在PCR扩增中,探针中的杂交区通常短于50个核苷酸,但是长于10个核苷酸。杂交序列通常在长度上至少是100、125、150、175、200或225个核苷酸,优选在长度上至少是250、275、300、325、350、375、400、425、450或475个核苷酸,还优选在长度上至少是500、525、550、575、600、625、650、675、700或725个核苷酸,或和全长SYT cDNA一样长。
用于本发明方法的另一核酸变体是编码如上文定义的SYT多肽的剪接变体。优选的剪接变体是表6中给出的SYT核酸序列、或任何前述SEQIDNO的直向同源物或旁系同源物的剪接变体。最优选的剪接变体是如SEQ ID NO:59、SEQ ID NO:150或SEQ ID NO:152所表示的SYT核酸序列的剪接变体。
本发明提供在植物中在非生物胁迫下增强产量和/或早期萌发势的方法,其包括在植物中引入并表达表6中给出的任何一种核酸序列的剪接变体,或表6中给出的任意氨基酸序列的直向同源物、旁系同源物或同源物的编码核酸的剪接变体。
用于实施本发明方法的另一种核酸变体是编码如上文所定义的SYT多肽的编码核酸的等位变体。等位变体天然存在,且包含在本发明方法中的是这些天然等位基因的用途。优选的等位变体是表6中给出的SYT核酸序列、或任意前述SEQ ID NO的直向同源物或旁系同源物的等位变体。最优选的是由SEQ ID NO:59所示的SYT核酸序列的剪接变体。
本发明提供在植物中在非生物胁迫下增强产量和/或早期萌发势的方法,其包括在植物中引入并表达表6中给出的任何一种核酸的等位变体,或包括在植物中引入并表达表6中给出的任意氨基酸序列的直向同源物、旁系同源物或同源物的编码核酸的等位变体。
用于本发明方法中的另一核酸变体是通过基因改组(或定向进化)而获得的编码SYT多肽的核酸变体。
用于本发明方法中的另一核酸变体是通过位点定向诱变而获得的编码SYT多肽的核酸变体。位点定向诱变可以用来产生SYT核酸序列的变体。几种方法可用于实现位点定向诱变,最常见的是基于PCR的方法(CurrentProtocols in Molecular Biology.Wiley编著)。
本发明提供在植物中在非生物胁迫下增强产量和/或早期萌发势的方法,其包括在植物中引入并表达表6中给出的任何一种核酸序列的变体,或包括在植物中引入并表达表6中给出的任意氨基酸序列的直向同源物、旁系同源物或同源物的编码核酸的变体,通过基因改组或位点定向诱变获得该变体核酸。
以下SYT核酸变体是适合实施本发明方法的变体实例:
(i)SYT核酸序列的部分;
(ii)能与SYT核酸序列杂交的核酸序列;
(iii)SYT核酸序列的剪接变体;
(iv)SYT核酸序列的等位变体;
(v)通过基因改组获得的SYT核酸序列;
(vi)通过位点定向诱变获得的SYT核酸序列。
还用于本发明方法中的是这样的核酸,其编码如表6中给出的SYT多肽的同源物、或任意前述SEQ ID NO的直向同源物或旁系同源物的同源物。
也可用于本发明方法中的是这样的核酸,其编码表6中给出的任一SYT核酸序列的衍生物、或任意前述SEQ ID NO的直向同源物或旁系同源物的衍生物。任意前述SEQ ID NO的直向同源物或旁系同源物的衍生物是可以适合用于本发明方法的另一实施例。SYT核酸序列可以来自任何人工或天然的来源,如植物、藻类、真菌或动物。可以通过仔细的人为操作在组成和/或基因组环境上修饰所述核酸序列的天然形式。优选具有植物来源的编码SYT多肽的核酸序列。可以从双子叶植物物种,优选从十字花科(Brassicaceae),更优选从拟南芥或欧洲油菜(Brassica napus)分离所述核酸序列。备选地,可以从豆科(Fabaceae),优选从大豆(Glycine max)分离核酸序列。更优选地,SYT核酸序列分离自:
(a)如SEQ ID NO:59所示的和如SEQ ID NO:60所示的SYT多肽分离自拟南芥;
(b)如SEQ ID NO:150所示的和如SEQ ID NO:151所示的SYT多肽分离自欧洲油菜;
(c)如SEQ ID NO:152所示的和如SEQ ID NO:153所示的SYT多肽分离自大豆。
上文定义了术语“产量”、“种子产量”和“早期萌发势”。术语“增加的”、“改良的”、“增强的”、“扩增的”、“延伸的”或“升高的”是可相互交换的。以玉米为例,产量增加可以表现为下列一种或多种指标:每平方米植物数的增加,每株植物穗数的增加、行数的增加、每行粒数、粒重、千粒重、穗长度/直径、种子饱满率的增加(其中种子饱满率是饱满种子数除以种子总数并乘以100)及其他。以稻为例,产量增加可以由下列一种或多种指标的增加表现:每平方米植物数、每株植物圆锥花序数、每圆锥花序小穗数、每圆锥花序花(小花)数(其表达为饱满种子数对原圆锥花序数之比)、种子饱满率的增加(其中种子饱满率是饱满种子数除以种子总数并乘以100)、千粒重的增加及其他。
增加的产量也可以产生改良的结构,或可以因改良的结构而出现。
根据本发明的优选特征,本发明方法的实施产生在非生物胁迫条件下相对于对照植物而具有增加的生物量、增加的种子产量和/或早期萌发势的植物。因而根据本发明,提供在非生物胁迫条件下相对于对照植物增加植物中生物量、种子产量和/或早期萌发势的方法,所述方法包括调节编码SYT多肽的核酸序列在植物中的表达。优选地,本文所引用的增加的生物量意指植物发育期和成熟时的地上部分(叶生物量)。优选地,本文所引用的增加的生物量意指以下任一项:种子总产量、饱满种子数、种子饱满率、TKW和收获指数。
由于本发明的转基因植物在非生物胁迫下具有增加的产量,因而相对于对照植物的生长速率,这些植物有可能在其生活周期中的对应阶段上在非生物胁迫下表现增加的生长速率(在其生活周期的至少部分期间,早期萌发势的出苗阶段)。增加的生长速率可以对于植物的一个或多个部分(包括种子)是特异性的,或可以基本上遍及整株植物。生长速率的增加可以在植物生活周期中的一个或多个阶段上或在基本上整个植物生活周期期间发生。在植物生活周期中的早期期间增加的生长速率可以反映增强的萌发势。生长速率的增加可以改变植物的收获周期,允许植物较晚播种和/或较早收获,否则这将不可能。若生长速率充分地增加,可以允许进一步播种相同植物物种的种子(例如种植并收获稻植物,随后种植并收获其他稻植物,全部稻植物均在一个常规生长时段内)。类似地,若生长速率足够地增加,可以允许进一步播种不同植物物种的种子(例如播种并收获玉米植物,随后例如播种并任选收获大豆、马铃薯或任何其他合适植物)。从相同的根茎中收获额外次数在一些作物植物的情况中也是可能的。改变植物的收获周期可以导致每平方米的年生物量产量的增加(因任何特定植物可以生长并收获的次数(如在一年中)增加)。生长速率的增加也可以允许比其野生型对应物在更广泛的地理区域内培育转基因植物,因为对培育作物的区域限制往往由栽种时节(早季)或在收获时期(晚季)的不利环境条件所决定。若缩短收获周期,则可以避开这类不利条件。生长速率可以通过从生长曲线中得到多种参数而确定,此类参数可以是:T-Mid(植物达到其50%最大尺寸所花费的时间)和T-90(植物达到其90%最大尺寸所花费的时间),等等。在非生物胁迫下测量植物生长速率,所述非生物胁迫如盐胁迫;水胁迫(干旱或水涝);减少的营养物可获得性胁迫;异常的热或寒冷/冰冻温度引起的温度胁迫;氧化胁迫;金属胁迫;化学毒性胁迫;或其组合。
本发明方法的实施产生在非生物胁迫下相对于对照植物具有增加的生长速率的植物。因而根据本发明,提供在非生物胁迫下相对于对照植物增加植物生长速率的方法,所述方法包括调节编码SYT多肽的核酸序列在植物中的表达。
植物一般通过生长得更慢而对暴露于胁迫作出应答。在严重胁迫条件下,植物甚至可以完全停止生长。与非胁迫条件下的对照植物相比,轻微胁迫在本发明意义中导致受胁迫植物生长降低小于40%、35%或30%,优选小于25%、20%或15%,更优选小于14%、13%、12%、11%或10%或更低。由于农业实践(灌溉、施肥、杀虫剂处理)上的进步,在栽培作物植物中并不经常遇到严重胁迫。因此,由轻微胁迫诱导的受损生长往往是农业上不希望的特征。轻微胁迫是典型的植物可能暴露于的胁迫。这些胁迫是常见的植物所暴露的生物性和/或非生物性(环境)胁迫。生物胁迫一般是由病原体如细菌、病毒、真菌、线虫和昆虫引起的那些胁迫。典型的非生物胁迫包括任一或更多如下胁迫:盐胁迫、水胁迫(干旱或水涝)、减少的营养物可获得性胁迫、异常的热或寒冷/冰冻温度引起的温度胁迫、氧化胁迫、金属胁迫或化学毒性胁迫。
本发明方法的实施产生在非生物胁迫下相对于对照植物具有增加的产量和/或早期萌发势的植物。如在Wang等(Planta(2003)218:1-14)中报道,非生物胁迫导致不利地影响植物生长及生产力的一系列形态学变化、生理学变化、生物化学变化和分子变化。干旱、盐度、极端温度和氧化胁迫通常是相互联系的并可以通过相似机制而诱导生长损害及细胞损害。例如,干旱和/或盐化作用主要表现为渗透胁迫,导致细胞内稳态和离子分布的破坏。经常伴随高温或低温、盐度或干旱胁迫的氧化胁迫可以造成功能性蛋白和结构蛋白变性。减少的营养物可获得性,尤其减少的氮可获得性是植物生长的主要限制因素,例如通过减少的用于蛋白合成的氨基酸的可获得性。因此,这些多样的环境胁迫常常激活相似的细胞信号途径和细胞应答,如产生胁迫蛋白质、增量调节抗氧化物质、积累相容性溶质和生长抑制。
既然多种多样的环境胁迫激活相似的路径,本发明关于盐胁迫的举例说明不应视为局限于盐胁迫,而更应视为表明SYT多肽总体而言参与非生物胁迫的屏显信息(screen)。Plant Science中TRENDS中的综述(Jian-Kang Zhu,第6卷,第2期,2001年2月)证实在盐胁迫下表现更好的转基因植物通常在包括骤冷、严寒、热和干旱的其他胁迫下也表现更好。(Rabbani等(Plant Physiol(2003)133:1755-1767)描述了干旱胁迫与高盐度胁迫间极高程度的“串话”。因此,显然SYT多肽(如本位定义的)连同其在盐胁迫下增加植物产量和/或早期萌发势方面的用途,也将会在多种其他非生物胁迫下增加植物产量和/或早期萌发势方面找到用武之地。
本文所定义的术语“非生物胁迫”意指如下一个或多个方面:盐胁迫、水胁迫(干旱或水涝)、减少的营养物可获得性胁迫、由异常的热、冷/冰冻温度引起的温度胁迫、氧化胁迫、金属胁迫或化学毒性胁迫。术语盐胁迫不局限于常见盐(NaCl),而可以是如下任何一种或多种:NaCl、KCl、LiCl、MgCl2、CaCl2等等。
本发明方法的实施产生在非生物胁迫条件下相对于对照植物而具有增加的产量和/或早期萌发势的植物。因而根据本发明,提供在非生物胁迫条件下相对于对照植物增加植物产量和/或早期萌发势的方法,所述方法包括调节编码SYT多肽的核酸序列在植物中的表达。引用的非生物胁迫意指如下一个或多个方面:盐胁迫、水胁迫(干旱或水涝)、减少的营养物可获得性胁迫、由异常的热、冷/冰冻温度引起的温度胁迫、氧化胁迫、金属胁迫或化学毒性胁迫。
本发明方法有利地适用于任何植物。特别用于本发明方法中的植物包括属于植物界超家族的全部植物,尤其单子叶植物和双子叶植物,包括选自以下的饲用或饲料豆类、观赏植物、粮食作物、树或灌木。根据本发明优选的实施方案,植物是作物植物。作物植物的实例包括大豆、向日葵、卡诺拉油菜、苜蓿、油菜、棉花、番茄、马铃薯和烟草。还优选地,植物是单子叶植物。单子叶植物的实例包括甘蔗。更优选地,植物是谷物。谷物的实例包括稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱和燕麦。
用于引入遗传修饰的优选方法是在植物中引入和表达编码SYT多肽的核酸序列。定义SYT多肽为这样的多肽,其从N末端到C末端包含:(i)按照增加的优选顺序,与SEQ ID NO:58的SNH结构域具有至少20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93、94%、95%、96、97%、98%、99%序列同一性的SNH结构域;和(ii)富含Met结构域;和(iii)富含QG结构域。优选地,SNH结构域包含图6中显示为黑色的残基。进一步优选地,SNH结构域为SEQ ID NO:57所代表。
根据本发明的优选方面,SYT核酸序列受调节的表达是增加的表达。增加的表达可以引起SYT mRNA或多肽水平提高,这等同于提高SYT多肽的活性;或者当多肽水平没有变化,或者甚至当多肽水平下降时也可以提高活性。这种情况出现在SYT多肽固有特性发生改变的时候,例如,通过制备比野生型多肽更具活性的突变体形式。增加或减少基因或基因产物表达的方法是本领域已知的。
本发明还提供遗传构建体和载体以促进在植物中引入和/或表达用于本发明方法中的核酸序列。
因而,提供基因构建体,其包含:
(i)编码如上面所定义的SYT多肽的核酸序列,或SEQ ID NO:150或SEQ ID NO:152代表的核酸序列;
(ii)一个或多个能够驱动(i)中核酸序列表达的控制序列;和任选地
(iii)转录终止序列。
优选的构建体是一种这样的构建体,其中调控序列是来自植物的启动子,如果单子叶植物被转化则优选来自单子叶植物。本发明方法中所用的构建体可以使用本领域技术人员众所周知的重组DNA技术构建。该基因构建体可以插入适于转化至植物内并适于在转化的细胞中表达目的基因的市售载体。本发明也提供如文中所定义的基因构建体在本发明方法中的用途。
植物用包含目的序列的载体转化(如编码SYT多肽的核酸序列)。目的序列有效地与一种或多种调控序列(至少与启动子)连接。
有利地,可以用任何类型的启动子来驱动核酸序列的表达。
有用的启动子有组成型启动子(Benfey等,EMBO J.8(1989)2195-2202),如来源于植物病毒的那些启动子,如35S CAMV(Franck等,Cell 21(1980)285-294)、19S CaMV(还参见US 5352605和WO84/02913)、34S FMV(Sanger等,Plant.Mol.Biol.,14,1990:433-443)、欧芹泛素启动子,或植物启动子如US 4,962,028中所述的核酮糖二磷酸缩化酶-加氧酶(Rubisco)小亚基启动子或植物启动子PRP1[Ward等,Plant.Mol.Biol.22(1993)]、SSU、PGEL1、OCS[Leisner(1988)Proc NatlAcad Sci美国85(5):2553-2557]、lib4、usp、mas[Comai(1990)PlantMol Biol 15(3):373-381]、STLS1、ScBV(Schenk(1999)Plant Mol Biol39(6):1221-1230)、B33、SAD1或SAD2(亚麻启动子,Jain等,CropScience,39(6),1999:1696-1701)或nos[Shaw等(1984)Nucleic Acids Res.12(20):7831-7846]。其他组成型植物启动子的实例为甜菜V-ATPase启动子(WO 01/14572)。合成组成型启动子的实例有超级启动子(Superpromoter)(WO 95/14098)和来源于G-box的启动子(WO 94/12015)。此外,适当的情况下,相对于EP-A 388186、EP-A 335528、WO 97/06268,还可以使用化学诱导性启动子。在植物中稳定组成型表达本发明多肽是有利的。然而,如果收获前的晚期表达有利的话,最好诱导性表达本发明的多肽,因为代谢操作很可能会导致植物生产延迟。
也能够通过化学诱导性启动子促进植物基因的表达(有关综述,参见Gatz 1997.Annu.Rev.Plant Physiol.Plant Mol.Biol.,48:89-108)。当期望以时间特异性方式表达基因时,化学诱导性启动子尤其适用。此类启动子的实例有水杨酸诱导性启动子(WO 95/19443)、脱落酸诱导性启动子(EP 335 528)、四环素诱导性启动子(Gatz等(1992)Plant J.2,397-404)、环己醇或乙醇诱导性启动子(WO 93/21334),或者本文所述的其他启动子。
其他合适的启动子是那些针对生物或非生物胁迫条件起反应的启动子,例如病原诱导的PRP1基因启动子(Ward等,Plant.Mol.Biol.22(1993)361-366)、番茄热诱导性hsp80启动子(US 5,187,267)、马铃薯冷诱导性α-淀粉酶启动子(WO 96/12814)或创伤诱导性pinII启动子(EP-A-0375091),或者本文所述的其他启动子。
优选的启动子尤其是那些导致基因在组织和器官、在种子细胞如胚乳细胞以及发育中的胚细胞中表达的启动子。合适的启动子有油菜籽油菜napin基因启动子(US 5,608,152)、蚕豆(Vicia faba)USP启动子(Baeumlein等,Mol Gen Genet,1991,225(3):459-67)、拟南芥油质蛋白启动子(WO98/45461)、菜豆(Phaseolus vulgaris)菜豆蛋白启动子(US 5,504,200)、芸苔Bce4启动子(WO 91/13980)、豆arc5启动子、胡萝卜DcG3启动子或豆球蛋白B4启动子(LeB4;Baeumlein等,1992,Plant Journal,2(2):233-9),以及在单子叶植物中带来种子特异性表达的启动子,如玉米、大麦、小麦、黑麦、稻等。有利的种子特异性启动子有蔗糖结合蛋白启动子(WO 00/26388)、菜豆蛋白启动子和napin启动子。必须考虑的合适的启动子有大麦lpt2或lpt1基因启动子(WO 95/15389和WO 95/23230),以及WO 99/16890中所述的启动子(来自大麦大麦醇溶蛋白基因、稻谷蛋白基因、稻oryzin基因、稻醇溶谷蛋白基因、小麦醇溶蛋白基因、小麦谷蛋白基因、玉米玉米醇溶蛋白基因、燕麦谷蛋白基因、高粱kasirin基因、黑麦黑麦碱基因的启动子)。其他合适的启动子为Amy32b、Amy 6-6和Aleurain[US 5,677,474]、Bce4(油菜籽油菜)[US 5,530,149]、大豆球蛋白(大豆)[EP 571 741]、磷酸烯醇式丙酮酸羧化酶(大豆)[JP 06/62870]、ADR12-2(大豆)[WO 98/08962],异柠檬酸裂合酶(油菜籽油菜)[US 5,689,040]或α-淀粉酶(大麦)[EP 781849]。可用于在植物中表达基因的其他启动子有叶特异性启动子,如DE-A 19644478中所述的那些;或者光调控的启动子,如豌豆petE启动子。
其他合适的植物启动子有胞质FBPase启动子或马铃薯ST-LSI启动子(Stockhaus等,EMBO J.8,1989,2445)、大豆磷酸核糖焦磷酸氨基转移酶启动子(GenBank登录号U87999)或EP-A-0 249 676中描述的瘤特异性启动子(node-specific promoter)。
在一个实施方案中,SYT核酸序列与组成型启动子有效连接。组成型启动子在其生长和发育的大多数但不必然是所有阶段都转录激活,并且基本上是普遍表达。优选启动子来源于植物,还优选来源于单子叶植物如果单子叶植物被转化。又优选组成型启动子是由基本上类似于SEQ ID NO:145或SEQ ID NO:56的核酸序列所示的GOS2启动子。最优选GOS2启动子如SEQ ID NO:56或SEQ ID NO:145所示。应当明白本发明的适用性不限于由SEQ ID NO:59代表的SYT核酸序列,同时本发明的适用性也不限于由GOS2启动子驱动时SYT核酸的表达。也可以用来驱动编码SYT核酸序列表达的其他组成型启动子的实例在定义部分中显示。
任选地,一种或多种终止子序列可以在引入植物的构建体中使用。额外调节元件可包括转录及翻译强化子。本领域技术人员会意识到可以适用于实施本发明的终止子和强化子序列。内含子序列也可以添加至5′非翻译区(UTR)或编码序列中,以增加在胞浆内积累的成熟信息的量。其他调控序列(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区之外)可以是蛋白质和/或RNA稳定化元件。本领域技术人员会知道或可以轻易地获得此类序列。
本发明的遗传构建体还可以包括需要用于在特定细胞类型中维持和/或复制的复制序列起点。一个实例是当需要将遗传构建体在细菌细胞中维持为附加型遗传元件(例如质粒或粘粒分子)时。优选的复制起点包括,但不限于f1-ori和colE1。
为检测如在本发明方法中所用核酸序列的成功转移和/或选择包含这些核酸的转基因植物,使用标记基因(或报道基因)是有利的。因而,遗传构建体可以任选地包含选择性标记基因。该标记基因当其不再需要时,可从转基因细胞移除或切除。移除标记的技术是本领域已知的,有用的技术描述于上面的定义部分。
本发明也包括可用本发明方法获得的植物。本发明因此提供可用本发明方法获得的植物、植物部分和植物细胞,所述植物中引入SYT核酸序列且所述植物、植物部分和植物细胞优选选自作物,更优选选自单子叶植物。
本发明也提供用于产生在非生物胁迫下具有增强的产量和/或早期萌发势的转基因植物的方法,其包括在植物中引入和表达SYT核酸序列。
更具体地,本发明提供用于产生在非生物胁迫下具有增强的产量和/或早期萌发势的转基因植物,优选单子叶植物的方法,所述方法包括:
(i)在植物或植物细胞中引入并表达编码SYT多肽的核酸序列;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
(i)的核酸可以是任意能编码如上面定义的SYT多肽的核酸,或如SEQ ID NO:150或SEQ ID NO:152所示的核酸序列。
从培育步骤(ii)中获得的植物后代可以通过多种方法加以繁殖,如通过克隆繁殖法或经典育种技术。例如,第一代(或T1)转化植物可以进行自交,产生纯合的第二代(或T2)转化体,并且T2植物通过经典育种技术进一步繁殖。
核酸序列可以直接引入植物细胞或引入植物本身(包括引入组织、器官或植物的任何其他部分)。根据本发明的优选特征,核酸序列优选地通过转化引入植物。
通常在转化后,对植物细胞或细胞群体选择一种或多种标记的存在,其中所述的标记由与目的基因一起共转移的植物可表达基因编码,随后将转化的材料再生成整株植物。为选择转化的植物,在转化中获得的植物材料原则上接受选择条件处理,以至于转化的植物可以与未转化的植物区分。例如。以上文所述方式获得的种子可以播种,在初始培育时期后,通过喷雾进行合适的选择处理。另一种可能性包括在使用合适选择剂的琼脂平板上培育种子(根据需要在消毒之后),以至于仅转化的种子可以生长成植物。备选地,对转化的植物筛选选择性标记(如上文所述的那些选择性标记)的存在。
在DNA转移和再生后,推测的转化植物也可以例如使用Southern分析对目的基因的存在、拷贝数和/或基因组构造进行评价。备选或额外地,新引入DNA的表达水平可以使用Northern和/或Western分析,这两种技术是本领域内普通技术人员众所周知的。
产生的转化植物可以通过多种方法加以增殖,如通过克隆性增殖法或经典育种技术。例如,第一代(或T1)的转化植物可以自花传粉产生纯化的第二代(或T2)转化体,并且T2植物通过经典育种技术进一步繁殖。
产生的转化生物可以采取多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆性转化体(例如受转化以含有表达盒的全部细胞);转化组织和未转化组织的移植体(例如在植物中,与未转化嫩枝嫁接的转化的根茎)。
本发明明确地扩展至通过本文中所述的任一方法产生的任何植物细胞或植物,并扩展至全部植物部分及其繁殖体。本发明进一步扩展至包含已经通过任一前述方法产生的原代转化或转染细胞、组织、器官或整株植物的后代,唯一要求是后代表现与通过本发明方法中的亲代所产生的那些后代相同的基因型特征和/或表型特征。本发明也包括宿主细胞,其含有分离的SYT核酸序列。本发明优选的宿主细胞是植物细胞。本发明也扩展至植物的可收获部分如,但不限于种子、叶、果实、花、茎、根、根状茎、块茎和球茎。本发明进一步涉及来自自、优选直接来自这种植物的可收获部分中的产物,如干燥颗粒或粉末、粗磨粉(meal)、油、脂肪及脂肪酸、淀粉或蛋白质。
根据本发明的优选特征,受调节的表达是增加的表达。增加核酸、基因或基因产物的表达的方法在本领域充分记载,实例在定义部分提供。
备选地,可以通过引入遗传修饰调节编码SYT多肽的核酸序列的表达,例如可以通过任一(或多种)如下方法引入所述遗传修饰:T-DNA激活、TILLING、同源重组、或通过在植物中引入和表达编码SYT多肽的核酸序列。引入遗传修饰之后的步骤是选择SYT多肽编码核酸序列受调节的表达,所述受调节的表达使植物在非生物胁迫下具有增加的产量和/或早期萌发势。
一种此类技术是T-DNA激活标注。引入的启动子可以是任意能够在期望生物体内(在本案中是植物)驱动基因表达的启动子。例如,组成型的、组织偏好的、细胞类型偏好的和诱导性的启动子都适用于T-DNA激活。还可以使用TILLING(定向诱导的基因组局部突变)技术再现本发明的效果。还可以使用同源物重组再现本发明的效果。
本发明还包括SYT核酸序列的用途和SYT多肽的用途,和如上文定义的构建体在非生物胁迫下在增加植物产量和/或早期萌发势中的用途。
可以在育种程序中使用SYT核酸序列或者SYT多肽,其中鉴定可以遗传地连接于SYT的DNA标记。可以使用SYT核酸序列或者SYT多肽界定分子标记。接着可以将此DNA或多肽标记在育种程序中使用,以选择具有增加的产量的植物。例如,SYT基因可以是表6中给出的SYT核酸序列、或任意前述SEQ ID NO的直向同源物或旁系同源物中任一所代表的核酸序列。
SYT核酸序列的等位变体也可以用于标记辅助的育种程序。这类育种程序有时需要使用,例如EMS诱变,通过植物诱变处理引入等位基因变体;备选的,此程序可以以收集无意产生的所谓“天然”起源的等位基因变体开始。然后通过例如PCR鉴定等位基因变体。随后是选择步骤,用以选择所讨论序列的较好等位基因变体,所述等位基因变体赋予植物增加的产量。一般通过监测含有所研究序列的不同等位基因变体植物的生长行为来进行选择,例如表6中给出的SYT核酸序列、或前述任意SEQ ID NO的直向同源物或旁系同源物中任一个的不同等位基因变体。可以在温室或田地中监测生长行为。更多任选的步骤包括,将经鉴定含有较好等位基因变体的植物与另一植物杂交。例如,可使用这种方法产生感兴趣表型特征的组合。
SYT核酸序列还可以作为探针,用于对为那些基因连锁性状的一部分并作为其标志物的基因进行遗传和物理的作图。这样的信息可以在植物育种中使用,以得到具有所期望表型的品系。SYT核酸序列的这类应用仅需要长至少15个核苷酸的核酸序列。SYT核酸序列可以用作限制性片段长度多态性(RFLP)标记。可用SYT核酸序列探测限制酶切消化的植物基因组DNA的Southern印迹(Sambrook J,Fritsch EF和Maniatis T(1989)《分子克隆:实验室手册》)。随后使用计算机程序如MapMaker(Lander等(1987)Genomics 1:174-181)对产生的带型进行遗传分析,以构建遗传图谱。此外,可以使用核酸序列在含有一组个体的限制性内切酶处理的基因组DNA中探测Southern印迹,所述一组个体为代表明确的遗传杂交的亲本和子代的一组个体。记录DNA多态性的分离并用于计算在先前用此群体获得的遗传图谱中SYT核酸序列的位置(Botstein等(1980)Am.J.Hum.Genet.32:314-331)。
在遗传作图中使用的植物基因衍生探针的产生和用途描述于Bematzky和Tanksley(1986)Plant Mol.Biol.Reporter 4:37-41中。众多出版物中描述过用上述方法或其变通形式对特定cDNA克隆进行遗传作图。例如,可以使用F2杂交群体、回交群体、随机交配群体、近亲同基因品系和其他个体组作图。这类方法是本领域技术人员众所周知的。
核酸探针也可以用于物理作图(即在物理图谱上安置序列;见Hoheisel等In:Non-mammalian Genomic Analysis:A Practical Guide,Academicpress 1996,第319-346页,及其中引用的参考文献)。
在另一个实施方案中,核酸探针可用于直接荧光原位杂交(FISH)作图(Trask(1991)Trends Genet.7:149-154)。尽管目前FISH作图的方法倾向用于大的克隆(几个kb到几百个kb;见Laan等(1995)Genome Res.5:13-20),但是灵敏性的提高允许在FISH作图中应用较短的探针。
用于遗传和物理作图的多种基于核酸扩增的方法可以使用所述核酸序列进行。实例包括等位基因特异性扩增(Kazazian(1989)J.Lab.Clin.Med11:95-96)、PCR扩增片段的多态性(CAPS;Sheffield等(1993)Genomics16:325-332)、等位基因特异性连接(Landegren等(1988)Science 241:1077-1080)、核苷酸延伸反应(Sokolov(1990)Nucleic Acid Res.18:3671)、放射杂交作图(Walter等(1997)Nat.Genet.7:22-28)和Happy作图(Dear和Cook(1989)Nucleic Acid Res.17:6795-6807)。为实施这些方法,使用核酸序列设计和产生用于扩增反应或引物延伸反应的引物对。这类引物的设计是本领域技术人员众所周知的。使用基于PCR的遗传作图的方法,可能需要鉴定跨越相应于本发明核酸序列区域作图的亲本之间DNA序列的差异。然而,这对作图方法通常不是必要的。
根据本发明的方法得到如前所述在非生物胁迫下具有增加的产量的植物。这些产量提高的性状还可以组合其他经济上有利的性状,如更多提高产量的性状、对多种胁迫的耐受性、改良多种构造特征和/或生化和/或生理学特征的性状。
cpFBPase多肽的详细描述
现已惊奇地发现,相对于对照植物,增加编码叶绿体果糖-1,6-二磷酸酶(cpFBPase)多肽的核酸序列在植物地上部分中的表达增加植物产量。因而,本发明提供相对于对照植物增加植物产量的方法,其包括增加编码cpFBPase多肽的核酸序列在植物地上部分中的表达。
在本文中对“对照植物”的引用意指任意合适的一种或多种对照植物。术语“参考”、”对照”或“野生型”在本文可互换地使用,且优选是这样的对象,例如细胞器、细胞、组织、植物,其尽可能与本发明的主题相似。参考、对照或野生型在其基因组、转录物组、蛋白质组或代谢物组上尽可能与本发明的主题相似。优选地,术语“参考-”、“对照-”或“野生型-”的细胞器、细胞、组织或植物涉及这样的细胞器、细胞、组织或植物,其与本发明细胞器、细胞、组织或植物或其部分遗传上几乎相同,优选95%、98%、99.00%、99.10%、99.30%、99.50%、99.70%、99.90%、99.99%、99.999%或更高的同一性。最优选地,“参考”、“对照”或“野生型”优选地是这样的对象,例如细胞器、细胞、组织或植物,其与根据本发明方法使用的植物、组织、细胞、细胞器在遗传上相同,除核酸序列或其所编码的基因产物根据本发明方法受到改变、调整或修饰之外。
除非另行指出,术语“多核苷酸”、“核酸”及“核酸分子”在文中互换使用。除非另行指出,术语“肽”、“多肽”及“蛋白质”在本文中互换使用。术语“序列”可能涉及多核苷酸、核酸、核酸分子、肽、多肽和蛋白质,取决于使用术语“序列”的上下文。术语“基因”、“多核苷酸”、“核酸序列”“核苷酸序列”或“核酸分子”在文中用于指任何长度的多聚体形式的核苷酸,或者为核糖核苷酸或者为脱氧核糖核苷酸。这些术语仅述及分子的一级结构。
因此,如本文所用的术语“核酸序列”、“基因”、“多核苷酸”、“核苷酸序列”或“核酸分子”包括双链和单链DNA及RNA。它们还包括已知类型的修饰,例如甲基化、“加帽”、用类似物取代一个或多个天然存在的核苷酸。优选本发明的DNA或RNA序列包含编码本文定义多肽的编码序列。
“编码序列”为核酸序列,当将其置于合适的调控序列的控制之下时,转录为mRNA和/或翻译为多肽。编码序列的边界确定为5’-末端的翻译起始密码子和3’-末端的翻译终止密码子。编码序列可以包括但不局限于:mRNA、cDNA、重组核酸序列或基因组DNA,而且在一定的情形下也可以存在内含子。
如本文定义的术语“叶绿体果糖-1,6-二磷酸酶(cpFBPase)多肽”指在叶绿体中发挥功能且包含:(i)至少一个FBPase结构域;和(ii)至少一个氧化还原调控插入片段(redox regulatory insertion)的多肽。
如上面定义的cpFBPase多肽的一个实例如SEQ ID NO:155中所示,所述cpFBPase在叶绿体中发挥功能且包括:(i)至少一个FBPase结构域;和(ii)至少一个氧化还原调控插入片段。还有此类实例是由SEQ ID NO:157、SEQ ID NO:159、SEQ ID NO:161、SEQ ID NO:163、SEQ ID NO:165、SEQ ID NO:167、SEQ ID NO:169、SEQ ID NO:171、SEQ ID NO:173、SEQ ID NO:175、SEQ ID NO:177、SEQ ID NO:179、SEQ ID NO:181、SEQ ID NO:183、SEQ ID NO:185、SEQ ID NO:187、SEQ ID NO:189、SEQ ID NO:191、SEQ ID NO:193、SEQ ID NO:195和SEQ ID NO:197、或任意前述SEQ ID NO的直向同源物或旁系同源物中任一个所示。本发明通过用SEQ ID NO:154所示的编码多肽SEQ ID NO:155的自莱茵衣藻序列转化的植物举例说明。SEQ ID NO:157(由SEQ ID NO:156编码,来自Bigelowiella natans)、SEQ ID NO:159(由SEQ ID NO:158编码,来自Aquilegia formosa x Aquilegia pubescens)、SEQ ID NO:161(由SEQ IDNO:160编码,来自拟南芥)、SEQ ID NO:163(由SEQ ID NO:162编码,来自欧洲油菜(Brassica napus))、SEQ ID NO:165(由SEQ ID NO:164编码,来自Cyanidioschyzon merolae)、SEQ ID NO:167(由SEQ ID NO:166编码,来自大豆(Glycine max))、SEQ ID NO:169(由SEQ ID NO:168编码,来自番茄(Lycopersicon esculentum))、SEQ ID NO:171(由SEQ ID NO:170编码,来自蒺藜苜蓿(Medicago truncatula))、SEQ ID NO:173(由SEQ IDNO:172编码,来自烟草(Nicotiana tabacum))、SEQ ID NO:175(由SEQID NO:174编码,来自稻(Oryza sativa))、SEQ ID NO:177(由SEQ ID NO:176编码,来自Ostreococcus lucimarinus)、SEQ ID NO:179(由SEQ ID NO:178编码,来自Ostreococcus tauri)、SEQ ID NO:181(由SEQ ID NO:180编码,来自三角褐指藻(Phaeodactylum tricornutum))、SEQ ID NO:183(由SEQ ID NO:182编码,来自成熟豌豆)、SEQ ID NO:185(由SEQ ID NO:184编码,来自枸桔(Poncirus trifoliata))、SEQ ID NO:187(由SEQ ID NO:186编码,来自美洲山杨(Populus tremuloides))、SEQ ID NO:189(由SEQID NO:188编码,来自马铃薯)、SEQ ID NO:191(由SEQ ID NO:190编码,来自菠菜(Spinacia oleracea))、SEQ ID NO:193(由SEQ ID NO:192编码,来自小麦)、SEQ ID NO:195(由SEQ ID NO:194编码,来自玉蜀黍(Zeamays))和SEQ ID NO:197(由SEQ ID NO:196编码,来自小立碗藓(Physicomitrella patens))是多肽SEQ ID NO:155的直向同源物。
应当理解落入“cpFBPase多肽”的定义内的序列不限于表7中(和序列表中提到的)所给出的多肽,也不限于任何多肽,所述多肽在叶绿体中发挥功能且包括:(i)至少一个FBPase结构域;和(ii)至少一个氧化还原调控插入片段,均可用于执行本发明方法。优选地,cpFBPase多肽如SEQ ID NO:155所表示的。
然而,本发明的实施不限于这些序列;可以使用如本文定义的任意cpFBPase编码核酸或cpFBPase多肽来有利地实施本发明方法。
本文实施例12的表C中给出了编码cpFBPase多肽的的核酸实例。此类核酸可用于实施本发明的方法。实施例12的表C中给出的氨基酸序列是由SEQ ID NO:155表示的cpFBPase多肽的直向同源物和旁系同源物的实例序列,术语“直向同源物”和“旁系同源物”如本文定义。直向同源物和旁系同源物可以通过开展所谓交互性blast搜索而容易地找到。这可由第一BLAST完成,所述第一BLAST参与提交查询序列(例如SEQ ID NO:154or SEQ ID NO:155)用于针对任一序列数据库(如公众可用的NCBI数据库)的BLAST搜索。当从核苷酸序列开始时,可以使用BLASTN或TBLASTX(使用标准默认值),并且当从多肽序列开始时,可以使用BLASTP或TBLASTN(使用标准默认值)。任选地可以筛选BLAST结果。随后提交筛选结果和非筛选结果的全长序列以针对来自生物的序列进行反向BLAST(第二BLAST),其中查询序列来自所述的生物(其中在查询序列是SEQ ID NO:154或SEQ ID NO:155的情况下,第二BLAST因而将针对自衣藻(chlamydomonas)序列)。随后比较第一和第二BLAST搜索的结果。若来自第一BLAST的高阶位命中源自与查询序列从其中衍生的物种相同的物种,反向BLAST随后理想地以最高命中(besides itself)的查询序列中产生,则鉴定到旁系同源物;若第一BLAST的中的高阶位命中不源自与查询序列从其中衍生的物种相同的物种,并且优选地在反向BLAST时产生属于最高命中之列的查询序列,则鉴定到直向同源物。高阶位命中是具有低E-值的那些命中。E-值越低,评分越显著(或换句话说,此命中因偶然而发生的几率越低)。E-值的计算是本领域众所周知的。除了E-值外,比较结果还由同一性百分数记分。同一性百分数指两个所比较核酸(或多肽)序列之间在特定长度范围内的相同核苷酸(或氨基酸)数目。直向同源物和旁系同源物鉴定的详细实例在实施例12中给出。在大型家族的情况下,可以使用ClustalW,随后使用邻接树法以便帮助显示相关基因的聚类和以便鉴定直向同源物和旁系同源物。优选地,用于本发明方法的cpFBPase多肽在叶绿体中发挥功能且包含:(i)至少一个FBPase结构域;和(ii)至少一个氧化还原调控插入片段;(iii)按增加的优选顺序,与SEQ ID NO:155具有至少40%、45%、50%、55%、65%、70%、75%、80%、85%、90%、95%或98%的序列同一性(计算示于实施例14)。
在确定进化连锁(evolutionary linkage)和二级结构和三级结构的改进的预测中,使用多个多肽序列的比对来发现蛋白质家族中的保守结构域和特征基序。本领域的技术人员可以使用许多程序来实施此类分析,例如,瑞士生物信息学研究所拥有的ExPASy蛋白质组工具盒所提供的程序。用于比对序列进行比较的方法是本领域众所周知的,此类方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP使用Needleman和Wunsch算法((1970)J Mol Biol 48:443-453)以找到使匹配数最大化并使空位数最小化的两个序列(覆盖整个序列的)的全局比对。BLAST算法(Altschul等(1990)J Mol Biol 215:403-10)计算序列同一性百分数并执行对两个序列间相似性的统计分析。用于执行BLAST分析的软件是公众通过国家生物技术信息中心(NCBI)可获得的。同源物可以使用例如ClustalW多重序列比对算法(1.83版本)以默认配对比对参数和单位是百分数的评分方法而轻易地鉴定。同源物可以使用例如ClustalW多重序列比对算法(1.83版本)以默认配对比对参数和单位是百分数的评分方法而轻易地鉴定。相似性和同一性的全局百分数也可以使用在MatGAT软件包中可获得的方法之一而确定(Campanella等,BMC Bioinformatics.2003年7月10日;4:29.MatGAT:用蛋白质或DNA序列而产生相似性/同一性矩阵的应用)。可以进行细微手工编辑以优化保守基序之间的比对,如本领域技术人员显而易见。此外作为使用全长序列以鉴定同源物的替代,也可以使用特定结构域。使用上文提及的程序,使用默认参数,针对整个核酸序列或氨基酸序列和/或针对选择的结构域或一个或多个保守基序测定了序列同一性值。
术语“结构域”和“基序”如定义部分所定义。存在用于鉴定结构域的专业数据库。cpFBPase多肽中的FBPase结构域可以使用例如SMART(Sch ultz等(1998)Proc.Natl.Acad.Sci.美国95,5857-5864;Letunic等(2002)Nucleic Acids Res 30,242-244;由德国海德堡的EMBL拥有)、InterPro(Mulder等,(2003)Nucl.Acids.Res.31,315-318;由英国的欧洲生物信息研究所(EBI)拥有)、Prosite(Bucher和Bairoch(1994),用于生物分子序列基序的广义图谱语法及其在自动化序列判读中的功能,(In)ISMB-94;第二届分子生物学智能系统国际会议文集.Altman R.,Brutlag D.,Karp P.,Lathrop R.,Searls D.编著,第53-61页,AAAIPress,Menlo Park;Hulo等,Nucl.Acids.Res.32:D134-D137,(2004))、作为一项服务向科学界提供的ExPASy蛋白质组服务器(由瑞士的瑞士生物信息学研究所(SIB)拥有)或Pfam(Bateman等,Nucleic Acids Research 30(1):276-280(2002),由英国的Sanger研究所拥有)加以鉴定。例如,在InterPro数据库中,包括在cpFBPase多肽中的FBPase结构域被命名为IPR000146。涉及由SEQ ID NO:155表示的cpFBPase多肽、在大量数据库中鉴定到的登录号列于实施例15中。
包含在FBPase结构域的一个重要基序是氧化还原调控插入片段,所述基序只存在于cpFBPase多肽,而不存在于cyFBPase多肽。通过使用上文所述和实施例13中(和图12)的方法比对所有FBPases多肽,鉴定包括二硫键形成(即redox regulation)所必需的至少两个半胱氨酸残基的插入片段氨基酸。保守半胱氨酸以它们在成熟豌豆(Pisum sativa)多肽中的位置命名,即Cys153,Cys173和Cys178。Cys153和Cys173通常是参与二硫键形成的两个配偶体(Chiadmi等人.(1999)EMBO J 18(23):6809-6815)。Cys153和Cys173被环分离,所述环的长度为10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、或25个氨基酸残基,优选为14、15、16、17、18、或19个氨基酸残基。
蛋白质亚细胞定位预测的任务是重要的且被充分研究。知道蛋白质的定位有助于阐明其功能。蛋白定位的实验方法涵盖从免疫定位到使用绿色荧光蛋白(GFP)的蛋白标记。此类方法是准确的,尽管与计算方法相比是劳动密集的。最近,来自序列数据的蛋白定位的计算预测已取得了很大进步。本领域技术人员所熟知的算法,诸如Psort、TargetP、ChloroP、Predotar、LipoP、MITOPROT、PATS、PTS1、SignalP等可在瑞士生物信息学研究所拥有的ExPASy蛋白质组工具中获得。本发明多肽的亚细胞定位的鉴定示于实施例16。具体地,本发明的SEQ ID NO:155被排布到光合(自养)细胞的质体(叶绿体)区室中。
靶向到质体的方法是本领域熟知的并且包括使用转运肽。下表7显示了可以用来将任何FBPase多肽靶向到质体的转运肽实例,而其天然形式的FBPase多肽正常不靶向到质体,或者其天然形式的FBPase多肽通过不同的转运肽(例如其天然转运肽)的作用靶向到质体。例如编码cyFBPase的核酸序列也可以适合用于本发明的方法,只要所述核酸靶向到质体,优选到叶绿体,且所述核酸包括至少一个调控氧化还原插入片段。
表7:将氨基酸靶向到质体的转运肽序列的实例
NCBI登录号 来源生物 蛋白质功能 转运肽序列
P07839 衣藻属 铁氧还蛋白 MAMAMRSTFAARVGAKPAVRGARPAS RMSCMA
AAR23425 衣藻属 核酮糖二磷酸羧化 酶-加氧酶激活酶 MQVTMKSSAVSGQRVGGARVATRSVR RAQLQV
CAA56932 拟南芥 Asp氨基转移酶 MASLMLSLGSTSLLPREINKDKLKLGTS ASNPFLKAKSFSRVTMTVAVKPSR
CAA31991 拟南芥 酰基载体蛋白1 MATQFSASVSLQTSCLATTRISFQKPALI SNHGKTNLSFNLRRSIPSRRLSVSC
CAB63798 拟南芥 酰基载体蛋白2 MASIAASASISLQARPRQLAIAASQVKSF SNGRRSSLSFNLRQLPTRLTVSCAAKP ETVDKVCAVVRKQL
CAB63799 拟南芥 酰基载体蛋白3 MASIATSASTSLQARPRQLVIGAKQVKS FSYGSRSNLSFNLRQLPTRLTVYCAAK PETVDKVCAVVRKQLSLKE
如SEQ ID NO:155所示的cpFBPase多肽是具有酶学委员会(EC;基于酶催化的反应的酶分类)编号EC 3.1.3.11,为果糖-二磷酸酶的酶。cpFBPase多肽催化果糖-1,6-二磷酸至果糖-6-磷酸和Pi的不可逆转化。该功能性测定可以是基于Pi比色的cpFBPase活性测定的测定,如Huppe和Buchanan(1989),在Naturforsch.44c:487-494中所述。其他测定酶活性的方法由Alscher-Herman(1982)在Plant Physiol 70:728-734中描述。
本文中“在叶绿体中发挥功能”意指cpFBPase多肽在叶绿体中是有活性的,即cpFBPase多肽在叶绿体中进行由果糖-二磷酸水解为果糖-6-磷酸和Pi组成的酶促反应。
编码表7中给出的cpFBpase多肽、或前述任意SEQ ID NO的直向同源物或旁系同源物的核酸序列不需要是全长核酸,因为本发明方法的实施不依赖全长核酸序列的使用。
cyFBPase的核酸变体也可以适于实施本发明的方法。变体cyFBPase核酸序列通常为与天然存在的cyFBPase核酸序列具有相同功能的那些核酸序列,其可以是相同的生物学功能,或者是当所述核酸序列在植物地上部分中的表达被增加时,相对于对照植物增加产量的功能。这样的cyFBPase变体实例包括天然存在的或通过DNA操作获得的核酸序列的部分、能与cyFBPase杂交的核酸序列、剪接变体、等位变体、通过基因改组获得的cyFBPase核酸序列、或通过位点定向诱变获得的cyFBPase核酸序列。
如本文所使用的术语“部分”是指编码多肽的DNA片段,所述DNA片段在叶绿体中发挥功能且包括:(i)至少一个FBPase结构域;和(ii)至少一个氧化还原调控插入片段。
例如,可以通过对如上文定义的编码cpFBPase多肽的核酸进行一个或多个缺失来制备部分。部分可以以分离的形式使用,或者可将其与其他编码(或非编码)序列融合,以便,例如,生产组合了若干活性的多肽。在另一实施例中,天然发生的转运肽序列可以被来自另一光合器官的转运肽序列取代,或被合成转运肽序列取代。如果考虑叶绿体转化的话,可一并转移转运肽序列。当与其他编码序列融合时,经翻译后所产生的多肽可能比预测的cpFBPase部分要大。用于本发明方法中的部分通常长度至少为900个核苷酸,优选长度至少为1000个核苷酸,更优选长度至少为1100个核苷酸和最优选长度至少为1200个核苷酸。优选地,部分是表7中给出的核酸序列、或前述任意SEQ ID NO的直向同源物或旁系同源物的编码核酸序列中任一个所表示的核酸序列的部分。最优选的部分是SEQ IDNO:154表示的核酸序列的部分。
根据本发明,提供增加植物产量的方法,其包括增加实施例12的表C中给出的核酸序列中任一个的部分、或实施例12的表C中给出的任何氨基酸序列的直向同源物、旁系同源物或同源物的编码核酸的部分在植物中的表达。
用于本发明方法的另一核酸变体为在降低的严格条件下、优选在严格条件下,能够与上文所定义的cpFBPase多肽的编码核酸序列或与上文所定义的部分杂交的核酸。根椐本发明,提供增加植物产量的方法,其包括增加能与实施例12的表C中给出的核酸序列中任一个杂交的核酸在植物中的表达、或包括能与实施例12的表C中给出的任何核酸序列的直向同源物、旁系同源物或同源物杂交的核酸在植物中的表达。
用于本发明方法中的杂交序列编码cpFBPase多肽,所述cpFBPase多肽在叶绿体中发挥功能且包括:(i)至少一个FBPase结构域;和(ii)至少一个氧化还原调控插入片段,且具有与SEQ ID NO:155所示的cpFBPase多肽基本相同的生物学活性。设计探针的方法是本领域熟知的。杂交序列通常在长度上小于1000bp,优选在长度上小于900、800、700、600或500bp。通常,对于DNA-DNA杂交,例如Southern印迹,探针长度在100-500bp之间变化,然而针对DNA-DNA杂交,例如在PCR扩增中,探针通常短于50个核苷酸,但是长于10个核苷酸。优选地,杂交序列是这样的杂交序列,其能够与任意如表7中给出的核酸序列所表示的核酸序列(或衍生的探针)、或编码任意前述SEQ ID NO的直向同源物或旁系同源物的核酸序列杂交,或与任意前述序列的部分杂交,部分如上文定义。最优选杂交序列能够与SEQ ID NO:154或与其部分(或探针)杂交。
用于本发明方法的另一核酸变体是编码如上文定义的cpFBPase多肽的剪接变体。此类变体将是其中基本上保留了蛋白质的生物学活性的变体;这可以通过选择性保留蛋白质的功能性节段而实现。优选的剪接变体是表7中给出的cpFBPase核酸序列、或编码任何前述SEQ ID NO的直向同源物或旁系同源物的核酸序列的剪接变体。最优选的剪接变体是如SEQ IDNO:154所表示的cpFBPase核酸序列的剪接变体。
用于实施本发明方法的另一种核酸变体是编码如上文所定义的cpFBPase多肽的核酸序列的等位变体。等位变体天然存在,且包含在本发明方法中的是这些天然等位基因的用途。优选的等位变体是表7中给出的cpFBPase核酸序列、或编码任意前述SEQ ID NO的直向同源物或旁系同源物的核酸序列的等位变体。最优选的是由SEQ ID NO:154所示的cpFBPase核酸序列的剪接变体。
本发明提供在植物中增加产量的方法,其包括在植物中增加表达实施例12的表C中给出的任何一种核酸序列的剪接变体、或实施例12的表C中给出的任意氨基酸序列的直向同源物、旁系同源物或同源物的编码核酸的剪接变体。
用于本发明方法中的另一核酸变体是通过基因改组(或定向进化)而获得的编码cpFBPase多肽的核酸变体。最优选的是通过如SEQ ID NO:155所示的cpFBPase核酸序列的基因改组获得的核酸变体。
本发明提供在植物中增加产量的方法,其包括在植物中增加表达实施例12的表C中给出的任何一种核酸序列的变体、或包括在植物中增加表达实施例12的表C中给出的任意氨基酸序列的直向同源物、旁系同源物或同源物的编码核酸的变体,所述变体核酸通过基因改组获得。
用于本发明方法中的另一核酸变体是通过位点定向诱变而获得的编码cpFBPase多肽的核酸变体。位点定向诱变也可以用来产生cpFBPase核酸序列的变体。几种方法可用于实现位点定向诱变,最常见的是基于PCR的方法(Current Protocols in Molecular Biology.Wiley编著)。例如,影响二硫键形成的突变是将保守半胱氨酸中的一个改变为丝氨酸,由此产生cpFBPase组成型活性(Chiadmi等,(1999)EMBO J 18(23):6809-6815).最优选的是通过如SEQ ID NO:154所示的cpFBPase核酸序列的位点定向诱变获得的核酸变体。
以下cpFBPase核酸变体是适合实施本发明方法的变体实例:
(i)cpFBPase核酸序列的部分;
(ii)能与cpFBPase核酸序列杂交的核酸序列;
(iii)cpFBPase核酸序列的剪接变体;
(iv)cpFBPase核酸序列的等位变体;
(v)通过基因改组获得的cpFBPase核酸序列;
(vi)通过位点定向诱变获得的cpFBPase核酸序列
还可用于本发明方法中的是这样的核酸序列,其编码如表7中给出的cpFBPase多肽的同源物、或编码任意前述SEQ ID NO的直向同源物或旁系同源物的同源物。
也可用于本发明方法中的是这样的核酸序列,其编码表7中给出的任一cpFBPase核酸序列的衍生物、或任意前述SEQ ID NO的直向同源物或旁系同源物的衍生物。表7中给出的任一所示的cpFBPase多肽、或任意前述SEQ ID NO的直向同源物或旁系同源物的衍生物是可以适合用于本发明方法的另一实例。
编码cpFBPase多肽的核酸序列可以来自任何人工或天然的来源,如植物、藻类、硅藻或动物。可以通过仔细的人为操作在组成和/或基因组环境上修饰所述核酸序列的天然形式。优选编码cpFBPase多肽的核酸序列来自光合细胞(植物界).还优选编码cpFBPase多肽的核酸序列来自植物细胞。更优选编码cpFBPase多肽的核酸序列来自硅藻细胞。最优选编码cpFBPase多肽的核酸序列来自藻类(红藻、褐藻或绿藻,)细胞。可以从属于绿藻门(Chlorophyta)或轮藻门(Charophyta)的绿藻、或从陆生植物(非维管植物或维管植物)分离所述核酸序列。例如,编码cpFBPase多肽的核酸序列分离自:衣藻属物种、小球藻物种(Chlorella sp.)、Bigelowiella natans、Cyanidioschyzon merolae、Ostreococcus lucimarinus、Ostreococcus tauri、Galderia sulphuraria、小立碗藓、三角褐指藻、Aquilegia formosa x Aquilegia pubescen、拟南芥、欧洲油菜、大豆、番茄、蒺藜苜蓿、烟草、稻、成熟豌豆,枸桔(Poncirus trifoliate)、美洲山杨,马铃薯,菠菜、小麦、玉蜀黍等。最优选编码cpFBPase多肽的核酸序列分离自莱茵衣藻。
本发明方法的实施产生具有增加产量的植物。术语“产量”、“增加的”、“改良的”、“增强的”、“扩增的”、“延伸的”、“强化的”或“提高的”是可相互交换的且上文已定义。增加的生物量可以表现为增加的根生物量。增加的根生物量可以归因于增加的根数量、增加的根厚度和/或根长度。增加的产量可以表现为下列一种或多种指标:
(i)植物一个或多个部分,特别是地上(可收获)部分增加的生物量(重量)、增加的根生物量或任何其他可收获部分增加的生物量;(ii)增加的早期萌发势,文中定义为萌发后三周幼苗的地上面积;
(iii)增加的种子总产量,这包括种子生物量(种子重量)的增加,并且其可以是每棵植株或单粒种子基础上的种子重量增加;
(iv)增加的每株植物圆锥花序数;
(v)增加的每个圆锥花序的花朵(“小穗floret”)数量;
(vi)增加的种子饱满率;
(vii)增加的(饱满)种子数量;
(viii)增加的种子大小(长、宽面积、周长),这也可影响种子的组成;
(ix)增加的种子体积,这也可影响种子的组成;
(x)增加的收获指数,其表达为可收获部分[如种子]的产量与总生物量的比率;和
(xi)增加的千粒重(TKW),这通过计数饱满种子数量及其总重量,进行外推得到。TKW增加可源于种子大小和/或种子重量的增加。TKW增加可源于胚大小和/或胚乳大小的增加。
在种子大小、种子体积、种子面积、种子周长、种子宽度和种子长度方面的增加可以归因于种子特定部分的增加,如归因于胚和/或胚乳和/或糊粉和/或盾片或种子的其他部分的大小的增加。
尤其,增加的产量是指增加的种子产量,和选自如下之一或多个指标:(i)增加的种子重量;(ii)增加的饱满种子数量;(iii)增加的种子饱满率;(iv)增加的收获指数。
以玉米为例,产量增加可以表现为下列一种或多种指标:每平方米植物数的增加、每株植物穗数的增加、行数、每行粒数、粒重、千粒重、穗长度/直径的增加、种子饱满率的增加(其中种子饱满率是饱满种子数除以种子总数并乘以100)及其他。
以稻为例,产量增加本身可以表现为下列一种或多种指标的增加:每平方米植物数、每株植物圆锥花序数、每圆锥花序小穗数、每圆锥花序花(小花)数(其表达为饱满种子数对原圆锥花序数之比)、种子饱满率的增加(其中种子饱满率是饱满种子数除以种子总数并乘以100)、千粒重的增加及其他。
增加的产量也可以产生改良的结构,或可以因改良的结构而出现。
根据本发明的优选特征,本发明方法的实施产生相对于对照植物而具有增加种子产量的植物。因而根据本发明,提供增加种子产量的方法,所述方法包括增加编码cpFBPase多肽的核酸序列在植物的地上部分中的表达。
由于本发明的转基因植物具有增加的产量,因而相对于对照植物的生长速率,这些植物有可能在其生活周期中的对应阶段上表现增加的生长速率(在其生活周期的至少部分期间)。
增加的生长速率可以对于植物的一个或多个部分(包括种子)是特异性的,或可以基本上遍及整株植物。具有增加的生长速率的植物可以具备较短的生活周期。植物的生活周期可以视为意指从干燥成熟种子成长至植物已经产生与起始材料相似的干燥成熟种子的阶段所需要的时间。这个生活周期可以受下列因素影响,如早期萌发势、生长速率、绿度指数、开花时间和种子成熟速度。生长速率的增加可以在植物生活周期中的一个或多个阶段上或在基本上整个植物生活周期期间发生。在植物生活周期中的早期期间增加的生长速率可以反映增强的萌发势。生长速率的增加可以改变植物的收获周期,允许植物较晚播种和/或较早收获,否则这将不可能(相似的作用可以用较早的开花时间获得)。若生长速率充分地增加,可以允许进一步播种相同植物物种的种子(例如播种并收获稻植物,随后播种并收获其他稻植物,全部稻植物均在一个常规生长时段内)。类似地,若生长速率足够地增加,可以允许进一步播种不同植物物种的种子(例如播种并收获玉米植物,随后例如播种并任选收获大豆、马铃薯或任何其他合适植物)。从相同的根茎中收获额外次数在一些作物植物的情况中也是可能的。改变植物的收获周期可以导致每英亩的年生物量产量的增加(因任何特定植物可以生长并收获的次数(如在一年中)增加)。生长速率的增加也可以允许比其野生型对应物在更广泛的地理区域内培育转基因植物,因为对培育作物的区域限制往往由栽种时节(早季)或在收获时期(晚季)的不利环境条件所决定。若缩短收获周期,则可以避开这类不利条件。生长速率可以通过从生长曲线中得到多种参数而确定,此类参数可以是:T-Mid(植物达到其50%最大尺寸所花费的时间)和T-90(植物达到其90%最大尺寸所花费的时间),等等。
根据本发明的优选特征,本发明方法的实施产生与对照植物相比具有增加的生长速率的植物。因而根据本发明,提供增加植物生长速率的方法,所述方法包括调节,优选增加编码如本文定义的cpFBPase多肽的核酸在植物中的表达。
与对照植物相比,无论植物处于非胁迫条件下还是植物暴露于多种胁迫下,都发生产量和/或生长速率的增加。植物一般通过生长得更慢而对暴露于胁迫作出应答。在严重胁迫条件下,植物甚至可以完全停止生长。另一方面,轻微胁迫在本文中定义为植物对其暴露的任何胁迫,其中所述的胁迫未导致植物完全停止生长而没有恢复生长的能力。与非胁迫条件下的对照植物相比,轻微胁迫在本发明意义中导致受胁迫植物生长降低小于40%、35%或30%,优选小于25%、20%或15%,更优选小于14%、13%、12%、11%或10%或更低。由于农业实践(灌溉、施肥、杀虫剂处理)上的进步,在栽培作物植物中并不经常遇到严重胁迫。因此,由轻微胁迫诱导的受损生长往往是农业上不希望的特征。轻微胁迫是植物暴露的常见生物性和/或非生物性(环境)胁迫。非生物胁迫可以因干旱或水涝、厌氧胁迫、盐胁迫、化学毒性、氧化胁迫和热、寒冷或冰冻温度所致。非生物胁迫可以是由水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。生物胁迫一般是由病原体如细菌、病毒、真菌和昆虫引起的那些胁迫。
尤其,本发明的方法可以在非胁迫条件下或在轻微干旱条件下实施以产生相对于对照植物而具有增加的产量的植物。如在Wang等(Planta(2003)218:1-14)中报道,非生物胁迫导致不利地影响植物生长及生产力的一系列形态学变化、生理学变化、生物化学变化和分子变化。已知干旱、盐度、极端温度和氧化胁迫是相互联系的并可以通过相似机制而诱导生长损害及细胞损害。Rabbani等(Plant Physiol(2003)133:1755-1767)描述了干旱胁迫与高盐度胁迫间极高程度的“串话”。例如,干旱和/或盐化作用主要表现为渗透胁迫,导致细胞内稳态和离子分布的破坏。经常伴随高温或低温、盐度或干旱胁迫的氧化胁迫可以造成功能性蛋白和结构蛋白变性。因此,这些多样的环境胁迫常常激活相似的细胞信号途径和细胞应答,如产生胁迫蛋白质、上调抗氧化物质、积累相容性溶质和生长抑制。如本文中所用的术语”非胁迫”条件是允许植物最佳生长的环境条件。本领域技术人员清楚对于给定地点的正常土壤条件和气候条件。
本发明方法的实施相对于在可比条件下培育的合适对照植物,赋予在非胁迫条件下或在轻微干旱条件下培育的植物增加的产量。因而根据本发明,提供用于在非胁迫条件下或在轻微干旱条件下培育的植物中增加产量的方法,所述方法包括增加编码cpFBPase多肽的核酸在植物中表达。
本发明方法的实施产生相对于在可比条件下培育的合适对照植物,在营养缺乏条件下、尤其在氮缺乏条件下培育的具有增加产量的植物。因而根据本发明,提供用于在营养缺乏条件下培育的植物中增加产量的方法,所述方法包括增加编码cpFBPase多肽的核酸在植物中的表达。营养缺乏可以因营养物的缺乏所致,所述营养物例如是氮、磷酸盐及其他含磷化合物、钾、钙、镉、镁、锰、铁和硼等。
优选产量和/或生长速率的增加根据本发明方法在非胁迫条件或轻微非生物或生物胁迫条件下出现。
术语“表达”或“基因表达”意指因特定一种或多种基因或基因构建体的转录。术语“表达”或“基因表达”尤其意指一种或多种基因或基因构建体转录成结构RNA(rRNA、tRNA)或mRNA,有或没有随后mRNA翻译成蛋白质。此过程包括DNA转录、加工得到的mRNA产物。
上文定义了术语“增加的表达”。增加编码cpFBPase多肽的核酸序列在地上部分的表达相对于对照植物导致植物增加的产量。优选地,核酸表达的增加为内源植物cpFBPase多肽表达的1.25、1.5、1.75、2、5、7.5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100或更多倍。
本文引用术语“植物地上部分”意指植物部分,所述植物部分不包括根、根毛和在土壤中(即不直接暴露于光照下)的任何其他植物部分。
通过增加编码cpFBPase多肽的核酸序列的表达(在质体中),获得cpFBPase多肽数量的增加。此cpFBPase多肽(在质体中)数量的增加导致cpFBPase活性的增加。备选地,当cpFBPase多肽数量没有改变时、或当cpFBPase多肽数量有减少时,也可以增加活性。这种情况出现在cpFBPase多肽固有特性发生改变的时候,例如,通过制备比野生型多肽更具活性的突变体形式。
使用本领域已知技术来增加编码cpFBPase多肽的核酸序列在质体中的表达,如通过使用转运肽序列将cpFBPase多肽靶向到质体或通过没有转运肽序列的cpFBPase多肽直接转化入质体中。可以在任何质体中增加表达,但优选是在叶绿体中优选地增加表达。
可以通过引入遗传修饰调节编码cpFBPase多肽的核酸序列的表达,可以通过任一(或多种)如下方法引入所述遗传修饰:T-DNA激活、TILLING、同源重组,或通过在植物中引入和表达编码cpFBPase多肽的核酸序列。引入遗传修饰之后的步骤是选择编码cpFBPase多肽的核酸序列的增加的表达,所述增加的表达产生相对于对照植物具有增加的产量的植物。
一种此类技术是T-DNA激活标注。引入的启动子可以是任意能够在期望生物体内(在本案中是植物)驱动基因表达的启动子。例如,组成型的、地上部分、地下部分、组织偏好的、细胞类型偏好的和诱导性的启动子都适用于T-DNA激活。还可以使用TILLING或同源物重组再现本发明的效果。
用于引入遗传修饰的优选方法是在植物地上部分引入和表达编码cpFBPase多肽的核酸序列。如本文定义的cpFBPase指多肽,所述多肽在叶绿体中发挥功能且包括:(i)至少一个FBPase结构域;和(ii)至少一个氧化还原调控插入片段。
在本发明的一个实施方案中,编码cpFBPase多肽的核酸序列的表达是增加的表达(在植物的地上部分中)。增加的表达可以引起cpFBPasemRNA或多肽水平提高,这等同于提高cpFBPase多肽的活性;或者当多肽水平没有变化,或者甚至当多肽水平下降时也可以提高活性。这种情况出现在cpFBPase多肽固有特性发生改变的时候,例如,通过制备比野生型多肽更具活性的突变体形式。增加或减少基因表达或基因产物的方法是本领域已知的。
本发明还提供遗传构建体和载体以促进在植物中引入和/或表达用于本发明方法中的核酸序列。
因而,提供基因构建体,其包含:
(i)编码如上面所定义的cpFBPase多肽的核酸序列;
(ii)一个或多个能够驱动(i)中核酸序列在植物地上部分中的表达的控制序列;和可选地
(iii)转录终止序列。
优选的构建体是一种这样的构架体,其中调控序列是来自植物的启动子,如果单子叶植物被转化优选来自单子叶植物。
本发明方法中所用的构建体可以使用本领域技术人员众所周知的重组DNA技术构建。该基因构建体可以插入适于转化至植物内并适于在转化的细胞中表达目的基因的市售载体。本发明也提供如文中所定义的基因构建体在本发明方法中的用途。
植物用包含目的序列的载体转化(如编码cpFBPase多肽的核酸序列)。目的序列有效地与一种或多种调控序列(至少与启动子)连接。术语“调节元件”、“调控序列”和“启动子”在本文都可互换使用,且在上文定义。
有利地,用于驱动核酸序列的表达的启动子是组织偏好的启动子,即是能够优先在特定组织如叶、茎、种子组织等内优先启动转录的启动子。仅能在特定组织中启动转录的启动子本文称作“组织特异的”。类似地,仅在特定细胞中启动转录的启动子本文称作“细胞特异性的”。此外或备选地,启动子可以自然产生或合成。优选地,启动子能驱动编码cpFBPase多肽的核酸在植物的地上部分即暴露于光照的部分中的表达,用于合适的cpFBPase氧化还原调控。
其他合适的启动子有组成型启动子(Benfey等,EMBO J.8(1989)2195-2202),如来源于植物病毒的那些启动子,如35S CAMV(Franck等,Cell 21(1980)285-294)、19S CaMV(还参见US 5352605和WO84/02913)、34S FMV(Sanger等,Plant.Mol.Biol.,14,1990:433-443)、欧芹泛素启动子,或植物启动子如US 4,962,028中所述的核酮糖二磷酸缩化酶-加氧酶(Rubisco)小亚基启动子或植物启动子PRP1[Ward等,Plant.Mol.Biol.22(1993)]、SSU、PGEL1、OCS[Leisner(1988)Proc NatlAcad Sci美国85(5):2553-2557]、lib4、usp、mas[Comai(1990)PlantMol Biol 15(3):373-381]、STLS1、ScBV(Schenk(1999)Plant Mol Biol39(6):1221-1230)、B33、SAD1或SAD2(亚麻启动子,Jain等,CropScience,39(6),1999:1696-1701)或nos[Shaw等(1984)Nucleic Acids Res.12(20):7831-7846]。其他组成型植物启动子的实例为甜菜V-ATPase启动子(WO 01/14572)。合成组成型启动子的实例有超级启动子(Superpromoter)(WO 95/14098)和来源于G-box的启动子(WO 94/12015)。此外,适当的情况下,相对于EP-A 388186、EP-A 335528、WO 97/06268,还可以使用化学诱导性启动子。在植物中稳定组成型表达本发明多肽是有利的。然而,如果收获前的晚期表达有利的话,最好诱导性表达本发明的多肽,因为代谢操作很可能会导致植物生产延迟。
也能够通过化学诱导性启动子促进植物基因的表达。此类启动子的实例有水杨酸诱导性启动子(WO 95/19443)、脱落酸诱导性启动子(EP 335 528)、四环素诱导性启动子(Gatz等(1992)Plant J.2,397-404)、环己醇或乙醇诱导性启动子(WO 93/21334),或者本文所述的其他启动子。
其他合适的启动子是那些针对生物或非生物胁迫起反应的启动子,例如病原诱导的PRP1基因启动子(Ward等,Plant.Mol.Biol.22(1993)361-366)、番茄热诱导性hsp80启动子(US 5,187,267)、马铃薯冷诱导性α-淀粉酶启动子(WO 96/12814)或创伤诱导性pinII启动子(EP-A-0 375 091),或者本文所述的其他启动子。
优选的启动子尤其是那些影响基因在组织和器官、在种子细胞如胚乳细胞以及发育中的胚细胞中表达的启动子。合适的启动子有油菜籽油菜napin基因启动子(US 5,608,152)、蚕豆(Vicia faba)USP启动子(Baeumlein等,Mol Gen Genet,1991,225(3):459-67)、拟南芥油质蛋白启动子(WO98/45461)、菜豆(Phaseolus vulgaris)菜豆蛋白启动子(US 5,504,200)、芸苔Bce4启动子(WO 91/13980)、豆arc5启动子、胡萝卜DcG3启动子或豆球蛋白B4启动子(LeB4;Baeumlein等,1992,Plant Journal,2(2):233-9),以及在单子叶植物中带来种子特异性表达的启动子,如玉米、大麦、小麦、黑麦、稻等。有利的种子特异性启动子有蔗糖结合蛋白启动子(WO 00/26388)、菜豆蛋白启动子和napin启动子。必须考虑的合适的启动子有大麦lpt2或lpt1基因启动子(WO 95/15389和WO 95/23230),以及WO 99/16890中所述的启动子(来自大麦大麦醇溶蛋白基因、稻谷蛋白基因、稻oryzin基因、稻醇溶谷蛋白基因、小麦醇溶蛋白基因、小麦谷蛋白基因、玉米玉米醇溶蛋白基因、燕麦谷蛋白基因、高粱kasirin基因、黑麦黑麦碱基因的启动子)。其他合适的启动子为Amy32b、Amy 6-6和Aleurain[US 5,677,474]、Bce4(油菜籽油菜)[US 5,530,149]、大豆球蛋白(大豆)[EP 571741]、磷酸烯醇式丙酮酸羧化酶(大豆)[JP 06/62870]、ADR12-2(大豆)[WO 98/08962],异柠檬酸裂合酶(油菜籽油菜)[US 5,689,040]或α-淀粉酶(大麦)[EP 781849]。
可用于在植物中表达基因的其他启动子有叶特异性启动子,如DE-A19644478中所述的那些;或者光调控的启动子,如豌豆petE启动子。
在一个实施方案中,核酸序列与组成型启动子有效连接。组成型启动子在其生长和发育的大多数但不必然是所有阶段都转录激活,并且基本上是普遍表达(包括在植物的地上部分)。优选启动子来源于植物,还优选来源于单子叶植物如果单子叶植物被转化。又优选组成型启动子是由基本上类似于SEQ ID NO:208或SEQ ID NO:56的核酸序列表示的GOS2启动子。最优选GOS2启动子是如SEQ ID NO:56或SEQ ID NO:208所表示的。应当明白本发明的适用性不限于由SEQ ID NO:154代表的cpFBPASE核酸序列,同时本发明的适用性也不限于由GOS2启动子驱动时cpFBPASE核酸的表达。也可以用来驱动编码cpFBPASE核酸序列表达的其他组成型启动子的实例如上文显示。
任选地,一种或多种终止子序列可以在引入植物的构建体中使用。额外调节元件可包括转录及翻译强化子。本领域技术人员会意识到可以适用于实施本发明的终止子和强化子序列。内含子序列也可以添加至5′非翻译区(UTR)或编码序列中,以增加在胞浆内积累的成熟信息的量。其他调控序列(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区之外)可以是蛋白质和/或RNA稳定化元件。本领域技术人员会知道或可以轻易地获得此类序列。
本发明的遗传构建体还可以包括需要用于在特定细胞类型中维持和/或复制的复制序列起点。一个实例是当需要将遗传构建体在细菌细胞中维持为附加型遗传元件(例如质粒或粘粒分子)时。优选的复制起点包括,但不限于fl-ori和colE1。
为检测如在本发明方法中所用核酸序列的成功转移和/或选择包含这些核酸的转基因植物,使用标记基因(或报道基因)是有利的。因而,遗传构建体可以任选地包含选择性标记基因。该标记基因当其不再需要时,可从转基因细胞移除或切除。移除标记的技术是本领域已知的,有用的技术描述于上面的“定义”部分。优选不同的标记,取决于组织和选择方法。
本发明也包括用根据本发明的方法可获得的植物(包括种子)。本发明因此提供用根据本发明的方法可获得的植物、植物部分和植物细胞,所述植物中引入cpFBPASE核酸序列且所述植物、植物部分和植物细胞优选自作物,更优选自单子叶植物。
本发明也提供用于产生相对于对照植物具有增强的产量的转基因植物的方法,其包括在植物中引入和表达编码cpFBPase多肽的核酸序列。
更具体地,本发明提供用于产生相对于对照植物具有增强的产量的转基因植物优选单子叶植物的方法,所述方法包括:
(i)在植物地上部分或植物细胞中引入并表达编码cpFBPase多肽的核酸序列;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
(i)的核酸可以是任意本文定义的能编码cpFBPase多肽的核酸。
核酸序列可以直接引入植物细胞或引入植物本身(包括引入组织、器官或植物的任何其他部分)。根据本发明的优选特征,核酸序列优选地通过转化引入植物。
可通过技术人员所熟悉的所有方法来再生遗传修饰的植物细胞。可在上面提到的S.D.Kung和R.Wu,Potrykus或
和Willmitzer的出版物中找到合适的方法。
通常在转化后,对植物细胞或细胞群体选择一种或多种标记的存在,其中所述的标记由与目的基因一起共转移的植物可表达基因编码,随后将转化的材料再生成整株植物。为选择转化的植物,在转化中获得的植物材料原则上接受选择条件处理,以至于转化的植物可以与未转化的植物区分。例如。以上文所述方式获得的种子可以播种,在初始培育时期后,通过喷雾进行合适的选择处理。另一种可能性包括在使用合适选择剂的琼脂平板上培育种子(根据需要在消毒之后),以至于仅转化的种子可以生长成植物。备选地,对转化的植物筛选选择性标记(如上文所述的那些选择性标记)的存在。
在DNA转移和再生后,推测的转化植物也可以例如使用Southern分析对目的基因的存在、拷贝数和/或基因组构造进行评价。备选或额外地,新引入DNA的表达水平可以使用Northern和/或Western分析、定量PCR,此类技术是本领域内普通技术人员众所周知的。
产生的转化植物可以通过多种方法加以增殖,如通过克隆性增殖法或经典育种技术。例如,第一代(或T1)的转化植物可以自花传粉产生纯化的第二代(或T2)转化体,并且T2植物通过经典育种技术进一步繁殖。
产生的转化生物可以采取多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆性转化体(例如受转化以含有表达盒的全部细胞);转化组织和未转化组织的移植体(例如在植物中,与未转化嫩枝嫁接的转化的根茎)。
本发明方法有利地适用于任何植物。特别用于本发明方法中的植物包括属于植物界超家族的全部植物,尤其单子叶植物和双子叶植物,包括选自以下的饲用或饲料豆类、观赏植物、粮食作物、树或灌木。根据本发明优选的实施方案,植物是作物植物。作物植物的实例包括大豆、向日葵、卡诺拉油菜、苜蓿、油菜、棉花、番茄、马铃薯和烟草。还优选地,植物是单子叶植物。单子叶植物的实例包括甘蔗。更优选地,植物是谷物。谷物的实例包括稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱和燕麦。
其他有利的植物选自菊科(Asteraceae)如向日葵属(Helianthus)、万寿菊属例如物种向日葵[向日葵(sunflower)]、香叶万寿菊(Tagetes lucida)、万寿菊(Tagetes erecta)或细叶万寿菊(Tagetes tenuifolia)[Marigold]、十字花科(Brassicaceae)如芸苔属(Brassica)、拟南芥属,例如物种欧洲油菜、芜芜青[卡诺拉油菜、油菜、蔓青]、或拟南芥;豆科(Fabaceae)如大豆属例如物种大豆、大豆(Soja hispida)或大豆(Soja max)[大豆];亚麻科(Linaceae)如亚麻属(Linum)例如物种亚麻[亚麻(flax、linseed)];禾本科如大麦属(Hordeum)、黑麦属(Secale)、燕麦属(Avena)、高粱属(Sorghum)、稻属(Oryza)、玉蜀黍属(Zea)、小麦属(Triticum)例如物种大麦[大麦]、黑麦[rye]、燕麦、燕麦(Avena fatua)、野燕麦、比赞燕麦、Avena fatua var.sativa、杂种燕麦[oat]、两色蜀黍[高粱、粟]、稻、阅叶稻[稻]、玉蜀黍[玉米、玉米]、普通小麦、硬粒小麦、圆柱小麦、Triticum hybernum、马卡小麦、普通小麦(Triticum sativum)或普通小麦(Triticum vulgare)[小麦、面包小麦、普通小麦];茄科(Solanaceae)如茄属(Solanum)、番茄属(Lycopersicon)例如马铃薯[马铃薯]、番茄(Lycopersicon esculentum、Lycopersiconlycopersicum、Lycopersicon pyriforme、Solanum integrifolium或Solanumlycopersicum)[西红柿(tomato)]。
本发明明确地扩展至通过本文中所述的任一方法产生的任何植物细胞或植物,并扩展至全部植物部分及其繁殖体。本发明进一步扩展至包含已经通过任一前述方法产生的原代转化或转染细胞、组织、器官或整株植物的后代,唯一要求是后代表现与通过本发明方法中的亲代所产生的那些后代相同的基因型特征和/或表型特征。本发明也包括宿主细胞,其含有分离的cpFBPase核酸序列。本发明优选的宿主细胞是植物细胞。本发明也扩展至植物的可收获部分如,但不限于种子、叶、果实、花、茎、根状茎、块茎和球茎。本发明进一步涉及来自自、优选直接来自这种植物的可收获部分中的产物,如干燥颗粒或粉末、油、脂肪及脂肪酸、淀粉或蛋白质。
本发明还包括cpFBPase核酸序列的用途和cpFBPase多肽的用途,和如上文定义的的构建体相对于对照植物在增加植物产量中的用途。增加的植物产量尤其是指增加的种子产量。本文引用增加的种子产量意指如下之任一指标:(i)增加的种子重量;(ii)增加的饱满种子数量;(iii)增加的种子饱满率;(iv)增加的收获指数。
可以在育种程序中使用cpFBPase核酸序列或者cpFBPase多肽,其中鉴定可以遗传地连接于cpFBPase基因座的DNA标记。可以使用cpFBPase核酸序列或者cpFBPase多肽界定分子标记。接着可以将此DNA或多肽标记在育种程序中使用,以选择具有增加的产量的植物。例如,cpFBPase基因可以是表7中给出的cpFBPase核酸序列、或任意前述SEQ ID NO的直向同源物或旁系同源物的编码核酸序列中任一所代表的核酸序列。
cpFBPase核酸序列的等位基因变体也可以用于标记辅助的育种程序。这类育种程序有时需要使用,例如EMS诱变,通过植物诱变处理引入等位基因变体;备选的,此程序可以以收集无意产生的所谓“天然”起源的等位基因变体开始。然后通过例如PCR鉴定等位基因变体。随后是选择步骤,用以选择所讨论序列的较好等位基因变体,所述等位基因变体赋予植物增加的产量。一般通过监测含有所研究序列的不同等位基因变体植物的生长行为来进行选择,例如表7中给出的cpFBPase核酸序列、或前述任意SEQ IDNO的直向同源物或旁系同源物的编码核酸序列中任一的不同等位基因变体。可以在温室或田地中监测生长行为。更多任选的步骤包括,将经鉴定含有较好等位基因变体的植物与另一植物杂交。例如,可使用这种方法产生感兴趣表型特征的组合。
cpFBPase核酸序列还可以作为探针,用于对为那些基因连锁性状的一部分并作为其标志物的基因进行遗传和物理的作图。这样的信息可以在植物育种中使用,以得到具有所期望表型的品系。cpFBPase核酸序列的这类应用仅需要长至少15个核苷酸的核酸序列。cpFBPase核酸序列可以用作限制性片段长度多态性(RFLP)标记。可用cpFBPase核酸序列探测限制酶切消化的植物基因组DNA的Southern印迹(Sambrook J,Fritsch EF和ManiatisT(1989)《分子克隆:实验室手册》)。随后使用计算机程序如MapMaker(Lander等(1987)Genomics 1:174-181)对产生的带型进行遗传分析,以构建遗传图谱。此外,可以使用核酸序列在含有一组个体的限制性内切酶处理的基因组DNA中探测Southern印迹,所述一组个体为代表明确的遗传杂交的亲本和子代的一组个体。记录DNA多态性的分离并用于计算在先前用此群体获得的遗传图谱中cpFBPase核酸序列的位置(Botstein等(1980)Am.J.Hum.Genet.32:314-331)。
在遗传作图中使用的植物基因衍生探针的产生和用途描述于Bematzky和Tanksley(1986)Plant Mol.Biol.Reporter 4:37-41中。众多出版物中描述过用上述方法或其变通形式对特定cDNA克隆进行遗传作图。例如,可以使用F2杂交群体、回交群体、随机交配群体、近亲同基因品系和其他个体组作图。这类方法是本领域技术人员众所周知的。
核酸探针也可以用于物理作图(即在物理图谱上安置序列;见Hoheisel等In:Non-mammalian Genomic Analysis:A Practical Guide,Academicpress 1996,第319-346页,及其中引用的参考文献)。
在另一个实施方案中,核酸探针可用于直接荧光原位杂交(FISH)作图(Trask (1991)Trends Genet.7:149-154)。尽管目前FISH作图的方法倾向用于大的克隆(几个kb到几百个kb;见Laan等(1995)Genome Res.5:13-20),但是灵敏性的提高允许在FISH作图中应用较短的探针。
用于遗传和物理作图的多种基于核酸扩增的方法可以使用所述核酸序列进行。实例包括等位基因特异性扩增(Kazazian(1989)J.Lab.Clin.Med11:95-96)、PCR扩增片段的多态性(CAPS;Sheffield等(1993)Genomics16:325-332)、等位基因特异性连接(Landegren等(1988)Science 241:1077-1080)、核苷酸延伸反应(Sokolov(1990)Nucleic Acid Res.18:3671)、放射杂交作图(Walter等(1997)Nat.Genet.7:22-28)和Happy作图(Dear和Cook(1989)Nucleic Acid Res.17:6795-6807)。为实施这些方法,使用核酸序列设计和产生用于扩增反应或引物延伸反应的引物对。这类引物的设计是本领域技术人员众所周知的。使用基于PCR的遗传作图的方法,可能需要鉴定跨越相应于本发明核酸序列区域作图的亲本之间DNA序列的差异。然而,这对作图方法通常不是必要的。
根据本发明的方法得到如前所述具有增加的产量的植物。产量提高的性状还可以组合其他经济上有利的性状,如更多提高产量的性状、对多种胁迫的耐受性、改良多种构造特征和/或生化和/或生理学特征的性状。
SIK多肽的详细描述
现已发现调节SIK核酸和/或SIK多肽在植物中的表达产生相对于对照植物具有多种改良的产量相关的性状的植物,其中SIK编码核酸在植物中的超量表达产生相对于对照植物具有增加的每株植物花数,和其中减少或基本去除SIK核酸产生相对于对应野生型植物具有增加的千粒重、增加的收获指数和增加的饱满率。
因此本发明提供了相对于对照植物改良植物中产量相关性状的方法,其包括调节SIK核酸和/或SIK多肽在植物中的表达,其中受调节的表达是SIK编码核酸在植物中的超量表达,其产生相对于对照植物增加的每株植物花数,和其中受调节的表达是减少或基本去除SIK核酸,其产生相对于对应野生型植物增加的千粒重(TKW)、增加的收获指数(HI)和增加的饱满率。
如本文定义的术语“调节”意指与对照植物相比基因表达水平的改变。如果SIK编码核酸被用于增加每株植物花数,就增加表达水平,如果SIK核酸被用于增加TKW、HI或饱满率,就降低表达水平。原先未受调节的表达可以是结构RNA(rRNA、tRNA)或mRNA的任何类型表达,随后是翻译。
术语“表达”或“基因表达”意指因特定一种或多种基因或基因构建体的转录。术语“表达”或“基因表达”尤其意指一种或多种基因或基因构建体转录成结构RNA(rRNA、tRNA)或mRNA,有或没有随后mRNA翻译成蛋白质。此过程包括DNA转录、加工得到的mRNA产物。
多种改良的产量相关性状与对照植物相比至少被改良5%、6%、7%、8%、9%或10%,优选至少15%或20%,更优选25%、30%、35%、40%、45%、50%、55%、60%、65%或70%。
改良可以是下列中的一种或更种:每株植物增加的花数、增加的种子饱满率(其如本文定义是饱满种子数与种子总数之间的比率);增加的收获指数,其如本文定义是可收获部分(如种子)产量与总生物量的比率;和增加的千粒重(TKW),这如本文定义从计数的饱满种子数及其总重量外推而来。增加的TKW可以因增加的种子大小和/或种子重量所致,并且也可以因胚和/或胚乳尺寸的增加所致。
与对照植物相比,无论植物处于非胁迫条件下还是植物暴露于多种胁迫下,都发生千粒重的增加、增加的收获指数和增加的饱满率。植物一般通过生长得更慢而对暴露于胁迫作出应答。在严重胁迫条件下,植物甚至可以完全停止生长。另一方面,轻微胁迫在本文中定义为植物对其暴露的任何胁迫,其中所述的胁迫未导致植物完全停止生长而没有恢复生长的能力。与非胁迫条件下的对照植物相比,轻微胁迫在本发明意义中导致受胁迫植物生长降低小于40%、35%或30%,优选小于25%、20%或15%,更优选小于14%、13%、12%、11%或10%或更低。由于农业实践(灌溉、施肥、杀虫剂处理)上的进步,在栽培作物植物中并不经常遇到严重胁迫。因此,由轻微胁迫诱导的受损生长往往是农业上不希望的特征。轻微胁迫是植物暴露的常见生物性和/或非生物性(环境)胁迫。非生物胁迫可以因干旱或水涝、厌氧胁迫、盐胁迫、化学毒性、氧化胁迫和热、寒冷或冰冻温度所致。非生物胁迫可以是由水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。生物胁迫一般是由病原体如细菌、病毒、真菌和昆虫引起的那些胁迫。
尤其,本发明的方法可以在非胁迫条件下或在轻微干旱条件下实施以产生相对于对照植物具有增加的千粒重、增加的收获指数和增加的饱满率的植物。如在Wang等(Planta(2003)218:1-14)中报道,非生物胁迫导致不利地影响植物生长及生产力的一系列形态学变化、生理学变化、生物化学变化和分子变化。已知干旱、盐度、极端温度和氧化胁迫是相互联系的并可以通过相似机制而诱导生长损害及细胞损害。Rabbani等(PlantPhysiol(2003)133:1755-1767)描述了干旱胁迫与高盐度胁迫间极高程度的“串话”。例如,干旱和/或盐化作用主要表现为渗透胁迫,导致细胞内稳态和离子分布的破坏。经常伴随高温或低温、盐度或干旱胁迫的氧化胁迫可以造成功能性蛋白和结构蛋白变性。因此,这些多样的环境胁迫常常激活相似的细胞信号途径和细胞应答,如产生胁迫蛋白质、上调抗氧化物质、积累相容性溶质和生长抑制。如本文中所用的术语”非胁迫”条件是允许植物最佳生长的环境条件。本领域技术人员清楚对于给定地点的正常土壤条件和气候条件。
本发明方法的实施相对于在可比条件下培育的对照植物,赋予在非胁迫条件下或在轻微干旱条件下培育的植物增加的千粒重、增加的收获指数和增加的饱满率。因而根据本发明,提供用于在非胁迫条件下或在轻微干旱条件下培育的植物中增加千粒重、增加收获指数和增加饱满率的方法,所述方法包括增加编码SIK多肽的核酸在植物中表达。
本发明方法的实施产生相对于在可比条件下培育的合适对照植物,在营养缺乏条件下、尤其在氮缺乏条件下培育的具有增加的千粒重、增加的收获指数和增加的饱满率的植物。因而根据本发明,提供用于在营养缺乏条件下培育的植物中增加千粒重、增加收获指数和增加饱满率的方法,所述方法包括增加编码SIK多肽的核酸在植物中的表达。营养缺乏可以因营养物的缺乏所致,所述营养物例如是氮、磷酸盐及其他含磷化合物、钾、钙、镉、镁、锰、铁和硼等。
本发明包括根据本发明方法可获得的植物或其部分(包括种子)。植物或其部分包括如上文定义的SIK多肽的核酸转基因。
根据本发明的一个方面,减少或基本去除SIK核酸产生相对于对照植物的下列一项或多项:增加的千粒重(TKW)、增加的收获指数(HI)和增加的饱满率。
本文中提及的“SIK核酸”意指聚合形式的任一长度的双链或单链的脱氧核糖核苷酸聚合物或核糖核苷酸聚合物,或其类似物,它具有天然核糖核苷酸的本质特征,因为它可以以类似于天然存在的多核苷酸的方式与SIK核酸序列杂交。
本文提及的“减少或基本去除SIK核酸或基因”和“内源”SIK基因如定义部分所述。
为了降低或基本去除SIK内源基因在植物中的表达,需要SIK核酸序列的足够长度的基本上连续的核苷酸。基本上连续的核苷酸片段可以来自任意SIK核酸,优选由SEQ ID NO 213至225,或下表8或表9中给出的任一核酸序列中任一所表述的SIK核酸。编码(功能性)多肽的SIK核酸序列不是本文中所讨论用于降低或基本去除内源SIK基因表达的多种方法所需的。
这种降低或基本去除可以使用如上文所述的常规工具和技术完成。用于降低或基本去除SIK核酸表达的优选方法是在植物中引入并表达这样的遗传构建体,其中SIK核酸克隆至所述的遗传构建体内作为由间隔区(非编码DNA)隔开的(部分或完全的)反向重复序列。
根据本发明的另一个方面,SIK编码核酸在植物中的超量表达产生相对于对照植物增加的每株植物花数。
用于SIK编码核酸超量表达的优选方法是通过在植物中引入和表达如下面定义的编码SIK多肽的核酸。
如本文定义的“SIK编码核酸”编码“SIK多肽”或“SIK氨基酸序列”,意指根据SEQ ID NO:210和其如本文定义的直向同源物和旁系同源物的多肽。
SEQ ID NO:210所示的SIK多肽和其直向同源物和旁系同源物也可以典型地包括以下特征:
ATP-结合区
ATP-结合区vsesltstsykasfrddftdpktieaivsrl(基序1)或以增加的优选顺序与基序I至少具有40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一性的ATP-结合区。
丝氨酸苏氨酸激酶活性位点标记
具有保守D残基的丝氨酸苏氨酸激酶活性位点标记AMYNDFSTSNIQI(基序2)或与以增加的优选顺序与基序II至少具有40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的同一性。
富含丝氨酸结构域
N末端富含丝氨酸结构域。
豆蔻酰化位点
直向同源物和旁系同源物还可以进一步包括一个或多个豆蔻酰化位点,其将蛋白质锚定到膜上。
激酶活性进而,SIK直向同源物和旁系同源物将展示激酶活性,可以使用常规工具和技术容易地确定所述激酶活性。几种测定是可用的(例如Current Protocols in Molecular Biology,1和2卷,Ausubel等人(1994),Current Protocols;或者是在线的,例如http://www.protocol-online.org)。
简言之,激酶测定通常包括:(1)使激酶蛋白质接触含有待磷酸化的靶位点的底物多肽;(2)在适当的条件下,在适当的激酶缓冲液中进行靶位点的磷酸化;(3)在恰当的反应期后将磷酸化的产物从未磷酸化的底物中分离出来。激酶活性的存在或缺乏是通过磷酸化的靶标的存在或缺乏来确定的。另外,可以进行定量测量。
纯化的SIK蛋白质,或者含有或富含SIK蛋白质的细胞提取物可以用作激酶蛋白质的来源。组蛋白H1或小肽尤其适合作为底物。肽在磷酸化位点基序中必须含有一个或多个丝氨酸、苏氨酸或酪氨酸残基。可以在Biochimica et Biophysica Acta 1314,191-225,(1996)中找到磷酸化位点的汇编。此外,肽底物可以有利地具有净正电荷,利于结合到磷酸纤维素滤器上(使能够将磷酸化的肽从未磷酸化的肽中分离出来并且检测磷酸化的肽)。如果不知道磷酸化位点基序,可以使用通用酪氨酸激酶底物。例如,Src相关肽(RRLIEDAEYAARG)是许多受体和非受体酪氨酸激酶的底物。为了确定合成肽磷酸化的动力参数,需要肽浓度的范围。对于起始反应,可以使用0.7-1.5mM的肽浓度。
对于每种激酶,重要的是要确定活性的最佳缓冲液、离子强度和pH。标准5×激酶缓冲液通常含有5mg/ml BSA(防止激酶吸附于测定管的牛血清白蛋白)、150mM Tris-Cl(pH 7.5)、100mM MgCl2。大部分酪氨酸激酶需要二价阳离子,尽管一些酪氨酸激酶(例如胰岛素-、IGF-1-、和PDGF受体激酶)需要MnCl2而不是MgCl2(或除了MgCl2)。必须根据经验为每种蛋白激酶确定二价阳离子的最佳浓度。
常用的磷酰基(phophoryl)基团供体是放射性标记的[γ-32P]ATP(通常是0.2mM终浓度)。在肽中掺入的32P的量可以通过在闪烁计数器中硝化纤维素干垫上测量活性来确定。
备选地或此外,可以通过在组成型启动子调控下在植物中超量表达编码SIK多肽的核酸以相对于对照植物检测每株植物花数的增加来测定SIK直向同源物和旁系同源物的活性,和也可以通过在组成型启动子调控下减少或基本去除SIK核酸以检测植物中千粒重(TKW)、收获指数(HI)和饱满率中的一项或更项相对于对照植物的增加来测定SIK直向同源物和旁系同源物的活性。
本发明通过用由SEQ ID NO:209代表的编码多肽序列SEQ IDNO:210的稻序列转化的植物加以说明,然而,本发明的实施不限于这些序列。本发明方法可以有利地使用编码如文中所定义的SIK多肽的任何核酸进行,例如表8和表9中给出的任何核酸序列。表8和表9给出的SEQ IDNO:210的直向同源物和旁系同源物的实例获自基因研究所(The Instituteof Genetic research,TIGR)。表9中的%同一性是在核苷酸水平上给出的。给出的以‘TC’开始的登录号鉴定通过TIGR发现的序列。如果是局部核酸,获得全长核酸序列(或至少足以实施本发明方法的长度)完全属于本领域技术人员能力范围。
表8:推定的SIK直向同源物和旁系同源物的实例
# TC 推定的功能
1 拟南芥|TC272322 (Q9C9Y3)假拟蛋白质F17O14.23
2 大麦|TC134680 (Q8RUD7)类似蛋白激酶AtSIK(P0485B12.21蛋白质)
3 棉花|TC30779 (Q9C9Y3)假拟蛋白质F17O14.23
4 葡萄|TC43027 Q94CI5)蛋白激酶AtSIK
5 日本鲈鱼(L.japonicus) TC17767 (Q94CI5)蛋白激酶AtSIK
6 莴苣|TC15801 蛋白激酶AtSIK
7 玉米|TC255367 (Q8RUD7)类似蛋白激酶AtSIK(P0485B12.21蛋白质)
8 玉米|TC272965 (Q8RUD7)类似蛋白激酶AtSIK(P0485B12.21蛋白质)
9 苜蓿|TC96175 (Q9C9Y3)假拟蛋白质F17O14.23
10 胡椒|TC5595 (Q94CI5)蛋白激酶AtSIK
11 马铃薯|TC117743 推定蛋白激酶结构域
12 稻|TC268277 (Q8RUD7)类似蛋白激酶AtSIK(P0485B12.21蛋白质)
13 甘蔗|TC67974 (Q8RUD7)类似蛋白激酶AtSIK(P0485B12.21蛋白质)
14 高粱|TC103780 (Q8RUD7)类似蛋白激酶AtSIK(P0485B12.21蛋白质)
15 大豆|TC229774 (Q94CI5)蛋白激酶AtSIK
16 西红柿|TC158378 68416.m01018蛋白激酶家族蛋白质包含蛋白激酶结构域 Pfam:PF00069
17 西红柿|TC166426 68416.m01018蛋白激酶家族蛋白质包含蛋白激酶结构域 Pfam:PF00069
18 小麦|TC257477 (Q8RUD7类似蛋白激酶AtSIK(P0485B12.21蛋白质)
表9:推定的SIK直向同源物和旁系同源物的实例
序列1 序列2 %同一性 匹配长度 p-值 Recip.最 佳命中
大麦|TC134680 拟南芥|TC272322 63 1030 6.80E-66 *
棉花|TC30779 拟南芥|TC272322 71 1008 9.40E-103 *
棉花|TC30779 大麦|TC134680 68 971 8.30E-80 *
葡萄|TC43027 拟南芥|TC272322 60 619 4.30E-25 *
葡萄|TC43027 棉花|TC30779 80 245 5.60E-29 *
葡萄|TC43027 玉米|TC272965 58 483 3.20E-13 *
葡萄|TC43027 稻|TC268277 66 318 3.50E-19 *
葡萄|TC43027 甘蔗|TC67974 63 372 2.40E-17 *
葡萄|TC43027 大豆|TC229774 77 276 4.60E-30 *
葡萄|TC43027 西红柿|TC158378 69 420 9.20E-33 *
葡萄|TC43027 西红柿|TC166426 75 241 1.80E-23
日本鲈鱼|TC17767 拟南芥|TC272322 72 659 1.30E-64 *
日本鲈鱼|TC17767 大麦|TC134680 67 659 4.40E-53 *
日本鲈鱼|TC17767 棉花|TC30779 80 654 9.20E-89 *
莴苣|TC15801 拟南芥|TC272322 69 529 8.90E-44 *
莴苣|TC15801 棉花|TC30779 77 501 1.20E-58 *
莴苣|TC15801 日本鲈鱼|TC17767 75 412 2.20E-45 *
玉米|TC255367 拟南芥|TC272322 62 528 5.50E-24 *
玉米|TC255367 大麦|TC134680 81 451 1.10E-60 *
玉米|TC255367 棉花|TC30779 63 738 6.90E-44 *
玉米|TC255367 日本鲈鱼|TC17767 66 366 2.20E-24 *
玉米|TC255367 莴苣|TC15801 65 455 4.10E-30 *
玉米|TC272965 大麦|TC134680 68 623 2.90E-43
苜蓿|TC96175 拟南芥|TC272322 67 1245 2.70E-102*
苜蓿|TC96175 大麦|TC134680 65 1069 2.50E-75*
苜蓿|TC96175 棉花|TC30779 76 1041 2.20E-125*
苜蓿|TC96175 日本鲈鱼|TC17767 89 666 3.50E-114*
苜蓿|TC96175 莴苣|TC15801 73 504 1.00E-51*
苜蓿|TC96175 玉米|TC255367 62 813 3.60E-41*
胡椒|TC5595 拟南芥|TC272322 66 696 6.40E-49*
胡椒|TC5595 大麦|TC134680 66 510 2.90E-38*
胡椒|TC5595 棉花|TC30779 76 553 1.60E-66*
胡椒|TC5595 日本鲈鱼|TC17767 75 474 4.50E-53*
胡椒|TC5595 莴苣|TC15801 75 541 3.30E-60*
胡椒|TC5595 玉米|TC255367 66 462 1.00E-29*
胡椒|TC5595 苜蓿|TC96175 67 800 1.30E-60*
马铃薯|TC117743 拟南芥|TC272322 64 1082 8.80E-65*
马铃薯|TC117743 大麦|TC134680 66 565 1.30E-39*
马铃薯|TC117743 棉花|TC30779 77 587 1.80E-70*
马铃薯|TC117743 日本鲈鱼|TC17767 75 496 3.60E-54*
马铃薯|TC117743 莴苣|TC15801 77 543 2.30E-65*
马铃薯|TC117743 玉米|TC255367 67 444 1.30E-33*
马铃薯|TC117743 苜蓿|TC96175 68 804 4.20E-64*
马铃薯|TC117743 胡椒|TC5595 82 826 1.60E-121*
稻|TC268277 拟南芥|TC272322 63 1019 3.10E-66*
稻|TC268277 大麦|TC134680 78 1371 5.70E-179*
稻|TC268277 棉花|TC30779 64 1436 3.40E-101*
稻|TC268277 日本鲈鱼|TC17767 70 656 1.90E-61*
稻|TC268277 玉米|TC255367 81 860 4.50E-121*
稻|TC268277 玉米|TC272965 74 646 4.00E-68
稻|TC268277 苜蓿|TC96175 63 1684 3.00E-104*
稻|TC268277 胡椒|TC5595 65 600 5.50E-40*
稻|TC268277 马铃薯|TC117743 65 691 3.80E-45*
甘蔗|TC67974 拟南芥|TC272322 63 938 1.50E-59*
甘蔗|TC67974 大麦|TC134680 76 1294 2.60E-151*
甘蔗|TC67974 棉花|TC30779 66 876 5.10E-70 *
甘蔗|TC67974 日本鲈鱼|TC17767 69 656 4.70E-57 *
甘蔗|TC67974 莴苣|TC15801 66 390 4.70E-28 *
甘蔗|TC67974 玉米|TC255367 96 367 2.80E-72
甘蔗|TC67974 玉米|TC272965 90 649 2.20E-112 *
甘蔗|TC67974 苜蓿|TC96175 64 1140 7.80E-75 *
甘蔗|TC67974 胡椒|TC5595 66 471 1.80E-33 *
甘蔗|TC67974 马铃薯|TC117743 67 460 1.00E-35 *
甘蔗|TC67974 稻|TC268277 82 1338 1.20E-194 *
甘蔗|TC67974 高粱|TC103780 95 1359 8.70E-277 *
甘蔗|TC67974 大豆|TC229774 70 750 1.70E-67 *
高粱|TC103780 拟南芥|TC272322 63 1057 1.40E-65 *
高粱|TC103780 大麦|TC134680 75 1421 5.10E-163 *
高粱|TC103780 棉花|TC30779 64 1333 8.60E-91 *
高粱|TC103780 日本鲈鱼|TC17767 69 656 6.40E-57 *
高粱|TC103780 莴苣|TC15801 64 493 3.70E-30 *
高粱|TC103780 玉米|TC255367 92 948 1.70E-180 *
高粱|TC103780 玉米|TC272965 89 651 2.40E-110
高粱|TC103780 苜蓿|TC96175 62 1653 5.10E-96 *
高粱|TC103780 胡椒|TC5595 64 580 2.60E-36 *
高粱|TC103780 马铃薯|TC117743 65 602 6.50E-39 *
高粱|TC103780 稻|TC268277 80 1852 1.40E-260 *
大豆|TC229774 拟南芥|TC272322 72 757 1.10E-77 *
大豆|TC229774 大麦|TC134680 69 756 5.70E-67 *
大豆|TC229774 棉花|TC30779 78 737 3.40E-96 *
大豆|TC229774 日本鲈鱼|TC17767 90 495 4.10E-87 *
大豆|TC229774 莴苣|TC15801 77 249 1.90E-26 *
大豆|TC229774 玉米|TC255367 71 203 2.00E-15 *
大豆|TC229774 苜蓿|TC96175 87 717 2.10E-118 *
大豆|TC229774 胡椒|TC5595 76 308 1.50E-32 *
大豆|TC229774 马铃薯|TC117743 76 332 1.80E-35 *
大豆|TC229774 稻|TC268277 71 744 4.20E-74 *
大豆|TC229774 高粱|TC103780 69 757 1.30E-65*
西红柿|TC158378 拟南芥|TC272322 71 686 3.10E-64*
西红柿|TC158378 大麦|TC134680 65 907 8.80E-63*
西红柿|TC158378 棉花|TC30779 78 669 2.90E-86*
西红柿|TC158378 日本鲈鱼|TC17767 78 427 1.70E-52*
西红柿|TC158378 莴苣|TC15801 81 181 3.90E-21
西红柿|TC158378 玉米|TC272965 60 428 4.80E-14*
西红柿|TC158378 苜蓿|TC96175 68 908 4.60E-76*
西红柿|TC158378 胡椒|TC5595 84 243 6.40E-34
西红柿|TC158378 马铃薯|TC117743 96 264 8.90E-50*
西红柿|TC158378 稻|TC268277 66 897 1.70E-64*
西红柿|TC158378 甘蔗|TC67974 65 906 2.40E-60*
西红柿|TC158378 大豆|TC229774 74 700 4.80E-78*
西红柿|TC166426 拟南芥|TC272322 70 675 1.80E-62
西红柿|TC166426 大麦|TC134680 67 680 1.40E-54
西红柿|TC166426 棉花|TC30779 77 679 3.80E-85
西红柿|TC166426 日本鲈鱼|TC17767 77 440 1.30E-50
西红柿|TC166426 莴苣|TC15801 81 193 6.50E-23*
西红柿|TC166426 苜蓿|TC96175 73 675 1.30E-69
西红柿|TC166426 胡椒|TC5595 95 255 1.10E-46*
西红柿|TC166426 马铃薯|TC117743 85 276 2.40E-39
西红柿|TC166426 稻|TC268277 67 680 2.70E-55
西红柿|TC166426 甘蔗|TC67974 67 680 4.90E-53
西红柿|TC166426 高粱|TC103780 67 680 1.60E-53*
西红柿|TC166426 大豆|TC229774 73 680 2.30E-72
小麦|TC257477 大麦|TC134680 91 672 7.00E-119*
小麦|TC257477 玉米|TC272965 69 639 2.80E-49*
小麦|TC257477 稻|TC268277 68 647 4.10E-47*
小麦|TC257477 甘蔗|TC67974 67 648 4.10E-46*
小麦|TC257477 高粱|TC103780 69 648 4.20E-49*
小麦|TC257477 西红柿|TC158378 61 441 1.20E-18*
可以容易地发现SIK直向同源物和旁系同源物,和编码此类直向同源物和旁系同源物的核酸可用于实施本发明的方法。
直向同源物和旁系同源物可以通过开展所谓交互性blast搜索而容易地找到。这一般包括第一BLAST,所述第一BLAST参与提交查询序列(例如SEQ ID NO:209或SEQ ID NO:210)用于针对任一序列数据库(如公众可用的NCBI数据库,所述数据库可在如下网站找到:http://www.ncbi.nlm.nih.gov)的BLAST搜索。当从核苷酸序列开始时,通常使用BLASTN或TBLASTX(使用标准默认值),并且当从蛋白质序列开始时,可以使用BLASTP或TBLASTN(使用标准默认值)。任选地可以筛选BLAST结果。随后提交筛选结果和非筛选结果的全长序列以针对来自生物的序列进行反向BLAST(第二BLAST),其中查询序列来自所述的生物(其中在查询序列是SEQ ID NO:209或SEQ ID NO:210的情况下,第二BLAST因而将针对稻(Oryza)序列)。随后比较第一和第二BLAST搜索的结果。若来自第一BLAST的高阶位命中源自与查询序列从其中衍生的物种相同的物种,反向BLAST随后理想地以最高命中的查询序列中产生,则鉴定到旁系同源物;若第一BLAST的中的高阶位命中不源自与查询序列从其中衍生的物种相同的物种,并且优选地在反向BLAST时产生属于最高命中之列的查询序列,则鉴定到直向同源物。
高阶位命中是具有低E-值的那些命中。E-值越低,评分越显著(或换句话说,此命中因偶然而发生的几率越低)。E-值的计算是本领域众所周知的。除了E-值外,比较结果还由同一性百分数记分。同一性百分数指两个所比较核酸(或多肽)序列之间在特定长度范围内的相同核苷酸(或氨基酸)数目。优选评分大于50,更优选大于100;和优选E-值小于e-5,更优选小于e-6。在大型家族的情况下,可以使用ClustalW,随后使用邻接树法以便帮助显示相关基因的聚类和以便鉴定直向同源物和旁系同源物。
也可以使用下述BLAST程序鉴定直向同源物和旁系同源物。可以使用本领域公知的常规技术如序列比对容易地鉴定同源物(或同源物蛋白质,包括直向同源物和旁系同源物)。用于比对序列进行比较的方法是本领域众所周知的,此类方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP使用Needleman和Wunsch算法((1970)J Mol Biol 48:443-453)以找到使匹配数最大化并使空位数最小化的两个完整序列的比对。BLAST算法(Altschul等(1990)J Mol Biol 215:403-10)计算序列同一性百分数并执行对两个序列间相似性的统计分析。用于执行BLAST分析的软件是公众通过国家生物技术信息中心可获得的。同源物可以使用例如ClustalW多重序列比对算法(1.83版本)以默认配对比对参数和单位是百分数的评分方法而轻易地鉴定。同源物可以使用例如ClustalW多重序列比对算法(1.83版本)以默认配对比对参数和单位是百分数的评分方法而轻易地鉴定。相似性和同一性的全局百分数也可以使用在MatGAT软件包中可获得的方法之一而确定(Campanella等,BMC Bioinformatics.4,29,2003)。可以进行细微手工编辑以优化保守基序之间的比对,如本领域技术人员显而易见。此外作为使用全长序列以鉴定同源物的替代,也可以使用特定结构域。使用上文提及的程序,使用默认参数,针对整个SIK核酸序列或氨基酸序列测定了序列同一性值,下面以百分比表示所述序列同一性值。
优选地,由用于本发明方法中的SIK编码核酸编码的SIK多肽以增加的优选顺序与多肽SEQ ID NO:210具有至少40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的同一性。
备选地,可以使用特异的结构域确定同源物中的序列同一性。可以使用上面列出的用于蛋白质鉴定的数据库和工具、和/或用于供比较的序列比对的方法鉴定和阐明任意给出的结构域。在一些情况下,可以调整默认参数以调节搜索的严格性。例如使用BLAST,可以提高用于报告针对数据库序列的匹配的统计显著性阈值(称作“期望”值)以显示严格性较低的匹配。这样,可以鉴定几乎精确的短匹配。
SIK多肽可由于ATP-结合区、丝氨酸苏氨酸激酶活性位点标记、N-末端富含丝氨酸结构域和一个或多豆蔻酰化位点的存在而确定。术语“结构域”和“基序”如上文所定义。存在用于鉴定结构域的专业数据库,如SMART(Schultz等(1998)Proc.Natl.Acad.Sci.美国95,5857-5864;Letunic等(2002)Nucleic Acids Res 30,242-244)、InterPro(Mulder等,(2003)Nucl.Acids.Res.31,315-318)、Prosite(Bucher和Bairoch(1994),用于生物分子序列基序的广义图谱语法及其在自动化序列判读中的功能,(在)ISMB-94;第二届分子生物学智能系统国际会议文集.Altman R.,Brutlag D.,Karp P.,Lathrop R.,Searls D.编著,第53-61页,AAAIPress,Menlo Park;Hulo等,Nucl.Acids.Res.32:D134-D137,(2004))或Pfam(Bateman等,Nucleic Acids Research 30(1):276-280(2002))鉴定。用于计算机芯片上分析蛋白质序列的一组工具可在ExPASY蛋白质组学服务器上获得(在Swiss Institute of Bioinformatics上驻留(Gasteiger等,ExPASy:用于深入认识和分析蛋白质的蛋白组学服务器,Nucleic AcidsRes.31:3784-3788(2003))。然而,通过推定的SIK多肽和本领域已知的SIK多肽的序列比对也可以容易地鉴定到所述多种结构域。
也用于本发明方法的是由SEQ ID NO:210所示的SIK多肽的同源物,或如上文定义的其直向同源物和旁系同源物的同源物的编码核酸。
也用于本发明方法的是由SEQ ID NO:210的衍生物的编码核酸或SEQ ID NO:210的直向同源物、旁系同源物或同源物的衍生物的编码核酸。
本文定义的SIK多肽的编码核酸不需要是全长核酸,因为本发明方法的实施不依赖全长核酸序列的使用。适合用于实施本发明方法的核酸实例包括表8和表9中给出的核酸序列,但不限于那些序列。核酸变体可用于实施本发明的方法。这样的核酸变体实例包括如本文定义的SIK多肽的编码核酸的部分、如本文定义的SIK多肽的编码核酸的剪接变体、如本文定义的SIK多肽的编码核酸的等位变体和通过基因改组获得的如本文定义的SIK多肽的编码核酸的变体。术语部分、剪接变体、等位变体和基因改组如文中所述。
本发明提供相对于对照植物增加每株植物花数的方法,其包括在植物中引入和表达表8或表9中给出的任一核酸序列的部分、或表8或表9中给出的任意氨基酸序列的直向同源物、旁系同源物或同源物的编码核酸的部分。
用于本发明方法的部分编码多肽,所述多肽与表8或表9中给出的任意氨基酸序列所表示的SIK多肽具有基本上相同的生物学活性。优选地,部分是表8或表9中给出的任一核酸的部分、由SEQ ID NO:213至225所表示的任一核酸序列的部分。部分通常长度至少为300个连续核苷酸,优选长度至少为400个连续核苷酸,更优选长度至少为500个连续核苷酸,所述连续核苷酸是表8和表9中给出的任一核酸序列或由SEQ ID NO:213至225所表示的任一核酸序列。最优选的部分是核酸SEQ ID NO:209的部分。优选地,部分编码氨基酸序列,所述氨基酸序列包括ATP-结合区、丝氨酸苏氨酸激酶活性位点标记、N-末端富含丝氨酸结构域、一个或多豆蔻酰化位点中任一种或多种,且具有激酶活性。
如本文所定义的SIK多肽的编码核酸的部分可以通过对核酸进行一个或多个缺失来制备部分。部分可以以分离的形式使用,或者可将其与其他编码(或非编码)序列融合,以便,例如,生产组合了若干活性的蛋白质。当与其他编码序列融合时,经翻译后所产生的多肽可能比预测的部分要大。
用于本发明的另一核酸变体是在降低的严格条件下、优选在严格条件下,能够与本文所定义的SIK多肽的编码核酸或与本文所定义的部分杂交的核酸。
用于本发明方法的杂交序列编码多肽,所述多肽与表8或表9中给出的任意氨基酸序列所表示的SIK多肽具有基本上相同的生物学活性。杂交序列通常长度至少为300个连续核苷酸,优选长度至少为400个连续核苷酸,更优选长度至少为500个连续核苷酸,所述连续核苷酸是表8和表9中给出的任一核酸序列。优选地,杂交序列是能够与表8或表9中给出的任意核酸杂交的序列、或与任意这些序列的部分杂交的序列,所述部分如上文定义。最优选的杂交序列是能够与SEQ ID NO:209所表示的核酸或其部分杂交。优选地,杂交序列编码氨基酸序列,所述氨基酸序列包括ATP-结合区、丝氨酸苏氨酸激酶活性位点标记、N-末端富含丝氨酸结构域、一个或多豆蔻酰化位点中任一种或多种,且具有激酶活性。
本发明提供增加每株植物花数的方法,所述方法包括在植物中引入和表达能够与表8或表9中给出的任一核酸或SEQ ID NO:213至225所表示的任一核酸序列杂交的核酸、或包括在植物中引入和表达能够与表1或表2中给出的任意核酸序列或SEQ ID NO:213至225所表示的任一核酸序列的直向同源物、旁系同源物或同源物的编码核酸杂交的核酸。
用于本发明方法的另一核酸变体是编码如上文定义的SIK多肽的剪接变体,术语“剪接变体”如上文定义。
本发明提供增加每株植物花数的方法,所述方法包括在植物中引入和表达表8或表9中给出的任一核酸序列的剪接变体或由SEQ ID NO:213至225所表示的任一核酸的剪接变体、或表8或表9中给出的任意氨基酸序列或由SEQ ID NO:213至225所表示的任一核酸序列的直向同源物、旁系同源物或同源物的编码核酸的剪接变体。
优选的剪接变体是由SEQ ID NO:209所表示的核酸的剪接变体或编码SEQ ID NO:210的直向同源物或旁系同源物的剪接变体。优选,剪接变体编码的氨基酸ATP-结合区、丝氨酸苏氨酸激酶活性位点标记、N-末端富含丝氨酸结构域、一个或多豆蔻酰化位点中任一种或多种,且具有激酶活性。
用于实施本发明方法的另一种核酸变体是编码如上文所定义的SIK多肽的编码核酸的等位变体。
本发明提供增加每株植物花数的方法,所述方法包括在植物中引入和表达表8或表9中给出的任一核酸或由SEQ ID NO:213至225所表示的任一核酸序列的等位变体、或在植物中引入和表达表8或表9中给出的任意氨基酸序列或由SEQ ID NO:213至225所表示的任一核酸序列的直向同源物、旁系同源物或同源物的编码核酸的等位变体。
优选的等位变体是SEQ ID NO:209的等位变体或SEQ ID NO:210的直向同源物或旁系同源物的编码核酸的等位变体。优选地,等位变体编码的氨基酸包括ATP-结合区、丝氨酸苏氨酸激酶活性位点标记、N-末端富含丝氨酸结构域、一个或多豆蔻酰化位点中任一种或多种,且具有激酶活性。
用于本发明方法中的另一核酸变体是通过基因改组而获得的核酸变体。也可以使用基因改组或定向进化来产生编码SIK多肽的核酸变体。
本发明提供增加每株植物花数的方法,所述方法包括在植物中引入和表达表8或表9中给出的任一核酸序列或由SEQ ID NO:213至225所表示的任一核酸序列的变体、或在植物中引入和表达表8或表9中给出的任意氨基酸序列或由SEQ ID NO:213至225所表示的任一核酸序列的直向同源物、旁系同源物或同源物的编码核酸的变体,所述变体核酸通过基因改组获得。优选地,通过基因改组获得变体核酸编码氨基酸,所述氨基酸ATP-结合区、丝氨酸苏氨酸激酶活性位点标记、N-末端富含丝氨酸结构域、一个或多豆蔻酰化位点中任一种或多种,且具有激酶活性。
此外,可以通过位点定向诱变获得核酸变体。几种方法可用于实现位点定向诱变;最常用的是基于PCR的方法(Current Protocols in MolecularBiology.Wiley编著)。
编码SIK样多肽的SIK核酸可以来自任何天然或人工的来源。可以通过仔细的人为操作在组成和/或基因组环境上修饰所述SIK核酸的天然形式。优选SIK编码核酸来自植物,又优选源自单子叶植物,更优选源自禾本科(Poaceae),最优选核酸来自稻。
因此本文任何SIK多肽的引用意指如上文定义的SIK多肽。编码此类SIK多肽的任意SIK核酸适合用于实施本发明方法以增加每株植物花数。
本发明也包括通过本发明方法可获得的植物或其部分(包括种子)。所述植物或其部分包括如上文定义的编码SIK多肽的核酸转基因。
本发明还提供遗传构建体和载体以促进在植物中引入和/或表达用于本发明方法中的SIK核酸序列。
因而,提供基因构建体,其包含:
(i)如上面所定义的SIK核酸或SIK编码核酸;
(ii)一个或多个与(i)的SIK核酸有效连接的调控序列。
在减少或基本去除SIK核酸以产生增加的千粒重、增加的收获指数和增加的饱满率的情况下,优选的构建体是一种这样的构建体,其包括SIK核酸的反向重复,优选能够形成发夹结构的反向重复,所述反向重复受组成型启动子的调控。
用于本发明方法中的构建体可以使用本领域技术人员众所周知的重组DNA技术构建。该基因构建体可以插入适于转化至植物内并适于在转化的细胞中转录目的基因的市售载体。本发明也提供如上文所定义的基因构建体在本发明方法中的用途。
植物用包含目的序列的载体转化。技术人员非常了解为成功转化、选择和增殖含有目的序列的宿主细胞而必须于载体上存在的遗传元件。目的序列有效地与一种或多种调控序列(至少与启动子)连接。术语“调节元件”、“调控序列”和“启动子”在本文都可交换使用且在上文定义。
有利地,本发明方法中可以使用任意型启动子。术语”启动子”指位于基因转录起点上游并参与识别及结合RNA聚合酶和其他蛋白质,因而指导有效连接的核酸转录的核酸调控序列。启动子可以是组成型启动子。备选地,启动子可以是诱导性启动子。此外或备选地,启动子可以是组织特异性启动子。仅能在特定组织中启动转录的启动子本文称作“组织特异的”,类似地,仅在特定细胞中启动转录的启动子本文称作“细胞特异的”。
优选地,核酸序列与组成型启动子有效连接。优选启动子来源于植物,还优选来源于单子叶植物如果单子叶植物被转化。又优选组成型启动子是由基本上类似于SEQ ID NO:56或226的核酸序列表示的GOS2启动子。最优选GOS2启动子是如SEQ ID NO:56或226所表示的。应当明白本发明的适用性不限于由SEQ ID NO:209代表的SIK核酸序列,同时本发明的适用性也不限于由GOS2启动子驱动时SIK核酸的表达。也可以用来驱动编码SIK核酸序列表达的其他组成型启动子的实例上文显示。
任选地,一种或多种终止子序列可以在引入植物的构建体中使用。额外调节元件可包括转录及翻译强化子。本领域技术人员会意识到可以适用于实施本发明的终止子和强化子序列。内含子序列也可以添加至5′非翻译区(UTR)或编码序列中,以增加在胞浆内积累的成熟信息的量。其他调控序列(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区之外)可以是蛋白质和/或RNA稳定化元件。本领域技术人员会知道或可以轻易地获得此类序列。
本发明的遗传构建体还可以包括需要用于在特定细胞类型中维持和/或复制的复制序列起点。一个实例是当需要将遗传构建体在细菌细胞中维持为附加型遗传元件(例如质粒或粘粒分子)时。优选的复制起点包括,但不限于f1-ori和colE1。
为检测如在本发明方法中所用核酸序列的成功转移和/或选择包含这些核酸的转基因植物,使用标记基因(或报道基因)是有利的。因而,遗传构建体可以任选地包含选择性标记基因。在本文“定义”部分更详细地描述了选择性标记。该标记基因当其不再需要时,可从转基因细胞移除或切除。移除标记的技术是本领域已知的,有用的技术描述于上面的“定义”部分。
还可以通过将遗传修饰引入SIK基因座调节SIK核酸或SIK多肽的表达。本文定义的基因座意指基因区,所述基因区包括目的基因和基因编码区上游或下游10kb。
例如,可以通过任一(或多种)如下方法引入所述遗传修饰:T-DNA激活、TILLING、和同源重组。引入遗传修饰之后的步骤是选择合适的受调节的表达。
本发明方法有利地适用于任何植物。特别用于本发明方法中的植物包括属于植物界超家族的全部植物,尤其单子叶植物和双子叶植物,包括选自以下的饲用或饲料豆类、观赏植物、粮食作物、树或灌木。根据本发明优选的实施方案,植物是作物植物。作物植物的实例包括大豆、向日葵、卡诺拉油菜、苜蓿、油菜、棉花、番茄、马铃薯和烟草。还优选地,植物是单子叶植物。单子叶植物的实例包括甘蔗。更优选地,植物是谷物。谷物的实例包括稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱和燕麦。
其他有利的植物选自菊科(Asteraceae)如向日葵属(Helianthus)、万寿菊属例如物种向日葵[向日葵(sunflower)]、香叶万寿菊(Tagetes lucida)、万寿菊(Tagetes erecta)或细叶万寿菊(Tagetes tenuifolia)[Marigold]、十字花科(Brassicaceae)如芸苔属(Brassica)、拟南芥属,例如物种欧洲油菜、芜芜青[卡诺拉油菜、油菜、蔓青]、或拟南芥;豆科(Fabaceae)如大豆属例如物种大豆、大豆(Soja hispida)或大豆(Soja max)[大豆];亚麻科(Linaceae)如亚麻属(Linum)例如物种亚麻[亚麻(flax、linseed)];禾本科如大麦属(Hordeum)、黑麦属(Secale)、燕麦属(Avena)、高粱属(Sorghum)、稻属(Oryza)、玉蜀黍属(Zea)、小麦属(Triticum)例如物种大麦[大麦]、黑麦[rye]、燕麦、燕麦(Avena fatua)、野燕麦、比赞燕麦、Avena fatua var.sativa、杂种燕麦[oat]、两色蜀黍[高粱、粟]、稻、阔叶稻[稻]、玉蜀黍[玉米、玉米]、普通小麦、硬粒小麦、圆柱小麦、Triticum hybernum、马卡小麦、普通小麦(Triticum sativum)或普通小麦(Triticum vulgare)[小麦、面包小麦、普通小麦];茄科(Solanaceae)如茄属(Solanum)、番茄属(Lycopersicon)例如马铃薯[马铃薯]、番茄(Lycopersicon esculentum、Lycopersiconlycopersicum、Lycopersicon pyriforme、Solanum integrifolium或Solanumlycopersicum)[西红柿(tomato)]。
本发明也包括用可根据本发明的方法获得的植物。本发明因此提供用可根据本发明的方法获得的植物、其植物部分或植物细胞,所述植物或其部分或细胞包含SIK核酸转基因(其可以编码如上文定义的SIK多肽)。
本发明还提供用于产生具有上面提到的各种改良的产量相关性状的转基因植物的方法,其包括在植物中引入和表达如定义的SIK核酸。
宿主植物对于本发明方法中所用核酸或载体、表达盒或构建体或载体而言原则上有利地是能够合成本发明方法中所用多肽的全部植物。
更具体地,本发明提供用于产生相对于对照植物具有各种改良的产量相关性状的转基因植物,所述方法包括:
(i)在植物细胞中引入和表达SIK核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞;
(ii)得到具有增加的每株植物花数的植物。
还提供用于产生相对于对照植物具有多种改良的产量相关性状的转基因植物,所述方法包括:
(i)在植物细胞中引入用于下调节SIK基因表达的构建体;和
(ii)在促进植物生长和发育的条件下培养植物细胞;
(ii)得到具有增加的千粒重、增加的收获指数和增加的饱满率中的一项或多项的植物。
核酸可以直接引入植物细胞或引入植物本身(包括引入组织、器官或植物的任何其他部分)。根据本发明的优选特征,核酸优选地通过转化引入植物。还优选用于减量调节SIK基因表达且被引入植物细胞或植物中的构建体包含SIK核酸或其部分的反向重复。
通常在转化后,选择一种或多种标记存在的植物细胞或细胞群体,其中所述的标记由与目的基因一起共转移的植物可表达的基因编码,随后将转化的材料再生成整株植物。
如所提到的那样,用本发明表达载体转化的农杆菌也可以以其自身已知的方法来转化植物,如实验植物,像拟南芥或作物植物,例如像谷类、玉米、燕麦、黑麦、大麦、小麦、黄豆(soya)、稻、棉花、甜菜、芸苔、向日葵、亚麻、大麻、马铃薯、烟草、番茄、胡萝卜、甜椒、油菜籽油菜、木薯淀粉、木薯、竹芋、万寿菊、苜蓿、生菜和多种树木、坚果和葡萄藤物种,特别是含油作物植物,如黄豆、花生、蓖麻油植物、向日葵、玉米、棉花、亚麻、油菜籽油菜、椰子、油椰、红花(Carthamus tinctorius)、可可豆,例如通过在农杆菌溶液中水浴划破的叶子或叶节,随后在合适的培养基中培养之。
遗传修饰的植物细胞可通过本领域技术人员熟悉的所有方法再生。合适的方法可见于S.D.Kung和R Wu、Potrykus或
和Willmitzer的上述出版物。
为了选择转化的植物,在转化中获得的植物材料原则上接受选择条件处理,以至于转化的植物可以与未转化的植物区分。例如,以上文所述方式获得的种子可以播种,在初始培育时期后,通过喷雾进行合适的选择。另一种可能性包括在使用合适选择剂的琼脂平板上生长种子(根据需要在消毒之后),使得仅转化的种子可以生长成植物。或者,转化的植物通过上述那些选择标记的存在筛选。
在DNA转移和再生后,推测的转化植物可以例如使用Southern分析对目的基因的存在、拷贝数和/或基因组构造进行评价。备选或额外地,表达水平可以使用Northern和/或Western、或定量PCR分析进行监测,所有技术是本领域技术人员众所周知的。
产生的转化植物可以通过多种方法加以增殖,如通过克隆增殖法或经典育种技术。例如,第一代(或T1)转化植物可以进行自交,以提供纯合的第二代(或T2)转化体,并且T2植物通过经典育种技术进一步增殖。
产生的转化生物可以采取多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆转化体(例如被转化以含有表达盒的全部细胞);转化组织和未转化组织的移植体(例如在植物中,与未转化嫩枝嫁接的转化的根状茎)。
本发明明确地扩展至通过文中所述的任意方法产生的任何植物细胞或植物,并扩展至全部植物部分及其繁殖体。本发明进一步扩展至包含已经通过任意前述方法产生的原代转化或转染细胞、组织、器官或整株植物的后代,唯一要求是后代表现与通过本发明方法中的亲代所产生的那些后代相同的一种或多种基因型特征和/或表型特征。
本发明也包括宿主细胞,其含有分离的如上文定义的SIK核酸。本发明优选的宿主细胞是植物细胞。宿主植物对于本发明方法中所用核酸或载体、表达盒或构建体或载体而言原则上有利地是能够合成本发明方法中所用多肽的全部植物。
本发明也扩展至植物的可收获部分如,但不限于种子、叶、果实、花、茎、根状茎、块茎和球茎。本发明进一步涉及来自,优选直接来自这种植物的可收获部分中的产物,如干燥颗粒或粉末、油、脂肪及脂肪酸、淀粉或蛋白质。
本发明也包括SIK核酸和SIK多肽在改良如上文提到的多种产量相关性状中的用途。
编码SIK多肽的核酸可以用于育种程序中,其中鉴定到可以遗传地与SIK基因连接的DNA标记。所述的核酸/基因可以用来定义分子标记。这种DNA标记随后可以在育种程序中用来选择在本发明方法中具有如上文定义的增加的产量的植物。
SIK核酸/基因的等位变体也可以用于标记辅助的育种程序中。这种育种程序有时需要通过使用例如EMS诱变法对植物进行诱变处理而引入等位基因变异;备选地,该程序可以从非人为引起的所谓“自然”起源的一组等位变体开始。随后进行等位变体的鉴定,例如通过PCR法。此后是用于选择所讨论及导致增加产量的序列的优异等位变体的步骤。一般通过监测含有所讨论序列的不同等位变体的植物的生长性能而实施选择。可以在温室中或田间监测生长性能。其他任选步骤包括将鉴定了优异等位变体的植物与另一种植物杂交。这可以用来例如产生目标表型特征的组合。
SIK核酸也可以用作探针以便对基因进行遗传作图或物理作图,所述探针作为所述基因的一部分及与这些基因关联的性状的标记。此类信息可以用于植物育种中,以便开发具有想要表型的株系。SIK核酸的这种用途仅需要具有至少15个核苷酸长度的核酸序列。SIK核酸可以用作限制性片段长度多态性(RFLP)标记。限制性消化的植物基因组DNA的Southern印迹(Sambrook J,Fritsch EF和Maniatis T(1989)Molecular Cloning,ALaboratory Manual)可以用SIK核酸探测。产生的结合图式随后可以使用计算机程序如MapMaker(Lander等人(1987)Genomics 1:174-181)进行遗传分析以构建遗传图。此外,该核酸可以用来探测含有经限制性内切核酸酶处理的一组个体的基因组DNA的Southern印迹,其中所述的一组个体代表具有确定的遗传杂交的亲代和后代。DNA多态性的分离被标出并用来计算SIK核酸在使用这个群体先前所获得的遗传图中的位置(Botstein等人(1980)Am.J.Hum.Genet.32:314-331)。
在Bernatzky和Tanksley(Plant Mol.Biol.Reporter 4:37-41,1986)中描述了植物基因衍生的探针的产生和其在遗传作图中的用途。众多出版物描述了使用以上所提及的方法学或其改良方法对特定cDNA克隆的遗传作图。例如,F2互交群、回交群、随机交配群、邻近纯合系和其他个体群体可以用于作图。此类方法学是本领域技术人员众所周知的。
所述核酸探针也可以用于物理作图(即序列在物理图上的排列;见Hoheisel等在:Non-mammalian Genomic Analyasis:A Practical Guide,Academic press 1996,第319-346页及其中引用的参考文献)。
在另一实施方案中,核酸探针可以在直接荧光原位杂交(FISH)作图法(Trask(1991)Trends Genet.7:149-154)中使用。尽管当前的FISH作图法支持使用大型克隆(几个kb至几百个kb;见Laan等人(1995)Genome Res.5:13-20),然而灵敏度的改善可以允许使用更短探针进行FISH作图。
用于遗传作图及物理作图的多种基于核酸扩增的方法可以使用所述核酸而实施。实例可见于文中的“定义”部分。实例包括等位基因特异性扩增(Kazazian(1989)J.Lab.Clin.Med 11:95-96)、PCR扩增片段的多态性(CAPS;Sheffield等,(1993)Genomics 16:325-332)、等位基因特异性连接(Landegren等,(1988)Science 241:1077-1080)、核苷酸延伸反应(Sokolov(1990)Nucleic Acid Res.18:3671)、放射杂交作图(Walter等人,(1997)Nat.Genet.7:22-28)和Happy作图(Dear和Cook,(1989)Nucleic Acid Res.17:6795-6807)。为实施这些方法,使用核酸序列设计和产生用于扩增反应或引物延伸反应的引物对。这类引物的设计是本领域技术人员众所周知的。使用基于PCR的遗传作图的方法,可能需要鉴定跨越相应于本发明核酸序列区域作图的亲本之间DNA序列的差异。然而,这对作图方法通常不是必要的。
本发明方法产生具有如前文所述的具有改良的产量相关性状的植物。这些有性状也可以与经济上有利的其他性状组合,如其他的产量增加性状、对其他非生物和生物胁迫的耐受性、调节各种构造性特征和/或生物化学特征和/或生理学特征的性状。
II类HD-Zip转录因子的详细描述
现已发现编码II类HD-Zip转录因子的核酸用于改良种子中储藏物的含量。因此本发明也提供通过调节编码II类HD-Zip转录因子的核酸在植物中的表达,相对于对照植物改良种子中储藏物的含量的方法。本发明还提供用于实施此类方法的核酸序列和构建体。本发明进而提供相对于对照植物具有改良的储藏物含量的种子,所述种子具有受调节的编码II类HD-Zip转录因子的核酸的表达。
本发明提供相对于对照植物改良种子中储藏物的含量的方法,所述方法包括调节编码II类HD-Zip转录因子的核酸在植物中的表达。
用于调节(优选增加)编码II类HD-Zip转录因子的核酸的表达的优选方法是通过在植物中引入和表达如此处所定义的编码II类HD-Zip转录因子的核酸。
“II类HD-Zip转录因子”意指包括如下的多肽:(i)同源域框;(ii)亮氨酸拉链;和(iii)以下给出的基序I、II和III(以任意顺序)。
基序I(SEQ ID NO:279)
RKKLRL、或在任意位点具有一个或多个保守氨基酸取代的基序I、和/或在任意位点具有一个或两个非保守改变的基序I;和
基序II(SEQ ID NO:280)
TKLKQTEVDCEFLRRCCENLTEEN、或在任意位点具有一个或多个保守氨基酸取代的基序II、和/或与基序II以增加的优选顺序具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更高序列同一性的基序;和
基序III(SEQ ID NO:281)
TLTMCPSCER、或在任意位点具有一个或多个保守氨基酸取代的基序III、和/或在任意位点具有一个、两个或三个非保守改变的基序III。
本文对“编码II类HD-Zip转录因子的核酸”或II类HD-Zip编码核酸的任意引用意指如上文定义的编码II类HD-Zip转录因子的核酸,此类核酸用于实施本发明方法。
如所提到的,用于调节(优选增加)编码II类HD-Zip转录因子的核酸的表达的优选方法是通过在植物中引入和表达编码II类HD-Zip转录因子的核酸。
本发明通过用SEQ ID NO:229所表示的编码多肽序列SEQ ID NO:230的核酸序列转化的植物举例说明。然而,本发明的实施不限于这些序列;可以有利地使用如本文定义的任意II类HD-Zip转录因子编码核酸或II类HD-Zip转录因子实施本发明方法。
例如,编码由SEQ ID NO:230所表示的氨基酸序列的直向同源物或旁系同源物的核酸可以用于实施本发明方法。在实施例1的表A中提供此类直向同源物和旁系同源物的实例。
直向同源物和旁系同源物包含用来描述基因祖先关系的进化概念。旁系同源物是相同物种内起源于先祖基因复制的基因;直向同源物是通过物种起源来自不同生物的基因。
直向同源物和旁系同源物可以通过开展所谓交互性blast搜索而容易地找到。这一般包括第一BLAST,所述第一BLAST参与提交查询序列(例如SEQ ID NO:229 or SEQ ID NO:230)用于针对任一序列数据库(如公众可用的NCBI数据库,所述数据库可在如下网站找到:http://www.ncbi.nlm.nih.gov)的BLAST搜索。当从核苷酸序列开始时,通常使用BLASTN或TBLASTX(使用标准默认值),并且当从蛋白质序列开始时,可以使用BLASTP或TBLASTN(使用标准默认值)。任选地可以筛选BLAST结果。随后提交筛选结果和非筛选结果的全长序列以针对来自生物的序列进行反向BLAST(第二BLAST),其中查询序列来自所述的生物(其中在查询序列是SEQ ID NO:229或SEQ ID NO:230的情况下,第二BLAST因而将针对稻序列)。随后比较第一和第二BLAST搜索的结果。若来自第一BLAST的高阶位命中源自与查询序列从其中衍生的物种相同的物种,反向BLAST随后理想地以最高命中的查询序列中产生,则鉴定到旁系同源物;若第一BLAST的中的高阶位命中不源自与查询序列从其中衍生的物种相同的物种,并且优选地在反向BLAST时产生属于最高命中之列的查询序列,则鉴定到直向同源物。高阶位命中是具有低E-值的那些命中。E-值越低,评分越显著(或换句话说,此命中因偶然而发生的几率越低)。E-值的计算是本领域众所周知的。除了E-值外,比较结果还由同一性百分数记分。同一性百分数指两个所比较核酸(或多肽)序列之间在特定长度范围内的相同核苷酸(或氨基酸)数目。在大型家族的情况下,可以使用ClustalW,随后使用邻接树法以便帮助显示相关基因的聚类和以便鉴定直向同源物和旁系同源物。
编码由SEQ ID NO:230所表示的氨基酸序列的同源物的核酸、或编码表H中给出的任意氨基酸序列的同源物的核酸可以用于实施本发明方法。
还用于本发明方法的是编码表H中给出的任一氨基酸的衍生物或表H中给出的任意氨基酸序列的直向同源物或旁系同源物的衍生物的核酸。“衍生物”包括这样的肽、寡肽、多肽,其中与天然发生形式的蛋白质(如由SEQID NO:230所表示的蛋白)的氨基酸序列相比,它们包含以非天然发生的氨基酸残基对氨基酸的取代或非天然发生的氨基酸残基的添加。
可以使用本领域公知的常规技术如序列比对容易地鉴定同源物(或同源物蛋白质,包括直向同源物和旁系同源物)。用于比对序列进行比较的方法是本领域众所周知的,此类方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP使用Needleman和Wunsch算法((1970)J Mol Biol48:443-453)以找到使匹配数最大化并使空位数最小化的两个完整序列的比对。BLAST算法(Altschul等(1990)J Mol Biol 215:403-10)计算序列同一性百分数并执行对两个序列间相似性的统计分析。用于执行BLAST分析的软件是公众通过国家生物技术信息中心可获得的。同源物可以使用例如ClustalW多重序列比对算法(1.83版本)以默认配对比对参数和单位是百分数的评分方法而轻易地鉴定。同源物可以使用例如ClustalW多重序列比对算法(1.83版本)以默认配对比对参数和单位是百分数的评分方法而轻易地鉴定。相似性和同一性的全局百分数也可以使用在MatGAT软件包中可获得的方法之一而确定(Campanella等,BMC Bioinformatics.4,29,2003)。可以进行细微手工编辑以优化保守基序之间的比对,如本领域技术人员显而易见。此外作为使用全长序列以鉴定同源物的替代,也可以使用特定结构域。
使用ClustalW和默认参数,针对整个核酸序列或氨基酸序列测定了序列同一性值,下面以百分比表示所述序列同一性值。
优选地,由用于本发明方法的核酸编码的多肽(如表H中给出的任意多肽序列)以增加的优选顺序与SEQ ID NO:230的多肽具有至少40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的同一性。
本发明提供相对于对照植物改良种子中储藏物的含量的方法,所述方法包括调节由SEQ ID NO:2或其直向同源物、旁系同源物或同源物所表示的II类HD-Zip转录因子的编码核酸在植物中的表达。
用于调节(优选增加)II类HD-Zip转录因子的编码核酸的表达的优选方法是通过在植物中引入和表达由SEQ ID NO:230所表示的II类HD-Zip转录因子的编码核酸,或其直向同源物、旁系同源物或同源物的编码核酸。
上述直向同源物、旁系同源物和同源物落入II类HD-Zip转录因子的定义内,即意指直向同源物、旁系同源物和同源物是包含如下的多肽:(i)同源域盒;(ii)亮氨酸拉链;和(iii)本文所述的基序I、II和III。
可以使用多种结构域和基序帮助鉴定用于本发明方法中的序列。存在用于鉴定结构域的专业数据库,例如,SMART(Schultz等(1998)Proc.Natl.Acad.Sci.美国95,5857-5864;Letunic等(2002)Nucleic Acids Res 30,242-244)、InterPro(Mulder等,(2003)Nucl.Acids.Res.31,315-318)、Prosite(Bucher和Bairoch(1994),用于生物分子序列基序的广义图谱语法及其在自动化序列判读中的功能,(在)ISMB-94;第二届分子生物学智能系统国际会议文集.Altman R.,Brutlag D.,Karp P.,Lathrop R.,Searls D.编著,第53-61页,AAAIPress,Menlo Park;Hulo等,Nucl.Acids.Res.32:D134-D137,(2004))或Pfam(Bateman等,Nucleic Acids Research 30(1):276-280(2002))鉴定。还可以使用常规技术,如本文所述的序列比对鉴定结构域和基序。
用于本发明方法的核酸不需要是全长核酸,因为本发明方法的实施不依赖全长核酸序列的使用。实例包括由SEQ ID NO:229表示的核酸序列的部分或表H中给出的任一核酸序列的部分。
本发明提供相对于对照植物改良种子中储藏物的含量的方法,所述方法包括调节由SEQ ID NO:229所表示的核酸序列的部分在植物中的表达,或包括调节表H中给出的任一核酸序列的部分在植物中的表达,或包括调节表H中给出的任意氨基酸序列的直向同源物、旁系同源物或同源物的编码核酸序列的部分在植物中的表达。
用于调节(优选增加)此类部分在植物中的表达的优选方法是通过在植物中引入和表达表H中给出的核酸序列的部分,或包括在植物中引入和表达表H中给出的任意多肽序列的直向同源物、旁系同源物或同源物的编码核酸序列的部分。
用于本发明方法的部分包括长度足以编码落入II类HD-Zip转录因子定义内的多肽的部分,即意指包含如下的多肽:(i)同源域盒;(ii)亮氨酸拉链;和(iii)本文所述的基序I、II和III。此外,此类部分与II类HD-Zip转录因子具有基本相同的生物学活性。
优选地,部分长度至少为500个连续核苷酸,优选长度至少为750个连续核苷酸,更优选长度至少为1250个连续核苷酸,所述连续核苷酸是SEQID NO:229、或表H中给出的任一核酸序列、或表H中给出的任意氨基酸序列的直向同源物、旁系同源物或同源物的任意编码核酸。最优选的部分是核酸SEQ ID NO:229的部分。
如本文所定义的部分可以通过对所讨论核酸进行一个或多个缺失来制备部分。部分可以以分离的形式使用,或者可将其与其他编码(或非编码)序列融合,以便,例如,生产组合了若干活性的蛋白质。当与其他编码序列融合时,经翻译后所产生的多肽可能比预测的部分要大。
用于本发明方法的另一核酸是这样的核酸,在降低的严格条件下、优选在中等严格条件下、更优选在严格条件下,其能够与SEQ ID NO:229所表示的核酸杂交,或在降低的严格条件下、优选在中等严格条件下、更优选在严格条件下,其能够与表H给出的核酸序列杂交,或在降低的严格条件下、优选在中等严格条件下、更优选在严格条件下,其能够与表H中给出的任意多肽序列的直向同源物、旁系同源物或同源物的编码核酸杂交。
本发明提供相对于对照植物改良种子中储藏物的含量的方法,所述方法包括调节能够与由SEQ ID NO:229所表示的核酸杂交的核酸在植物中的表达,或包括调节能够与表H中给出的核酸序列杂交的核酸在植物中的表达,或包括调节能够与表H中给出的任意多肽序列的直向同源物、旁系同源物或同源物的编码核酸序列杂交的核酸在植物中的表达。最优选杂交序列能够与由SEQ ID NO:229所表示的核酸杂交。杂交序列优选能够在降低的严格条件下、优选在中等严格条件下、更优选在严格条件下杂交。
用于调节(优选增加)此类杂交序列在植物中的表达的优选方法是通过在植物中引入和表达能够与表H中给出的核酸序列杂交的核酸,或包括在植物中引入和表达能够与表H中给出的任一氨基酸序列的直向同源物、旁系同源物或同源物的编码核酸序列杂交的核酸序列。最优选杂交序列能够与由SEQ ID NO:229所表示的核酸杂交。杂交序列优选能够在降低的严格条件下、优选在中等严格条件下、更优选在严格条件下杂交。
用于本发明方法的杂交序列包括长度足以编码落入II类HD-Zip转录因子定义内的多肽的核酸,即意指包含如下的多肽:(i)同源域盒;(ii)亮氨酸拉链;和(iii)本文所述的基序I、II和III。此外,此类杂交序列与II类HD-Zip转录因子具有基本相同的生物学活性。
杂交序列通常长度至少为500个连续核苷酸,优选长度至少为750个连续核苷酸,更优选长度至少为1250个连续核苷酸,所述连续核苷酸是能够与表H中给出的核酸序列杂交的任意核酸、或是表H中给出的任一氨基酸序列的直向同源物、旁系同源物或同源物的任意编码核酸。最优选连续核苷酸是具有能够与由SEQ ID NO:229所表示的核酸杂交的核酸,或其部分杂交的核酸。
用于本发明方法的另一核酸是SEQ ID NO:229的剪接变体,或表H中给出的任意核酸序列的剪接变体,或表H给出的任一氨基酸序列的直向同源物、旁系同源物或同源物的编码核酸的剪接变体。
本发明提供相对于对照植物改良种子中储藏物的含量的方法,所述方法包括调节由SEQ ID NO:229所表示的核酸的剪接变体在植物中的表达,或包括调节表H中给出的核酸序列的剪接变体在植物中的表达,或包括调节表H中给出的任一氨基酸序列的直向同源物、旁系同源物或同源物的编码核酸序列的剪接变体在植物中的表达。
用于调节(优选增加)此类剪接变体在植物中的表达的优选方法是通过在植物中引入和表达表H中给出的核酸序列的剪接变体,或包括在植物中引入和表达表H中给出的任一氨基酸序列的直向同源物、旁系同源物或同源物的编码核酸序列的剪接变体。
用于本发明方法的剪接变体包括长度足以编码落入II类HD-Zip转录因子定义内的多肽的核酸,即意指包含如下的多肽:(i)同源域盒;(ii)亮氨酸拉链;和(iii)本文所述的基序I、II和III。此外,此类剪接变体与II类HD-Zip转录因子具有基本相同的生物学活性。
用于实施本发明方法的另一核酸是SEQ ID NO:229的等位变体,或表H中给出的任意核酸序列的等位变体,或表H给出的任一氨基酸序列的直向同源物、旁系同源物或同源物的编码核酸的等位变体。等位变体天然存在,且包括在本发明方法范围内的是这些天然等位基因的用途。
本发明提供相对于对照植物改良种子中储藏物的含量的方法,所述方法包括调节由SEQ ID NO:229所表示的核酸的等位变体在植物中的表达,或包括调节表H中给出的核酸序列的等位变体在植物中的表达,或包括调节表H中给出的任一氨基酸序列的直向同源物、旁系同源物或同源物的编码核酸序列的等位变体在植物中的表达。
用于调节(优选增加)此类等位变体在植物中的表达的优选方法是通过在植物中引入和表达表H中给出的核酸序列的等位变体,或包括在植物中引入和表达表H中给出的任一氨基酸序列的直向同源物、旁系同源物或同源物的编码核酸序列的等位变体。
用于本发明方法的等位变体包括长度足以编码落入II类HD-Zip转录因子定义内的多肽的核酸,即意指包含如下的多肽:(i)同源域盒;(ii)亮氨酸拉链;和(iii)本文所述的基序I、II和III。此外,此类等位变体与II类HD-Zip转录因子具有基本相同的生物学活性。
用于本发明方法的另一核酸是通过基因改组获得的核酸。基因改组或定向进化还可以用于产生表H给出的任一核酸的变体,或表H给出的任一氨基酸序列的直向同源物、旁系同源物或同源物的编码核酸的变体。
本发明提供相对于对照植物改良种子中储藏物的含量的方法,所述方法包括调节由SEQ ID NO:229所表示的核酸的变体在植物中的表达,或包括调节表H中给出的任一核酸序列的变体在植物中的表达,或包括调节表H中给出的任一氨基酸序列的直向同源物、旁系同源物或同源物的编码核酸序列的变体在植物中的表达,所述变体核酸通过基因改组获得。
用于调节(优选增加)此类变体在植物中的表达的优选方法是通过在植物中引入和表达表H中给出的任一核酸序列的变体,或包括在植物中引入和表达表H中给出的任意氨基酸序列的直向同源物、旁系同源物或同源物的编码核酸序列的变体,所述变体核酸通过基因改组获得。
通过基因改组获得的用于本发明方法的此类变体包括长度足以编码落入II类HD-Zip转录因子定义内的多肽的核酸,即意指包含如下的多肽:(i)同源域盒;(ii)亮氨酸拉链;和(iii)本文所述的基序I、II和III。
此外,还可以通过位点定向诱变获得用于本发明方法的核酸。几种方法可用于实现位点定向诱变,最常用的是基于PCR的方法(CurrentProtocols in Molecular Biology.Wiley编著)。
II类HD-Zip转录因子展示转录因子的一般生物学活性(至少以其天然形式)且通常具有DNA结合活性和激活结构域。本领域技术人员可以使用常规工具和技术容易地确定激活结构域和DNA-结合活性的存在。Sessa等1997(J Mol Biol 274(3):303-309)研究了ATHB-1和ATHB-2(=HAT4)HD-Zip(HD-Zip-1和-2)结构域的DNA结合属性,并发现它们与DNA相互作用作为同源二聚体且识别两个不同的9bp假回文结构序列,分别是CAAT(A/T)ATTG(BS-1)和CAAT(G/C)ATTG(BS-2)。从HD-Zip-2结构域的突变分析,它们确定螺旋3的保守氨基酸残基:,Val47和Asn51、和Arg55对HD-Zip-2结构域的DNA结合活性是关键的。他们还报道通过用赖氨酸取代Arg55或者通过用HD-Zip-1的对应残基(分别是丙氨酸和色氨酸)取代Glu46和Thr56来消除通过HD-Zip-2结构域在中心位点的G/C碱基配对的优选识别。
根据本发明的优选特征,受调节的表达是增加的表达。增加核酸、基因或基因产物的表达的方法在本领域充分记载。
用于调节II类HD-Zip转录因子的编码核酸在植物中的表达的另一方法包括降低或基本去除编码II类HD-Zip转录因子的内源基因在植物中的表达。本文中提及的“降低或基本去除”意指内源基因表达和/或多肽水平和/或多肽活性相对于对照植物的降低。与对照植物相比,降低或基本去除以递增优选顺序是至少10%、20%、30%、40%或50%、60%、70%、80%、85%、90%,或95%、96%、97%、98%、99%或更多的降低。降低表达的方法在上文“定义”部分描述。
为了降低或基本去除内源基因在植物中的表达,需要核酸序列的足够长度的基本上连续的核苷酸。为了开展基因沉默,这个长度可以是少至20、19、18、17、16、15、14、13、12、11、10个或更少的核苷酸,或者该长度可以多至整个基因(包括5’和/或3’UTR,在部分或全长中)。基本上连续的核苷酸片段可以来自SEQ ID NO:229、或来自表H中给出的任意核酸序列、或来自能够编码表H中给出的任一氨基酸序列的直向同源物、旁系同源物或同源物的任意核酸。编码(功能性)多肽的核酸序列不是本文中所讨论用于降低或基本去除内源基因表达的多种方法所需的。
适合用于本发明方法的核酸可以来自任何天然或人工的来源。可以通过仔细的人为操作在组成和/或基因组环境上修饰所述核酸的天然形式。优选核酸来自植物,又优选源自双子叶植物,又优选源自十字花科,更优选核酸来自拟南芥。
用于调节(优选增加)II类HD-Zip转录因子的编码核酸的表达的优选方法是在植物中引入和表达II类HD-Zip转录因子的编码核酸,然而,实施本方法的效果即改良的种子储藏物含量还可以使用其他公知技术实现。一种此类技术是T-DNA激活标注。还可以使用TILLING技术再现本发明的效果。还可以使用同源物再现再生本发明的效果,所述同源重组允许所选择核酸在基因组中确定的选择位置引入。
实施本发明方法提供相对于对照植物的种子具有改良的种子储藏物含量的种子。改良的种子储藏物含量指脂质、油、肪酸、淀粉、糖和蛋白质中一种或多种相对于对照植物对应项的改良的含量。优选地,调节II类HD-Zip转录因子的编码核酸在植物中的表达产生相对于对照植物的种子,具有增加的油含量的种子的植物。在此情况下,受调节的表达通常是II类HD-Zip转录因子的编码核酸在植物中的超量表达。优选地,调节II类HD-Zip转录因子的编码核酸在植物中的表达产生相对于对照植物的种子,具有增加的蛋白质含量的种子的植物。在此情况下,受调节的表达通常是减少或基本去除内源基因II类HD-Zip转录因子编码基因的表达。
本发明也包括通过本发明方法可获得的植物或其部分(尤其种子)。所述植物或其部分包括核酸转基因(包括上文所述如用于本发明方法的任一核酸序列)。
本发明还提供遗传构建体和载体以促进在植物中引入和/或表达上文所述如用于本发明方法的核酸序列。
更具体地,提供基因构建体,其包含:
(i)如上面所定义的II类HD-Zip转录因子的编码核酸;
(ii)一个或多个与(i)的核酸有效连接的调控序列。
用于本发明方法中的构建体可以使用本领域技术人员众所周知的重组DNA技术构建。该基因构建体可以插入适于转化至植物内并适于在转化的细胞中表达目的基因的市售载体。本发明也提供如文中所定义的基因构建体在本发明方法中的用途。
植物用包含目的序列的载体转化。技术人员非常了解为成功转化、选择和增殖含有目的序列的宿主细胞而必须于载体上存在的遗传元件。目的序列有效地与一种或多种调控序列(至少与启动子)连接。术语“调节元件”、“调控序列”和“启动子”在本文都可交换使用且在上文定义。
有利地,可以使用任何类型的启动子,无论自然的或合成的,驱动核酸序列的表达。见本文“定义”部分对各种启动子类型的定义。
根据本发明的优选特征,目的核酸与组成型启动子有效连接。组成型启动子在生长和发育的大多数但不必然是所有阶段都转录激活,并且基本上是普遍表达。优选组成型启动子是GOS2启动子,更优选组成型启动子是稻GOS2启动子,又优选组成型启动子是由基本上类似于SEQ ID NO:56或SEQ ID NO:282的核酸序列表示的。最优选组成型启动子是如SEQID NO:56或SEQ ID NO:282所表示的。也可以用来实施本发明方法的其他组成型启动子的实例上文显示。
任选地,一种或多种终止子序列可以在引入植物的构建体中使用。额外调节元件可包括转录及翻译强化子。本领域技术人员会意识到可以适用于实施本发明的终止子和强化子序列。内含子序列也可以添加至5′非翻译区(UTR)或编码序列中,以增加在胞浆内积累的成熟信息的量。其他调控序列(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区之外)可以是蛋白质和/或RNA稳定化元件。本领域技术人员会知道或可以轻易地获得此类序列。
本发明的遗传构建体还可以包括需要用于在特定细胞类型中维持和/或复制的复制序列起点。一个实例是当需要将遗传构建体在细菌细胞中维持为附加型遗传元件(例如质粒或粘粒分子)时。优选的复制起点包括,但不限于f1-ori和colE1。
为检测如在本发明方法中所用核酸序列的成功转移和/或选择包含这些核酸的转基因植物,使用标记基因(或报道基因)是有利的。因而,遗传构建体可以任选地包含选择性标记基因。该标记基因当其不再需要时,可从转基因细胞移除或切除。移除标记的技术是本领域已知的,有用的技术描述于上面的“定义”部分。
本发明还提供产生相对于对照植物具有改良的种子中储藏物含量的转基因植物的方法,其包括在植物中引入和表达由SEQ ID NO:229所表示的核酸序列,或包括在植物中引入和表达表H中给出的核酸序列,或包括在植物中引入和表达表H中给出的任意氨基酸序列的直向同源物、旁系同源物或同源物的编码核酸序列,或包括在植物中引入和表达本文定义的如用于本发明方法的任意核酸。
更具体地,本发明提供用于产生相对于对照植物具有改良的种子中储藏物含量的转基因植物的方法,所述方法包括:
(i)在植物、植物部分或植物细胞中引入和表达由SEQ ID NO:229所表示的核酸序列,或包括在植物中引入和表达表H中给出的核酸序列,或包括在植物中引入和表达表H中给出的任意氨基酸序列的直向同源物、旁系同源物或同源物的编码核酸序列;和
(ii)在促进植物生长和发育的条件下培养植物细胞;和
(iii)从(ii)的植物中收获种子;和任选地
(iv)从(iii)的种子中提取脂质、油、脂肪酸、淀粉、糖和蛋白质中的任一种或多种。
可以处理收获的种子以提取特定的种子储藏物,如脂质、油、脂肪酸、淀粉、糖和蛋白质。尤其是,种子用于提取油。可以从处理过的或未经处理的种子中提取所述油。
核酸序列可以直接引入植物细胞或引入植物本身(包括引入组织、器官或植物的任何其他部分)。根据本发明的优选特征,核酸序列优选地通过转化引入植物。
本文所指的术语“转化”如本文定义。能够后续克隆性增殖(无论通过器官发生或胚胎发生)的植物组织可以用本发明的遗传构建体转化并且可以从中再生整株植物。选择的具体组织将取决于可用于并且最适于正进行转化的具体物种的克隆性增殖系统。示例性组织靶包括叶盘、花粉、胚、子叶、下胚轴、大配子体、愈伤组织、现存分生组织(例如顶端分生组织、腋芽和根分生组织)和诱导的分生组织(例如子叶分生组织和下胚轴分生组织)。多核苷酸可以瞬时或稳定地引入宿主细胞并且可以非整合地维持,例如作为质粒。备选地,多核苷酸可以整合至宿主基因组内。产生的转化植物细胞随后可以用来以本领域技术人员已知的方式再生出转化植物。
植物物种的转化现在是相当常规的技术。有利地,几种转化方法中的任一方法可以用来将目的基因引入合适的祖先细胞。转化方法包括使用脂质体、电穿孔法、增加游离DNA摄入的化学品、DNA直接注射至植物、粒子枪轰击法、使用病毒或花粉的转化法和显微投射法(microprojection)。转化方法可以选自用于原生质体的钙/聚乙二醇法(Krens,F.A.等,(1982)Nature 296,72-74;Negrutiu I等(1987)Plant Mol Biol 8:363-373);原生质体的电穿孔法(Shillito R.D.等(1985)Bio/Technol 3,1099-1102);对植物材料的微量注射法(Crossway A等,(1986)Mol.Gen Genet 202:179-185);DNA或RNA涂布的粒子轰击法(Klein TM等,(1987)Nature 327:70)、(非整合性)病毒感染法等。转基因稻植物优选地通过农杆菌介导的转化法产生,使用任意用于稻转化的公知方法,如在任一以下文献中描述的:公开的欧洲专利申请EP 1198985 A1,Aldemita和Hodges(Planta 199:612-617,1996);Chan等(Plant Mol Biol 22(3):491-506,1993),Hiei等(Plant J 6(2):271-282,1994),其公开内容在本文中引入作为参考,如同完全给出那样。在玉米转化的情况下,优选的方法如Ishida等(Nat.Biotechnol 14(6):745-50,1996)或Frame等(Plant Physiol 129(1):13-22,2002)描述,其公开内容在本文中如充分所述那样引入作为参考。
可通过技术人员所熟悉的所有方法来再生遗传修饰过的植物细胞。可在上面提到的S.D.Kung和R.Wu,Potrykus或
和Willmitzer的出版物中找到合适的方法。
通常在转化后,选择一种或多种标记存在的植物细胞或细胞群体,其中所述的标记由与目的基因一起共转移的植物可表达的基因编码,随后将转化的材料再生成整株植物。为了选择转化的植物,在转化中获得的植物材料原则上接受选择条件处理,以至于转化的植物可以与未转化的植物区分。例如,以上文所述方式获得的种子可以播种,在初始培育时期后,通过喷雾进行合适的选择。另一种可能性包括在使用合适选择剂的琼脂平板上生长种子(根据需要在消毒之后),使得仅转化的种子可以生长成植物。或者,转化的植物通过上述那些选择标记的存在筛选。
在DNA转移和再生后,推测的转化植物可以例如使用Southern分析对目的基因的存在、拷贝数和/或基因组构造进行评价。备选或额外地,新引入DNA的表达水平可以使用Northern和/或Western分析、或定量PCR进行监测,所有技术是本领域技术人员众所周知的。
产生的转化植物可以通过多种方法加以增殖,如通过克隆增殖法或经典育种技术。例如,第一代(或T1)转化植物可以进行自交,以提供纯合的第二代(或T2)转化体,并且T2植物可以通过经典育种技术进一步增殖。
产生的转化生物可以采取多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆转化体(例如被转化以含有表达盒的全部细胞);转化组织和未转化组织的移植体(例如在植物中,与未转化嫩枝嫁接的转化的根状茎)。
本发明明确地扩展至通过文中所述的任意方法产生的任何植物细胞或植物,并扩展至全部植物部分及其繁殖体。本发明进一步扩展至包含已经通过任意前述方法产生的原代转化或转染细胞、组织、器官或整株植物的后代,唯一要求是后代表现与通过本发明方法中的亲代所产生的那些后代相同的一种或多种基因型特征和/或表型特征。
本发明也包括宿主细胞,其含有上文所述用于本发明方法的任一核酸。本发明优选的宿主细胞是植物细胞。
本发明方法有利地适用于任何植物。特别用于本发明方法中的植物包括属于植物界超家族的全部植物,尤其单子叶植物和双子叶植物,包括选自以下的饲用或饲料豆类、观赏植物、粮食作物、树或灌木。根据本发明优选的实施方案,植物是作物植物。作物植物的实例包括大豆、向日葵、卡诺拉油菜、苜蓿、油菜、棉花、番茄、马铃薯和烟草。还优选地,植物是单子叶植物。单子叶植物的实例包括甘蔗。更优选地,植物是谷物。谷物的实例包括稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱和燕麦。
根据本发明的另一优选实施方案,植物是通常培育用于产生油的作物植物。此类用于产生油的作物植物的实例包括油菜籽、卡诺拉油菜、亚麻(linseed)、大豆、向日葵、玉米、燕麦、黑麦、大麦、小麦、胡椒(pepper)、万寿菊、棉、油椰、椰子(coconut palm),亚麻(flax)、蓖麻(castor)、花生、橄榄、avocado、芝麻、jatropha。
本发明也扩展至植物的可收获部分特别是种子,还有叶、果实、花、茎、根状茎、块茎、根和球茎。本发明进一步涉及直接来自优选来自这种植物的可收获部分中的产物,如干燥颗粒或粉末、油、脂肪及脂肪酸、淀粉或蛋白质。来自植物可收获部分的特定目的产物是油。
本发明还包括本文提及的用于本发明方法的任意核酸的用途,用于相对于对照植物改良种子储藏物含量。特别有用的是由SEQ ID NO:229所表示的核酸、和表A给出的任意核酸序列、和给H中给出的任意多肽序列的直向同源物、旁系同源物或同源物的任意编码核酸序列。本发明还包括由SEQ ID NO:230所表示的多肽序列的用途、和表H中给出的多肽序列的用途,用于相对于对照植物改良种子储藏物含量。
这些核酸或编码的多肽可以用于育种程序中,其中鉴定到可以遗传地与II类HD-Zip转录因子编码基因连接的DNA标记。所述的核酸/基因、或多肽本身可以用来定义分子标记。这种DNA或蛋白质标记随后可以在育种程序中用来选择具有改良的种子储藏物含量的植物。
等位变体也可以用于标记辅助的育种程序中。这种育种程序有时需要通过使用例如EMS诱变法对植物进行诱变处理而引入等位基因变异;备选地,该程序可以从非人为引起的所谓“自然”起源的一组等位变体开始。随后进行等位变体的鉴定,例如通过PCR法。此后是用于选择所讨论及导致增加产量的序列的优异等位变体的步骤。一般通过监测含有所讨论序列的不同等位变体的植物的生长性能而实施选择。可以在温室中或田间监测生长性能。其他任选步骤包括将鉴定了优异等位变体的植物与另一种植物杂交。这可以用来例如产生目标表型特征的组合。
核酸也可以用作探针以便对基因进行遗传作图或物理作图,所述探针作为所述基因的一部分及与这些基因关联的性状的标记。此类信息可以用于植物育种中,以便开发具有想要表型的株系。这种用途仅需要具有至少15个核苷酸长度的核酸序列。核酸可以用作限制性片段长度多态性(RFLP)标记。限制性消化的植物基因组DNA的Southern印迹(Sambrook J,Fritsch EF和Maniatis T(1989)Molecular Cloning,A Laboratory Manual)可以用核酸探测。产生的结合图式随后可以使用计算机程序如MapMaker(Lander等人(1987)Genomics 1:174-181)进行遗传分析以构建遗传图。此外,该核酸可以用来探测含有经限制性内切核酸酶处理的一组个体的基因组DNA的Southern印迹,其中所述的一组个体代表具有确定的遗传杂交的亲代和后代。DNA多态性的分离被标出并用来计算核酸在使用这个群体先前所获得的遗传图中的位置(Botstein等人(1980)Am.J.Hum.Genet.32:314-331)。
在Bernatzky和Tanksley(1986)Plant Mol.Biol.Reporter 4:37-41中描述了植物基因衍生的探针的产生和其在遗传作图中的用途。众多出版物描述了使用以上所提及的方法学或其改良方法对特定cDNA克隆的遗传作图。例如,F2互交群、回交群、随机交配群、邻近纯合系和其他个体群体可以用于作图。此类方法学是本领域技术人员众所周知的。
所述核酸探针也可以用于物理作图(即序列在物理图上的排列;见Hoheisel等在:Non-mammalian Genomic Analyasis:A Practical Guide,Academic press 1996,第319-346页及其中引用的参考文献)。
在另一实施方案中,核酸探针可以在直接荧光原位杂交(FISH)作图法(Trask(1991)Trends Genet.7:149-154)中使用。尽管当前的FISH作图法支持使用大型克隆(几个kb至几百个kb;见Laan等人(1995)Genome Res.5:13-20),然而灵敏度的改善可以允许使用更短探针进行FISH作图。
用于遗传作图及物理作图的多种基于核酸扩增的方法可以使用所述核酸而实施。实例可见于文中的“定义”部分。实例包括等位基因特异性扩增(Kazazian(1989)J.Lab.Clin.Med 11:95-96)、PCR扩增片段的多态性(CAPS;Sheffield等,(1993)Genomics 16:325-332)、等位基因特异性连接(Landegren等,(1988)Science 241:1077-1080)、核苷酸延伸反应(Sokolov(1990)Nucleic Acid Res.18:3671)、放射杂交作图(Walter等人,(1997)Nat.Genet.7:22-28)和Happy作图(Dear和Cook,(1989)Nucleic Acid Res.17:6795-6807)。为实施这些方法,使用核酸序列设计和产生用于扩增反应或引物延伸反应的引物对。这类引物的设计是本领域技术人员众所周知的。使用基于PCR的遗传作图的方法,可能需要鉴定跨越相应于本发明核酸序列区域作图的亲本之间DNA序列的差异。然而,这对作图方法通常不是必要的。
本发明方法产生如前文所述的具有改良的种子储藏物含量的植物。这些性状也可以与经济上有利的其他性状组合,如其他的产量增加性状,对其他非生物和生物胁迫的耐受性,调节各种构造性特征和/或生物化学特征和/或生理学特征的性状。
SYB1多肽的详细描述
现已惊奇地发现调节SYB1多肽的编码核酸在植物中的表达产生了相对于对照植物具有增强的产量相关性状的植物。当在无胁迫条件下(非胁迫条件)培育植物时,惊奇地发现了这种产量增加。下文详述适于增强植物中产量相关性状的特定的SYB1多肽类别。
本发明提供用于相对于对照植物增强植物中产量相关性状的方法,其包括调节SYB1多肽的编码核酸在植物中的表达。术语”调节”就表达或基因表达而言意指这样的过程,其中表达水平与对照植物相比因所述基因的表达而改变,优选地,增加表达水平。原先未受调节的表达可以是结构RNA(rRNA、tRNA)或mRNA的任何类型表达,随后是翻译。
在此之后“用于本发明方法的蛋白质”的任何引用意指如本文定义的SYB1多肽。在此之后“用于本发明方法的核酸”的任何引用意指能够编码此类SYB1多肽的核酸。术语“多肽”和“蛋白质”在本文中可互换使用并且指处于任意长度聚合形式中的氨基酸。术语″多核苷酸″、″核酸序列″、″核苷酸序列″在本文中可互换使用并且指处于任意长度非分支聚合形式中的核苷酸,即核糖核苷酸或脱氧核糖核苷酸或这二者组合。
用于调节(优选增加)用于本发明方法的蛋白质的编码核酸的表达的优选方法是通过在植物中引入和表达如下文定义的用于本发明方法的蛋白质的编码核酸。
待引入植物(并且因而用于实施本发明方法)的核酸是编码现在所述类型蛋白质的任意核酸,下文又称作“SYB1核酸”或“SYB1基因”。如本文定义“SYB1”多肽指任意核酸序列,所述核酸序列包括3个RanBP型锌指结构域(SMART登录号:SM00547,Interpro登录号:IPR001876)和任选一个或多个低复杂性结构域,但当针对SMART数据库分析时缺少不与锌指结构域或低复杂性结构域(如果出现)重叠的任何其他结构域。ZnF RBZ型锌指结构域出现在Ran-结合蛋白质中、和其他蛋白质中。在RanBPs中,这种结构域结合RanGDP。可以使用Wootton和Federhen (MethodsEnzymol.266(1996),第554-571页)的SEG算法鉴定低复杂性结构域。优选处于自然形式的SYB1多肽(即,如它们自然存在)以增加的优选顺序不长过350,300,290,280,270,260,250,240,230,220,210,190或180个氨基酸,更优选SYB1多肽的长度范围是180到130个氨基酸。
已知锌指结构域结合锌离子且通常参与蛋白质-DNA或蛋白质-蛋白质相互作用。优选地,SYB1蛋白质中的锌指结构域以如下基序之一开始:(G/R/D/N)DW(基序1,SEQ ID NO:344)、或GSW(基序2,SEQ ID NO:345),且在第5位具有第一保守半胱胺酸残基(其中基序1或基序2具有第1位至第3位)、在第7位至第10位之间具有第二保守半胱胺酸残基、在第18位至第21位之间具有第三保守半胱胺酸残基和在第21位至第24位之间具有第四保守半胱胺酸残基。此外,SYB1蛋白质中的锌指结构域优选包括保守基序NF(Q/C/S)(R/K)R(基序3,SEQ ID NO:346)或N(F/Y)(A/S/P)(N/S/F)R(基序4,SEQ ID NO 347)。
任选地,位于锌指结构域(始于第四个保守半胱胺酸残基之后且终于基序1或2的开始之前)之间的序列富含甘氨酸残基,甘氨酸含量高达35%、或甚至更高(同时普通蛋白质中甘氨酸含量大约6.93%(SWISS PROTnotes,release 44,2004年7月))。此外或备选地,与普通蛋白质中丝氨酸含量(6.89%)相比此序列中丝氨酸含量也增加。
优选地,所述多肽序列当其用于构建系统树(例如图2b所示的)时,聚簇于包含SEQ ID NO:286所示的氨基酸序列的SYB1多肽组,而不是聚簇于任何其他组。
用于本发明方法的多肽和编码其的核酸的实例在下文实施例40的表中给出。
还用于本发明方法的是实施例40的表中给出的任一氨基酸序列的同源物、和实施例40的表中给出的任一多肽的衍生物或任意前述SEQ ID NO的直向同源物或旁系同源物。
本发明通过用由SEQ ID NO:285表示的编码多肽序列SEQ IDNO:286的拟南芥核酸序列转化的植物加以说明,然而,本发明的实施不限于这些序列。本发明方法可以有利地使用编码如文中所定义的用于本发明方法的蛋白质的任何核酸进行,所述蛋白质包括直向同源物和旁系同源物,例如实施例40的表中给出的任何核酸序列。可以认为实施例40的表中给出的氨基酸序列是由SEQ ID NO:286表示的SYB1多肽的直向同源物和旁系同源物。
直向同源物和旁系同源物可以通过开展所谓交互性blast搜索而容易地找到。其一般包括第一BLAST,所述第一BLAST参与提交查询序列(例如使用实施例40的表中列出的任何核酸序列)用于针对任一序列数据库(如公众可用的NCBI数据库)的BLAST搜索。当从核苷酸序列开始时,通常使用BLASTN或TBLASTX(使用标准默认值),并且当从蛋白质序列开始时,可以使用BLASTP或TBLASTN(使用标准默认值)。任选地可以筛选BLAST结果。随后提交筛选结果和非筛选结果的全长序列以针对来自生物的序列进行反向BLAST(第二BLAST),其中查询序列来自所述的生物(其中在查询序列是SEQ ID NO:285或SEQ ID NO:286的情况下,第二BLAST因而将针对拟南芥序列)。随后比较第一和第二BLAST搜索的结果。若来自第一BLAST的高阶位命中源自与查询序列从其中衍生的物种相同的物种,反向BLAST随后理想地以最高命中的查询序列中产生,则鉴定到旁系同源物;若第一BLAST的中的高阶位命中不源自与查询序列从其中衍生的物种相同的物种,并且优选地在反向BLAST时产生属于最高命中之列的查询序列,则鉴定到直向同源物。
高阶位命中是具有低E-值的那些命中。E-值越低,评分越显著(或换句话说,此命中因偶然而发生的几率越低)。E-值的计算是本领域众所周知的。除了E-值外,比较结果还由同一性百分数记分。同一性百分数指两个所比较核酸(或多肽)序列之间在特定长度范围内的相同核苷酸(或氨基酸)数目。在大型家族的情况下,可以使用ClustalW,随后使用邻接树法以便帮助显示相关基因的聚类和以便鉴定直向同源物和旁系同源物。
实施例40的表给出由SEQ ID NO:286表示的SYB1蛋白质的直向同源物和旁系同源物的实例。使用上述BLAST过程可以容易地鉴定到其他直向同源物和旁系同源物。
通过三个保守ZnF_RBZ型锌指结构域结构域(图22所示)的出现可鉴定到本发明的蛋白质。术语“结构域”和“基序”或“标记”在“定义”部分定义。也存在用于鉴定结构域的专业数据库,如SMART(Schultz等(1998)Proc.Natl.Acad.Sci.美国95,5857-5864;Letunic等(2002)Nucleic Acids Res30,242-244)、InterPro(Mulder等,(2003)Nucl.Acids.Res.31,315-318)、Prosite(Bucher和Bairoch(1994),用于生物分子序列基序的广义图谱语法及其在自动化序列判读中的功能,(在)ISMB-94;第二届分子生物学智能系统国际会议文集.Altman R.,Brutlag D.,Karp P.,Lathrop R.,Searls D.编著,第53-61页,AAAIPress,Menlo Park;Hulo等,Nucl.Acids.Res.32:D134-D137,(2004))或Pfam(Bateman等,Nucleic Acids Research 30(1):276-280(2002))鉴定。用于计算机芯片上分析蛋白质序列的一组工具可在ExPASY蛋白质组学服务器上获得(在Swiss Institute of Bioinformatics上驻留(Gasteiger等,ExPASy:用于深入认识和分析蛋白质的蛋白组学服务器,Nucleic Acids Res.31:3784-3788(2003))。
也使用本领域熟知的常规技术可以容易地鉴定结构域,例如通过序列比对鉴定。用于比对序列用于比较的方法是本领域众所周知的,此类方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP使用Needleman和Wunsch算法((1970)J Mol Biol 48:443-453)以找到使匹配数最大化并使空位数最小化的两个完整序列(覆盖整个序列的)的全局比对。BLAST算法(Altschul等(1990)J Mol Biol 215:403-10)计算序列同一性百分数并执行对两个序列间相似性的统计分析。用于执行BLAST分析的软件是公众通过国家生物技术信息中心(NCBI)可获得的。同源物可以使用例如ClustalW多重序列比对算法(1.83版本)以默认配对比对参数和评分方法(以百分数计)而轻易地鉴定。相似性和同一性的全局百分数也可以使用在MatGAT软件包中可获得的方法之一而确定(Campanella等,BMC Bioinformatics.2003Jul 10;4:29.MatGAT:an application that generates similarity/identitymatrices using protein or DNA sequences.)。可以进行细微手工编著以优化保守基序之间的比对,如本领域技术人员显而易见。此外除了使用全长序列以鉴定同源物,也可以使用特定结构域(如ZnF_RBZ型锌指结构域或上面定义的基序之一)。在下面实施例42中以百分比描述的序列同一性值使用上述程序,利用默认参数,针对完整核酸或氨基酸序列/或针对选择的结构域或保守基序上确定。
此外,SYB1蛋白质(至少以其天然形式)可以与蛋白质或核酸相互作用且当根据本发明方法表达时具有增加种子产量的效果。实施例45中提供进一步详述。
用于本发明方法的编码蛋白质的核酸不需要是全长核酸,因为本发明方法的实施不依赖全长核酸序列的使用。适合用于实施本发明方法的核酸实例包括实施例40的表中给出的核酸序列,但不限于这些序列。核酸变体可用于实施本发明的方法。这样的核酸变体实例包括用于本发明方法的蛋白质的编码核酸的部分、与用于本发明方法的蛋白质的编码核酸杂交的核酸、用于本发明方法的蛋白质的编码核酸的剪接变体、用于本发明方法的蛋白质的编码核酸的等位变体和通过基因改组获得的用于本发明方法的蛋白质的编码核酸的变体。现将描述术语部分、杂交序列、剪接变体、等位变体和基因改组。
本发明提供增强植物中产量相关性状的方法,所述方法包括在植物中引入和表达实施例40的表中给出的任一核酸序列的部分、或实施例40的表中给出的任意氨基酸序列的直向同源物、旁系同源物或同源物的编码核酸的部分。
用于本发明方法的部分编码多肽,所述多肽落入如本文定义的用于本发明方法的蛋白质的编码核酸的定义内且与实施例40的表中给出的氨基酸序列具有基本上相同的生物学活性。优选地,部分是实施例40的表中给出的任一核酸的部分。部分通常长度至少为200个连续核苷酸,优选长度至少为300个连续核苷酸,更优选长度至少为400个连续核苷酸,最优选长度至少为500个连续核苷酸,所述连续核苷酸是实施例40的表中给出的任一核酸序列。最优选的部分是SEQ ID NO:285的核酸的部分。优选地,部分编码氨基酸序列,所述氨基酸序列包括如本文定义的ZnF_RBZ型锌指结构域。优选地,部分编码氨基酸序列,所述氨基酸序列当其用于构建SYB1系统树(例如图23b所示的)时,趋向聚簇于包含SEQ ID NO:286所示的氨基酸序列的SYB1蛋白质组,而不是聚簇于任何其他组。
如本文所定义的SYB1蛋白质的编码核酸的部分可以通过对核酸进行一个或多个缺失来制备。部分可以以分离的形式使用,或者可将其与其他编码(或非编码)序列融合,以便,例如,生产组合了若干活性的蛋白质。当与其他编码序列融合时,经翻译后所产生的多肽可能比预测的SYB1蛋白质部分要大。
用于本发明的另一核酸变体是在降低的严格条件下、优选在严格条件下,能够与本文所定义的SYB1蛋白质的编码核酸或与本文所定义的部分杂交的核酸。
用于本发明方法的杂交序列编码多肽,所述多肽具有三个ZnF_RBZ型锌指结构域(见图23a的比对),且与实施例40的表中给出的任意氨基酸序列所表示的SYB1蛋白质具有基本上相同的生物学活性。杂交序列通常长度至少为200个连续核苷酸,优选长度至少为300个连续核苷酸,更优选长度至少为400个连续核苷酸,最优选长度至少为500个连续核苷酸,所述连续核苷酸是实施例40的表中给出的任一核酸序列。优选地,杂交序列是能够与实施例40的表中给出的任意核酸杂交的序列、或与任意这些序列的部分杂交的序列,部分如上文定义。最优选的杂交序列是能够与SEQID NO:285所表示的核酸或其部分杂交。优选地,杂交序列编码氨基酸序列,所述氨基酸序列包括任一个或多个如本文定义的基序或结构域。优选地,杂交序列编码氨基酸序列,所述氨基酸序列当其用于构建SYB1系统树(例如图23b所示的)时,趋向聚簇于包含SEQ ID NO:286所示的氨基酸序列的SYB1蛋白质组,而不是聚簇于任何其他组。
本发明提供增强植物中产量相关性状的方法,所述方法包括在植物中引入和表达能够与实施例40的表中给出的任一核酸杂交的核酸、或包括在植物中引入和表达能够与实施例40的表中给出的任意核酸序列的直向同源物、旁系同源物或同源物的编码核酸杂交的核酸。
用于本发明方法的另一核酸变体是编码如上文定义的SYB1蛋白质的的剪接变体,术语“剪接变体”如上文定义。
本发明提供增强植物中产量相关性状的方法,其包括在植物中引入和表达实施例40的表中给出的任一核酸序列的剪接变体、或实施例40的表中给出的任意氨基酸序列的直向同源物、旁系同源物或同源物的编码核酸的剪接变体。
优选的剪接变体是由SEQ ID NO:285所表示的核酸的剪接变体或SEQ ID NO:286的直向同源物或旁系同源物的编码核酸的剪接变体。优选地,由剪接变体编码的氨基酸序列包括任一个或多个如本文定义的基序或结构域。优选地,由剪接变体编码的氨基酸序列,当其用于构建SYB1系统树(例如图23b所示的)时,趋向聚簇于包含SEQ ID NO:286所示的氨基酸序列的SYB1蛋白质组,而不是聚簇于任何其他组。
用于本发明方法的另一核酸变体是编码如上文定义的SYB1蛋白质的核酸的剪接变体。等位变体天然存在,且包括在本发明方法范围内的是这些天然等位体的用途。用于本发明方法的所述等位变体与SEQ ID NO:286的SYB1蛋白质具有基本上相同的生物学活性。
本发明提供增强植物中产量相关性状的方法,其包括在植物中引入和表达实施例40的表中给出的任一核酸的等位变体、或包括在植物中引入和表达实施例40的表中给出的任意氨基酸序列的直向同源物、旁系同源物或同源物的编码核酸的等位变体。
优选的等位变体是SEQ ID NO:285的等位变体或SEQ ID NO:286的直向同源物或旁系同源物的编码核酸的等位变体。优选地,由等位变体编码的氨基酸序列包括任一个或多个如本文定义的基序或结构域。优选地,由等位变体编码的氨基酸序列,当其用于构建SYB1系统树(例如图23b所示的)时,趋向聚簇于包含SEQ ID NO:286所示的氨基酸序列的SYB1蛋白质组,而不是聚簇于任何其他组。
用于本发明方法的另一核酸变体是通过基因改组获得的核酸变体,术语“基因改组”如上述。
本发明提供增强植物中产量相关性状的方法,其包括在植物中引入和表达实施例40的表中给出的任一核酸序列的变体、或包括在植物中引入和表达实施例40的表中给出的任意氨基酸序列的直向同源物、旁系同源物或同源物的编码核酸的变体,所述变体核酸通过基因改组获得。
优选地,通过基因改组获得变体核酸编码氨基酸序列,所述氨基酸序列包括任一个或多个如本文定义的基序或结构域。优选地,由通过基因改组获得变体核酸编码的氨基酸序列,当其用于构建SYB1系统树(例如图23b所示的)时,趋向聚簇于包含SEQ ID NO:286所示的氨基酸序列的SYB1蛋白质组,而不是聚簇于任何其他组。
此外,可以通过位点定向诱变获得核酸变体。几种方法可用于实现位点定向诱变;最常用的是基于PCR的方法(Current Protocols in MolecularBiology.Wiley编著)。
编码SYB1蛋白质的核酸可以来自任何天然或人工的来源。可以通过仔细的人为操作在组成和/或基因组环境上修饰所述核酸的天然形式。优选SYB1编码核酸来自植物,又优选源自双子叶植物,更优选源自十字花科,最优选核酸来自拟南芥。
因此本文任何SYB1蛋白质的引用意指如上文定义的SYB1蛋白质。编码此类SYB1蛋白质的任意核酸适合用于实施本发明方法。
本发明也包括可通过本发明方法获得的植物或其部分(包括种子)。所述植物或其部分包括如上文定义的编码SYB1蛋白质的核酸转基因。
本发明还提供遗传构建体和载体以促进在植物中引入和/或表达用于本发明方法中的核酸序列。用于本发明方法中的构建体可以使用本领域技术人员众所周知的重组DNA技术构建。该基因构建体可以插入适于转化至植物内并适于在转化的细胞中表达目的基因的市售载体。本发明也提供如文中所定义的基因构建体在本发明方法中的用途。
更具体地,本发明提供构建体,其包含:
(i)如上面所定义的SYB1核酸或其变体;
(ii)一个或多个与(i)的核酸序列有效连接的调控序列;和任选地
(iii)转录终止序列。
优选地,编码SYB1多肽的核酸如上文定义。术语“调控序列”和“终止序列”如本文定义。
植物用包含目的序列的载体转化(即如上文定义的编码SYB1多肽的核酸)。技术人员非常了解为成功转化、选择和增殖含有目的序列的宿主细胞而必须于载体上存在的遗传元件。目的序列有效地与一种或多种调控序列(至少与启动子)连接。术语“调节元件”、“调控序列”和“启动子”在本文都可交换使用且在上文定义。
有利地,可以使用任何类型的启动子驱动核酸序列的表达。优选地,SYB1核酸或其变体与组成型启动子有效连接。优选的组成型启动子也是基本上普遍表达的组成型启动子。还优选组成型启动子来自植物,更优选单子叶植物。最优选是使用GOS2启动子(来自稻)(SEQ ID NO:56或SEQ ID NO:343)。应当清楚,本发明的实用性不局限于SEQ ID NO:285所示的SYB1核酸,本发明的实用性也不局限于受GOS2启动子驱动的SYB1核酸的表达。上文显示了同样可用于驱动SYB1核酸表达的其他组成型启动子的实例。
任选地,一种或多种终止子序列可以在引入植物的构建体中使用。额外调节元件可包括转录及翻译强化子。本领域技术人员会意识到可以适用于实施本发明的终止子和强化子序列。内含子序列也可以添加至5′非翻译区(UTR)或编码序列中,以增加在胞浆内积累的成熟信息的量。其他调控序列(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区之外)可以是蛋白质和/或RNA稳定化元件。本领域技术人员会知道或可以轻易地获得此类序列。
本发明的遗传构建体还可以包括需要用于在特定细胞类型中维持和/或复制的复制序列起点。一个实例是当需要将遗传构建体在细菌细胞中维持为附加型遗传元件(例如质粒或粘粒分子)时。优选的复制起点包括,但不限于f1-ori和colE1。
为检测如在本发明方法中所用核酸序列的成功转移和/或选择包含这些核酸的转基因植物,使用标记基因(或报道基因)是有利的。在定义部分更详细地描述了“选择性标记”。该标记基因当其不再需要时,可从转基因细胞移除或切除。移除标记的技术是本领域已知的,有用的技术描述于上面的“定义”部分。
本发明还提供产生相对于对照植物具有增强的产量相关性状的转基因植物的方法,所述方法包括在植物中引入和表达如上文定义的SYB1蛋白质的任意编码核酸。
(i)更具体地,本发明提供用于产生具有增加的产量相关性状的转基因植物的方法,所述方法包括:在植物或植物细胞中引入和表达SYB1核酸或其变体;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
(i)的核酸可以是如本文定义的能够编码SYB1多肽的任意核酸。
核酸可以直接引入植物细胞或引入植物本身(包括引入组织、器官或植物的任何其他部分)。根据本发明的优选特征,核酸优选地通过转化引入植物。“定义”部分更加详细的描述了术语“转化”。
遗传修饰的植物细胞可通过本领域技术人员熟悉的所有方法再生。合适的方法可见于S.D.Kung和R Wu、Potrykus或
和Willmitzer的上述出版物。
通常在转化后,选择一种或多种标记存在的植物细胞或细胞群体,其中所述的标记由与目的基因一起共转移的植物可表达的基因编码,随后将转化的材料再生成整株植物。为了选择转化的植物,在转化中获得的植物材料原则上接受选择条件处理,以至于转化的植物可以与未转化的植物区分。例如,以上文所述方式获得的种子可以播种,在初始培育时期后,通过喷雾进行合适的选择。另一种可能性包括在使用合适选择剂的琼脂平板上生长种子(根据需要在消毒之后),使得仅转化的种子可以生长成植物。或者,转化的植物通过上述那些选择标记的存在筛选。
在DNA转移和再生后,推测的转化植物也可以例如使用Southern分析对目的基因的存在、拷贝数和/或基因组构造进行评价。备选或额外地,新引入DNA的表达水平可以使用Northern和/或Western分析进行监测,这两种技术是本领域技术人员众所周知的。
产生的转化植物可以通过多种方法加以增殖,如通过克隆增殖法或经典育种技术。例如,第一代(或T1)转化植物可以进行自交,选择纯合的第二代(或T2)转化体,并且随后T2植物可以通过经典育种技术进一步增殖。
产生的转化生物可以采取多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆转化体(例如被转化以含有表达盒的全部细胞);转化组织和未转化组织的移植体(例如在植物中,与未转化嫩枝嫁接的转化的根状茎)。
本发明明确地扩展至通过文中所述的任意方法产生的任何植物细胞或植物,并扩展至全部植物部分及其繁殖体。本发明进一步扩展至包含已经通过任意前述方法产生的原代转化或转染细胞、组织、器官或整株植物的后代,唯一要求是后代表现与通过本发明方法中的亲代所产生的那些后代相同的一种或多种基因型特征和/或表型特征。
本发明也包括宿主细胞,其含有如上文定义的SYB1蛋白质的编码核酸。本发明优选的宿主细胞是植物细胞。
宿主植物对于本发明方法中所用核酸或载体、表达盒或构建体或载体而言原则上有利地是能够合成本发明方法中所用多肽的全部植物。
本发明方法有利地适用于任何植物。特别用于本发明方法中的植物包括属于植物界超家族的全部植物,尤其单子叶植物和双子叶植物,包括选自以下的饲用或饲料豆类、观赏植物、粮食作物、树或灌木。根据本发明优选的实施方案,植物是作物植物。作物植物的实例包括大豆、向日葵、卡诺拉油菜、苜蓿、油菜、棉花、番茄、马铃薯和烟草。还优选地,植物是单子叶植物。单子叶植物的实例包括甘蔗。更优选地,植物是谷物。谷物的实例包括稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱和燕麦。本发明也扩展至植物的可收获部分如,但不限于种子、叶、果实、花、茎、根状茎、块茎和球茎。本发明进一步涉及来自、优选直接来自这种植物的可收获部分中的产物,如干燥颗粒或粉末、油、脂肪及脂肪酸、淀粉或蛋白质。
根据本发明的优选特征,受调节的表达是增加的表达。如上文所述,用于调节(优选增加)SYB1蛋白质的编码核酸的表达的优选方法是在植物中引入和表达SYB1蛋白质的编码核酸;然而,实现本方法的效果即增强产量相关性状也可以使用其他公知技术来实现。一种此类技术是T-DNA激活标注。还可以使用TILLING(定向诱导的基因组局部突变)技术,或用同源物重组再现本发明的效果,所述同源重组允许选择的核酸于确定的选择位置上引入基因组中。
实施本发明方法提供具有增强的产量相关性状的植物。特别地实施本发明方法提供相对于对照植物具有增加的产量、尤其是增加种子产量的植物。术语“产量”和“种子产量”在本文“定义”部分更详细地描述。
本文对增强的产量相关性状的引用意指在植物一个部分或多个部分的生物量(重量)的增加,其包括地上(可收获)部分和/或(可收获)地下部分。
特别地,此类可收获部分是种子,且实施本发明方法产生具有相对于合适的对照植物的种子产量具有增加的种子产量的植物。
以玉米为例,产量增加可以表现为下列一种或多种指标:每平方米所栽培的植物数的增加、每株植物穗数的增加、行数的增加、每行粒数、粒重、千粒重、穗长度/直径、种子饱满率的增加(其中种子饱满率是饱满种子数除以种子总数并乘以100)及其他。以稻为例,产量增加本身可以表现为下列一种或多种指标的增加:每平方米植物数、每株植物圆锥花序数、每圆锥花序小穗数、每圆锥花序花(小花)数(其表达为饱满种子数对原圆锥花序数之比)、种子饱满率的增加(其中种子饱满率是饱满种子数除以种子总数并乘以100)、千粒重的增加及其他。
由于本发明的转基因植物具有增加的产量,因而相对于对照植物的生长速率,这些植物有可能在其生活周期中的对应阶段上表现增加的生长速率(在其生活周期的至少部分期间)。增加的生长速率可以对于植物的一个或多个部分(包括种子)是特异性的,或可以基本上遍及整株植物。具有增加的生长速率的植物可以具备较短的生活周期。植物的生活周期可以视为意指从干燥成熟种子成长至植物已经产生与起始材料相似的干燥成熟种子的阶段所需要的时间。这个生活周期可以受下列因素影响,如早期萌发势、生长速率、绿度指数、开花时间和种子成熟速度。生长速率的增加可以在植物生活周期中的一个或多个阶段上或在基本上整个植物生活周期期间发生。在植物生活周期中的早期期间增加的生长速率可以反映增强的萌发势。生长速率的增加可以改变植物的收获周期,允许植物较晚播种和/或较早收获,否则这将不可能(相似的作用可以用较早的开花时间获得)。若生长速率充分地增加,可以允许进一步播种相同植物物种的种子(例如播种并收获稻植物,随后播种并收获其他稻植物,全部稻植物均在一个常规生长时段内)。类似地,若生长速率足够地增加,可以允许进一步播种不同植物物种的种子(例如播种并收获玉米植物,随后例如播种并任选收获大豆、马铃薯或任何其他合适植物)。从相同的根茎中收获额外次数在一些作物植物的情况中也是可能的。改变植物的收获周期可以导致每英亩的年生物量产量的增加(因任何特定植物可以生长并收获的次数(如在一年中)增加)。生长速率的增加也可以允许比其野生型对应物在更广泛的地理区域内培育转基因植物,因为对培育作物的区域限制往往由栽种时节(早季)或在收获时期(晚季)的不利环境条件所决定。若缩短收获周期,则可以避开这类不利条件。生长速率可以通过从生长曲线中得到多种参数而确定,此类参数可以是:T-Mid(植物达到其50%最大尺寸所花费的时间)和T-90(植物达到其90%最大尺寸所花费的时间),等等。
根据本发明的优选特征,本发明方法的实施产生与对照植物相比具有增加的生长速率的植物。因而根据本发明,提供增加植物生长速率的方法,所述方法包括调节,优选增加如本文定义的编码SYB1蛋白质的核酸在植物中的表达。
与对照植物相比,无论植物处于非胁迫条件下还是植物暴露于多种胁迫下,都发生产量和/或生长速率的增加。植物一般通过生长得更慢而对暴露于胁迫作出应答。在严重胁迫条件下,植物甚至可以完全停止生长。另一方面,轻微胁迫在本文中定义为植物对其暴露的任何胁迫,其中所述的胁迫未导致植物完全停止生长而没有恢复生长的能力。与非胁迫条件下的对照植物相比,轻微胁迫在本发明意义中导致受胁迫植物生长降低小于40%、35%或30%,优选小于25%、20%或15%,更优选小于14%、13%、12%、11%或10%或更低。由于农业实践(灌溉、施肥、杀虫剂处理)上的进步,在栽培作物植物中并不经常遇到严重胁迫。因此,由轻微胁迫诱导的受损生长往往是农业上不希望的特征。轻微胁迫是植物暴露的常见生物性和/或非生物性(环境)胁迫。非生物胁迫可以因干旱或水涝、厌氧胁迫、盐胁迫、化学毒性、氧化胁迫和热、寒冷或冰冻温度所致。非生物胁迫可以是由水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。生物胁迫一般是由病原体如细菌、病毒、真菌和昆虫引起的那些胁迫。
尤其,本发明的方法可以在非胁迫条件下或在轻微干旱条件下实施以产生相对于对照植物而具有增加的产量的植物。如在Wang等(Planta(2003)218:1-14)中报道,非生物胁迫导致不利地影响植物生长及生产力的一系列形态学变化、生理学变化、生物化学变化和分子变化。已知干旱、盐度、极端温度和氧化胁迫是相互联系的并可以通过相似机制而诱导生长损害及细胞损害。Rabbani等(Plant Physiol(2003)133:1755-1767)描述了干旱胁迫与高盐度胁迫间极高程度的“串话”。例如,干旱和/或盐化作用主要表现为渗透胁迫,导致细胞内稳态和离子分布的破坏。经常伴随高温或低温、盐度或干旱胁迫的氧化胁迫可以造成功能性蛋白和结构蛋白变性。因此,这些多样的环境胁迫常常激活相似的细胞信号途径和细胞应答,如产生胁迫蛋白质、上调抗氧化物质、积累相容性溶质和生长抑制。如本文中所用的术语”非胁迫”条件是那些允许植物最佳生长的环境条件。本领域技术人员清楚对于给定地点的正常土壤条件和气候条件。
本发明方法的实施相对于在可比条件下培育的合适的对照植物,赋予在非胁迫条件下或在轻微干旱条件下培育的植物增加的产量。因而根据本发明,提供用于在非胁迫条件下或在轻微干旱条件下培育的植物中增加产量的方法,所述方法包括增加编码SYB1多肽的核酸在植物中表达。
本发明方法的实施产生相对于在可比条件下培育的合适对照植物,在营养缺乏条件下、尤其在氮缺乏条件下培育的具有增加产量的植物。因而根据本发明,提供用于在营养缺乏条件下培育的植物中增加产量的方法,所述方法包括增加编码SYB1多肽的核酸在植物中的表达。营养缺乏可以因营养物的缺乏所致,所述营养物例如是氮、磷酸盐及其他含磷化合物、钾、钙、镉、镁、锰、铁和硼等。
在本发明优选的实施方案中,本发明方法在非胁迫条件下产生产量和/或生长速率的增加。
本发明还包括本文所述SYB1蛋白质的编码核酸的用途和这些SYB1蛋白质的用途,用于增强植物中产量相关性状。本发明进而包括植物的用途。可以在育种程序中使用本文所述SYB1蛋白质的编码核酸或者SYB1蛋白质自身,其中鉴定可以遗传地连接于SYB1编码基因的DNA标记。可以使用核酸/基因、或者SYB1蛋白质自身界定分子标记。接着可以将此DNA或蛋白质标记在育种程序中使用,以选择具有如上文本发明方法中定义的增强的产量相关性状的植物。
SYB1蛋白质编码核酸/基因的等位变体也可以用于标记辅助的育种程序。这类育种程序有时需要使用,例如EMS诱变,通过植物诱变处理引入等位基因变体;备选的,此程序可以以收集无意产生的所谓“天然”起源的等位基因变体开始。然后通过例如PCR鉴定等位基因变体。随后是选择步骤,用以选择所讨论序列的较好等位基因变体,所述等位基因变体赋予植物增加的产量。一般通过监测含有所研究序列的不同等位基因变体植物的生长行为来进行选择。可以在温室或田地中监测生长行为。更多任选的步骤包括,将经鉴定含有较好等位基因变体的植物与另一植物杂交。例如,可使用这种方法产生感兴趣表型特征的组合。
SYB1蛋白质编码核酸还可以作为探针,用于对为那些基因连锁性状的一部分并作为其标志物的基因进行遗传和物理的作图。这样的信息可以在植物育种中使用,以得到具有所期望表型的品系。SYB1蛋白质编码核酸的这类应用仅需要长至少15个核苷酸的核酸序列。SYB1蛋白质编码核酸可以用作限制性片段长度多态性(RFLP)标记。可用SYB1蛋白质编码核酸探测限制酶切消化的植物基因组DNA的Southern印迹(Sambrook J,Fritsch EF和Maniatis T(1989)《分子克隆:实验室手册》)。随后使用计算机程序如MapMaker(Lander等(1987)Genomics 1:174-181)对产生的带型进行遗传分析,以构建遗传图谱。此外,可以使用核酸在含有一组个体的限制性内切酶处理的基因组DNA中探测Southern印迹,所述一组个体为代表明确的遗传杂交的亲本和子代的一组个体。记录DNA多态性的分离并用于计算在先前用此群体获得的遗传图谱中SYB1蛋白质编码核酸的位置(Botstein等(1980)Am.J.Hum.Genet.32:314-331)。
在遗传作图中使用的植物基因衍生探针的产生和用途描述于Bematzky和Tanksley(1986)Plant Mol.Biol.Reporter 4:37-41中。众多出版物中描述过用上述方法或其变通形式对特定cDNA克隆进行遗传作图。例如,可以使用F2杂交群体、回交群体、随机交配群体、近亲同基因品系和其他个体组作图。这类方法是本领域技术人员众所周知的。
核酸探针也可以用于物理作图(即在物理图谱上安置序列;见Hoheisel等In:Non-mammalian Genomic Analysis:A Practical Guide,Academicpress 1996,第319-346页,及其中引用的参考文献)。
在另一个实施方案中,核酸探针可用于直接荧光原位杂交(FISH)作图(Trask(1991)Trends Genet.7:149-154)。尽管目前FISH作图的方法倾向用于大的克隆(几个kb到几百个kb;见Laan等(1995)Genome Res.5:13-20),但是灵敏性的提高允许在FISH作图中应用较短的探针。
用于遗传和物理作图的多种基于核酸扩增的方法可以使用所述核酸序列进行。实例包括等位基因特异性扩增(Kazazian(1989)J.Lab.Clin.Med11:95-96)、PCR扩增片段的多态性(CAPS;Sheffield等(1993)Genomics16:325-332)、等位基因特异性连接(Landegren等(1988)Science 241:1077-1080)、核苷酸延伸反应(Sokolov(1990)Nucleic Acid Res.18:3671)、放射杂交作图(Walter等(1997)Nat.Genet.7:22-28)和Happy作图(Dear和Cook(1989)Nucleic Acid Res.17:6795-6807)。为实施这些方法,使用核酸序列设计和产生用于扩增反应或引物延伸反应的引物对。这类引物的设计是本领域技术人员众所周知的。使用基于PCR的遗传作图的方法,可能需要鉴定跨越相应于本发明核酸序列区域作图的亲本之间DNA序列的差异。然而,这对作图方法通常不是必要的。
根据本发明的方法得到如前所述具有增强的产量相关性状的植物。这些性状还可以组合其他经济上有利的性状,如其他提高产量的性状、对其他非生物或生物胁迫的耐受性、改良多种构造特征和/或生化和/或生理学特征的性状。
附图描述
本发明现在将参考下列附图进行描述,其中:
图1显示了AZ多肽的结构域结构的实例。SEQ ID NO:2编码的蛋白质包括两个锚蛋白重复(粗体字,下划线)和两个C3H1结构域(斜体字,下划线)。
图2显示了根据SMART数据库的锚蛋白(ANK)和C3H1锌指(C3H1)共有序列,用于各种氨基酸组的符号在图例中给出。
图3代表了用MATGAT(BLOSUM62,空位开放罚分11,空位延伸罚分1)制备的序列同一性/相似性矩阵。序列同一性以粗体显示在对角线之上,在对角线之下给出针对:A)全长蛋白质序列,B)包括大部分C末端推测的锌指结构域的部分蛋白质的序列相似性。
图4显示了双元载体p056,其用于在WS118蛋白启动子(内参PRO0151)控制下的拟南芥AZ编码序列在稻中的表达。
图5显示了植物和哺乳动物SYT多肽典型的结构域结构。保守的SNH结构域位于多肽的N末端。植物SYT多肽中多肽C末端剩余部分由富含QG结构域组成,哺乳动物SYT多肽C末端剩余部分由富含QPGY结构域组成。富含Met结构域通常包含在植物富含QG结构域或哺乳动物QPGY富含结构域的头一半之内(从N末端到C末端的方向)。可能有第二富含Met结构域位于植物SYT多肽的SNH结构域之前。
图6显示了数个SYT多肽N末端的多重比对,使用的是基于改进的ClustalW算法(InforMax,Bethesda,MD,http://www.informaxinc.com)的VNTI AlignX多重比对程序,采用默认设置,空位开放罚分为10,空位延伸罚分为0.05。植物和人SYT多肽的交叉的SNH结构域以加框表示。比对中最后一行包括来源于所比对序列的共有序列。
图7显示了数个植物SYT多肽N末端的多重比对,使用的是基于改进的ClustalW算法(InforMax,Bethesda,MD,http://www.informaxinc.com)的VNTI AlignX多重比对程序,采用默认设置,空位开放罚分为10,空位延伸罚分为0.05。从N末端到C末端方向的两个主要结构域以加框表示,并被鉴定为SNH结构域和富含Met/富含QG结构域。另外,N末端富含Met结构域也以加框表示,SEQ ID NO:90和SEQ ID NO 91的位置以粗体下划线表示。
图8显示了利用ClustalW 1.83(http://align.genome.jp/sit-bin/clustalw)通过多重SYT多肽比对得到的邻近连接树。SYT1和SYT2/SYT3进化枝以括弧标识。
图9显示了双元载体p0523,其用于在稻中表达处于GOS2启动子(内参PRO0129)控制之下的拟南芥AtSYT1。
图10为卡尔文循环的概述。显示了13个酶促反应,及实施这些反应的酶的名称。黑色箭头显示cpFBPase在循环中的位置。
图11为显示借助铁氧化还原蛋白-硫氧化还原蛋白系统,cpFBPase的光照激活的示意图。
图12为cyFBPase多肽和cpFBPase多肽的比对。该多肽序列使用Vector NTI套件(InforMax,Bethesda,MD)的AlignX程序进行比对。多重比对使用空位开始罚分10和空位延伸罚分0.01进行。cpFBPase多肽的预测叶绿体转运肽以加框表示。示出氧化还原调控插入片段和二硫键形成中涉及的半胱氨酸。最后,活性位点区也以加框表示,并示出结合果糖-1,6-二磷酸的6-磷酸的氨基酸残基Asn237、Tyr269、Tyr289和Arg268、和结合所述果糖的氨基酸残基Lys299。
图13显示了双元载体p1597,其用于在稻中表达处于GOS2启动子(内参PRO0129)控制之下的编码cpFBPase多肽的莱茵衣藻(Chlamydomonasreindhardtii)核酸。
图14为编码表2中所述推测的SIK直向同源物的SIK核酸的比对。
图15为稻SIK多肽(SEQ ID NO:2)和拟南芥SIK多肽(SEQ ID NO:4)和具有NCBI登录号OS_BAD73441的OSSIK多肽的比对。
图16代表双元载体,其用于在稻中沉默内源基因,使用SEQ ID NO:1所表示的SIK核酸,使用组成型启动子GOS2控制之下的发夹构建体。
图17显示了双元载体,其用于在稻中表达处于GOS2启动子控制之下的来自稻的SIK编码核酸。
图18显示了显示II类HD-Zip成员的HD-Zip系统树的部分。
图19显示了几种II类HD-Zip多肽序列的比对。
图20为取自Henriksson等(2005)(Plant Phys 139:509-518)的比对。在所有HD-Zip I和II蛋白质中亮氨酸拉链结构域处于相同位置(C末端到HD)。HD-Zip I和II蛋白质的HD-Zip结构域在序列上彼此相似,尽管HD-Zip I与II之间氨基酸位置的数目不同。在第46位的氨基酸在HD-ZipI和II内是不变的,但在类别之间是不同的。几种其他氨基酸如第6位、第25位、第29位、第30位、第58位和第61位的氨基酸在HD-Zip II内是不变的,且与HD-Zip I的氨基酸不同,其显示了在这些位置的变化。
图21显示了双元载体,其用于在稻中增加处于GOS2启动子控制之下的拟南芥II类HD-Zip转录因子(HAT4)的编码核酸的表达。
图22显示了SYB1蛋白质的两个实例的结构域。锌指结构域以下划线粗体字表示。
图23a显示了不同SYB1蛋白质(所用的序列是:CDS2671(SEQ IDNO:2)、AAZ94630(SEQ ID NO:4)、Q53AV6(SEQ ID NO:6)、Q6Z6E6(SEQ ID NO:8)、Q8GWD1(SEQ ID NO:10)、Q9SW92(SEQID NO:12)、Q8RYZ5(SEQ ID NO:14)、甜菜(Beta vulgaris)(SEQ IDNO:16)、Q8S8K1(SEQ ID NO:18)、Q8GZ43(SEQ ID NO:20)、Q7F1K4(SEQ ID NO:22)、Q7XHQ8(SEQ ID NO:24))的多重比对;图23b显示了系统树,其中黑色框阐明SYB1蛋白质组。
图24显示了双元载体,其用于在稻中增加处于GOS2启动子(内参PRO0129)控制之下的拟南芥SYB1蛋白质的编码核酸的表达。
图25详解用于实施本发明方法的序列的实例。SEQ ID NO:1至SEQID NO:56涉及AZ序列。SEQ ID NO:1和2代表AZ编码序列CDS3104和推导出的蛋白质序列。SEQ ID NO:53和47代表AZ编码序列CDS3108和推导出的蛋白质序列。SEQ ID NO:3和6代表可能出现在AZ蛋白质中的保守序列,SEQ ID NO:9和55代表用于实例部分的WS118启动子的序列,SEQ ID NO:10和52是其他AZ蛋白质和编码这些蛋白质的核酸序列实例,SEQ ID NO:54和56是稻GOS2启动子的序列。
SEQ ID NO:56至153涉及SYT序列。显示从起点到终点的SYT核酸序列。这些序列的大部分来自低质量的EST测序。因此,可能遇到核酸取代。
SEQ ID NO:56和SEQ ID NO:154至208表示涉及用于实施本发明方法的cpFBPase的序列实例。
SEQ ID NO:56和SEQ ID NO:209至228涉及用于实施本发明方法的SIK蛋白质/核酸的序列实例,其用于实施本发明方法,或用于分离此类序列。序列可来自低质量测序的公共EST集合。作为结果,可期望几个核酸取代。也可以使用天然转录序列的5,和3’UTR实施本发明方法,以减少或基本去除内源SIK基因表达。
SEQ ID NO:229至284为用于实施本发明方法的II类HD-Zip转录因子(HAT4)的序列实例。
SEQ ID NO:56和SEQ ID NO:285至347为涉及SYB1蛋白质和核酸且用于实施本发明方法的序列实例。
实施例
本发明现在将参考仅作为说明的下列实施例加以描述。下列实施例不意图彻底定义或限制本发明范围。
DNA操作:除非另外声明,重组DNA技术根据(Sambrook(2001)Molecular Cloning:a laboratory manual,第三版Cold Spring HarborLaboratory Press,CSH,New York)中或Ausubel等(1994),CurrentProtocols in Molecular Biology,Current Protocols第1和2卷中描述的标准方法进行。用于植物分子工作的标准材料和方法在由BIOS ScientificPublications Ltd(UK)和Blackwell Scientific Publications(UK)出版的R.D.D.Croy的Plant Molecular Biology Labfax(1993)中描述。
实施例1:鉴定与本发明方法中所用核酸序列相关的序列
使用数据库序列搜索工具,如基本局部比对工具(BLAST)(Altschul等(1990)J.Mol.Biol.215:403-410;和Altschul等(1997)Nucleic Acids Res.25:3389-3402)在国家生物技术信息中心(NCBI)的Entrez核苷酸数据库中所维护的那些序列内鉴定到与本发明方法中所用核酸序列相关的(全长cDNA、EST或基因组)序列。该程序用来通过核酸序列或多肽序列与序列数据库比较并通过计算匹配的统计学显著性而找到序列间具有局部相似性的区域。例如,对用于本发明的核酸所编码的多肽使用TBLASTN算法,采用默认设置和过滤以忽略低复杂性序列抵消。分析的结果通过配对性比较显示,并根据几率评分(E-值)排序,其中该评分反映特定比对结果因偶然而发生的概率(E-值越低,命中的显著性越高)。除了E-值外,比较还通过同一性百分数进行记分。同一性百分数指两个所比较核酸(或多肽)序列之间在特定长度范围内的相同核苷酸(或氨基酸)数目。在一些情况下,可以调整默认参数以调节搜索法的严格性。例如可以增加E-值以显示严格性较小的匹配。以这种方式,可以鉴定短的几乎精确的匹配。
表A提供与本发明方法中的核酸序列相关的核酸序列的列表。
表A AZ多肽的实例
植物来源 核酸SEQ ID NO: 蛋白质SEQ ID NO:
拟南芥 1 2
大桉(Eucalyptus grandis) 10 11
稻 12 13
蒺藜苜蓿 14 15
稻 16 17
拟南芥 18 19
稻 20 21
拟南芥 22 23
拟南芥 24 25
大桉 26 27
大桉 28 29
大豆 30 31
大桉 32 33
拟南芥 34 35
稻 36 37
大麦 38 39
辐射松(Pinus radiata) 40 41
辐射松 42 43
大豆 44
大豆 45
大豆 46
拟南芥 47
拟南芥 48
拟南芥 49
拟南芥 50
拟南芥 51
拟南芥 52
拟南芥 53
在一些情况下,相关序列已经由研究所如基因组研究所(TIGR)试验性汇编并向公众公开。真核生物基因直向同源物(EGO)数据库可以用来鉴定此类的相关序列,这可通过关键词搜索,或用目的核酸或多肽序列使用BLAST算法进行。
实施例2:基因克隆AZ
拟南芥AZ编码基因(CDS3104)通过PCR,使用拟南芥幼苗cDNA文库(Invitrogen,Paisley,UK)作为模板进行扩增。将提取自幼苗的RNA逆转录后,将cDNA克隆至pCMV Sport 6.0。库的插入序列平均大小是1.5kb并且克隆的最初数目是1.59×107cfu。在6×1011cfu/ml的第一轮扩增后测定原始滴度是9.6×105cfu/ml。在质粒提取后,将200ng模板用于50μlPCR混合物中。将引物prm06717(有义,AttB1位点为斜体,起始密码子为粗体字:5’-
tqctqtqqatcaqacc-3’)(SEQID NO 7)和prm06718(反义,互补:位点为斜体字:5’-
ggttag gtctctca attctgc·-3’)(SEQ ID NO8)用于PCR扩增,其中所述引物包括用于Gateway重组的AttB位点。在标准条件中使用Hifi Taq DNA聚合酶进行PCR。将期望大小的PCR片段扩增且也使用标准方法予以纯化。随后实施Gateway方法的第一步骤,即BP反应,在此期间PCR片段与pDONR201质粒发生体内重组以产生根据Gateway命名的“进入克隆”p07。质粒pDONR201作为
技术的部分从Invitrogen购买。
实施例3:载体构建
进入克隆p07随后在LR反应中与p02417(一种用于植物(稻)转化的目的载体)一起使用。这种载体在T-DNA边界内含有作为功能性元件的:植物选择标记;筛选标记表达盒和意图与已经克隆于所述进入克隆中的目的序列发生LR体内重组的Gateway盒。用于种子特异性表达的稻WSI18启动子(SEQ ID NO:9)(PRO0151)位于这种Gateway盒的上游(p056,图4)。
已描述了用于植物转化的许多不同的二元(和超级二元)载体系统(例如An,G.in Agrobacterium Protocols.Methods in Molecular Biology第44卷,pp 47-62,Gartland KMA和MR Davey eds.Humana Press,Totowa,NewJersey)。许多载体系统基于Bevan(Nucleic Acid Research.1984.12:8711-8721)描述的载体pBIN19,该载体包含侧翼连接来自根癌农杆菌Ti质粒的左和右边界序列的植物基因表达盒。植物基因表达盒由至少两个基因——选择标记基因和调控性状基因的cDNA或基因组DNA的转录的植物启动子——组成。可使用不同的选择标记基因,包括编码突变的乙酰羟酸合酶(AHAS)的拟南芥基因(美国专利57673666和6225105)。类似地,可使用不同的启动子调控性状基因以实现对基因转录的组成型、发育型、组织型或环境型调控。
在LR重组步骤后,热休克或电穿孔方案将产生的表达载体p056(图4)转化至农杆菌菌株LBA4044。转化的菌落在YEP培养基上以28℃生长2天,并用相应的抗生素选择。这些农杆菌培养物用于植物转化。
其他根瘤农杆菌菌株可以用于植物转化且是本领域公知的。此类菌株实例是C58C1或EHA105
实施例4:植物转化
稻转化
含有表达载体的农杆菌独立地用来转化稻植物。将稻的日本栽培品种Nipponbare的成熟干燥种子脱壳。通过在70%乙醇中温育一分钟,随后在2%HgCl2中30分钟,随后用无菌蒸馏水洗涤6次15分钟而实施消毒。消毒的种子随后在含有2,4-D的培养基(愈伤组织诱导培养基)上萌发。在黑暗中温育4周后,将盾片衍生的胚发生性愈伤组织切下并在同一种培养基上增殖。2周后,愈伤组织通过在同一种培养基上传代培养另外2周而繁殖或增殖。胚发生性愈伤组织片在新鲜培养基上传代培养3日,之后共培育(以增强细胞分裂活性)。
含有表达载体的农杆菌菌株LBA4404用于共培育。农杆菌接种在含有适宜抗生素的AB培养基上并在28℃培养3日。随后将细菌收集并重悬在液体共培育培养基中至密度(OD600)约1。将混悬液随后转移至培养皿并将愈伤组织在该混悬液内浸泡15分钟。愈伤组织组织随后在滤纸上吸干并转移至固化的共培育培养基上并且在黑暗中于25℃温育3日。共培育的愈伤组织在黑暗中于28℃在选择剂存在下于含有2,4-D的培养基上培育4周。在此时段期间,形成迅速生长的抗性愈伤组织岛。在这种材料转移至再生培养基并在光线下温育后,胚发生潜力释放并且苗在随后4-5周发育。将苗从愈伤组织中切下并且在含有植物生长素的培养基上温育2-3周,其中将苗从所述的培养基上转移至土壤。硬化的苗在高湿度和短日照下于温室中培育。
一个构建体产生大约35个独立T0稻转化体。将原代转化体从组织培养箱转移至温室。在定量PCR分析以验证T-DNA插入物的拷贝数后,仅保留表现选择剂耐受性的单拷贝转基因植物用于收获T1种子。种子随后在移植后3-5月收获。本方法以超过50%的比率产生单一基因座转化体(Aldemita和Hodges1996,Chan等1993,Hiei等1994)。
玉米转化
玉米的转化根据对Ishida等(1996.Nature Biotech 14745-50)描述方法的改良方法进行。在玉米中的转化是基因型依赖的并且仅特定的基因型可操作用于转化和再生。近交系A188(明尼苏达大学)或以A188作为亲本的杂种是用于转化的供体材料的良好来源,但是其他基因型也可以成功地使用。玉米穗从玉米植物中在授粉后大约11日(DAP)收获,此时不成熟胚的长度是大约1至1.2mm。不成熟胚与含有表达载体的根癌农杆菌共培育并且转基因植物通过器官发生而恢复。切下的胚在愈伤组织诱导培养基上、随后在玉米再生培养基上培育,其中所述的再生培养基含有选择剂(例如咪唑啉酮,但可以使用多种选择标记)。培养板在25℃于光照下培养2-3周,或直至苗发育。将绿色苗从每个胚转移至玉米生根培养基并在25℃培养2-3周,直至根发育。将生根的苗移植至温室的土壤中。从表现选择剂耐受的并含有单拷贝的T-DNA插入物的植物中产生T1种子。
小麦转化
小麦的转化用Ishida等Ishida等(1996)Nature Biotech 14(6):745-50描述的方法进行。通常在转化中使用(可从墨西哥CIMMYT获得的)栽培品种Bobwhite。不成熟胚与含有表达载体的根癌农杆菌共培育并且转基因植物通过器官发生而恢复。在与农杆菌温育后,胚在愈伤组织诱导培养基上、随后在再生培养基上体外培育,其中所述的再生培养基含有选择剂(例如咪唑啉酮,但可以使用多种选择标记)。培养平板在25℃于光照下培养2-3周,或直至苗发育。将绿色苗从每个胚转移至生根培养基并在25℃培养2-3周,直至根发育。将生根的苗移植至温室的土壤中。从表现选择剂耐受的并含有单拷贝的T-DNA插入物的植物中产生T1种子。
大豆转化
根据对Texas A&M美国专利5,164,310中所述方法的改良方法转化大豆。几个商业大豆品种对于通过这种方法的转化是可行的。栽培品种Jack(从Illinois种子基金会可获得)通常用于转化。对大豆种子消毒以便体外播种。从7日龄幼苗中切下下胚轴、胚根和一片子叶。进一步培育上胚轴和余下的子叶以发育腋生节。将这些腋生节切下并与含有表达载体的根癌农杆菌温育。在共培育处理之后,将外植体洗涤并转移至选择培养基。将再生的苗切下并置于苗伸长培养基上。将长度不超过1cm的苗置于生根培养基上直至根发育。将生根的苗移植至温室的土壤中。从表现选择剂耐受的并含有单拷贝T-DNA插入物的植物中产生T1种子。
油菜籽/卡诺拉油菜转化
使用5-6日龄幼苗的子叶柄和下胚轴作为用于组织培养的外植体并且根据Babic等(1998,Plant Cell Rep 17:183-188)转化。商业栽培品种Westar(Agriculture Canada)是用于转化的标准品种,但是也可以使用其他品种。对卡诺拉油菜种子作表面消毒以便体外播种。从体外幼苗中切下具有附着子叶的子叶柄外植体,并以(含有表达载体的)农杆菌通过叶柄外植体的切口端浸入细菌混悬液而接种。外植体随后在含有3mg/l BAP、3%蔗糖、0.7%植物琼脂(Phytagar)的MSBAP-3培养基上在23℃,16小时光照下培养2天。在与农杆菌共培育2日后,将叶柄外植体转移至含有的3mg/l BAP、头孢噻肟、羧苄青霉素或特美汀(300mg/l)的MSBAP-3培养基上持续7日,并且随后在含头孢噻肟、羧苄青霉素或特美汀和选择剂的MSBAP-3培养基上培养,直至苗再生。当苗具有5-10mm长度时,将苗切下并转移至苗伸长培养基(含0.5mg/l BAP的MSBAP-0.5)。将长度大约2cm的苗转移至用于根诱导的生根培养基(MS0)。将生根的苗移植至温室的土壤中。从表现选择剂耐受性并含有单拷贝T-DNA插入物的植物中产生T1种子。
苜蓿转化
苜蓿(Medicago sativa)的再生性克隆使用(McKersie等,1999PlantPhysiol 119:839-847)的方法加以转化。苜蓿的再生和转化是基因型依赖性的并且因而需要再生植物。已经描述了获得再生性植物的方法。例如,这些再生性植物可以选自栽培品种Rangelander(Agriculture Canada)或如Brown DCW与A Atanassov(1985.Plant Cell Tissue Culture 4:111-112)描述的任何其他商业苜蓿品种。备选地,RA3品种(威斯康星大学)已经被选择用于组织培养中(Walker等,1978Am J Bot 65:654-659)。将叶柄外植体与含有表达载体的根癌农杆菌C58C1pMP90(McKersie等,1999PlantPhysiol 119:839-847)或LBA4404的过夜培养物共培育。外植体在黑暗中在含有288mg/L Pro、53mg/L硫代脯氨酸、4.35g/L K2SO4和100μm乙酰丁香酮的SH诱导培养基上共培育3天.外植体在半浓缩Murashige-Skoog培养基(Murashige和Skoog,1962)中洗涤并平板接种在不含乙酰丁香酮而含有合适选择剂和合适抗生素以抑止农杆菌生长的相同SH诱导培养基上。在数周后,将体细胞胚转移至不含生长调节剂、不含抗生素而含有50g/L蔗糖的BOi2Y发育培养基中。体细胞胚随后在半浓缩Murashige-Skoog培养基上萌发。将生根的幼苗移植至花钵内并且在温室中培育。从表现选择剂耐受性并含有单拷贝T-DNA插入物的植物中产生T1种子。
实施例5:在稻WS118启动子控制下的AZ在稻中的表达的评价准备
产生大约15至20个独立的T0稻转化体。原代转化体从组织培养箱转移至温室用于生长和收获T1种子。留下7个事件,其中所述事件的T1后代对转基因的存在/不存在以3∶1比例分离。对于这些事件中的每一事件,通过监测目视标记表达而选择含有转基因的大约10株T1幼苗(杂合子和纯合子)和缺少转基因的大约10株T1幼苗(失效合子)。将选择的T1植物转移至温室。每个植物接受唯一的条形码标签以明确地将表型分型数据与对应的植物联系起来。选择的T1植物在10cm直径特别设计的花钵(花钵具有透明底部以使根可视)中的土壤上于下列环境设置下培育:光周期=11.5小时,日光密度=30,000lux,昼间温度=28℃或更高,夜间温度=22℃,相对湿度=60-70%。转基因植物和对应的失效合子在随机位置上并排培育。悉心照料使植物不受任何胁迫。使植物从播种期直至成熟期通过数字成像箱数次。在每一时间点上,对每株植物从至少6个不同角度拍摄数字图像(2048×1536像素,1600万颜色)。在植物生长期数字照相机还通过花钵底部记录图像。
干旱筛选
在正常条件下在花盆土中培养来自T2种子的植物,直到进入抽穗期。然后将其转移到“干燥”区域,停止灌溉。向随机选择的花盆中插入湿度探测仪,以监测土壤水含量(SWC)。当SWC低于一定的阈值时,自动向植物持续补水,直到再次达到正常水平。然后将植物再次重新转移到正常条件下。其余的栽培(植物成熟、种子收获)与不在非生物胁迫条件下培养的植物相同。记录生长和产量阐述参数,作为生长在正常条件下的细节。
氮利用效率筛选
在除营养液以外正常的条件下在花盆土中培养来自T2种子的稻植物。从植物移植到成熟一直用特定的营养液对花盆浇水,所述营养液的氮(N)含量降低,通常低7到8倍。其余的栽培(植物成熟、种子收获)与不在非生物胁迫条件下培养的植物相同。记录生长和产量阐述参数,作为生长在正常条件下的细节。
植物地上部分面积(或叶生物量)通过计数在来自植物地上部分的数字图像上区别于背景的像素的总数而测定。该值对在相同时间点上从不同角度拍摄的画面进行平均化并且通过校正转化成以平方mm表达的物理表面值。实验证实以这种方式测量的地上部分植物面积与地上植物部分的生物量相关。地上部分面积是在植物已经达到其最大叶生物量的时间点。使用适宜的软件从产生的图像推导出根的特征,例如总投影面积(其可与总的根体积相关)、平均直径和高于某个粗度阈值的根的长度(粗根的长度或细根的长度)。
将成熟的主圆锥花序收获、装袋、加条形码标记并且随后在干燥箱内在37℃干燥3日。随后将圆锥花序脱粒并且收集全部种子。使用鼓风设备分开饱满粒与空粒。在分离后,然后使用商购获得的计数器对两批种子均进行计数。弃去空粒。饱满粒在分析天平上称重和使用数字图像测量种子的横截面积。该方法产生以下一组种子相关参数集:
饱满种子数通过计数分离步骤后的饱满粒数而确定。种子总产量(种子总重量)通过称量从植物中收获的全部饱满粒而测量。每株植物种子总数通过计数从植物中收获的壳粒数目而测量。收获指数(HI)在本发明中定义为种子总产量与地上部分面积(mm2)之间的比,乘以系数106。从计数的饱满种子数及其总重量外推出千粒重(TKW)。如本发明中定义的种子饱满率是饱满种子数对种子(或小花)总数的比例(表述为%)。可使用图像分析软件以自动化的方式从数字图像推导出这些参数,然后对这些参数进行统计学分析。使用与图像分析软件偶联的定制装置(由2个主要组件,称重和成像装置,组成),测量单个种子的参数(包括宽度、长度、面积、重量)。
使用对非平衡设计作出校正的双因子ANOVA(方差分析)作为统计模型用于植物表型特征的总体评价。对用所述基因转化的全部事件的全部植物的全部测量参数实施F检验。实施F检验以检查基因对于全部转化事件的作用并验证基因的整体作用(又称作“基因全局作用”)。若F检验的值显示该数据是显著的,则可以得出存在“基因”作用的结论,意味着不仅仅基因的存在或位置才造成所述作用。对于F检验,用于真实全局基因作用的显著性的阈值设置在5%概率水平。
为检查基因在事件中的作用,即株系特异性作用,使用来自转基因植物和对应的无效植物的数据集在每个事件内进行t检验。“无效植物”或“无效分离子”或“失效合子”是以与转基因植物相同的方式受到处理,但是转基因已经从中发生分离的植物。无效植物也可以描述为纯合阴性转化植物。用于t检验的显著性的阈值设置在10%概率水平上。一些事件的结果可以高于或低于这个阈值。这基于如此假设,即基因可能仅在基因组中某些位置内具有作用,并且这种位置依赖性作用的出现并非罕见。这种基因作用在本文中又称作“基因的株系作用”。p-值通过t-值与t-分布比较或备选地通过F-值与F-分布比较而获得。该p-值随后给出无效假设(即转基因的作用不存在)是正确的概率。
在使用T2植物的第二实验中确认了第一实验中针对AZ获得的数据。选择具有正确表达模式的4个品系进行进一步分析。通过监测标记的表达,筛选来自T1中的阳性植物(杂合子和纯合子)的种子批(Seed batch)。对于每一个选择的事件,然后保留杂合子种子批以进行T2评估。在每批种子中,在温室中生长相同数量的阳性和阴性植物以进行评估。
在T2代中评估了总数为120株的AZ转化植物,即每事件30株植物,其中15株为转基因阳性的,15株为转基因阴性的。
由于进行的两种实验具有重叠事件,因此进行组合分析。这可用于检查两种实验中效应的一致性,并且如果情况果真如此,其可用于从两种实验中收集证据从而增加结论的可信性。使用的方法是考虑到数据的多级结构(即实验-事件-分离子)的混合模型方法。通过比较卡方分布的似然比测试来获得p值。
实施例6:AZ转化体评价:测量产量相关参数
在如上所述对种子分析时,本发明人发现与缺少AZ转基因的植物相比,用AZ基因构建体转化的植物具有更高种子产量,其表达为(更高的)千粒重。此外,与对照植物相比在携带转基因的植物中发现增加的萌发势和增加的绿度系数。
对构建体之一而言,在T1代中千粒重增加了2.7%。这些阳性结果又在T2代中获得(2.1%的增加)。在组合分析中联合T1代的结果重新评估这些T2数据,获得的P值显示观察到的效应是高度显著的。
实施例7:AtSYT1的基因克隆
使用拟南芥幼苗cDNA文库(Invitrogen,Paisley,UK)作为模板通过PCR扩增拟南芥AtSYT1基因。在反转录从幼苗提取的RNA后,将cDNA克隆入pCMV Sport 6.0。文库的平均插入物大小为1.5kb,克隆的原始数目是1.59×107cfu的级别。在6×1011cfu/ml的第一次扩增后,初始滴度确定为9.6×105cfu/ml。在质粒提取后,将200ng模板用于50μl PCR混合物中。将包含用于Gateway重组的AttB位点的引物prm06681(SEQ ID NO:148;有义,起始密码子为粗体字,AttB1位点为斜体:5’-
CTTAAACA
CAACAGCACCTGATG-3’)和prm06682(SEQ ID NO:149;反向,互补,AttB2位点为斜体:5’-
CATCATTAAGATTCCTTGTGC-3’)用于PCR扩增。在标准条件中使用Hifi Taq DNA聚合酶进行PCR。也使用标准方法扩增和纯化727bp的PCR片段(包括attB位点)。然后进行Gateway方法的第一步骤BP反应,在该步骤期间,PCR片段与pDONR201质粒进行体内重组,从而产生,按照Gateway命名法的“入门克隆”,p07466。质粒pDONR201作为
技术的一部分购自Invitrogen。
实施例8:载体的构建
随后将入门克隆p07466与用于植物(稻)转化的目的载体p00640一起用于LR反应。该载体在T-DNA边界内以功能性元件的形式包含:植物选择标记、可筛选的标记表达盒和旨在用于与已克隆入入门克隆的目的序列进行LR体内重组的Gateway盒。用于组成型表达的稻GOS2启动子(SEQ ID NO:145)(PRO0129)位于该Gateway盒的上游。
已描述了用于植物转化的许多不同的二元(和超级二元)载体系统(例如An,G.in Agrobacterium Protocols.Methods in Molecular Biology第44卷,pp 47-62,Gartland KMA和MR Davey eds.Humana Press,Totowa,NewJersey)。许多载体系统基于Bevan(Nucleic Acid Research.1984.12:8711-8721)描述的载体pBIN19,该载体包含侧翼连接来自根癌农杆菌Ti质粒的左和右边界序列的植物基因表达盒。植物基因表达盒由至少两个基因——选择标记基因和调控性状基因的cDNA或基因组DNA的转录的植物启动子——组成。可使用不同的选择标记基因,包括编码突变的乙酰羟酸合酶(AHAS)的拟南芥基因(美国专利57673666和6225105)。类似地,可使用不同的启动子调控性状基因以实现对基因转录的组成型、发育型、组织型或环境型调控。
在LR重组步骤后,热休克或电穿孔方案将产生的表达载体pGOS2::AtSYT1(图9)转化至农杆菌菌株LBA4044。转化的菌落在YEP培养基上以28℃生长2天,并用相应的抗生素选择。这些农杆菌培养物用于植物转化。
其他根瘤农杆菌菌株可以用于植物转化且是本领域公知的。此类菌株实例是C58C1或EHA105。
实施例9:植物转化
稻转化
含有表达载体的农杆菌独立地用来转化稻植物。将稻的日本栽培品种Nipponbare的成熟干燥种子脱壳。通过在70%乙醇中温育一分钟,随后在2%HgCl2中30分钟,随后用无菌蒸馏水洗涤6次15分钟而实施消毒。消毒的种子随后在含有2,4-D的培养基(愈伤组织诱导培养基)上萌发。在黑暗中温育4周后,将盾片衍生的胚发生性愈伤组织切下并在同一种培养基上增殖。2周后,愈伤组织通过在同一种培养基上传代培养另外2周而繁殖或增殖。胚发生性愈伤组织片在新鲜培养基上传代培养3日,之后共培育(以增强细胞分裂活性)。
含有表达载体的农杆菌菌株LBA4404用于共培育。农杆菌接种在含有适宜抗生素的AB培养基上并在28℃培养3日。随后将细菌收集并重悬在液体共培育培养基中至密度(OD600)约1。将混悬液随后转移至培养皿并将愈伤组织在该混悬液内浸泡15分钟。愈伤组织组织随后在滤纸上吸干并转移至固化的共培育培养基上并且在黑暗中于25℃温育3日。共培育的愈伤组织在黑暗中于28℃在选择剂存在下于含有2,4-D的培养基上培育4周。在此时段期间,形成迅速生长的抗性愈伤组织岛。在这种材料转移至再生培养基并在光线下温育后,胚发生潜力释放并且苗在随后4-5周发育。将苗从愈伤组织中切下并且在含有植物生长素的培养基上温育2-3周,其中将苗从所述的培养基上转移至土壤。硬化的苗在高湿度和短日照下于温室中培育。
一个构建体产生大约35个独立T0稻转化体。将原代转化体从组织培养箱转移至温室。在定量PCR分析以验证T-DNA插入物的拷贝数后,仅保留表现选择剂耐受性的单拷贝转基因植物用于收获T1种子。种子随后在移植后3-5月收获。本方法以超过50%的比率产生单一基因座转化体(Aldemita和Hodges1996,Chan等1993,Hiei等1994)。
玉米转化
玉米的转化根据对Ishida等(1996.Nature Biotech 14745-50)描述方法的改良方法进行。在玉米中的转化是基因型依赖的并且仅特定的基因型可操作用于转化和再生。近交系A188(明尼苏达大学)或以A188作为亲本的杂种是用于转化的供体材料的良好来源,但是其他基因型也可以成功地使用。玉米穗从玉米植物中在授粉后大约11日(DAP)收获,此时不成熟胚的长度是大约1至1.2mm。不成熟胚与含有表达载体的根癌农杆菌共培育并且转基因植物通过器官发生而恢复。切下的胚在愈伤组织诱导培养基上、随后在玉米再生培养基上培育,其中所述的再生培养基含有选择剂(例如咪唑啉酮,但可以使用多种选择标记)。培养板在25℃于光照下培养2-3周,或直至苗发育。将绿色苗从每个胚转移至玉米生根培养基并在25℃培养2-3周,直至根发育。将生根的苗移植至温室的土壤中。从表现选择剂耐受的并含有单拷贝的T-DNA插入物的植物中产生T1种子。
小麦转化
小麦的转化用Ishida等Ishida等(1996)Nature Biotech 14(6):745-50描述的方法进行。通常在转化中使用(可从墨西哥CIMMYT获得的)栽培品种Bobwhite。不成熟胚与含有表达载体的根癌农杆菌共培育并且转基因植物通过器官发生而恢复。在与农杆菌温育后,胚在愈伤组织诱导培养基上、随后在再生培养基上体外培育,其中所述的再生培养基含有选择剂(例如咪唑啉酮,但可以使用多种选择标记)。培养平板在25℃于光照下培养2-3周,或直至苗发育。将绿色苗从每个胚转移至生根培养基并在25℃培养2-3周,直至根发育。将生根的苗移植至温室的土壤中。从表现选择剂耐受的并含有单拷贝的T-DNA插入物的植物中产生T1种子。
大豆转化
根据对Texas A&M美国专利5,164,310中所述方法的改良方法转化大豆。几个商业大豆品种对于通过这种方法的转化是可行的。栽培品种Jack(从Illinois种子基金会可获得)通常用于转化。对大豆种子消毒以便体外播种。从7日龄幼苗中切下下胚轴、胚根和一片子叶。进一步培育上胚轴和余下的子叶以发育腋生节。将这些腋生节切下并与含有表达载体的根癌农杆菌温育。在共培育处理之后,将外植体洗涤并转移至选择培养基。将再生的苗切下并置于苗伸长培养基上。将长度不超过1cm的苗置于生根培养基上直至根发育。将生根的苗移植至温室的土壤中。从表现选择剂耐受的并含有单拷贝T-DNA插入物的植物中产生T1种子。
油菜籽/卡诺拉油菜转化
使用5-6日龄幼苗的子叶柄和下胚轴作为用于组织培养的外植体并且根据Babic等(1998,Plant Cell Rep 17:183-188)转化。商业栽培品种Westar(Agriculture Canada)是用于转化的标准品种,但是也可以使用其他品种。对卡诺拉油菜种子作表面消毒以便体外播种。从体外幼苗中切下具有附着子叶的子叶柄外植体,并以(含有表达载体的)农杆菌通过叶柄外植体的切口端浸入细菌混悬液而接种。外植体随后在含有3mg/l BAP、3%蔗糖、0.7%植物琼脂(Phytagar)的MSBAP-3培养基上在23℃,16小时光照下培养2天。在与农杆菌共培育2日后,将叶柄外植体转移至含有的3mg/l BAP、头孢噻肟、羧苄青霉素或特美汀(300mg/l)的MSBAP-3培养基上持续7日,并且随后在含头孢噻肟、羧苄青霉素或特美汀和选择剂的MSBAP-3培养基上培养,直至苗再生。当苗具有5-10mm长度时,将苗切下并转移至苗伸长培养基(含0.5mg/l BAP的MSBAP-0.5)。将长度大约2cm的苗转移至用于根诱导的生根培养基(MS0)。将生根的苗移植至温室的土壤中。从表现选择剂耐受性并含有单拷贝T-DNA插入物的植物中产生T1种子。
苜蓿转化
苜蓿(的再生性克隆使用(McKersie等,1999Plant Physiol 119:839-847)的方法加以转化。苜蓿的再生和转化是基因型依赖性的并且因而需要再生植物。已经描述了获得再生性植物的方法。例如,这些再生性植物可以选自栽培品种Rangelander(Agriculture Canada)或如Brown DCW与AAtanassov(1985.Plant Cell Tissue Culture 4:111-112)描述的任何其他商业苜蓿品种。备选地,RA3品种(威斯康星大学)已经被选择用于组织培养中(Walker等,1978Am J Bot 65:654-659)。将叶柄外植体与含有表达载体的根癌农杆菌C58C1pMP90(McKersie等,1999Plant Physiol 119:839-847)或LBA4404的过夜培养物共培育。外植体在黑暗中在含有288mg/L Pro、53mg/L硫代脯氨酸、4.35g/L K2SO4和100μm乙酰丁香酮的SH诱导培养基上共培育3天.外植体在半浓缩Murashige-Skoog培养基(Murashige和Skoog,1962)中洗涤并平板接种在不含乙酰丁香酮而含有合适选择剂和合适抗生素以抑止农杆菌生长的相同SH诱导培养基上。在数周后,将体细胞胚转移至不含生长调节剂、不含抗生素而含有50g/L蔗糖的BOi2Y发育培养基中。体细胞胚随后在半浓缩Murashige-Skoog培养基上萌发。将生根的幼苗移植至花钵内并且在温室中培育。从表现选择剂耐受性并含有单拷贝T-DNA插入物的植物中产生T1种子。
实施例10:在非生物胁迫下AtSYT1转基因植物的评价准备
留下4个事件,其中所述事件的T1后代对转基因的存在/不存在以3:1比例分离。对于这些事件中的每一事件,通过监测目视标记表达而选择含有转基因的大约15株T1幼苗(杂合子和纯合子)和缺少转基因的大约15株T1幼苗(失效合子)。转基因植物和对应的失效合子在随机位置上并排培育。温室条件是短日照(12小时光照),在光线下平均温度28℃和在黑暗中22℃以及平均相对湿度70%。
盐胁迫筛选
在由椰子纤维和argex(3比1的比例)制成的基质上培养植物。在将幼苗移植至温室后的前两周使用正常的营养液。前两周过后,向营养液中添加25mM的盐(NaCl),直到收获植物为止。随后测量种子相关参数。
干旱筛选
在正常条件下在花盆土中培养植物,直到进入抽穗期。然后将其转移到“干燥”区域,停止灌溉。向随机选择的花盆中插入湿度探测仪,以监测土壤水含量(SWC)。当SWC低于一定的阈值时,自动向植物持续补水,直到再次达到正常水平。然后将植物再次重新转移到正常条件下。其余的栽培(植物成熟、种子收获)与不在非生物胁迫条件下培养的植物相同。随后测量种子相关参数。
对转基因植物施加水胁迫的一个备选方法是用包含渗压剂例如聚乙二醇(PEG)的水在特定的水势下处理转基因植物。因为PEG可能是有毒的,因此只对植物提供短期的暴露,然后重新开始正常浇水。
减少的养分(氮)可用性筛选
在除营养液以外正常的条件下在花盆土中培养稻植物。从植物移植到成熟一直用特定的营养液对花盆浇水,所述营养液的氮(N)含量降低,通常低7到8倍。其余的栽培(植物成熟、种子收获)与不在非生物胁迫条件下培养的植物相同。随后测量种子相关参数。
统计学分析:F检验
将双因素ANOVA(方差分析)用作总体评估植物表型特征的统计学模型。对用本发明基因转化的所有植株的所有事件的所有测量参数进行F检验。进行F检验以检查基因对所有转化事件的效应,并检验基因的总体效应,亦称为“总体基因效应”。真实的总体基因效应的显著性阈值设置为F检验的5%概率水平。如果显著性F检验值指向某基因效应,这意味着不仅仅是基因的存在或位置引起表型上的差异。
生物量相关参数的测量
从播种期到成熟期,植物多次通过数码成像箱。在每个时间点上对每株植物从至少6个不同的角度获取数码图像(2048×1536像素,1千6百万色)。
植物地上面积(或者说叶生物量)通过计数区别于背景的地上植物部分数码图像的像素总数而确定。此值取同一时间点从不同的角度拍摄的照片的平均值,并通过校准转换为以平方毫米表示的物理表面值(physicalsurface value)。实验表明通过这种方法测量的地上植物面积与植物地上部分的生物量相关。地上面积在植物达到其最大叶生物量的时间点取值。早期活力表现为萌发后三周的植物(幼苗)地上面积。
种子相关参数的测量
收获成熟的主圆锥花序、计数、袋装、用条形码标记,然后在37℃下在烘箱中干燥3天。然后对圆锥花序脱粒,收集所有种子和进行计数。使用鼓风机将饱满谷壳与空谷壳分离。弃去空谷壳,然后对剩余级分再次计数。在分析天平上称取饱满谷壳的重量。通过计数在分离步骤后留下的饱满谷壳的数目来确定饱满种子的数目。通过称取从植物收获的所有饱满谷壳的重量来测量总的种子产量。通过计数从植物收获的谷壳的数目来测量每株植物的总的种子数目。根据计数的饱满种子的数目和其总重量推算千粒重(TKW)。收获指数(HI)在本发明定义为种子总产量和地上面积(mm2)之间的比率乘以因子106。每圆锥花序的花的总数在本发明定义为种子总数与成熟的主圆锥花序的数目之间的比率。种子饱满率在本发明定义为饱满种子的数目占种子(或小花)总数的百分比。
实施例11:在非生物胁迫(盐胁迫)下AtSYT1转基因稻植物的评价结果
表B中给出了对受盐胁迫的AtSYT1转基因稻植物的评价结果。还显示转基因植物和对应的失效合子之间的差异百分数,来自F检验的P值低于0.05。
在非生物胁迫下与对照植物(在这种情况下,失效合子)相比,地上生物量、早期萌发势、种子总产量、饱满种子数、种子饱满率、TKW和收获系数在AtSYT1转基因植物中显著增加。
表B:在非生物胁迫下AtSYT1转基因稻植物的评价结果。
性状 %差异
地上生物量 19
早期萌发势 18
种子总产量 30
饱满种子数 18
饱满率 15
TKW 10
收获系数 16
实施例12:与SEQ ID NO:154和SEQ ID NO:155相关的序列的鉴定
使用数据库搜索工具例如基本局部比对工具(Basic Local AlignmentTool)(BLAST)(Altschul等人(1990)J.Mol.Biol.215:403-410;和Altschul等人(1997)Nucleic Acids Res.25:3389-3402),在美国国家生物技术信息中心(NCBI)Entrez核苷酸数据库维护的序列中,鉴定与SEQ IDNO:154和SEQ ID NO:155相关的序列(全长cDNA、EST或基因组序列)。通常BLAST程序通过将核酸或多肽序列与序列数据库进行比较,以及通过计算匹配的统计学显著性,用于寻找序列之间具有局部相似性的区域。对核酸SEQ ID NO:154所编码的多肽运用TBLASTN算法,使用缺省设置,开启过滤器,以忽略低复杂度序列。分析的输出视窗为两两比较,并根据概率分值(E值)排序,其中分值反映特定比对偶然发生的概率(E值越低,命中事件的显著性越高)。除了E值之外,还对比较进行同一性百分比记分。同一性百分比是指两比较核酸(或多肽)序列之间在特定长度上的相同核苷酸(或氨基酸)数。在有些情况下,可以调整缺省参数以更改搜索的严格度。
除了可在NCBI上获得的公共可获得的核酸序列外,还按照与上述的方法相同的方法搜索私人序列数据库。
表C提供了与SEQ ID NO:154表示的核酸序列相关的核酸序列列表。
表C:可用于本发明方法的与核酸序列(SEQ ID NO:154)相关的核酸序列,以及相应的推导多肽。
名称 来源生物 核酸 SEQ ID NO: 多肽 SEQ ID NO: 数据库登录号 状态
Chlre_cpFBPase 莱茵衣藻 (Chlamydomonas reinhardtii) 154 155 来自AW721488 BQ811919 CF555540 全长
Bigna_cpFBPase Bigelowiella natans 156 157 AY267678 全长
Aqufo_cpFBPase Aquilegia formosa x Aquilegia pubescens 158 159 DR944021 DT749545 全长
Arath_cpFBPase 拟南芥 160 161 X58148 全长
Brana_cpFBPase 欧洲油菜 162 163 AF081796 全长
Cyame_cpFBPase Cyanidioschyzon merolae 164 165 CMO245C* 全长
Glyma_cpFBPase 大豆 166 167 L34841 全长
Lyces_cpFBPase 番茄 168 169 BT014319 全长
Medtr_cpFBPase 蒺藜苜蓿 170 171 BI310407 BI265103 CO516140 全长
Nicta_cpFBPase 烟草 172 173 DW000613 EB680028 全长
Orysa_cpFBPase 稻 174 175 AB007194 全长
Ostlu_cpFBPase Ostreococcus lucimarinus 176 177 jgi|Ost9901_3|92356 |ost_03_002_042** 全长
Ostta_cpFBPase Ostreococcus tauri 178 179 CR954203 全长
Phatr_cpFBPase 三角褐指藻 180 181 scaffold_27:145102-145476** 全长
Pissa_cpFBPase 成熟豌豆 182 183 L34806 全长
Pontr_cpFBPase 枸桔(Poncirus trifoliata) 184 185 CV705787 CV705786 全长
Poptr_cpFBPase 美洲山杨 186 187 CV241715 DT474034 全长
Soltu_cpFBPase 马铃薯 188 189 AF1340451 全长
Spiol_cpFBPase 菠菜 190 191 L76555 全长
Triae_cpFBPase 普通小麦 192 193 X07780 全长
Zeama_cpFBPase 玉蜀黍 194 195 DR792524.1 DT645374.1 全长
Phypa_cpFBPase 小立碗藓 196 197 BY991118.1 BJ168552.1 +proprietary 全长
Galsu_cpFBPase Galderia sulphuraria 198 199 AJ302644 部分
Marpo_cpFBPase 地钱(Marchantia polymorpha) 200 201 BJ862191 部分
Tagpa_cpFBPase 孔雀草(Tagetes patula) 202 203 Contig CON_01b-cs_scarletade-4-e3.b1 proprietary 部分
Linus_cpFBPase 204 204 205 contig6298 proprietary 部分
*Cyanidioschyzon merolae数据库位于Tokyo大学的生物系
**Ostreococcus lucimarinus和三角褐指藻e数据库位于DOE JointGenome Institute,US Department of Energy
实施例13:相关多肽序列的比对
来自Vector NTI(Invitrogen)的AlignX基于普遍使用的渐进比对的聚类算法(Clustal algorithm)(Thompson等人(1997)Nucleic Acids Res25:4876-4882;Chenna等人(2003).Nucleic Acids Res 31:3497-3500)。可使用邻接聚类算法构建系统树。空位开放罚分的缺省值为10,空位延伸罚分的缺省值为0.1,选择的权重矩阵是Blosum 62(如果比对多肽)。
在鉴定可用于实施本发明方法的多肽中,使用相关多肽获得的多序列比对结果示于本申请的图12中。叶绿体FBPase多肽(cpFBPase)与胞质FBPase(cyFBPase)不同于叶绿体FBPase多肽的N末端存在供质体(叶绿体)亚细胞靶向(图中加框表示)的转运肽。此外,前者包含氨基酸插入(也加框表示,且命名为氧化还原调控插入片段),所述氨基酸插入包括至少两个二硫键形成(即氧化还原调控)所必需的半胱氨酸残基。保守半胱氨酸以它们在成熟豌豆(Pisum sativa)cpFBPase多肽中的位置命名,即Cys153、Cys173和Cys178。Cys153和Cys173通常是参与二硫键形成的两个配偶体(Chiadmi等人.(1999)EMBO J 18(23):6809-6815)。如Prosite数据库中定义cpFBPase的活性位点基序是PS00124且与以下氨基酸序列对应:[AG]-[RK]-[LI]-X(1,2)-[LIV]-[FY]-E-X(2)-P-[LIVM]-[GSA],其中[RK]是结合的活性位点,且X是任意氨基酸。预测活性位点基序和预测活性位点本身(包括在所述基序内)在图12中也被框表示。在图12中还鉴定到结合果糖-1,6-二磷酸的6-磷酸的氨基酸残基Asn237、Tyr269、Tyr289和Arg268,和结合果糖的氨基酸残基Lys299(Chiadmi等人.(1999)EMBO J 18(23):6809-6815)。后面这些也以它们在成熟豌豆(Pisumsativa)cpFBPase多肽中的位置编号。
实施例14:计算可用于实施本发明方法的多肽序列之间的全局百分比同一性(global percentage identity)
使用可在本领域内获得的方法中的一个方法MatGAT(矩阵全局比对工具(Matrix Global Alignment Tool))软件(BMC Bioinformatics.20034:29.MatGAT:an application that generates similarity/identity matricesusing protein or DNA sequences.Campanella JJ,Bitincka L,Smalley J;由Ledion Bitincka托管的软件),确定可以用于实施本发明的方法的全长多肽序列之间的全局相似性和同一性百分比。MatGAT软件无需对数据进行预比对,即可产生DNA或蛋白质序列的相似性/同一性矩阵。该程序利用Myers和Miller全局比对算法(空位开放罚分为12,而空位延伸罚分为2)进行一系列的两两比对,利用例如Blosum 62(对于多肽而言)计算相似性和同一性,然后将结果排列成距离矩阵。序列相似性示于对角线下半部,而序列同一性示于对角线上半部。
比较所用的参数有:
记分矩阵:Blosum 62
首个空位:12
延伸空位:2
多肽序列全长范围(将部分多肽序列排除在外)的全局相似性和同一性的软件分析结果示于表D。对角线上方给出同一性百分比,而对角线下方给出相似性百分比。
与SEQ ID NO:155相比,可用于实施本发明方法的多肽序列之间的百分比同一性可以为低至40%的氨基酸同一性。
表D:全长多肽序列范围的全局相似性和同一性的MatGAT结果。
实施例15:鉴定在用于实施本发明方法的多肽序列内包含的结构域
蛋白质家族、结构域和位点集成资源(Integrated Resouce of ProteinFamilies,Domain and Site,InterPro)数据库是基于文本和序列的搜索的通常所用标签数据库的集成界面。InterPro数据库组合了这些数据库,所述的数据库使用不同方法学和不同程度的有关已充分表征蛋白质的生物学信息以得到蛋白质标签。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam、Smart和TIGRFAMs。Interpro驻留于英国的欧洲生物信息研究所。
InterPro扫描如SEQ ID NO:155所代表的多肽序列的结果在表E中。
表E:如SEQ ID NO:155所代表的多肽序列的InterPro扫描结果
数据库 检索号 检索名称
InterPro IPR000146 肌醇磷酸酶/果糖-1,6-二磷酸酶
ProDom PD001491 肌醇磷酸酶/果糖-1,6-二磷酸酶
PRINTS PR00115 FBPHPHTASE
PIR超家族 PIRSF000904 果糖-1,6-二磷酸酶/景天庚酮糖-1,7-二磷酸酶
PANTHER PTHR11556 果糖-1,6-二磷酸酶-相关的
Pfam PF00316 FBPase
PROFILE PS00124 FBPASE活性位点
PROSITE PS00124 FBPASE活性位点
实施例16:用于实施本发明方法的多肽序列的拓扑学预测(亚细胞定位,跨膜...)
TargetP 1.1预测真核蛋白质的亚细胞定位。位置分配是基于任何氨基端前序列的预测的存在:叶绿体转运肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP)。作为最终预测基础的记分并不实际是概率,并且它们未必合为一体。然而,具有最高记分的位置根据TargetP是最有可能的,并且记分之间的关系(可靠性类别)可以是预测的肯定性的一个指标。可靠性类别(RC)是1-5,其中1表示最强预测。TargetP在丹麦技术大学的服务器上维护。
对于预测含有氨基端前序列的序列,也可以预测潜在的切割位点。
选择了众多参数,如生物组(非植物或植物)、临界设置(无、预定义设置的临界或用户指定设置的临界)和对切割位点预测的计算(是或否)。
如SEQ ID NO:155所代表的多肽序列的TargetP 1.1分析的结果在表F中显示。已经选择“植物”生物组,未定义临界值并且需要转运肽的预测长度。如SEQ ID NO:155所代表的多肽序列的亚细胞定位可以是叶绿体,且转运肽的预测长度是始于N-末端的56个氨基酸(不如亚细胞定位自身的可靠,可在数个氨基酸的长度上变化)。成熟碗豆cpFBPase具有长度为53个氨基酸的转运肽。当比对碗豆cpFBPase和cpFBPase SEQ lD NO:155时,可能推导后者转运肽的长度也是53个氨基酸。
表F:如SEQ ID NO:44所代表的多肽序列的TargetP 1.1分析
长度(AA) 415
叶绿体转运肽 0.832
线粒体转运肽 0.106
分泌途径信号肽 0.003
其他亚细胞靶向 0.065
预测的位置 叶绿体
可靠性类别 2
预测的转运肽长度 56
众多其他算法可以用来执行此类分析,包括:
在丹麦技术大学(Technical University of Denmar)服务器上驻留的ChloroP 1.1;
在澳大利亚布里斯班昆士兰大学分子生物科学研究所(Institute forMolecular Bioscience,University of Queensland,Brisbane,Australia)的服务器上驻留的蛋白质Prowler亚细胞定位预测程序(Protein ProwlerSubcellular Localisation Predictor)第1.2版;
在加拿大阿尔伯塔省埃德蒙顿市阿尔伯塔大学(University of Alberta,Edmonton,Alberta,Canada)的服务器上驻留的PENCE Proteme AnalystPA-GOSUB 2.5.
实施例17:与用于实施本发明方法的多肽序列相关的分析法
如SEQ ID NO:155所示的多肽序列是具有酶学委员会(EC;基于酶催化的反应的酶分类)编号EC 3.1.3.11,为果糖-二磷酸酶(也称为D-果糖-1,6-二磷酸1-磷酸水解酶)的酶。该功能性测定可以是基于Pi比色的cpFBPase活性测定的测定,如Huppe和Buchanan(1989),在Naturforsch.44c:487-494中所述。其他测定酶活性的方法由Alscher-Herman(1982)在PlantPhysiol 70:728-734中描述。
实施例18:克隆如SEQ ID NO:154所代表的核酸序列
除非另外声明,重组DNA技术根据(Sambrook(2001)MolecularCloning:a laboratory manual,第三版Cold Spring Harbor LaboratoryPress,CSH,New York)中或Ausubel等(1994),Current Protocols inMolecular Biology,Current Protocols第1和2卷中描述的标准方法进行。用于植物分子工作的标准材料和方法在由BIOS Scientific PublicationsLtd(UK)和Blackwell Scientific Publications(UK)出版的R.D.D.Croy的Plant Molecular Biology Labfax(1993)中描述。
本发明方法中所用的核酸序列通过PCR,使用购自杜克大学的Chlamy中心(以前的衣藻基因中心),North Carolina,美国的莱茵衣藻CC-1690cDNA文库(“Core文库”)(在来自Stratagene的λZAP II载体中)作为模板而扩增。在标准条件下使用Hifi Taq DNA聚合酶,利用在50μl PCR混合物中的200ng模板进行PCR。所用引物是
prm08448SEQ ID NO:206;有义,AttB1位点是小写字体:5’-ggggacaagtttgtacaaaaaagcaggcttaaacaatggccgccaccatg-3’;和prm08449(SEQ ID NO:207;反义,互补AttB2位点是小写字体:5’-ggggaccactttgtacaagaaagctgggtagctgcttagtgcttcttggt-3’,
其包括用于Gateway重组的AttB位点。扩增的PCR片段也使用标准方法予以纯化。随后实施Gateway方法的第一步骤,即BP反应,在此期间PCR片段与pDONR201质粒发生体内重组以产生根据Gateway命名的“进入克隆”,p15972。质粒pDONR201作为
技术的构成部分从Invitrogen购买。
实施例19:使用如SEQ ID NO:154所代表核酸序列构建表达载体
进入克隆p15972随后在LR反应中与p05050(一种用于稻转化的目的载体)一起使用。这种载体在T-DNA边界内含有作为功能性元件的:植物选择标记;筛选标记表达盒和意图与已经克隆于所述进入克隆内的目的核酸序列发生LR体内重组的Gateway盒。用于组成型表达(PRO0129)的稻GOS2启动子(SEQ ID NO:208)位于这种Gateway盒的上游。
在LR重组步骤后,产生的表达载体pGOS2::FBPase(图13)根据本领域众所周知的方法转化至农杆菌菌株LBA4044中。
实施例20:植物转化
稻转化
含有表达载体的农杆菌用来转化稻植物。将稻的日本栽培品种Nipponbare的成熟干燥种子脱壳。通过在70%乙醇中温育一分钟,随后在2%HgCl2中30分钟,随后用无菌蒸馏水洗涤6次15分钟而实施消毒。消毒的种子随后在含有2,4-D的培养基(愈伤组织诱导培养基)上萌发。在黑暗中温育4周后,将盾片衍生的胚发生性愈伤组织切下并在同一种培养基上增殖。2周后,愈伤组织通过在同一种培养基上传代培养另外2周而繁殖或增殖。胚发生性愈伤组织片在新鲜培养基上传代培养3日,之后共培育(以增强细胞分裂活性)。
含有表达载体的农杆菌菌株LBA4404用于共培育。农杆菌接种在含有适宜抗生素的AB培养基上并在28℃培养3日。随后将细菌收集并重悬在液体共培育培养基中至密度(OD600)约1。将混悬液随后转移至培养皿并将愈伤组织在该混悬液内浸泡15分钟。愈伤组织组织随后在滤纸上吸干并转移至固化的共培育培养基上并且在黑暗中于25℃温育3日。共培育的愈伤组织在黑暗中于28℃在选择剂存在下于含有2,4-D的培养基上培育4周。在此时段期间,形成迅速生长的抗性愈伤组织岛。在这种材料转移至再生培养基并在光线下温育后,胚发生潜力释放并且苗在随后4-5周发育。将苗从愈伤组织中切下并且在含有植物生长素的培养基上温育2-3周,其中将苗从所述的培养基上转移至土壤。硬化的苗在高湿度和短日照下于温室中培育。
一个构建体产生大约35个独立T0稻转化体。将原代转化体从组织培养箱转移至温室。在定量PCR分析以验证T-DNA插入物的拷贝数后,仅保留表现选择剂耐受性的单拷贝转基因植物用于收获T1种子。种子随后在移植后3-5月收获。本方法以超过50%的比率产生单一基因座转化体(Aldemita和Hodges1996,Chan等1993,Hiei等1994)。
玉米转化
玉米的转化根据对Ishida等(1996.Nature Biotech 14745-50)描述方法的改良方法进行。在玉米中的转化是基因型依赖的并且仅特定的基因型可操作用于转化和再生。近交系A188(明尼苏达大学)或以A188作为亲本的杂种是用于转化的供体材料的良好来源,但是其他基因型也可以成功地使用。玉米穗从玉米植物中在授粉后大约11日(DAP)收获,此时不成熟胚的长度是大约1至1.2mm。不成熟胚与含有表达载体的根癌农杆菌共培育并且转基因植物通过器官发生而恢复。切下的胚在愈伤组织诱导培养基上、随后在玉米再生培养基上培育,其中所述的再生培养基含有选择剂(例如咪唑啉酮,但可以使用多种选择标记)。培养板在25℃于光照下培养2-3周,或直至苗发育。将绿色苗从每个胚转移至玉米生根培养基并在25℃培养2-3周,直至根发育。将生根的苗移植至温室的土壤中。从表现选择剂耐受的并含有单拷贝的T-DNA插入物的植物中产生T1种子。
小麦转化
小麦的转化用Ishida等Ishida等(1996)Nature Biotech 14(6):745-50描述的方法进行。通常在转化中使用(可从墨西哥CIMMYT获得的)栽培品种Bobwhite。不成熟胚与含有表达载体的根癌农杆菌共培育并且转基因植物通过器官发生而恢复。在与农杆菌温育后,胚在愈伤组织诱导培养基上、随后在再生培养基上体外培育,其中所述的再生培养基含有选择剂(例如咪唑啉酮,但可以使用多种选择标记)。培养平板在25℃于光照下培养2-3周,或直至苗发育。将绿色苗从每个胚转移至生根培养基并在25℃培养2-3周,直至根发育。将生根的苗移植至温室的土壤中。从表现选择剂耐受的并含有单拷贝的T-DNA插入物的植物中产生T1种子。
大豆转化
根据对Texas A&M美国专利5,164,310中所述方法的改良方法转化大豆。几个商业大豆品种对于通过这种方法的转化是可行的。栽培品种Jack(从Illinois种子基金会可获得)通常用于转化。对大豆种子消毒以便体外播种。从7日龄幼苗中切下下胚轴、胚根和一片子叶。进一步培育上胚轴和余下的子叶以发育腋生节。将这些腋生节切下并与含有表达载体的根癌农杆菌温育。在共培育处理之后,将外植体洗涤并转移至选择培养基。将再生的苗切下并置于苗伸长培养基上。将长度不超过1cm的苗置于生根培养基上直至根发育。将生根的苗移植至温室的土壤中。从表现选择剂耐受的并含有单拷贝T-DNA插入物的植物中产生T1种子。
油菜籽/卡诺拉油菜转化
使用5-6日龄幼苗的子叶柄和下胚轴作为用于组织培养的外植体并且根据Babic等(1998,Plant Cell Rep 17:183-188)转化。商业栽培品种Westar(Agriculture Canada)是用于转化的标准品种,但是也可以使用其他品种。对卡诺拉油菜种子作表面消毒以便体外播种。从体外幼苗中切下具有附着子叶的子叶柄外植体,并以(含有表达载体的)农杆菌通过叶柄外植体的切口端浸入细菌混悬液而接种。外植体随后在含有3mg/lBAP、3%蔗糖、0.7%植物琼脂(Phytagar)的MSBAP-3培养基上在23℃,16小时光照下培养2天。在与农杆菌共培育2日后,将叶柄外植体转移至含有的3mg/l BAP、头孢噻肟、羧苄青霉素或特美汀(300mg/l)的MSBAP-3培养基上持续7日,并且随后在含头孢噻肟、羧苄青霉素或特美汀和选择剂的MSBAP-3培养基上培养,直至苗再生。当苗具有5-10mm长度时,将苗切下并转移至苗伸长培养基(含0.5mg/l BAP的MSBAP-0.5)。将长度大约2cm的苗转移至用于根诱导的生根培养基(MS0)。将生根的苗移植至温室的土壤中。从表现选择剂耐受性并含有单拷贝T-DNA插入物的植物中产生T1种子。
苜蓿转化
苜蓿的再生性克隆使用(McKersie等,1999Plant Physiol 119:839-847)的方法加以转化。苜蓿的再生和转化是基因型依赖性的并且因而需要再生植物。已经描述了获得再生性植物的方法。例如,这些再生性植物可以选自栽培品种Rangelander(Agriculture Canada)或如Brown DCW与AAtanassov(1985.Plant Cell Tissue Culture 4:111-112)描述的任何其他商业苜蓿品种。备选地,RA3品种(威斯康星大学)已经被选择用于组织培养中(Walker等,1978Am J Bot 65:654-659)。将叶柄外植体与含有表达载体的根癌农杆菌C58C1 pMP90(McKersie等,1999Plant Physiol 119:839-847)或LBA4404的过夜培养物共培育。外植体在黑暗中在含有288mg/L Pro、53mg/L硫代脯氨酸、4.35g/L K2SO4和100μm乙酰丁香酮的SH诱导培养基上共培育3天.外植体在半浓缩Murashige-Skoog培养基(Murashige和Skoog,1962)中洗涤并平板接种在不含乙酰丁香酮而含有合适选择剂和合适抗生素以抑止农杆菌生长的相同SH诱导培养基上。在数周后,将体细胞胚转移至不含生长调节剂、不含抗生素而含有50g/L蔗糖的BOi2Y发育培养基中。体细胞胚随后在半浓缩Murashige-Skoog培养基上萌发。将生根的幼苗移植至花钵内并且在温室中培育。从表现选择剂耐受性并含有单拷贝T-DNA插入物的植物中产生T1种子。
实施例21:表型评价方法
21.1评价准备
产生大约35个独立的T0稻转化体。原代转化体从组织培养箱转移至温室用于生长和收获T1种子。留下8个事件,其中所述事件的T1后代对转基因的存在/不存在以3∶1比例分离。对于这些事件中的每一事件,通过监测目视标记表达而选择含有转基因的大约10株T1幼苗(杂合子和纯合子)和缺少转基因的大约10株T1幼苗(失效合子)。转基因植物和对应的失效合子在随机位置上并排培育。温室条件是短日照(12小时光照),在光线下28℃和在黑暗中22℃以及相对湿度70%。
干旱筛选
在正常条件下在花盆土中培养来自T2种子的植物,直到进入抽穗期。然后将其转移到“干燥”区域,停止灌溉。向随机选择的花盆中插入湿度探测仪,以监测土壤水含量(SWC)。当SWC低于一定的阈值时,自动向植物持续补水,直到再次达到正常水平。然后将植物再次重新转移到正常条件下。其余的栽培(植物成熟、种子收获)与不在非生物胁迫条件下培养的植物相同。记录生长和产量阐述参数,作为生长在正常条件下的细节。
氮利用效率筛选
在除营养液以外正常的条件下在花盆土中培养来自T2种子的稻植物。从植物移植到成熟一直用特定的营养液对花盆浇水,所述营养液的氮(N)含量降低,通常低7到8倍。其余的栽培(植物成熟、种子收获)与不在非生物胁迫条件下培养的植物相同。记录生长和产量阐述参数,作为生长在正常条件下的细节。
4个T1事件在T2世代中按照如用于T1世代的相同评价方法作进一步评估,但每个事件采用更多的个体。使植物从播种期直至成熟期通过数字成像箱数次。在每一时间点上,对每株植物从至少6个不同角度拍摄数字图像(2048x1536像素,1600万颜色)。
21.2统计分析:F-检验
使用双因子ANOVA(方差分析)作为统计模型用于植物表型特征的整体评价。对用本发明基因转化的全部事件的全部植物的所有测量参数实施F检验。实施F检验以检查基因对于全部转化事件的作用并验证基因的整体作用(又称作全局基因作用)。用于真实全局基因作用的显著性的阈值对于F检验设置在5%概率水平上。显著性F检验值标示基因作用,意味着不仅仅基因的存在或位置才造成表型上的差异。
21.3参数测量
生物量相关参数的测量
从播种期到成熟期,植物多次通过数码成像箱。在每个时间点上对每株植物从至少6个不同的角度获取数码图像(2048×1536像素,1千6百万色)。
植物地上面积(或者说叶生物量)通过计数区别于背景的地上植物部分数码图像的像素总数而确定。此值取同一时间点从不同的角度拍摄的照片的平均值,并通过校准转换为以平方毫米表示的物理表面值(physicalsurface value)。实验表明通过这种方法测量的地上植物面积与植物地上部分的生物量相关。地上面积在植物达到其最大叶生物量的时间点取值。早期活力表现为萌发后三周的植物(幼苗)地上面积。
种子相关参数的测量
收获成熟的主圆锥花序、计数、袋装、用条形码标记,然后在37℃下在烘箱中干燥3天。然后对圆锥花序脱粒,收集所有种子和进行计数。使用鼓风机将饱满谷壳与空谷壳分离。弃去空谷壳,然后对剩余级分再次计数。在分析天平上称取饱满谷壳的重量。通过计数在分离步骤后留下的饱满谷壳的数目来确定饱满种子的数目。通过称取从植物收获的所有饱满谷壳的重量来测量总的种子产量。通过计数从植物收获的谷壳的数目来测量每株植物的总的种子数目。根据计数的饱满种子的数目和其总重量推算千粒重(TKW)。收获指数(HI)在本发明定义为种子总产量和地上面积(mm2)之间的比率乘以因子106。每圆锥花序的花的总数在本发明定义为种子总数与成熟的主圆锥花序的数目之间的比率。种子饱满率在本发明定义为饱满种子的数目占种子(或小花)总数的百分比。
实施例22:转基因植物的表型评价结果
表G中给出了表达用于本发明方法的核酸序列的转基因稻植物的评价结果。还显示转基因植物和对应的失效合子之间的差异百分数,来自F检验的P值低于0.05。
在非生物胁迫下与对照植物(在这种情况下,失效合子)相比,种子总产量、饱满种子数、种子饱满率和收获系数在表达用于本发明方法的核酸序列的转基因植物中显著增加。
表G:表达用于本发明方法的核酸序列的转基因稻植物的评价结果。
性状T1世代中的增加%T2世代中的增加%
种子总产量 7 28
饱满种子数 5 28
饱满率 6 19
收获系数 4 21
实施例23:基因克隆
通过PCR扩增稻基因,使用引物(SEQ ID NO:227;有义,起始密码子为粗体字,AttB1位点是斜体:5’-ggggacaagtttgtacaaaaaagcaggcttaaacaatgatgggttgcttcactgtc-3’)和(SEQ ID NO:228;反义,互补AttB2位点是斜体:5’-ggggaccactttgtacaagaaagctgggtatggacaatcaaaaaccctca-3’),其包括用于Gateway重组的AttB位点,用于PCR扩增。在标准条件下使用Hifi Taq DNA聚合酶进行PCR。扩增的PCR片段也使用标准方法予以纯化。随后实施Gateway方法的第一步骤,即BP反应,在此期间PCR片段与pDONR201质粒发生体内重组以产生根据Gateway命名的“进入克隆”。质粒pDONR201作为
技术的构成部分从Invitrogen购买。
实施例24:减量调节载体构建
进入克隆随后在LR反应中与用于减量调节构建体稻转化的目的载体一起使用。这种载体在T-DNA边界内含有:植物选择性标记;筛选标记表达盒和意图发生LR体内重组(因此来自进入克隆的目的序列以有义和反义方向整合)的Gateway盒。用于组成型表达的稻GOS2启动子(SEQ IDNO:226)位于这种Gateway盒的上游。
在LR重组步骤后,将产生的表达载体(图16)转化至农杆菌菌株LBA4044并随后转化至稻植物内。允许转化的稻植物生长并随后对实施例26中所述参数进行检验。
实施例25:超量表达载体构建
进入克隆随后在LR反应中与用于植物(稻)转化的目的载体一起使用。这种载体在T-DNA边界内含有:植物选择性标记;筛选标记表达盒和意图与已经克隆于所述进入克隆中的目的序列发生LR体内重组的Gateway盒。用于组成型表达的稻GOS2启动子位于这种Gateway盒的上游。
在LR重组步骤后,将产生的表达载体(图17)转化至农杆菌菌株LBA4044并随后转化至稻植物内。转化的菌落在YEP培养基上以28℃生长2天,并用相应的抗生素选择。这些农杆菌培养物用于植物转化。允许转化的稻植物生长并随后对实施例26中所述参数进行检验。
实施例26:以反义方向SIK转化的植物的评价
产生大约15至20个独立的T0稻转化体。原代转化体从组织培养箱转移至温室用于生长和收获T1种子。留下6个事件,其中所述事件的T1后代对转基因的存在/不存在以3∶1比例分离。对于这些事件中的每一事件,通过监测目视标记表达而选择含有转基因的大约10株T1幼苗(杂合子和纯合子)和缺少转基因的大约10株T1幼苗(失效合子)。将选择的T1植物转移至温室。每个植物接受唯一的条形码标签以明确地将表型分型数据与对应的植物联系起来。选择的T1植物在10cm直径花钵中的土壤上于下列环境设置下培育:光周期=11.5小时,日光密度=30,000lux,昼间温度=28℃或更高,夜间温度=22℃,相对湿度=60-70%。在最佳灌溉条件下培养植物,直到进入抽穗期,同时停止灌溉。向随机选择的花盆中插入湿度探测仪,以监测土壤水含量(SWC)。当SWC低于20%时,自动向植物持续补水,再次达到最佳灌溉条件。转基因植物和对应的失效合子在随机位置上并排培育。使植物从播种期直至成熟期通过数字成像箱数次。在每一时间点上,对每株植物从至少6个不同角度拍摄数字图像(2048x1536像素,1600万颜色)。
干旱筛选
在正常条件下在花盆土中培养来自T2种子的植物,直到进入抽穗期。然后将其转移到“干燥”区域,停止灌溉。向随机选择的花盆中插入湿度探测仪,以监测土壤水含量(SWC)。当SWC低于一定的阈值时,自动向植物持续补水,直到再次达到正常水平。然后将植物再次重新转移到正常条件下。其余的栽培(植物成熟、种子收获)与不在非生物胁迫条件下培养的植物相同。记录生长和产量阐述参数,作为生长在正常条件下的细节。
氮利用效率筛选
在除营养液以外正常的条件下在花盆土中培养来自T2种子的稻植物。从植物移植到成熟一直用特定的营养液对花盆浇水,所述营养液的氮(N)含量降低,通常低7到8倍。其余的栽培(植物成熟、种子收获)与不在非生物胁迫条件下培养的植物相同。记录生长和产量阐述参数,作为生长在正常条件下的细节。
植物地上部分面积(或叶生物量)通过计数在来自植物地上部分的数字图像上区别于背景的像素的总数而测定。该值对在相同时间点上从不同角度拍摄的画面进行平均化并且通过校正转化成以平方mm表达的物理表面值。实验证实以这种方式测量的地上部分植物面积与地上植物部分的生物量相关。最大面积是在植物已经达到其最大叶生物量的时间点的地上部分面积。
将成熟的主圆锥花序收获、装袋、加条形码标记并且随后在干燥箱内在37℃干燥3日。随后将圆锥花序脱粒并且收集全部种子。使用鼓风设备分开饱满粒与空粒。在分离后,然后使用商购获得的计数器对两批种子均进行计数。弃去空粒。饱满粒在分析天平上称重和使用数字图像测量种子的横截面积。该方法产生以下一组种子相关参数集:
每个圆锥花序的花数是估计植物上每个圆锥花序小花的平均数目的参数,该参数来自种子总数除以第一个圆锥花序数。最高圆锥花序以及垂直排列时与最高圆锥花序重叠的全部圆锥花序被视为第一圆锥花序并以手工方式计数。饱满种子数通过计数分离步骤后的饱满粒数而确定。种子总产量(总种子重)通过称量从植物中收获的全部饱满粒而测量。每株植物种子总数通过计数从植物中收获的壳粒数目而测量且对应每株植物小花数。可使用图像分析软件以自动化的方式从数字图像推导出这些参数,然后对这些参数进行统计学分析。使用与图像分析软件偶联的定制装置(由2个主要组件,称重和成像装置,组成),测量单个种子的参数(包括宽度、长度、面积、重量)。收获指数(HI)在本发明中定义为种子总产量与地上部分面积(mm2)之间的比,乘以系数106。
使用对非平衡设计作出校正的双因子ANOVA(方差分析)作为统计模型用于植物表型特征的总体评价。对用所述基因转化的全部事件的全部植物的全部测量参数实施F检验。实施F检验以检查基因对于全部转化事件的作用并验证基因的整体作用(又称作“基因全局作用”)。若F检验的值显示该数据是显著的,则可以得出存在“基因”作用的结论,意味着不仅仅基因的存在或位置才造成所述作用。对于F检验,用于真实全局基因作用的显著性的阈值设置在5%概率水平。
为检查基因在事件中的作用,即株系特异性作用,使用来自转基因植物和对应的无效植物的数据集在每个事件内进行t检验。“无效植物”或“无效分离子”或“失效合子”是以与转基因植物相同的方式受到处理,但是转基因已经从中发生分离的植物。无效植物也可以描述为纯合阴性转化植物。用于t检验的显著性的阈值设置在10%概率水平上。一些事件的结果可以高于或低于这个阈值。这基于如此假设,即基因可能仅在基因组中某些位置内具有作用,并且这种位置依赖性作用的出现并非罕见。这种基因作用在本文中又称作“基因的株系作用”。p-值通过t-值与t-分布比较或备选地通过F-值与F-分布比较而获得。该p-值随后给出无效假设(即转基因的作用不存在)是正确的概率。
实施例27:结果
1.千粒重
用减量调节构建体转化的转基因品系与对照植物相比产生3%的整体百分比增加,最好的品系与对照植物相比产生10%的增加。
2.收获指数
用减量调节构建体转化的转基因品系与对照植物相比产生16%的整体百分比增加,最好的品系与对照植物相比产生61%的增加。
3.饱满率
用减量调节构建体转化的转基因品系与对照植物相比产生14%的整体百分比增加,最好的品系与对照植物相比产生41%的增加。
4.每个圆锥花序的花数(每株植物花数)
用减量调节构建体转化的转基因品系与对照植物相比产生-3%的整体百分比降低,最好的品系与对照植物相比产生-11%的降低。花数的降低对草是重要的(例如当用于草坪)。
用超量表达构建体转化的转基因品系与对照植物相比产生6%的整体百分比增加,最好的品系与对照植物相比产生14%的增加。
实施例28:与SEQ ID NO:229和SEQ ID NO:230相关的序列的鉴定
使用数据库搜索工具例如基本局部比对工具(Basic Local AlignmentTool)(BLAST)(Altschul等人(1990)J.Mol.Biol.215:403-410;和Altschul等人(1997)Nucleic Acids Res.25:3389-3402),在美国国家生物技术信息中心(NCBI)Entrez核苷酸数据库维护的序列中,鉴定与SEQ IDNO:229相关的序列(全长cDNA、EST或基因组序列)和/或与SEQ ID NO:230相关的蛋白质序列。通常BLAST程序通过将核酸或多肽序列与序列数据库进行比较,以及通过计算匹配的统计学显著性,用于寻找序列之间具有局部相似性的区域。对核酸SEQ ID NO:229所编码的多肽运用TBLASTN算法,使用缺省设置,开启过滤器,以忽略低复杂度序列。分析的输出视窗为两两比较,并根据概率分值(E值)排序,其中分值反映特定比对偶然发生的概率(E值越低,命中事件的显著性越高)。除了E值之外,还对比较进行同一性百分比记分。同一性百分比是指两比较核酸(或多肽)序列之间在特定长度上的相同核苷酸(或氨基酸)数。
表H提供了与SEQ ID NO:229表示的核酸序列相关的核酸序列。
表H:用于实施本发明方法的、涉及核酸序列SEQ ID NO:229和SEQID NO:230的核酸和多肽序列。
名称 来源生物 核酸SEQ ID NO: 多肽SEQ ID NO: 数据库登录号 状态
HAT4 拟南芥 229 230 AT4G16780 全长
LD 拟南芥 231 232 NP 192165.1 全长
稻 233 234 Os03g47022 全长
稻 235 236 Os03g12860 全长
HAT22 稻 237 238 Os10g01470 全长
HAT14 稻 239 240 Os08g36220 全长
稻 241 242 Os09g27450 全长
HAT3 稻 243 244 Os06g04850 全长
S1HDL2 稻 245 246 Os06g04870 全长
HD-ZIP 稻 247 248 Os10g41230 全长
拟南芥 249 250 NP_174025.3 全长
HAT14 拟南芥 251 252 NP_974743.1 全长
HAT4 拟南芥 253 254 NP_193411.1 全长
HAT1 拟南芥 255 256 NP_193476.1 全长
HAT2 拟南芥 257 258 NP_199548.1 全长
HB-4 拟南芥 259 260 NP_182018.1 全长
HAT3 拟南芥 261 262 NP_191598.1 全长
稻 263 264 Os04g46350 全长
稻 265 266 Os10g23090 全长
稻 267 268 Os10g23090 全长
稻 269 270 Os03g08960 全长
稻 271 272 Os08g37580 全长
稻 273 274 Os09g29460 全长
稻 275 276 Os10g39720 全长
稻 277 278 Os05g09630 全长
实施例29:相关多肽序列的比对
来自Vector NTI(Invitrogen)的AlignX基于普遍使用的渐进比对的聚类算法(Clustal algorithm)(Thompson等人(1997)Nucleic Acids Res25:4876-4882;Chenna等人(2003).Nucleic Acids Res 31:3497-3500)。使用邻接聚类算法构建系统树(见图18)。空位开放罚分的缺省值为10,空位延伸罚分的缺省值为0.1,选择的权重矩阵是Blosum 62(如果比对多肽)。多序列比对结果示于本应用的图19中。
实施例30:鉴定用于实施本发明方法的多肽序列中所包含的结构域蛋白质家族、结构域和位点集成资源(Integrated Resouce of ProteinFamilies,Domain and Site,InterPro)数据库是基于文本和序列的搜索的通常所用标签数据库的集成界面。InterPro数据库组合了这些数据库,所述的数据库使用不同方法学和不同程度的有关已充分表征蛋白质的生物学信息以得到蛋白质标签。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam、Smart和TIGRFAMs。Interpro驻留于英国的欧洲生物信息研究所。
InterPro扫描如SEQ ID NO:230所代表的多肽序列的结果在表I中。
表I:如SEQ ID NO:230所代表的多肽序列的InterPro扫描结果
数据库 检索号 检索名称
InterPro IPR006712 HDZIP
InterPro IPR001356 同源框
InterPro IPR003106 HALZ
ProDom PDA0K5J 1 同源框PPHB4DNA结合
ProDom PD728753 DNA结合
ProDom PD064887 DNA结合
PIR超家族 PIRPS00001 Asn糖基化基序
PIR超家族 PS00004 cAMP磷酸化位点
PIR超家族 PS00005 PKC磷酸化位点
PIR超家族 PS00006 CK2磷酸化位点
PIR超家族 PS00008 豆蔻酰化
PIR超家族 PS00009 酰胺化
PIR超家族 PS00027 同源框
PIR超家族 PS00029 亮氨酸拉链
Pfam PF04618 HDZIP
Pfam PF00046 同源框
Pfam PF02183 HALZ
实施例31:克隆SEQ ID NO:229所代表的核酸序列
拟南芥HAT4编码基因通过PCR,使用拟南芥cDNA文库(Invitrogen,Paisley,UK)作为模板进行扩增。将提取自幼苗的RNA逆转录后,将cDNA克隆至pCMV Sport 6.0。库的插入序列平均大小是1.6kb并且克隆的最初数目是1.67×107cfu。在6×1010cfu/ml的第一轮扩增后测定原始滴度是3.34×106cfu/ml。在质粒提取后,将200ng模板用于50μlPCR混合物中。
所用的引物是:
正向(SEQ ID NO:283)
ggggacaagtttgtacaaaaaagcaggcttcacaatgatgttcgagaaagacgatctg
反向(SEQ ID NO:284)
ggggaccactttgtacaagaaagctgggtttaggacctaggacgaagagcgt
其包括用于Gateway重组的AttB位点。扩增的PCR片段也使用标准方法予以纯化。随后实施Gateway方法的第一步骤,即BP反应,在此期间PCR片段与pDONR201质粒发生体内重组以产生根据Gateway命名的“进入克隆”。质粒pDONR201作为
技术的构成部分从Invitrogen购买。
实施例32:使用如SEQ ID NO:229所代表核酸序列的表达载体构建
进入克隆随后在LR反应中与一种用于稻转化的目的载体一起使用。这种载体在T-DNA边界内含有作为功能性元件的:植物选择标记;筛选标记表达盒和意图与已经克隆于所述进入克隆内的目的核酸序列发生LR体内重组的Gateway盒。用于组成型表达的稻GOS2启动子(SEQ IDNO:282)位于这种Gateway盒的上游。
在LR重组步骤后,产生的表达载体(图21)根据本领域众所周知的方法转化至农杆菌菌株LBA4044中。
实施例33:植物转化
稻转化
含有表达载体的农杆菌用来转化稻植物。将稻的日本栽培品种Nipponbare的成熟干燥种子脱壳。通过在70%乙醇中温育一分钟,随后在2%HgCl2中30分钟,随后用无菌蒸馏水洗涤6次15分钟而实施消毒。消毒的种子随后在含有2,4-D的培养基(愈伤组织诱导培养基)上萌发。在黑暗中温育4周后,将盾片衍生的胚发生性愈伤组织切下并在同一种培养基上增殖。2周后,愈伤组织通过在同一种培养基上传代培养另外2周而繁殖或增殖。胚发生性愈伤组织片在新鲜培养基上传代培养3日,之后共培育(以增强细胞分裂活性)。
含有表达载体的农杆菌菌株LBA4404用于共培育。农杆菌接种在含有适宜抗生素的AB培养基上并在28℃培养3日。随后将细菌收集并重悬在液体共培育培养基中至密度(OD600)约1。将混悬液随后转移至培养皿并将愈伤组织在该混悬液内浸泡15分钟。愈伤组织组织随后在滤纸上吸干并转移至固化的共培育培养基上并且在黑暗中于25℃温育3日。共培育的愈伤组织在黑暗中于28℃在选择剂存在下于含有2,4-D的培养基上培育4周。在此时段期间,形成迅速生长的抗性愈伤组织岛。在这种材料转移至再生培养基并在光线下温育后,胚发生潜力释放并且苗在随后4-5周发育。将苗从愈伤组织中切下并且在含有植物生长素的培养基上温育2-3周,其中将苗从所述的培养基上转移至土壤。硬化的苗在高湿度和短日照下于温室中培育。
一个构建体产生大约35个独立T0稻转化体。将原代转化体从组织培养箱转移至温室。在定量PCR分析以验证T-DNA插入物的拷贝数后,仅保留表现选择剂耐受性的单拷贝转基因植物用于收获T1种子。种子随后在移植后3-5月收获。本方法以超过50%的比率产生单一基因座转化体(Aldemita和Hodges1996,Chan等1993,Hiei等1994)。
实施例34:表型评价方法
34.1评价准备
产生大约35个独立的T0稻转化体。原代转化体从组织培养箱转移至温室用于生长和收获T1种子。留下8个事件,其中所述事件的T1后代对转基因的存在/不存在以3∶1比例分离。对于这些事件中的每一事件,通过监测目视标记表达而选择含有转基因的大约10株T1幼苗(杂合子和纯合子)和缺少转基因的大约10株T1幼苗(失效合子)。转基因植物和对应的失效合子在随机位置上并排培育。温室条件是短日照(12小时光照),在光线下28℃和在黑暗中22℃以及相对湿度70%。
4个T1事件在T2世代中按照如用于T1世代的相同评价方法作进一步评估,但每个事件采用更多的个体。
干旱筛选
在正常条件下在花盆土中培养来自T2种子的植物,直到进入抽穗期。然后将其转移到“干燥”区域,停止灌溉。向随机选择的花盆中插入湿度探测仪,以监测土壤水含量(SWC)。当SWC低于一定的阈值时,自动向植物持续补水,直到再次达到正常水平。然后将植物再次重新转移到正常条件下。其余的栽培(植物成熟、种子收获)与不在非生物胁迫条件下培养的植物相同。记录生长和产量阐述参数,作为生长在正常条件下的细节。
氮利用效率筛选
在除营养液以外正常的条件下在花盆土中培养来自T2种子的稻植物。从植物移植到成熟一直用特定的营养液对花盆浇水,所述营养液的氮(N)含量降低,通常低7到8倍。其余的栽培(植物成熟、种子收获)与不在非生物胁迫条件下培养的植物相同。记录生长和产量阐述参数,作为生长在正常条件下的细节。
使用Oxford QP20+脉冲(pulsed)NMR对稻种子进行非破坏性油测量。使用未脱壳的整粒种子。34.2统计分析:F-检验
使用双因子ANOVA(方差分析)作为统计模型用于植物表型特征的整体评价。对用本发明基因转化的全部事件的全部植物的所有测量参数实施F检验。实施F检验以检查基因对于全部转化事件的作用并验证基因的整体作用(又称作全局基因作用)。用于真实全局基因作用的显著性的阈值对于F检验设置在5%概率水平上。显著性F检验值标示基因作用,意味着不仅仅基因的存在或位置才造成表型上的差异。
34.3结果
最好的品系在油含量上与对照植物相比显示11%的增加,全部品系的油含量平均增加6%且来自F-检验的P值小于0.0001。
实施例35:玉米转化
玉米的转化根据对Ishida等(1996.Nature Biotech 14745-50)描述方法的改良方法进行。在玉米中的转化是基因型依赖的并且仅特定的基因型可操作用于转化和再生。近交系A188(明尼苏达大学)或以A188作为亲本的杂种是用于转化的供体材料的良好来源,但是其他基因型也可以成功地使用。玉米穗从玉米植物中在授粉后大约11日(DAP)收获,此时不成熟胚的长度是大约1至1.2mm。不成熟胚与含有表达载体的根癌农杆菌共培育并且转基因植物通过器官发生而恢复。切下的胚在愈伤组织诱导培养基上、随后在玉米再生培养基上培育,其中所述的再生培养基含有选择剂(例如咪唑啉酮,但可以使用多种选择标记)。培养板在25℃于光照下培养2-3周,或直至苗发育。将绿色苗从每个胚转移至玉米生根培养基并在25℃培养2-3周,直至根发育。将生根的苗移植至温室的土壤中。从表现选择剂耐受的并含有单拷贝的T-DNA插入物的植物中产生T1种子。
实施例36:小麦转化
小麦的转化用Ishida等Ishida等(1996)Nature Biotech 14(6):745-50描述的方法进行。通常在转化中使用(可从墨西哥CIMMYT获得的)栽培品种Bobwhite。不成熟胚与含有表达载体的根癌农杆菌共培育并且转基因植物通过器官发生而恢复。在与农杆菌温育后,胚在愈伤组织诱导培养基上、随后在再生培养基上体外培育,其中所述的再生培养基含有选择剂(例如咪唑啉酮,但可以使用多种选择标记)。培养平板在25℃于光照下培养2-3周,或直至苗发育。将绿色苗从每个胚转移至生根培养基并在25℃培养2-3周,直至根发育。将生根的苗移植至温室的土壤中。从表现选择剂耐受的并含有单拷贝的T-DNA插入物的植物中产生T1种子。
实施例37:大豆转化
根据对Texas A&M美国专利5,164,310中所述方法的改良方法转化大豆。几个商业大豆品种对于通过这种方法的转化是可行的。栽培品种Jack(从Illinois种子基金会可获得)通常用于转化。对大豆种子消毒以便体外播种。从7日龄幼苗中切下下胚轴、胚根和一片子叶。进一步培育上胚轴和余下的子叶以发育腋生节。将这些腋生节切下并与含有表达载体的根癌农杆菌温育。在共培育处理之后,将外植体洗涤并转移至选择培养基。将再生的苗切下并置于苗伸长培养基上。将长度不超过1cm的苗置于生根培养基上直至根发育。将生根的苗移植至温室的土壤中。从表现选择剂耐受的并含有单拷贝T-DNA插入物的植物中产生T1种子。
实施例38:油菜籽/卡诺拉油菜转化
使用5-6日龄幼苗的子叶柄和下胚轴作为用于组织培养的外植体并且根据Babic等(1998,Plant Cell Rep 17:183-188)转化。商业栽培品种Westar(Agriculture Canada)是用于转化的标准品种,但是也可以使用其他品种。对卡诺拉油菜种子作表面消毒以便体外播种。从体外幼苗中切下具有附着子叶的子叶柄外植体,并以(含有表达载体的)农杆菌通过叶柄外植体的切口端浸入细菌混悬液而接种。外植体随后在含有3mg/l BAP、3%蔗糖、0.7%植物琼脂(Phytagar)的MSBAP-3培养基上在23℃,16小时光照下培养2天。在与农杆菌共培育2日后,将叶柄外植体转移至含有的3mg/l BAP、头孢噻肟、羧苄青霉素或特美汀(300mg/l)的MSBAP-3培养基上持续7日,并且随后在含头孢噻肟、羧苄青霉素或特美汀和选择剂的MSBAP-3培养基上培养,直至苗再生。当苗具有5-10mm长度时,将苗切下并转移至苗伸长培养基(含0.5mg/lBAP的MSBAP-0.5)。将长度大约2cm的苗转移至用于根诱导的生根培养基(MS0)。将生根的苗移植至温室的土壤中。从表现选择剂耐受性并含有单拷贝T-DNA插入物的植物中产生T1种子。
实施例39:苜蓿转化
苜蓿的再生性克隆使用(McKersie等,1999 Plant Physiol 119:839-847)的方法加以转化。苜蓿的再生和转化是基因型依赖性的并且因而需要再生植物。已经描述了获得再生性植物的方法。例如,这些再生性植物可以选自栽培品种Rangelander(Agriculture Canada)或如Brown DCW与AAtanassov(1985.Plant Cell Tissue Culture 4:111-112)描述的任何其他商业苜蓿品种。备选地,RA3品种(威斯康星大学)已经被选择用于组织培养中(Walker等,1978 Am J Bot 65:654-659)。将叶柄外植体与含有表达载体的根癌农杆菌C58C1 pMP90(McKersie等,1999 Plant Physiol 119:839-847)或LBA4404的过夜培养物共培育。外植体在黑暗中在含有288mg/L Pro、53mg/L硫代脯氨酸、4.35g/L K2SO4和100μm乙酰丁香酮的SH诱导培养基上共培育3天.外植体在半浓缩Murashige-Skoog培养基(Murashige和Skoog,1962)中洗涤并平板接种在不含乙酰丁香酮而含有合适选择剂和合适抗生素以抑止农杆菌生长的相同SH诱导培养基上。在数周后,将体细胞胚转移至不含生长调节剂、不含抗生素而含有50g/L蔗糖的BOi2Y发育培养基中。体细胞胚随后在半浓缩Murashige-Skoog培养基上萌发。将生根的幼苗移植至花钵内并且在温室中培育。从表现选择剂耐受性并含有单拷贝T-DNA插入物的植物中产生T1种子。
实施例40:与SEQ ID NO:285和SEQ ID NO:286相关的序列的鉴定
使用数据库搜索工具例如基本局部比对工具(Basic Local AlignmentTool)(BLAST)(Altschul等人(1990)J.Mol.Biol.215:403-410;和Altschul等人(1997)Nucleic Acids Res.25:3389-3402),在美国国家生物技术信息中心(NCBI)Entrez核苷酸数据库维护的序列中,鉴定涉及SEQ IDNO:285的序列(全长cDNA、EST或基因组序列)和/或涉及SEQ ID NO:286的蛋白质序列。通常BLAST程序通过将核酸或多肽序列与序列数据库进行比较,以及通过计算匹配的统计学显著性,用于寻找序列之间具有局部相似性的区域。对核酸SEQ ID NO:285所编码的多肽运用TBLASTN算法,使用缺省设置,开启过滤器,以忽略低复杂度序列。分析的输出视窗为两两比较,并根据概率分值(E值)排序,其中分值反映特定比对偶然发生的概率(E值越低,命中事件的显著性越高)。除了E值之外,还对比较进行同一性百分比记分。同一性百分比是指两比较核酸(或多肽)序列之间在特定长度上的相同核苷酸(或氨基酸)数。在有些情况下,可以调整缺省参数以更改搜索的严格度。
除了可在NCBI上获得的公共可获得的核酸序列外,按照与上述的方法相同的方法搜索proprietary序列数据库。
表J提供了与SEQ ID NO:285表示的核酸序列和SEQ ID NO:286表示的蛋白质序列相关的核酸和蛋白质序列列表。
表J:可用于本发明方法的、与核酸序列(SEQ ID NO:1)相关的核酸序列,以及推导的相应多肽。
名称 来源生物 核酸 SEQ ID NO: 多肽SEQ ID NO: 数据库登 录号 状态
SYB1 拟南芥 285 286 NM112438 全长
锌指蛋白样蛋白质 陆地棉 287 288 AAZ94630 全长
推测的锌指蛋白ZF2 玉蜀黍 289 290 Q53AV6 全长
锌指转录因子 ZFP30 稻 291 292 Q6Z6E6 全长
假拟蛋白质 At5g25490 拟南芥 293 294 Q8GWD1 全长
锌指蛋白 稻 295 296 Q9SW92 全长
推测锌指转录因子 稻 297 298 Q8RYZ5 全长
GlimmerM蛋白质 152 甜菜 299 300 ABD83289 全长
推测的蛋白质 At2g17975 拟南芥 301 302 Q8S8K1 全长
假想RanBP2-型锌指 蛋白At1g67325 拟南芥 303 304 Q8GZ43 全长
P53结合蛋白样 稻 305 306 Q7F1K4 全长
推测的p53结合蛋白 稻 307 308 Q7XHQ8 全长
假拟蛋白质 芜青 309 310 CX272690 全长
假拟蛋白质 乳浆大戟 311 312 DV143669 全长
假拟蛋白质 陆地棉 313 314 DR459119 全长
假拟蛋白质 葡萄 315 316 DV221228 全长
假拟蛋白质 毛果杨 (Populus trichocarpa) 317 318 DT496999 全长
假拟蛋白质 陆地棉 319 320 DT457997 全长
假拟蛋白质 野莴苣 321 322 DW105125 全长
假拟蛋白质 大豆 323 324 BG238374 全长
假拟蛋白质 毛果杨 325 226 DT494117 全长
假拟蛋白质 杨属某种 327 328 DV465465 全长
锌指转录因子 稻 329 330 AY219846 全长
假拟蛋白质 柳枝稷 (Panicum virgatum) 331 332 DN152082 全长
锌指,RanBP2型 蒺藜苜蓿 333 334 Q1RWK5 全长
锌指,RanBP2型 蒺藜苜蓿 335 336 Q1S406 全长
假拟蛋白质 丝兰(Yucca filamentosa) 337 338 DT581158 全长
假拟蛋白质 大麦 339 340 BQ471337 全长
实施例41:相关多肽序列的比对
来自Vector NTI(Invitrogen)的AlignX基于普遍使用的渐进比对的聚类算法(Clustal algorithm)(Thompson等人(1997)Nucleic Acids Res25:4876-4882;Chenna等人(2003).Nucleic Acids Res 31:3497-3500)。可使用邻接聚类算法构建系统树。空位开放罚分的缺省值为10,空位延伸罚分的缺省值为0.1,选择的权重矩阵是Blosum 62(如果比对多肽)。
在鉴定可用于实施本发明方法的多肽中,使用相关多肽获得的多序列比对结果示于本应用的图23a中。可容易地到三个锌指结构域。
实施例42:计算可用于实施本发明方法的多肽序列之间的全局百分比同一性
使用可在本领域内获得的方法中的一个方法MatGAT(矩阵全局比对工具(Matrix Global Alignment Tool))软件(BMC Bioinformatics.20034:29.MatGAT:an application that generates similarity/identity matricesusing protein or DNA sequences.Campanella JJ,Bitincka L,Smalley J;由Ledion Bitincka托管的软件),确定可以用于实施本发明的方法的全长多肽序列之间的全局相似性和同一性百分比。MatGAT软件无需对数据进行预比对,即可产生DNA或蛋白质序列的相似性/同一性矩阵。该程序利用Myers和Miller全局比对算法(空位开放罚分为12,而空位延伸罚分为2)进行一系列的两两比对,利用例如Blosum 62(对于多肽而言)计算相似性和同一性,然后将结果排列成距离矩阵。序列相似性示于对角线下半部,而序列同一性示于对角线上半部。
比较所用的参数有:
记分矩阵:Blosum 62
首个空位:12
延伸空位:2
多肽序列全长范围(将部分多肽序列排除在外)的全局相似性和同一性的软件分析结果示于表K。对角线上方给出同一性百分比,而对角线下方给出相似性百分比。
与SEQ ID NO:286相比,可用于实施本发明方法的多肽序列之间的百分比同一性可以为低至16.9%的氨基酸同一性。
表K:多肽序列全长范围的全局相似性和同一性的MatGAT结果。
实施例43:鉴定包含在可用于实施本发明方法的多肽序列中的结构域
蛋白质家族、结构域和位点集成资源(Integrated Resouce of ProteinFamilies,Domain and Site,InterPro)数据库是基于文本和序列的搜索的通常所用标签数据库的集成界面。InterPro数据库组合了这些数据库,所述的数据库使用不同方法学和不同程度的有关已充分表征蛋白质的生物学信息以得到蛋白质标签。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam、Smart和TIGRFAMs。Interpro驻留于英国的欧洲生物信息研究所。
InterPro扫描如SEQ ID NO:286所代表的多肽序列的结果在表L中。
表L:如SEQ ID NO:286所代表的多肽序列的InterPro扫描结果
数据库 检索号 检索名称
InterPro IPR001878 锌指,RanBP2-型
PROFILE PS50199 ZF RANBP22
PROSITE PS01358 ZF RANBP21
PFAM PF00641 zf-RanBP
SMART SM00547 ZnF RBZ
实施例44:用于实施本发明方法的多肽序列的拓扑学预测(亚细胞定位,跨膜...)
TargetP 1.1预测真核蛋白质的亚细胞定位。位置分配是基于任何氨基端前序列的预测的存在:叶绿体转运肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP)。作为最终预测基础的记分并不实际是概率,并且它们未必合为一体。然而,具有最高记分的位置根据TargetP是最有可能的,并且记分之间的关系(可靠性类别)可以是预测的肯定性的一个指标。可靠性类别(RC)是1-5,其中1表示最强预测。TargetP在丹麦技术大学的服务器上维护。
对于预测含有氨基端前序列的序列,也可以预测潜在的切割位点。
选择了众多参数,如生物组(非植物或植物)、临界设置(无、临界的预定义设置或临界的用户指定设置)和对切割位点预测的计算(是或否)。
如SEQ ID NO:286所代表的多肽序列的TargetP 1.1分析的结果在表M中显示。已经选择“植物”生物组,未定义临界值并且需要转运肽的预测长度。没有清楚的亚细胞定位预测,只有线粒体定位的弱预测(可靠级别5级,最低的可靠性)。因此SYB1蛋白质也可以定位于胞质中。
表M:如SEQ ID NO:286所代表的多肽序列的TargetP 1.1分析
长度(AA)164
叶绿体转运肽0.417
线粒体转运肽0.505
分泌途径信号肽0.014
其他亚细胞靶向0.184
预测的位置线粒体
可靠性类别5
预测的转运肽长度12
众多其他算法可以用来执行此类分析,包括:
在丹麦技术大学服务器上驻留的ChloroP 1.1;
在澳大利亚布里斯班昆士兰大学分子生物科学研究所的服务器上驻留的蛋白质Prowler亚细胞定位预测程序第1.2版;
在加拿大阿尔伯塔省埃德蒙顿市阿尔伯塔大学的服务器上驻留的PENCE Proteme Analyst PA-GOSUB 2.5;
实施例45:涉及用于实施本发明方法的多肽序列的分析法
SEQ ID NO:286所示的多肽序列通过锌指结构域的存在可以和核酸以及蛋白质相互作用。DNA结合试验是本领域众所周知的,其包括作为一般参考的PCR-辅助的DNA结合位点选择和DNA凝胶移位结合试验,参见Current Protocols in Molecular Biology,第1和2卷,Ausubel等(1994),Current Protocols。
SEQ ID NO:286所示的蛋白质预测和表N中所示的数个蛋白质相互作用(结构来自SMART数据库)。SYB1蛋白质的功能性因此在酵母双杂交筛选中用候选配体蛋白质测试。
表N:预测的SEQ ID NO:286相互作用
描述 识别符
推测的胞质P450 At2g46960
未知的 At5g03670
与胞质b558/566,亚基B的弱相似性 F18B3.90
超敏诱导性响应蛋白质 MQB2.6″
糖基化水解酶家族9 T21L14.7
未知的 F26O13.50
包含brix结构域的蛋白质 At5g61770
peterpan At5g61770
未知的/预测的GTPase Q9SJF1/At1g08410
核苷酸结合蛋白质 Q9SHS8/At2g27200
此外,根据本发明方法的SYB1蛋白质的表达产生如下所述增加的种子产量。
实施例46:克隆SEQ ID NO:285所代表的核酸序列
除非另外声明,重组DNA技术根据(Sambrook(2001)MolecularCloning:a laboratory manual,第三版Cold Spring Harbor LaboratoryPress,CSH,New York)中或Ausubel等(1994),Current Protocols inMolecular Biology,Current Protocols第1和2卷中描述的标准方法进行。用于植物分子工作的标准材料和方法在由BIOS Scientific PublicationsLtd(UK)和Blackwell Scientific Publications(UK)出版的R.D.D.Croy的Plant Molecular Biology Labfax(1993)中描述。
使用拟南芥幼苗cDNA文库(Invitrogen,Paisley,UK)作为模板通过PCR扩增拟南芥SYB1基因。在反转录从幼苗提取的RNA后,将cDNA克隆入pCMV Sport 6.0。文库的平均插入物大小为1.5kb,克隆的原始数目是1.59x107cfu的级别。在6x1011cfu/ml的第一次扩增后,初始滴度确定为9.6x105cfu/ml。在质粒提取后,将200ng模板用于50μl PCR混合物中。将包含用于Gateway重组的AttB位点的引物prm5539(SEQ ID NO:341;有义,起始密码子为粗体字,AttB1位点为斜体:5’-ggggacaagtttgtacaaaaaagcaggcttaaacaatgagcagacccggagatt -3’)和prm5540(SEQ ID NO:342;反向,互补,AttB2位点为斜体:5’-ggggaccactttgtacaagaaagctgggtagacaaggctacttcaaaagca-3’)用于PCR扩增。在标准条件中使用Hifi Taq DNA聚合酶进行PCR。也使用标准方法扩增和纯化559bp的PCR片段(包括attB位点)。然后进行Gateway方法的第一步骤BP反应,在该步骤期间,PCR片段与pDONR201质粒进行体内重组,从而产生,按照Gateway命名法,“入门克隆”,p58a。质粒pDONR201作为
技术的一部分购自Invitrogen。
实施例47:使用如SEQ ID NO:285所代表核酸序列构建表达载体
进入克隆p58a随后在LR反应中与p0640(一种用于稻转化的目的载体)一起使用。这种载体在T-DNA边界内含有作为功能性元件的:植物选择标记;筛选标记表达盒和意图与已经克隆于所述进入克隆内的目的核酸序列发生LR体内重组的Gateway盒。用于组成型表达(pGOS2)的稻GOS2启动子(SEQ ID NO:343)位于这种Gateway盒的上游。
在LR重组步骤后,产生的表达载体pGOS2::SYB1(图24)根据本领域众所周知的方法转化至农杆菌菌株LBA4044中。
实施例48:植物转化
稻转化
含有表达载体的农杆菌用来转化稻植物。将稻的日本栽培品种Nipponbare的成熟干燥种子脱壳。通过在70%乙醇中温育一分钟,随后在2%HgCl2中30分钟,随后用无菌蒸馏水洗涤6次15分钟而实施消毒。消毒的种子随后在含有2,4-D的培养基(愈伤组织诱导培养基)上萌发。在黑暗中温育4周后,将盾片衍生的胚发生性愈伤组织切下并在同一种培养基上增殖。2周后,愈伤组织通过在同一种培养基上传代培养另外2周而繁殖或增殖。胚发生性愈伤组织片在新鲜培养基上传代培养3日,之后共培育(以增强细胞分裂活性)。
含有表达载体的农杆菌菌株LBA4404用于共培育。农杆菌接种在含有适宜抗生素的AB培养基上并在28℃培养3日。随后将细菌收集并重悬在液体共培育培养基中至密度(OD600)约1。将混悬液随后转移至培养皿并将愈伤组织在该混悬液内浸泡15分钟。愈伤组织组织随后在滤纸上吸干并转移至固化的共培育培养基上并且在黑暗中于25℃温育3日。共培育的愈伤组织在黑暗中于28℃在选择剂存在下于含有2,4-D的培养基上培育4周。在此时段期间,形成迅速生长的抗性愈伤组织岛。在这种材料转移至再生培养基并在光线下温育后,胚发生潜力释放并且苗在随后4-5周发育。将苗从愈伤组织中切下并且在含有植物生长素的培养基上温育2-3周,其中将苗从所述的培养基上转移至土壤。硬化的苗在高湿度和短日照下于温室中培育。
一个构建体产生大约35个独立T0稻转化体。将原代转化体从组织培养箱转移至温室。在定量PCR分析以验证T-DNA插入物的拷贝数后,仅保留表现选择剂耐受性的单拷贝转基因植物用于收获T1种子。种子随后在移植后3-5月收获。本方法以超过50%的比率产生单一基因座转化体(Aldemita和Hodges1996,Chan等1993,Hiei等1994)。
玉米转化
玉米的转化根据对Ishida等(1996.Nature Biotech 14745-50)描述方法的改良方法进行。在玉米中的转化是基因型依赖的并且仅特定的基因型可操作用于转化和再生。近交系A188(明尼苏达大学)或以A188作为亲本的杂种是用于转化的供体材料的良好来源,但是其他基因型也可以成功地使用。玉米穗从玉米植物中在授粉后大约11日(DAP)收获,此时不成熟胚的长度是大约1至1.2mm。不成熟胚与含有表达载体的根癌农杆菌共培育并且转基因植物通过器官发生而恢复。切下的胚在愈伤组织诱导培养基上、随后在玉米再生培养基上培育,其中所述的再生培养基含有选择剂(例如咪唑啉酮,但可以使用多种选择标记)。培养板在25℃于光照下培养2-3周,或直至苗发育。将绿色苗从每个胚转移至玉米生根培养基并在25℃培养2-3周,直至根发育。将生根的苗移植至温室的土壤中。从表现选择剂耐受的并含有单拷贝的T-DNA插入物的植物中产生T1种子。
小麦转化
小麦的转化用Ishida等Ishida等(1996)Nature Biotech 14(6):745-50描述的方法进行。通常在转化中使用(可从墨西哥CIMMYT获得的)栽培品种Bobwhite。不成熟胚与含有表达载体的根癌农杆菌共培育并且转基因植物通过器官发生而恢复。在与农杆菌温育后,胚在愈伤组织诱导培养基上、随后在再生培养基上体外培育,其中所述的再生培养基含有选择剂(例如咪唑啉酮,但可以使用多种选择标记)。培养平板在25℃于光照下培养2-3周,或直至苗发育。将绿色苗从每个胚转移至生根培养基并在25℃培养2-3周,直至根发育。将生根的苗移植至温室的土壤中。从表现选择剂耐受的并含有单拷贝的T-DNA插入物的植物中产生T1种子。
大豆转化
根据对Texas A&M美国专利5,164,310中所述方法的改良方法转化大豆。几个商业大豆品种对于通过这种方法的转化是可行的。栽培品种Jack(从Illinois种子基金会可获得)通常用于转化。对大豆种子消毒以便体外播种。从7日龄幼苗中切下下胚轴、胚根和一片子叶。进一步培育上胚轴和余下的子叶以发育腋生节。将这些腋生节切下并与含有表达载体的根癌农杆菌温育。在共培育处理之后,将外植体洗涤并转移至选择培养基。将再生的苗切下并置于苗伸长培养基上。将长度不超过1cm的苗置于生根培养基上直至根发育。将生根的苗移植至温室的土壤中。从表现选择剂耐受的并含有单拷贝T-DNA插入物的植物中产生T1种子。
油菜籽/卡诺拉油菜转化
使用5-6日龄幼苗的子叶柄和下胚轴作为用于组织培养的外植体并且根据Babic等(1998,Plant Cell Rep 17:183-188)转化。商业栽培品种Westar(Agriculture Canada)是用于转化的标准品种,但是也可以使用其他品种。对卡诺拉油菜种子作表面消毒以便体外播种。从体外幼苗中切下具有附着子叶的子叶柄外植体,并以(含有表达载体的)农杆菌通过叶柄外植体的切口端浸入细菌混悬液而接种。外植体随后在含有3mg/l BAP、3%蔗糖、0.7%植物琼脂(Phytagar)的MSBAP-3培养基上在23℃,16小时光照下培养2天。在与农杆菌共培育2日后,将叶柄外植体转移至含有的3mg/l BAP、头孢噻肟、羧苄青霉素或特美汀(300mg/l)的MSBAP-3培养基上持续7日,并且随后在含头孢噻肟、羧苄青霉素或特美汀和选择剂的MSBAP-3培养基上培养,直至苗再生。当苗具有5-10mm长度时,将苗切下并转移至苗伸长培养基(含0.5mg/l BAP的MSBAP-0.5)。将长度大约2cm的苗转移至用于根诱导的生根培养基(MS0)。将生根的苗移植至温室的土壤中。从表现选择剂耐受性并含有单拷贝T-DNA插入物的植物中产生T1种子。
苜蓿转化
苜蓿的再生性克隆使用(McKersie等,1999 Plant Physiol 119:839-847)的方法加以转化。苜蓿的再生和转化是基因型依赖性的并且因而需要再生植物。已经描述了获得再生性植物的方法。例如,这些再生性植物可以选自栽培品种Rangelander(Agriculture Canada)或如Brown DCW与AAtanassov(1985.Plant Cell Tissue Culture 4:111-112)描述的任何其他商业苜蓿品种。备选地,RA3品种(威斯康星大学)已经被选择用于组织培养中(Walker等,1978 Am J Bot 65:654-659)。将叶柄外植体与含有表达载体的根癌农杆菌C58C1 pMP90(McKersie等,1999 Plant Physiol 119:839-847)或LBA4404的过夜培养物共培育。外植体在黑暗中在含有288mg/L Pro、53mg/L硫代脯氨酸、4.35g/L K2SO4和100μm乙酰丁香酮的SH诱导培养基上共培育3天.外植体在半浓缩Murashige-Skoog培养基(Murashige和Skoog,1962)中洗涤并平板接种在不含乙酰丁香酮而含有合适选择剂和合适抗生素以抑止农杆菌生长的相同SH诱导培养基上。在数周后,将体细胞胚转移至不含生长调节剂、不含抗生素而含有50g/L蔗糖的BOi2Y发育培养基中。体细胞胚随后在半浓缩Murashige-Skoog培养基上萌发。将生根的幼苗移植至花钵内并且在温室中培育。从表现选择剂耐受性并含有单拷贝T-DNA插入物的植物中产生T1种子。
实施例49:表型评价方法
49.1评价准备
产生大约35个独立的T0稻转化体。原代转化体从组织培养箱转移至温室用于生长和收获T1种子。留下6个事件,其中所述事件的T1后代对转基因的存在/不存在以3∶1比例分离。对于这些事件中的每一事件,通过监测目视标记表达而选择含有转基因的大约10株T1幼苗(杂合子和纯合子)和缺少转基因的大约10株T1幼苗(失效合子)。转基因植物和对应的失效合子在随机位置上并排培育。温室条件是短日照(12小时光照),在光线下28℃和在黑暗中22℃以及相对湿度70%。
干旱筛选
在正常条件下在花盆土中培养来自T2种子的植物,直到进入抽穗期。然后将其转移到“干燥”区域,停止灌溉。向随机选择的花盆中插入湿度探测仪,以监测土壤水含量(SWC)。当SWC低于一定的阈值时,自动向植物持续补水,直到再次达到正常水平。然后将植物再次重新转移到正常条件下。其余的栽培(植物成熟、种子收获)与不在非生物胁迫条件下培养的植物相同。记录生长和产量阐述参数,作为生长在正常条件下的细节。
氮利用效率筛选
在除营养液以外正常的条件下在花盆土中培养来自T2种子的稻植物。从植物移植到成熟一直用特定的营养液对花盆浇水,所述营养液的氮(N)含量降低,通常低7到8倍。其余的栽培(植物成熟、种子收获)与不在非生物胁迫条件下培养的植物相同。记录生长和产量阐述参数,作为生长在正常条件下的细节。
4个T1事件在T2世代中按照如用于T1世代的相同评价方法作进一步评估,但每个事件采用更多的个体。使植物从播种期直至成熟期通过数字成像箱数次。在每一时间点上,对每株植物从至少6个不同角度拍摄数字图像(2048x1536像素,1600万颜色)。
49.2统计分析:F-检验
使用双因子ANOVA(方差分析)作为统计模型用于植物表型特征的整体评价。对用本发明基因转化的全部事件的全部植物的所有测量参数实施F检验。实施F检验以检查基因对于全部转化事件的作用并验证基因的整体作用(又称作全局基因作用)。用于真实全局基因作用的显著性的阈值对于F检验设置在5%概率水平上。显著性F检验值标示基因作用,意味着不仅仅基因的存在或位置才造成表型上的差异。
49.3参数测量
生物量相关参数的测量
从播种期到成熟期,植物多次通过数码成像箱。在每个时间点上对每株植物从至少6个不同的角度获取数码图像(2048×1536像素,1千6百万色)。
植物地上面积(或者说叶生物量)通过计数区别于背景的地上植物部分数码图像的像素总数而确定。此值取同一时间点从不同的角度拍摄的照片的平均值,并通过校准转换为以平方毫米表示的物理表面值(physicalsurface value)。实验表明通过这种方法测量的地上植物面积与植物地上部分的生物量相关。地上面积在植物达到其最大叶生物量的时间点取值。早期活力表现为萌发后三周的植物(幼苗)地上面积。根生物量增加表现为总根生物量增加(测量为植物生命期间观察到的根最大生物量);或者表现为根/枝条指数的增加(测量为根和枝条的活跃生长期中根生物量和枝条生物量之间的比例)。
种子相关参数的测量
收获成熟的主圆锥花序、计数、袋装、用条形码标记,然后在37℃下在烘箱中干燥3天。然后对圆锥花序脱粒,收集所有种子和进行计数。使用鼓风机将饱满谷壳与空谷壳分离。弃去空谷壳,然后对剩余级分再次计数。在分析天平上称取饱满谷壳的重量。通过计数在分离步骤后留下的饱满谷壳的数目来确定饱满种子的数目。通过称取从植物收获的所有饱满谷壳的重量来测量总的种子产量。通过计数从植物收获的谷壳的数目来测量每株植物的总的种子数目。根据计数的饱满种子的数目和其总重量推算千粒重(TKW)。收获指数(HI)在本发明定义为种子总产量和地上面积(mm2)之间的比率乘以因子106。每圆锥花序的花的总数在本发明定义为种子总数与成熟的主圆锥花序的数目之间的比率。种子饱满率在本发明定义为饱满种子的数目占种子(或小花)总数的百分比。
实施例50:转基因植物的表型评价结果
表O中给出了表达用于本发明方法的核酸序列的转基因稻植物的评价结果。还显示转基因植物和对应的失效合子之间的差异百分数,来自F检验的P值低于0.05。
在非生物胁迫下与对照植物(在这种情况下,失效合子)相比,种子总产量、饱满种子数、种子饱满率、收获系数和千粒重在表达用于本发明方法的核酸序列的转基因植物中显著增加。
表O:表达用于实施本发明方法的核酸序列的转基因稻植物的评价结果。
性状T1世代增加%T2世代增加%
种子总产量 20 23
饱满种子数 17 19
饱满率 12 20
收获系数 15 20
千粒重 2 4
序列表
<110>克罗普迪塞恩股份有限公司
<120>具有改良特征的植物及其制备方法
<130>PF58401-prio
<160>347
<170>PatentIn版本3.3
<210>1
<211>2151
<212>DNA
<213>拟南芥(Arabidopsis thaliana)
<400>1
atgtgctgtg gatcagaccg attaaaccag atcgtgtcat caagatcttc gttgccaatt 60
tctttcgagg aagataacaa tcttgttacc aacacagaca tgaatcactt aacagtcgaa 120
acagaggata cgtttgcgag cttgcttgag cttgcagcta acaacgatgt tgaaggtgta 180
aggctatcta tcgagagaga cccttcttgt gtagacgaag ctggtctctg gtacggtcgt 240
caaaaaggtt ctaaagctat ggtcaacgat tacaggactc cgttgatggt tgctgctact 300
tacggaagca ttgatgtgat caagcttatt gtttctttga ctgatgctga cgtgaaccgt 360
gcttgcggga atgatcagac cactgcgtta cactgcgctg cttctggagg agctgtgaat 420
gctatccaag ttgttaagct gcttcttgca gctggagctg atttgaatct gttggatgct 480
gaaggtcaac gagctggtga tgttattgtt gttcctccta agcttgaagg cgtgaagctg 540
atgcttcagg agcttctttc tgctgatgga tcatctactg cggagcggaa tctacgggtt 600
gtgacaaatg ttccgaatag aagctcatct ccgtgtcatt ctcctactgg agagaatggt 660
ggatcagggt ctggttcacc gctcggctct ccttttaagc tgaaatctac tgaattcaag 720
aaagagtatc cggttgatcc gtctttgcca gatatcaaga acagtatcta cgcgactgat 780
gagtttagaa tgtattcctt caaggtccgg ccttgctctc gtgcttattc acatgattgg 840
actgagtgtc cttttgttca cccgggtgaa aacgcgagga ggagagaccc gaggaagttc 900
cattacagct gcgttccttg cccggatttt aggaaaggag cttgtaggag aggagatatg 960
tgtgagtatg cgcacggtgt gtttgaatgc tggcttcatc cggctcagta caggacccgt 1020
ctttgcaaag atggaacagg ctgtgctcgg cgggtttgtt tctttgcgca tacacccgag 1080
gagcttcgac ctttgtacgc atcaactggt tcagcggttc cttcgcctag atcgaatgct 1140
gattatgcag ctgctttgag tctccttcct ggttctccat caggagtctc tgtcatgtcc 1200
ccgctttccc catcagcagc ggggaacgga atgtctcatt cgaatatggc ttggccacaa 1260
ccaaatgtcc ctgcgttgca cttaccagga agcaatctac agtcaagcag gctaaggtct 1320
tctctcaatg caagggatat cccgacggat gagttcaata tgttagcgga ttacgagcag 1380
cagcaactcc tcaacgagta ttccaatgct ctgagccgtt ctggtcggat gaaatcaatg 1440
cctccttcga atcttgaaga tcttttctca gcagaaggct cttcatctcc ccggttcact 1500
gattccgctt tagcttccgc ggtgttctcg cctacacaca agtcagctgt cttcaaccag 1560
ttccaacaac agcaacagca gcagcagagc atgttgtctc caatcaacac aagcttttct 1620
tcaccaaaga gcgttgacca ctcattgttt tcaggtggag gaagaatgtc tcctcggaat 1680
gttgttgaac caatatcacc catgagtgct cgggtttcca tgttggctca gtgcgtgaag 1740
caacaacaac agcaacagca gcagcagcag cagcaacatc agttccgtag ccttagctcc 1800
agagagctca gaacaaactc tagcccaatc gttggttcac cggtaaacaa caacacatgg 1860
tcatcaaaat ggggatcttc aaatggtcaa ccggattggg gaatgagctc agaagcactt 1920
ggtaagttga gatcttcgtc atcgtttgat ggtgatgagc ctgatgtgtc atgggtccag 1980
tcactggtga aggagactcc agcagaagcc aaagagaaag cagcaacatc ttcctcaggg 2040
gaacacgtga tgaagcagcc aaatccggtt gaaccggtaa tggatcatgc tgggctagaa 2100
gcttggattg agcaaatgca gctcgatcag cttgtggctc agcagaattg a 2151
<210>2
<211>716
<212>PRT
<213>拟南芥
<400>2
Met Cys Cys Gly Ser Asp Arg Leu Asn Gln Ile Val Ser Ser Arg Ser
1 5 10 15
Ser Leu Pro Ile Ser Phe Glu Glu Asp Asn Asn Leu Val Thr Asn Thr
20 25 30
Asp Met Asn His Leu Thr Val Glu Thr Glu Asp Thr Phe Ala Ser Leu
35 40 45
Leu Glu Leu Ala Ala Asn Asn Asp Val Glu Gly Val Arg Leu Ser Ile
50 55 60
Glu Arg Asp Pro Ser Cys Val Asp Glu Ala Gly Leu Trp Tyr Gly Arg
65 70 75 80
Gln Lys Gly Ser Lys Ala Met Val Asn Asp Tyr Arg Thr Pro Leu Met
85 90 95
Val Ala Ala Thr Tyr Gly Ser Ile Asp Val Ile Lys Leu Ile Val Ser
100 105 110
Leu Thr Asp Ala Asp Val Asn Arg Ala Cys Gly Asn Asp Gln Thr Thr
115 120 125
Ala Leu His Cys Ala Ala Ser Gly Gly Ala Val Asn Ala Ile Gln Val
130 135 140
Val Lys Leu Leu Leu Ala Ala Gly Ala Asp Leu Asn Leu Leu Asp Ala
145 150 155 160
Glu Gly Gln Arg Ala Gly Asp Val Ile Val Val Pro Pro Lys Leu Glu
165 170 175
Gly Val Lys Leu Met Leu Gln Glu Leu Leu Ser Ala Asp Gly Ser Ser
180 185 190
Thr Ala Glu Arg Asn Leu Arg Val Val Thr Asn Val Pro Asn Arg Ser
195 200 205
Ser Ser Pro Cys His Ser Pro Thr Gly Glu Asn Gly Gly Ser Gly Ser
210 215 220
Gly Ser Pro Leu Gly Ser Pro Phe Lys Leu Lys Ser Thr Glu Phe Lys
225 230 235 240
Lys Glu Tyr Pro Val Asp Pro Ser Leu Pro Asp Ile Lys Asn Ser Ile
245 250 255
Tyr Ala Thr Asp Glu Phe Arg Met Tyr Ser Phe Lys Val Arg Pro Cys
260 265 270
Ser Arg Ala Tyr Ser Hi s Asp Trp Thr Glu Cys Pro Phe Val His Pro
275 280 285
Gly Glu Asn Ala Arg Arg Arg Asp Pro Arg Lys Phe His Tyr Ser Cys
290 295 300
Val Pro Cys Pro Asp Phe Arg Lys Gly Ala Cys Arg Arg Gly Asp Met
305 310 315 320
Cys Glu Tyr Ala His Gly Val Phe Glu Cys Trp Leu His Pro Ala Gln
325 330 335
Tyr Arg Thr Arg Leu Cys Lys Asp Gly Thr Gly Cys Ala Arg Arg Val
340 345 350
Cys Phe Phe Ala His Thr Pro Glu Glu Leu Arg Pro Leu Tyr Ala Ser
355 360 365
Thr Gly Ser Ala Val Pro Ser Pro Arg Ser Asn Ala Asp Tyr Ala Ala
370 375 380
Ala Leu Ser Leu Leu Pro Gly Ser Pro Ser Gly Val Ser Val Met Ser
385 390 395 400
Pro Leu Ser Pro Ser Ala Ala Gly Asn Gly Met Ser His Ser Asn Met
405 410 415
Ala Trp Pro Gln Pro Asn Val Pro Ala Leu Hi s Leu Pro Gly Ser Asn
420 425 430
Leu Gln Ser Ser Arg Leu Arg Ser Ser Leu Asn Ala Arg Asp Ile Pro
435 440 445
Thr Asp Glu Phe Asn Met Leu Ala Asp Tyr Glu Gln Gln Gln Leu Leu
450 455 460
Asn Glu Tyr Ser Asn Ala Leu Ser Arg Ser Gly Arg Met Lys Ser Met
465 470 475 480
Pro Pro Ser Asn Leu Glu Asp Leu Phe Ser Ala Glu Gly Ser Ser Ser
485 490 495
Pro Arg Phe Thr Asp Ser Ala Leu Ala Ser Ala Val Phe Ser Pro Thr
500 505 510
His Lys Ser Ala Val Phe Asn Gln Phe Gln Gln Gln Gln Gln Gln Gln
515 520 525
Gln Ser Met Leu Ser Pro Ile Asn Thr Ser Phe Ser Ser Pro Lys Ser
530 535 540
Val Asp His Ser Leu Phe Ser Gly Gly Gly Arg Met Ser Pro Arg Asn
545 550 555 560
Val Val Glu Pro Ile Ser Pro Met Ser Ala Arg Val Ser Met Leu Ala
565 570 575
Gln Cys Val Lys Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln
580 585 590
His Gln Phe Arg Ser Leu Ser Ser Arg Glu Leu Arg Thr Asn Ser Ser
595 600 605
Pro Ile Val Gly Ser Pro Val Asn Asn Asn Thr Trp Ser Ser Lys Trp
610 615 620
Gly Ser Ser Asn Gly Gln Pro Asp Trp Gly Met Ser Ser Glu Ala Leu
625 630 635 640
Gly Lys Leu Arg Ser Ser Ser Ser Phe Asp Gly Asp Glu Pro Asp Val
645 650 655
Ser Trp Val Gln Ser Leu Val Lys Glu Thr Pro Ala Glu Ala Lys Glu
660 665 670
Lys Ala Ala Thr Ser Ser Ser Gly Glu Hi s Val Met Lys Gln Pro Asn
675 680 685
Pro Val Glu Pro Val Met Asp Hi s Ala Gly Leu Glu Ala Trp Ile Glu
690 695 700
Gln Met Gln Leu Asp Gln Leu Val Ala Gln Gln Asn
705 710 715
<210>3
<211>13
<212>PRT
<213>人工序列
<220>
<223>基序1
<220>
<221>变体
<222>(1)..(1)
<223>\取代=″Ala″
<220>
<221>变体
<222>(7)..(7)
<223>\取代=″Thr″
<400>3
Pro Cys Ser Arg Ala Tyr Ser His Asp Trp Thr Glu Cys
1 5 10
<210>4
<211>12
<212>PRT
<213>人工序列
<220>
<223>基序2
<400>4
His Pro Gly Glu Asn Ala Arg Arg Arg Asp Pro Arg
1 5 10
<210>5
<211>19
<212>PRT
<213>人工序列
<220>
<223>基序3
<220>
<221>变体
<222>(3)..(3)
<223>\取代=″Ile″
<220>
<221>变体
<222>(6)..(6)
<223>\取代=″Ser″
<220>
<221>变体
<222>(11)..(11)
<223>\取代=″Ser″
<220>
<221>变体
<222>(14)..(14)
<223>\取代=″Lys″
<400>5
His Gly Val Phe Glu Cys Trp Leu His Pro Ala Gln Tyr Arg Thr Arg
1 5 10 15
Leu Cys Lys
<210>6
<211>5
<212>PRT
<213>人工序列
<220>
<223>基序4
<400>6
Cys Phe Phe Ala His
1 5
<210>7
<211>54
<212>DNA
<213>人工序列
<220>
<223>引物:prm06717
<400>7
ggggacaagt ttgtacaaaa aagcaggctt aaacaatgtg ctgtggatca gaec 54
<210>8
<211>50
<212>DNA
<213>人工序列
<220>
<223>引物:prm06718
<400>8
ggggaccact ttgtacaaga aagctgggtg gttaggtctc tcaattctgc 50
<210>9
<211>981
<212>DNA
<213>稻(Oryza sativa)
<400>9
aagaggcaag agcatccgta ttaaccagcc ttttgagact tgagagtgtg tgtgactcga 60
tccagcgtag tttcagttcg tgtgttggtg agtgattcca gccaagtttg cgatggcttc 120
tcagcaggaa cgggctagct accacgccgg cgagaccaag gcccgcgccg aggagaagac 180
ggggcgcatg atgggcacgg cgcaggagaa ggcgcgggag gccaaggaca cggcgtccga 240
cgccgcgggg cgcgcgatgg gcaggggaca cggcgccaag gaggcgacca aggagaaggc 300
gtacgagacc aaggacgcga ccaaggagaa ggcgtacgag gcaaaggacg cggcctccga 360
cgccaccggc cgcgccatgg acaagggccg cggcgccgcg ggcgccacga gggacaaggc 420
gtacgatgcc aaggacaggg cggctgacac ggcgcagtcc gccgccgacc gcgcccgcga 480
cggcgccggg cagaccggga gctacattgg acagaccgcc gaggccgcca agcagaaagc 540
ggccggcgcc gcgcagtacg ccaaggagac cgcgatcgcc ggcaaggaca agaccggcgc 600
cgtgctccag caggcagggg agcaggtgaa gagcgtggcg gtgggggcga aggacgcggt 660
gatgtacacg ctcgggatgt caggcgataa caagaacaac gccgctgccg gcaaggacac 720
cagcacctac aagcctggaa ctgggagtga ctaccagtaa tacggtagaa gaagcatgtg 780
tcgtctttgg cactgatgcc aaagtgtacg tgttgtatcc tcttttttaa gtttcagctc 840
gacttcgacg tgttcggtgt cacactttgg tttttcagtt gtgctcaact gttcatgttt 900
ctggttccat ggagggccag tgtggaggtc aatgtttaag ctttcgtttt aaaatctgat 960
aataaagttg gttaagacct g 981
<210>10
<211>3372
<212>DNA
<213>大桉(Eucalyptus grandis)
<400>10
ggaagacgaa gagcaacaaa ataggtctca ctccctcctc tctcctctct cctctctctt 60
ctttctctct cttctgcttc taacaaagtc tcttccttga gagacagggc tgcgtcgtcg 120
tctttctctc tcctcgctgc gagcttctga gaaagttcaa ttctttttct cttgttctct 180
ctctctaccc ttctgggtac cactgtgaag ctccggtctt ttctattttt tttttttttg 240
ggctatctgg gtctgggcaa atccatcgcg cgctctgctc tggactgaga ggccgtcagt 300
ggctttagat ctgcgacgcc tcttgcttgc tcagtgagct gggctagttc aaatcgacga 360
agaaagcatg cgctagtgat tggtgtgggt aatacactgc attcgatctc tactaagtat 420
ccccaagtat actaagatcc cgttctcagc catgagtcaa ctgaccattc agactgagga 480
cacttttgcc agcttgcttg agcttgctgc taacaacgac acagaatctt tcggacggtg 540
tgtggaacgt gatccttcga gcatagatga aattggatat tggtatggtc gccaaaaggg 600
ttcgaagcag gtggtcaata tgcaaagaac tcctcttatg gtggctgcta catatggtag 660
tgttgatgta atgagactca ttctttgcct atctgatgct gatgtgaatc gaacctgcag 720
cacagacaag agcacagccc ttcactgtgc tgcctctggt ggtgctgtga atgctgtaga 780
tgctgtgagg ctactcctgt cagctggtgc tgacccaagt ttagcagatg ctaacggtca 840
gcggcctgtg gatgttattg ttgttcctcc aaagctcctt tcaataaagt ttgctcttga 900
agagctcttg tcgaccgaag gatctgtaaa tgaacacaat ctgagagtgt ccgtagccac 960
ttccaattca acctctcccc cactttcatc ttccccggat aatggttccc cagcatctgc 1020
taattgttct tcccccaaga actcaaagtt aagtgatgcc cctgttcttt atgcatcaga 1080
aaagaaggaa tacccggtgg atccatctct tccagatatc aagaatagca tttactcaac 1140
agatgaattc cgaatgtatt cttttaaagt gcggccttgt tcacgagcgt actcgcatga 1200
ttggacggag tgcccttttg ttcatccagg ggagaatgcc cgtagaaggg atccaaggaa 1260
gttccactac agctgtgtcc cttgccctga tttccggaag ggtgcttgta gacgtggaga 1320
tatgtgtgaa tatgctcatg gtgtttttga gtgctggctc catcctgctc agtatcggac 1380
tcgattatgc aaggatggta caagttgtgc tcggagagtg tgcttctttg cccacacgga 1440
gcaagagctg cgtccattgt acgtctccac tggttctgct gttccgtctc ctcgctcgag 1500
tacctctgga gctgctgcca tggattttgc tgcagccatg agcctcttac ctggttcccc 1560
atcatcagta tccatcatgt ccccttcacc cttcactcct cccatgtctc catctgctaa 1620
tggtatttct cacccatctg ttgcctggcc ccagcaaaat gtaccaactt tgcatcttcc 1680
cggaagcaat cttcagtcca gccgcttgag atcttctctt aatgcaagag atattcctca 1740
ggaggatttt gacttgctgt cagattatga tgtgcaacag cagcagctcc taaatgagtt 1800
ttccatcctt tcacaacaat cgatgggtgc taattccttg aaccgttctg gtcggctgaa 1860
aactttgacc ccctcaaacc ttgatgatct cttctctgct gagagctcat cccctcgcta 1920
cgctgatcaa gccctggctt ctgctgtttt ttcaccaacg cacaaatctg cagtaatcaa 1980
tcaatttcag cagcagcagc agagcatgtt atcacccatc aacacaacct tctctcctaa 2040
gagtgtcgac caccctttgt tgcaagcgtc tttcggtgtt caatctgggc gaatgtcccc 2100
tcgtaacatg gatcccatct ctcctataag ttctcgtgtg tcgatgttgg cccaacgaga 2160
gaaacagcaa cagcaattac gcagcctaag ctctcgtgaa ctcggttcca attcagccgc 2220
cattgtgggt tcccccgtgg gttcttggtc gaaatgggga gctacaaatg ggaaaccaga 2280
ctgggctgtt agtgcagatg aactaggtaa gcttcgcagg tctaattcat ttgagcttgg 2340
gaacaatggt gaggagccag atctttcatg ggttcaatcc ctcgttaaag aatctcctac 2400
cgagatgaaa gaaaagcttt cgtcaactct ctctggtgtt ccagcccccg ctacatccag 2460
tgaggttccg agtatcagct cgcagatgga atcggttgat cacgaagtgc taggagcatg 2520
gctccagcag atgcagctcg atccgctcgt ggctcagcaa aactaggttg ttttttttcc 2580
tacatggcct tgaggaagta gacagcggaa agtttttttt ggtaaatact atgttttttc 2640
tggaaatttt tgatgctggg ggtggggtct ggaagaagat aacaaggcag gaaaggggtc 2700
agtgaagtca ctggagaaaa ggaattcatt tttaaccatt ttatcattct attacaacag 2760
aaagtaggga aaaaaaagga agaccctctg ggttatgaag agaaattaaa cccaggctag 2820
gcgttctcct ttctaatatt tccaatttta ggtccatatt actgtcattt cctttttgcc 2880
gtcttatcat atttcatcaa aatggaactg gggactaatg tttgttccat tctttcgctc 2940
ttctgattta tttgcaccct tggggtaaga tcaaaagaga aattatgatc attttctttt 3000
gaggatattt ttttttccca atatttgtga gaatgaaagt taagagggga tatgatgtgt 3060
ctggtgttgt agtatgaaaa accaataacc gagttcacct gttgctgctg gtggtagaag 3120
aagtggagaa gaagctatga tcctttgatg taacagtcaa tcaaacattt taataccttt 3180
attttttgtt tcctcatgta atccatcctt tgtgattgtc ctctctctct ctctctctct 3240
ctctctctcc ctccccgtgt tctttcttca taagcgtctt gcttgtcgat ctgtaaatta 3300
ttgaaaaggg tcatggaaag ccgtgccggt gtggattctc atttttgcaa aaaaaaaaaa 3360
aaaaaaaaaa aa 3372
<210>11
<211>704
<212>PRT
<213>大桉
<400>11
Met Ser Gln Leu Thr Ile Gln Thr Glu Asp Thr Phe Ala Ser Leu Leu
1 5 10 15
Glu Leu Ala Ala Asn Asn Asp Thr Glu Ser Phe Gly Arg Cys Val Glu
20 25 30
Arg Asp Pro Ser Ser Ile Asp Glu Ile Gly Tyr Trp Tyr Gly Arg Gln
35 40 45
Lys Gly Ser Lys Gln Val Val Asn Met Gln Arg Thr Pro Leu Met Val
50 55 60
Ala Ala Thr Tyr Gly Ser Val Asp Val Met Arg Leu Ile Leu Cys Leu
65 70 75 80
Ser Asp Ala Asp Val Asn Arg Thr Cys Ser Thr Asp Lys Ser Thr Ala
85 90 95
Leu His Cys Ala Ala Ser Gly Gly Ala Val Asn Ala Val Asp Ala Val
100 105 110
Arg Leu Leu Leu Ser Ala Gly Ala Asp Pro Ser Leu Ala Asp Ala Asn
115 120 125
Gly Gln Arg Pro Val Asp Val Ile Val Val Pro Pro Lys Leu Leu Ser
130 135 140
Ile Lys Phe Ala Leu Glu Glu Leu Leu Ser Thr Glu Gly Ser Val Asn
145 150 155 160
Glu His Asn Leu Arg Val Ser Val Ala Thr Ser Asn Ser Thr Ser Pro
165 170 175
Pro Leu Ser Ser Ser Pro Asp Asn Gly Ser Pro Ala Ser Ala Asn Cys
180 185 190
Ser Ser Pro Lys Asn Ser Lys Leu Ser Asp Ala Pro Val Leu Tyr Ala
195 200 205
Ser Glu Lys Lys Glu Tyr Pro Val Asp Pro Ser Leu Pro Asp Ile Lys
210 215 220
Asn Ser Ile Tyr Ser Thr Asp Glu Phe Arg Met Tyr Ser Phe Lys Val
225 230 235 240
Arg Pro Cys Ser Arg Ala Tyr Ser His Asp Trp Thr Glu Cys Pro Phe
245 250 255
Val His Pro Gly Glu Asn Ala Arg Arg Arg Asp Pro Arg Lys Phe His
260 265 270
Tyr Ser Cys Val Pro Cys Pro Asp Phe Arg Lys Gly Ala Cys Arg Arg
275 280 285
Gly Asp Met Cys Glu Tyr Ala His Gly Val Phe Glu Cys Trp Leu His
290 295 300
Pro Ala Gln Tyr Arg Thr Arg Leu Cys Lys Asp Gly Thr Ser Cys Ala
305 310 315 320
Arg Arg Val Cys Phe Phe Ala His Thr Glu Gln Glu Leu Arg Pro Leu
325 330 335
Tyr Val Ser Thr Gly Ser Ala Val Pro Ser Pro Arg Ser Ser Thr Ser
340 345 350
Gly Ala Ala Ala Met Asp Phe Ala Ala Ala Met Ser Leu Leu Pro Gly
355 360 365
Ser Pro Ser Ser Val Ser Ile Met Ser Pro Ser Pro Phe Thr Pro Pro
370 375 380
Met Ser Pro Ser Ala Asn Gly Ile Ser His Pro Ser Val Ala Trp Pro
385 390 395 400
Gln Gln Asn Val Pro Thr Leu His Leu Pro Gly Ser Asn Leu Gln Ser
405 410 415
Ser Arg Leu Arg Ser Ser Leu Asn Ala Arg Asp Ile Pro Gln Glu Asp
420 425 430
Phe Asp Leu Leu Ser Asp Tyr Asp Val Gln Gln Gln Gln Leu Leu Asn
435 440 445
Glu Phe Ser Ile Leu Ser Gln Gln Ser Met Gly Ala Asn Ser Leu Asn
450 455 460
Arg Ser Gly Arg Leu Lys Thr Leu Thr Pro Ser Asn Leu Asp Asp Leu
465 470 475 480
Phe Ser Ala Glu Ser Ser Ser Pro Arg Tyr Ala Asp Gln Ala Leu Ala
485 490 495
Ser Ala Val Phe Ser Pro Thr His Lys Ser Ala Val Ile Asn Gln Phe
500 505 510
Gln Gln Gln Gln Gln Ser Met Leu Ser Pro Ile Asn Thr Thr Phe Ser
515 520 525
Pro Lys Ser Val Asp His Pro Leu Leu Gln Ala Ser Phe Gly Val Gln
530 535 540
Ser Gly Arg Met Ser Pro Arg Asn Met Asp Pro Ile Ser Pro Ile Ser
545 550 555 560
Ser Arg Val Ser Met Leu Ala Gln Arg Glu Lys Gln Gln Gln Gln Leu
565 570 575
Arg Ser Leu Ser Ser Arg Glu Leu Gly Ser Asn Ser Ala Ala Ile Val
580 585 590
Gly Ser Pro Val Gly Ser Trp Ser Lys Trp Gly Ala Thr Asn Gly Lys
595 600 605
Pro Asp Trp Ala Val Ser Ala Asp Glu Leu Gly Lys Leu Arg Arg Ser
610 615 620
Asn Ser Phe Glu Leu Gly Asn Asn Gly Glu Glu Pro Asp Leu Ser Trp
625 630 635 640
Val Gln Ser Leu Val Lys Glu Ser Pro Thr Glu Met Lys Glu Lys Leu
645 650 655
Ser Ser Thr Leu Ser Gly Val Pro Ala Pro Ala Thr Ser Ser Glu Val
660 665 670
Pro Ser Ile Ser Ser Gln Met Glu Ser Val Asp His Glu Val Leu Gly
675 680 685
Ala Trp Leu Gln Gln Met Gln Leu Asp Pro Leu Val Ala Gln Gln Asn
690 695 700
<210>12
<211>1860
<212>DNA
<213>稻
<400>12
atgggggagc ctgggggcgc cgaggcggcc gtctccgcga ggctgctcga gctggcggcc 60
gacgacaacg cggcggggct cggggagctc ctcgcggcgt ggccctccct cgccgacgag 120
cccgcgccgt ggtacacccc ggcgcggggc gcggagccgc tgaccccgct catggtcgcc 180
gccgtgtacg gctcggtggg ctgcctcgac gcgctcctct cgccgcccta cctcgtggac 240
cccaaccgcg cctcggcgtc gtcgctctcc accccgctcc acctcgccgc cgcgggcggg 300
tccgcctccg cccccgcggc ggtctcccgc ctcctcgccg ccggcgccga cccggccctc 360
ctcgaccacc tccagcgccg ggcgtccgac ctcgtcgcgc tcccgcccaa ctcgctcccg 420
ctcaagaacc acctcctctc cctcctcggc gcccgcaagg agtggcctcc cgacccctcc 480
ctccccgaca tcaagaacgg cgcctacgcc tccgacgact tcaggatgta ctcgttcaag 540
gtgcgcgcgt gctcgcgggc ctactcccat gactggacgg agtgcccctt cgtccacccc 600
ggcgagaacg cgcggcggcg cgacccgagg aagtaccact acagctgcgt gccgtgcccg 660
gagttcaaga agggggccgg gtgcaggaga ggggacatgt gcgagtacgc gcacggggtg 720
ttcgagagct ggctccaccc ggcgcagtac cggacgcgcc tctgcaagga cggcgtcggc 780
tgcgcccgcc gcgtctgctt cttcgcccac acgcccgacg agctccgccc gctctacgtc 840
tccacgggct ccgccgtgcc gtcgccgcgc ggggcgttgg agatggcggc ggcggcggcg 900
gcgatgggga tggggctgtc gtcgccgggg tcgtcgtcgt tcacgccgcc gctatcgccg 960
tcggccggcg ggggcggggg cgggggcggg ggcagcggcg gcggcggcgc gtggccgcag 1020
cagccgagcg tgccggcgct ctgcctgccc gggagcgccg ggaacctcca cctgagccgg 1080
ctgcgcacgt cgctgagcgc gcgcgacatg gccgtcgacg agctgctcgc cgcggcggcg 1140
gcggcggcgg actacgacgg cctcgtcgcc tcccccgcct ccatccggtc cgcgaggggg 1200
aaggcgcttg tgccgtcaaa tctcgacgag ctcttctccg ctgagctcgc cgccgccgcg 1260
gcgtcgcgct cgccgcgcta cgccgaccaa ggcggcgccg cgttctcccc gacccgcaag 1320
gccaccgtgc tcaaccaatt ccagctgcag cagcagcata gcttgctctc gccgcgggcg 1380
gccgcggtga caccagagcc ggtctcccca atgagctccc gcctcctcgc cgcgctggcg 1440
cagcgggaga agatgcagca gcagacgctg cggagcatga gctcacggga cctcggcaac 1500
gccgcgtcgc tgctggtcgg ctcgccggtg agctcgagca tgtccaaatg ggggttcccc 1560
tccggcaacc cggactgggg cgccgacgac gaggagctcg gccgcctcaa gcgttgctcc 1620
tcgttcgagc tccggtccgg agccgccaat ggcaaccatg agcctgacct ctcatgggtc 1680
aacaccctag tgaaggagcc gacaccggag aagatgatga cgacgacatc ggcaatggat 1740
tccattggca tcttgggaca gaacacaagc cgtgatcaca tcgtcggagg cgaggatgac 1800
actgccggag tcatcagcag ctggcttgaa cagctccagc tcgatgagat ggttgtctag 1860
<210>13
<211>619
<212>PRT
<213>稻
<400>13
Met Gly Glu Pro Gly Gly Ala Glu Ala Ala Val Ser Ala Arg Leu Leu
1 5 10 15
Glu Leu Ala Ala Asp Asp Asn Ala Ala Gly Leu Gly Glu Leu Leu Ala
20 25 30
Ala Trp Pro Ser Leu Ala Asp Glu Pro Ala Pro Trp Tyr Thr Pro Ala
35 40 45
Arg Gly Ala Glu Pro Leu Thr Pro Leu Met Val Ala Ala Val Tyr Gly
50 55 60
Ser Val Gly Cys Leu Asp Ala Leu Leu Ser Pro Pro Tyr Leu Val Asp
65 70 75 80
Pro Asn Arg Ala Ser Ala Ser Ser Leu Ser Thr Pro Leu His Leu Ala
85 90 95
Ala Ala Gly Gly Ser Ala Ser Ala Pro Ala Ala Val Ser Arg Leu Leu
100 105 110
Ala Ala Gly Ala Asp Pro Ala Leu Leu Asp His Leu Gln Arg Arg Ala
115 120 125
Ser Asp Leu Val Ala Leu Pro Pro Asn Ser Leu Pro Leu Lys Asn His
130 135 140
Leu Leu Ser Leu Leu Gly Ala Arg Lys Glu Trp Pro Pro Asp Pro Ser
145 150 155 160
Leu Pro Asp Ile Lys Asn Gly Ala Tyr Ala Ser Asp Asp Phe Arg Met
165 170 175
Tyr Ser Phe Lys Val Arg Ala Cys Ser Arg Ala Tyr Ser His Asp Trp
180 185 190
Thr Glu Cys Pro Phe Val His Pro Gly Glu Asn Ala Arg Arg Arg Asp
195 200 205
Pro Arg Lys Tyr His Tyr Ser Cys Val Pro Cys Pro Glu Phe Lys Lys
210 215 220
Gly Ala Gly Cys Arg Arg Gly Asp Met Cys Glu Tyr Ala His Gly Val
225 230 235 240
Phe Glu Ser Trp Leu His Pro Ala Gln Tyr Arg Thr Arg Leu Cys Lys
245 250 255
Asp Gly Val Gly Cys Ala Arg Arg Val Cys Phe Phe Ala His Thr Pro
260 265 270
Asp Glu Leu Arg Pro Leu Tyr Val Ser Thr Gly Ser Ala Val Pro Ser
275 280 285
Pro Arg Gly Ala Leu Glu Met Ala Ala Ala Ala Ala Ala Met Gly Met
290 295 300
Gly Leu Ser Ser Pro Gly Ser Ser Ser Phe Thr Pro Pro Leu Ser Pro
305 310 315 320
Ser Ala Gly Gly Gly Gly Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly
325 330 335
Ala Trp Pro Gln Gln Pro Ser Val Pro Ala Leu Cys Leu Pro Gly Ser
340 345 350
Ala Gly Asn Leu His Leu Ser Arg Leu Arg Thr Ser Leu Ser Ala Arg
355 360 365
Asp Met Ala Val Asp Glu Leu Leu Ala Ala Ala Ala Ala Ala Ala Asp
370 375 380
Tyr Asp Gly Leu Val Ala Ser Pro Ala Ser Ile Arg Ser Ala Arg Gly
385 390 395 400
Lys Ala Leu Val Pro Ser Asn Leu Asp Glu Leu Phe Ser Ala Glu Leu
405 410 415
Ala Ala Ala Ala Ala Ser Arg Ser Pro Arg Tyr Ala Asp Gln Gly Gly
420 425 430
Ala Ala Phe Ser Pro Thr Arg Lys Ala Thr Val Leu Asn Gln Phe Gln
435 440 445
Leu Gln Gln Gln His Ser Leu Leu Ser Pro Arg Ala Ala Ala Val Thr
450 455 460
Pro Glu Pro ValSer Pro Met Ser Ser Arg Leu Leu Ala Ala Leu Ala
465 470 475 480
Gln Arg Glu Lys Met Gln Gln Gln Thr Leu Arg Ser Met Ser Ser Arg
485 490 495
Asp Leu Gly Asn Ala Ala Ser Leu Leu Val Gly Ser Pro Val Ser Ser
500 505 510
Ser Met Ser Lys Trp Gly Phe Pro Ser Gly Asn Pro Asp Trp Gly Ala
515 520 525
Asp Asp Glu Glu Leu Gly Arg Leu Lys Arg Cys Ser Ser Phe Glu Leu
530 535 540
Arg Ser Gly Ala Ala Asn Gly Asn His Glu Pro Asp Leu Ser Trp Val
545 550 555 560
Asn Thr Leu Val Lys Glu Pro Thr Pro Glu Lys Met Met Thr Thr Thr
565 570 575
Ser Ala Met Asp Ser Ile Gly Ile Leu Gly Gln Asn Thr Ser Arg Asp
580 585 590
His Ile Val Gly Gly Glu Asp Asp Thr Ala Gly Val Ile Ser Ser Trp
595 600 605
Leu Glu Gln Leu Gln Leu Asp Glu Met Val Val
610 615
<210>14
<211>2106
<212>DNA
<213>蒺藜苜蓿(Medicago truncatula)
<400>14
atgaaaaatc taactgttcg tactgatgat tctttttcca gcttacttga acatgcttct 60
aacaatgatt ttgaagattt caaggtagct ctagatagtg atgcttcact tattaatgaa 120
gttggcttct ggtatgtccg tcaaaaggga tctaaccaaa ttgttcttga gcaccgaacc 180
cctttaatgg tggctgcttc ctatgggagt attgatattc taaagcttat actctcatat 240
cccgaggctg atgttaattt ctcctgtgga actgataaaa gcactgctct tcactgtgct 300
gcctcaagtg gttcagttaa tgctgttgat gctataaaat tgcttttatc agctggtgct 360
gatatcaatt ctgtggatgc taatgggaaa cgccctgtgg atgttatcgt tgttcctatt 420
gttgttcctc ataagctcga aggtgttaaa acaattcttg aagaacttct ctcagacagt 480
gcttctgaag gatctgtgga tgattgctct cttcccctgt ctcttatttc atcgagtcct 540
ggttcatctg cccctttatc atctgctgaa aatggatctc catcctctcc tgtggctccc 600
aagtttacag atacagctgt taattctaca tcagaaaaga aagagtatcc agttgaccca 660
tctcttcctg acataaaaaa cagcatgtat gccacagatg aattccgcat gtattcattc 720
aaggttcgtc cttgttctcg tgcatactct catgattgga ctgagtgtcc ttttgtgcat 780
cctggagaga atgctcgaag gagagaccct agaaagtttc actacagctg tgtgccatgc 840
cctgatttta ggaaaggggc ttgccgacgt tcggatatgt gtgaatatgc tcatggagta 900
ttcgagtgct ggctacaccc agctcagtat cggacaaggc tgtgcaaaga cggtatgggt 960
tgtaaccgaa gggtgtgctt cttcgctcac tcacctgaag agctgcgtcc gctgtatgtg 1020
tccactggtt ctgctgttcc ttcaccccga tcagctgctt ctactgctaa tgtcatggac 1080
atggctgctg ctatgagcct tttccctggt tcaccatcat caatctcttt gatgtctcaa 1140
tcaccctttg cacagcctcc tctatctcca tctgcaaatg gcaataatgc ttggccacag 1200
cccaatgtgc cagctcttca tttaccagga agcattaatc aaactagtcg tttgagatct 1260
tctcttagtg cccgtgatat gccacacgac gacttcaaca atatgttgca agactttgat 1320
gggcagcagc agatactaaa tgacttgagc tgtttctcac agccccgtcc tggtgctatt 1380
tcagttggtc gatctggccg ccctaaaaca ctaactccct caaatctgga tgatcttttt 1440
tgtgctgaga ttgcttcatc tcctaggtat tccgaccccg ctgcggcttc tgtattttcc 1500
ccaacacaca aatctgctgt cttcaaccag tttcaacagc ttcaaagctc cttatcaccc 1560
atcaacacaa atgtcatgtc tcctacaaac gtagagcatc ccctgttcca ccaggcttca 1620
tatggtctct cttctcctgg aaggatgtca ccaagaagta tggaagccct atctccaatg 1680
agttctcggc tgtcagcttt tgctcagcgt gagaaacaac agcagcagca gcaacagctg 1740
cgtagcctca gctcaagaga actcggtgct aacaatcctc tctcagctgt tgggtcccct 1800
gttaactcct ggtccaagtg gggatcatcc cctattggaa aagctgattg gtcggtaaat 1860
ccaaatgact tcggtcaaac acagagatca acttcttttg agcatggaaa caatggagaa 1920
gagcctgatg taggttgggt ccattccctt gtcaaggatc ccacacctga gaagaaagag 1980
aagcttgcag gttccggccc aattccatcc gttgaaaaga atcccaatcc tcaagcggac 2040
ggcattgatc actctgtttt gggagcttgg ctcgagcaac tgcagctgga tcaacttgta 2100
gtctag 2106
<210>15
<211>701
<212>PRT
<213>蒺藜苜蓿
<400>15
Met Lys Asn Leu Thr Val Arg Thr Asp Asp Ser Phe Ser Ser Leu Leu
1 5 10 15
Glu His Ala Ser Asn Asn Asp Phe Glu Asp Phe Lys Val Ala Leu Asp
20 25 30
Ser Asp Ala Ser Leu Ile Asn Glu Val Gly Phe Trp Tyr Val Arg Gln
35 40 45
Lys Gly Ser Asn Gln Ile Val Leu Glu His Arg Thr Pro Leu Met Val
50 55 60
Ala Ala Ser Tyr Gly Ser Ile Asp Ile Leu Lys Leu Ile Leu Ser Tyr
65 70 75 80
Pro Glu Ala Asp Val Asn Phe Ser Cys Gly Thr Asp Lys Ser Thr Ala
85 90 95
Leu His Cys Ala Ala Ser Ser Gly Ser Val Asn Ala Val Asp Ala Ile
100 105 110
Lys Leu Leu Leu Ser Ala Gly Ala Asp Ile Asn Ser Val Asp Ala Asn
115 120 125
Gly Lys Arg Pro Val Asp Val Ile Val Val Pro Ile Val Val Pro His
130 135 140
Lys Leu Glu Gly Val Lys Thr Ile Leu Glu Glu Leu Leu Ser Asp Ser
145 150 155 160
Ala Ser Glu Gly Ser Val Asp Asp Cys Ser Leu Pro Leu Ser Leu Ile
165 170 175
Ser Ser Ser Pro Gly Ser Ser Ala Pro Leu Ser Ser Ala Glu Asn Gly
180 185 190
Ser Pro Ser Ser Pro Val Ala Pro Lys Phe Thr Asp Thr Ala Val Asn
195 200 205
Ser Thr Ser Glu Lys Lys Glu Tyr Pro Val Asp Pro Ser Leu Pro Asp
210 215 220
Ile Lys Asn Ser Met Tyr Ala Thr Asp Glu Phe Arg Met Tyr Ser Phe
225 230 235 240
Lys Val Arg Pro Cys Ser Arg Ala Tyr Ser His Asp Trp Thr Glu Cys
245 250 255
Pro Phe Val His Pro Gly Glu Asn Ala Arg Arg Arg Asp Pro Arg Lys
260 265 270
Phe His Tyr Ser Cys Val Pro Cys Pro Asp Phe Arg Lys Gly Ala Cys
275 280 285
Arg Arg Ser Asp Met Cys Glu Tyr Ala His Gly Val Phe Glu Cys Trp
290 295 300
Leu His Pro Ala Gln Tyr Arg Thr Arg Leu Cys Lys Asp Gly Met Gly
305 310 315 320
Cys Asn Arg Arg Val Cys Phe Phe Ala His Ser Pro Glu Glu Leu Arg
325 330 335
Pro Leu Tyr Val Ser Thr Gly Ser Ala Val Pro Ser Pro Arg Ser Ala
340 345 350
Ala Ser Thr Ala Asn Val Met Asp Met Ala Ala Ala Met Ser Leu Phe
355 360 365
Pro Gly Ser Pro Ser Ser Ile Ser Leu Met Ser Gln Ser Pro Phe Ala
370 375 380
Gln Pro Pro Leu Ser Pro Ser Ala Asn Gly Asn Asn Ala Trp Pro Gln
385 390 395 400
Pro Asn Val Pro Ala Leu His Leu Pro Gly Ser Ile Asn Gln Thr Ser
405 410 415
Arg Leu Arg Ser Ser Leu Ser Ala Arg Asp Met Pro His Asp Asp Phe
420 425 430
Asn Asn Met Leu Gln Asp Phe Asp Gly Gln Gln Gln Ile Leu Asn Asp
435 440 445
Leu Ser Cys Phe Ser Gln Pro Arg Pro Gly Ala Ile Ser Val Gly Arg
450 455 460
Ser Gly Arg Pro Lys Thr Leu Thr Pro Ser Asn Leu Asp Asp Leu Phe
465 470 475 480
Cys Ala Glu Ile Ala Ser Ser Pro Arg Tyr Ser Asp Pro Ala Ala Ala
485 490 495
Ser Val Phe Ser Pro Thr His Lys Ser Ala Val Phe Asn Gln Phe Gln
500 505 510
Gln Leu Gln Ser Ser Leu Ser Pro Ile Asn Thr Asn Val Met Ser Pro
515 520 525
Thr Asn Val Glu His Pro Leu Phe His Gln Ala Ser Tyr Gly Leu Ser
530 535 540
Ser Pro Gly Arg Met Ser Pro Arg Ser Met Glu Ala Leu Ser Pro Met
545 550 555 560
Ser Ser Arg Leu Ser Ala Phe Ala Gln Arg Glu Lys Gln Gln Gln Gln
565 570 575
Gln Gln Gln Leu Arg Ser Leu Ser Ser Arg Glu Leu Gly Ala Asn Asn
580 585 590
Pro Leu Ser Ala Val Gly Ser Pro Val Asn Ser Trp Ser Lys Trp Gly
595 600 605
Ser Ser Pro Ile Gly Lys Ala Asp Trp Ser Val Asn Pro Asn Asp Phe
610 615 620
Gly Gln Thr Gln Arg Ser Thr Ser Phe Glu His Gly Asn Asn Gly Glu
625 630 635 640
Glu Pro Asp Val Gly Trp Val His Ser Leu Val Lys Asp Pro Thr Pro
645 650 655
Glu Lys Lys Glu Lys Leu Ala Gly Ser Gly Pro Ile Pro Ser Val Glu
660 665 670
Lys Asn Pro Asn Pro Gln Ala Asp Gly Ile Asp His Ser Val Leu Gly
675 680 685
Ala Trp Leu Glu Gln Leu Gln Leu Asp Gln Leu Val Val
690 695 700
<210>16
<211>2841
<212>DNA
<213>稻
<400>16
atgaacggca cgccgatctc cgcgtccgcc gcggccggcg tcgacggagt cggcgcggcg 60
gtggcgctgg cggccgcgac caagaagagt gccgccgcgg cggccgccgt cgccgagatg 120
gcgaaaaccc tcaccgtcga cacggacgac gccttcgcgg ggctcctcga gctcgccgcg 180
gacgacgacg cggagggcct gcgccgcgcg ctggagcgcg ccccgcccgc cgccgcggac 240
gaggcgggcc tctggtacgg ccgccgcaag gtcctcgagc accgcacgcc gctgatggtc 300
gcggccacct atggcagcct cgcggtgctt cgcctgctgc tgtccctccc gtccgtcgat 360
gtcaatcgcc gctgtggctc cgacggcacc accgccctcc actgtgcggc gtctggtggc 420
tcgccgtctt gtgtggaggc cgtcaagctg ctgcttgctg ctggggctga tgctgatgcc 480
acggatgctt ccggatatcg tccagctgat gtgatctctg ttcctccaaa gatgtttgac 540
gccaagattg ccctccaaga tcttcttgga tgcccaaagg ctgggcatgg cgttctccgg 600
gtggtgacaa gggccgcaaa ctctatgttg tcacctgtat catcccctac agcagaagat 660
gcacgatctc catcagctgc tgtgatgatg acgacaaagt ttgcagatct tccaagggtt 720
gtgacatcgg aaaagaaaga atatccagtg gatccgtccc ttcccgatat caagaacagc 780
atctatgctt ccgatgagtt ccgcatgtac tcatttaaga tcaggccatg ctcgcgggcg 840
tactcacatg attggactga gtgcccgttt gttcacccag gggagaacgc acggcgtcgg 900
gaccctcgca agtatcacta cagctgtgtg ccatgccccg actttagaaa gggagtttgc 960
cggcgtggtg acatgtgtga atatgctcat ggcgtgttcg agtgttggct ccatccagca 1020
cagtaccgta ctcgcctttg caaggatggc acaagctgta atcgccgtgtctgtttcttt 1080
gcgcatacaa ctgatgagct ccgaccacta tatgtttcca ctggatctgc agtaccatcc 1140
ccaagagcct cggcaacagc tacaatggag atggctgcag caatgggctt gatgcctggt 1200
tctccatcat cagtttcagc agtcatgtcc ccatttacac caccaatgtc cccttcaggc 1260
aatgggatgc ccccttcatt gggctggcag cagccaaatg ttccgacact acaccttcca 1320
ggcagcagcc ttcagtcgag ccggctccgt acctcactta gtgcaaggga tatgcctgct 1380
gatgattact ccctgatgca ggatattgat tcacagctta taaatgattt gtgctattca 1440
cgtattggtt catcaacagg aaaccacacg tctcggacca agtccctaaa tccgtcaaac 1500
ttggatgatc tcttctctgc tgagatggtc tcttccccga ggtatagtaa tgctgatcag 1560
ggtggtatgt tttcaccatc tcacaaggct gctttcctta atcagttcca gcaacagcag 1620
caggcacttc tttcaccaat caacacagtc ttctccccga agtctgtgga caaccagcag 1680
ttgccttcac actcatctct gttgcaagca tcacttggta tatcctcccc tggccgcatg 1740
tctcctcgat gtgttgaatc tgggtcccct atgaactctc atcttgctgc tgctcttgct 1800
cagcgtgaga agcaacagca gacaatgaga agtctcagtt ctcgtgatct tgggccgagt 1860
gctgcaagag catcaggtgt tgttggctcc cctctaagct catcatggtc aaagtgggga 1920
tcaccttcag ggacacctga ctggggtgtt aatggtgaag aattgggcaa gcttcgccgg 1980
tcatcatcgt ttgagctgag atctggtggt gatgatccag atctctcttg ggtacacaca 2040
ctggttaagg aatctccacc agagaagcaa gtcactactg ctgaatccat aaactctgtt 2100
ggaccttcac cactgatgcc tcccagtgta agcaacggtg aaggtcctag tctgaatgcc 2160
ccgctggatg ggcatgacca agctgctgtt attggagcat tgcttgaaca gatgcagctt 2220
gatcagcata ttggtagtct agcaacataa gcgctgaatg agcctggaaa gtgcaaggag 2280
ttattattct tagttaatga atttggagta atttttttcc tgttcattaa gatggtcagc 2340
aagcaaaagg atggatagct gatggtggtg attcagagat tggttttctt tactttattg 2400
aggtaaatca tatacattat tgaggttcca gtaggttgaa agattgaagt accttgattg 2460
gggtcgtttc aagaccgacc caggtagaat cgcaccccgg cagcttcaat tcatcggtca 2520
aaaatatttc cctgttttgt taattaaccc cgttaaaaaa gaagactcgt ttggtgtttc 2580
ggaattcttt tctttacctt agcggtgttt attttgttta ttatgatatt gatacttgat 2640
gtactgatgg gtataaggtt ggttaccagg catgctatag tggtatatca agtcccaaag 2700
tattcttttt ctccctttca ccatttgtcg aggatcatac tatggccttg ttttggtcag 2760
atcttgaggc ctgtataatc cttggatttg taataatgta atattgtcat tgaacttaca 2820
ttgctattgt tttgcaatcg c 2841
<210>17
<211>749
<212>PRT
<213>稻
<400>17
Met Asn Gly Thr Pro Ile Ser Ala Ser Ala Ala Ala Gly Val Asp Gly
1 5 10 15
Val Gly Ala Ala Val Ala Leu Ala Ala Ala Thr Lys Lys Ser Ala Ala
20 25 30
Ala Ala Ala Ala Val Ala Glu Met Ala Lys Thr Leu Thr Val Asp Thr
35 40 45
Asp Asp Ala Phe Ala Gly Leu Leu Glu Leu Ala Ala Asp Asp Asp Ala
50 55 60
Glu Gly Leu Arg Arg Ala Leu Glu Arg Ala Pro Pro Ala Ala Ala Asp
65 70 75 80
Glu Ala Gly Leu Trp Tyr Gly Arg Arg Lys Val Leu Glu His Arg Thr
85 90 95
Pro Leu Met Val Ala Ala Thr Tyr Gly Ser Leu Ala Val Leu Arg Leu
100 105 110
Leu Leu Ser Leu Pro Ser Val Asp Val Asn Arg Arg Cys Gly Ser Asp
115 120 125
Gly Thr Thr Ala Leu His Cys Ala Ala Ser Gly Gly Ser Pro Ser Cys
130 135 140
Val Glu Ala Val Lys Leu Leu Leu Ala Ala Gly Ala Asp Ala Asp Ala
145 150 155 160
Thr Asp Ala Ser Gly Tyr Arg Pro Ala Asp Val Ile Ser Val Pro Pro
165 170 175
Lys Met Phe Asp Ala Lys Ile Ala Leu Gln Asp Leu Leu Gly Cys Pro
180 185 190
Lys Ala Gly His Gly Val Leu Arg Val Val Thr Arg Ala Ala Asn Ser
195 200 205
Met Leu Ser Pro Val Ser Ser Pro Thr Ala Glu Asp Ala Arg Ser Pro
210 215 220
Ser Ala Ala Val Met Met Thr Thr Lys Phe Ala Asp Leu Pro Arg Val
225 230 235 240
Val Thr Ser Glu Lys Lys Glu Tyr Pro Val Asp Pro Ser Leu Pro Asp
245 250 255
Ile Lys Asn Ser Ile Tyr Ala Ser Asp Glu Phe Arg Met Tyr Ser Phe
260 265 270
Lys Ile Arg Pro Cys Ser Arg Ala Tyr Ser His Asp Trp Thr Glu Cys
275 280 285
Pro Phe Val His Pro Gly Glu Asn Ala Arg Arg Arg Asp Pro Arg Lys
290 295 300
Tyr His Tyr Ser Cys Val Pro Cys Pro Asp Phe Arg Lys Gly Val Cys
305 310 315 320
Arg Arg Gly Asp Met Cys Glu Tyr Ala His Gly Val Phe Glu Cys Trp
325 330 335
Leu His Pro Ala Gln Tyr Arg Thr Arg Leu Cys Lys Asp Gly Thr Ser
340 345 350
Cys Asn Arg Arg Val Cys Phe Phe Ala His Thr Thr Asp Glu Leu Arg
355 360 365
Pro Leu Tyr Val Ser Thr Gly Ser Ala Val Pro Ser Pro Arg Ala Ser
370 375 380
Ala Thr Ala Thr Met Glu Met Ala Ala Ala Met Gly Leu Met Pro Gly
385 390 395 400
Ser Pro Ser Ser Val Ser Ala Val Met Ser Pro Phe Thr Pro Pro Met
405 410 415
Ser Pro Ser Gly Asn Gly Met Pro Pro Ser Leu Gly Trp Gln Gln Pro
420 425 430
Asn Val Pro Thr Leu His Leu Pro Gly Ser Ser Leu Gln Ser Ser Arg
435 440 445
Leu Arg Thr Ser Leu Ser Ala Arg Asp Met Pro Ala Asp Asp Tyr Ser
450 455 460
Leu Met Gln Asp Ile Asp Ser Gln Leu Ile Asn Asp Leu Cys Tyr Ser
465 470 475 480
Arg Ile Gly Ser Ser Thr Gly Asn His Thr Ser Arg Thr Lys Ser Leu
485 490 495
Asn Pro Ser Asn Leu Asp Asp Leu Phe Ser Ala Glu Met Val Ser Ser
500 505 510
Pro Arg Tyr Ser Asn Ala Asp Gln Gly Gly Met Phe Ser Pro Ser His
515 520 525
Lys Ala Ala Phe Leu Asn Gln Phe Gln Gln Gln Gln Gln Ala Leu Leu
530 535 540
Ser Pro Ile Asn Thr Val Phe Ser Pro Lys Ser Val Asp Asn Gln Gln
545 550 555 560
Leu Pro Ser His Ser Ser Leu Leu Gln Ala Ser Leu Gly Ile Ser Ser
565 570 575
Pro Gly Arg Met Ser Pro Arg Cys Val Glu Ser Gly Ser Pro Met Asn
580 585 590
Ser His Leu Ala Ala Ala Leu Ala Gln Arg Glu Lys Gln Gln Gln Thr
595 600 605
Met Arg Ser Leu Ser Ser Arg Asp Leu Gly Pro Ser Ala Ala Arg Ala
610 615 620
Ser Gly Val Val Gly Ser Pro Leu Ser Ser Ser Trp Ser Lys Trp Gly
625 630 635 640
Ser Pro Ser Gly Thr Pro Asp Trp Gly Val Asn Gly Glu Glu Leu Gly
645 650 655
Lys Leu Arg Arg Ser Ser Ser Phe Glu Leu Arg Ser Gly Gly Asp Asp
660 665 670
Pro Asp Leu Ser Trp Val His Thr Leu Val Lys Glu Ser Pro Pro Glu
675 680 685
Lys Gln Val Thr Thr Ala Glu Ser Ile Asn Ser Val Gly Pro Ser Pro
690 695 700
Leu Met Pro Pro Ser Val Ser Asn Gly Glu Gly Pro Ser Leu Asn Ala
705 710 715 720
Pro Leu Asp Gly His Asp Gln Ala Ala Val Ile Gly Ala Leu Leu Glu
725 730 735
Gln Met Gln Leu Asp Gln His Ile Gly Ser Leu Ala Thr
740 745
<210>18
<211>2769
<212>DNA
<213>拟南芥
<400>18
acaccagtta ccctctcatc cgttttcgtt ttttttttct ctctttcaaa aatctctcag 60
ctgaggttga tcgatcttct tcttcttctt cctcactctt tagatttgtt ccttttgcat 120
tttacacttt tggatctgaa aatgtggttc tctgtttcgc ccgttaccgt ttagattcag 180
ttctgttttt ttcttacccg atcgcttgat tcggactgtg atctttgatc ttttttcttc 240
tccagtgccg tgaaggatgt gtggtcttgc taagaagctg gatatagagg atactttgac 300
atcactgtca gaccaagaga atgaatcttt ggccaaaccc atgaatgatg ctgctgaatg 360
ggaacattcg ttttctgcct tgcttgagtt tgctgcagac aacgatgtgg aggggtttag 420
gcggcaactc tctgatgtgt cttgtatcaa ccagatgggt ctttggtaca gacggcagag 480
gtttgttaga agaatggttc ttgagcaaag aaccccgctg atggttgctt cgttatatgg 540
gagtttagat gttgtgaagt ttattctttc tttcccggaa gcggagttga atctgtcttg 600
tggtcctgat aaaagtactg ctcttcattg cgctgcttct ggtgcttctg tgaattcctt 660
ggatgttgtc aagttgcttt tgagtgtagg agcagatcct aatatccctg atgctcatgg 720
aaatcgtcct gttgatgttc ttgttgtgtc tccacacgct cctggtttga gaaccatcct 780
tgaagagatc ttgaagaaag acgagattat atctgaagat ctgcatgcct cgtcatctag 840
cttgggatca agtttccggt ctctctcatc atcccctgat aatggttcct cgttactctc 900
cttagattca gtatcctctc cgactaagcc acacggtact gatgtaactt tcgcatcaga 960
gaagaaagag tacccaattg atccatcatt gcctgatatc aaaagcggga tttattcaac 1020
cgatgagttt cgtatgttct cgttcaagat ccgcccatgt tctcgagcat attcccatga 1080
ctggactgaa tgtccatttg cacacccagg tgagaatgca aggagaagag acccgaggaa 1140
gtttcactat acgtgtgttc catgcccgga ttttaagaaa ggatcctgta agcaaggtga 1200
tatgtgtgaa tatgctcatg gggtttttga atgctggcta caccctgctc agtacagaac 1260
acgattgtgc aaggacggaa tgggttgcaa ccgaagggtt tgcttctttg ctcacgcaaa 1320
tgaggagttg cgtcccttgt acccttccac aggatctgga ttgccatctc ctcgggcttc 1380
gtctgctgtt tccgcctcta ctatggacat ggcgtcagtt ttgaacatgt taccaggctc 1440
accatctgct gctcaacatt cgttcacccc accaatatct ccttctggaa atggtagtat 1500
gccccattca tcgatgggtt ggcctcagca gaacataccg gcgttgaatc ttcctggaag 1560
caatatccag ttgagtcgtc tgagatcttc tcttaacgct agagatattc cttctgagca 1620
gcttagcatg ctgcatgagt ttgaaatgca acgtcagctt gctggcgata tgcacagtcc 1680
acgctttatg aatcattccg ctcgtcctaa gacactgaac ccttcaaatc tggaggaact 1740
cttctcagct gaggttgcat ctcctcgttt ctctgatcaa cttgctgttt catctgttct 1800
atcgccttcc cacaagtccg cgcttcttaa tcagctgcag aataataagc agagcatgct 1860
ttctcctatc aagacaaatc taatgtcttc tccaaagaat gtggagcaac attctcttct 1920
gcagcaagcc tcgtcacccc gaggcggaga gcctatttcc ccaatgaatg ctcgaatgaa 1980
acagcagcta cattcacgca gcctaagctc ccgtgatttt ggatctagtc tgccccgtga 2040
tttaatgccg actgattctg gttcgccatt aagtccatgg tcaagttggg accagaccca 2100
tggaagcaag gtggattggt cagtccaatc agatgagtta ggtcggttga gaaaatctca 2160
ttccttggct aataacccaa acagggaagc agatgtttca tgggctcagc agatgttaaa 2220
agactcttca tcacctagga acggaaaccg tgttgtgaac atgaatggtg caaggccatt 2280
gactcaaggt ggttcgagtg tgaatcctca caacagtgac actcgtgaga gcgacattct 2340
tgatgcgtgg cttgaacagc tgcacctaga tcgctgagcc tcagctgcga gagagaggtt 2400
cacatttctg tgaagctgtg aaactgatga ttcgtttatt tattattcaa gaaagcaaac 2460
ggaaacaaaa gcaaactccg ggtaagcttt tttcgattct aataacccta aaaggctcag 2520
ttttttcagg cttctttctg aaatttcttt actttcttat ttttatcacc tcattaaatt 2580
aattattgta tcatctctgt tgtaacaatg gccaaagtgc gcctctatta cttcccggat 2640
ttctgattta cattttttgt atcctctcag tttgtcaatt gtttctaata tctccttcat 2700
atttgtcaaa gaacactgta tgagaaataa taacatattg tttcagctaa taagattcat 2760
tcatttcct 2769
<210>19
<211>706
<212>PRT
<213>拟南芥
<400>19
Met Cys Gly Leu Ala Lys Lys Leu Asp Ile Glu Asp Thr Leu Thr Ser
1 5 10 15
Leu Ser Asp Gln Glu Asn Glu Ser Leu Ala Lys Pro Met Asn Asp Ala
20 25 30
Ala Glu Trp Glu Hi s Ser Phe Ser Ala Leu Leu Glu Phe Ala Ala Asp
35 40 45
Asn Asp Val Glu Gly Phe Arg Arg Gln Leu Ser Asp Val Ser Cys Ile
50 55 60
Asn Gln Met Gly Leu Trp Tyr Arg Arg Gln Arg Phe Val Arg Arg Met
65 70 75 80
Val Leu Glu Gln Arg Thr Pro Leu Met Val Ala Ser Leu Tyr Gly Ser
85 90 95
Leu Asp Val Val Lys Phe Ile Leu Ser Phc Pro Glu Ala Glu Leu Asn
100 105 110
Leu Ser Cys Gly Pro Asp Lys Ser Thr Ala Leu His Cys Ala Ala Ser
115 120 125
Gly Ala Ser Val Asn Ser Leu Asp Val Val Lys Leu Leu Leu Ser Val
130 135 140
Gly Ala Asp Pro Asn Ile Pro Asp Ala His Gly Asn Arg Pro Val Asp
145 150 155 160
Val Leu Val Val Ser Pro His Ala Pro Gly Leu Arg Thr Ile Leu Glu
165 170 175
Glu Ile Leu Lys Lys Asp Glu Ile Ile Ser Glu Asp Leu His Ala Ser
180 185 190
Ser Ser Ser Leu Gly Ser Ser Phe Arg Ser Leu Ser Ser Ser Pro Asp
195 200 205
Asn Gly Ser Ser Leu Leu Ser Leu Asp Ser Val Ser Ser Pro Thr Lys
210 215 220
Pro His Gly Thr Asp Val Thr Phe Ala Ser Glu Lys Lys Glu Tyr Pro
225 230 235 240
Ile Asp Pro Ser Leu Pro Asp Ile Lys Ser Gly Ile Tyr Ser Thr Asp
245 250 255
Glu Phe Arg Met Phe Ser Phe Lys Ile Arg Pro Cys Ser Arg Ala Tyr
260 265 270
Ser His Asp Trp Thr Glu Cys Pro Phe Ala His Pro Gly Glu Asn Ala
275 280 285
Arg Arg Arg Asp Pro Arg Lys Phe His Tyr Thr Cys Val Pro Cys Pro
290 295 300
Asp Phe Lys Lys Gly Ser Cys Lys Gln Gly Asp Met Cys Glu Tyr Ala
305 310 315 320
His Gly Val Phe Glu Cys Trp Leu His Pro Ala Gln Tyr Arg Thr Arg
325 330 335
Leu Cys Lys Asp Gly Met Gly Cys Asn Arg Arg Val Cys Phe Phe Ala
340 34 5350
His Ala Asn Glu Glu Leu Arg Pro Leu Tyr Pro Ser Thr Gly Ser Gly
355 360 365
Leu Pro Ser Pro Arg Ala Ser Ser Ala Val Ser Ala Ser Thr Met Asp
370 375 380
Met Ala Ser Val Leu Asn Met Leu Pro Gly Ser Pro Ser Ala Ala Gln
385 390 395 400
His Ser Phe Thr Pro Pro Ile Ser Pro Ser Gly Asn Gly Ser Met Pro
405 410 415
His Ser Ser Met Gly Trp Pro Gln Gln Asn Ile Pro Ala Leu Asn Leu
420 425 430
Pro Gly Ser Asn Ile Gln Leu Ser Arg Leu Arg Ser Ser Leu Asn Ala
435 440 445
Arg Asp Ile Pro Ser Glu Gln Leu Ser Met Leu His Glu Phe Glu Met
450 455 460
Gln Arg Gln Leu Ala Gly Asp Met His Ser Pro Arg Phe Met Asn His
465 470 475 480
Ser Ala Arg Pro Lys Thr Leu Asn Pro Ser Asn Leu Glu Glu Leu Phe
485 490 495
Ser Ala Glu Val Ala Ser Pro Arg Phe Ser Asp Gln Leu Ala Val Ser
500 505 510
Ser Val Leu Ser Pro Ser His Lys Ser Ala Leu Leu Asn Gln Leu Gln
515 520 525
Asn Asn Lys Gln Ser Met Leu Ser Pro Ile Lys Thr Asn Leu Met Ser
530 535 540
Ser Pro Lys Asn Val Glu Gln His Ser Leu Leu Gln Gln Ala Ser Ser
545 550 555 560
Pro Arg Gly Gly Glu Pro Ile Ser Pro Met Asn Ala Arg Met Lys Gln
565 570 575
Gln Leu His Ser Arg Ser Leu Ser Ser Arg Asp Phe Gly Ser Ser Leu
580 585 590
Pro Arg Asp Leu Met Pro Thr Asp Ser Gly Ser Pro Leu Ser Pro Trp
595 600 605
Ser Ser Trp Asp Gln Thr His Gly Ser Lys Val Asp Trp Ser Val Gln
610 615 620
Ser Asp Glu Leu Gly Arg Leu Arg Lys Ser His Ser Leu Ala Asn Asn
625 630 635 640
Pro Asn Arg Glu Ala Asp Val Ser Trp Ala Gln Gln Met Leu Lys Asp
645 650 655
Ser Ser Ser Pro Arg Asn Gly Asn Arg Val Val Asn Met Asn Gly Ala
660 665 670
Arg Pro Leu Thr Gln Gly Gly Ser Ser Val Asn Pro His Asn Ser Asp
675 680 685
Thr Arg Glu Ser Asp Ile Leu Asp Ala Trp Leu Glu Gln Leu His Leu
690 695 700
Asp Arg
705
<210>20
<211>2674
<212>DNA
<213>稻
<400>20
tgcgagtcct cctcctcttc tcgtcgccgt gctactctcg ctttctctct ctctctctct 60
cacttgttcc ccaaggcgag aagcagccgc cgccggcgag cgtcgcgggg gaggggaggg 120
aagggaggga ggagcggtgg atccgggctt gattggattg ggtcggattc gattttggat 180
caaccccgga gggcgggagc ggttgctaca gatgcgttga gctttggtta atctatccgg 240
cgagagataa tgggcgagct tgctgatctc gttgtcgtgc cgtcgcagcc gccgctcgcc 300
ggcggccggc gggacagget ggcggcgctg ctggagctcg cggcggcgga tgatgttgat 360
gggctcaggg gggcgctcgc ggagggaggc gaggaggcgg cggagttggc tgatggggtc 420
gggctgtggt atggtcggag caaggcgtac gaggcgcgca cgccgctgat ggtggcggcg 480
acgtacggca gcgccggggt ggtctcgctg ctggtgggcc tcggcggttg cgtcgacgtc 540
aaccgtcgcc ctggagccga cggcgccacc gcgctccact gcgccgcctc cggtggctcg 600
cgcaacgccg tcgctgttgt caagctgctt ttggccgctg gcgccgatcc ggccaccccc 660
gattccgccg gccgcttccc cgccgacgtc atcctagctc ctccggcttc gccagatgcc 720
cttggcgatc tcgaggtgct cctcggccgc cgccgagcac tcgccgtggc gacctcggtg 780
gcttcaggtt cgtcatcccc tccgctctcg tcctcaccag atgagggcaa caggtcgccc 840
tcgtcgcgtt cgtcgtcgct gtctcccatc actgtggatc gtgggaagaa ggagtatccg 900
gtggatccaa ctctgccgga catcaagagc agcgtgtatg cttcggatga gttccgcatg 960
tttgcgttca aggtccggcc ctgctcccgt gcctactcac acgactggac tgagtgcccg 1020
tttgtgcacc ccggcgagaa cgcccgccgc cgtgatcccc gcaagcaccc atacactgct 1080
gtgccttgcc ccaactttcg ccggcctggt ggctgcccta gcggcgatag ctgtgagttc 1140
tcgcatggcg tgtttgagag ctggctacac ccatcacagt atcgcacaag gctctgcaag 1200
gagggagcag cttgcgcccg tcgcatttgc ttctttgccc atgatgagga tgagctccgc 1260
catgtgcctc acaacagtgg tgccggcctg ctgtctcccc gcgcttcttc atccattgat 1320
atgactgctg cagctgcgct cgggcttctt ccaggttctc ctaccagaca ctttgcaccg 1380
ccgcctgtgt caccatctgc tgggagcaat ggaggagctg ctgctgcgca ttggctccaa 1440
ggcagtaggc tgcgttcttc tttcaatgca agggatgctg ctgttgatga ccttggcatg 1500
ctcctcgaat gggaatcaca ataccttggg gcactctgcc tgccacccag cagccgcccc 1560
caaccacgcc tttcagctgg tctgagtatc aggccaacaa ttgctccatc caatcttgaa 1620
gacatgtatg cttcagacat ggcaatgtct ccgaggttcc ctaatgacca aggtcactca 1680
gtctactcac cagcccacaa atcagccctc ctcaacaagc ttcatcaaca gaagggcctc 1740
ttatcacctg ttaacaccaa cagaatgtac tccccaaggg ctcttgatcc gtcatctttg 1800
gcacattctc catttggtgg catgtctccc cggtcccccc gtaccatgga acctacatca 1860
cccctaagtg ctcgtgtagg agcccctgcc acacagcggc cttctgttgg ttcaccacgg 1920
aattccagtg cttggggcac cgtggggtcc ccgatgggta aggttgactg gggtgtcgat 1980
agcgaggagc tagtccgctt gagacgccct gcacaaccag ggtttggaga agatgagaca 2040
gatgtatcat gggtgcagtc actggtaagc aatgctgagc ttaatggcaa gaggggcgaa 2100
gtacaaggca tgcctggtac ttctgcattg atgaacaggc ctgacctgaa caatcagggt 2160
gacttgttgg accagacggt gatcggtgct tggcttgagc agatgcacct ggatcagaag 2220
tgatttccaa gggaagccat gaagtcccaa agtggatgaa gcctttattt tgccaaggtt 2280
atttaccaaa gaatagttgt tggtcctagt aaataataat ttattctttt taattcttga 2340
aatttttggt gggcaaagtc agagatggtg gtcaagttca acaaaacatt tggtcacaga 2400
ttggtagctg aaatcagttc cagagattgg taaacaacct cattacttgg ggtcctaact 2460
agtattcttt tgattagctc agatgagtct ttattttagt gggttaaaat tcatatgttc 2520
cccatggtta ttatgtccat gatctcttcc taacaaaaga gagattataa ttgtccattt 2580
ttcatttatc aatgaatgat tttgttaaaa caatgtaagt tacattctta attttttctc 2640
tgttcaatgg aattaccttc cttggttagt cctc 2674
<210>21
<211>657
<212>PRT
<213>稻
<400>21
Met Gly Glu Leu Ala Asp Leu Val Val Val Pro Ser Gln Pro Pro Leu
1 5 10 15
Ala Gly Gly Arg Arg Asp Arg Leu Ala Ala Leu Leu Glu Leu Ala Ala
20 25 30
Ala Asp Asp Val Asp Gly Leu Arg Gly Ala Leu Ala Glu Gly Gly Glu
35 40 45
Glu Ala Ala Glu Leu Ala Asp Gly Val Gly Leu Trp Tyr Gly Arg Ser
50 55 60
Lys Ala Tyr Glu Ala Arg Thr Pro Leu Met Val Ala Ala Thr Tyr Gly
65 70 75 80
Ser Ala Gly Val Val Ser Leu Leu Val Gly Leu Gly Gly Cys Val Asp
85 90 95
Val Asn Arg Arg Pro Gly Ala Asp Gly Ala Thr Ala Leu His Cys Ala
100 105 110
Ala Ser Gly Gly Ser Arg Asn Ala Val Ala Val Val Lys Leu Leu Leu
115 120 125
Ala Ala Gly Ala Asp Pro Ala Thr Pro Asp Ser Ala Gly Arg Phe Pro
130 135 140
Ala Asp Val Ile Leu Ala Pro Pro Ala Ser Pro Asp Ala Leu Gly Asp
145 150 155 160
Leu Glu Val Leu Leu Gly Arg Arg Arg Ala Leu Ala Val Ala Thr Ser
165 170 175
Val Ala Ser Gly Ser Ser Ser Pro Pro Leu Ser Ser Ser Pro Asp Glu
180 185 190
Gly Asn Arg Ser Pro Ser Ser Arg Ser Ser Ser Leu Ser Pro Ile Thr
195 200 205
Val Asp Arg Gly Lys Lys Glu Tyr Pro Val Asp Pro Thr Leu Pro Asp
210 215 220
Ile Lys Ser Ser Val Tyr Ala Ser Asp Glu Phe Arg Met Phe Ala Phe
225 230 235 240
Lys Val Arg Pro Cys Ser Arg Ala Tyr Ser His Asp Trp Thr Glu Cys
245 250 255
Pro Phe Val His Pro Gly Glu Asn Ala Arg Arg Arg Asp Pro Arg Lys
260 265 270
His Pro Tyr Thr Ala Val Pro Cys Pro Asn Phe Arg Arg Pro Gly Gly
275 280 285
Cys Pro Ser Gly Asp Ser Cys Glu Phe Ser His Gly Val Phe Glu Ser
290 295 300
Trp Leu His Pro Ser Gln Tyr Arg Thr Arg Leu Cys Lys Glu Gly Ala
305 310 315 320
Ala Cys Ala Arg Arg Ile Cys Phe Phe Ala His Asp Glu Asp Glu Leu
325 330 335
Arg His Val Pro His Asn Ser Gly Ala Gly Leu Leu Ser Pro Arg Ala
340 345 350
Ser Ser Ser Ile Asp Met Thr Ala Ala Ala Ala Leu Gly Leu Leu Pro
355 360 365
Gly Ser Pro Thr Arg His Phe Ala Pro Pro Pro Val Ser Pro Ser Ala
370 375 380
Gly Ser Asn Gly Gly Ala Ala Ala Ala His Trp Leu Gln Gly Ser Arg
385 390 395 400
Leu Arg Ser Ser Phe Asn Ala Arg Asp Ala Ala Val Asp Asp Leu Gly
405 410 415
Met Leu Leu Glu Trp Glu Ser Gln Tyr Leu Gly Ala Leu Cys Leu Pro
420 425 430
Pro Ser Ser Arg Pro Gln Pro Arg Leu Ser Ala Gly Leu Ser Ile Arg
435 440 445
Pro Thr Ile Ala Pro Ser Asn Leu Glu Asp Met Tyr Ala Ser Asp Met
450 455 460
Ala Met Ser Pro Arg Phe Pro Asn Asp Gln Gly His Ser Val Tyr Ser
465 470 475 480
Pro Ala His Lys Ser Ala Leu Leu Asn Lys Leu His Gln Gln Lys Gly
485 490 495
Leu Leu Ser Pro Val Asn Thr Asn Arg Met Tyr Ser Pro Arg Ala Leu
500 505 510
Asp Pro Ser Ser Leu Ala His Ser Pro Phe Gly Gly Met Ser Pro Arg
515 520 525
Ser Pro Arg Thr Met Glu Pro Thr Ser Pro Leu Ser Ala Arg Val Gly
530 535 540
Ala Pro Ala Thr Gln Arg Pro Ser Val Gly Ser Pro Arg Asn Ser Ser
545 550 555 560
Ala Trp Gly Thr Val Gly Ser Pro Met Gly Lys Val Asp Trp Gly Val
565 570 575
Asp Ser Glu Glu Leu Val Arg Leu Arg Arg Pro Ala Gln Pro Gly Phe
580 585 590
Gly Glu Asp Glu Thr Asp Val Ser Trp Val Gln Ser Leu Val Ser Asn
595 600 605
Ala Glu Leu Asn Gly Lys Arg Gly Glu Val Gln Gly Met Pro Gly Thr
610 6l5 620
Ser Ala Leu Met Asn Arg Pro Asp Leu Asn Asn Gln Gly Asp Leu Leu
625 630 635 640
Asp Gln Thr Val Ile Gly Ala Trp Leu Glu Gln Met His Leu Asp Gln
645 650 655
Lys
<210>22
<211>2223
<212>DNA
<213>拟南芥
<400>22
ttcttcaaaa accccaacca cttcttctcc ccaaaaacct ccaaagtttc aatctttact 60
tctctctttt tctccaagtt atcttctttt ctaggaagag atatgtgcgg tgcaaagagc 120
aacctttgct catctaaaac cctaacagaa gtcgaattca tgaggcagaa atcagaagac 180
ggagcttccg ccacgtgtct cctcgaattc gccgcctgtg atgatctttc atcgtttaag 240
agagagatcg aagagaatcc atcggtggag attgatgagt cagggttttg gtattgcaga 300
cgggtcgggt ctaagaagat gggttttgaa gaaagaacac cacttatggt tgctgctatg 360
tatggaagca tggaagtgtt gaattacata attgccacag gaagatccga tgtgaacaga 420
gtttgcagtg acgagaaagt cactgctctt cactgtgcag tttctggctg ttctgtttct 480
atcgttgaga tcatcaagat cttgcttgat gcttctgctt cacctaattg tgttgacgct 540
aatgggaaca aaccggttga tttgttggct aaagattctc ggtttgttcc taaccagagt 600
agaaaggcgg ttgaggtttt actgaccggg attcatggtt cggttatgga agaagaggag 660
gaggaactga agagtgttgt gactaagtat ccagctgatg catcacttcc tgatattaac 720
gaaggtgttt atggaactga tgattttagg atgtttagct ttaaggttaa gccatgttct 780
agggcttatt cacatgattg gactgaatgt ccttttgttc atcctggtga gaatgcaagg 840
aggagagatc ctaggaagta tccttacact tgtgtgcctt gtcccgagtt tcgtaaaggg 900
tcttgtccta aaggagattc gtgtgagtac gcgcacggtg ttttcgagtc ttggcttcac 960
ccggcgcagt ataggacacg gctttgcaaa gatgagactg gttgtgctag gagagtttgt 1020
ttctttgctc atagacggga tgagttaaga ccggttaatg cttctactgg ttctgcaatg 1080
gtttcaccaa ggtcgtctaa tcagtctcct gagatgtctg ttatgtctcc tttgacgctg 1140
ggatcatcgc caatgaactc tcctatggct aatggtgttc ctttgtctcc aagaaatggt 1200
ggtttatggc agaacagagt taatagcctt acaccaccac cgttgcagct taatggtagc 1260
agattgaagt cgactttgag tgctagagat atggatatgg agatggaact taggtttcgc 1320
ggtttggata accggagact tggtgatctc aagccatcca acctcgaaga gactttcgga 1380
tcatatgact cagcttctgt gatgcaactt caatcaccaa gcaggcattc tcagatgaac 1440
cactatccgt cttcacctgt gaggcagcct cctcctcatg gattcgaatc ttcagcagcc 1500
atggcagctg cagtgatgaa tgcaagatcc tcagcgtttg cgaaacgcag cttgagtttc 1560
aaaccagctc cagtagcttc taatgtctcc gattggggat caccaaatgg gaagcttgag 1620
tggggaatgc aaagagatga gctgaacaag ttgaggagaa gtgcctcctt cggcattcat 1680
ggaaacaaca acaacagtgt gtcacgccct gctagagact acagtgacga gccagatgtg 1740
tcgtgggtga actcactggt gaaagagaat gcaccagaga gagtgaatga gagggttggg 1800
aatacggtga atggtgcagc gagtagagac aagtttaagc tgccgtcgtg ggcagagcaa 1860
atgtatatag accatgagca gcagattgtg gcataagaag cagaaagaaa gatgtgggat 1920
ttatattgct tttgtcttct gggcctctct acacagaatc taacaaatct ggcaataatt 1980
ctttgatttg tgtttgaccc atagtttggt tactagtata tgttttttta tgttcttttt 2040
ttctttgtca ttctcttgtc cttcgtgaca ctatgtaatg attaaaagca aataattgat 2100
gcatgagttc aaatgttctt tgaaggatcc atcttattag ctttgtaatt gttgtgatat 2160
cttaatctta ttggttacgt atttcaagtg ctttagaaaa aatgggccta agagattttg 2220
ggg 2223
<210>23
<211>597
<212>PRT
<213>拟南芥
<400>23
Met Cys Gly Ala Lys Ser Asn Leu Cys Ser Ser Lys Thr Leu Thr Glu
1 5 10 15
Val Glu Phe Met Arg Gln Lys Ser Glu Asp Gly Ala Ser Ala Thr Cys
20 25 30
Leu Leu Glu Phe Ala Ala Cys Asp Asp Leu Ser Ser Phe Lys Arg Glu
35 40 45
Ile Glu Glu Asn Pro Ser Val Glu Ile Asp Glu Ser Gly Phe Trp Tyr
50 55 60
Cys Arg Arg Val Gly Ser Lys Lys Met Gly Phe Glu Glu Arg Thr Pro
65 70 75 80
Leu Met Val Ala Ala Met Tyr Gly Ser Met Glu Val Leu Asn Tyr Ile
85 90 95
Ile Ala Thr Gly Arg Ser Asp Val Asn Arg Val Cys Ser Asp Glu Lys
100 105 110
Val Thr Ala Leu His Cys Ala Val Ser Gly Cys Ser Val Ser Ile Val
115 120 125
Glu Ile Ile Lys Ile Leu Leu Asp Ala Ser Ala Ser Pro Asn Cys Val
130 135 140
Asp Ala Asn Gly Asn Lys Pro Val Asp Leu Leu Ala Lys Asp Ser Arg
145 150 155 160
Phe Val Pro Asn Gln Ser Arg Lys Ala Val Glu Val Leu Leu Thr Gly
165 170 175
Ile His Gly Ser Val Met Glu Glu Glu Glu Glu Glu Leu Lys Ser Val
180 185 190
Val Thr Lys Tyr Pro Ala Asp Ala Ser Leu Pro Asp Ile Asn Glu Gly
195 200 205
Val Tyr Gly Thr Asp Asp Phe Arg Met Phe Ser Phe Lys Val Lys Pro
210 215 220
Cys Ser Arg Ala Tyr Ser His Asp Trp Thr Glu Cys Pro Phe Val His
225 230 235 240
Pro Gly Glu Asn Ala Arg Arg Arg Asp Pro Arg Lys Tyr Pro Tyr Thr
245 250 255
Cys Val Pro Cys Pro Glu Phe Arg Lys Gly Ser Cys Pro Lys Gly Asp
260 265 270
Ser Cys Glu Tyr Ala His Gly Val Phe Glu Ser Trp Leu His Pro Ala
275 280 285
Gln Tyr Arg Thr Arg Leu Cys Lys Asp Glu Thr Gly Cys Ala Arg Arg
290 295 300
Val Cys Phe Phe Ala His Arg Arg Asp Glu Leu Arg Pro Va1 Asn Ala
305 310 315 320
Ser Thr Gly Ser Ala Met Val Ser Pro Arg Ser Ser Asn Gln Ser Pro
325 330 335
Glu Met Ser Val Met Ser Pro Leu Thr Leu Gly Ser Ser Pro Met Asn
340 345 350
Ser Pro Met Ala Asn Gly Val Pro Leu Ser Pro Arg Asn Gly Gly Leu
355 360 365
Trp Gln Asn Arg Val Asn Ser Leu Thr Pro Pro Pro Leu Gln Leu Asn
370 375 380
Gly Ser Arg Leu Lys Ser Thr Leu Ser Ala Arg Asp Met Asp Met Glu
385 390 395 400
Met Glu Leu Arg Phe Arg Gly Leu Asp Asn Arg Arg Leu Gly Asp Leu
405 410 415
Lys Pro Ser Asn Leu Glu Glu Thr Phe Gly Ser Tyr Asp Ser Ala Ser
420 425 430
Val Met Gln Leu Gln Ser Pro Ser Arg His Ser Gln Met Asn His Tyr
435 440 445
Pro Ser Ser Pro Val Arg Gln Pro Pro Pro His Gly Phe Glu Ser Ser
450 455 460
Ala Ala Met Ala Ala Ala Val Met Asn Ala Arg Ser Ser Ala Phe Ala
465 470 475 480
Lys Arg Ser Leu Ser Phe Lys Pro Ala Pro Val Ala Ser Asn Val Ser
485 490 495
Asp Trp Gly Ser Pro Asn Gly Lys Leu Glu Trp Gly Met Gln Arg Asp
500 505 510
Glu Leu Asn Lys Leu Arg Arg Ser Ala Ser Phe Gly Ile His Gly Asn
515 520 525
Asn Asn Asn Ser Val Ser Arg Pro Ala Arg Asp Tyr Ser Asp Glu Pro
530 535 540
Asp Val Ser Trp Val Asn Ser Leu Val Lys Glu Asn Ala Pro Glu Arg
545 550 555 560
Val Asn Glu Arg Val Gly Asn Thr Val Asn Gly Ala Ala Ser Arg Asp
565 570 575
Lys Phe Lys Leu Pro Ser Trp Ala Glu Gln Met Tyr Ile Asp His Glu
580 585 590
Gln Gln Ile Val Ala
595
<210>24
<211>1761
<212>DNA
<213>拟南芥
<400>24
atggaaaaag atagtattat gtgcagtgga ccaaagagca atctctgctc ttcaagaacc 60
ttaacagaaa tcgaatcaag gcaaaaggaa gaagaaacaa tgcttctcct cgaattcgct 120
gcttgtgatg atcttgactc gttcaagaga gaggttgaag agaaagggct tgatttggat 180
gagtcagggt tatggtattg cagacgtgtc ggttctaaga agatgggtct tgaagaaaga 240
acacctttaa tggttgcagc tatgtatgga agcataaagg ttttgacttt catcgtttcc 300
actggaaaat ctgatgtgaa cagagcttgt ggtgaagaga gagttactcc gcttcactgt 360
gctgttgctg gctgttctgt gaatatgatt gaagtcatca atgtcttgct tgatgcttct 420
gctttggtta actctgttga tgctaatggg aatcaacctt tggatgtgtt tgttcgagtt 480
tcgaggtttg tggctagtcc gaggaggaaa gcggttgagt tgttgctgag aggaggaggt 540
gttggaggat tgatcgatga ggcggttgaa gaagagatca agattgtctc taagtatcca 600
gctgatgctt ctttaccgga tataaacgaa ggggtttatg gaagtgatga gtttaggatg 660
tatagcttta aggttaagcc atgttctagg gcttattctc atgattggac cgagtgtgct 720
tttgttcatc cgggagaaaa tgcgaggagg agagatccga ggaagtatcc ttacacttgt 780
gtcccctgtc ccgagttccg taaaggatca tgcccgaaag gagattcttg cgagtatgct 840
cacggggttt tcgagtcgtg gcttcacccc gcgcagtata aaacccggct ttgtaaagat 900
gaaacgggtt gtgcaaggaa agtttgtttc tttgctcata aacgcgaaga gatgagacct 960
gttaatgctt caactggctc tgccgtggct cagtctccgt ttagcagctt ggagatgatg 1020
ccagggttgt ctcctcttgc ttattcttca ggagtttcga ctcctccggt ttctccaatg 1080
gctaatggtg ttccttcctc tccaagaaac ggcggatcat ggcagaacag agtcaatacc 1140
cttactccac cggctttgca gctcaatggt ggaagcagat tgaagtccac actgagcgct 1200
agagatatcg atatggagat ggagatggaa ttgagactcc gcggttttgg caacaatgtg 1260
gaagagacgt tcgggtctta tgtttcctct ccaagtagga attctcaaat gggtcaaaac 1320
atgaaccaac attatccatc ttccccggtg agacaaccgc catctcaaca cgggttcgaa 1380
tcttcagcag ctgcagcggt tgcagtgatg aaagcgagat caaccgcctt tgcgaaacgt 1440
agcttgagct tcaaaccagc tactcaagca gcaccacagt cgaatctctc ggattgggga 1500
tctccaaacg ggaagctgga atggggaatg aaaggagaag agctgaataa gatgagaaga 1560
agtgtttcct ttggaatcca tggaaacaac aacaataacg cagctagaga ctacagggac 1620
gagccagatg tgtcatgggt taactcttta gttaaagaca gtactgtggt gtctgagaga 1680
agctttggaa tgaatgagag ggttcggata atgtcgtggg ctgagcaaat gtacagagag 1740
aaggagcaga ctgtggtgta a 1761
<210>25
<211>586
<212>PRT
<213>拟南芥
<400>25
Met Glu Lys Asp Ser Ile Met Cys Ser Gly Pro Lys Ser Asn Leu Cys
1 5 10 15
Ser Ser Arg Thr Leu Thr Glu Ile Glu Ser Arg Gln Lys Glu Glu Glu
20 25 30
Thr Met Leu Leu Leu Glu Phe Ala Ala Cys Asp Asp Leu Asp Ser Phe
35 40 45
Lys Arg Glu Val Glu Glu Lys Gly Leu Asp Leu Asp Glu Ser Gly Leu
50 55 60
Trp Tyr Cys Arg Arg Val Gly Ser Lys Lys Met Gly Leu Glu Glu Arg
65 70 75 80
Thr Pro Leu Met Val Ala Ala Met Tyr Gly Ser Ile Lys Val Leu Thr
85 90 95
Phe Ile Val Ser Thr Gly Lys Ser Asp Val Asn Arg Ala Cys Gly Glu
100 105 110
Glu Arg Val Thr Pro Leu His Cys Ala Val Ala Gly Cys Ser Val Asn
115 120 125
Met Ile Glu Val Ile Asn Val Leu Leu Asp Ala Ser Ala Leu Val Asn
130 135 140
Ser Val Asp Ala Asn Gly Asn Gln Pro Leu Asp Val Phe Val Arg Val
145 150 155 160
Ser Arg Phe Val Ala Ser Pro Arg Arg Lys Ala Val Glu Leu Leu Leu
165 170 175
Arg Gly Gly Gly Val Gly Gly Leu Ile Asp Glu Ala Val Glu Glu Glu
180 185 190
Ile Lys Ile Val Ser Lys Tyr Pro Ala Asp Ala Ser Leu Pro Asp Ile
195 200 205
Asn Glu Gly Val Tyr Gly Ser Asp Glu Phe Arg Met Tyr Ser Phe Lys
210 215 220
Val Lys Pro Cys Ser Arg Ala Tyr Ser His Asp Trp Thr Glu Cys Ala
225 230 235 240
Phe Val His Pro Gly Glu Asn Ala Arg Arg Arg Asp Pro Arg Lys Tyr
245 250 255
Pro Tyr Thr Cys Val Pro Cys Pro Glu Phe Arg Lys Gly Ser Cys Pro
260 265 270
Lys Gly Asp Ser Cys Glu Tyr Ala His Gly Val Phe Glu Ser Trp Leu
275 280 285
His Pro Ala Gln Tyr Lys Thr Arg Leu Cys Lys Asp Glu Thr Gly Cys
290 295 300
Ala Arg Lys Val Cys Phe Phe Ala His Lys Arg Glu Glu Met Arg Pro
305 310 315 320
Val Asn Ala Ser Thr Gly Ser Ala Val Ala Gln Ser Pro Phe Ser Ser
325 330 335
Leu Glu Met Met Pro Gly Leu Ser Pro Leu Ala Tyr Ser Ser Gly Val
340 345 350
SerThr Pro Pro Val Ser Pro Met Ala Asn Gly Val Pro Ser Ser Pro
355 360 365
Arg Asn Gly Gly Ser Trp Gln Asn Arg Val Asn Thr Leu Thr Pro Pro
370 375 380
Ala Leu Gln Leu Asn Gly Gly Ser Arg Leu Lys Ser Thr Leu Ser Ala
385 390 395 400
Arg Asp Ile Asp Met Glu Met Glu Met Glu Leu Arg Leu Arg Gly Phe
405 410 415
Gly Asn Asn Val Glu Glu Thr Phe Gly Ser Tyr Val Ser Ser Pro Ser
420 425 430
Arg Asn Ser Gln Met Gly Gln Asn Met Asn Gln His Tyr Pro Ser Ser
435 440 445
Pro Val Arg Gln Pro Pro Ser Gln His Gly Phe Glu Ser Ser Ala Ala
450 455 460
Ala Ala Val Ala Val Met Lys Ala Arg Ser Thr Ala Phe Ala Lys Arg
465 470 475 480
Ser Leu Ser Phe Lys Pro Ala Thr Gln Ala Ala Pro Gln Ser Asn Leu
485 490 495
Ser Asp Trp Gly Ser Pro Asn Gly Lys Leu Glu Trp Gly Met Lys Gly
500 505 510
Glu Glu Leu Asn Lys Met Arg Arg Ser Val Ser Phe Gly Ile His Gly
515 520 525
Asn Asn Asn Asn Asn Ala Ala Arg Asp Tyr Arg Asp Glu Pro Asp Val
530 535 540
Ser Trp Val Asn Ser Leu Val Lys Asp Ser Thr Val Val Ser Glu Arg
545 550 555 560
Ser Phe Gly Met Asn Glu Arg Val Arg Ile Met Ser Trp Ala Glu Gln
565 570 575
Met Tyr Arg Glu Lys Glu Gln Thr Val Val
580 585
<210>26
<211>2709
<212>DNA
<213>大桉
<400>26
cttctgaaag ctttttgact taagacgaga gagaaggaga gaaggtcccc ctcctcgtcc 60
tcgtcccccc gtggattttg aagaagaaaa gtcgcacctt ccttctcctt tcccactcct 120
ccctctgctc gaagcttttc tcttccgcag aattacataa aaacctcgac tttgcgcatc 180
attccgattc acctcacacc ttcactttcc cactcgaggt ctcccccctc ttttcctagc 240
tctttccctt tccctccctc tctctcgaga atcgccgcat ttggaggagc tccaatctgc 300
tttgctttgc tttgctctct tcttgctcgg ttccccctca taaggagtcg attatgtgca 360
acggttcttc gaagggtaaa cttttcccct cgagtatggg catggagggc gaattccaca 420
acaaggatgg cgaagcaccc cgtaaatgct ctgccttgct tgaattggca gcctcggacg 480
atctctcgtc gttcaaaagt gaagtggaag agaagggctg cgacgttgat gaggccagct 540
tttggtatgg taggagaatc gggtcgaaga agatgggttt tgaagagagg actccattga 600
tgatctctgc tttgtttgga agcaccaagg tcttgaaata cataatcgag accgccagag 660
ctgatgtcaa caggtcttgt gggtccgaca aggtggccgc cctccattgc gcagccgcgg 720
gtgggtccag ttcttcactt gaaattgtga agctcttgat tgaggcctca gcggatatta 780
attctgtaga tggcaatgga aataggccca tcgacgtgct tgccccggca gggaagtctc 840
gctgcaattc cagaaataag tttgttagat cgttgctgaa aggtgaaaac tatgtcgtgg 900
aaggtgacca atcctttgac atagaaggag aggagaagct agtcgctctt ccaaaggagg 960
gaggcgagaa gaaagagtat cctgttgatg tctctctacc tgacataaac aatgggttct 1020
acagtaccga tgagttccgg atgtatgctt tcaaggtgaa gccttgctcg agggcttact 1080
cccacgactg gaccgagtgc ccgtttgtgc accctgggga gaacgcgagg aggagggacc 1140
cacgcaagta cccttacagc tgtgtccctt gtcctgagtt tcgcaagggt tcgtgcgtaa 1200
ggggggatgc ttgtgagtat gctcatggag tctttgagtc gtggcttcac ccagcgcaat 1260
accgaacccg gctgtgcaag gatgaaactg gttgtactcg caaagtttgc ttctttgctc 1320
acaagtccga agaattgcgt cccgtgtatg cttccacagg ttctgctatg ccctcaccca 1380
agtccttttc agctaatgcc ctagacatga caaccctgag ccccttatcc cttaattcac 1440
catctctgcc tttgcctgct acttccacgc cccccatgtc acctttggct gcctcatctt 1500
cacccaaggg catgaacttg tggcataaca aaattaacct gaccccacca agcctgcagc 1560
ttcctggcag ccggctgaag acggctatga gtgcgcggga cttcgatttt gagttggaat 1620
ttcttgggct ggaaaagcaa gcttctcagc ggcagcaact gatagaagag atttctcgtc 1680
tctcatcgcc ctctcatatg tggaactcgg aatttggcag aaccgcagag ctgaagccca 1740
ctaaccttga tgatgcgttt ggatctcttg acacttctct tttgtctccg ttgcaggggt 1800
cgtcgatgaa aacatcgact cctacccagt tgcaatcccc cacagggctt aaaatttcga 1860
atttgaacca actccgtgcg agctacccgt ctagcagctt gtcgtcctct cctgtgagga 1920
agacctcttc ttttgggttc gactcatcca gtgcagttgc tgcagcagtc atgaactcac 1980
ggtctgctgc tatgacgaag cggagccaga gcttcattga ccgtggagca gtgggtcaac 2040
ggtctggact cattggacct gctaattctg ctcctaggat gtccaacctt tcggactggg 2100
gctcgcctga tgggaagttg gattggggtg ttcaagggga cgagctcaac aagcttagga 2160
agtccgcttc cttcggcttt agaaacaaca gtatggcgaa cccaaacaac gtggcgtctc 2220
ccagtgctga tgagccggac gtgtcgtggg ttggttcatt ggtgaaggat gtggctccgc 2280
ccgaagggta tccacagtat ctgtacatag aacaggagca gatggtggca taactaaagc 2340
gaagagcacc acacgaactc tctcctgatg gcttaagatg acttgtttga cattctttat 2400
attcttacaa acagcgcgtt cttaggagtt agctggagga aagaaggaaa cggtattgag 2460
tttgagattc aggctcttag ctggacagcg aaaatttggg gaaggaagag aatttggttt 2520
cttgcccaac ttagataatg atgcttttga aggcttaaaa gaaagatgaa ggcaaacatt 2580
cttttgttag tattgtatta ttgttttaat ttttcatccc ctctgtcggg gtgtggtggg 2640
tgtcgatgtt tctttcatca gtaaaatata taatgaggtt tactcatcta ttttctacta 2700
aaaaaaaaa 2709
<210>27
<211>659
<212>PRT
<213>大桉
<400>27
Met Cys Asn Gly Ser Ser Lys Gly Lys Leu Phe Pro Ser Ser Met Gly
1 5 10 15
Met Glu Gly Glu Phe His Asn Lys Asp Gly Glu Ala Pro Arg Lys Cys
20 25 30
Ser Ala Leu Leu Glu Leu Ala Ala Ser Asp Asp Leu Ser Ser Phe Lys
35 40 45
Ser Glu Val Glu Glu Lys Gly Cys Asp Val Asp Glu Ala Ser Phe Trp
50 55 60
Tyr Gly Arg Arg Ile Gly Ser Lys Lys Met Gly Phe Glu Glu Arg Thr
65 70 75 80
Pro Leu Met Ile Ser Ala Leu Phe Gly Ser Thr Lys Val Leu Lys Tyr
85 90 95
Ile Ile Glu Thr Ala Arg Ala Asp Val Asn Arg Ser Cys Gly Ser Asp
100 105 110
Lys Val Ala Ala Leu His Cys Ala Ala Ala Gly Gly Ser Ser Ser Ser
115 120 125
Leu Glu Ile Val Lys Leu Leu Ile Glu Ala Ser Ala Asp Ile Asn Ser
130 135 140
Val Asp Gly Asn Gly Asn Arg Pro Ile Asp Val Leu Ala Pro Ala Gly
145 150 155 160
Lys Ser Arg Cys Asn Ser Arg Asn Lys Phe Val Arg Ser Leu Leu Lys
165 170 175
Gly Glu Asn Tyr Val Val Glu Gly Asp Gln Ser Phe Asp Ile Glu Gly
180 185 190
Glu Glu Lys Leu Val Ala Leu Pro Lys Glu Gly Gly Glu Lys Lys Glu
195 200 205
Tyr Pro Val Asp Val Ser Leu Pro Asp Ile Asn Asn Gly Phe Tyr Ser
210 215 220
Thr Asp Glu Phe Arg Met Tyr Ala Phe Lys Val Lys Pro Cys Ser Arg
225 230 235 240
Ala Tyr Ser His Asp Trp Thr Glu Cys Pro Phe Val His Pro Gly Glu
245 250 255
Asn Ala Arg Arg Arg Asp Pro Arg Lys Tyr Pro Tyr Ser Cys Val Pro
260 265 270
Cys Pro Glu Phe Arg Lys Gly Ser Cys Val Arg Gly Asp Ala Cys Glu
275 280 285
Tyr Ala His Gly Val Phe Glu Ser Trp Leu His Pro Ala Gln Tyr Arg
290 295 300
Thr Arg Leu Cys Lys Asp Glu Thr Gly Cys Thr Arg Lys Val Cys Phe
305 310 315 320
Phe Ala His Lys Ser Glu Glu Leu Arg Pro Val Tyr Ala Ser Thr Gly
325 330 335
Ser Ala Met Pro Ser Pro Lys Ser Phe Ser Ala Asn Ala Leu Asp Met
340 345 350
Thr Thr Leu Ser Pro Leu Ser Leu Asn Ser Pro Ser Leu Pro Leu Pro
355 360 365
Ala Thr Ser Thr Pro Pro Met Ser Pro Leu Ala Ala Ser Ser Ser Pro
370 375 380
Lys Gly Met Asn Leu Trp His Asn Lys Ile Asn Leu Thr Pro Pro Ser
385 390 395 400
Leu Gln Leu Pro Gly Ser Arg Leu Lys Thr Ala Met Ser Ala Arg Asp
405 410 415
Phe Asp Phe Glu Leu Glu Phe Leu Gly Leu Glu Lys Gln Ala Ser Gln
420 425 430
Arg Gln Gln Leu Ile Glu Glu Ile Ser Arg Leu Ser Ser Pro Ser His
435 440 445
Met Trp Asn Ser Glu Phe Gly Arg Thr Ala Glu Leu Lys Pro Thr Asn
450 455 460
Leu Asp Asp Ala Phe Gly Ser Leu Asp Thr Ser Leu Leu Ser Pro Leu
465 470 475 480
Gln Gly Ser Ser Met Lys Thr Ser Thr Pro Thr Gln Leu Gln Ser Pro
485 490 495
Thr Gly Leu Lys Ile Ser Asn Leu Asn Gln Leu Arg Ala Ser Tyr Pro
500 505 510
Ser Ser Ser Leu Ser Ser Ser Pro Val Arg Lys Thr Ser Ser Phe Gly
515 520 525
Phe Asp Ser Ser Ser Ala Val Ala Ala Ala Val Met Asn Ser Arg Ser
530 535 540
Ala Ala Met Thr Lys Arg Ser Gln Ser Phe Ile Asp Arg Gly Ala Val
545 550 555 560
Gly Gln Arg Ser Gly Leu Ile Gly Pro Ala Asn Ser Ala Pro Arg Met
565 570 575
Ser Asn Leu Ser Asp Trp Gly Ser Pro Asp Gly Lys Leu Asp Trp Gly
580 585 590
Val Gln Gly Asp Glu Leu Asn Lys Leu Arg Lys Ser Ala Ser Phe Gly
595 600 605
Phe Arg Asn Asn Ser Met Ala Asn Pro Asn Asn Val Ala Ser Pro Ser
610 615 620
Ala Asp Glu Pro Asp Val Ser Trp Val Gly Ser Leu Val Lys Asp Val
625 630 635 640
Ala Pro Pro Glu Gly Tyr Pro Gln Tyr Leu Tyr Ile Glu Gln Glu Gln
645 650 655
Met Val Ala
<210>28
<211>2518
<212>DNA
<213>大桉
<400>28
tctccttcga gtttctttct tcactagaat tcgctcccga gtctgttgtt gctcgtgtag 60
ttttgcttac tccgtccttc gtttagctcg ctgaccagcg cggagctagg agcggtcgct 120
aaaggattac tcgtacaaaa cgtaaactca gctctgccaa ttttcccatg gagggggaat 180
cttacttcga gaaagatgaa aaatattcta attgctcaat cttgctcgaa ttatctgctt 240
cggacgatct cccagctttt gaaaggaaag cgaaagagaa gggctgtaac attgatggtg 300
ctagcttctg gtacggtaga agaattggct caaggaagat gggtcttgaa gagaggactc 360
ctctcatggt ggcttccttg tttggaagct ctagggttgt gaagtacatt ctcgaatctg 420
gcaaagtcga tgtaaatagg gcttgtggtt cggacaaggt cactgccctt cactgtgctg 480
ttgccagtgg ctctgcttct gcggtggagg ttgtcaagct cttgcttcac gcatctgccg 540
atgctaattg cattgatggc aatggaaaga agccaattga tgtgatagcc cttccattaa 600
agtcacgcgg cgattcaagg aggaagctga tggagctgtt gctgaaaggc gataattctg 660
atggggaatt tgaatcccac gaggagaagc cgattgccgc accgcaagca tccaaagagg 720
gaagcgaaaa gaaagagtat caatttcctg ttgatatctc tctgcctgac ataaatgttg 780
ggatttacag tactgatgag ttcagaatgt atgctttcaa agtaaagcct tgctcgcggg 840
catactccca tgactggaca gagtgcccat ttgttcatcc tggcgagaat gcgaggaggc 900
gggaccctcg caagtacccc tacagctgcg tcccttgccc tgaatttcgg aagggatctt 960
gecaaaaggg tgactcctgt gagtacgcgc acggcgtatt tgagtcgtgg cttcatcctg 1020
cacagtatag aacaagactg tgcaaggatg agactggatg tgctcgcaaa gtttgtttct 1080
ttgctcacaa gcccgaagaa ttaaggcctg tctatgcttc gacgggatca gctatgcctt 1140
ccccaaaatc ctactcatca agtgggctgg acatgtccac attgagtcct ctctcaatca 1200
gttctccgtc agcatcgttg cctgttactt caacagcacc catgtctcct cttgcagcct 1260
cgtcatctcc gatgtctgtg aacatgtggc agagcaaggc taacaagctc tccccgccaa 1320
tgctgcagct ctcaggtagt aggctgaaga ctgctttgag tgctagggac ttggacctgg 1380
agatggaatt gcgtggtcta gagagtcaga tggccactca acagcatcag ttgatggaag 1440
agatatctcg tctctcctca ccatcatcct gctttagtag taggattggg gaagtgaaac 1500
ccactaacct cgatgacgtt tttgggtctc cggatcctgc tttgctgcct caattgcagg 1560
ggctgtcaag accttcaaca ccaagccagt tgcaatctcc aactgggctt cagatgcgcc 1620
agaatgcaac ccagtttcgt ggggcgtacc agagcaatgc aaatgcattg tcatctccag 1680
caatgaagca ggcaccttct tatgggtttg actcatctag tgcagttgca gcagcggtga 1740
tgaattcgag gtcagccgct tttgcgaagc ggagtcagag ttttatcgac aggggaatgg 1800
cgtgccctgg aattgccaat tcttccccta tgatgtcttc agctatgtcg agctggagct 1860
cacctcatgg gaaattggat tggggcgtcc aaggagatga gttgaatagg ctgaggaaag 1920
ctgcttcctt taagatgaga agcagcaccg gagcaggtgc taatactgtc tcggcagcag 1980
ccatggctga tgagccagat atttcttggg tcagttcatt ggttaaggac gtgccttctg 2040
cggaggacgc gatgttcgct gcagagaaag gacagcgcac ttatgggaaa gacatccgcg 2100
aaaggattac cccatgggtg gagcagctgt acagagaagt gccacggatg gcgatgtaag 2160
attgccactg caagtcggat gccttagtat gctgactaat tgatattctt tgcatttgtt 2220
ttgaggcatt tggtagccat tagatacgag aaaaggccaa gcagcaggtg gtgtcttggc 2280
aaggaatagg atgcacatag tctgttatcg agtagaatag acttgggaac aatggttata 2340
gccaaatgtt aaaagttatg atattctttt ccaattcttt ctcttcctca tagtaggttt 2400
ctcaccaagt cttttagtga gagcctgcgg gatgtactat atgtttccct tatgtaacgt 2460
ctcttcgttg aaagaaatgg ctttataata taaagcatca agttttttaa aaaaaaaa 2518
<210>29
<211>663
<212>PRT
<213>大桉
<400>29
Met Glu Gly Glu Ser Tyr Phe Glu Lys Asp Glu Lys Tyr Ser Asn Cys
1 5 10 15
Ser Ile Leu Leu Glu Leu Ser Ala Ser Asp Asp Leu Pro Ala Phe Glu
20 25 30
Arg Lys Ala Lys Glu Lys Gly Cys Asn Ile Asp Gly Ala Ser Phe Trp
35 40 45
Tyr Gly Arg Arg Ile Gly Ser Arg Lys Met Gly Leu Glu Glu Arg Thr
50 55 60
Pro Leu Met Val Ala Ser Leu Phe Gly Ser Ser Arg Val Val Lys Tyr
65 70 75 80
Ile Leu Glu Ser Gly Lys Val Asp Val Asn Arg Ala Cys Gly Ser Asp
85 90 95
Lys Val Thr Ala Leu His Cys Ala Val Ala Ser Gly Ser Ala Ser Ala
100 105 110
Val Glu Val Val Lys Leu Leu Leu His Ala Ser Ala Asp Ala Asn Cys
115 120 125
Ile Asp Gly Asn Gly Lys Lys Pro Ile Asp Val Ile Ala Leu Pro Leu
130 135 140
Lys Ser Arg Gly Asp Ser Arg Arg Lys Leu Met Glu Leu Leu Leu Lys
145 150 155 160
Gly Asp Asn Ser Asp Gly Glu Phe Glu Ser His Glu Glu Lys Pro Ile
165 170 175
Ala Ala Pro Gln Ala Ser Lys Glu Gly Ser Glu Lys Lys Glu Tyr Gln
180 185 190
Phe Pro Val Asp Ile Ser Leu Pro Asp Ile Asn Val Gly Ile Tyr Ser
195 200 205
Thr Asp Glu Phe Arg Met Tyr Ala Phe Lys Val Lys Pro Cys Ser Arg
210 215 220
Ala Tyr Ser His Asp Trp Thr Glu Cys Pro Phe Val His Pro Gly Glu
225 230 235 240
Asn Ala Arg Arg Arg Asp Pro Arg Lys Tyr Pro Tyr Ser Cys Val Pro
245 250 255
Cys Pro Glu Phe Arg Lys Gly Ser Cys Gln Lys Gly Asp Ser Cys Glu
260 265 270
Tyr Ala His Gly Val Phe Glu Ser Trp Leu His Pro Ala Gln Tyr Arg
275 280 285
Thr Arg Leu Cys Lys Asp Glu Thr Gly Cys Ala Arg Lys Val Cys Phe
290 295 300
Phe Ala His Lys Pro Glu Glu Leu Arg Pro Val Tyr Ala Ser Thr Gly
305 310 315 320
Ser Ala Met Pro Ser Pro Lys Ser Tyr Ser Ser Ser Gly Leu Asp Met
325 330 335
Ser Thr Lcu Ser Pro Leu Ser Ile Ser Ser Pro Ser Ala Ser Leu Pro
340 345 350
Val Thr Ser Thr Ala Pro Met Ser Pro Leu Ala Ala Ser Ser Ser Pro
355 360 365
Met Ser Val Asn Met Trp Gln Ser Lys Ala Asn Lys Leu Ser Pro Pro
370 375 380
Met Leu Gln Leu Ser Gly Ser Arg Leu Lys Thr Ala Leu Ser Ala Arg
385 390 395 400
Asp Leu Asp Leu Glu Met Glu Leu Arg Gly Leu Glu Ser Gln Met Ala
405 410 415
Thr Gln Gln His Gln Leu Met Glu Glu Ile Ser Arg Leu Ser Ser Pro
420 425 430
Ser Ser Cys Phe Ser Ser Arg Ile Gly Glu Val Lys Pro Thr Asn Leu
435 440 445
Asp Asp Val Phe Gly Ser Pro Asp Pro Ala Leu Leu Pro Gln Leu Gln
450 455 460
Gly Leu Ser Arg Pro Ser Thr Pro Ser Gln Leu Gln Ser Pro Thr Gly
465 470 475 480
Leu Gln Met Arg Gln Asn Ala Thr Gln Phe Arg Gly Ala Tyr Gln Ser
485 490 495
Asn Ala Asn Ala Leu Ser Ser Pro Ala Met Lys Gln Ala Pro Ser Tyr
500 505 510
Gly Phe Asp Ser Ser Ser Ala Val Ala Ala Ala Val Met Asn Ser Arg
515 520 525
Ser Ala Ala Phe Ala Lys Arg Ser Gln Ser Phe Ile Asp Arg Gly Met
530 535 540
Ala Cys Pro Gly Ile Ala Asn Ser Ser Pro Met Met Ser Ser Ala Met
545 550 555 560
Ser Ser Trp Scr Ser Pro His Gly Lys Leu Asp Trp Gly Val Gln Gly
565 570 575
Asp Glu Leu Asn Arg Leu Arg Lys Ala Ala Ser Phe Lys Met Arg Ser
580 585 590
Ser Thr Gly Ala Gly Ala Asn Thr Val Ser Ala Ala Ala Met Ala Asp
595 600 605
Glu Pro Asp Ile Ser Trp Val Ser Ser Leu Val Lys Asp Val Pro Ser
610 615 620
Ala Glu Asp Ala Met Phe Ala Ala Glu Lys Gly Gln Arg Thr Tyr Gly
625 630 635 640
Lys Asp Ile Arg Glu Arg Ile Thr Pro Trp Val Glu Gln Leu Tyr Arg
645 650 655
Glu Val Pro Arg Met Ala Met
660
<210>30
<211>2001
<212>DNA
<213>普通小麦(Triticum aestivum)
<220>
<221>misc_feature
<222>(481)..(530)
<223>n是a、c、g或t
<400>30
cgaattccgg tcgacgattt ctcgatttcc ttctctataa cacaacgctc tcttctcttg 60
caaccaaagt acttgttcca gtgtctactc tactcaaaaa ggatttggga catcatgtgc 120
agtgattcga aaagtaaact ttcttcccca accctcgtcg tcatggagaa tagtaacatt 180
cagaagcaga atctggatgg tctctacaac tcggttttgc ttgaattgtc tgcatctgat 240
gattatgaag ctttcaaaag agaggtggag gaaaaaggct tagatgtgaa cgaggcaggc 300
ttttggtacg gtagaagaat tgggtcaaag aagatgggat ctgaaacgag gacccctctg 360
atgattgctt ctttgtttgg aagcgccaag gtgctcaatt atattcttct tcagaaagga 420
ggaggtgttg atgtgaacag ggtctgtggt tctgataggg ccactgctct ccattgtgct 480
nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn tcccgggtcg 540
cgatttcgta ggagattcac agagagaaaa gaagcaatta gtgataataa gaaagaatac 600
cctgttgata tatcactgcc agacataaac aacggtgtat atggaacaga tgattttagg 660
atgtacaact tcaaggtgaa gccttgctca agggcttact cccatgactg gaccgagtgt 720
ccattcgttc acccagggga gaacgctagg aggagagacc cacggaaata cccttacagc 780
tgtgttcctt gccctgagtt ccgcaaaggg acctgccaga agggtgattc ctgtgagtat 840
gctcatggtg tttttgagtc ctggetgcat cctgcccaat accggacaag gctttgcaag 900
gatgagactg gctgcgctag aaaagtctgc ttctttgccc acaaacctga agagctacgc 960
cctgtgtatg cttccactgg gtcggctatg ccatcaccaa aatcatattc agctagtgga 1020
cttgacatga cagcgatgag tccattggct ctaagttcca catctttgcc taatgccccc 1080
ccgtttccag cctcacccta tcgtgcgccc tcgttcttct ctcagagtga agctgtgcag 1140
aacaaaataa accttactcc accatcgttg cagctccctg gtagccgact gaaggctgct 1200
ttgagtgcca gggatctgga gatggagatg gaactgctcg gtctagaaag ccctgctcgc 1260
caacaacagc agcagcagca acaattgatc gaagagattg ccaggatctc ttccccatct 1320
ttccggagca aggaattcaa taggattgtt gatttgaatc ctactaacct tgatgacctg 1380
ttagcatctg ctgacccttc tgtattttct caactacatg gactttctgt gcaaccttca 1440
acacccacac aaagtgggct tcagatgcgc caaaacatga accacctccg tgcgagttat 1500
ccatccaaca tcccttcctc tcctgtgagg aagccctcag cttttgggtt tgactcatca 1560
gctgctgtgg caactgcagt gatgaattct aggtctgctg ccttcgcaaa gcgaagccaa 1620
agtttcattg atcgtggagc tgcaacccac catcttgggc tgtcttcagc ttccaactct 1680
tcttgcaggg tatcctctac cctttcagat tggagttccc ctaccgggaa actggattgg 1740
ggtgtaaacg gagacaagct gaacaagctg aggaaatcta cttcctttgg attcagaaac 1800
agtggggtaa ctgcatcccc catagcacag cctgaatttg gtgctgagcc ggatgtctca 1860
tgggttcatt cattggttaa agatgttccc tccgagaggt ctgagatatt tggtgctgag 1920
aagcaacaat atgatctcag taaagagatg cttccaccat ggatggagca gctgtatata 1980
gagcaggagc agatggtagc a 2001
<210>31
<211>667
<212>PRT
<213>普通小麦
<220>
<221>不确定
<222>(161)..(177)
<223>Xaa可以使任何天然发生的氨基酸
<400>31
Arg Ile Pro Val Asp Asp Phe Ser Ile Ser Phe Ser Ile Thr Gln Arg
1 5 10 15
Ser Leu Leu Leu Gln Pro Lys Tyr Leu Phe Gln Cys Leu Leu Tyr Ser
20 25 30
Lys Arg Ile Trp Asp Ile Met Cys Ser Asp Ser Lys Ser Lys Leu Ser
35 40 45
Ser Pro Thr Leu Val Val Met Glu Asn Ser Asn Ile Gln Lys Gln Asn
50 55 60
Leu Asp Gly Leu Tyr Asn Ser Val Leu Leu Glu Leu Ser Ala Ser Asp
65 70 75 80
Asp Tyr Glu Ala Phe Lys Arg Glu Val Glu Glu Lys Gly Leu Asp Val
85 90 95
Asn Glu Ala Gly Phe Trp Tyr Gly Arg Arg Ile Gly Ser Lys Lys Met
100 105 110
Gly Ser Glu Thr Arg Thr Pro Leu Met Ile Ala Ser Leu Phe Gly Ser
115 120 125
Ala Lys Val Leu Asn Tyr Ile Leu Leu Gln Lys Gly Gly Gly Val Asp
130 135 140
Val Asn Arg Val Cys Gly Ser Asp Arg Ala Thr Ala Leu His Cys Ala
145 150 155 160
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
165 170 175
Xaa Pro Gly Ser Arg Phe Arg Arg Arg Phe Thr Glu Arg Lys Glu Ala
180 185 190
Ile Ser Asp Asn Lys Lys Glu Tyr Pro Val Asp Ile Ser Leu Pro Asp
195 200 205
Ile Asn Asn Gly Val Tyr Gly Thr Asp Asp Phe Arg Met Tyr Asn Phe
210 215 220
Lys Val Lys Pro Cys Ser Arg Ala Tyr Ser His Asp Trp Thr Glu Cys
225 230 235 240
Pro Phe Val His Pro Gly Glu Asn Ala Arg Arg Arg Asp Pro Arg Lys
245 250 255
Tyr Pro Tyr Ser Cys Val Pro Cys Pro Glu Phe Arg Lys Gly Thr Cys
260 265 270
Gln Lys Gly Asp Ser Cys Glu Tyr Ala His Gly Val Phe Glu Ser Trp
275 280 285
Leu His Pro Ala Gln Tyr Arg Thr Arg Leu Cys Lys Asp Glu Thr Gly
290 295 300
Cys Ala Arg Lys Val Cys Phe Phe Ala His Lys Pro Glu Glu Leu Arg
305 310 315 320
Pro Val Tyr Ala Ser Thr Gly Ser Ala Met Pro Ser Pro Lys Ser Tyr
325 330 335
Ser Ala Ser Gly Leu Asp Met Thr Ala Met Ser Pro Leu Ala Leu Ser
340 345 350
Ser Thr Ser Leu Pro Asn Ala Pro Pro Phe Pro Ala Ser Pro Tyr Arg
355 360 365
Ala Pro Ser Phe Phe Ser Gln Ser Glu Ala Val Gln Asn Lys Ile Asn
370 375 380
Leu Thr Pro Pro Ser Leu Gln Leu Pro Gly Ser Arg Leu Lys Ala Ala
385 390 395 400
Leu Ser Ala Arg Asp Leu Glu Met Glu Met Glu Leu Leu Gly Leu Glu
405 410 415
Ser Pro Ala Arg Gln Gln Gln Gln Gln Gln Gln Gln Leu Ile Glu Glu
420 425 430
Ile Ala Arg Ile Ser Ser Pro Ser Phe Arg Ser Lys Glu Phe Asn Arg
435 440 445
Ile Val Asp Leu Asn Pro Thr Asn Leu Asp Asp Leu Leu Ala Ser Ala
450 455 460
Asp Pro Ser Val Phe Ser Gln Leu His Gly Leu Ser Val Gln Pro Ser
465 470 475 480
Thr Pro Thr Gln Ser Gly Leu Gln Met Arg Gln Asn Met Asn His Leu
485 490 495
Arg Ala Ser Tyr Pro Ser Asn Ile Pro Ser Ser Pro Val Arg Lys Pro
500 505 510
Ser Ala Phe Gly Phe Asp Ser Ser Ala Ala Val Ala Thr Ala Val Met
515 520 525
Asn Ser Arg Ser Ala Ala Phe Ala Lys Arg Ser Gln Ser Phe Ile Asp
530 535 540
Arg Gly Ala Ala Thr His His Leu Gly Leu Ser Ser Ala Ser Asn Ser
545 550 555 560
Ser Cys Arg Val Ser Ser Thr Leu Ser Asp Trp Ser Ser Pro Thr Gly
565 570 575
Lys Leu Asp Trp Gly Val Asn Gly Asp Lys Leu Asn Lys Leu Arg Lys
580 585 590
Ser Thr Ser Phe Gly Phe Arg Asn Ser Gly Val Thr Ala Ser Pro Ile
595 600 605
Ala Gln Pro Glu Phe Gly Ala Glu Pro Asp Val Ser Trp Val His Ser
610 615 620
Leu Val Lys Asp Val Pro Ser Glu Arg Ser Glu Ile Phe Gly Ala Glu
625 630 635 640
Lys Gln Gln Tyr Asp Leu Ser Lys Glu Met Leu Pro Pro Trp Met Glu
645 650 655
Gln Leu Tyr Ile Glu Gln Glu Gln Met Val Ala
660 665
<210>32
<211>2683
<212>DNA
<213>大桉
<400>32
gcaaaggtcg atcacttcct ccctagaaag cgagtgtgga gttgaagctt gataaccaga 60
ggccgcctct cgtctcgtct cgcccgcctg cgcttgctct gctctccgcg tgccaaggga 120
gtgttcctag gtgctgaatc tttccatgtg tagcggttca aaagggaagg gagagtgaat 180
tcgagaagca gaggatgtcg gcccgtcagt tctcgatcct gctcgagtta tctgctgcgg 240
atgatctgac gaactttaag aaagcagttg aggaagacgg ctacgatatt gatgagtcga 300
gcttgtggta tggtaggagg atcgggtcga agaagattgg gcttgaagag agaactcccc 360
tcatgattgc cgcgatgttc ggcagtatgt ccgtgctgga ttatattatc aagtctggcc 420
gggccaatgt aaacaaggcg tgtggttcag atggtgctac cgcgcttcac tgtgctgcgg 480
ctggtggctc ggtacaatct cctgaggtgg tcaagctgtt gcttgattct tcagcgaatg 540
ctaactccat tgatgcgaat gggaaacgag cgggagactt gatttctgag gtctctggtt 600
cgcccttcaa ttcgagaagg aagactttgg atgtcatgtt gactggaggt gggactgttg 660
agtttgttga ggaaacttac aatctgcctg agaatctggg tagtcaaatt gaaggaaacg 720
aacaaagaga gagtccaacg gcccgcgctt ccaaggatgg ttctgaaaag aaagagtatc 780
ctgtcgacct ttctcttccg gacatcaaca atggaatata tagcacagat gagtttagga 840
tgtattcttt caaagtgaag ccttgctcga gagcttactc tcatgactgg actgagtgtc 900
catttgttea ccctggggag aatgcaagac ggcgtgaccc acggaaatat caetacagct 960
gtgtgccttg ccctgagttc cgcaaggggt catgcaggca aggggatggc tgcgagtatg 1020
ctcatggtat atttgagtgc tggcttcacc cagctcaata tcgcacccgt ctctgtaagg 1080
atgagattgg atgcaccaga aaagtctgtt tctttgccca caaacatgaa gagcttcgtc 1140
cattgtatgc atcaactggt tcggcgcttc cttctccaag atcattttcg cccgttgctg 1200
cttctctaga catgggatca ctgagccctc tctctctcgg ttcttcttca gtccggatac 1260
cgccaacttc aacaccacct atgactccat caggggcctc ttctcccctt ggtgggtcga 1320
tgtggaaaag ccaaattaat agcactccgc ctggcttgca gcttccaggt agcaggttga 1380
gaagcgcatt gagtgctaga gacatggatt tagatgttga cttgatcgat ctagaaaata 1440
attatcgttt gcagaagcag ttgctcgaac actttcctga tctgtcctct cctcgtggtt 1500
ggaacaactc ttcatccacc acgtcggctt tccctgagta ttcaggtgac atgactggag 1560
aaataagtag gttaggagta aaaccaaata atctcgagga tagtttcagg tcattggacc 1620
tgaccctctt gtctcagtta caagggctgt cacttgatgg tgcaatatcc cagctgcaat 1680
ctcctactgg aatgaagatt cggcagaaca tgacccagca gctctactca aactatactg 1740
acaagctttc ctcgtcacct agggcaatgc catcatttgg aaccgatcct tccagagctt 1800
cagcagcagc cactctgagt tccaggtcat tggcatttgc aaaaaggagc cacagcttca 1860
ttgagcggag tacagtgaac agtcagtctg gatattcagc aggtgctgct tctccaactg 1920
caaggatgtc ttcccagaat gactggggct cgcccgatgg caaactagac tggggcattc 1980
aaggggagga gctgaacaag ctgaggaaat ctgcatcatt cgggctcagg agcagcagca 2040
accgcttcca tgcgtctgca gattctgcga cagcaactgt aggggaccca gacatgccct 2100
ggattcagtc cttggcaaag gaagccccgt cacaaaaccc tggcaatttt ggagcagagc 2160
atcagcagca gcagcagcag cagcagcagc agcagtatca tcttaattct ggaggtactg 2220
agctgcttcc agcttgggtg gagcagttgt acgcggatca ggagcagatg gtcgcctgag 2280
atcaacattg gcttcttatc taaccactat tagtcatttc gttattgctt taattttttt 2340
tcttctgagt ctagtattaa tgtctaggat tcgaacgaac tggaaaatta aatctagagg 2400
gaagatggga agaaaagagc aggatggaag gtttctgctc ggtccgagat ttctcatagt 2460
ctattataga ctatcgtatt tctcgttctt ttccgtccca atgttcttga tttggttctc 2520
agcatgtttt ctggatgagg cttacaaact atgtaatctt gtcttgctaa aagaatcaga 2580
gctgcacctg caccaaaggt tgtgatacta ccgcttattg atgatgatga taataataat 2640
aattcggaca tttagtacca agtccgatgt ctcaaaaaaa aaa 2683
<210>33
<211>694
<212>PRT
<213>大桉
<400>33
Met Ser Ala Arg Gln Phe Ser Ile Leu Leu Glu Leu Ser Ala Ala Asp
1 5 10 15
Asp Leu Thr Asn Phe Lys Lys Ala Val Glu Glu Asp Gly Tyr Asp Ile
20 25 30
Asp Glu Ser Ser Leu Trp Tyr Gly Arg Arg Ile Gly Ser Lys Lys Ile
35 40 45
Gly Leu Glu Glu Arg Thr Pro Leu Met Ile Ala Ala Met Phe Gly Ser
50 55 60
Met Ser Val Leu Asp Tyr Ile Ile Lys Ser Gly Arg Ala Asn Val Asn
65 70 75 80
Lys Ala Cys Gly Ser Asp Gly Ala Thr Ala Leu His Cys Ala Ala Ala
85 90 95
Gly Gly Ser Val Gln Ser Pro Glu Val Val Lys Leu Leu Leu Asp Ser
100 105 110
Ser Ala Asn Ala Asn Ser Il e Asp Ala Asn Gly Lys Arg Ala Gly Asp
115 120 125
Leu Ile Ser Glu Val Ser Gly Ser Pro Phe Asn Ser Arg Arg Lys Thr
130 135 140
Leu Asp Val Met Leu Thr Gly Gly Gly Thr Val Glu Phe Val Glu Glu
145 150 155 160
Thr Tyr Asn Leu Pro Glu Asn Leu Gly Ser Gln Ile Glu Gly Asn Glu
165 170 175
Gln Arg Glu Ser Pro Thr Ala Arg Ala Ser Lys Asp Gly Ser Glu Lys
180 185 190
Lys Glu Tyr Pro Val Asp Leu Ser Leu Pro Asp Ile Asn Asn Gly Ile
195 200 205
Tyr Ser Thr Asp Glu Phe Arg Met Tyr Ser Phe Lys Val Lys Pro Cys
210 215 220
Ser Arg Ala Tyr Ser His Asp Trp Thr Glu Cys Pro Phe Val His Pro
225 230 235 240
Gly Glu Asn Ala Arg Arg Arg Asp Pro Arg Lys Tyr His Tyr Ser Cys
245 250 255
Val Pro Cys Pro Glu Phe Arg Lys Gly Ser Cys Arg Gln Gly Asp Gly
260 265 270
Cys Glu Tyr Ala His Gly Ile Phe Glu Cys Trp Leu His Pro Ala Gln
275 280 285
Tyr Arg Thr Arg Leu Cys Lys Asp Glu Ile Gly Cys Thr Arg Lys Val
290 295 300
Cys Phe Phe Ala His Lys His Glu Glu Leu Arg Pro Leu Tyr Ala Ser
305 310 315 320
Thr Gly Ser Ala Leu Pro Ser Pro Arg Ser Phe Ser Pro Val Ala Ala
325 330 335
Ser Leu Asp Met Gly Ser Leu Ser Pro Leu Ser Leu Gly Ser Ser Ser
340 345 350
Val Arg Ile Pro Pro Thr Ser Thr Pro Pro Met Thr Pro Ser Gly Ala
355 360 365
Ser Ser Pro Leu Gly Gly Ser Met Trp Lys Ser Gln Ile Asn Ser Thr
370 375 380
Pro Pro Gly Leu Gln Leu Pro Gly Ser Arg Leu Arg Ser Ala Leu Ser
385 390 395 400
Ala Arg Asp Met Asp Leu Asp Val Asp Leu Ile Asp Leu Glu Asn Asn
405 410 415
Tyr Arg Leu Gln Lys Gln Leu Leu Glu His Phe Pro Asp Leu Ser Ser
420 425 430
Pro Arg Gly Trp Asn Asn Ser Ser Ser Thr Thr Ser Ala Phe Pro Glu
435 440 445
Tyr Ser Gly Asp Met Thr Gly Glu Ile Ser Arg Leu Gly Val Lys Pro
450 455 460
Asn Asn Leu Glu Asp Ser Phe Arg Ser Leu Asp Leu Thr Leu Leu Ser
465 470 475 480
Gln Leu Gln Gly Leu Ser Leu Asp Gly Ala Ile Ser Gln Leu Gln Ser
485 490 495
Pro Thr Gly Met Lys Ile Arg Gln Asn Met Thr Gln Gln Leu Tyr Ser
500 505 510
Asn Tyr Thr Asp Lys Leu Ser Ser Ser Pro Arg Ala Met Pro Ser Phe
515 520 525
Gly Thr Asp Pro Ser Arg Ala Ser Ala Ala Ala Thr Leu Ser Ser Arg
530 535 540
Ser Leu Ala Phe Ala Lys Arg Ser His Ser Phe Ile Glu Arg Ser Thr
545 550 555 560
Val Asn Ser Gln Ser Gly Tyr Ser Ala Gly Ala Ala Ser Pro Thr Ala
565 570 575
Arg Met Ser Ser Gln Asn Asp Trp Gly Ser Pro Asp Gly Lys Leu Asp
580 585 590
Trp Gly Ile Gln Gly Glu Glu Leu Asn Lys Leu Arg Lys Ser Ala Ser
595 600 605
Phe Gly Leu Arg Ser Ser Ser Asn Arg Phe His Ala Ser Ala Asp Ser
610 615 620
Ala Thr Ala Thr Val Gly Asp Pro Asp Met Pro Trp Ile Gln Ser Leu
625 630 635 640
Ala Lys Glu Ala Pro Ser Gln Asn Pro Gly Asn Phe Gly Ala Glu His
645 650 655
Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Tyr His Leu Asn Ser
660 665 670
Gly Gly Thr Glu Leu Leu Pro Ala Trp Val Glu Gln Leu Tyr Ala Asp
675 680 685
Gln Glu Gln Met Val Ala
690
<210>34
<211>2499
<212>DNA
<213>拟南芥
<400>34
attttgacct taagaagaaa gtgacaagga gaggaagaag aagaaaaaaa acataatttg 60
aggaagaaga aaaaaaattc ggatttgttt tttcaataaa ttgactaatt gagtactcgt 120
ttaaaggaag tgaagagcgg ttttttggta gtggtggtcg agaaaagaga gagtttgtct 180
ctgtgactca gagtgaaatc aatagagcgg gaaaagattg ttgctttttt ttgccatggg 240
agttgatgag ctgtctcacc tcaaattctc tcttctgcta gaatcatcag cctgcaatga 300
tttgtccggt tttaagtctc tagttgaaga agaaggtctt gagagcattg atggctctgg 360
tttgtggtat gggaggagat taggatcaaa gaagatgggt tttgaggaga ggacgcctct 420
tatgattgct gccttgtttg gaagcaaaga ggttgttgat tacatcatta gtactggtct 480
tgttgacgtg aaccgctctt gtggctctga tggtgccacg gctcttcact gtgcggtctc 540
tggcttgtct gccaatagcc ttgagattgt tactcttctg ctgaagggct ctgcgaatcc 600
ggattcttgt gatgcttatg gtaacaagcc tggagatgtg attttccctt gtttgagtcc 660
ggtttttagc gcgaggatga aggttttgga gcgtttgttg aaaggaaatg atgatttgaa 720
tgaagttaat gggcaagaag aaagcgagcc agaggttgag gttgaggttg aggtttcgcc 780
tcctcggggg tctgagagga aggagtatcc ggttgatcca acgcttcctg atatcaagaa 840
cggtgtatat gggacggatg agttccggat gtatgctttc aagatcaagc cgtgctctag 900
agcatactct cacgactgga cggaatgtcc ctttgttcat ccgggtgaga acgcaaggag 960
gcgtgatccg aggaagtacc attatagttg tgtcccttgt cctgaattcc ggaaggggtc 1020
ttgttccaga ggtgatactt gcgagtatgc tcatggtatc tttgagtgct ggcttcaccc 1080
ggctcagtac cggactcgtc tctgcaagga cgagacgaat tgctcgagaa gagtttgttt 1140
ctttgcccac aaacccgagg agctgcgtcc tttgtaccct tcaactggat caggtgttcc 1200
gtccccgcgg tcttccttct catcttgcaa ttcctcgacc gctttcgaca tgggaccgat 1260
tagtccgctt cctatcggag caacaaccac acctcctttg agtcctaacg gtgtatcctc 1320
tccaataggt ggaggaaaaa cgtggatgaa ctggcctaac ataacccctc ctgcattgca 1380
gcttccaggg agcagattga aatctgcatt gaatgcaaga gaaatcgatt tctctgaaga 1440
gatgcaaagt cttacttctc caactacatg gaacaacacg ccaatgtcat ctccattctc 1500
cggaaagggc atgaacaggc ttgcaggagg agcaatgagc ccggtgaata gtctcagtga 1560
tatgtttggg acagaggata atacatcggg tttgcagatc cgacgcagcg tcattaaccc 1620
gcagctgcat tccaacagtc tttcttcatc acctgtggga gccaattctc tgttttcgat 1680
ggattcctcc gcagtcttgg cttcaagagc ggctgaattt gctaaacagc gaagccaaag 1740
cttcatagaa cgcaacaacg gactgaatca ccatcccgca atctcttcca tgactacaac 1800
ttgtttaaac gattggggct cattggatgg gaagcttgac tggagcgtcc aaggagacga 1860
gctacagaag ctcagaaaat ccacttcttt ccgtctcaga gccggtggca tggaatcaag 1920
actgcctaac gaagggactg ggctcgaaga gccagatgtc tcatgggtgg agccgctggt 1980
gaaagagcca caggagacaa gactagctcc ggtttggatg gagcaatcat acatggagac 2040
agaacagacc gtggcttgaa tcaaaagttt tgaactttca ttaaccgttc cacaagaagc 2100
aaagtcagaa agattccgag aggtcgatgc taatctattt cattttattt gtttaatgct 2160
ttgttatttt tctttagaat aaaaagaaaa aattcttagg ggacaaaaga gagttcgttt 2220
gtctctctct ctgtctccaa agaaaaacag aggtgaaaaa aggtttcaaa acctaagaaa 2280
ccttgaatta cctcacctca cttccttgat tctttactat tcacaatgag taatcgattt 2340
ttttttttct tggtaacact ctcacgctga atatatatgt tttttagtaa taatataatt 2400
ggaatacaga aatgtattta cacttgtgaa gttagggaaa gtgttgtaat tgtttcttct 2460
aagagttgat ctaagatgtt tgagactata tcttcgctt 2499
<210>35
<211>607
<212>PRT
<213>拟南芥
<400>35
Met Gly Val Asp Glu Leu Ser His Leu Lys Phe Ser Leu Leu Leu Glu
1 5 10 15
Ser Ser Ala Cys Asn Asp Leu Ser Gly Phe Lys Ser Leu Val Glu Glu
20 25 30
Glu Gly Leu Glu Ser Ile Asp Gly Ser Gly Leu Trp Tyr Gly Arg Arg
35 40 45
Leu Gly Ser Lys Lys Met Gly Phe Glu Glu Arg Thr Pro Leu Met Ile
50 55 60
Ala Ala Leu Phe Gly Ser Lys Glu Val Val Asp Tyr Ile Ile Ser Thr
65 70 75 80
Gly Leu Val Asp Val Asn Arg Ser Cys Gly Ser Asp Gly Ala Thr Ala
85 90 95
Leu His Cys Ala Val Ser Gly Leu Ser Ala Asn Ser Leu Glu Ile Val
100 105 110
Thr Leu Leu Leu Lys Gly Ser Ala Asn Pro Asp Ser Cys Asp Ala Tyr
115 120 125
Gly Asn Lys Pro Gly Asp Val Ile Phe Pro Cys Leu Ser Pro Val Phe
130 135 140
Ser Ala Arg Met Lys Val Leu Glu Arg Leu Leu Lys Gly Asn Asp Asp
145 150 155 160
Leu Asn Glu Val Asn Gly Gln Glu Glu Ser Glu Pro Gl u Val Glu Val
165 170 175
Glu Val Glu Val Ser Pro Pro Arg Gly Ser Glu Arg Lys Glu Tyr Pro
180 185 190
Val Asp Pro Thr Leu Pro Asp Ile Lys Asn Gly Val Tyr Gly Thr Asp
195 200 205
Glu Phe Arg Met Tyr Ala Phe Lys Ile Lys Pro Cys Ser Arg Ala Tyr
210 215 220
Ser His Asp Trp Thr Glu Cys Pro Phe Val His Pro Gly Glu Asn Ala
225 230 235 240
Arg Arg Arg Asp Pro Arg Lys Tyr His Tyr Ser Cys Val Pro Cys Pro
245 250 255
Glu Phe Arg Lys Gly Ser Cys Ser Arg Gly Asp Thr Cys Glu Tyr Ala
260 265 270
His Gly Ile Phe Glu Cys Trp Leu His Pro Ala Gln Tyr Arg Thr Arg
275 280 285
LeL Cys Lys Asp Glu Thr Asn Cys Ser Arg Arg Val Cys Phe Phe Ala
290 295 300
His Lys Pro Glu Glu Leu Arg Pro Leu Tyr Pro Ser Thr Gly Ser Gly
305 310 315 320
Val Pro Ser Pro Arg Ser Ser Phe Ser Ser Cys Asn Ser Ser Thr Ala
325 330 335
Phe Asp Met Gly Pro Ile Ser Pro Leu Pro Ile Gly Ala Thr Thr Thr
340 345 350
Pro Pro Leu Ser Pro Asn Gly Val Ser Ser Pro Ile Gly Gly Gly Lys
355 360 365
Thr Trp Met Asn Trp Pro Asn Ile Thr Pro Pro Ala Leu Gln Leu Pro
370 375 380
Gly Ser Arg Leu Lys Ser Ala Leu Asn Ala Arg Glu Ile Asp Phe Ser
385 390 395 400
Glu Glu Met Gln Ser Leu Thr Ser Pro Thr Thr Trp Asn Asn Thr Pro
405 410 415
Met Ser Ser Pro Phe Ser Gly Lys Gly Met Asn Arg Leu Ala Gly Gly
420 425 430
Ala Met Ser Pro Val Asn Ser Leu Ser Asp Met Phe Gly Thr Glu Asp
435 440 445
Asn Thr Ser Gly Leu Gln Ile Arg Arg Ser Val Ile Asn Pro Gln Leu
450 455 460
His Ser Asn Ser Leu Ser Ser Ser Pro Val Gly Ala Asn Ser Leu Phe
465 470 475 480
Ser Met Asp Ser Ser Ala Val Leu Ala Ser Arg Ala Ala Glu Phe Ala
485 490 495
Lys Gln Arg Ser Gln Ser Phe Ile Glu Arg Asn Asn Gly Leu Asn His
500 505 510
His Pro Ala Ile Ser Ser Met Thr Thr Thr Cys Leu Asn Asp Trp Gly
515 520 525
Ser Leu Asp Gly Lys Leu Asp Trp Ser Val Gln Gly Asp Glu Leu Gln
530 535 540
Lys Leu Arg Lys Ser Thr Ser Phe Arg Leu Arg Ala Gly Gly Met Glu
545 550 555 560
Ser Arg Leu Pro Asn Glu Gly Thr Gly Leu Glu Glu Pro Asp Val Ser
565 570 575
Trp Val Glu Pro Leu Val Lys Glu Pro Gln Glu Thr Arg Leu Ala Pro
580 585 590
Val Trp Met Glu Gln Ser Tyr Met Glu Thr Glu Gln Thr Val Ala
595 600 605
<210>36
<211>1806
<212>DNA
<213>稻
<400>36
atgtgctctg ggccgcgcaa gccgtccaca ccgccgctgc cgcagcagca gaaggaggcg 60
acggtgatgg cggcgtcctt gcttcttgag ctggcggcag cggacgacgt ggcggcggtg 120
aggagggtcg tggaggagga gaaggtgtct cttggcgtgg ctgggttgtg gtatgggcct 180
tcggcgagcg gcgtggcgag gctcgggatg gagcggagga cggcggcgat ggtggcggcg 240
ctgtacggga gcacgggggt gcttgggtat gtcgtggcgg cagcgccggc ggaggccgcg 300
cgcgcgtcgg agacggatgg ggccacgccg ctgcacatgg cggctgccgg tggcgcggcg 360
aacgcggtcg cggccacgcg cctgttgctc gccgcggggg cgtcggtcga cgcgctctcg 420
gcttcggggc tccgcgccgg tgacctcctc ccgcgcgcca ccgcggcgga gaaggccatc 480
cggctgctgc tcaagtcgcc ggccgtgtcg ccgtcgtcgt cgccgaagaa gtcggcctcg 540
ccgccgtcgc cgccgccgcc gcaggaggcg aagaaggagt acccgcctga cctgacgctg 600
cccgacctca agagcggact gttcagcacc gacgagttcc gcatgtacag cttcaaggtg 660
aagccgtgct cccgcgccta ctcccatgac tggaccgagt gccccttcgt ccaccccggc 720
gagaacgcgc gccgccgcga ccctcgccgc tactcctaca gctgcgtgcc ttgcccggag 780
ttccgcaagg gcggctcgtg ccgcaagggc gacgcgtgcg agtacgccca tggcgtgttc 840
gagtgctggc tccacccggc gcagtacagg acgcgcctct gcaaggacga ggtcggctgc 900
gcgcgccgca tctgcttctt cgcccacaag cccgacgagc tccgcgccgt caacccctcc 960
gccgtgtccg tcggcatgca gcccaccgta tcgtcgccgc gctcctcgcc gcccaacggg 1020
ctcgacatgg cggcggcggc ggcggcgatg atgagccccg cctggccgtc gtccccagcg 1080
agccgcctca agacggcgct cggcgcgcgg gagctcgact tcgacctcga gatgctcgcg 1140
ctggaccagt accagcagaa gctgttcgac aaggtgtccg gcgcgccgtc gccgagggcg 1200
agctggggcg ccgcggcgaa cggcctcgcc accgcgtcgc cggcgagggc cgtgccggac 1260
tacaccgacc tgctcggctc cgtcgacccg gccatgctgt cccagctcca cgcgctgtcc 1320
ctcaagcagg ccggcgacat gcccgcgtac agctccatgg cggacaccac gcagatgcac 1380
atgccgacct cgccgatggt gggcggcgcg aacaccgcgt tcgggctgga ccactccatg 1440
gcgaaggcga tcatgagctc ccgcgcctcg gcgttcgcca agcgcagcca gagcttcatc 1500
gaccgcggag gccgcgcccc ggcggcgcgt tcgctcatgt cgccggcgac gaccggcgcg 1560
ccgtccattc tctcggactg gggctcgccg gacggcaagc tggactgggg cgtccagggc 1620
gacgagctgc acaagctccg caagtcggcg tcgttcgcgt tccgcggcca atccgccatg 1680
ccggtggcga cgcacgccgc ggcggcggag ccggacgtgt catgggtgaa ctctcttgtc 1740
aaggacggcc acgccgccgg cgacatattc gcgcagtggc cggagcagga gcagatggtg 1800
gcatga 1806
<210>37
<211>601
<212>PRT
<213>稻
<400>37
Met Cys Ser Gly Pro Arg Lys Pro Ser Thr Pro Pro Leu Pro Gln Gln
1 5 10 15
Gln Lys Glu Ala Thr Val Met Ala Ala Ser Leu Leu Leu Glu Leu Ala
20 25 30
Ala Ala Asp Asp Val Ala Ala Val Arg Arg Val Val Glu Glu Glu Lys
35 40 45
Val Ser Leu Gly Val Ala Gly Leu Trp Tyr Gly Pro Ser Ala Ser Gly
50 55 60
Val Ala Arg Leu Gly Met Glu Arg Arg Thr Ala Ala Met Val Ala Ala
65 70 75 80
Leu Tyr Gly Ser Thr Gly Val Leu Gly Tyr Val Val Ala Ala Ala Pro
85 90 95
Ala Glu Ala Ala Arg Ala Ser Glu Thr Asp Gly Ala Thr Pro Leu His
100 105 110
Met Ala Ala Ala Gly Gly Ala Ala Asn Ala Val Ala Ala Thr Arg Leu
115 120 125
Leu Leu Ala Ala Gly Ala Ser Val Asp Ala Leu Ser Ala Ser Gly Leu
130 135 140
Arg Ala Gly Asp Leu Leu Pro Arg Ala Thr Ala Ala Glu Lys Ala Ile
145 150 155 160
Arg Leu Leu Leu Lys Ser Pro Ala Val Ser Pro Ser Ser Ser Pro Lys
165 170 175
Lys Ser Ala Ser Pro Pro Ser Pro Pro Pro Pro Gl n Glu Ala Lys Lys
180 185 190
Glu Tyr Pro Pro Asp Leu Thr Leu Pro Asp Leu Lys Ser Gly Leu Phe
195 200 205
Ser Thr Asp Glu Phe Arg Met Tyr Ser Phe Lys Val Lys Pro Cys Ser
210 215 220
Arg Ala Tyr Ser His Asp Trp Thr Glu Cys Pro Phe Val His Pro Gly
225 230 235 240
Glu Asn Ala Arg Arg Arg Asp Pro Arg Arg Tyr Ser Tyr Ser Cys Val
245 250 255
Pro Cys Pro Glu Phe Arg Lys Gly Gly Ser Cys Arg Lys Gly Asp Ala
260 265 270
Cys Glu Tyr Ala His Gly Val Phe Glu Cys Trp Leu Hi s Pro Ala Gln
275 280 285
Tyr Arg Thr Arg Leu Cys Lys Asp Glu Val Gly Cys Ala Arg Arg Ile
290 295 300
Cys Phe Phe Ala His Lys Pro Asp Glu Leu Arg Ala Val Asn Pro Ser
305 310 315 320
Ala Val Ser Val Gly Met Gln Pro Thr Val Ser Ser Pro Arg Ser Ser
325 330 335
Pro Pro Asn Gly Leu Asp Met Ala Ala Ala Ala Ala Ala Met Met Ser
340 345 350
Pro Ala Trp Pro Ser Ser Pro Ala Ser Arg Leu Lys Thr Ala Leu Gly
355 360 365
Ala Arg Glu Leu Asp Phe Asp Leu Glu Met Leu Ala Leu Asp Gln Tyr
370 375 380
Gln Gln Lys Leu Phe Asp Lys Val Ser Gly Ala Pro Ser Pro Arg Ala
385 390 395 400
Ser Trp Gly Ala Ala Ala Asn Gly Leu Ala Thr Ala Ser Pro Ala Arg
405 410 415
Ala Val Pro Asp Tyr Thr Asp Leu Leu Gly Ser Val Asp Pro Ala Met
420 425 430
Leu Ser Gln Leu His Ala Leu Ser Leu Lys Gln Ala Gly Asp Met Pro
435 440 445
Ala Tyr Ser Ser Met Ala Asp Thr Thr Gln Met His Met Pro Thr Ser
450 455 460
Pro Met Val Gly Gly Ala Asn Thr Ala Phe Gly Leu Asp His Ser Met
465 470 475 480
Ala Lys Ala Ile Met Ser Ser Arg Ala Ser Ala Phe Ala Lys Arg Ser
485 490 495
Gln Ser Phe Ile Asp Arg Gly Gly Arg Ala Pro Ala Ala Arg Ser Leu
500 505 510
Met Ser Pro Ala Thr Thr Gly Ala Pro Ser Ile Leu Ser Asp Trp Gly
515 520 525
Ser Pro Asp Gly Lys Leu Asp Trp Gly Val Gln Gly Asp Glu Leu His
530 535 540
Lys Leu Arg Lys Ser Ala Ser Phe Ala Phe Arg Gly Gln Ser Ala Met
545 550 555 560
Pro Val Ala Thr His Ala Ala Ala Ala Glu Pro Asp Val Ser Trp Val
565 570 575
Asn Scr Leu Val Lys Asp Gly His Ala Ala Gly Asp Ile Phe Ala Gln
580 585 590
Trp Pro Glu Gln Glu Gln Met Val Ala
595 600
<210>38
<211>1692
<212>DNA
<213>大麦(Hordeum vulgare)
<400>38
cggcacgagg cacatccatc atctaacctc acctctcctc tcctcccctc tcctcctacc 60
aaacccaaaa ccaagcagag caagagcaag agcaagagca agagcaagca agcatgtgcc 120
ctggcctgcg caacctcgcc gccgccatgc caccctccgc ccacgaccac ccctcctcct 180
acctgctcga gctcgccgcc gacgacgacc tccccgcctt ccgccgcgcc gtccaggagg 240
acaacctctc cctcgacgcc gcatccccga ggtacgagcc atcccccaaa tcagaccaac 300
aacaacaaca cgccccagct cgcgctccac ctgcgcaccc ccgccatggt cgccgcgctc 360
tacggcagca ccaccgtcct ctcctacgtc ctctccatcg ccccctccga ggccgcccgc 420
gcctccgcat ccgacggcgc caccccgctc ctcctcgccc accagggccg cgcgccatcc 480
gcgccccacg ccgcacgcct cctcctcacc gacggcgcat catcgtcctc cctactcgcg 540
ccccaagctc accctctcaa ccaccaaaac caaaaccaaa acagccccac caagaaagac 600
tcgccgccgg actccaggag gaccaccacc aagaaggact actcctccgc ctccgactcc 660
cagacggagg acatcaacgc gggcgtcttc gccaccgacg acttccggat gtacagcttc 720
aaggtgaacc cgtgctcccg cgcctacacg cacgactgga ccgagtgccc cttcgcccac 780
cccggcgaga acgcgcgccg ccgcgacccg cgccgcgtgc catactcgtg cgtcccatgc 840
ccggacttcc gccgcgaccc ggccgcatgc cgcaagggcg acgcctgcga gtacgcgcac 900
ggcgtcttcg agtcatggct ccaccccgcg cagtaccgca ccaggctctg caaggacgag 960
gtcggatgcc cgcgccgcat ctgcttcttc gcgcacggcg cccgacagct acgcgccgtc 1020
aacccctccg ccgcatccat ggactcgcca tccccaactt cctcttcgcc gccgcgaacc 1080
tccaggccgg ccgcgctcac cgcgtcgctc agctcgcggg acctcgactt ggacgccgac 1140
aaccaggccc agtacgcgcg caggatgatg atggccaggg ccaactcccc gccggactac 1200
tcgcccgacc tcgtcgccgc ctacgtacag gcgctctcct ccctgcaaca gcagcagcat 1260
cagcagaacc agcaacagca gcatcagcag cagaaccagc accagcagca acatcagcag 1320
aaccagcacc agcagcatca gcagcaacat cagcagagca tggggatggg ggggctgagc 1380
gcccgcgccg ccgccttcac caaccgcagc cagaccttcg tgcaccgctc tccgtccccg 1440
gctccggcgc ggtcgttcaa gtctccggcg ccgtcgtcca tgctcgcgga ctgggggtcg 1500
ccggacggga agctggactg gggcgtgcag gccgcggagc tgcgcaagtc cacgtctttc 1560
ggagtcagaa gcagcagcag gccgcatcat gagacgacga gggcggagga caacatgtac 1620
ccgtcgtgga tgaaggacgg cagcgatatg ctgctggcgg cgcggtggtc ggacctggag 1680
cagatggtcg cc 1692
<210>39
<211>564
<212>PRT
<213>大麦
<400>39
Arg His Glu Ala His Pro Ser Ser Asn Leu Thr Ser Pro Leu Leu Pro
1 5 10 15
Ser Pro Pro Thr Lys Pro Lys Thr Lys Gln Ser Lys Ser Lys Ser Lys
20 25 30
Ser Lys Ser Lys Gln Ala Cys Ala Leu Ala Cys Ala Thr Ser Pro Pro
35 40 45
Pro Cys His Pro Pro Pro Thr Thr Thr Pro Pro Pro Thr Cys Ser Ser
50 55 60
Ser Pro Pro Thr Thr Thr Ser Pro Pro Ser Ala Ala Pro Ser Arg Arg
65 70 75 80
Thr Thr Ser Pro Ser Thr Pro His Pro Arg Gly Thr Ser His Pro Pro
85 90 95
Asn Gln Thr Asn Asn Asn Asn Thr Pro Gln Leu Ala Leu His Leu Arg
100 105 110
Thr Pro Ala Met Val Ala Ala Leu Tyr Gly Ser Thr Thr Val Leu Ser
115 120 125
Tyr Val Leu Ser Ile Ala Pro Ser Glu Ala Ala Arg Ala Ser Ala Ser
130 135 140
Asp Gly Ala Thr Pro Leu Leu Leu Ala His Gln Gly Arg Ala Pro Ser
145 150 155 160
Ala Pro His Ala Ala Arg Leu Leu Leu Thr Asp Gly Ala Ser Ser Ser
165 170 175
Ser Leu Leu Ala Pro Gln Ala His Pro Leu Asn His Gln Asn Gln Asn
180 185 190
Gln Asn Ser Pro Thr Lys Lys Asp Ser Pro Pro Asp Ser Arg Arg Thr
195 200 205
Thr Thr Lys Lys Asp Tyr Ser Ser Ala Ser Asp Ser Gln Thr Glu Asp
210 215 220
Ile Asn Ala Gly Val Phe Ala Thr Asp Asp Phe Arg Met Tyr Ser Phe
225 230 235 240
Lys Val Asn Pro Cys Ser Arg Ala Tyr Thr Hi s Asp Trp Thr Glu Cys
245 250 255
Pro Phe Ala His Pro Gly Glu Asn Ala Arg Arg Arg Asp Pro Arg Arg
260 265 270
Val Pro Tyr Ser Cys Val Pro Cys Pro Asp Phe Arg Arg Asp Pro Ala
275 280 285
Ala Cys Arg Lys Gly Asp Ala Cys Glu Tyr Ala His Gly Val Phe Glu
290 295 300
Ser Trp Leu His Pro Ala Gln Tyr Arg Thr Arg Leu Cys Lys Asp Glu
305 310 315 320
Val Gly Cys Pro Arg Arg Ile Cys Phe Phe Ala His Gly Ala Arg Gln
325 330 335
Leu Arg Ala Val Asn Pro Ser Ala Ala Ser Met Asp Ser Pro Ser Pro
340 345 350
Thr Ser Ser Ser Pro Pro Arg Thr Ser Arg Pro Ala Ala Leu Thr Ala
355 360 365
Ser Leu Ser Ser Arg Asp Leu Asp Leu Asp Ala Asp Asn Gln Ala Gln
370 375 380
Tyr Ala Arg Arg Met Met Met Ala Arg Ala Asn Ser Pro Pro Asp Tyr
385 390 395 400
Ser Pro Asp Leu Val Ala Ala Tyr Val Gln Ala Leu Ser Ser Leu Gln
405 410 415
Gln Gln Gln His Gln Gln Asn Gln Gln Gln Gln His Gln Gln Gln Asn
420 425 430
Gln His Gln Gln Gln His Gln Gln Asn Gln His Gln Gln Hi s Gln Gln
435 440 445
Gln His Gln Gln Ser Met Gly Met Gly Gly Leu Ser Ala Arg Ala Ala
450 455 460
Ala Phe Thr Asn Arg Ser Gln Thr Phe Val His Arg Ser Pro Ser Pro
465 470 475 480
Ala Pro Ala Arg Ser Phe Lys Ser Pro Ala Pro Ser Ser Met Leu Ala
485 490 495
Asp Trp Gly Ser Pro Asp Gly Lys Leu Asp Trp Gly Val Gln Ala Ala
500 505 510
Glu Leu Arg Lys Ser Thr Ser Phe Gly Val Arg Ser Ser Ser Arg Pro
515 520 525
His His Glu Thr Thr Arg Ala Glu Asp Asn Met Tyr Pro Ser Trp Met
530 535 540
Lys Asp Gly Ser Asp Met Leu Leu Ala Ala Arg Trp Ser Asp Leu Glu
545 550 555 560
Gln Met Val Ala
<210>40
<211>3610
<212>DNA
<213>辐射松(Pinus radiata)
<400>40
tgtttccagg cgggcactaa agcaagggag ggggtaggct ttactttctg ctctgcgcaa 60
agaacgttga aatcaatcgc cctggctggt ctggcgtgac tactagattc aatttcttca 120
tggccgtctt cacataccca ttctttaccg gttcagagct gtgatcttta tttttaacag 180
ccacaatcat ggtttgtgtt tccagtgtta tgatctgagt gaagttcgtt ctttttctcg 240
tgacccaggc ttgatactag gccggacctt tctgaggtgg aagagatcta tacatttgag 300
gcctattttg tgtagccatg tgtggaggcc cagaacattt gaagcctgcc agcccacacg 360
aaggagaaga taaagtcaaa atggccgaga atcagtctat caaagtgaag gaattgtctg 420
aatcttgttc aagtctacat gaactagctg ctaataatga ccttattggc tttaagaaag 480
caatggagga agaagggtca aagatagatg aggttaactt ttggtacggg aggcagaatg 540
gttctaatca gatggtcctg gagcaaagga ctccattgat ggttgctgca ctttatggca 600
gtgtagatgc gctgagttac atcttatcca tttatgtaac ttgtggagca gatgttaacc 660
aagcctgtgg gtcagataac tccactgcct tgcattgtgc ggctgtggga gggtctgcct 720
gtgcagttga aactgtaaaa ttgttacttc atgcaggcag tgatgtgaat cgcttggatg 780
cttatggcag aagaccagca gatgtgatta tggtttctcc taagctaacc gaaatcaagg 840
ccaagctaga agaaatgtta aacgcagctg gttcatgtca aacttctccg gcaaagttgc 900
ctaacatagt ttcagggcca cctgggtttg agtcaaaggg gatggagtcc atgtccccat 960
tgccattgtt gcctctttca ttgtctttag aagcatccaa taatagatca ggttgtgtga 1020
attctccaac atcttcgcca aagtccatgg aagcattaaa gggtttcggt gatgttaatg 1080
agaagaagga atatcctgtg gacccttctt ttccagacat aaagaatagc atctatacta 1140
cagatgaatt tcggatgttt tccttcaagg tgcggccatg ttcacgggca tattctcatg 1200
attggactga atgcccattt gtgcatcctg gtgaaaatgc cagaaggcgg gatccaagaa 1260
ggtatcatta tagctgtgtt ccttgcccag attttcggaa agggacttgt aggcgcagtg 1320
atgtttgtga atatgcacac ggtgtttttg agtgctggtt acatcctgct caatatagga 1380
cacggttgtg caaagatggg actaattgtt cacgtagagt ttgcttcttt gctcacacat 1440
ctgaggaact acgccctctc attgtctcta ctgggtctgc tgttccatcc ccaagggcat 1500
catcatctct ggacatgaca tctgtcatga gtcctcttgc ccctggttct ccctcttcag 1560
tttcaatgat gtcacccttc ctatcaaatc ctcagcaagg cagtgtgctt actccgccta 1620
tgtctccatc agcgtcctct gtaaatggat atggaggctg gccacagcct aatgtaccaa 1680
ccttacacct tcctggtagc aatgttcaaa ccagccgtct tagagcggaa cttaatgcca 1740
gagacatgcc tgttgaggat tctcctcgaa tttcagacta tgaagggcag caactcctga 1800
atgatttttc tccactgtcc acacaagcca ggctgaatgc tgctgctgct gttatatctg 1860
gtggcgggaa caccacaaca aggtctggaa aatacaagag tcacgggatc aatactgttg 1920
ctccaacgaa tcttgaagac ttgtttgcct ccgaggtaac atctcctaga gtagcagttc 1980
ttgaaccttc catcttttct cagatgagtc cccaaatgca agctcataag actgcccagg 2040
catatatgca gattcaaaac cagatgctgc ctcctataaa tacacaggca ttttcgcagg 2100
gaattacaca gatgcagcag gctgcaatag agcctcagag ccctggacat tctttgatgc 2160
aatcaccttt ccaatcttcc tcgtatgggt tgggatcccc tggtagaatg tcacctcgtt 2220
gtgtggatgt ggaacgtcat aatacatgtg ggtctccctt atcaccggct atggctgcaa 2280
cgataaattc aagaatggct atggctgctt ttgttcagag ggaaaaacgg agccatagtt 2340
cccgtgactt gggagctaat gtgaatccca gttcatggtc tgattggggc tcgcctacag 2400
gtaaagttga ctggggggtt caaggagaag agttgagcaa attaagaaag tcggcttcat 2460
ttggtccccg cagttatgaa gaaccggatt tgtcttgggt tcaaacactg gtaaaggaaa 2520
ctacaccaga gggtaaagat ggaggaaatg taagctgttc tggggaaact ccacacaagg 2580
ggcaaataga aaatgttgat cattcagttt tgggtgcctg gattgaacag atgcagcttg 2640
atcagattgt agcttgagat taggattatt tatttggagt ggtggtaggg ataggctcat 2700
ttaaaattca atttctcatt ttttactatt tcttttataa aaattcccca ttatagttta 2760
ggaaatagtc tggttttcta cctattatca gaattacacc tgcaggaaat tttggaggaa 2820
agcatgcaaa aagtagatag ggatgttatt cctatcagca ggttgacaag ctgaaaatca 2880
cttgggtggt agaccagaga atgacactat tttttgttga catggcaact gaagatgctg 2940
ttttctttac ttatcattaa caaccctata tatatttgtt ttgaaagaac tgagcggaga 3000
aatgttgtca gttggttact ctgcgcaagg ccttggaaga aatccaagat gtggcatctt 3060
ggtgcatttt taatttatca agtgtgaaat ccataacagg tttcagtgag tgacttctga 3120
ggttgtatat ggaaaaacct atgatgttgg ctgtctactg ctatttttct gtgcctaaac 3180
tgtcaactaa agtttgcagg tggcaatttt gtggcagcat atttgcacat tgaagcggat 3240
ggtctgcacc tgctatagaa gttttcgagt ctgtagaatt tgatggtgca agatgatttt 3300
ctagttgata tatttggaag gctttgccaa agtagtggca tgtacatttt gcaaaaattt 3360
aaaggatggc aatccattgt tttgccatgt agcttcactt tattgattag gtggaaagga 3420
attttgagac acttcaattt gtgcatactt ttgttctgaa ctgcaaaatc agtctcttgt 3480
gatgtcctca aggctattat gctcagggat ttgcctaaaa ccataagtgg ccttagataa 3540
ggtaccattg tattaccttt tattgtttgg atattttatt tatgaaagtg aatttatttt 3600
aaaaaaaaaa 3610
<210>41
<211>779
<212>PRT
<213>辐射松
<400>41
Met Cys Gly Gly Pro Glu His Leu Lys Pro Ala Ser Pro His Glu Gly
1 5 10 15
Glu Asp Lys Val Lys Met Ala Glu Asn Gln Ser Ile Lys Val Lys Glu
20 25 30
Leu Ser Glu Ser Cys Ser Ser Leu His Glu Leu Ala Ala Asn Asn Asp
35 40 45
Leu Ile Gly Phe Lys Lys Ala Met Glu Glu Glu Gly Ser Lys Ile Asp
50 55 60
Glu Val Asn Phe Trp Tyr Gly Arg Gln Asn Gly Ser Asn Gln Met Val
65 70 75 80
Leu Glu Gln Arg Thr Pro Leu Met Val Ala Ala Leu Tyr Gly Ser Val
85 90 95
Asp Ala Leu Ser Tyr Ile Leu Ser Ile Tyr Val Thr Cys Gly Ala Asp
100 105 110
Val Asn Gln Ala Cys Gly Ser Asp Asn Ser Thr Ala Leu His Cys Ala
115 120 125
Ala Val Gly Gly Ser Ala Cys Ala Val Glu Thr Val Lys Leu Leu Leu
130 135 140
His Ala Gly Ser Asp Val Asn Arg Leu Asp Ala Tyr Gly Arg Arg Pro
145 150 155 160
Ala Asp Val Ile Met Val Ser Pro Lys Leu Thr Glu Ile Lys Ala Lys
165 170 175
Leu Glu Glu Met Leu Asn Ala Ala Gly Ser Cys Gln Thr Ser Pro Ala
180 185 190
Lys Leu Pro Asn Ile Val Ser Gly Pro Pro Gly Phe Glu Ser Lys Gly
195 200 205
Met Glu Ser Met Ser Pro Leu Pro Leu Leu Pro Leu Ser Leu Ser Leu
210 215 220
Glu Ala Ser Asn Asn Arg Ser Gly Cys Val Asn Ser Pro Thr Ser Ser
225 230 235 240
Pro Lys Ser Met Glu Ala Leu Lys Gly Phe Gly Asp Val Asn Glu Lys
245 250 255
Lys Glu Tyr Pro Val Asp Pro Ser Phe Pro Asp Ile Lys Asn Ser Ile
260 265 270
Tyr Thr Thr Asp Glu Phe Arg Met Phe Ser Phe Lys Val Arg Pro Cys
275 280 285
Ser Arg Ala Tyr Ser His Asp Trp Thr Glu Cys Pro Phe Val His Pro
290 295 300
Gly Glu Asn Ala Arg Arg Arg Asp Pro Arg Arg Tyr His Tyr Ser Cys
305 310 315 320
Val Pro Cys Pro Asp Phe Arg Lys Gly Thr Cys Arg Arg Ser Asp Val
325 330 335
Cys Glu Tyr Ala His Gly Val Phe Glu Cys Trp Leu His Pro Ala Gln
340 345 350
Tyr Arg Thr Arg Leu Cys Lys Asp Gly Thr Asn Cys Ser Arg Arg Val
355 360 365
Cys Phe Phe Ala His Thr Ser Glu Glu Leu Arg Pro Leu Ile Val Ser
370 375 380
Thr Gly Ser Ala Val Pro Ser Pro Arg Ala Ser Ser Ser Leu Asp Met
385 390 395 400
Thr Ser Val Met Ser Pro Leu Ala Pro Gly Ser Pro Ser Ser Val Ser
405 410 415
Met Met Ser Pro Phe Leu Ser Asn Pro Gln Gln Gly Ser Val Leu Thr
420 425 430
Pro Pro Met Ser Pro Ser Ala Ser Ser Val Asn Gly Tyr Gly Gly Trp
435 440 445
Pro Gln Pro Asn Val Pro Thr Leu His Leu Pro Gly Ser Asn Val Gln
450 455 460
Thr Ser Arg Leu Arg Ala Glu Leu Asn Ala Arg Asp Met Pro Val Glu
465 470 475 480
Asp Ser Pro Arg Ile Ser Asp Tyr Glu Gly Gln Gln Leu Leu Asn Asp
485 490 495
Phe Ser Pro Leu Ser Thr Gln Ala Arg Leu Asn Ala Ala Ala Ala Val
500 505 510
Ile Ser Gly Gly Gly Asn Thr Thr Thr Arg Ser Gly Lys Tyr Lys Ser
515 520 525
His Gly Ile Asn Thr Val Ala Pro Thr Asn Leu Glu Asp Leu Phe Ala
530 535 540
Ser Glu Val Thr Ser Pro Arg Val Ala Val Leu Glu Pro Ser Ile Phe
545 550 555 560
Ser Gln Met Ser Pro Gln Met Gln Ala His Lys Thr Ala Gln Ala Tyr
565 570 575
Met Gln Ile Gln Asn Gln Met Leu Pro Pro Ile Asn Thr Gln Ala Phe
580 585 590
Ser Gln Gly Ile Thr Gln Met Gln Gln Ala Ala Ile Glu Pro Gln Ser
595 600 605
Pro Gly His Ser Leu Met Gln Ser Pro Phe Gln Ser Ser Ser Tyr Gly
610 615 620
Leu Gly Ser Pro Gly Arg Met Ser Pro Arg Cys Val Asp Val Glu Arg
625 630 635 640
His Asn Thr Cys Gly Ser Pro Leu Ser Pro Ala Met Ala Ala Thr Ile
645 650 655
Asn Ser Arg Met Ala Met Ala Ala Phe Val Gln Arg Glu Lys Arg Ser
660 665 670
His Ser Ser Arg Asp Leu Gly Ala Asn Val Asn Pro Ser Ser Trp Ser
675 680 685
Asp Trp Gly Ser Pro Thr Gly Lys Val Asp Trp Gly Val Gln Gly Glu
690 695 700
Glu Leu Ser Lys Leu Arg Lys Ser Ala Ser Phe Gly Pro Arg Ser Tyr
705 710 715 720
Glu Glu Pro Asp Leu Ser Trp Val Gln Thr Leu Val Lys Glu Thr Thr
725 730 735
Pro Glu Gly Lys Asp Gly Gly Asn Val Ser Cys Ser Gly Glu Thr Pro
740 745 750
His Lys Gly Gln Ile Glu Asn Val Asp His Ser Val Leu Gly Ala Trp
755 760 765
Ile Glu Gln Met Gln Leu Asp Gln Ile Val Ala
770 775
<210>42
<211>3610
<212>DNA
<213>辐射松
<400>42
tgtttccagg cgggcactaa agcaagggag ggggtaggct ttactttctg ctctgcgcaa 60
agaacgttga aatcaatcgc cctggctggt ctggcgtgac tactagattc aatttcttca 120
tggccgtctt cacataccca ttctttaccg gttcagagct gtgatcttta tttttaacag 180
ccacaatcat ggtttgtgtt tccagtgtta tgatctgagt gaagttcgtt ctttttctcg 240
tgacccaggc ttgatactag gccggacctt tctgaggtgg aagagatcta tacatttgag 300
gcctattttg tgtagccatg tgtggaggcc cagaacattt gaagcctgcc agcccacacg 360
aaggagaaga taaagtcaaa atggccgaga atcagtctat caaagtgaag gaattgtctg 420
aatcttgttc aagtctacat gaactagctg ctaataatga ccttattggc tttaagaaag 480
caatggagga agaagggtca aagatagatg aggttaactt ttggtacggg aggcagaatg 540
gttctaatca gatggtcctg gagcaaagga ctccattgat ggttgctgca ctttatggca 600
gtgtagatgc gctgagttac atcttatcca tttatgtaac ttgtggagca gatgttaacc 660
aagcctgtgg gtcagataac tccactgcct tgcattgtgc ggctgtggga gggtctgcct 720
gtgcagttga aactgtaaaa ttgttacttc atgcaggcag tgatgtgaat cgcttggatg 780
cttatggcag aagaccagca gatgtgatta tggtttctcc taagctaacc gaaatcaagg 840
ccaagctaga agaaatgtta aacgcagctg gttcatgtca aacttctccg gcaaagttgc 900
ctaacatagt ttcagggcca cctgggtttg agtcaaaggg gatggagtcc atgtccccat 960
tgccattgtt gcctctttca ttgtctttag aagcatccaa taatagatca ggttgtgtga 1020
attctccaac atcttcgcca aagtccatgg aagcattaaa gggtttcggt gatgttaatg 1080
agaagaagga atatcctgtg gacccttctt ttccagacat aaagaatagc atctatacta 1140
cagatgaatt tcggatgttt tccttcaagg tgcggccatg ttcacgggca tattctcatg 1200
attggactga atgcccattt gtgcatcctg gtgaaaatgc cagaaggcgg gatccaagaa 1260
ggtatcatta tagctgtgtt ccttgcccag attttcggaa agggacttgt aggcgcagtg 1320
atgtttgtga atatgcacac ggtgtttttg agtgctggtt acatcctgct caatatagga 1380
cacggttgtg caaagatggg actaattgtt cacgtagagt ttgcttcttt gctcacacat 1440
ctgaggaact acgccctctc attgtctcta ctgggtctgc tgttccatcc ccaagggcat 1500
catcatctct ggacatgaca tctgtcatga gtcctcttgc ccctggttct ccctcttcag 1560
tttcaatgat gtcacccttc ctatcaaatc ctcagcaagg cagtgtgctt actccgccta 1620
tgtctccatc agcgtcctct gtaaatggat atggaggctg gccacagcct aatgtaccaa 1680
ccttacacct tcctggtagc aatgttcaaa ccagccgtct tagagcggaa cttaatgcca 1740
gagacatgcc tgttgaggat tctcctcgaa tttcagacta tgaagggcag caactcctga 1800
atgatttttc tccactgtcc acacaagcca ggctgaatgc tgctgctgct gttatatctg 1860
gtggcgggaa caccacaaca aggtctggaa aatacaagag tcacgggatc aatactgttg 1920
ctccaacgaa tcttgaagac ttgtttgcct ccgaggtaac atctcctaga gtagcagttc 1980
ttgaaccttc catcttttct cagatgagtc cccaaatgca agctcataag actgcccagg 2040
catatatgca gattcaaaac cagatgctgc ctcctataaa tacacaggca ttttcgcagg 2100
gaattacaca gatgcagcag gctgcaatag agcctcagag ccctggacat tctttgatgc 2160
aatcaccttt ccaatcttcc tcgtatgggt tgggatcccc tggtagaatg tcacctcgtt 2220
gtgtggatgt ggaacgtcat aatacatgtg ggtctccctt atcaccggct atggctgcaa 2280
cgataaattc aagaatggct atggctgctt ttgttcagag ggaaaaacgg agccatagtt 2340
cccgtgactt gggagctaat gtgaatccca gttcatggtc tgattggggc tcgcctacag 2400
gtaaagttga ctggggggtt caaggagaag agttgagcaa attaagaaag tcggcttcat 2460
ttggtccccg cagttatgaa gaaccggatt tgtcttgggt tcaaacactg gtaaaggaaa 2520
ctacaccaga gggtaaagat ggaggaaatg taagctgttc tggggaaact ccacacaagg 2580
ggcaaataga aaatgttgat cattcagttt tgggtgcctg gattgaacag atgcagcttg 2640
atcagattgt agcttgagat taggattatt tatttggagt ggtggtaggg ataggctcat 2700
ttaaaattca atttctcatt ttttactatt tcttttataa aaattcccca ttatagttta 2760
ggaaatagtc tggttttcta cctattatca gaattacacc tgcaggaaat tttggaggaa 2820
agcatgcaaa aagtagatag ggatgttatt cctatcagca ggttgacaag ctgaaaatca 2880
cttgggtggt agaccagaga atgacactat tttttgttga catggcaact gaagatgctg 2940
ttttctttac ttatcattaa caaccctata tatatttgtt ttgaaagaac tgagcggaga 3000
aatgttgtca gttggttact ctgcgcaagg ccttggaaga aatccaagat gtggcatctt 3060
ggtgcatttt taatttatca agtgtgaaat ccataacagg tttcagtgag tgacttctga 3120
ggttgtatat ggaaaaacct atgatgttgg ctgtctactg ctatttttct gtgcctaaac 3180
tgtcaactaa agtttgcagg tggcaatttt gtggcagcat atttgcacat tgaagcggat 3240
ggtctgcacc tgctatagaa gttttcgagt ctgtagaatt tgatggtgca agatgatttt 3300
ctagttgata tatttggaag gctttgccaa agtagtggca tgtacatttt gcaaaaattt 3360
aaaggatggc aatccattgt tttgccatgt agcttcactt tattgattag gtggaaagga 3420
attttgagac acttcaattt gtgcatactt ttgttctgaa ctgcaaaatc agtctcttgt 3480
gatgtcctca aggctattat gctcagggat ttgcctaaaa ccataagtgg ccttagataa 3540
ggtaccattg tattaccttt tattgtttgg atattttatt tatgaaagtg aatttatttt 3600
aaaaaaaaaa 3610
<210>43
<211>749
<212>PRT
<213>辐射松
<400>43
Met Lys Glu Met Ala Glu Tyr Cys Ser Pro Ala Leu Leu Glu Leu Ala
1 5 10 15
Ala Asn Asn Asp Leu Ser Gly Phe Lys Gln Ala Val Glu Glu Gly Gly
20 25 30
Ser Ser Val Asn Glu Arg Gly Leu Trp Tyr Gly Arg Gln Ile Gly Ser
35 40 45
Gly Gln Lys Met Val Leu Glu Gln Arg Thr Pro Leu Met Val Ala Ala
50 55 60
Leu Tyr Gly Ser Leu Asp Val Leu Ser Tyr Met Leu Ser Gly Gly Arg
65 70 75 80
Val Asp Val Asn Gln Ser Cys Gly Ser Asp Met Ser Thr Ala Leu His
85 90 95
Cys Ala Ala Ala Gly Gly Ser Ile Leu Ala Ile Glu Thr Val Gly Met
100 105 110
Leu Ile Lys Ala Gly Ala Asp Val Asn Phe Met Asn Ala Gly Gly Arg
115 120 125
Lys Pro Ala Asp Val Ile Met Val Ser Pro Lys Leu Ala His Phe Lys
130 135 140
Asn Val Leu Glu Asp Leu Leu Ile Met Gly Ser Asn Ser Pro Met Lys
145 150 155 160
Ile Pro Cys Arg Val Ser Gly Ser Gly Phe Tyr Leu Pro Glu Gly Gly
165 170 175
Gly Cys Phe Phe Asp Glu His Gly Cys Val Val Ser Val Pro Thr Ser
180 185 190
Ser Pro Leu Phe Ser Ser Pro Asp Ala Thr Ser Pro Ala Thr Val Asn
195 200 205
Ser Pro Leu Ser Ser Pro Pro Thr Ser Leu Asp Thr Pro Lys Asn Leu
210 215 220
Cys Asp Cys Gly Gln Lys Lys Glu Phe Ala Val Asp Ser Ser Leu Pro
225 230 235 240
Asp Ile Lys Asn Ser Ile Tyr Ser Thr Asp Glu Phe Arg Met Tyr Ser
245 250 255
Phe Lys Val Arg Pro Cys Ser Arg Ala Tyr Ser His Asp Trp Thr Glu
260 265 270
Cys Pro Phe Val His Pro Gly Glu Asn Ala Arg Arg Arg Asp Pro Arg
275 280 285
Lys Tyr His Tyr Ser Cys Val Pro Cys Pro Asp Phe Arg Lys Gly Ala
290 295 300
Cys Arg Arg Gly Asp Val Cys Glu Tyr Ala His Gly Val Phe Glu Cys
305 310 315 320
Trp Leu His Pro Ala Gln Tyr Arg Thr Arg Leu Cys Lys Asp Gly Thr
325 330 335
Asn Cys Ser Arg Arg Val Cys Phe Phe Ala His Thr Pro Glu Glu Leu
340 345 350
Arg Pro Leu Tyr Pro Pro Ala Cys Ser Ser Met Leu Ser Gln Arg Thr
355 360 365
Thr Met Thr Ser Ser Asp Lys Met Ala Val Met His Pro Leu Ala Pro
370 375 380
Gly Ser Ala Ser Ser Val Leu Met Met Ser Ser Ser Asn Ser Ser Gln
385 390 395 400
Ser Ser Phe Pro Asn Ser Pro Val Ser Pro Leu Ser Ser Ala Asn Thr
405 410 415
Ser Ser His Ser Ser Phe Gly Gly Gly Ser Trp Ala His Pro Asn Leu
420 425 430
Pro Thr Leu His Leu Ser Asn Gly Ala Leu Gln Ala Ser Arg Leu Arg
435 440 445
Thr Ala Val Asn Ala Arg Asp Met His Pro Asp Cys Ser Ile Glu Ser
450 455 460
Gly Asp Tyr Glu Gly Gln Leu Leu Asn Glu Phe Ala Tyr Leu Ser Thr
465 470 475 480
Gln Ala Arg Gly Asn Gly Pro Met Ala Thr Val Ser Ser Ser Gly Asn
485 490 495
Thr Pro Cys Arg Pro Arg Lys Phe Arg Ala His Asn Val Ala Pro Thr
500 505 510
Asn Leu Glu Asp Leu Phe Ala Ser Glu Val Phe Ser Pro Lys Met Thr
515 520 525
Ala Ser Glu Ser Ala Phe Leu Ser Glu Ile Gln Ser His Lys Ser Ala
530 535 540
Gln Leu Ser Pro Gln Leu Gln Ser Gln Met Leu Ser Ser Phe Asn Thr
545 550 555 560
Gln Val Tyr Pro Gln Gly Ser Thr Gln Gly Gln Met His Met Gln His
565 570 575
Gly Gly Val Asp Cys Gln Ser Pro Ser Val Phe Leu Ser Pro Pro Pro
580 585 590
Val Gln Leu Ala Ser Tyr Ser Leu Ser Ser Leu Gly Pro Leu Ser Ser
595 600 605
Leu Thr Gly Glu Leu Glu Arg Gln Asn Ser Asn Gly Ser Pro Leu Ser
610 615 620
Pro Ile Met Ser Thr Ala Ala Asp Ser Arg Ala Val Ala Phe Ser Gln
625 630 635 640
Arg Asp Lys Gly Ser Ser Arg Ser Gly Asp Leu Gly Gly Ala Thr Thr
645 650 655
Trp Ser Glu Trp Gly Ser Pro Thr Gly Lys Val Asn Trp Gly Ile Arg
660 665 670
Gly Glu Glu Leu Gln Lys Phe Arg Lys Ser Ala Ser Phe Gly Ile Arg
675 680 685
Ser Ser Asp Glu Pro Asp Leu Ser Trp Val Gln Lys Leu Phe Lys Glu
690 695 700
Ala Pro Met Glu Ser Met Asp Arg Gly Thr Met Gly Arg Ser Met Asp
705 710 715 720
Ile Ala Asn Ser Val Gln Met Glu Ala Thr Asp Leu Gly Gly Trp Ile
725 730 735
Ser Gln Ile Asn Pro Asp Gln Val Ala Pro Leu Thr Leu
740 745
<210>44
<211>711
<212>PRT
<213>大豆(Glycine max)
<400>44
Lys Ser Ala Asn Asp Lys Glu Met Lys Ser Leu Thr Val Asn Thr Glu
1 5 10 15
Asp Ser Phe Ser Ser Leu Leu Glu Leu Ala Ser Asn Asn Asp Ile Glu
20 25 30
Gly Phe Lys Val Leu Leu Glu Lys Asp Ser Ser Ser Ile Asn Glu Val
35 40 45
Gly Leu Trp Tyr Gly Arg Gln Asn Gly Ser Lys Gln Phe Val Leu Glu
50 55 60
His Arg Thr Pro Leu Met Val Ala Ala Thr Tyr Gly Ser Ile Asp Val
65 70 75 80
Met Lys Ile Ile Leu Leu Cys Pro Glu Ala Asp Val Asn Phe Ala Cys
85 90 95
Gly Ala Asn Lys Thr Thr Ala Leu His Cys Ala Ala Ser Gly Gly Ser
100 105 110
Ala Asn Ala Val Asp Ala Val Lys Ile Leu Leu Ser Ala Gly Ala Asp
115 120 125
Val Asn Gly Val Asp Ala Asn Gly Asn Arg Pro Ile Asp Val Ile Ala
130 135 140
Val Pro Pro Lys Leu Gln Gly Ala Lys Ala Val Leu Glu Glu Leu Leu
145 150 155 160
Ser Asp Ser Ala Ser Glu Gly Ser Ile Gly Glu Phe Ser Val Pro Val
165 170 175
Ser Val Asn Thr Ser Ser Leu Gly Ser Pro Gly His Ser Ser Asn Gly
180 185 190
Met Pro Tyr Thr Pro Ser Ser Ser Pro Pro Ser Pro Val Val Ala Lys
195 200 205
Phe Thr Asp Ala Ala Val Cys Ser Leu Ser Glu Lys Lys Glu Tyr Pro
210 215 220
Ile Asp Pro Ser Leu Pro Asp Ile Lys Asn Ser Ile Tyr Ala Thr Asp
225 230 235 240
Glu Phe Arg Met Phe Ser Phe Lys Val Arg Pro Cys Ser Arg Ala Tyr
245 250 255
Ser His Asp Trp Thr Glu Cys Pro Phe Val His Pro Gly Glu Asn Ala
260 265 270
Arg Arg Arg Asp Pro Arg Lys Phe His Tyr Ser Cys Val Pro Cys Pro
275 280 285
Asp Phe Arg Lys Gly Ala Cys Arg Arg Gly Asp Met Cys Glu Tyr Ala
290 295 300
His Gly Val Phe Glu Cys Trp Leu His Pro Ala Gln Tyr Arg Thr Arg
305 310 315 320
Leu Cys Lys Asp Gly Thr Ser Cys Asn Arg Arg Val Cys Phe Phe Ala
325 330 335
His Thr Ala Glu Glu Leu Arg Pro Leu Tyr Val Ser Thr Gly Ser Ala
340 345 350
Val Pro Ser Pro Arg Ser Ser Ala Ser Ala Pro Asn Val Met Asp Met
355 360 365
Ala Ala Ala Met Ser Leu Leu Pro Gly Ser Pro Ser Ser Val Ser Ser
370 375 380
Met Ser Pro Ser His Phe Gly Gln Pro Met Ser Pro Ser Ala Asn Gly
385 390 395 400
Met Ser Leu Ser Ser Ala Trp Ala Gln Pro Asn Val Ser Ala Leu His
405 410 415
Leu Pro Gly Ser Asn Leu Gln Ser Ser Arg Leu Arg Ser Ser Leu Ser
420 425 430
Ala Arg Asp Met Pro Pro Asp Asp Leu Asn Met Met Ser Asp Leu Asp
435 440 445
Gly Gln Gln Gln His Pro Leu Asn Asp Leu Ser Cys Tyr Leu Gln Pro
450 455 460
Arg Pro Gly Ala Gly Ser Val Ser Arg Ser Gly Arg Ser Lys Ile Leu
465 470 475 480
Thr Pro Ser Asn Leu Glu Asp Leu Phe Ser Ala Glu Ile Ser Ser Ser
485 490 495
Pro Arg Tyr Ser Asp Pro Ala Ala Gly Ser Val Phe Ser Pro Thr His
500 505 510
Lys Ser Ala Val Leu Asn Gln Phe Gln Gln Leu Gln Ser Met Leu Ser
515 520 525
Pro Ile Asn Thr Asn Leu Leu Ser Pro Lys Asn Val Glu His Pro Leu
530 535 540
Leu Gln Ala Ser Phe Gly Val Ser Pro Ser Gly Arg Met Ser Pro Arg
545 550 555 560
Ser Val Glu Pro Ile Ser Pro Met Ser Ser Arg Ile Ser Ala Phe Ala
565 570 575
Gln Arg Glu Lys Gln Gln Gln Gln Gln Gln Gln Leu Arg Ser Leu Ser
580 585 590
Ser Arg Asp Leu Gly Ala Asn Ser Pro Ala Ser Leu Val Gly Ser Pro
595 600 605
Ala Asn Pro Trp Ser Lys Trp Gly Ser Pro Asn Gly Lys Ala Asp Trp
610 615 620
Ser Val Asn Gly Asp Thr Leu Gly Arg Gln Met Arg Arg Ser Ser Ser
625 630 635 640
Phe Glu Leu Lys Asn Asn Gly Glu Glu Pro Asp Leu Ser Trp Val Gln
645 650 655
Ser Leu Val Lys Glu Ser Pro Pro Glu Met Ile Lys Glu Lys Phe Ala
660 665 670
Ser Pro Met Pro Thr Ala Ser Ala Asp Gly Pro Asn Ser Asn Ser Gln
675 680 685
Ile Glu Ser Ile Asp His Ser Val Leu Gly Ala Trp Leu Glu Gln Met
690 695 700
Gln Leu Asp Gln Leu Val Val
705 710
<210>45
<211>643
<212>PRT
<213>大豆
<400>45
Arg Gly Ser Gly Phe Pro Gly Arg Pro Thr Arg Pro Arg Ser Gly Arg
1 5 10 15
Thr Arg Gly Arg Thr Arg Gly Val Asn Phe Ala Cys Gly Ala Asn Lys
20 25 30
Thr Thr Ala Leu His Cys Ala Ala Ser Gly Ala Ser Thr Lys Ala Val
35 40 45
Asp Ala Val Lys Leu Leu Leu Ser Ala Gly Ala Asp Val Asn Cys Val
50 55 60
Asp Ala Asn Gly Asn Arg Pro Ile Asp Val Ile Ala Val Pro Pro Lys
65 70 75 80
Leu Gln Gly Ala Lys Ala Val Leu Glu Glu Leu Leu Ser Asp Asn Ala
85 90 95
Ser Asp Val Ser Val Gly Glu Phe Ser Val Pro Val Ser Val Asn Ser
100 105 110
Ser Ser Pro Gly Ser Pro Ala His Ser Ser Asn Gly Met Pro Tyr Thr
115 120 125
Pro Ser Val Ser Pro Pro Ser Pro Val Ala Ala Lys Phe Thr Asp Ala
130 135 140
Ala Ile Cys Ser Leu Ser Glu Lys Ala Arg Glu Tyr Pro Ile Asp Pro
145 150 155 160
Ser Leu Pro Asp Ile Lys Asn Ser Ile Tyr Ala Thr Asp Glu Phe Arg
165 170 175
Met Phe Ser Phe Lys Val Arg Pro Cys Ser Arg Ala Tyr Ser His Asp
180 185 190
Trp Thr Glu Cys Pro Phe Val His Pro Gly Glu Asn Ala Arg Arg Arg
195 200 205
Asp Pro Arg Lys Phe His Tyr Ser Cys Val Pro Cys Pro Asp Phe Arg
210 215 220
Lys Gly Ala Cys Arg Arg Gly Asp Met Cys Glu Tyr Ala His Gly Val
225 230 235 240
Phe Glu Cys Trp Leu His Pro Ala Gln Tyr Arg Thr Arg Leu Cys Lys
245 250 255
Asp Gly Thr Ser Cys Asn Arg Arg Val Cys Phe Phe Ala His Thr Ala
260 265 270
Glu Glu Leu Arg Pro Leu Tyr Val Ser Thr Gly Ser Ala Ala Pro Ser
275 280 285
Pro Arg Ser Ser Ala Ser Gly Pro Asn Val Met Asp Met Ala Ala Ala
290 295 300
Met Ser Leu Phe Pro Gly Ser Pro Ser Ser Gly Ser Ser Ile Ser Leu
305 310 315 320
Ser Ile Ser Phe Ser Leu Asp Pro Met Ser Pro Ser Ala Asn Gly Met
325 330 335
Pro Leu Ser Ser Ala Trp Ala Gln Pro Asn Val Pro Ala Leu His Leu
340 345 350
Pro Gly Ser Asn Leu Gln Ser Ser Arg Leu Arg Ser Ser Leu Ser Ala
355 360 365
Arg Asp Ile Pro Pro Glu Asp Leu Asn Met Met Ser Asp Leu Asp Gly
370 375 380
Gln Gln Gln His His Leu Asn Asp Leu Ser Cys Tyr Ile Gln Pro Arg
385 390 395 400
Pro Gly Ala Ser Ser Val Ser Arg Ser Gly Arg Ser Lys Thr Leu Thr
405 410 415
Pro Ser Asn Leu Glu Glu Leu Phe Ser Ala Glu Ile Ser Leu Ser Pro
420 425 430
Arg Tyr Ser Asp Pro Ala Ala Gly Ser Val Phe Ser Pro Thr His Lys
435 440 445
Ser Ala Val Leu Asn Gln Phe Gln Gln Leu Gln Ser Met Leu Ser Pro
450 455 460
Ile Asn Thr Asn Leu Leu Ser Pro Lys Asn Val Glu His Pro Leu Phe
465 470 475 480
Gln Ala Ser Phe Gly Val Ser Pro Ser Gly Arg Met Ser Pro Arg Ser
485 490 495
Val Glu Pro Ile Ser Pro Met Ser Ala Arg Leu Ser Ala Phe Ala Gln
500 505 510
Arg Glu Lys Gln Gln Gln Gln Leu Arg Ser Val Ser Ser Arg Asp Leu
515 520 525
Gly Ala Asn Ser Pro Ala Ser Leu Val Gly Ser Pro Ala Asn Pro Trp
530 535 540
Ser Lys Trp Gly Ser Pro Ile Gly Lys Ala Asp Trp Ser Val Asn Gly
545 550 555 560
Asp Ser Leu Gly Arg Gln Met Arg Arg Ser Ser Ser Phe Glu Arg Lys
565 570 575
Asn Asn Gly Glu Glu Pro Asp Leu Ser Trp Val Gln Ser Leu Val Lys
580 585 590
Glu Ser Pro Pro Glu Met Ile Lys Glu Lys Phe Ala Ser Pro Met Pro
595 600 605
Thr Ala Ser Ala Asp Gly Pro Asn Ser Asn Ser Gln Ile Glu Ser Ile
610 615 620
Asp His Ser Val Leu Gly Ala Trp Leu Glu Gln Met Gln Leu Asp Gln
625 630 635 640
Leu Val Val
<210>46
<211>669
<212>PRT
<213>大豆
<400>46
Ser His Glu Met Asn His Leu Ser Leu Asp Thr Glu Asp Ser Leu Ala
1 5 10 15
Ser Leu Leu Leu Glu Leu Ala Ala Asn Asn Asp Val Ser Gly Phe Lys
20 25 30
Arg Leu Ile Glu Cys Glu Pro Ser Ser Ile Asp Glu Val Gly Leu Trp
35 40 45
Tyr Gly Arg His Lys Glu Ser Lys Lys Met Val Asn Glu Gln Arg Thr
50 55 60
Pro Leu Met Val Ala Ala Thr Tyr Gl y Ser Ile Asp Val Met Thr Leu
65 70 75 80
Ile Leu Ser Leu Ser Glu Ala Asp Val Asn Arg Ser Ser Gly Leu Asp
85 90 95
Lys Ser Thr Ala Leu His Cys Ala Ala Ser Gly Gly Ser Glu Asn Ala
100 105 110
Val Asp Ala Val Lys Leu Leu Leu Glu Ala Gly Ala Asp Arg Asn Ser
115 120 125
Val Asp Ala Asn Gly Arg Arg Pro Gly Asp Val Ile Val Ser Pro Pro
130 135 140
Lys Leu Asp Tyr Val Lys Lys Ser Leu Glu Glu Leu Leu Gly Ser Asp
145 150 155 160
Asp Trp Ser Leu Leu Arg Val Met Arg Ser Thr Cys Asn Gly Cys Ser
165 170 175
Ala Glu Asp Leu Lys Met Lys Thr Asn Glu Val Ser Glu Lys Lys Glu
180 185 190
Tyr Pro Val Asp Leu Ser Leu Pro Asp Ile Lys Asn Ser Ile Tyr Ser
195 200 205
Ser Asp Glu Phe Arg Met Tyr Ser Phe Lys Val Arg Pro Cys Ser Arg
210 215 220
Ala Tyr Ser His Asp Trp Thr Glu Cys Pro Phe Val His Pro Gly Glu
225 230 235 240
Asn Ala Arg Arg Arg Asp Pro Arg Lys Phe His Tyr Ser Cys Val Pro
245 250 255
Cys Pro Glu Phe Arg Lys Gly Ala Cys Arg Arg Gly Asp Met Cys Glu
260 265 270
Tyr Ala His Gly Val Phe Glu Cys Trp Leu His Pro Ala Gln Tyr Arg
275 280 285
Thr Arg Leu Cys Lys Asp Gly Thr Asn Cys Ala Arg Arg Val Cys Phe
290 295 300
Phe Ala His Thr Asn Glu Glu Leu Arg Pro Leu Tyr Val Ser Thr Gly
305 310 315 320
Ser Ala Val Pro Ser Pro Arg Ser Ser Ala Ser Ser Ala Met Asp Phe
325 330 335
Val Ala Ala Ile Ser Pro Ser Ser Met Ser Val Met Ser Pro Ser Pro
340 345 350
Phe Thr Pro Pro Met Ser Pro Ser Ser Ala Ser Ile Ala Trp Pro Gln
355 360 365
Pro Asn Ile Pro Ala Leu His Leu Pro Gly Ser Asn Phe His Ser Ser
370 375 380
Arg Leu Arg Ser Ser Leu Asn Ala Arg Asp Phe Ser Val Asp Asp Phe
385 390 395 400
Asp Leu Leu Leu Pro Asp Tyr Asp His His His His Gln Gln Gln Gln
405 410 415
Gln Gln Phe Leu Asn Glu Leu Ser Cys Leu Ser Pro His Ala Met Asn
420 425 430
Cys Asn Thr Met Asn Arg Ser Gly Arg Met Lys Pro Leu Thr Pro Ser
435 440 445
Asn Leu Asp Asp Leu Phe Ser Ala Glu Ser Ser Ser Pro Arg Tyr Ala
450 455 460
Asp Pro Ala Leu Ala Ser Ala Val Phe Ser Pro Thr His Lys Ser Ala
465 470 475 480
Val Phe Asn Gln Phe Gln His Gln Gln Ser Met Leu Ala Pro Leu Asn
485 490 495
Thr Asn Phe Ala Ser Lys Asn Phe Glu His Pro Leu Leu Gln Ala Ser
500 505 510
Leu Gly Met Ser Pro Arg Asn Val Glu Pro Ile Ser Pro Met Gly Ser
515 520 525
Arg Ile Ser Met Leu Ala Gln Arg Glu Lys Gln Gln Phe Arg Ser Leu
530 535 540
Ser Phe Arg Glu Leu Gly Ser Asn Ser Ala Ala Ala Ser Ala Asp Ser
545 550 555 560
Trp Ser Lys Trp Gly Ser Pro Asn Val Lys Leu Asp Trp Pro Val Gly
565 570 575
Ala Gly Glu Val Gly Lys Leu Arg Arg Ser Ser Ser Phe Glu Leu Gly
580 585 590
Asn Asn Gly Glu Glu Pro Asp Leu Ser Trp Val Gln Ser Leu Val Lys
595 600 605
Glu Ser Pro Ala Glu Val Lys Asp Lys Leu Ala Thr Thr Val Ser Tyr
610 615 620
Val Ala Ala Ala Ala Ala Gly Ser Ser Ser Glu Gly Ser Asn Ile Ser
625 630 635 640
Thr Gln Met Glu Ser Val Val Asp His Ala Val Leu Gly Ala Trp Leu
645 650 655
Glu Gln Met Gln Leu Asp His Leu Val Ala Gln Gln Asn
660 665
<210>47
<211>580
<212>PRT
<213>拟南芥
<400>47
Met Cys Ser Gly Pro Lys Ser Asn Leu Cys Ser Ser Arg Thr Leu Thr
1 5 10 15
Glu Ile Glu Ser Arg Gln Lys Glu Glu Glu Thr Met Leu Leu Leu Glu
20 25 30
Phe Ala Ala Cys Asp Asp Leu Asp Ser Phe Lys Arg Glu Val Glu Glu
35 40 45
Lys Gly Leu Asp Leu Asp Glu Ser Gly Leu Trp Tyr Cys Arg Arg Val
50 55 60
Gly Ser Lys Lys Met Gly Leu Glu Glu Arg Thr Pro Leu Met Val Ala
65 70 75 80
Ala Met Tyr Gly Ser Ile Lys Val Leu Thr Phe Ile Val Ser Thr Gly
85 90 95
Lys Ser Asp Val Asn Arg Ala Cys Gly Glu Glu Arg Val Thr Pro Leu
100 105 110
His Cys Ala Val Ala Gly Cys Ser Val Asn Met Ile Glu Val Ile Asn
115 120 125
Val Leu Leu Asp Ala Ser Ala Leu Val Asn Ser Val Asp Ala Asn Gly
130 135 140
Asn Gln Pro Leu Asp Val Phe Val Arg Val Ser Arg Phe Val Ala Ser
145 150 155 160
Pro Arg Arg Lys Ala Val Glu Leu Leu Leu Arg Gly Gly Gly Val Gly
165 170 175
Gly Leu Ile Asp Glu Ala Val Glu Glu Glu Ile Lys Ile Val Ser Lys
180 185 190
Tyr Pro Ala Asp Ala Ser Leu Pro Asp Ile Asn Glu Gly Val Tyr Gly
195 200 205
Ser Asp Glu Phe Arg Met Tyr Ser Phe Lys Val Lys Pro Cys Ser Arg
210 215 220
Ala Tyr Ser His Asp Trp Thr Glu Cys Ala Phe Val His Pro Gly Glu
225 230 235 240
Asn Ala Arg Arg Arg Asp Pro Arg Lys Tyr Pro Tyr Thr Cys Val Pro
245 250 255
Cys Pro Glu Phe Arg Lys Gly Ser Cys Pro Lys Gly Asp Ser Cys Glu
260 265 270
Tyr Ala His Gly Val Phe Glu Ser Trp Leu His Pro Ala Gln Tyr Lys
275 280 285
Thr Arg Leu Cys Lys Asp Glu Thr Gly Cys Ala Arg Lys Val Cys Phe
290 295 300
Phe Ala His Lys Arg Glu Glu Met Arg Pro Val Asn Ala Ser Thr Gly
305 310 315 320
Ser Ala Val Ala Gln Ser Pro Phe Ser Ser Leu Glu Met Met Pro Gly
325 330 335
Leu Ser Pro Leu Ala Tyr Ser Ser Gly Val Ser Thr Pro Pro Val Ser
340 345 350
Pro Met Ala Asn Gly Val Pro Ser Ser Pro Arg Asn Gly Gly Ser Trp
355 360 365
Gln Asn Arg Val Asn Thr Leu Thr Pro Pro Ala Leu Gln Leu Asn Gly
370 375 380
Gly Ser Arg Leu Lys Ser Thr Leu Ser Ala Arg Asp Ile Asp Met Glu
385 390 395 400
Met Glu Met Glu Leu Arg Leu Arg Gly Phe Gly Asn Asn Val Glu Glu
405 410 415
Thr Phe Gly Ser Tyr Val Ser Ser Pro Ser Arg Asn Ser Gln Met Gly
420 425 430
Gln Asn Met Asn Gln His Tyr Pro Ser Ser Pro Val Arg Gln Pro Pro
435 440 445
Ser Gln His Gly Phe Glu Ser Ser Ala Ala Ala Ala Val Ala Val Met
450 455 460
Lys Ala Arg Ser Thr Ala Phe Ala Lys Arg Ser Leu Ser Phe Lys Pro
465 470 475 480
Ala Thr Gln Ala Ala Pro Gln Ser Asn Leu Ser Asp Trp Gly Ser Pro
485 490 495
Asn Gly Lys Leu Glu Trp Gly Met Lys Gly Glu Glu Leu Asn Lys Met
500 505 510
Arg Arg Ser Val Ser Phe Gly Ile His Gly Asn Asn Asn Asn Asn Ala
515 520 525
Ala Arg Asp Tyr Arg Asp Glu Pro Asp Val Ser Trp Val Asn Ser Leu
530 535 540
Val Lys Asp Ser Thr Val Val Ser Glu Arg Ser Phe Gly Met Asn Glu
545 550 555 560
Arg Val Arg Ile Met Ser Trp Ala Glu Gln Met Tyr Arg Glu Lys Glu
565 570 575
Gln Thr Val Val
580
<210>48
<211>719
<212>PRT
<213>拟南芥
<400>48
Met Cys Cys Gly Ser Asp Arg Leu Asn Gln Ile Val Ser Ser Arg Ser
1 5 10 15
Ser Leu Pro Ile Ser Phe Glu Glu Asp Asn Asn Leu Val Thr Asn Thr
20 25 30
Asp Met Asn His Ile Thr Val Glu Thr Glu Asp Thr Phe Ala Ser Leu
35 40 45
Leu Glu Leu Ala Ala Asn Asn Asp Val Glu Gly Val Arg Leu Ser Ile
50 55 60
Glu Arg Asp Pro Ser Cys Val Asp Glu Ala Gly Leu Trp Tyr Gly Arg
65 70 75 80
Gln Lys Gly Ser Lys Ala Met Val Asn Asp Tyr Arg Thr Pro Leu Met
85 90 95
Val Ala Ala Thr Tyr Gly Ser Ile Asp Val Ile Lys Leu Ile Val Ser
100 105 110
Leu Thr Asp Ala Asp Val Asn Arg Ala Cys Gly Asn Asp Gln Thr Thr
115 120 125
Ala Leu His Cys Ala Ala Ser Gly Gly Ala Val Asn Ala Ile Gln Val
130 135 140
Val Lys Leu Leu Leu Ala Ala Gly Ala Asp Leu Asn Leu Leu Asp Ala
145 150 155 160
Glu Gly Gln Arg Ala Gly Asp Val Ile Val Val Pro Pro Lys Leu Glu
165 170 175
Gly Val Lys Leu Met Leu Gln Glu Leu Leu Ser Ala Asp Gly Ser Ser
180 185 190
Thr Ala Glu Arg Asn Leu Arg Val Val Thr Asn ValPro Asn Arg Ser
195 200 205
Ser Ser Pro Cys His Ser Pro Thr Gly Glu Asn Gly Gly Ser Gly Ser
210 215 220
Gly Ser Pro Leu Gly Ser Pro Phe Lys Leu Lys Ser Thr Glu Phe Lys
225 230 235 240
Lys Glu Tyr Pro Val Asp Pro Ser Leu Pro Asp Ile Lys Asn Ser Ile
245 250 255
Tyr Ala Thr Asp Glu Phe Arg Met Tyr Ser Phe Lys Val Arg Pro Cys
260 265 270
Ser Arg Ala Tyr Ser His Asp Trp Thr Glu Cys Pro Phe Val His Pro
275 280 285
Gly Glu Asn Ala Arg Arg Arg Asp Pro Arg Lys Phe His Tyr Ser Cys
290 295 300
Val Pro Cys Pro Asp Phe Arg Lys Gly Ala Cys Arg Arg Gly Asp Met
305 310 315 320
Cys Glu Tyr Ala His Gly Val Phe Glu Cys Trp Leu His Pro Ala Gln
325 330 335
Tyr Arg Thr Arg Leu Cys Lys Asp Gly Thr Gly Cys Ala Arg Arg Val
340 345 350
Cys Phe Phe Ala His Thr Pro Glu Glu Leu Arg Pro Leu Tyr Ala Ser
355 360 365
Thr Gly Ser Ala Val Pro Ser Pro Arg Ser Asn Ala Asp Tyr Ala Ala
370 375 380
Ala Leu Ser Leu Leu Pro Gly Ser Pro Ser Gly Val Ser Val Met Ser
385 390 395 400
Pro Leu Ser Pro Ser Ala Ala Gly Asn Gly Met Ser His Ser Asn Met
405 410 415
Ala Trp Pro Gln Pro Asn Val Pro Ala Leu His Leu Pro Gly Ser Asn
420 425 430
Leu Gln Ser Ser Arg Leu Arg Ser Ser Leu Asn Ala Arg Asp Ile Pro
435 440 445
Thr Asp Glu Phe Asn Met Leu Ala Asp Tyr Glu Gln Gln Gln Leu Leu
450 455 460
Asn Glu Tyr Ser Asn Ala Leu Ser Arg Ser Gly Arg Met Lys Ser Met
465 470 475 480
Pro Pro Ser Asn Leu Glu Asp Leu Phe Ser Ala Glu Gly Ser Ser Ser
485 490 495
Pro Arg Phe Thr Asp Ser Ala Leu Ala Ser Ala Val Phe Ser Pro Thr
500 505 510
His Lys Ser Ala Val Phe Asn Gln Phe Gln Gln Gln Gln Gln Gln Gln
515 520 525
Gln Gln Gln Ser Met Leu Ser Pro Ile Asn Thr Ser Phe Ser Ser Pro
530 535 540
Lys Ser Val Asp His Ser Leu Phe Ser Gly Gly Gly Arg Met Ser Pro
545 550 555 560
Arg Asn Val Val Glu Pro Ile Ser Pro Met Ser Ala Arg Val Ser Met
565 570 575
Leu Ala Gln Cys Val Lys Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln
580 585 590
Gln Gln Gln His Gln Phe Arg Ser Leu Ser Ser Arg Glu Leu Arg Thr
595 600 605
Asn Ser Ser Pro Ile Val Gly Ser Pro Val Asn Asn Asn Thr Trp Ser
610 615 620
Ser Lys Trp Gly Ser Ser Asn Gly Gln Pro Asp Trp Gly Met Ser Ser
625 630 635 640
Glu Ala Leu Gly Lys Leu Arg Ser Ser Ser Ser Phe Asp Gly Asp Glu
645 650 655
Pro Asp Val Ser Trp Val Gln Ser Leu Val Lys Glu Thr Pro Ala Glu
660 665 670
Ala Lys Glu Lys Ala Ala Thr Ser Ser Ser Gly Glu His Val Met Lys
675 680 685
Gln Pro Asn Pro Val Glu Pro Val Met Asp His Ala Gly Leu Glu Ala
690 695 700
Trp Ile Glu Gln Met Gln Leu Asp Gln Leu Val Ala Gln Gln Asn
705 710 715
<210>49
<211>686
<212>PRT
<213>拟南芥
<400>49
Met Asn His Ile Thr Val Glu Thr Glu Asp Thr Phe Ala Ser Leu Leu
1 5 10 15
Glu Leu Ala Ala Asn Asn Asp Val Glu Gly Val Arg Leu Ser Ile Glu
20 25 30
Arg Asp Pro Ser Cys Val Asp Glu Ala Gly Leu Trp Tyr Gly Arg Gln
35 40 45
Lys Gly Ser Lys Ala Met Val Asn Asp Tyr Arg Thr Pro Leu Met Val
50 55 60
Ala Ala Thr Tyr Gly Ser Ile Asp Val Ile Lys Leu Ile Val Ser Leu
65 70 75 80
Thr Asp Ala Asp Val Asn Arg Ala Cys Gly Asn Asp Gln Thr Thr Ala
85 90 95
Leu His Cys Ala Ala Ser Gly Gly Ala Val Asn Ala Ile Gln Val Val
100 105 110
Lys Leu Leu Leu Ala Ala Gly Ala Asp Leu Asn Leu Leu Asp Ala Glu
115 120 125
Gly Gln Arg Ala Gly Asp Val Ile Val Val Pro Pro Lys Leu Glu Gly
130 135 140
Val Lys Leu Met Leu Gln Glu Leu Leu Ser Ala Asp Gly Ser Ser Thr
145 150 155 160
Ala Glu Arg Asn Leu Arg Val Val Thr Asn Val Pro Asn Arg Ser Ser
165 170 175
Ser Pro Cys His Ser Pro Thr Gly Glu Asn Gly Gly Ser Gly Ser Gly
180 185 190
Ser Pro Leu Gly Ser Pro Phe Lys Leu Lys Ser Thr Glu Phe Lys Lys
195 200 205
Glu Tyr Pro Val Asp Pro Ser Leu Pro Asp Ile Lys Asn Ser Ile Tyr
210 215 220
Ala Thr Asp Glu Phe Arg Met Tyr Ser Phe Lys Val Arg Pro Cys Ser
225 230 235 240
Arg Ala Tyr Ser His Asp Trp Thr Glu Cys Pro Phe Val His Pro Gly
245 250 255
Glu Asn Ala Arg Arg Arg Asp Pro Arg Lys Phe His Tyr Ser Cys Val
260 265 270
Pro Cys Pro Asp Phe Arg Lys Gly Ala Cys Arg Arg Gly Asp Met Cys
275 280 285
Glu Tyr Ala His Gly Val Phe Glu Cys Trp Leu His Pro Ala Gln Tyr
290 295 300
Arg Thr Arg Leu Cys Lys Asp Gly Thr Gly Cys Ala Arg Arg Val Cys
305 310 315 320
Phe Phe Ala His Thr Pro Glu Glu Leu Arg Pro Leu Tyr Ala Ser Thr
325 330 335
Gly Ser Ala Val Pro Ser Pro Arg Ser Asn Ala Asp Tyr Ala Ala Ala
340 345 350
Leu Ser Leu Leu Pro Gly Ser Pro Ser Gly Val Ser Val Met Ser Pro
355 360 365
Leu Ser Pro Ser Ala Ala Gly Asn Gly Met Ser His Ser Asn Met Ala
370 375 380
Trp Pro Gln Pro Asn Val Pro Ala Leu His Leu Pro Gly Ser Asn Leu
385 390 395 400
Gln Ser Ser Arg Leu Arg Ser Ser Leu Asn Ala Arg Asp Ile Pro Thr
405 410 415
Asp Glu Phe Asn Met Leu Ala Asp Tyr Glu Gln Gln Gln Leu Leu Asn
420 425 430
Glu Tyr Ser Asn Ala Leu Ser Arg Ser Gly Arg Met Lys Ser Met Pro
435 440 445
Pro Ser Asn Leu Glu Asp Leu Phe Ser Ala Glu Gly Ser Ser Ser Pro
450 455 460
Arg Phe Thr Asp Ser Ala Leu Ala Ser Ala Val Phe Ser Pro Thr His
465 470 475 480
Lys Ser Ala Val Phe Asn Gln Phe Gln Gln Gln Gln Gln Gln Gln Gln
485 490 495
Gln Gln Ser Met Leu Ser Pro Ile Asn Thr Ser Phe Ser Ser Pro Lys
500 505 510
Ser Val Asp His Ser Leu Phe Ser Gly Gly Gly Arg Met Ser Pro Arg
515 520 525
Asn Val Val Glu Pro Ile Ser Pro Met Ser Ala Arg Val Ser Met Leu
530 535 540
Ala Gln Cys Val Lys Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln
545 550 555 560
Gln Gln His Gln Phe Arg Ser Leu Ser Ser Arg Glu Leu Arg Thr Asn
565 570 575
Ser Ser Pro Ile Val Gly Ser Pro Val Asn Asn Asn Thr Trp Ser Ser
580 585 590
Lys Trp Gly Ser Ser Asn Gly Gln Pro Asp Trp Gly Met Ser Ser Glu
595 600 605
Ala Leu Gly Lys Leu Arg Ser Ser Ser Ser Phe Asp Gly Asp Glu Pro
610 615 620
Asp Val Ser Trp Val Gln Ser Leu Val Lys Glu Thr Pro Ala Glu Ala
625 630 635 640
Lys Glu Lys Ala Ala Thr Ser Ser Ser Gly Glu His Val Met Lys Gln
645 650 655
Pro Asn Pro Val Glu Pro Val Met Asp His Ala Gly Leu Glu Ala Trp
660 665 670
Ile Glu Gln Met Gln Leu Asp Gln Leu Val Ala Gln Gln Asn
675 680 685
<210>50
<211>633
<212>PRT
<213>拟南芥
<400>50
Met Val Asn Asp Tyr Arg Thr Pro Leu Met Val Ala Ala Thr Tyr Gly
1 5 10 15
Ser Ile Asp Val Ile Lys Leu Ile Val Ser Leu Thr Asp Ala Asp Val
20 25 30
Asn Arg Ala Cys Gly Asn Asp Gln Thr Thr Ala Leu His Cys Ala Ala
35 40 45
Ser Gly Gly Ala Val Asn Ala Ile Gln Val Val Lys Leu Leu Leu Ala
50 55 60
Ala Gly Ala Asp Leu Asn Leu Leu Asp Ala Glu Gly Gln Arg Ala Gly
65 70 75 80
Asp Val Ile Val Val Pro Pro Lys Leu Glu Gly Val Lys Leu Met Leu
85 90 95
Gln Glu Leu Leu Ser Ala Asp Gly Ser Ser Thr Ala Glu Arg Asn Leu
100 105 110
Arg Val Val Thr Asn Val Pro Asn Arg Ser Ser Ser Pro Cys His Ser
115 120 125
Pro Thr Gly Glu Asn Gly Gly Ser Gly Ser Gly Ser Pro Leu Gly Ser
130 135 140
Pro Phe Lys Leu Lys Ser Thr Glu Phe Lys Lys Glu Tyr Pro Val Asp
145 150 155 160
Pro Ser Leu Pro Asp Ile Lys Asn Ser Ile Tyr Ala Thr Asp Glu Phe
165 170 175
Arg Met Tyr Ser Phe Lys Val Arg Pro Cys Ser Arg Ala Tyr Ser His
180 185 190
Asp Trp Thr Glu Cys Pro Phe Val His Pro Gly Glu Asn Ala Arg Arg
195 200 205
Arg Asp Pro Arg Lys Phe His Tyr Ser Cys Val Pro Cys Pro Asp Phe
210 215 220
Arg Lys Gly Ala Cys Arg Arg Gly Asp Met Cys Glu Tyr Ala His Gly
225 230 235 240
Val Phe Glu Cys Trp Leu His Pro Ala Gln Tyr Arg Thr Arg Leu Cys
245 250 255
Lys Asp Gly Thr Gly Cys Ala Arg Arg Val Cys Phe Phe Ala His Thr
260 265 270
Pro Glu Glu Leu Arg Pro Leu Tyr Ala Ser Thr Gly Ser Ala Val Pro
275 280 285
Ser Pro Arg Ser Asn Ala Asp Tyr Ala Ala Ala Leu Ser Leu Leu Pro
290 295 300
Gly Ser Pro Ser Gly Val Ser Val Met Ser Pro Leu Ser Pro Ser Ala
305 310 315 320
Ala Gly Asn Gly Met Ser His Ser Asn Met Ala Trp Pro Gln Pro Asn
325 330 335
Val Pro Ala Leu His Leu Pro Gly Ser Asn Leu Gln Ser Ser Arg Leu
340 345 350
Arg Ser Ser Leu Asn Ala Arg Asp Ile Pro Thr Asp Glu Phe Asn Met
355 360 365
Leu Ala Asp Tyr Glu Gln Gln Gln Leu Leu Asn Glu Tyr Ser Asn Ala
370 375 380
Leu Ser Arg Ser Gly Arg Met Lys Ser Met Pro Pro Ser Asn Leu Glu
385 390 395 400
Asp Leu Phe Ser Ala Glu Gly Ser Ser Ser Pro Arg Phe Thr Asp Ser
405 410 415
Ala Leu Ala Ser Ala Val Phe Ser Pro Thr His Lys Ser Ala Val Phe
420 425 430
Asn Gln Phe Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Ser Met Leu
435 440 445
Ser Pro Ile Asn Thr Ser Phe Ser Ser Pro Lys Ser Val Asp His Ser
450 455 460
Leu Phe Ser Gly Gly Gly Arg Met Ser Pro Arg Asn Val Val Glu Pro
465 470 475 480
Ile Ser Pro Met Ser Ala Arg Val Ser Met Leu Ala Gln Cys Val Lys
485 490 495
Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln His Gln Phe
500 505 510
Arg Ser Leu Ser Ser Arg Glu Leu Arg Thr Asn Ser Ser Pro Ile Val
515 520 525
Gly Ser Pro Val Asn Asn Asn Thr Trp Ser Ser Lys Trp Gly Ser Ser
530 535 540
Asn Gly Gln Pro Asp Trp Gly Met Ser Ser Glu Ala Leu Gly Lys Leu
545 550 555 560
Arg Ser Ser Ser Ser Phe Asp Gly Asp Glu Pro Asp Val Ser Trp Val
565 570 575
Gln Ser Leu Val Lys Glu Thr Pro Ala Glu Ala Lys Glu Lys Ala Ala
580 585 590
Thr Ser Ser Ser Gly Glu His Val Met Lys Gln Pro Asn Pro Val Glu
595 600 605
Pro Val Met Asp His Ala Gly Leu Glu Ala Trp Ile Glu Gln Met Gln
610 615 620
Leu Asp Gln Leu Val Ala Gln Gln Asn
625 630
<210>51
<211>678
<212>PRT
<213>拟南芥
<400>51
Met Asn Asp Ala Ala Glu Trp Glu His Ser Phe Ser Ala Leu Leu Glu
1 5 10 15
Phe Ala Ala Asp Asn Asp Val Glu Gly Phe Arg Arg Gln Leu Ser Asp
20 25 30
Val Ser Cys Ile Asn Gln Met Gly Leu Trp Tyr Arg Arg Gln Arg Phe
35 40 45
Val Arg Arg Met Val Leu Glu Gln Arg Thr Pro Leu Met Val Ala Ser
50 55 60
Leu Tyr Gly Ser Leu Asp Val Val Lys Phe Ile Leu Ser Phe Pro Glu
65 70 75 80
Ala Glu Leu Asn Leu Ser Cys Gly Pro Asp Lys Ser Thr Ala Leu His
85 90 95
Cys Ala Ala Ser Gly Ala Ser Val Asn Ser Leu Asp Val Val Lys Leu
100 105 110
Leu Leu Ser Val Gly Ala Asp Pro Asn Ile Pro Asp Ala His Gly Asn
115 120 125
Arg Pro Val Asp Val Leu Val Val Ser Pro His Ala Pro Gly Leu Arg
130 135 140
Thr Ile Leu Glu Glu Ile Leu Lys Lys Asp Glu Ile Ile Ser Glu Asp
145 150 155 160
Leu His Ala Ser Ser Ser Ser Leu Gly Ser Ser Phe Arg Ser Leu Ser
165 170 175
Ser Ser Pro Asp Asn Gly Ser Ser Leu Leu Ser Leu Asp Ser Val Ser
180 185 190
Ser Pro Thr Lys Pro His Gly Thr Asp Val Thr Phe Ala Ser Glu Lys
195 200 205
Lys Glu Tyr Pro Ile Asp Pro Ser Leu Pro Asp Ile Lys Ser Gly Ile
210 215 220
Tyr Ser Thr Asp Glu Phe Arg Met Phe Ser Phe Lys Ile Arg Pro Cys
225 230 235 240
Ser Arg Ala Tyr Ser His Asp Trp Thr Glu Cys Pro Phe Ala His Pro
245 250 255
Gly Glu Asn Ala Arg Arg Arg Asp Pro Arg Lys Phe His Tyr Thr Cys
260 265 270
Val Pro Cys Pro Asp Phe Lys Lys Gly Ser Cys Lys Gln Gly Asp Met
275 280 285
Cys Glu Tyr Ala His Gly Val Phe Glu Cys Trp Leu His Pro Ala Gln
290 295 300
Tyr Arg Thr Arg Leu Cys Lys Asp Gly Met Gly Cys Asn Arg Arg Val
305 310 315 320
Cys Phe Phe Ala His Ala Asn Glu Glu Leu Arg Pro Leu Tyr Pro Ser
325 330 335
Thr Gly Ser Gly Leu Pro Ser Pro Arg Ala Ser Ser Ala Val Ser Ala
340 345 350
Ser Thr Met Asp Met Ala Ser Val Leu Asn Met Leu Pro Gly Ser Pro
355 360 365
Ser Ala Ala Gln His Ser Phe Thr Pro Pro Ile Ser Pro Ser Gly Asn
370 375 380
Gly Ser Met Pro His Ser Ser Met Gly Trp Pro Gln Gln Asn Ile Pro
385 390 395 400
Ala Leu Asn Leu Pro Gly Ser Asn Ile Gln Leu Ser Arg Leu Arg Ser
405 410 415
Ser Leu Asn Ala Arg Asp Ile Pro Ser Glu Gln Leu Ser Met Leu His
420 425 430
Glu Phe Glu Met Gln Arg Gln Leu Ala Gly Asp Met His Ser Pro Arg
435 440 445
Phe Met Asn His Ser Ala Arg Pro Lys Thr Leu Asn Pro Ser Asn Leu
450 455 460
Glu Glu Leu Phe Ser Ala Glu Val Ala Ser Pro Arg Phe Ser Asp Gln
465 470 475 480
Leu Ala Val Ser Ser Val Leu Ser Pro Ser His Lys Ser Ala Leu Leu
485 490 495
Asn Gln Leu Gln Asn Asn Lys Gln Ser Met Leu Ser Pro Ile Lys Thr
500 505 510
Asn Leu Met Ser Ser Pro Lys Asn Val Glu Gln His Ser Leu Leu Gln
515 520 525
Gln Ala Ser Ser Pro Arg Gly Gly Glu Pro Ile Ser Pro Met Asn Ala
530 535 540
Arg Met Lys Gln Gln Leu His Ser Arg Ser Leu Ser Ser Arg Asp Phe
545 550 555 560
Gly Ser Ser Leu Pro Arg Asp Leu Met Pro Thr Asp Ser Gly Ser Pro
565 570 575
Leu Ser Pro Trp Ser Ser Trp Asp Gln Thr His Gly Ser Lys Val Asp
580 585 590
Trp Ser Val Gln Ser Asp Glu Leu Gly Arg Leu Arg Lys Ser His Ser
595 600 605
Leu Ala Asn Asn Pro Asn Arg Glu Ala Asp Val Ser Trp Ala Gln Gln
610 615 620
Met Leu Lys Asp Ser Ser Ser Pro Arg Asn Gly Asn Arg Val Val Asn
625 630 635 640
Met Asn Gly Ala Arg Pro Leu Thr Gln Gly Gly Ser Ser Val Asn Pro
645 650 655
His Asn Ser Asp Thr Arg Glu Ser Asp Ile Leu Asp Ala Trp Leu Glu
660 665 670
Gln Leu His Leu Asp Arg
675
<210>52
<211>640
<212>PRT
<213>拟南芥
<400>52
Met Gly Leu Trp Tyr Arg Arg Gln Arg Phe Val Arg Arg Met Val Leu
1 5 10 15
Glu Gln Arg Thr Pro Leu Met Val Ala Ser Leu Tyr Gly Ser Leu Asp
20 25 30
Val Val Lys Phe Ile Leu Ser Phe Pro Glu Ala Glu Leu Asn Leu Ser
35 40 45
Cys Gly Pro Asp Lys Ser Thr Ala Leu His Cys Ala Ala Ser Gly Ala
50 55 60
Ser Val Asn Ser Leu Asp Val Val Lys Leu Leu Leu Ser Val Gly Ala
65 70 75 80
Asp Pro Asn Ile Pro Asp Ala His Gly Asn Arg Pro Val Asp Val Leu
85 90 95
Val Val Ser Pro His Ala Pro Gly Leu Arg Thr Ile Leu Glu Glu Ile
100 105 110
Leu Lys Lys Asp Glu Ile Ile Ser Glu Asp Leu His Ala Ser Ser Ser
115 120 125
Ser Leu Gly Ser Ser Phe Arg Ser Leu Ser Ser Ser Pro Asp Asn Gly
130 135 140
Ser Ser Leu Leu Ser Leu Asp Ser Val Ser Ser Pro Thr Lys Pro His
145 150 155 160
Gly Thr Asp Val Thr Phe Ala Ser Glu Lys Lys Glu Tyr Pro Ile Asp
165 170 175
Pro Ser Leu Pro Asp Ile Lys Ser Gly Ile Tyr Ser Thr Asp Glu Phe
180 185 190
Arg Met Phe Ser Phe Lys Ile Arg Pro Cys Ser Arg Ala Tyr Ser His
195 200 205
Asp Trp Thr Glu Cys Pro Phe Ala His Pro Gly Glu Asn Ala Arg Arg
210 215 220
Arg Asp Pro Arg Lys Phe His Tyr Thr Cys Val Pro Cys Pro Asp Phe
225 230 235 240
Lys Lys Gly Ser Cys Lys Gln Gly Asp Met Cys Glu Tyr Ala His Gly
245 250 255
Val Phe Glu Cys Trp Leu His Pro Ala Gln Tyr Arg Thr Arg Leu Cys
260 265 270
Lys Asp Gly Met Gly Cys Asn Arg Arg Val Cys Phe Phe Ala His Ala
275 280 285
Asn Glu Glu Leu Arg Pro Leu Tyr Pro Ser Thr Gly Ser Gly Leu Pro
290 295 300
Ser Pro Arg Ala Ser Ser Ala Val Ser Ala Ser Thr Met Asp Met Ala
305 310 315 320
Ser Val Leu Asn Met Leu Pro Gly Ser Pro Ser Ala Ala Gln His Ser
325 330 335
Phe Thr Pro Pro Ile Ser Pro Ser Gly Asn Gly Ser Met Pro His Ser
340 345 350
Ser Met Gly Trp Pro Gln Gln Asn Ile Pro Ala Leu Asn Leu Pro Gly
355 360 365
Ser Asn Ile Gln Leu Ser Arg Leu Arg Ser Ser Leu Asn Ala Arg Asp
370 375 380
Ile Pro Ser Glu Gln Leu Ser Met Leu His Glu Phe Glu Met Gln Arg
385 390 395 400
Gln Leu Ala Gly Asp Met His Ser Pro Arg Phe Met Asn His Ser Ala
405 410 415
Arg Pro Lys Thr Leu Asn Pro Ser Asn Leu Glu Glu Leu Phe Ser Ala
420 425 430
Glu Val Ala Ser Pro Arg Phe Ser Asp Gln Leu Ala Val Ser Ser Va1
435 440 445
Leu Ser Pro Ser His Lys Ser Ala Leu Leu Asn Gln Leu Gln Asn Asn
450 455 460
Lys Gln Ser Met Leu Ser Pro Ile Lys Thr Asn Leu Met Ser Ser Pro
465 470 475 480
Lys Asn Val Glu Gln His Ser Leu Leu Gln Gln Ala Ser Ser Pro Arg
485 490 495
Gly Gly Glu Pro Ile Ser Pro Met Asn Ala Arg Met Lys Gln Gln Leu
500 505 510
His Ser Arg Ser Leu Ser Ser Arg Asp Phe Gly Ser Ser Leu Pro Arg
515 520 525
Asp Leu Met Pro Thr Asp Ser Gly Ser Pro Leu Ser Pro Trp Ser Ser
530 535 540
Trp Asp Gln Thr His Gly Ser Lys Val Asp Trp Ser Val Gln Ser Asp
545 550 555 560
Glu Leu Gly Arg Leu Arg Lys Ser His Ser Leu Ala Asn Asn Pro Asn
565 570 575
Arg Glu Ala Asp Val Ser Trp Ala Gln Gln Met Leu Lys Asp Ser Ser
580 585 590
Ser Pro Arg Asn Gly Asn Arg Val Val Asn Met Asn Gly Ala Arg Pro
595 600 605
Leu Thr Gln Gly Gly Ser Ser Val Asn Pro His Asn Ser Asp Thr Arg
610 615 620
Glu Ser Asp Ile Leu Asp Ala Trp Leu Glu Gln Leu His Leu Asp Arg
625 630 635 640
<210>53
<211>2158
<212>DNA
<213>稻
<400>53
tgctccttct tcattgcaaa gaaagcacca ccttttaaag aatcctcctc acactccatt 60
cttcttaaaa aacccaccac aacacaattc ccacttgttt cttcatcatc acctacttca 120
atcaaaaaac attccaactt tcttctcaat ttcattccag gatagtatta tgtgcagtgg 180
accaaagagc aatctctgct cttcaagaac cttaacagaa atcgaatcaa ggcaaaagga 240
agaagaaaca atgcttctcc tcgaattcgc tgcttgtgat gatcttgact cgttcaagag 300
agaggttgaa gagaaagggc ttgatttgga tgagtcaggg ttatggtatt gcagacgtgt 360
cggttctaag aagatgggtc ttgaagaaag aacaccttta atggttgcag ctatgtatgg 420
aagcataaag gttttgactt tcatcgtttc cactggaaaa tctgatgtga acagagcttg 480
tggtgaagag agagttactc cgcttcactg tgctgttgct ggctgttctg tgaatatgat 540
tgaagtcatc aatgtcttgc ttgatgcttc tgctttggtt aactctgttg atgctaatgg 600
gaatcaacct ttggatgtgt ttgttcgagt ttcgaggttt gtggctagtc cgaggaggaa 660
agcggttgag ttgttgctga gaggaggagg tgttggagga ttgatcgatg aggcggttga 720
agaagagatc aagattgtct ctaagtatcc agctgatgct tctttaccgg atataaacga 780
aggggtttat ggaagtgatg agtttaggat gtatagcttt aaggttaagc catgttctag 840
ggcttattct catgattgga ccgagtgtgc ttttgttcat ccgggagaaa atgcgaggag 900
gagagatccg aggaagtatc cttacacttg tgtcccctgt cccgagttcc gtaaaggatc 960
atgcccgaaa ggagattctt gcgagtatgc tcacggggtt ttcgagtcgt ggcttcaccc 1020
cgcgcagtat aaaacccggc tttgtaaaga tgaaacgggt tgtgcaagga aagtttgttt 1080
ctttgctcat aaacgcgaag agatgagacc tgttaatgct tcaactggct ctgccgtggc 1140
tcagtctccg tttagcagct tggagatgat gccagggttg tctcctcttg cttattcttc 1200
aggagtttcg actcctccgg tttctccaat ggctaatggt gttccttcct ctccaagaaa 1260
cggcggatca tggcagaaca gagtcaatac ccttactcca ccggctttgc agctcaatgg 1320
tggaagcaga ttgaagtcca cactgagcgc tagagatatc gatatggaga tggagatgga 1380
attgagactc cgcggttttg gcaacaatgt ggaagagacg ttcgggtctt atgtttcctc 1440
tccaagtagg aattctcaaa tgggtcaaaa catgaaccaa cattatccat cttccccggt 1500
gagacaaccg ccatctcaac acgggttcga atcttcagca gctgcagcgg ttgcagtgat 1560
gaaagcgaga tcaaccgcct ttgcgaaacg tagcttgagc ttcaaaccag ctactcaagc 1620
agcaccacag tcgaatctct cggattgggg atctccaaac gggaagctgg aatggggaat 1680
gaaaggagaa gagctgaata agatgagaag aagtgtttcc tttggaatcc atggaaacaa 1740
caacaataac gcagctagag actacaggga cgagccagat gtgtcatggg ttaactcttt 1800
agttaaagac agtactgtgg tgtctgagag aagctttgga atgaatgaga gggttcggat 1860
aatgtcgtgg gctgagcaaa tgtacagaga gaaggagcag actgtggtgt aaacacacac 1920
aaagatggtt tcttatatat attgcttttg ggccatctct gcaaatttga ttctttaatt 1980
tttgtgactt tctttagttg ttactgttat tagtagtata tggtttgttg tcactacgag 2040
tctacgtgat gaaaagatag aagttaattg cattagtttc tatattcgtt tctcatcctc 2100
ttgtaattta tcaaaccatg aaatggctaa gcaatccaaa ccgaaaaaaa aaaaaaaa 2158
<210>54
<211>2193
<212>DNA
<213>稻
<400>54
aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct 60
aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact 120
catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt 180
tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc 240
tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata 300
aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga 360
atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt 420
ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat 480
ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag 540
gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt 600
tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc 660
tgaattcaag cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat 720
aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa 780
aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca 840
acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag 900
tccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa 960
aaccaagcat cctcctcctc ccatctataa attcctcccc ccttttcccc tctctatata 1020
ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag 1080
cgaccgcctt cttcgatcca tatcttccgg tcgagttctt ggtcgatctc ttccctcctc 1140
cacctcctcc tcacagggta tgtgcccttc ggttgttctt ggatttattg ttctaggttg 1200
tgtagtacgg gcgttgatgt taggaaaggg gatctgtatc tgtgatgatt cctgttcttg 1260
gatttgggat agaggggttc ttgatgttgc atgttatcgg ttcggtttga ttagtagtat 1320
ggttttcaat cgtctggaga gctctatgga aatgaaatgg tttagggtac ggaatcttgc 1380
gattttgtga gtaccttttg tttgaggtaa aatcagagca ccggtgattt tgcttggtgt 1440
aataaaagta cggttgtttg gtcctcgatt ctggtagtga tgcttctcga tttgacgaag 1500
ctatcctttg tttattccct attgaacaaa aataatccaa ctttgaagac ggtcccgttg 1560
atgagattga atgattgatt cttaagcctg tccaaaattt cgcagctggc ttgtttagat 1620
acagtagtcc ccatcacgaa attcatggaa acagttataa tcctcaggaa caggggattc 1680
cctgttcttc cgatttgctt tagtcccaga attttttttc ccaaatatct taaaaagtca 1740
ctttctggtt cagttcaatg aattgattgc tacaaataat gcttttatag cgttatccta 1800
gctgtagttc agttaatagg taatacccct atagtttagt caggagaaga acttatccga 1860
tttctgatct ccatttttaa ttatatgaaa tgaactgtag cataagcagt attcatttgg 1920
attatttttt ttattagctc tcaccccttc attattctga gctgaaagtc tggcatgaac 1980
tgtcctcaat tttgttttca aattcacatc gattatctat gcattatcct cttgtatcta 2040
cctgtagaag tttctttttg gttattcctt gactgcttga ttacagaaag aaatttatga 2100
agctgtaatc gggatagtta tactgcttgt tcttatgatt catttccttt gtgcagttct 2160
tggtgtagct tgccactttc accagcaaag ttc 2193
<210>55
<211>1827
<212>DNA
<213>稻
<400>55
gcttgagtca tagggagaaa acaaatcgat catatttgac tcttttccct ccatctctct 60
taccggcaaa aaaagtagta ctggtttata tgtaaagtaa gattctttaa ttatgtgaga 120
tccggcttaa tgcttttctt ttgtcacata tactgcattg caacaattgc catatattca 180
cttctgccat cccattatat agcaactcaa gaatggattg atatatcccc tattactaat 240
ctagacatgt taaggctgag ttgggcagtc catcttccca acccaccacc ttcgtttttc 300
gcgcacatac ttttcaaact actaaatggt gtgtttttta aaaatatttt caatacaaaa 360
gttgctttaa aaaattatat tgatccattt ttttaaaaaa aatagctaat acttaattaa 420
tcacgtgtta aaagaccgct ccgttttgcg tgcaggaggg ataggttcac atcctgcatt 480
accgaacaca gcctaaatct tgttgtctag attcgtagta ctggatatat taaatcatgt 540
tctaagttac tatatactga gatgaataga ataagtaaaa ttagacccac cttaagtctt 600
gatgaagtta ctactagctg cgtttgggag gacttcccaa aaaaaaaagt attagccatt 660
agcacgtgat taattaagta ctagtttaaa aaacttaaaa aataaattaa tatgattctc 720
ttaagtaact ctcctataga aaacttttac aaaattacac cgtttaatag tttggaaaat 780
atgtcagtaa aaaataagag agtagaagtt atgaaagtta gaaaaagaat tgttttagta 840
gtatacagtt ataaactatt ccctctgttc taaaacataa gggattatgg atggattcga 900
catgtaccag taccatgaat cgaatccaga caagtttttt atgcatattt attctactat 960
aatatatcac atctgctcta aatatcttat atttcgaggt ggagactgtc gctatgtttt 1020
tctgcccgtt gctaagcaca cgccaccccc gatgcgggga cgcctctggc cttcttgcca 1080
cgataattga atggaacttc cacattcaga ttcgataggt gaccgtcgac tccaagtgct 1140
ttgcacaaaa caactccggc ctcccggcca ccagtcacac gactcacggc actaccaccc 1200
ctgactccct gaggcggacc tgccactgtt ctgcatgcga agctatctaa aattctgaag 1260
caaagaaagc acagcacatg ctccgggaca cgcgccaccc ggcggaaaag ggctcggtgt 1320
ggcgatctca cagccgcata tcgcatttca caagccgccc atctccaccg gcttcacgag 1380
gctcatcgcg gcacgaccgc gcacggaacg cacgcggccg acccgcgcgc ctcgatgcgc 1440
gagcccatcc gccgcgtcct ccctttgcct ttgccgctat cctctcggtc gtatcccgtt 1500
tctctgtctt ttgctccccg gcgcgcgcca gttcggagta ccagcgaaac ccggacacct 1560
ggtacacctc cgccggccac aacgcgtgtc cccctacgtg gccgcgcagc acatgcccat 1620
gcgcgacacg tgcacctcct catccaaact ctcaagtctc aacggtccta taaatgcacg 1680
gatagcctca agctgctcgt cacaaggcaa gaggcaagag gcaagagcat ccgtattaac 1740
cagccttttg agacttgaga gtgtgtgtga ctcgatccag cgtagtttca gttcgtgtgt 1800
tggtgagtga ttccagccaa gtttgcg 1827
<210>56
<211>2194
<212>DNA
<213>稻
<400>56
aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct 60
aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact 120
catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt 180
tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc 240
tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata 300
aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga 360
atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt 420
ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat 480
ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag 540
gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt 600
tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc 660
tgaattcaag cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat 720
aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa 780
aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca 840
acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag 900
tccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa 960
aaccaagcat cctccttctc ccatctataa attcctcccc ccttttcccc tctctatata 1020
ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag 1080
cgaccgcctt ctcgatccat atcttccggt cgagttcttg gtcgatctct tccctcctcc 1140
acctcctcct cacagggtat gtgcctccct tcggttgttc ttggatttat tgttctaggt 1200
tgtgtagtac gggcgttgat gttaggaaag gggatctgta tctgtgatga ttcctgttct 1260
tggatttggg atagaggggt tcttgatgtt gcatgttatc ggttcggttt gattagtagt 1320
atggttttca atcgtctgga gagctctatg gaaatgaaat ggtttaggga tcggaatctt 1380
gcgattttgt gagtaccttt tgtttgaggt aaaatcagag caccggtgat tttgcttggt 1440
gtaataaagt acggttgttt ggtcctcgat tctggtagtg atgcttctcg atttgacgaa 1500
gctatccttt gtttattccc tattgaacaa aaataatcca actttgaaga cggtcccgtt 1560
gatgagattg aatgattgat tcttaagcct gtccaaaatt tcgcagctgg cttgtttaga 1620
tacagtagtc cccatcacga aattcatgga aacagttata atcctcagga acaggggatt 1680
ccctgttctt ccgatttgct ttagtcccag aatttttttt cccaaatatc ttaaaaagtc 1740
actttctggt tcagttcaat gaattgattg ctacaaataa tgcttttata gcgttatcct 1800
agctgtagtt cagttaatag gtaatacccc tatagtttag tcaggagaag aacttatccg 1860
atttctgatc tccattttta attatatgaa atgaactgta gcataagcag tattcatttg 1920
gattattttt tttattagct ctcacccctt cattattctg agctgaaagt ctggcatgaa 1980
ctgtcctcaa ttttgttttc aaattcacat cgattatcta tgcattatcc tcttgtatct 2040
acctgtagaa gtttcttttt ggttattcct tgactgcttg attacagaaa gaaatttatg 2100
aagctgtaat cgggatagtt atactgcttg ttcttatgat tcatttcctt tgtgcagttc 2160
ttggtgtagc ttgccacttt caccagcaaa gttc 2194
<210>57
<211>46
<212>PRT
<213>人工序列
<220>
<223>SNH结构域
<220>
<221>变体
<222>(3)..(3)
<223>/取代=″Lys″
<220>
<221>不确定
<222>(4)..(4)
<223>Xaa可以使任何天然发生的氨基酸
<220>
<221>变体
<222>(6)..(6)
<223>/取代=″Glu″
<220>
<221>变体
<222>(7)..(7)
<223>/取代=″Asp″
<220>
<221>变体
<222>(9)..(9)
<223>/取代=″Asn″
<220>
<221>不确定
<222>(10)..(10)
<223>Xaa可以使任何天然发生的氨基酸
<220>
<221>不确定
<222>(13)..(13)
<223>Xaa可以使任何天然发生的氨基酸
<220>
<221>变体
<222>(14)..(14)
<223>/取代=″Ala″/取代=″Lys″
<220>
<221>变体
<222>(16)..(16)
<223>/取代=″Val″/取代=″Met″
<220>
<221>变体
<222>(17)..(17)
<223>/取代=″Asp″/取代=″Ser″
<220>
<221>变体
<222>(18)..(18)
<223>/取代=″Asn″
<220>
<221>变体
<222>(19)..(19)
<223>/取代=″Leu″
<220>
<221>不确定
<222>(21)..(21)
<223>Xaa可以使任何天然发生的氨基酸
<220>
<221>变体
<222>(23)..(23)
<223>/取代=″Arg″
<220>
<221>不确定
<222>(24)..(25)
<223>Xaa可以使任何天然发生的氨基酸
<220>
<221>变体
<222>(28)..(28)
<223>/取代=″Asp″/取代=″Ser″
<220>
<221>不确定
<222>(29)..(30)
<223>Xaa可以使任何天然发生的氨基酸
<220>
<221>变体
<222>(32)..(32)
<223>/取代=″Ser″/取代=″Gln″
<220>
<221>不确定
<222>(33)..(33)
<223>Xaa可以使任何天然发生的氨基酸
<220>
<221>变体
<222>(35)..(35)
<223>/取代=″His″
<220>
<221>不确定
<222>(36)..(36)
<223>Xaa可以使任何天然发生的氨基酸
<220>
<221>变体
<222>(39)..(39)
<223>/取代=″Leu″/取代=″Val″
<220>
<221>变体
<222>(43)..(43)
<223>/取代=″Thr″
<400>57
Ile Gln Gln Xaa Leu Asp Glu Asn Lys Xaa Leu Ile Xaa Cys Ile Leu
1 5 10 15
Glu Ser Gln Asn Xaa Gly Lys Xaa Xaa Glu Cys Ala Xaa Xaa Gln Ala
20 25 30
Xaa Leu Gln Xaa Asn Leu Met Tyr Leu Ala Ala Ile Ala Asp
35 40 45
<210>58
<211>46
<212>PRT
<213>拟南芥
<400>58
Ile Gln Gln Tyr Leu Asp Glu Asn Lys Ser Leu Ile Leu Lys Ile Val
1 5 10 15
Glu Ser Gln Asn Ser Gly Lys Leu Ser Glu Cys Ala Glu Asn Gln Ala
20 25 30
Arg Leu Gln Arg Asn Leu Met Tyr Leu Ala Ala Ile Ala Asp
35 40 45
<210>59
<211>633
<212>DNA
<213>拟南芥
<400>59
atgcaacagc acctgatgca gatgcagccc atgatggctg gttactaccc cagcaatgtt 60
acctctgatc atatccaaca gtacttggac gaaaacaaat cgttgattct gaagattgtt 120
gagtctcaaa actctggaaa gcttagcgaa tgcgccgaga atcaagcaag gcttcaacgc 180
aacctaatgt acctagctgc aatagcagat tctcagcctc agccaccaag tgtgcatagc 240
cagtatggat ctgctggtgg tgggatgatt cagggagaag gagggtcaca ctatttgcag 300
cggcaacaag cgactcaaca gcaacagatg actcagcagt ctctaatggc ggctcgatct 360
tcaatgttgt atgctcagca acagcagcag cagcagcctt acgcgacgct tcagcatcag 420
caattgcacc atagccagct tggaatgagc tcgagcagcg gaggaggagg aagcagtggt 480
ctccatatcc ttcagggaga ggctggtggg tttcatgatt ttggccgtgg gaagccggaa 540
atgggaagtg gtggtggcgg tgaaggcaga ggaggaagtt caggggatgg tggagaaacc 600
ctttacttga aatcatcaga tgatgggaat tga 633
<210>60
<211>210
<212>PRT
<213>拟南芥
<400>60
Met Gln Gln His Leu Met Gln Met Gln Pro Met Met Ala Gly Tyr Tyr
1 5 10 15
Pro Ser Asn Val Thr Ser Asp His Ile Gln Gln Tyr Leu Asp Glu Asn
20 25 30
Lys Ser Leu Ile Leu Lys Ile Val Glu Ser Gln Asn Ser Gly Lys Leu
35 40 45
Ser Glu Cys Ala Glu Asn Gln Ala Arg Leu Gln Arg Asn Leu Met Tyr
50 55 60
Leu Ala Ala Ile Ala Asp Ser Gln Pro Gln Pro Pro Ser Val His Ser
60 70 75 80
Gln Tyr Gly Ser Ala Gly Gly Gly Met Ile Gln Gly Glu Gly Gly Ser
85 90 95
His Tyr Leu Gln Gln Gln Gln Ala Thr Gln Gln Gln Gln Met Thr Gln
100 105 110
Gln Ser Leu Met Ala Ala Arg Ser Ser Met Leu Tyr Ala Gln Gln Gln
115 120 125
Gln Gln Gln Gln Pro Tyr Ala Thr Leu Gln His Gln Gln Leu His His
130 135 140
Ser Gln Leu Gly Met Ser Ser Ser Ser Gly Gly Gly Gly Ser Ser Gly
145 150 155 160
Leu His Ile Leu Gln Gly Glu Ala Gly Gly Phe His Asp Phe Gly Arg
165 170 175
Gly Lys Pro Glu Met Gly Ser Gly Gly Gly Gly Glu Gly Arg Gly Gly
180 185 190
Ser Ser Gly Asp Gly Gly Glu Thr Leu Tyr Leu Lys Ser Ser Asp Asp
195 200 205
Gly Asn
210
<210>61
<211>588
<212>DNA
<213>拟南芥
<400>61
atgcagcagc agcagtctcc gcaaatgttt ccgatggttc cgtcgattcc ccctgctaac 60
aacatcacta ccgaacagat ccaaaagtac cttgatgaga acaagaagct gattatggcc 120
atcatggaaa accagaatct cggtaaactt gctgagtgcg cccagtacca agctcttctc 180
cagaagaact tgatgtatct tgctgcaatt gctgatgctc aacccccacc acctacgcca 240
ggaccttcac catctacagc tgtcgctgcc cagatggcaa caccgcattc tgggatgcaa 300
ccacctagct acttcatgca acacccacaa gcatcccctg cagggatttt cgctccaagg 360
ggtcctttac agtttggtag cccactccag tttcaggatc cgcaacagca gcagcagata 420
catcagcaag ctatgcaagg acacatgggg attagaccaa tgggtatgac caacaacggg 480
atgcagcatg cgatgcaaca accagaaacc ggtcttggag gaaacgtggg gcttagagga 540
ggaaagcaag atggagcaga tggacaagga aaagatgatg gcaagtga 588
<210>62
<211>195
<212>PRT
<213>拟南芥
<400>62
Met Gln Gln Gln Gln Ser Pro Gln Met Phe Pro Met Val Pro Ser Ile
1 5 10 15
Pro Pro Ala Asn Asn Ile Thr Thr Glu Gln Ile Gln Lys Tyr Leu Asp
20 25 30
Glu Asn Lys Lys Leu Ile Met Ala Ile Met Glu Asn Gln Asn Leu Gly
35 40 45
Lys Leu Ala Glu Cys Ala Gln Tyr Gln Ala Leu Leu Gln Lys Asn Leu
50 55 60
Met Tyr Leu Ala Ala Ile Ala Asp Ala Gln Pro Pro Pro Pro Thr Pro
65 70 75 80
Gly Pro Ser Pro Ser Thr Ala Val Ala Ala Gln Met Ala Thr Pro His
85 90 95
Ser Gly Met Gln Pro Pro Ser Tyr Phe Met Gln His Pro Gln Ala Ser
100 105 110
Pro Ala Gly Ile Phe Ala Pro Arg Gly Pro Leu Gln Phe Gly Ser Pro
115 120 125
Leu Gln Phe Gln Asp Pro Gln Gln Gln Gln Gln Ile His Gln Gln Ala
130 135 140
Met Gln Gly His Met Gly Ile Arg Pro Met Gly Met Thr Asn Asn Gly
145 150 155 160
Met Gln His Ala Met Gln Gln Pro Glu Thr Gly Leu Gly Gly Asn Val
165 170 175
Gly Leu Arg Gly Gly Lys Gln Asp Gly Ala Asp Gly Gln Gly Lys Asp
180 185 190
Asp Gly Lys
195
<210>63
<211>672
<212>DNA
<213>拟南芥
<400>63
atgcagcaat ctccacagat gattccgatg gttcttcctt catttccgcc caccaataat 60
atcaccaccg aacagatcca aaagtatctt gatgagaaca agaagctgat aatggcgatc 120
ttggaaaatc agaacctcgg taaacttgca gaatgtgctc agtatcaagc tcttctccag 180
aagaatttga tgtatctcgc tgcaattgcg gatgctcaac ctcagccacc agcagctaca 240
ctaacatcag gagccatgac tccccaagca atggctccta atccgtcatc aatgcagcca 300
ccaccaagct acttcatgca gcaacatcaa gctgtgggaa tggctcaaca aatacctcct 360
gggattttcc ctcctagagg tccattgcaa tttggtagcc cgcatcagtt tctggatccg 420
cagcaacagt tacatcaaca agctatgcaa gggcacatgg ggattagacc aatgggtttg 480
aataataaca acggactgca acatcaaatg caccaccatg aaactgctct tgccgcaaac 540
aatgcgggtc ctaacgatgc tagtggagga ggtaaaccgg atgggaccaa tatgagccag 600
agtggagctg atgggcaagg tggctcagcc gctagacatg gcggtggtga tgcaaaaact 660
gaaggaaaat ga 672
<210>64
<211>223
<212>PRT
<213>拟南芥
<400>64
Met Gln Gln Ser Pro Gln Met Ile Pro Met Val Leu Pro Ser Phe Pro
1 5 10 15
Pro Thr Asn Asn Ile Thr Thr Glu Gln Ile Gln Lys Tyr Leu Asp Glu
20 25 30
Asn Lys Lys Leu Ile Met Ala Ile Leu Glu Asn Gln Asn Leu Gly Lys
35 40 45
Leu Ala Glu Cys Ala Gln Tyr Gln Ala Leu Leu Gln Lys Asn Leu Met
50 55 60
Tyr Leu Ala Ala Ile Ala Asp Ala Gln Pro Gln Pro Pro Ala Ala Thr
65 70 75 80
Leu Thr Ser Gly Ala Met Thr Pro Gln Ala Met Ala Pro Asn Pro Ser
85 90 95
Ser Met Gln Pro Pro Pro Ser Tyr Phe Met Gln Gln His Gln Ala Val
100 105 110
Gly Met Ala Gln Gln Ile Pro Pro Gly Ile Phe Pro Pro Arg Gly Pro
115 120 125
Leu Gln Phe Gly Ser Pro His Gln Phe Leu Asp Pro Gln Gln Gln Leu
130 135 140
His Gln Gln Ala Met Gln Gly His Met Gly Ile Arg Pro Met Gly Leu
145 150 155 160
Asn Asn Asn Asn Gly Leu Gln His Gln Met His His His Glu Thr Ala
165 170 175
Leu Ala Ala Asn Asn Ala Gly Pro Asn Asp Ala Ser Gly Gly Gly Lys
180 185 190
Pro Asp Gly Thr Asn Met Ser Gln Ser Gly Ala Asp Gly Gln Gly Gly
195 200 205
Ser Ala Ala Arg His Gly Gly Gly Asp Ala Lys Thr Glu Gly Lys
210 215 220
<210>65
<211>633
<212>DNA
<213>Aspergillus officinalis
<400>65
atgcagcagc acctgatgca gatgcagccc atgatggcaa cctacggttc accgaatcag 60
gtcaccaccg atatcattca gcagtatctg gacgagaaca agcagttgat tctggctatt 120
cttgaaaacc aaaattcagg aaaagctgat gaatgtgctg agaatcaggc taagcttcag 180
aggaatctga tgtatcttgc agccattgcg gatagccagc cccaagttcc taccattgct 240
cagtatcctc ccaacgctgt tgctgctatg caatcgagtg ctcgctacat gcaacaacac 300
caagcagctc aacagatgac ccctcaatct ctcatggctg ctcgctcctc aatgctctac 360
tcacagtccc caatgtctgc actccagcag caacagcagc aagcagcaat gcatagccag 420
ctcgccatga gctccggagg caacaacagc agcaccggag gattcaccat tcttcatggt 480
gaagctagca taggaggcaa tggctcaatg aattctggtg gagtctttgg agattttgga 540
cggagcagcg gtgggaagca agagactggg agcgaagggc acgggacaga gactcctatg 600
tacctgaaag gctctgaaga agaaggaaac tga 633
<210>66
<211>210
<212>PRT
<213>Aspergillus officinalis
<400>66
Met Gln Gln His Leu Met Gln Met Gln Pro Met Met Ala Thr Tyr Gly
1 5 10 15
Ser Pro Asn Gln Val Thr Thr Asp Ile Ile Gln Gln Tyr Leu Asp Glu
20 25 30
Asn Lys Gln Leu Ile Leu Ala Ile Leu Glu Asn Gln Asn Ser Gly Lys
35 40 45
Ala Asp Glu Cys Ala Glu Asn Gln Ala Lys Leu Gln Arg Asn Leu Met
50 55 60
Tyr Leu Ala Ala Ile Ala Asp Ser Gln Pro Gln Val Pro Thr Ile Ala
65 70 75 80
Gln Tyr Pro Pro Asn Ala Val Ala Ala Met Gln Ser Ser Ala Arg Tyr
85 90 95
Met Gln Gln His Gln Ala Ala Gln Gln Met Thr Pro Gln Ser Leu Met
100 105 110
Ala Ala Arg Ser Ser Met Leu Tyr Ser Gln Ser Pro Met Ser Ala Leu
115 120 125
Gln Gln Gln Gln Gln Gln Ala Ala Met His Ser Gln Leu Ala Met Ser
130 135 140
Ser Gly Gly Asn Asn Ser Ser Thr Gly Gly Phe Thr Ile Leu His Gly
145 150 155 160
Glu Ala Ser Ile Gly Gly Asn Gly Ser Met Asn Ser Gly Gly Val Phe
165 170 175
Gly Asp Phe Gly Arg Ser Ser Gly Gly Lys Gln Glu Thr Gly Ser Glu
180 185 190
Gly His Gly Thr Glu Thr Pro Met Tyr Leu Lys Gly Ser Glu Glu Glu
195 200 205
Gly Asn
210
<210>67
<211>591
<212>DNA
<213>欧洲油菜(Brassica napus)
<400>67
atgcagccca tgatggctgg ttactacccc agcaatgtca cctctgatca tatccagcag 60
tacttggatg agaacaagtc tttgattctg aagatagttg agtctcaaaa ctcaggaaag 120
ctcagcgagt gtgccgagaa tcaggcaagg cttcaacgca acctcatgta cttggctgca 180
atagcagatt ctcagcctca acctccaagc gtgcatagcc agtatggatc tgctggtggt 240
gggttgattc agggagaagg agcgtcacac tatttgcagc agcaacaggc gactcaacag 300
cagcagatga ctcagcagtc tcttatggca gctcgttctt caatgatgta tcagcagcag 360
caacagcctt atgcaacgct tcagcatcag cagttgcacc atagccagct tgggatgagc 420
tctagcagcg gaggaggaag cagtggtctc catatccttc agggagaggc tggtgggttt 480
catgaatttg gccgtgggaa gccggagatg ggaagtggtg aaggcagggg tggaagctca 540
ggggatggtg gagaaacact ctacttgaag tcatcagatg atgggaactg a 591
<210>68
<211>203
<212>PRT
<213>欧洲油菜
<400>68
Met Gln Gln His Leu Met Gln Met Gln Pro Met Met Ala Gly Tyr Tyr
1 5 10 15
Pro Ser Asn Val Thr Ser Asp His Ile Gln Gln Tyr Leu Asp Glu Asn
20 25 30
Lys Ser Leu Ile Leu Lys Ile Val Glu Ser Gln Asn Ser Gly Lys Leu
35 40 45
Ser Glu Cys Ala Glu Asn Gln Ala Arg Leu Gln Arg Asn Leu Met Tyr
50 55 60
Leu Ala Ala Ile Ala Asp Ser Gln Pro Gln Pro Pro Ser Val His Ser
65 70 75 80
Gln Tyr Gly Ser Ala Gly Gly Gly Leu Ile Gln Gly Glu Gly Ala Ser
85 90 95
His Tyr Leu Gln Gln Gln Gln Ala Thr Gln Gln Gln Gln Met Thr Gln
100 105 110
Gln Ser Leu Met Ala Ala Arg Ser Ser Met Met Tyr Gln Gln Gln Gln
115 120 125
Gln Pro Tyr Ala Thr Leu Gln His Gln Gln Leu His His Ser Gln Leu
130 135 140
Gly Met Ser Ser Ser Ser Gly Gly Gly Ser Ser Gly Leu His Ile Leu
145 150 155 160
Gln Gly Glu Ala Gly Gly Phe His Glu Phe Gly Arg Gly Lys Pro Glu
165 170 175
Met Gly Ser Gly Glu Gly Arg Gly Gly Ser Ser Gly Asp Gly Gly Glu
180 185 190
Thr Leu Tyr Leu Lys Ser Ser Asp Asp Gly Asn
195 200
<210>69
<211>663
<212>DNA
<213>甜橙(Citrus sinensis)
<400>69
atgcaacagc acctgatgca gatgcagccc atgatggcag cttattatcc caacaacgtc 60
actactgacc acattcaaca gtatctagat gagaacaaat cattgatttt gaagattgtt 120
gagagccaga attcagggaa actgagcgag tgtgcagaga accaggcaag attgcagcgg 180
aatctcatgt acctggctgc tattgctgat gctcaacccc aaccacctag cgttcatgcc 240
cagttctctt ctggtggcat tatgcagcca ggagctcact atatgcaaca ccagcaatct 300
cagccaatga caccacagtc acttatggct gcacgctcat ccatggtgta ctctcaacag 360
caattttcag tgcttcagca acagcaagcc ttgcatggtc agcttggcat gagctctggt 420
ggtagctcag gacttcacat gctgcaaagt gagggtagta ctgcaggagg tagtggttca 480
cttgggggtg ggggattccc tgattttggc cgtggctcat ctggtgaagg cttgcactca 540
aggggaatgg ggagcaagca tgatataggc agttctggat ctgctgaagg acgaggaggg 600
agctcaggaa gccaagatgg aggcgaaact ctctacttga aaggggctga tgatggaaat 660
taa 663
<210>70
<211>219
<212>PRT
<213>甜橙
<400>70
Met Gln Gln His Leu Met Gln Met Gln Pro Met Met Ala Ala Tyr Tyr
1 5 10 15
Pro Asn Asn Val Thr Thr Asp His Ile Gln Gln Tyr Leu Asp Glu Asn
20 25 30
Lys Ser Leu Ile Leu Lys Ile Val Glu Ser Gln Asn Ser Gly Lys Leu
35 40 45
Ser Glu Cys Ala Glu Asn Gln Ala Arg Leu Gln Arg Asn Leu Met Tyr
50 55 60
Leu Ala Ala Ile Ala Asp Ala Gln Pro Gln Pro Pro Ser Val His Ala
65 70 75 80
Gln Phe Ser Ser Gly Gly Ile Met Gln Pro Gly Ala His Tyr Met Gln
85 90 95
His Gln Gln Ser Gln Pro Met Thr Pro Gln Ser Leu Met Ala Ala Arg
100 105 110
Ser Ser Met Val Tyr Ser Gln Gln Gln Phe Ser Val Leu Gln Gln Gln
115 120 125
Gln Ala Leu His Gly Gln Leu Gly Met Ser Ser Gly Gly Ser Ser Gly
130 135 140
Leu His Met Leu Gln Ser Glu Gly Ser Thr Ala Gly Gly Ser Gly Ser
145 150 155 160
Leu Gly Gly Gly Gly Phe Pro Asp Phe Gly Arg Gly Ser Ser Gly Glu
165 170 175
Gly Leu His Ser Arg Gly Met Gly Ser Lys His Asp Ile Gly Ser Ser
180 185 190
Gly Ser Ala Glu Gly Arg Gly Gly Ser Ser Gly Ser Gln Asp Gly Gly
195 200 205
Glu Thr Leu Tyr Leu Lys Gly Ala Asp Asp Gly
210 215
<210>71
<211>660
<212>DNA
<213>树棉(Gossypium arboreum)
<220>
<221>misc_feature
<222>(309)..(309)
<223>n是a、c、g或t
<400>71
atgcagcagc acctgatgca gatgcagccc atgatggcag cttattatcc caacaacgtc 60
actactgatc atattcaaca gtatctcgat gagaacaagt cattgatctt aaagattgtt 120
gagagccaga attctgggaa attgagtgaa tgtgctgaga accaagcaag gctgcagcga 180
aacctcatgt acctggctgc cattgcggat tctcaacccc aaccacccac cgtgcatgca 240
cagtttccat ctggtggtat catgcagcaa ggagctgggc actacatgca gcaccaacaa 300
gctcaacana tgacacaaca gtcgcttatg gctgctcggt cctcaatgtt gtattctcag 360
caaccatttt ctgcactgca acaacaacaa caacaaggct ttgcacagtc agcttggcat 420
gagctctggc gggagcacag gcctttcata tgctgcaaac tgaatctagt actgcagggg 480
gcagtgagac accttgggcc cgagggttgt cctgatttgg acgggggtct tttggagagg 540
catccctggt ggcaggccaa tggccggggg aacaaccaaa aatccgggga ggccggctca 600
cctaagggcc gggaggagcc cttggggcag gggggggtga tggggggaac ctcttcttaa 660
<210>72
<211>219
<212>PRT
<213>树棉
<220>
<221>不确定
<222>(103)..(103)
<223>Xaa可以使任何天然发生的氨基酸
<400>72
Met Gln Gln His Leu Met Gln Met Gln Pro Met Met Ala Ala Tyr Tyr
1 5 10 15
Pro Asn Asn Val Thr Thr Asp His Ile Gln Gln Tyr Leu Asp Glu Asn
20 25 30
Lys Ser Leu Ile Leu Lys Ile Val Glu Ser Gln Asn Ser Gly Lys Leu
35 40 45
Ser Glu Cys Ala Glu Asn Gln Ala Arg Leu Gln Arg Asn Leu Met Tyr
50 55 60
Leu Ala Ala Ile Ala Asp Ser Gln Pro Gln Pro Pro Thr Val His Ala
65 70 75 80
Gln Phe Pro Ser Gly Gly Ile Met Gln Gln Gly Ala Gly His Tyr Met
85 90 95
Gln His Gln Gln Ala Gln Xaa Met Thr Gln Gln Ser Leu Met Ala Ala
100 105 110
Arg Ser Ser Met Leu Tyr Ser Gln Gln Pro Phe Ser Ala Leu Gln Gln
115 120 125
Gln Gln Gln Gln Gly Phe Ala Gln Ser Ala Trp His Glu Leu Trp Arg
130 135 140
Glu His Arg Pro Phe Ile Cys Cys Lys Leu Asn Leu ValLeu Gln Gly
145 150 155 160
Ala Val Arg His Leu Gly Pro Glu Gly Cys Pro Asp Leu Asp Gly Gly
165 170 175
Leu Leu Glu Arg His Pro Trp Trp Gln Ala Asn Gly Arg Gly Asn Asn
180 185 190
Gln Lys Ser Gly Glu Ala Gly Ser Pro Lys Gly Arg Glu Glu Pro Leu
195 200 205
Gly Gln Gly Gly Val Met Gly Gly Thr Ser Ser
210 215
<210>73
<211>636
<212>DNA
<213>蒺藜苜蓿(Medicago trunculata)
<400>73
atgcagcagc acctgatgca gatgcagccc atgatggcag cttactatcc taacaacgtc 60
actactgatc atattcaaca gtatcttgat gagaacaagt ccttgattct caagattgtt 120
gaaagccaga acactggcaa gctcaccgag tgtgctgaga accaatcaag gcttcagaga 180
aatctcatgt acctagctgc aatagctgat tctcaacccc aaccacctac tatgcctggc 240
cagtaccctt caagtggaat gatgcagcag ggaggacact acatgcaggc tcaacaagct 300
cagcagatga cacaacaaca attaatggct gcacgttcct ctcttatgta tgctcaacag 360
cttcaacagc agcaagcctt gcaaagccaa cttggtatga attccagtgg aagtcaaggc 420
cttcacatgt tgcatagtga aggggctaat gttggaggca attcatctct aggggctggt 480
tttcctgatt ttggccgtag ctcagccggt gatggtttgc acggcagtgg taagcaagac 540
attggaagca ctgatggccg cggtggaagc tctagtggtc actctggtga tggcggcgaa 600
acactttacc tgaaatcttc tggtgatggg aattag 636
<210>74
<211>211
<212>PRT
<213>蒺藜苜蓿
<400>74
Met Gln Gln His Leu Met Gln Met Gln Pro Met Met Ala Ala Tyr Tyr
1 5 10 15
Pro Asn Asn Val Thr Thr Asp His Ile Gln Gln Tyr Leu Asp Glu Asn
20 25 30
Lys Ser Leu Ile Leu Lys Ile Val Glu Ser Gln Asn Thr Gly Lys Leu
35 40 45
Thr Glu Cys Ala Glu Asn Gln Ser Arg Leu Gln Arg Asn Leu Met Tyr
50 55 60
Leu Ala Ala Ile Ala Asp Ser Gln Pro Gln Pro Pro Thr Met Pro Gly
65 70 75 80
Gln Tyr Pro Ser Ser Gly Met Met Gln Gln Gly Gly His Tyr Met Gln
85 90 95
Ala Gln Gln Ala Gln Gln Met Thr Gln Gln Gln Leu Met Ala Ala Arg
100 105 110
Ser Ser Leu Met Tyr Ala Gln Gln Leu Gln Gln Gln Gln Ala Leu Gln
115 120 125
Ser Gln Leu Gly Met Asn Ser Ser Gly Ser Gln Gly Leu His Met Leu
130 135 140
His Ser Glu Gly Ala Asn Val Gly Gly Asn Ser Ser Leu Gly Ala Gly
145 150 155 160
Phe Pro Asp Phe Gly Arg Ser Ser Ala Gly Asp Gly Leu His Gly Ser
165 170 175
Gly Lys Gln Asp Ile Gly Ser Thr Asp Gly Arg Gly Gly Ser Ser Ser
180 185 190
Gly His Ser Gly Asp Gly Gly Glu Thr Leu Tyr Leu Lys Ser Ser Gly
195 200 205
Asp Gly Asn
210
<210>75
<211>684
<212>DNA
<213>稻
<400>75
atgcagcagc aacacctgat gcagatgaac cagggcatga tggggggata tgcttcccct 60
accaccgtca ccactgatct cattcagcag tatctggatg agaacaagca gctgatcctg 120
gccatccttg acaaccagaa caatgggaag gtggaagagt gcgctcggaa ccaagctaag 180
ctccagcaca atctcatgta cctcgccgcc atcgccgaca gccagccgcc gcagacggcc 240
gccatgtccc agtatccgtc gaacctgatg atgcagtccg gggcgaggta catgccgcag 300
cagtcggcgc agatgatggc gccgcagtcg ctgatggcgg cgaggtcttc gatgatgtac 360
gcgcagccgg cgctgtcgcc gctccagcag cagcagcagc agcaggcggc ggcggcgcac 420
gggcagctgg gcatgggctc ggggggcacc accagcgggt tcagcatcct ccacggcgag 480
gccagcatgg gcggcggcgg cggcggcggt ggcgccggta acagcatgat gaacgccggc 540
gtgttctccg acttcggacg cggcggcggc ggcggcggca aggaggggtc cacctcgctg 600
tccgtcgacg tccggggcgc caactccggc gcccagagcg gcgacgggga gtacctcaag 660
ggcaccgagg aggaaggcagctag 684
<210>76
<211>227
<212>PRT
<213>稻
<400>76
Met Gln Gln Gln His Leu Met Gln Met Asn Gln Gly Met Met Gly Gly
1 5 10 15
Tyr Ala Ser Pro Thr Thr Val Thr Thr Asp Leu Ile Gln Gln Tyr Leu
20 25 30
Asp Glu Asn Lys Gln Leu Ile Leu Ala Ile Leu Asp Asn Gln Asn Asn
35 40 45
Gly Lys Val Glu Glu Cys Ala Arg Asn Gln Ala Lys Leu Gln His Asn
50 55 60
Leu Met Tyr Leu Ala Ala Ile Ala Asp Ser Gln Pro Pro Gln Thr Ala
65 70 75 80
Ala Met Ser Gln Tyr Pro Ser Asn Leu Met Met Gln Ser Gly Ala Arg
85 90 95
Tyr Met Pro Gln Gln Ser Ala Gln Met Met Ala Pro Gln Ser Leu Met
100 105 110
Ala Ala Arg Ser Ser Met Met Tyr Ala Gln Pro Ala Leu Ser Pro Leu
115 120 125
Gln Gln Gln Gln Gln Gln Gln Ala Ala Ala Ala His Gly Gln Leu Gly
130 135 140
Met Gly Ser Gly Gly Thr Thr Ser Gly Phe Ser Ile Leu Hi s Gly Glu
145 150 155 160
Ala Ser Met Gly Gly Gly Gly Gly Gly Gly Gly Ala Gly Asn Ser Met
165 170 175
Met Asn Ala Gly Val Phe Ser Asp Phe Gly Arg Gly Gly Gly Gly Gly
180 185 190
Gly Lys Glu Gly Ser Thr Ser Leu Ser Val Asp ValArg Gly Ala Asn
195 200 205
Ser Gly Ala Gln Ser Gly Asp Gly Glu Tyr Leu Lys Gly Thr Glu Glu
210 215 220
Glu Gly Ser
225
<210>77
<211>558
<212>DNA
<213>稻
<400>77
atgcagcagc agccgatgcc gatgcccgcg caggcgccgc cgacggccgg aatcaccacc 60
gagcagatcc aaaagtatct ggatgaaaac aagcagctta ttttggctat tttggaaaat 120
cagaatctgg gaaagttggc agaatgtgct cagtatcaag cgcagcttca gaagaatctc 180
ttgtacttgg ctgcaattgc tgatactcaa ccgcagacca ctataagccg tccccagatg 240
gtgccgcatg gtgcatcgcc ggggttaggg gggcaataca tgtcgcaggt gccaatgttc 300
ccccccagga cccctctaac gccccagcag atgcaggagc agcagctgca gcaacagcaa 360
gcccagctgc tctcgttcgg cggtcagatg gttatgaggc ctggcgttgt gaatggcatt 420
cctcagcttc tgcaaggcga aatgcaccgc ggagcagatc accagaacgc tggcggggcc 480
acctcggagc cttccgagag ccacaggagc accggcaccg aaaatgacgg tggaagcgac 540
ttcggcgatc aatcctaa 558
<210>78
<211>185
<212>PRT
<213>稻
<400>78
Met Gln Gln Gln Pro Met Pro Met Pro Ala Gln Ala Pro Pro Thr Ala
1 5 10 15
Gly Ile Thr Thr Glu Gln Ile Gln Lys Tyr Leu Asp Glu Asn Lys Gln
20 25 30
Leu Ile Leu Ala Ile Leu Glu Asn Gln Asn Leu Gly Lys Leu Ala Glu
35 40 45
Cys Ala Gln Tyr Gln Ala Gln Leu Gln Lys Asn Leu Leu Tyr Leu Ala
50 55 60
Ala Ile Ala Asp Thr Gln Pro Gln Thr Thr Ile Ser Arg Pro Gln Met
65 70 75 80
Val Pro His Gly Ala Ser Pro Gly Leu Gly Gly Gln Tyr Met Ser Gln
85 90 95
Val Pro Met Phe Pro Pro Arg Thr Pro Leu Thr Pro Gln Gln Met Gln
100 105 110
Glu Gln Gln Leu Gln Gln Gln Gln Ala Gln Leu Leu Ser Phe Gly Gly
115 120 125
Gln Met Val Met Arg Pro Gly Val Val Asn Gly Ile Pro Gln Leu Leu
130 135 140
Gln Gly Glu Met His Arg Gly Ala Asp His Gln Asn Ala Gly Gly Ala
145 150 155 160
Thr Ser Glu Pro Ser Glu Ser His Arg Ser Thr Gly Thr Glu Asn Asp
165 170 175
Gly Gly Ser Asp Phe Gly Asp Gln Ser
180 185
<210>79
<211>618
<212>DNA
213>稻
<400>79
atgcagcagc agatggccat gccggcgggg gccgccgccg ccgcggtgcc gccggcggcc 60
ggcatcacca ccgagcagat ccaaaagtat ttggatgaaa ataaacagct aattttggcc 120
atcctggaaa atcaaaacct agggaagttg gctgaatgtg ctcagtacca agctcagctt 180
caaaagaatc tcttgtatct ggctgccatt gcagatgccc aaccacctca gaatccagga 240
agtcgccctc agatgatgca gcctggtgct accccaggtg ctgggcatta catgtcccaa 300
gtaccgatgt tccctccaag aactccctta accccacaac agatgcaaga gcagcagcag 360
cagcaactcc agcaacagca agctcaggct ctagccttcc ccggccagat gctaatgaga 420
ccaggtactg tcaatggcat gcaatctatc ccagttgctg accctgctcg cgcagccgat 480
cttcagacgg cagcaccggg ctcggtagat ggccgaggaa acaagcagga tgcaacctcg 540
gagccttccg ggaccgagag ccacaagagt gcgggagcag ataacgacgc aggcggtgac 600
atagcggaga agtcctga 618
<210>80
<211>205
<212>PRT
<213>稻
<400>80
Met Gln Gln Gln Met Ala Met Pro Ala Gly Ala Ala Ala Ala Ala Val
1 5 10 15
Pro Pro Ala Ala Gly Ile Thr Thr Glu Gln Ile Gln Lys Tyr Leu Asp
20 25 30
Glu Asn Lys Gln Leu Ile Leu Ala Ile Leu Glu Asn Gln Asn Leu Gly
35 40 45
Lys Leu Ala Glu Cys Ala Gln Tyr Gln Ala Gln Leu Gln Lys Asn Leu
50 55 60
Leu Tyr Leu Ala Ala Ile Ala Asp Ala Gln Pro Pro Gln Asn Pro Gly
65 70 75 80
Ser Arg Pro Gln Met Met Gln Pro Gly Ala Thr Pro Gly Ala Gly His
85 90 95
Tyr Met Ser Gln Val Pro Met Phe Pro Pro Arg Thr Pro Leu Thr Pro
100 105 110
Gln Gln Met Gln Glu Gln Gln Gln Gln Gln Leu Gln Gln Gln Gln Ala
115 120 125
Gln Ala Leu Ala Phe Pro Gly Gln Met Leu Met Arg Pro Gly Thr Val
130 135 140
Asn Gly Met Gln Ser Ile Pro Val Ala Asp Pro Ala Arg Ala Ala Asp
145 150 155 160
Leu Gln Thr Ala Ala Pro Gly Ser Val Asp Gly Arg Gly Asn Lys Gln
165 170 175
Asp Ala Thr Ser Glu Pro Ser Gly Thr Glu Ser His Lys Ser Ala Gly
180 185 190
Ala Asp Asn Asp Ala Gly Gly Asp Ile Ala Glu Lys Ser
195 200 205
<210>81
<211>540
<212>DNA
<213>马铃薯(Solanum tuberosum)
<400>81
atgcagcagc agcacctgat gcagatgcag cccatgatgg cagcctatta tcccaacaat 60
gtcactactg atcatattca acagttcctg gatgagaaca aatcacttat tctgaagatt 120
gttgagagcc agaactctgg gaaaataagt gaatgtgcag agtcccaagc taaacttcag 180
agaaatctta tgtaccttgc agctattgct gattcacagc cccagcctcc tagtatgcat 240
tcacagttag cttctggtgg gatgatgcag ggaggggcac attatatgca gcaacaacaa 300
gctcaacaac tcacaacgca atcgcttatg gctgcagcaa gatcctcctc ctcaatgctc 360
tatggacaac aacaacaaca acaacaacaa caactatcat cattgcaaca acagcaagca 420
gcctttcata gccagcaact cggaatgagc agctctggtg gaggaagcag tagtggactt 480
cacatgctac aaagcgaaaa cactcatagt gctagcactg gtggtgggtg gtttccctga 540
<210>82
<211>179
<212>PRT
<213>马铃薯
<400>82
Met Gln Gln Gln His Leu Met Gln Met Gln Pro Met Met Ala Ala Tyr
1 5 10 15
Tyr Pro Asn Asn Val Thr Thr Asp His Ile Gln Gln Phe Leu Asp Glu
20 25 30
Asn Lys Ser Leu Lle Leu Lys Ile Val Glu Ser Gln Asn Ser Gly Lys
35 40 45
Ile Ser Glu Cys Ala Glu Ser Gln Ala Lys Leu Gln Arg Asn Leu Met
50 55 60
Tyr Leu Ala Ala Ile Ala Asp Ser Gln Pro Gln Pro Pro Ser Met His
65 70 75 80
Ser Gln Leu Ala Ser Gly Gly Met Met Gln Gly Gly Ala His Tyr Met
85 90 95
Gln Gln Gln Gln Ala Gln Gln Leu Thr Thr Gln Ser Leu Met Ala Ala
100 105 110
Ala Arg Ser Ser Ser Ser Met Leu Tyr Gly Gln Gln Gln Gln Gln Gln
115 120 125
Gln Gln Gln Leu Ser Ser Leu Gln Gln Gln Gln Ala Ala Phe His Ser
130 135 140
Gln Gln Leu Gly Met Ser Ser Ser Gly Gly Gly Ser Ser Ser Gly Leu
145 150 155 160
His Met Leu Gln Ser Glu Asn Thr His Ser Ala Ser Thr Gly Gly Gly
165 170 175
Trp Phe Pro
<210>83
<211>684
<212>DNA
<213>玉蜀黍(Zea mays)
<400>83
atgcagcagc aacacctgat gcagatgaac cagaacatga tggggggcta cacctctcct 60
gccgccgtga ccaccgatct catccagcag cacctggacg agaacaagca gctgatcctg 120
gccatcctcg acaaccagaa caatggcaag gcggaggagt gcgaacggca ccaagctaag 180
ctccagcaca acctcatgta cctggccgcc atcgctgaca gccagccgcc acagaccgcg 240
ccactatcac agtacccgtc caacctgatg atgcagccgg gccctcggta catgccaccg 300
cagtccgggc agatgatgaa cccgcagtcg ctgatggcgg cgcggtcctc catgatgtac 360
gcgcacccgt ccctgtcgcc actccagcag cagcaggcgg cgcacggaca gctgggtatg 420
gctccagggg gcggcggtgg cggcacgacc agcgggttca gcatcctcca cggcgaggcc 480
agcatgggcg gtggtggtgc tggcgcaggc gccggcaaca acatgatgaa cgccggcatg 540
ttctcgggct ttggccgcag cggcagtggc gccaaggaag ggtcgacctc tctgtcggtt 600
gacgtccgag gtggaaccag ctccggcgcg cagagcgggg acggcgagta cctcaaagtc 660
ggcaccgagg aagaaggcag ttag 684
<210>84
<211>227
<212>PRT
<213>玉蜀黍
<400>84
Met Gln Gln Gln His Leu Met Gln Met Asn Gln Asn Met Met Gly Gly
1 5 10 15
Tyr Thr Ser Pro Ala Ala Val Thr Thr Asp Leu Ile Gln Gln His Leu
20 25 30
Asp Glu Asn Lys Gln Leu Ile Leu Ala Ile Leu Asp Asn Gln Asn Asn
35 40 45
Gly Lys Ala Glu Glu Cys Glu Arg His Gln Ala Lys Leu Gln His Asn
50 55 60
Leu Met Tyr Lau Ala Ala Ile Ala Asp Ser Gln Pro Pro Gln Thr Ala
65 70 75 80
Pro Leu Ser Gln Tyr Pro Ser Asn Leu Met Met Gln Pro Gly Pro Arg
85 90 95
Tyr Met Pro Pro Gln Ser Gly Gln Met Met Asn Pro Gln Ser Leu Met
100 105 110
Ala Ala Arg Ser Ser Met Met Tyr Ala His Pro Ser Leu Ser Pro Leu
115 120 125
Gln Gln Gln Gln Ala Ala His Gly Gln Leu Gly Met Ala Pro Gly Gly
130 135 140
Gly Gly Gly Gly Thr Thr Ser Gly Phe Ser Ile Leu His Gly Glu Ala
145 150 155 160
Ser Met Gly Gly Gly Gly Ala Gly Ala Gly Ala Gly Asn Asn Met Met
165 170 175
Asn Ala Gly Met Phe Ser Gly Phe Gly Arg Ser Gly Ser Gly Ala Lys
180 185 190
Glu Gly Ser Thr Ser Leu Ser Val Asp Val Arg Gly Gly Thr Ser Ser
195 200 205
Gly Ala Gln Ser Gly Asp Gly Glu Tyr Leu Lys Val Gly Thr Glu Glu
210 215 220
Glu Gly Ser
225
<210>85
<211>549
<212>DNA
<213>玉蜀黍
<400>85
atgcagcagc cgatgcacat gcagccacag gcgccggcga taaccccagc tgccggaatc 60
agcacggagc agatccaaaa gtatctggat gagaataagc agcttatttt ggctattttg 120
gaaaatcaga acctaggaaa attggcagaa tgtgctcagt atcaatcaca acttcagaag 180
aacctcttgt atctcgctgc aatcgcagat gctcaaccgc agactgctgt aagccgccct 240
cagatggcgc cgcctggtgg atcgcctgga gtagggcagt acatgtcaca ggtgcctatg 300
ttcccaccga ggacacctct tacaccccag cagatgcagg agcagcagct tcagcagcag 360
caggctcagt tgctaaactt cagtggccaa atggttgcta gaccaggcat ggtcaacggc 420
atggctcagt ccatgcaagc tcagctacca ccgggtgtga acaagcagga tgctggtggg 480
gtcgcctctg agccctcggg caccgagagc cacaggagca ctggtggtga cgatggtgga 540
agcgactag 549
<210>86
<211>182
<212>PRT
<213>玉蜀黍
<400>86
Met Gln Gln Pro Met His Met Gln Pro Gln Ala Pro Ala Ile Thr Pro
1 5 10 15
Ala Ala Gly Ile Ser Thr Glu Gln Ile Gln Lys Tyr Leu Asp Glu Asn
20 25 30
Lys Gln Leu Ile Leu Ala Ile Leu Glu Asn Gln Asn Leu Gly Lys Leu
35 40 45
Ala Glu Cys Ala Gln Tyr Gln Ser Gln Leu Gln Lys Asn Leu Leu Tyr
50 55 60
Leu Ala Ala Ile Ala Asp Ala Gln Pro Gln Thr Ala Val Ser Arg Pro
65 70 75 80
Gln Met Ala Pro Pro Gly Gly Ser Pro Gly Val Gly Gln Tyr Met Ser
85 90 95
Gln Val Pro Met Phe Pro Pro Arg Thr Pro Leu Thr Pro Gln Gln Met
100 105 110
Gln Glu Gln Gln Leu Gln Gln Gln Gln Ala Gln Leu Leu Asn Phe Ser
115 120 125
Gly Gln Met Val Ala Arg Pro Gly Met Val Asn Gly Met Ala Gln Ser
130 135 140
Met Gln Ala Gln Leu Pro Pro Gly Val Asn Lys Gln Asp Ala Gly Gly
145 150 155 160
Val Ala Ser Glu Pro Ser Gly Thr Glu Ser His Arg Ser Thr Gly Gly
165 170 175
Asp Asp Gly Gly Ser Asp
180
<210>87
<211>1173
<212>DNA
<213>人(Homo sapiens)
<400>87
atgggcggca acatgtctgt ggctttcgcg gccccgaggc agcgaggcaa gggggagatc 60
actcccgctg cgattcagaa gatgttggat gacaataacc atcttattca gtgtataatg 120
gactctcaga ataaaggaaa gacctcagag tgttctcagt atcagcagat gttgcacaca 180
aacttggtat accttgctac aatagcagat tctaatcaaa atatgcagtc tcttttacca 240
gcaccaccca cacagaatat gcctatgggt cctggaggga tgaatcagag cggccctccc 300
ccacctccac gctctcacaa catgccttca gatggaatgg taggtggggg tcctcctgca 360
ccgcacatgc agaaccagat gaacggccag atgcctgggc ctaaccatat gcctatgcag 420
ggacctggac ccaatcaact caatatgaca aacagttcca tgaatatgcc ttcaagtagc 480
catggatcca tgggaggtta caaccattct gtgccatcat cacagagcat gccagtacag 540
aatcagatga caatgagtca gggacaacca atgggaaact atggtcccag accaaatatg 600
agtatgcagc caaaccaagg tccaatgatg catcagcagc ctccttctca gcaatacaat 660
atgccacagg gaggcggaca gcattaccaa ggacagcagc cacctatggg aatgatgggt 720
caagttaacc aaggcaatca tatgatgggt cagagacaga ttcctcccta tagacctcct 780
caacagggcc caccacagca gtactcaggc caggaagact attacgggga ccaatacagt 840
catggtggac aaggtcctcc agaaggcatg aaccagcaat attaccctga tggaaattca 900
cagtatggcc aacagcaaga tgcataccag ggaccacctc cacaacaggg atatccaccc 960
cagcagcagc agtacccagg gcagcaaggt tacccaggac agcagcaggg ctacggtcct 1020
tcacagggtg gtccaggtcc tcagtatcct aactacccac agggacaagg tcagcagtat 1080
ggaggatata gaccaacaca gcctggacca ccacagccac cccagcagag gccttatgga 1140
tatgaccagg gacagtatgg aaattaccagcag 1173
<210>88
<211>391
<212>PRT
<213>人
<400>88
Met Gly Gly Asn Met Ser Val Ala Phe Ala Ala Pro Arg Gln Arg Gly
1 5 10 15
Lys Gly Glu Ile Thr Pro Ala Ala Ile Gln Lys Met Leu Asp Asp Asn
20 25 30
Asn His Leu Ile Gln Cys Ile Met Asp Ser Gln Asn Lys Gly Lys Thr
35 40 45
Ser Glu Cys Ser Gln Tyr Gln Gln Met Leu His Thr Asn Leu Val Tyr
50 55 60
Leu Ala Thr Ile Ala Asp Ser Asn Gln Asn Met Gln Ser Leu Leu Pro
65 70 75 80
Ala Pro Pro Thr Gln Asn Met Pro Met Gly Pro Gly Gly Met Asn Gln
85 90 95
Ser Gly Pro Pro Pro Pro Pro Arg Ser His Asn Met Pro Ser Asp Gly
100 105 110
Met Val Gly Gly Gly Pro Pro Ala Pro His Met Gln Asn Gln Met Asn
115 120 125
Gly Gln Met Pro Gly Pro Asn His Met Pro Met Gln Gly Pro Gly Pro
130 135 140
Asn Gln Leu Asn Met Thr Asn Ser Ser Met Asn Met Pro Ser Ser Ser
145 150 155 160
His Gly Ser Met Gly Gly Tyr Asn His Ser Val Pro Ser Ser Gln Ser
165 170 175
Met Pro Val Gln Asn Gln Met Thr Met Ser Gln Gly Gln Pro Met Gly
180 185 190
Asn Tyr Gly Pro Arg Pro Asn Met Ser Met Gln Pro Asn Gln Gly Pro
195 200 205
Met Met His Gln Gln Pro Pro Ser Gln Gln Tyr Asn Met Pro Gln Gly
210 215 220
Gly Gly Gln His Tyr Gln Gly Gln Gln Pro Pro Met Gly Met Met Gly
225 230 235 240
Gln Val Asn Gln Gly Asn His Met Met Gly Gln Arg Gln Ile Pro Pro
245 250 255
Tyr Arg Pro Pro Gln Gln Gly Pro Pro Gln Gln Tyr Ser Gly Gln Glu
260 265 270
Asp Tyr Tyr Gly Asp Gln Tyr Ser His Gly Gly Gln Gly Pro Pro Glu
275 280 285
Gly Met Asn Gln Gln Tyr Tyr Pro Asp Gly Asn Ser Gln Tyr Gly Gln
290 295 300
Gln Gln Asp Ala Tyr Gln Gly Pro Pro Pro Gln Gln Gly Tyr Pro Pro
305 310 315 320
Gln Gln Gln Gln Tyr Pro Gly Gln Gln Gly Tyr Pro Gly Gln Gln Gln
325 330 335
Gly Tyr Gly Pro Ser Gln Gly Gly Pro Gly Pro Gln Tyr Pro Asn Tyr
340 345 350
Pro Gln Gly Gln Gly Gln Gln Tyr Gly Gly Tyr Arg Pro Thr Gln Pro
355 360 365
Gly Pro Pro Gln Pro Pro Gln Gln Arg Pro Tyr Gly Tyr Asp Gln Gly
370 375 380
Gln Tyr Gly Asn Tyr Gln Gln
385 390
<210>89
<211>627
<212>DNA
<213>洋葱(Allium cepa)
<400>89
atgcagcagc cgcagccagc gatgggaacc atgggctcggtgccacctac tagcatcacc 60
accgaacaga ttcaaaggta cttggatgag aacaaacagt taatattggc aattttggat 120
aatcaaaatt taggaagact gaatgagtgt gctcaatatc aagctcagct tcaaaagaat 180
ctgctttacc tggcagcaat agctgatgct cagcctcagt ctcctgcggt gcgtctgcag 240
atgatgcctc aaggtgcagc tgccacgcct caagctggaa accaatttat gcagcagcag 300
agccctaatt tccctcccaa aacaggaatg caatttactc ctcaacaagt acaagaattg 360
cagcagcaac agctacaaca tcagccacat atgatgcctc catttcaagg tcaaatgggt 420
atgagaccta tgaatggaat gcaggcagca atgcatgcag attcatctct tgcttataac 480
actaacaata agcaagatgc aggaaacgca gcttatgaaa atactgctgc caacacagat 540
ggttccattc aaaagaaaac agcaaatgat gatttagacc cttctgcagc aaaccctaga 600
aggtctgaag atgccaaatc atcatga 627
<210>90
<211>208
<212>PRT
<213>洋葱
<400>90
Met Gln Gln Pro Gln Pro Ala Met Gly Thr Met Gly Ser Val Pro Pro
1 5 10 15
Thr Ser Ile Thr Thr Glu Gln Ile Gln Arg Tyr Leu Asp Glu Asn Lys
20 25 30
Gln Leu Ile Leu Ala Ile Leu Asp Asn Gln Asn Leu Gly Arg Leu Asn
35 40 45
Glu Cys Ala Gln Tyr Gln Ala Gln Leu Gln Lys Asn Leu Leu Tyr Leu
50 55 60
Ala Ala Ile Ala Asp Ala Gln Pro Gln Ser Pro Ala Val Arg Leu Gln
65 70 75 80
Met Met Pro Gln Gly Ala Ala Ala Thr Pro Gln Ala Gly Asn Gln Phe
85 90 95
Met Gln Gln Gln Ser Pro Asn Phe Pro Pro Lys Thr Gly Met Gln Phe
100 105 110
Thr Pro Gln Gln Val Gln Glu Leu Gln Gln Gln Gln Leu Gln His Gln
115 120 125
Pro His Met Met Pro Pro Phe Gln Gly Gln Met Gly Met Arg Pro Met
130 135 140
Asn Gly Met Gln Ala Ala Met His Ala Asp Ser Ser Leu Ala Tyr Asn
145 150 155 160
Thr Asn Asn Lys Gln Asp Ala Gly Asn Ala Ala Tyr Glu Asn Thr Ala
165 170 175
Ala Asn Thr Asp Gly Ser Ile Gln Lys Lys Thr Ala Asn Asp Asp Leu
180 185 190
Asp Pro Ser Ala Ala Asn Pro Arg Arg Ser Glu Asp Ala Lys Ser Ser
195 200 205
<210>91
<211>633
<212>DNA
<213>Aquilegia formosa x Aquilegia pubescens
<400>91
atgcaacaca tgcagatgca gcccatgatg ccaccttata gtgccaacag cgtcactact 60
gatcatatcc aacagtactt ggatgaaaat aaggcgttga ttctgaagat acttgagaac 120
caaaattcgg gaaaagttag tgaatgtgca gagaaccaag caagacttca acgaaatctt 180
atgtatctgg ctgcaattgc tgattctcaa ccacagcctc ccaatatgca tgctcagtac 240
tctaatgcgg gtataccacc tggtgcacat tacctacaac accaacaggc ccaacagatg 300
acacaacagt cgctcatggc tgctcgatca aatatgctgt atgctcagcc aatcacagga 360
atgcagcaac agcaagcaat gcatagccag cttggcatga gctctggtgg taacagtgga 420
ctccacatga tgcacaatga gggcagcatg ggaggtagtg gggcacttgg aagctattct 480
gattatggcc gtggcagtgg tggtggagta actatcgcta gcaaacaaga tggtggaagt 540
ggttctggtg aaggacgagg tggaaactct ggaggccaaa gtgcagatgg aggtgaatct 600
ctttacctga aaaacagtga cgaagggaac taa 633
<210>92
<211>210
<212>PRT
<213>Aquilegia formosa x Aquilegia pubescens
<400>92
Met Gln His Met Gln Met Gln Pro Met Met Pro Pro Tyr Ser Ala Asn
1 5 10 15
Ser Val Thr Thr Asp His Ile Gln Gln Tyr Leu Asp Glu Asn Lys Ala
20 25 30
Leu Ile Leu Lys Ile Leu Glu Asn Gln Asn Ser Gly Lys Val Ser Glu
35 40 45
Cys Ala Glu Asn Gln Ala Arg Leu Gln Arg Asn Leu Met Tyr Leu Ala
50 55 60
Ala Ile Ala Asp Ser Gln Pro Gln Pro Pro Asn Met His Ala Gln Tyr
65 70 75 80
Ser Asn Ala Gly Ile Pro Pro Gly Ala His Tyr Leu Gln His Gln Gln
85 90 95
Ala Gln Gln Met Thr Gln Gln Ser Leu Met Ala Ala Arg Ser Asn Met
100 105 110
Leu Tyr Ala Gln Pro Ile Thr Gly Met Gln Gln Gln Gln Ala Met His
115 120 125
Ser Gln Leu Gly Met Ser Ser Gly Gly Asn Ser Gly Leu His Met Met
130 135 140
His Asn Glu Gly Ser Met Gly Gly Ser Gly Ala Leu Gly Ser Tyr Ser
145 150 155 160
Asp Tyr Gly Arg Gly Ser Gly Gly Gly Val Thr Ile Ala Ser Lys Gln
165 170 175
Asp Gly Gly Ser Gly Ser Gly Glu Gly Arg Gly Gly Asn Ser Gly Gly
180 185 190
Gln Ser Ala Asp Gly Gly Glu Ser Leu Tyr Leu Lys Asn Ser Asp Glu
195 200 205
Gly Asn
210
<210>93
<211>615
<212>DNA
<213>二穗短柄草(Brachypodium distachyon)
<400>93
atgcagcagg cgatgtccat gtccccgggg tcggccggcg cggtgccgcc tccggccggc 60
atcaccacag agcagatcca aaagtatttg gatgaaaata agcaacttat tttggccatc 120
ctggaaaatc agaacctagg aaagttgact gaatgtgctc agtatcaagc tcaacttcag 180
aagaatctct tgtatctggc tgccattgcg gatgcccaac caccacagaa ccctggaagt 240
cgcccccaga tggtgcagcc tggtggtatg ccaggtgcag ggcattacat gtcgcaagta 300
ccaatgttcc ctccaagaac ccctttaacc ccacaacaga tgcaagagca acagcaccag 360
cagcttcagc agcagcaagc acaggctctt gctttcccca gccagatggt catgagacca 420
ggtactgtga acggcatgca gcctatgcaa gctgatctcc aagcagcagc agcagcacct 480
ggcctggcag acagccgagg aagtaagcag gacgcagcgg tagctggggc catctcggaa 540
ccttctggca ccgagagtca caagagtaca ggagcggatc atgaggcagg tggcgatgta 600
gctgagcaat cctaa 615
<210>94
<211>204
<212>PRT
<213>二穗短柄草
<400>94
Met Gln Gln Ala Met Ser Met Ser Pro Gly Ser Ala Gly Ala Val Pro
1 5 10 15
Pro Pro Ala Gly Ile Thr Thr Glu Gln Ile Gln Lys Tyr Leu Asp Glu
20 25 30
Asn Lys Gln Leu Ile Leu Ala Ile Leu Glu Asn Gln Asn Leu Gly Lys
35 40 45
Leu Thr Glu Cys Ala GlnTyr Gln Ala Gln Leu Gln Lys Asn Leu Leu
50 55 60
Tyr Leu Ala Ala Ile Ala Asp Ala Gln Pro Pro Gln Asn Pro Gly Ser
65 70 75 80
Arg Pro Gln Met Val Gln Pro Gly Gly Met Pro Gly Ala Gly His Tyr
85 90 95
Met Ser Gln Val Pro Met Phe Pro Pro Arg Thr Pro Leu Thr Pro Gln
100 105 110
Gln Met Gln Glu Gln Gln His Gln Gln Leu Gln Gln Gln Gln Ala Gln
115 120 125
Ala Leu Ala Phe Pro Ser Gln Met Val Met Arg Pro Gly Thr Val Asn
130 135 140
Gly Met Gln Pro Met Gln Ala Asp Leu Gln Ala Ala Ala Ala Ala Pro
145 150 155 160
Gly Leu Ala Asp Ser Arg Gly Ser Lys Gln Asp Ala Ala Val Ala Gly
165 170 175
Ala Ile Ser Glu Pro Ser Gly Thr Glu Ser His Lys Ser Thr Gly Ala
180 185 190
Asp His Glu Ala Gly Gly Asp Val Ala Glu Gln Ser
195 200
<210>95
<211>636
<212>DNA
<213>欧洲油菜
<400>95
atgcagcagc agcagcagca gcagcagcag cctccgcaaa tgtttccgat ggctccttcg 60
atgccgccaa ctaacatcac caccgaacag atccaaaagt accttgagga gaacaagaag 120
ctgataatgg caatcatgga aaatcagaat cttggcaagc ttgcagagtg tgcacagtac 180
caagctcttc tccagaagaa cttaatgtac ctcgctgcta ttgctgatgc tcaacctcct 240
ccatctaccg ctggagctac accaccacca gctatggctt cccagatggg ggcaccgcat 300
cctgggatgc aaccgccgag ctactttatg caacacccac aagcttcagg gatggctcaa 360
caagcaccac ccgctggtat cttccctccg agaggtcctt tgcagtttgg tagcccacac 420
cagcttcagg atccgcaaca gcagcatatg catcaacagg ctatgcaagg acacatgggg 480
atgcgaccaa tgggtatcaa caacaacaat gggatgcagc atcagatgca gcaacaacaa 540
ccagaaacct ctcttggagg aagcgctgca aacgtggggc ttagaggtgg aaagcaagat 600
ggagcagatg gacaaggaaa agatgatggc aaatga 636
<210>96
<211>203
<212>PRT
<213>欧洲油菜
<400>96
Met Gln Gln His Leu Met Gln Met Gln Pro Met Met Ala Gly Tyr Tyr
1 5 10 15
Pro Ser Asn Val Thr Ser Asp His Ile Gln Gln Tyr Leu Asp Glu Asn
20 25 30
Lys Ser Leu Ile Leu Lys Ile Val Glu Ser Gln Asn Ser Gly Lys Leu
35 40 45
Ser Glu Cys Ala Glu Asn Gln Ala Arg Leu Gln Arg Asn Leu Met Tyr
50 55 60
Leu Ala Ala Ile Ala Asp Ser Gln Pro Gln Pro Pro Ser Val His Ser
65 70 75 80
Gln Tyr Gly Ser Ala Gly Gly Gly Leu Ile Gln Gly Glu Gly Ala Ser
85 90 95
His Tyr Leu Gln Gln Gln Gln Ala Thr Gln Gln Gln Gln Met Thr Gln
100 105 110
Gln Ser Leu Met Ala Ala Arg Ser Ser Met Met Tyr Gln Gln Gln Gln
115 120 125
Gln Pro Tyr Ala Thr Leu Gln His Gln Gln Leu His His Ser Gln Leu
130 135 140
Gly Met Ser Ser Ser Ser Gly Gly Gly Ser Ser Gly Leu His Ile Leu
145 150 155 160
Gln Gly Glu Ala Gly Gly Phe His Glu Phe Gly Arg Gly Lys Pro Glu
165 170 175
Met Gly Ser Gly Glu Gly Arg Gly Gly Ser Ser Gly Asp Gly Gly Glu
180 185 190
Thr Leu Tyr Leu Lys Ser Ser Asp Asp Gly Asn
195 200
<210>97
<211>636
<212>DNA
<213>甜橙
<400>97
atgcagcagc caccgcaaat gatccctgtt atgccttcat ttccacccac caacatcacc 60
acagagcaga ttcaaaagta ccttgatgag aacaaaaagt tgattttggc aattttggac 120
aatcaaaatc ttggaaagct tacagaatgt gcccactatc aagctcagct tcaaaagaat 180
ttaatgtatt tagctgcaat tgctgatgca caaccacaag caccaacaat gcctcctcag 240
atggctccac atcctgcaat gcaagctagt gggtattaca tgcaacatcc tcaggcggca 300
gcaatggctc agcaacaagg aatctttccc caaaagatgc cattacaatt caataaccct 360
catcaactac aggatcctca acagcagcta caccaacatc aagccatgca agcacaaatg 420
ggaatgagac cgggtgccac taacaatggt atgcatccca tgcatgctga aagctctctt 480
ggaggtggca gcagtggagg acccccttca gcatcaggcc caggtgacat acgtggtgga 540
aataagcaag atgcctcgga ggctgggact actggtgctg atggccaggg cagttcggct 600
ggtgggcatg gtggggatgg agaggaggca aagtga 636
<210>98
<211>211
<212>PRT
<213>甜橙
<400>98
Met Gln Gln Pro Pro Gln Met Ile Pro Val Met Pro Ser Phe Pro Pro
1 5 10 15
Thr Asn Ile Thr Thr Glu Gln Ile Gln Lys Tyr Leu Asp Glu Asn Lys
20 25 30
Lys Leu Ile Leu Ala Ile Leu Asp Asn Gln Asn Leu Gly Lys Leu Thr
35 40 45
Glu Cys Ala His Tyr Gln Ala Gln Leu Gln Lys Asn Leu Met Tyr Leu
50 55 60
Ala Ala Ile Ala Asp Ala Gln Pro Gln Ala Pro Thr Met Pro Pro Gln
65 70 75 80
Met Ala Pro His Pro Ala Met Gln Ala Ser Gly Tyr Tyr Met Gln His
85 90 95
Pro Gln Ala Ala Ala Met Ala Gln Gln Gln Gly Ile Phe Pro Gln Lys
100 105 110
Met Pro Leu Gln Phe Asn Asn Pro His Gln Leu Gln Asp Pro Gln Gln
115 120 125
Gln Leu His Gln His Gln Ala Met Gln Ala Gln Met Gly Met Arg Pro
130 135 140
Gly Ala Thr Asn Asn Gly Met His Pro Met His Ala Glu Ser Ser Leu
145 150 155 160
Gly Gly Gly Ser Ser Gly Gly Pro Pro Ser Ala Ser Gly Pro Gly Asp
165 170 175
Ile Arg Gly Gly Asn Lys Gln Asp Ala Ser Glu Ala Gly Thr Thr Gly
180 185 190
Ala Asp Gly Gln Gly Ser Ser Ala Gly Gly His Gly Gly Asp Gly Glu
195 200 205
Glu Ala Lys
210
<210>99
<211>597
<212>DNA
<213>乳浆大戟(Euphorbia esula)
<400>99
atgcagcagc aaccgcagat gatgcctatg atgccttcat atccaccagc aaacattacc 60
acggagcaaa tccaaaagta tcttgatgaa aataaaaaat tgattttggc gatcttggat 120
aatcaaaatc ttggaaaact cgctgagtgt gcacagtatc aagccctgct gcaaaaaaat 180
ctgatgtatt tagccgcaat tgctgatgca caaccccaga ccccacccat gccacctcag 240
atgtccccac atccggctat gcaacaagga gcatattaca tgcaacatcc tcaggctgca 300
gcagcagcaa tggctcatca gtcgggtatt ttcccaccaa agatgtctcc gttacaattc 360
aataatcctc atcaaataca ggacccccag cagttacatc aagcagccct ccaagggcaa 420
atgggaatga ggcccatggg gcccaataac gggatgcatc cgatgcaccc cgaggcaaat 480
cttggaggat ctaatgatgg tcgtggagga aacaaacagg atgctccgga gacgggagca 540
tcgggaggtg atgggcaagg caattctggt ggtgatgggg ctgaagatgg gaaatga 597
<210>100
<211>198
<212>PRT
<213>乳浆大戟
<400>100
Met Gln Gln Gln Pro Gln Met Met Pro Met Met Pro Ser Tyr Pro Pro
1 5 10 15
Ala Asn Ile Thr Thr Glu Gln Ile Gln Lys Tyr Leu Asp Glu Asn Lys
20 25 30
Lys Leu Ile Leu Ala Ile Leu Asp Asn Gln Asn Leu Gly Lys Leu Ala
35 40 45
Glu Cys Ala Gln Tyr Gln Ala Leu Leu Gln Lys Asn Leu Met Tyr Leu
50 55 60
Ala Ala Ile Ala Asp Ala Gln Pro Gln Thr Pro Pro Met Pro Pro Gln
65 70 75 80
Met Ser Pro His Pro Ala Met Gln Gln Gly Ala Tyr Tyr Met Gln His
85 90 95
Pro Gln Ala Ala Ala Ala Ala Met Ala His Gln Ser Gly Ile Phe Pro
100 105 110
Pro Lys Met Ser Pro Leu Gln Phe Asn Asn Pro His Gln Ile Gln Asp
115 120 125
Pro Gln Gln Leu His Gln Ala Ala Leu Gln Gly Gln Met Gly Met Arg
130 135 140
Pro Met Gly Pro Asn Asn Gly Met His Pro Met His Pro Glu Ala Asn
145 150 155 160
Leu Gly Gly Ser Asn Asp Gly Arg Gly Gly Asn Lys Gln Asp Ala Pro
165 170 175
Glu Thr Gly Ala Ser Gly Gly Asp Gly Gln Gly Asn Ser Gly Gly Asp
180 185 190
Gly Ala Glu Asp Gly Lys
195
<210>101
<211>642
<212>DNA
<213>大豆
<400>101
atgcagcaga caccgccaat gattcctatg atgccttctt tcccacctac gaacataacc 60
accgagcaga ttcaaaaata ccttgatgag aacaagaagc tgattctggc aatattggac 120
aatcaaaatc ttggaaaact tgcagaatgt gcccagtacc aagctcagct tcaaaagaat 180
ttgatgtatt tagctgcaat tgctgatgcc cagcctcaaa ccccggccat gcctccgcag 240
atggcaccgc accctgccat gcaaccagga ttctatatgc aacatcctca ggctgctgca 300
gcagcaatgg ctcagcagca gcaaggaatg ttcccccaga aaatgccatt gcaatttggc 360
aatccacatc aaatgcagga acaacaacag cagctacacc agcaggccat ccaaggtcaa 420
atgggactta gacctggaga tataaataat ggcatgcatc caatgcacag tgaggctgct 480
cttggaggtg gaaacagcgg tggtccacct tcggctactg gtccaaacga tgcacgtggt 540
ggaagcaagc aagatgcctc tgaggctgga acagctggtg gagacggcca aggcagctcc 600
gcggctgc tc ataacagtgg agatggtgaa gaggcaaagt ga 642
<210>102
<211>213
<212>PRT
<213>大豆
<400>102
Met Gln Gln Thr Pro Pro Met Ile Pro Met Met Pro Ser Phe Pro Pro
1 5 10 15
Thr Asn Ile Thr Thr Glu Gln Ile Gln Lys Tyr Leu Asp Glu Asn Lys
20 25 30
Lys Leu Ile Leu Ala Ile Leu Asp Asn Gln Asn Leu Gly Lys Leu Ala
35 40 45
Glu Cys Ala Gln Tyr Gln Ala Gln Leu Gln Lys Asn Leu Met Tyr Leu
50 55 60
Ala Ala Ile Ala Asp Ala Gln Pro Gln Thr Pro Ala Met Pro Pro Gln
65 70 75 80
Met Ala Pro His Pro Ala Met Gln Pro Gly Phe Tyr Met Gln His Pro
85 90 95
Gln Ala Ala Ala Ala Ala Met Ala Gln Gln Gln Gln Gly Met Phe Pro
100 105 110
Gln Lys Met Pro Leu Gln Phe Gly Asn Pro His Gln Met Gln Glu Gln
115 120 125
Gln Gln Gln Leu His Gln Gln Ala Ile Gln Gly Gln Met Gly Leu Arg
130 135 140
Pro Gly Asp Ile Asn Asn Gly Met His Pro Met His Ser Glu Ala Ala
145 150 155 160
Leu Gly Gly Gly Asn Ser Gly Gly Pro Pro Ser Ala Thr Gly Pro Asn
165 170 175
Asp Ala Arg Gly Gly Ser Lys Gln Asp Ala Ser Glu Ala Gly Thr Ala
180 185 190
Gly Gly Asp Gly Gln Gly Ser Ser Ala Ala Ala His Asn Ser Gly Asp
195 200 205
Gly Glu Glu Ala Lys
210
<210>103
<211>633
<212>DNA
<213>野大豆(Glycine soya)
<400>103
atgcagcaga caccgcctat gattcctatg atgccttcgt tcccacctac gaacataacc 60
accgagcaga ttcaaaaata ccttgatgag aacaagaagc tgattctggc aatattggac 120
aatcaaaatc ttggaaaact tgcagaatgt gcccagtacc aagctcagct tcaaaagaat 180
ttgatgtatt tagctgcaat tgctgatgcc cagcctcaaa caccagccat gcctccacag 240
atggcaccac accctgccat gcaaccagga ttctatatgc aacatcctca ggctgcagca 300
gcagcaatgg ctcagcagca gcagcaagga atgttccccc agaaaatgcc attgcaattt 360
ggcaatccac atcaaatgca ggaacaacag cagcagctac accagcaagc catccaaggt 420
caaatgggac tgagacctgg aggaataaat aatggcatgc atccaatgca caatgagggc 480
ggcaacagcg gtggtccacc ctcggctacc ggtccgaacg acgcacgtgg tggaagcaag 540
caagatgctt ctgaggctgg aacagctggt ggagatggcc aaggcagctc tgcagctgct 600
cataacagtg gagatggtga agaggcaaag tga 633
<210>104
<211>210
<212>PRT
<213>野大豆
<400>104
Met Gln Gln Thr Pro Pro Met Ile Pro Met Met Pro Ser Phe Pro Pro
1 5 10 15
Thr Asn Ile Thr Thr Glu Gln Ile Gln Lys Tyr Leu Asp Glu Asn Lys
20 25 30
Lys Leu Ile Leu Ala Ile Leu Asp Asn Gln Asn Leu Gly Lys Leu Ala
35 40 45
Glu Cys Ala Gln Tyr Gln Ala Gln Leu Gln Lys Asn Leu Met Tyr Leu
50 55 60
Ala Ala Ile Ala Asp Ala Gln Pro Gln Thr Pro Ala Met Pro Pro Gln
65 70 75 80
Met Ala Pro His Pro Ala Met Gln Pro Gly Phe Tyr Met Gln His Pro
85 90 95
Gln Ala Ala Ala Ala Ala Met Ala Gln Gln Gln Gln Gln Gly Met Phe
100 105 110
Pro Gln Lys Met Pro Leu Gln Phe Gly Asn Pro His Gln Met Gln Glu
115 120 125
Gln Gln Gln Gln Leu His Gln Gln Ala Ile Gln Gly Gln Met Gly Leu
130 135 140
Arg Pro Gly Gly Ile Asn Asn Gly Met His Pro Met His Asn Glu Gly
145 150 155 160
Gly Asn Ser Gly Gly Pro Pro Ser Ala Thr Gly Pro Asn Asp Ala Arg
165 170 175
Gly Gly Ser Lys Gln Asp Ala Ser Glu Ala Gly Thr Ala Gly Gly Asp
180 185 190
Gly Gln Gly Ser Ser Ala Ala Ala His Asn Ser Gly Asp Gly Glu Glu
195 200 205
Ala Lys
210
<210>105
<211>690
<212>DNA
<213>陆地棉(Gossypium hirsutum)
<400>105
atgcagcagc acctgatgca gatgcagccc atgatggcag cttattatcc caacaacgtc 60
actactgatc atattcaaca gtatctcgat gagaacaagt cattgatctt aaagattgtt 120
gagagccaga attctgggaa attgagtgaa tgtgctgaga accaagcaag gctgcagcga 180
aacctcatgt acctggctgc cattgcggat tctcaacccc aaccacccac cgtgcatgca 240
cagtttccat ctggtggtat catgcagcca ggagctgggc actacatgca gcaccaacaa 300
gctcaacaaa tgacacaaca gtcgcttatg gctgctcggt cctcaatgtt gtattctcag 360
caaccatttt ctgcactgca acaacaacag cagcaagctt tgcacagtca gcttggcatg 420
agctctggcg gaagcacagg ccttcatatg ctgcaaactg aatctagtac tgcaggtggc 480
agtggagcac ttggggccgg agggtttcct gattttggac gtggttcttc tggagaaggc 540
atccatggtg gcaggccaat ggcaggtgga agcaagcaag atatcgggag tgccggctca 600
gctgaaggtc gtggaggaag ctctggtggt cagggtggtg gtgatggggg tgaaaccctt 660
tacttaaaag cagccgatga tgggaactga 690
<210>106
<211>229
<212>PRT
<213>陆地棉
<400>106
Met Gln Gln His Leu Met Gln Met Gln Pro Met Met Ala Ala Tyr Tyr
1 5 10 15
Pro Asn Asn Val Thr Thr Asp His Ile Gln Gln Tyr Leu Asp Glu Asn
20 25 30
Lys Ser Leu Ile Leu Lys Ile Val Glu Ser Gln Asn Ser Gly Lys Leu
35 40 45
Ser Glu Cys Ala Glu Asn Gln Ala Arg Leu Gln Arg Asn Leu Met Tyr
50 55 60
Leu Ala Ala Ile Ala Asp Ser Gln Pro Gln Pro Pro Thr Val His Ala
65 70 75 80
Gln Phe Pro Ser Gly Gly Ile Met Gln Pro Gly Ala Gly His Tyr Met
85 90 95
Gln His Gln Gln Ala Gln Gln Met Thr Gln Gln Ser Leu Met Ala Ala
100 105 110
Arg Ser Ser Met Leu Tyr Ser Gln Gln Pro Phe Ser Ala Leu Gln Gln
115 120 125
Gln Gln Gln Gln Ala Leu His Ser Gln Leu Gly Met Ser Ser Gly Gly
130 135 140
Ser Thr Gly Leu His Met Leu Gln Thr Glu Ser Ser Thr Ala Gly Gly
145 150 155 160
Ser Gly Ala Leu Gly Ala Gly Gly Phe Pro Asp Phe Gly Arg Gly Ser
165 170 175
Ser Gly Glu Gly Ile His Gly Gly Arg Pro Met Ala Gly Gly Ser Lys
180 185 190
Gln Asp Ile Gly Ser Ala Gly Ser Ala Glu Gly Arg Gly Gly Ser Ser
195 200 205
Gly Gly Gln Gly Gly Gly Asp Gly Gly Glu Thr Leu Tyr Leu Lys Ala
210 215 220
Ala Asp Asp Gly Asn
225
<210>107
<211>642
<212>DNA
<213>陆地棉
<400>107
atgccgcagc caccgcaaat gattcctgtg atgccttcat atccacctac taatatcact 60
actgaacaga ttcagaagta ccttgatgag aataagaagt tgattttggc aattttggac 120
aatcagaatc ttggaaaact cgctgaatgc gcccagtatc aagctcagct gcaaaagaat 180
ttgatgtatt tagctgcaat tgcggatgct caacctcaat caacgccagc aatgtcgcct 240
cagatggcac cgcatccagc aatgcaaccc ggaggatatt ttatgcaaca tcctcaagct 300
gctgcaatgt cacagcaacc tggcatgtac cctcaaaagg tgccattgca attcaatagt 360
ccgcatcaaa tgcaggaccc tcagcacctc ctatatcagc agcatcaaca agcaatgcaa 420
ggtcaaatgg gaatcaggcc tgggggaccc aataatagca tgcatcccat gcattcagag 480
gctagccttg gaggcggcag cagtggtggt ccccctcaac cttcaggccc aagtgatgga 540
cgtgctggaa acaagcaaga gggctccgaa gctggtggta atgggcaggg cagcacaact 600
ggtgggcatg gtggcggtga tggagcggat gaggcaaagt ga 642
<210>108
<211>213
<212>PRT
<213>陆地棉
<400>108
Met Pro Gln Pro Pro Gln Met Ile Pro Val Met Pro Ser Tyr Pro Pro
1 5 10 15
Thr Asn Ile Thr Thr Glu Gln Ile Gln Lys Tyr Leu Asp Glu Asn Lys
20 25 30
Lys Leu Ile Leu Ala Ile Leu Asp Asn Gln Asn Leu Gly Lys Leu Ala
35 40 45
Glu Cys Ala Gln Tyr Gln Ala Gln Leu Gln Lys Asn Leu Met Tyr Leu
50 55 60
Ala Ala Ile Ala Asp Ala Gln Pro Gln Ser Thr Pro Ala Met Ser Pro
65 70 75 80
Gln Met Ala Pro His Pro Ala Met Gln Pro Gly Gly Tyr Phe Met Gln
85 90 95
His Pro Gln Ala Ala Ala Met Ser Gln Gln Pro Gly Met Tyr Pro Gln
100 105 110
Lys Val Pro Leu Gln Phe Asn Ser Pro His Gln Met Gln Asp Pro Gln
115 120 125
His Leu Leu Tyr Gln Gln His Gln Gln Ala Met Gln Gly Gln Met Gly
130 135 140
Ile Arg Pro Gly Gly Pro Asn Asn Ser Met His Pro Met His Ser Glu
145 150 155 160
Ala Ser Leu Gly Gly Gly Ser Ser Gly Gly Pro Pro Gln Pro Ser Gly
165 170 175
Pro Ser Asp Gly Arg Ala Gly Asn Lys Gln Glu Gly Ser Glu Ala Gly
180 185 190
Gly Asn Gly Gln Gly Ser Thr Thr Gly Gly His Gly Gly Gly Asp Gly
195 200 205
Ala Asp Glu Ala Lys
210
<210>109
<211>561
<212>DNA
<213>大麦
<400>109
atgcagcaag cgatgcccat gccgccggcg gcggcggcgc ctgggatgcc tccttctgcc 60
ggcctcagca ccgagcagat ccaaaagtac ctggatgaaa ataaacaact aattttggct 120
atcttggaaa atcagaacct gggaaagttg gcggaatgtg ctcagtatca agctcagctt 180
cagaagaatc ttttgtattt ggctgcgatt gctgatactc agccacagac ctctgtaagc 240
cgtcctcaga tggcaccacc tgctgcatcc ccaggggcag ggcattacat gtcacaggtg 300
ccaatgttcc ctccgaggac ccctctaacg cctcagcaga tgcaggagca gcaactacag 360
caacaacagg ctcagatgct tccgtttgct ggtcaaatgg ttgcgagacc cggggctgtc 420
aatggcattc cccaggcccc tcaagttgaa caaccagcct atgcagcagg tggggccagt 480
tccgagcctt ctggcaccga gagccacagg agcactggcg ccgataacga tggtgggagc 540
ggcttggctg accagtccta a 561
<210>110
<211>186
<212>PRT
<213>大麦
<400>110
Met Gln Gln Ala Met Pro Met Pro Pro Ala Ala Ala Ala Pro Gly Met
1 5 10 15
Pro Pro Ser Ala Gly Leu Ser Thr Glu Gln Ile Gln Lys Tyr Leu Asp
20 25 30
Glu Asn Lys Gln Leu Ile Leu Ala Ile Leu Glu Asn Gln Asn Leu Gly
35 40 45
Lys Leu Ala Glu Cys Ala Gln Tyr Gln Ala Gln Leu Gln Lys Asn Leu
50 55 60
Leu Tyr Leu Ala Ala Ile Ala Asp Thr Gln Pro Gln Thr Ser Val Ser
65 70 75 80
Arg Pro Gln Met Ala Pro Pro Ala Ala Ser Pro Gly Ala Gly His Tyr
85 90 95
Met Ser Gln Val Pro Met Phe Pro Pro Arg Thr Pro Leu Thr Pro Gln
100 105 110
Gln Met Gln Glu Gln Gln Leu Gln Gln Gln Gln Ala Gln Met Leu Pro
115 120 125
Phe Ala Gly Gln Met Val Ala Arg Pro Gly Ala Val Asn Gly Ile Pro
130 135 140
Gln Ala Pro Gln Val Glu Gln Pro Ala Tyr Ala Ala Gly Gly Ala Ser
145 150 155 160
Ser Glu Pro Ser Gly Thr Glu Ser His Arg Ser Thr Gly Ala Asp Asn
165 170 175
Asp Gly Gly Ser Gly Leu Ala Asp Gln Ser
180 185
<210>111
<211>555
<212>DNA
<213>野莴苣(Lactuca serriola)
<220>
<221>misc_feature
<222>(253)..(253)
<223>n是a、c、g或t
<400>111
atgaagcagc cgatgatgcc gaatccaatg atgtcttctt cgtttcctcc tacaaacatc 60
accaccgatc agatccaaaa gttccttgat gaaaacaagc aactaattat agcaataatg 120
agcaacctaa atcttggaaa gcttgctgaa tgtgcccagt accaagctct actccaaaaa 180
aatttgatgt atctagcagc cattgcagat gctcaaccac ctacacctac accaacacta 240
aatatctctt atnagatggg cccggttcca catccaggga tgccacagca aggtggattt 300
tacatggcgc agcagcaccc tcaggcggct gtaatgacgg ctcagccacc ttctggtttt 360
ccacaaccga tgcctggtat gcaatttaac agcccacagg ctattcaagg gcagatgggc 420
gggaggtccg gtgggccgcc aagctcagcc gctagtgatg tctggagagg aagcatgcaa 480
gatggtggtg gtggtgctgc tgctgatggt ggtaaggatg gtcatgctgg cggtggacct 540
gaggaagcaa agtaa 555
<210>112
<211>184
<212>PRT
<213>野莴苣
<220>
<221>不确定
<222>(85)..(85)
<223>Xaa可以使任何天然发生的氨基酸
<400>112
Met Lys Gln Pro Met Met Pro Asn Pro Met Met Ser Ser Ser Phe Pro
1 5 10 15
Pro Thr Asn Ile Thr Thr Asp Gln Ile Gln Lys Phe Leu Asp Glu Asn
20 25 30
Lys Gln Leu Ile Ile Ala Ile Met Ser Asn Leu Asn Leu Gly Lys Leu
35 40 45
Ala Glu Cys Ala Gln Tyr Gln Ala Leu Leu Gln Lys Asn Leu Met Tyr
50 55 60
Leu Ala Ala Ile Ala Asp Ala Gln Pro Pro Thr Pro Thr Pro Thr Leu
65 70 75 80
Asn Ile Ser Tyr Xaa Met Gly Pro Val Pro His Pro Gly Met Pro Gln
85 90 95
Gln Gly Gly Phe Tyr Met Ala Gln Gln His Pro Gln Ala Ala Val Met
100 105 110
Thr Ala Gln Pro Pro Ser Gly Phe Pro Gln Pro Met Pro Gly Met Gln
115 120 125
Phe Asn Ser Pro Gln Ala Ile Gln Gly Gln Met Gly Gly Arg Ser Gly
130 135 140
Gly Pro Pro Ser Ser Ala Ala Ser Asp Val Trp Arg Gly Ser Met Gln
145 150 155 160
Asp Gly Gly Gly Gly Ala Ala Ala Asp Gly Gly Lys Asp Gly His Ala
165 170 175
Gly Gly Gly Pro Glu Glu Ala Lys
180
<210>113
<211>627
<212>DNA
<213>番茄(Lycopersicon esculentum)
<400>113
atgcagcagc acctgatgca gatgcagccc atgatggcag cttactatcc aacgaacgtc 60
actactgacc atattcaaca gtatttggat gaaaacaaat cactcattct gaagattgtt 120
gagagccaga actctgggaa actcagtgaa tgtgcggaga accaagctag gcttcagagg 180
aatctgatgt accttgctgc gattgctgat tcacaacctc aaccttctag catgcattct 240
cagttctctt ctggtgggat gatgcagcca gggacacaca gttacttgca gcagcagcag 300
cagcaacaac aagcgcaaca aatggcaaca caacaactca tggctgcaag atcctcgtcg 360
atgctctatg gacaacagca gcagcaatct cagttatcgc aatatcaaca aggcttgcat 420
agtagccaac tcggcatgag ttctggcagt ggcggaagca ctggacttca tcacatgctt 480
caaagtgaat catcacctca tggtggtggt ttctctcatg acttcggccg cgcaaataag 540
caagacattg ggagtagtat gtctgctgaa gggcgcggcg gaagttcagg tggtgagaat 600
ctttatc tga aagcttctga ggattga 627
<210>114
<211>208
<212>PRT
<213>番茄
<400>114
Met Gln Gln His Leu Met Gln Met Gln Pro Met Met Ala Ala Tyr Tyr
1 5 10 15
Pro Thr Asn Val Thr Thr Asp His Ile Gln Gln Tyr Leu Asp Glu Asn
20 25 30
Lys Ser Leu Ile Leu Lys Ile Val Glu Ser Gln Asn Ser Gly Lys Leu
35 40 45
Ser Glu Cys Ala Glu Asn Gln Ala Arg Leu Gln Arg Asn Leu Met Tyr
50 55 60
Leu Ala Ala Ile Ala Asp Ser Gln Pro Gln Pro Ser Ser Met His Ser
65 70 75 80
Gln Phe Ser Ser Gly Gly Met Met Gln Pro Gly Thr His Ser Tyr Leu
85 90 95
Gln Gln Gln Gln Gln Gln Gln Gln Ala Gln Gln Met Ala Thr Gln Gln
100 105 110
Leu Met Ala Ala Arg Ser Ser Ser Met Leu Tyr Gly Gln Gln Gln Gln
115 120 125
Gln Ser Gln Leu Ser Gln Tyr Gln Gln Gly Leu His Ser Ser Gln Leu
130 135 140
Gly Met Ser Ser Gly Ser Gly Gly Ser Thr Gly Leu His His Met Leu
145 150 155 160
Gln Ser Glu Ser Ser Pro His Gly Gly Gly Phe Ser His Asp Phe Gly
165 170 175
Arg Ala Asn Lys Gln Asp Ile Gly Ser Ser Met Ser Ala Glu Gly Arg
180 185 190
Gly Gly Ser Ser Gly Gly Glu Asn Leu Tyr Leu Lys Ala Ser Glu Asp
195 200 205
<210>115
<211>624
<212>DNA
<213>驯化苹果(Malus domestica)
<400>115
atgcagcagc caccacaaat gatccccgtc atgccttcat ttcctcccac caacatcacc 60
accgaacaaa ttcagaagta ccttgatgac aacaaaaagt tgattctggc aatattggat 120
aatcaaaatc ttggaaaact tgctgagtgt gctcagtacc aggctctgct tcaaaagaat 180
ctgatgtatt tagcagcaat tgccgatgcg caaccacagg caccagctgc ccctccccag 240
atggccccac atcctgctat gcaacaggca ggatattaca tgcaacatcc tcaggcagca 300
gcaatggctc agcaacaggg tattttctcc ccaaagatgc cgatgcaatt caataacatg 360
catcaaatgc acgatccaca gcagcaccaa caagccatgc aagggcaaat gggaatgaga 420
cctggagggc ctaacggcat gccttccatg cttcatactg aggccacaca tggtggtggt 480
agtggcggcc caaattcagc tggagaccca aatgatgggc gtggaggaag caagcaagac 540
gcc tctgagt ctggggcagg tggtgatggc caggggacct cagccggcgg gcgtggaact 600
ggtgatggag aggacggcaa gtga 624
<210>116
<211>207
<212>PRT
<213>驯化苹果
<400>116
Met Gln Gln Pro Pro Gln Met Ile Pro Val Met Pro Ser Phe Pro Pro
1 5 10 15
Thr Asn Ile Thr Thr Glu Gln Ile Gln Lys Tyr Leu Asp Asp Asn Lys
20 25 30
Lys Leu Ile Leu Ala Ile Leu Asp Asn Gln Asn Leu Gly Lys Leu Ala
35 40 45
Glu Cys Ala Gln Tyr Gln Ala Leu Leu Gln Lys Asn Leu Met Tyr Leu
50 55 60
Ala Ala Ile Ala Asp Ala Gln Pro Gln Ala Pro Ala Ala Pro Pro Gln
65 70 75 80
Met Ala Pro His Pro Ala Met Gln Gln Ala Gly Tyr Tyr Met Gln His
85 90 95
Pro Gln Ala Ala Ala Met Ala Gln Gln Gln Gly Ile Phe Ser Pro Lys
100 105 110
Met Pro Met Gln Phe Asn Asn Met His Gln Met His Asp Pro Gln Gln
115 120 125
His Gln Gln Ala Met Gln Gly Gln Met Gly Met Arg Pro Gly Gly Pro
130 135 140
Asn Gly Met Pro Ser Met Leu His Thr Glu Ala Thr His Gly Gly Gly
145 150 155 160
Ser Gly Gly Pro Asn Ser Ala Gly Asp Pro Asn Asp Gly Arg Gly Gly
165 170 175
Ser Lys Gln Asp Ala Ser Glu Ser Gly Ala Gly Gly Asp Gly Gln Gly
180 185 190
Thr Ser Ala Gly Gly Arg Gly Thr Gly Asp Gly Glu Asp Gly Lys
195 200 205
<210>117
<211>639
<212>DNA
<213>蒺藜苜蓿
<400>117
atgcagcaga cacctcaaat gattcctatg atgccttcat tcccacaaca aacaaacata 60
accactgagc agattcaaaa atatcttgat gagaacaaga agctgatcct ggcaatattg 120
gacaatcaaa atcttggaaa acttgcagaa tgtgcccagt accaagctca gcttcagaag 180
aatttgatgt atttagctgc aattgctgac gcgcagccac aaacaccggc cttgcctcca 240
cagatggccc cgcaccctgc gatgcaacaa ggattctata tgcaacatcc tcaggctgca 300
gcaatggctc agcaacaagg aatgttcccc caaaaaatgc caatgcagtt cggtaatccg 360
catcaaatgc aggatcagca gcatcagcag caacaacagc agctacatca gcaagctatg 420
caaggtcaaa tgggacttag acctggaggg ataaataacg gcatgcatcc aatgcacaac 480
gaggctgctc tcggaggtag cggcagtggt ggtcaaatga cgggcgtggt ggtggagcaa 540
gcaagatgct tcggagctgg gacagccggc ggtgatggtc aaggaacctc tgccgcagct 600
gcgcacaaca gtggagatgc ttcagaagaa ggaaagtaa 639
<210>118
<211>213
<212>PRT
<213>蒺藜苜蓿
<400>118
Met Gln Gln Thr Pro Gln Met Ile Pro Met Met Pro Ser Phe Pro Gln
1 5 10 15
Gln Thr Asn Ile Thr Thr Glu Gln Ile Gln Lys Tyr Leu Asp Glu Asn
20 25 30
lys Lys Leu Ile Leu Ala Ile Leu Asp Asn Gln Asn Leu Gly Lys Leu
35 40 45
Ala Glu Cys Ala Gln Tyr Gln Ala Gln Leu Gln Lys Asn Leu Met Tyr
50 55 60
Leu Ala Ala Ile Ala Asp Ala Gln Pro Gln Thr Pro Ala Leu Pro Pro
65 70 75 80
Gln Met Ala Pro His Pro Ala Met Gln Gln Gly Phe Tyr Met Gln His
85 90 95
Pro Gln Ala Ala Ala Met Ala Gln Gln Gln Gly Met Phe Pro Gln Lys
100 105 110
Met Pro Met Gln Phe Gly Asn Pro His Gln Met Gln Asp Gln Gln His
115 120 125
Gln Gln Gln Gln Gln Gln Leu His Gln Gln Ala Met Gln Gly Gln Met
130 135 140
Gly Leu Arg Pro Gly Gly Ile Asn Asn Gly Met His Pro Met His Asn
145 150 155 160
Glu Ala Ala Leu Gly Gly Ser Gly Ser Gly Gly Pro Asn Asp Gly Arg
165 170 175
Gly Gly Gly Ser Lys Gln Asp Ala Ser Glu Ala Gly Thr Ala Gly Gly
180 185 190
Asp Gly Gln Gly Thr Ser Ala Ala Ala Ala His Asn Ser Gly Asp Ala
195 200 205
Ser Glu Glu Gly Lys
210
<210>119
<211>624
<212>DNA
<213>柳枝稷(Panicum virgatum)
<400>119
atgcagcagc agatgcccat gcagtcggcg cccccggcga ccggcatcac caccgagcag 60
atccaaaagt atttggatga aaataagcag cttattttgg ccatcctgga aaatcagaac 120
ttaggaaagt tggctgaatg tgctcagtat caagctcagc ttcaaaagaa tctcttgtac 180
ctggctgcga ttgcagatgc ccaaccccaa ccaccacaga accctgcaag tcgcccacag 240
atgatgcaac ctggcatggt accaggtgca gggcattaca tgtcccaagt accaatgttc 300
ccgccaagaa caccattaac cccgcaacag atgcaagaac agcagcagca gcagcagcag 360
cttcaacagc agcaagcaca ggctcttgct ttcccgggac agatggtcat gagacctacc 420
attaatggca tgcagcctat gcaagccgac cctgctgccg ccgccgccag cctacagcag 480
tcagcacctg gccctactga tgggcgagga ggcaagcaag atgcaactgc tggggtgagc 540
acagagcctt ctggcaccga gagccacaag agcacaaccg cagcagatca cgatgtgggc 600
actgatgtcg cggagaaatc ctaa 624
<210>120
<211>207
<212>PRT
<213>柳枝稷
<400>120
Met Gln Gln Gln Met Pro Met Gln Ser Ala Pro Pro Ala Thr Gly Ile
1 5 10 15
Thr Thr Glu Gln Ile Gln Lys Tyr Leu Asp Glu Asn Lys Gln Leu Ile
20 25 30
Leu Ala Ile Leu Glu Asn Gln Asn Leu Gly Lys Leu Ala Glu Cys Ala
35 40 45
Gln Tyr Gln Ala Gln Leu Gln Lys Asn Leu Leu Tyr Leu Ala Ala Ile
50 55 60
Ala Asp Ala Gln Pro Gln Pro Pro Gln Asn Pro Ala Ser Arg Pro Gln
65 70 75 80
Met Met Gln Pro Gly Met Val Pro Gly Ala Gly His Tyr Met Ser Gln
85 90 95
Val Pro Met Phe Pro Pro Arg Thr Pro Leu Thr Pro Gln Gln Met Gln
100 105 110
Glu Gln Gln Gln Gln Gln Gln Gln Leu Gln Gln Gln Gln Ala Gln Ala
115 120 125
Leu Ala Phe Pro Gly Gln Met Val Met Arg Pro Thr Ile Asn Gly Met
130 135 140
Gln Pro Met Gln Ala Asp Pro Ala Ala Ala Ala Ala Ser Leu Gln Gln
145 150 155 160
Ser Ala Pro Gly Pro Thr Asp Gly Arg Gly Gly Lys Gln Asp Ala Thr
165 170 175
Ala Gly Val Ser Thr Glu Pro Ser Gly Thr Glu Ser His Lys Ser Thr
180 185 190
Thr Ala Ala Asp His Asp Val Gly Thr Asp Val Ala Glu Lys Ser
195 200 205
<210>121
<211>747
<212>DNA
<213>北美云杉(Picea sitchensis)
<400>121
atgcagcagc atctcatgca aatgcagccc atgatggcgg catacgcctc caacaacatc 60
accactgatc acatccagaa gtacctggat gagaacaagc agttgattct ggcaattctg 120
gacaaccaaa atcttggaaa gctcaatgag tgtgctcagt accaagcaaa acttcagcag 180
aatttgatgt atctggctgc gattgctgat tctcaaccac aagcacaaac tgcacatgct 240
cagattcctc ctaatgcagt gatgcagtct ggtgggcatt acatgcagca ccagcaggca 300
cagcaacaag tgactcctca gtctctgatg gcagctagat cttccatgct gtattctcag 360
cagccgatgg ctgctttgca tcaagctcag caacaacagc agcagcagca tcagcagcaa 420
caacaatctc ttcacagcca gcttggcata aattctggag gaagcagtgg attgcatatg 480
ttgcatggtg agacaaacat gggatgtaat gggcctctct catctggggg cttccctgaa 540
tttgggcgtg ggtctgctac ctctgctgaa ggtatgcagg ccaacagggg cttcactata 600
gatcgtggtt caaataagca ggatggagta ggatcagaga atgcccatcc aggtgctggt 660
gatggaagag ggagttcaac tggagggcag aatgcagatg agtcagaacc atcatacctg 720
aaagcctccg aagaagaagg aaac tag 747
<210>122
<211>248
<212>PRT
<213>北美云杉
<40>122
Met Gln Gln His Leu Met Gln Met Gln Pro Met Met Ala Ala Tyr Ala
1 5 10 15
Ser Asn Asn Ile Thr Thr Asp His Ile Gln Lys Tyr Leu Asp Glu Asn
20 25 30
Lys Gln Leu Ile Leu Ala Ile Leu Asp Asn Gln Asn Leu Gly Lys Leu
35 40 45
Asn Glu Cys Ala Gln Tyr Gln Ala Lys Leu Gln Gln Asn Leu Met Tyr
50 55 60
Leu Ala Ala Ile Ala Asp Ser Gln Pro Gln Ala Gln Thr Ala His Ala
65 70 75 80
Gln Ile Pro Pro Asn Ala Val Met Gln Ser Gly Gly His Tyr Met Gln
85 90 95
His Gln Gln Ala Gln Gln Gln Val Thr Pro Gln Ser Leu Met Ala Ala
100 105 110
Arg Ser Ser Met Leu Tyr Ser Gln Gln Pro Met Ala Ala Leu His Gln
115 120 125
Ala Gln Gln Gln Gln Gln Gln Gln His Gln Gln Gln Gln Gln Ser Leu
130 135 140
His Ser Gln Leu Gly Ile Asn Ser Gly Gly Ser Ser Gly Leu His Met
145 150 155 160
Leu His Gly Glu Thr Asn Met Gly Cys Asn Gly Pro Leu Ser Ser Gly
165 170 175
Gly Phe Pro Glu Phe Gly Arg Gly Ser Ala Thr Ser Ala Glu Gly Met
180 185 190
Gln Ala Asn Arg Gly Phe Thr Ile Asp Arg Gly Ser Asn Lys Gln Asp
195 200 205
Gly Val Gly Ser Glu Asn Ala His Pro Gly Ala Gly Asp Gly Arg Gly
210 215 220
Ser Ser Thr Gly Gly Gln Asn Ala Asp Glu Ser Glu Pro Ser Tyr Leu
225 230 235 240
Lys Ala Ser Glu Glu Glu Gly Asn
245
<210>123
<211>735
<212>DNA
<213>火炬松(Pinus taeda)
<400>123
atgcagcagc acctcatgca aatgcagccc atgatggcgg cctacgcctc caacaatatc 60
accactgatc acatccagaa gtacctggat gagaacaagc agttgattct ggcaattttg 120
gacaaccaaa atctcggaaa gctcaatgag tgtgctcaat accaagcaaa acttcagcag 180
aatttgatgt atctggctgc tattgctgat tctcaacctc aagcacaaac tgcacatgct 240
cagattcctc caaatgcggt gatgcagtct ggtgggcatt acatgcagca tcaacaggca 300
cagcaacaag ttactcctca gtctctgatg gcagctagat cttccatact gtatgctcag 360
caacaacagc agcagcagca tcagcagcat cagcagcaac agcagcaaca acagtctctt 420
cacagccagc ttggcataaa ttctggagga agcagcggtt tgcatatgtt gcatggtgag 480
acaaacatgg gatgtaatgg gcctctgtca tctgggggat tccctgaatt tgggcgtggg 540
tctgctacct ctgctgatgg tatgcaggtg aacaggggct ttgctataga tcgtggttca 600
aacaagcagg atggagttgg atcagagaat gcccatgctg gtgctggtga tggaagaggg 660
agttcaactg gagggcagaa tgcagatgag tcagaaccat catacctgaa ggcctccgag 720
gaagaaggaa ac tag 735
<210>124
<211>244
<212>PRT
<213>火炬松
<400>124
Met Gln Gln His Leu Met Gln Met Gln Pro Met Met Ala Ala Tyr Ala
1 5 10 15
Ser Asn Asn Ile Thr Thr Asp His Ile Gln Lys Tyr Leu Asp Glu Asn
20 25 30
Lys Gln Leu Ile Leu Ala Ile Leu Asp Asn Gln Asn Leu Gly Lys Leu
35 40 45
Asn Glu Cys Ala Gln Tyr Gln Ala Lys Leu Gln Gln Asn Leu Met Tyr
50 55 60
Leu Ala Ala Ile Ala Asp Ser Gln Pro Gln Ala Gln Thr Ala His Ala
65 70 75 80
Gln Ile Pro Pro Asn Ala Val Met Gln Ser Gly Gly His Tyr Met Gln
85 90 95
His Gln Gln Ala Gln Gln Gln Val Thr Pro Gln Ser Leu Met Ala Ala
100 105 110
Arg Ser Ser Ile Leu Tyr Ala Gln Gln Gln Gln Gln Gln Gln His Gln
115 120 125
Gln His Gln Gln Gln Gln Gln Gln Gln Gln Ser Leu His Ser Gln Leu
130 135 140
Gly Ile Asn Ser Gly Gly Ser Ser Gly Leu His Met Leu His Gly Glu
145 150 155 160
Thr Asn Met Gly Cys Asn Gly Pro Leu Ser Ser Gly Gly Phe Pro Glu
165 170 175
Phe Gly Arg Gly Ser Ala Thr Ser Ala Asp Gly Met Gln Val Asn Arg
180 185 190
Gly Phe Ala Ile Asp Arg Gly Ser Asn Lys Gln Asp Gly Val Gly Ser
195 200 205
Glu Asn Ala His Ala Gly Ala Gly Asp Gly Arg Gly Ser Ser Thr Gly
210 215 220
Gly Gln Asn Ala Asp Glu Ser Glu Pro Ser Tyr Leu Lys Ala Ser Glu
225 230 235 240
Glu Glu Gly Asn
<210>125
<211>663
<212>DNA
<213>欧洲山杨(Populus tremula)
<400>125
atgcaacagc acctgatgca gatgcagccc atgatggcag cctattaccc cagcaacgtc 60
actactgatc atattcaaca gtatctggac gaaaacaagt cattgatttt gaagattgtt 120
gagagccaga attcagggaa actcagtgag tgtgcagaga accaagcaag actgcaacaa 180
aatctcatgt acttggctgc aattgctgat tgtcagcccc aaccacctac catgcatgcc 240
cagttccctt ccagcggcat tatgcagcca ggagcacatt acatgcagca tcaacaagct 300
caacagatga caccacaagc ccttatggct gcacgctctt ctatgctgca gtatgctcaa 360
cagccattct cagcgcttca acaacagcaa gccttacaca gccagctcgg catgagctct 420
ggtggaagcg caggacttca tatgatgcaa agcgaggcta acactgcagg aggcagtgga 480
gctcttggtg ctggacgatt tcctgatttt ggcatggatg cctccagtag aggaatcgca 540
agtgggagca agcaagatat tcggagtgca gggtctagtg aagggcgagg aggaagctct 600
ggaggccagg gtggtgatgg aggtgaaacc ctttacttga aatctgctga tgatgggaac 660
tga 663
<210>126
<211>220
<212>PRT
<213>欧洲山杨
<400>126
Met Gln Gln His Leu Met Gln Met Gln Pro Met Met Ala Ala Tyr Tyr
1 5 10 15
Pro Ser Asn Val Thr Thr Asp His Ile Gln Gln Tyr Leu Asp Glu Asn
20 25 30
Lys Ser Leu Ile Leu Lys Ile Val Glu Ser Gln Asn Ser Gly Lys Leu
35 40 45
Ser Glu Cys Ala Glu Asn Gln Ala Arg Leu Gln Gln Asn Leu Met Tyr
50 55 60
Leu Ala Ala Ile Ala Asp Cys Gln Pro Gln Pro Pro Thr Met His Ala
65 70 75 80
Gln Phe Pro Ser Ser Gly Ile Met Gln Pro Gly Ala His Tyr Met Gln
85 90 95
His Gln Gln Ala Gln Gln Met Thr Pro Gln Ala Leu Met Ala Ala Arg
100 105 110
Ser Ser Met Leu Gln Tyr Ala Gln Gln Pro Phe Ser Ala Leu Gln Gln
115 120 125
Gln Gln Ala Leu His Ser Gln Leu Gly Met Ser Ser Gly Gly Ser Ala
130 135 140
Gly Leu His Met Met Gln Ser Glu Ala Asn Thr Ala Gly Gly Ser Gly
145 150 155 160
Ala Leu Gly Ala Gly Arg Phe Pro Asp Phe Gly Met Asp Ala Ser Ser
165 170 175
Arg Gly Ile Ala Ser Gly Ser Lys Gln Asp Ile Arg Ser Ala Gly Ser
180 185 190
Ser Glu Gly Arg Gly Gly Ser Ser Gly Gly Gln Gly Gly Asp Gly Gly
195 200 205
Glu Thr Leu Tyr Leu Lys Ser Ala Asp Asp Gly Asn
210 215 220
<210>127
<211>678
<212>DNA
<213>甘蔗(Saccharum officinarum)
<400>127
atgcagcagc aacacctgat gcagatgaac cagaacatga ttgggggcta cacctctcct 60
gccgctgtga caaccgatct catccagcag tacctggatg agaacaagca gctgatcctg 120
gccatcctcg acaaccagaa caatggcaag gtggaggagt gcgaacggca ccaagctaag 180
ctccagcaca acctcatgta cctggccgcc atcgccgaca gccagccacc acagactgca 240
ccactatcac aatacccgtc caacctgatg atgcagccgg gccctcggta catgccaccg 300
cagtccgggc agatgatgag cccgcagtcg ctaatggcgg cgcggtcctc catgatgtac 360
gcgcacccgt ccatgtcacc actccagcag cagcaggcag cgcacgggca gctgggcatg 420
gcttcagggg gcggcggtgg cacgaccagt gggttcaaca tcctccatgg cgaggccagt 480
atgggcggtg ctggtggcgc ttgtgccggc aacaacatga tgaacgccgg catgttctca 540
ggctttggcc gcagcggcag tggcgccaag gagggatcga cctcgctgtc ggttgacgtc 600
cgtggtggca ccagctccgg cgcgcaaagc ggggacggcg agtacctgaa agcaggcacc 660
gaggaagaag gcagt taa 678
<210>128
<211>225
<212>PRT
<213>甘蔗
<400>128
Met Gln Gln Gln His Leu Met Gln Met Asn Gln Asn Met Ile Gly Gly
1 5 10 15
Tyr Thr Ser Pro Ala Ala Val Thr Thr Asp Leu Ile Gln Gln Tyr Leu
20 25 30
Asp Glu Asn Lys Gln Leu Ile Leu Ala Ile Leu Asp Asn Gln Asn Asn
35 40 45
Gly Lys Val Glu Glu Cys Glu Arg His Gln Ala Lys Leu Gln His Asn
50 55 60
Leu Met Tyr Leu Ala Ala Ile Ala Asp Ser Gln Pro Pro Gln Thr Ala
65 70 75 80
Pro Leu Ser Gln Tyr Pro Ser Asn Leu Met Met Gln Pro Gly Pro Arg
85 90 95
Tyr Met Pro Pro Gln Ser Gly Gln Met Met Ser Pro Gln Ser Leu Met
100 105 110
Ala Ala Arg Ser Ser Met Met Tyr Ala His Pro Ser Met Ser Pro Leu
115 120 125
Gln Gln Gln Gln Ala Ala His Gly Gln Leu Gly Met Ala Ser Gly Gly
130 135 140
Gly Gly Gly Thr Thr Ser Gly Phe Asn Ile Leu His Gly Glu Ala Ser
145 150 155 160
Met Gly Gly Ala Gly Gly Ala Cys Ala Gly Asn Asn Met Met Asn Ala
165 170 175
Gly Met Phe Ser Gly Phe Gly Arg Ser Gly Ser Gly Ala Lys Glu Gly
180 185 190
Ser Thr Ser Leu Ser Val Asp Val Arg Gly Gly Thr Ser Ser Gly Ala
195 200 205
Gln Ser Gly Asp Gly Glu Tyr Leu Lys Ala Gly Thr Glu Glu Glu Gly
210 215 220
Ser
225
<210>129
<211>561
<212>DNA
<213>甘蔗
<400>129
atgcagcagc cgatgcccat gcagccgcag gcgccggaga tgaccccggc cgccggaatc 60
accacggagc agatccaaaa gtatctggat gagaataagc agcttatttt ggctattttg 120
gaaaatcaga acctaggaaa attggcagaa tgtgctcagt atcaatcaca acttcagaag 180
aacctcttgt atctcgctgc aatcgcagat gcccaaccac agactgctgt aagccgccct 240
cagatggcgc cgcctggtgc attgcctgga gtagggcagt acatgtcaca ggtgcctatg 300
ttcccaccga ggacacctct aacaccccag cagatgcagg agcagcaact tcagcagcag 360
caggctcagc tgctaaattt cagtggccta atggttgcta gacctggcat ggtcaacggc 420
atgcctcagt ccattcaagt tcagcaagct cagccaccac cagcagggaa caaacaggat 480
gctggtgggg tcgcctcgga gccctcgggc attgagaacc acaggagcac tggtggtgat 540
aatgatggtg gaagcgacta g 561
<210>130
<211>186
<212>PRT
<213>甘蔗
<400>130
Met Gln Gln Pro Met Pro Met Gln Pro Gln Ala Pro Glu Met Thr Pro
1 5 10 15
Ala Ala Gly Ile Thr Thr Glu Gln Ile Gln Lys Tyr Leu Asp Glu Asn
20 25 30
Lys Gln Leu Ile Leu Ala Ile Leu Glu Asn Gln Asn Leu Gly Lys Leu
35 40 45
Ala Glu Cys Ala Gln Tyr Gln Ser Gln Leu Gln Lys Asn Leu Leu Tyr
50 55 60
Leu Ala Ala Ile Ala Asp Ala Gln Pro Gln Thr Ala Val Ser Arg Pro
65 70 75 80
Gln Met Ala Pro Pro Gly Ala Leu Pro Gly Val Gly Gln Tyr Met Ser
85 90 95
Gln Val Pro Met Phe Pro Pro Arg Thr Pro Leu Thr Pro Gln Gln Met
100 105 110
Gln Glu Gln Gln Leu Gln Gln Gln Gln Ala Gln Leu Leu Asn Phe Ser
115 120 125
Gly Leu Met Val Ala Arg Pro Gly Met Val Asn Gly Met Pro Gln Ser
130 135 140
lle Gln Val Gln Gln Ala Gln Pro Pro Pro Ala Gly Asn Lys Gln Asp
145 150 155 160
Ala Gly Gly Val Ala Ser Glu Pro Ser Gly Ile Glu Asn His Arg Ser
165 170 175
Thr Gly Gly Asp Asn Asp Gly Gly Ser Asp
180 185
<210>131
<211>642
<212>DNA
<213>甘蔗
<400>131
atgcagcagc agatgcccat gccgccggcg cccgctgcgg cggcggcgcc cccggcggcc 60
ggcatcacca ccgagcagat ccaaaagtat ttggacgaaa ataagcaact tattttggcc 120
atcctggaaa atcagaactt aggaaagttg gctgaatgtg ctcagtatca agctcaactt 180
caaaagaacc tcttgtacct ggctgcgatt gctgatgccc aaccccagcc accacaaaac 240
cctgcaggtc gccctcagat gatgcaacct ggtatagtgc caggtgcggg gcattacatg 300
tcacaagtac caatgttccc tccaagaact ccattaaccc cacagcagat gcaagagcag 360
cagcagcaac agcttcagca gcagcaagcg caggctctta cattccctgg acagatggtc 420
atgagaccag ctaccatcaa cggcatacag cagcctatgc aagctgaccc tgcccgggca 480
gcggagctgc aacaaccacc acctatccca gctgacgggc gagtaagcaa gcagcaggac 540
acaacggctg gcgtgagctc agagccttct gccaatgaga gccacaagac cacaactgga 600
gcagatagtg aggcaggtgg tgacgtggcg gagaaatcct aa 642
<210>132
<211>213
<212>PRT
<213>甘蔗
<400>132
Met Gln Gln Gln Met Pro Met Pro Pro Ala Pro Ala Ala Ala Ala Ala
1 5 10 15
Pro Pro Ala Ala Gly Ile Thr Thr Glu Gln Ile Gln Lys Tyr Leu Asp
20 25 30
Glu Asn Lys Gln Leu Ile Leu Ala Ile Leu Glu Asn Gln Asn Leu Gly
35 40 45
Lys Leu Ala Glu Cys Ala Gln Tyr Gln Ala Gln Leu Gln Lys Asn Leu
50 55 60
Leu Tyr Leu Ala Ala Ile Ala Asp Ala Gln Pro Gln Pro Pro Gln Asn
65 70 75 80
Pro Ala Gly Arg Pro Gln Met Met Gln Pro Gly Ile Val Pro Gly Ala
85 90 95
Gly His Tyr Met Ser Gln Val Pro Met Phe Pro Pro Arg Thr Pro Leu
100 105 110
Thr Pro Gln Gln Met Gln Glu Gln Gln Gln Gln Gln Leu Gln Gln Gln
115 120 125
Gln Ala Gln Ala Leu Thr Phe Pro Gly Gln Met Val Met Arg Pro Ala
130 135 140
Thr Ile Asn Gly Ile Gln Gln Pro Met Gln Ala Asp Pro Ala Arg Ala
145 150 155 160
Ala Glu Leu Gln Gln Pro Pro Pro Ile Pro Ala Asp Gly Arg Val Ser
165 170 175
Lys Gln Gln Asp Thr Thr Ala Gly Val Ser Ser Glu Pro Ser Ala Asn
180 185 190
Glu Ser His Lys Thr Thr Thr Gly Ala Asp Ser Glu Ala Gly Gly Asp
195 200 205
Val Ala Glu Lys Ser
210
<210>133
<211>645
<212>DNA
<213>马铃薯
<400>133
atgcagcagc acctgatgca gatgcagccc atgatggcag cttactatcc aacgaacgtc 60
actactgacc atattcaaca gtatttggat gagaacaaat cactcattct gaaaattgtt 120
gagagccaaa actcgggaaa actcagtgaa tgtgcagaga accaagctag gcttcagagg 180
aatctgatgt accttgctgc tattgctgat tcacaacctc agccttctag catgcattct 240
cagttctctt ctggtgggat gatgcagcca gggacacaca gttacctgca gcagcagcag 300
cagcaacaac aagcgcaaca aatggcaaca caacaactca tggctgcaag atcctcatca 360
atgctctatg gacaacaaca gcagcagcag cagcagtctc agttatcaca atttcaacaa 420
ggcttgcata gtagccaact tggcatgagt tctggcagtg gtggaagcac tggacttcat 480
cacatgcttc aaagtgaatc atcacctcat ggtggtggtt tctctcatga cttcggccgt 540
gcaaataagc aagacattgg gagtagtatg tctgctgaag ggcgcggcgg aagctcaggt 600
ggtgatggtg gtgagaatct ttatctgaaa gcttctgagg attga 645
<210>134
<211>214
<212>PRT
<213>马铃薯
<400>134
Met Gln Gln His Leu Met Gln Met Gln Pro Met Met Ala Ala Tyr Tyr
1 5 10 15
Pro Thr Asn Val Thr Thr Asp His Ile Gln Gln Tyr Leu Asp Glu Asn
20 25 30
Lys Ser Leu Ile Leu Lys Ile Val Glu Ser Gln Asn Ser Gly Lys Leu
35 40 45
Ser Glu Cys Ala Glu Asn Gln Ala Arg Leu Gln Arg Asn Leu Met Tyr
50 55 60
Leu Ala Ala Ile Ala Asp Ser Gln Pro Gln Pro Ser Ser Met His Ser
65 70 75 80
Gln Phe Ser Ser Gly Gly Met Met Gln Pro Gly Thr His Ser Tyr Leu
85 90 95
Gln Gln Gln Gln Gln Gln Gln Gln Ala Gln Gln Met Ala Thr Gln Gln
100 105 110
Leu Met Ala Ala Arg Ser Ser Ser Met Leu Tyr Gly Gln Gln Gln Gln
115 120 125
Gln Gln Gln Gln Ser Gln Leu Ser Gln Phe Gln Gln Gly Leu His Ser
130 135 140
Ser Gln Leu Gly Met Ser Ser Gly Ser Gly Gly Ser Thr Gly Leu His
145 150 155 160
His Met Leu Gln Ser Glu Ser Ser Pro His Gly Gly Gly Phe Ser His
165 170 175
Asp Phe Gly Arg Ala Asn Lys Gln Asp Ile Gly Ser Ser Met Ser Ala
180 185 190
Glu Gly Arg Gly Gly Ser Ser Gly Gly Asp Gly Gly Glu Asn Leu Tyr
195 200 205
Leu Lys Ala Ser Glu Asp
210
<210>135
<211>645
<212>DNA
<213>两色蜀黍(Sorghum bicolor)
<400>135
atgcagcagc agatgcccat gccgccggcg cccgctgcgg cggcggcgac ggcgcccccg 60
gcggccggca tcaccaccga gcagatccag aagtatttgg acgaaaataa gcaacttatt 120
ttggccatcc tagaaaatca gaacttagga aagttggctg aatgtgctca gtatcaagct 180
caacttcaaa agaacctctt gtacctggct gcgattgctg atgcccaacc ccgaccaccg 240
caaaaccctg caggtcgccc tcagatgatg caacctggta tagtgccagg tgcagggcat 300
tacatgtcac aagtaccaat gttccctcca agaactccat taaccccaca gcaaatgcaa 360
gagcagcagc agcaacagct tcagcagcag caagcgcagg ctcttgcatt ccctgggcag 420
atggtcatga gaccagctac catcaacggc atgcagcagc ctatgcaggc tgaccctgcc 480
cgggcagcgg agctgcaaca gccagcatct gtcccagccg acgggcgagt aagcaagcag 540
gacacagcgg ctggggtgag ctcagagcct tctgccaatg agagccacaa gaccacaacc 600
ggagcagata gtgaggcagg tggagacgtg gcggagaaat cctaa 645
<210>136
<211>214
<212>PRT
<213>两色蜀黍
<400>136
Met Gln Gln Gln Met Pro Met Pro Pro Ala Pro Ala Ala Ala Ala Ala
1 5 10 15
Thr Ala Pro Pro Ala Ala Gly Ile Thr Thr Glu Gln Ile Gln Lys Tyr
20 25 30
Leu Asp Glu Asn Lys Gln Leu Ile Leu Ala Ile Leu Glu Asn Gln Asn
35 40 45
Leu Gly Lys Leu Ala Glu Cys Ala Gln Tyr Gln Ala Gln Leu Gln Lys
50 55 60
Asn Leu Leu Tyr Leu Ala Ala Ile Ala Asp Ala Gln Pro Arg Pro Pro
65 70 75 80
Gln Asn Pro Ala Gly Arg Pro Gln Met Met Gln Pro Gly Ile Val Pro
85 90 95
Gly Ala Gly His Tyr Met Ser Gln Val Pro Met Phe Pro Pro Arg Thr
100 105 110
Pro Leu Thr Pro Gln Gln Met Gln Glu Gln Gln Gln Gln Gln Leu Gln
115 120 125
Gln Gln Gln Ala Gln Ala Leu Ala Phe Pro Gly Gln Met Val Met Arg
130 135 140
Pro Ala Thr Ile Asn Gly Met Gln Gln Pro Met Gln Ala Asp Pro Ala
145 150 155 160
Arg Ala Ala Glu Leu Gln Gln Pro Ala Ser Val Pro Ala Asp Gly Arg
165 170 175
Val Ser Lys Gln Asp Thr Ala Ala Gly Val Ser Ser Glu Pro Ser Ala
180 185 190
Asn Glu Ser His Lys Thr Thr Thr Gly Ala Asp Ser Glu Ala Gly Gly
195 200 205
Asp Val Ala Glu Lys Ser
210
<210>137
<211>558
<212>DNA
<213>普通小麦
<400>137
atgcagcaag cgatgcccat gccgccggcg gcggcggcgc cggggatgcc tccgtctgct 60
ggcctcagca ccgagcagat ccaaaagtac ctggatgaaa ataagcaact aattttggct 120
atcttggaaa atcagaacct gggaaagttg gcggaatgtg ctcagtatca agctcagctt 180
cagaagaatc ttttgtattt ggctgcaatc gctgatactc agccacagac cactgtaagc 240
cgtcctcaga tggcaccacc tagtgcatcc ccaggggcag ggcattacat gtcacaggtg 300
ccaatgttcc ctccgaggac ccctctaacg cctcagcaga tgcaggagca gcaactacag 360
cagcaacagg ctcagatgct tccgtttgct ggtcaaatgg ttgcgagacc tggggctgtc 420
aatggcatgc ctcaggcccc tcaagttgaa ccagcctatg cagcaggtgg ggccagttct 480
gagccttctg gcactgagag ccacaggagc actggtgccg ataatgacgg ggggagcggc 540
tgggctgatc agtcctaa 558
<210>138
<211>185
<212>PRT
<213>普通小麦
<400>138
Met Gln Gln Ala Met Pro Met Pro Pro Ala Ala Ala Ala Pro Gly Met
1 5 10 15
Pro Pro Ser Ala Gly Leu Ser Thr Glu Gln Ile Gln Lys Tyr Leu Asp
20 25 30
Glu Asn Lys Gln Leu Ile Leu Ala Ile Leu Glu Asn Gln Asn Leu Gly
35 40 45
Lys Leu Ala Glu Cys Ala Gln Tyr Gln Ala Gln Leu Gln Lys Asn Leu
50 55 60
Leu Tyr Leu Ala Ala Ile Ala Asp Thr Gln Pro Gln Thr Thr Val Ser
65 70 75 80
Arg Pro Gln Met Ala Pro Pro Ser Ala Ser Pro Gly Ala Gly His Tyr
85 90 95
Met Ser Gln Val Pro Met Phe Pro Pro Arg Thr Pro Leu Thr Pro Gln
100 105 110
Gln Met Gln Glu Gln Gln Leu Gln Gln Gln Gln Ala Gln Met Leu Pro
115 120 125
Phc Ala Gly Gln Met Val Ala Arg Pro Gly Ala Val Asn Gly Met Pro
130 135 140
Gln Ala Pro Gln Val Glu Pro Ala Tyr Ala Ala Gly Gly Ala Ser Ser
145 150 155 160
Glu Pro Ser Gly Thr Glu Ser His Arg Ser Thr Gly Ala Asp Asn Asp
165 170 175
Gly Gly Ser Gly Trp Ala Asp Gln Ser
180 185
<210>139
<211>603
<212>DNA
<213>普通小麦
<400>139
atgcagcagg cgatgtcctt gcccccggga gcggtcggcg cggtgtcctc gccggccggc 60
atcaccaccg agcagatcca aaagtatttg gatgaaaata agcaacttat tttggccatc 120
cttgaaaatc agaacctagg aaagttggct gaatgtgctc agtatcaagc tcaactccaa 180
aagaatctct tgtatctagc tgctatcgcg gatgcccaac caccacagaa ccctacaagt 240
caccctcaga tggtgcagcc tggtagtatg caaggtgcag ggcattacat gtcacaagta 300
ccaatgttcc ctccaagaac gcctttaacc ccacagcaga tgcaagagca gcagcaccag 360
cagcttcagc agcagcaagc ccaggccctt tctttccccg cccaggtggt catgagacca 420
ggcaccgtca acggcatgca gcagcctatg caagcagccg gcgacctcca gccagcagca 480
gcacctggag ggagcaagca ggacgccgca gtggctgggg ccagctcgga accatctggc 540
accaagagcc acaagaacgc gggagcagag gaggtgggcg ctgatgtagc agaacaatcc 600
taa 603
<210>140
<211>200
<212>PRT
<213>普通小麦
<400>140
Met Gln Gln Ala Met Ser Leu Pro Pro Gly Ala Val Gly Ala Val Ser
1 5 10 15
Ser Pro Ala Gly Ile Thr Thr Glu Gln Ile Gln Lys Tyr Leu Asp Glu
20 25 30
Asn Lys Gln Leu Ile Leu Ala Ile Leu Glu Asn Gln Asn Leu Gly Lys
35 40 45
Leu Ala Glu Cys Ala Gln Tyr Gln Ala Gln Leu Gln Lys Asn Leu Leu
50 55 60
Tyr Leu Ala Ala Ile Ala Asp Ala Gln Pro Pro Gln Asn Pro Thr Ser
65 70 75 80
His Pro Gln Met Val Gln Pro Gly Ser Met Gln Gly Ala Gly His Tyr
85 90 95
Met Ser Gln Val Pro Met Phe Pro Pro Arg Thr Pro Leu Thr Pro Gln
100 105 110
Gln Met Gln Glu Gln Gln His Gln Gln Leu Gln Gln Gln Gln Ala Gln
115 120 125
Ala Leu Ser Phe Pro Ala Gln Val Val Met Arg Pro Gly Thr Val Asn
130 135 140
Gly Met Gln Gln Pro Met Gln Ala Ala Gly Asp Leu Gln Pro Ala Ala
145 150 155 160
Ala Pro Gly Gly Ser Lys Gln Asp Ala Ala Val Ala Gly Ala Ser Ser
165 170 175
Glu Pro Ser Gly Thr Lys Ser His Lys Asn Ala Gly Ala Glu Glu Val
180 185 190
Gly Ala Asp Val Ala Glu Gln Ser
195 200
<210>141
<211>672
<212>DNA
<213>葡萄(Vitis vinifera)
<400>141
atgcagcagc acctgatgca gatgcagccc atgatggcag cctattaccc cagcaacgtc 60
accactgatc acattcagca gtatcttgat gaaaacaagt cattgattct gaagattgtt 120
gagagccaga attcaggaaa attgactgaa tgtgcagaga accaggcaag actacagaga 180
aacctcatgt acctggctgc aattgctgat tctcaacccc aaccacccac catgcatgct 240
cagttccctc ctagtggcat tgttcagcca ggagctcact acatgcaaca ccaacaagct 300
caacaaatga caccacagtc gctcctggct gcacgctcct ccatgctgta cacccaacaa 360
ccattttcgg ccctgcaaca acaacaagcc atccatagcc agcttggcat gggctctggt 420
ggaagtgcag gacttcacat gctgcaaagc gaggggagta atccaggagg caatggaaca 480
ctggggactg gtgggtttcc tgatttcagc cgtggaactt ctggagaagg cctgcaggct 540
gcaggcaggg gaatggctgg tgggagcaag caagatatgg gaaatgcaga agggcgagga 600
gggaactcag gaggtcaggg tggggatgga ggtgagactc tttacttgaa agctgctgaa 660
gatgggaatt ga 672
<210>142
<211>223
<212>PRT
<213>葡萄
<400>142
Met Gln Gln His Leu Met Gln Met Gln Pro Met Met Ala Ala Tyr Tyr
1 5 10 15
Pro Ser Asn Val Thr Thr Asp His Ile Gln Gln Tyr Leu Asp Glu Asn
20 25 30
Lys Ser Leu Ile Leu Lys Ile Val Glu Ser Gln Asn Ser Gly Lys Leu
35 40 45
Thr Glu Cys Ala Glu Asn Gln Ala Arg Leu Gln Arg Asn Leu Met Tyr
50 55 60
Leu Ala Ala Ile Ala Asp Ser Gln Pro Gln Pro Pro Thr Met His Ala
65 70 75 80
Gln Phe Pro Pro Ser Gly Ile Val Gln Pro Gly Ala His Tyr Met Gln
85 90 95
His Gln Gln Ala Gln Gln Met Thr Pro Gln Ser Leu Leu Ala Ala Arg
100 105 110
Ser Ser Met Leu Tyr Thr Gln Gln Pro Phe Ser Ala Leu Gln Gln Gln
115 120 125
Gln Ala Ile His Ser Gln Leu Gly Met Gly Ser Gly Gly Ser Ala Gly
130 135 140
Leu His Met Leu Gln Ser Glu Gly Ser Asn Pro Gly Gly Asn Gly Thr
145 150 155 160
Leu Gly Thr Gly Gly Phe Pro Asp Phe Ser Arg Gly Thr Ser Gly Glu
165 170 175
Gly Leu Gln Ala Ala Gly Arg Gly Met Ala Gly Gly Ser Lys Gln Asp
180 185 190
Met Gly Asn Ala Glu Gly Arg Gly Gly Asn Ser Gly Gly Gln Gly Gly
195 200 205
Asp Gly Gly Glu Thr Leu Tyr Leu Lys Ala Ala Glu Asp Gly Asn
210 215 220
<210>143
<211>663
<212>DNA
<213>玉蜀黍
<400>143
atgcagcagc agatgcccat gccgccggcg cccgctgccg ccgcggcggc ggcgcccccg 60
gcggcaggca tcactaccga gcagatccag aagtatttgg acgaaaataa gcaacttatt 120
ttggccatcc tggaaaatca gaacttaggg aagttggctg aatgtgctca gtatcaagct 180
caacttcaaa agaacctctt gtacctggct gcgattgctg atgcccaacc ccagcctccg 240
caaaaccctg caggtcgccc tcagatgatg cagcctggta tagtgccagg tgcggggcat 300
tacatgtcac aagtaccaat gttccctcca agaaccccat taaccccaca gcagatgcag 360
gagcagcagc aacaacaaca gtttcagcag cagcagcagc aagtgcaggc tcttacattt 420
cctggacaga tggtcatgag accaggcacc atcaacggca tgcagcagca gcagcctatg 480
caggctgacc ctgcccgggc agcagcggag ctgcagcagg cagcacctat cccagctgac 540
gggcgaggaa gcaagcagga caccgcgggt ggggcgagct cagagccttc tgccaatgag 600
agccacaaga gcgccaccgg agcagatacc gaggcaggtg gcgacgtggc cgagaaatcc 660
taa 663
<210>144
<211>220
<212>PRT
<213>玉蜀黍
<400>144
Met Gln Gln Gln Met Pro Met Pro Pro Ala Pro Ala Ala Ala Ala Ala
1 5 10 15
Ala Ala Pro Pro Ala Ala Gly Ile Thr Thr Glu Gln Ile Gln Lys Tyr
20 25 30
Leu Asp Glu Asn Lys Gln Leu Ile Leu Ala Ile Leu Glu Asn Gln Asn
35 40 45
Leu Gly Lys Leu Ala Glu Cys Ala Gln Tyr Gln Ala Gln Leu Gln Lys
50 55 60
Asn Leu Leu Tyr Leu Ala Ala Ile Ala Asp Ala Gln Pro Gln Pro Pro
65 70 75 80
Gln Asn Pro Ala Gly Arg Pro Gln Met Met Gln Pro Gly Ile Val Pro
85 90 95
Gly Ala Gly His Tyr Met Ser Gln Val Pro Met Phe Pro Pro Arg Thr
100 105 110
Pro Leu Thr Pro Gln Gln Met Gln Glu Gln Gln Gln Gln Gln Gln Phe
115 120 125
Gln Gln Gln Gln Gln Gln Val Gln Ala Leu Thr Phe Pro Gly Gln Met
130 135 140
Val Met Arg Pro Gly Thr Ile Asn Gly Met Gln Gln Gln Gln Pro Met
145 150 155 160
Gln Ala Asp Pro Ala Arg Ala Ala Ala Glu Leu Gln Gln Ala Ala Pro
165 170 175
Ile Pro Ala Asp Gly Arg Gly Ser Lys Gln Asp Thr Ala Gly Gly Ala
180 185 190
Ser Ser Glu Pro Ser Ala Asn Glu Ser His Lys Ser Ala Thr Gly Ala
195 200 205
Asp Thr Glu Ala Gly Gly Asp Val Ala Glu Lys Ser
210 215 220
<210>145
<211>2193
<212>DNA
<213>稻
<400>145
aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct 60
aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact 120
catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt 180
tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc 240
tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata 300
aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga 360
atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt 420
ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat 480
ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag 540
gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt 600
tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc 660
tgaattcaag cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat 720
aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa 780
aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca 840
acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag 900
tccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa 960
aaccaagcat cctcctcctc ccatctataa attcctcccc ccttttcccc tctctatata 1020
ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag 1080
cgaccgcctt cttcgatcca tatcttccgg tcgagttctt ggtcgatctc ttccctcctc 1140
cacctcctcc tcacagggta tgtgcccttc ggttgttctt ggatttattg ttctaggttg 1200
tgtagtacgg gcgttgatgt taggaaaggg gatctgtatc tgtgatgatt cctgttcttg 1260
gatttgggat agaggggttc ttgatgttgc atgttatcgg ttcggtttga ttagtagtat 1320
ggttttcaat cgtctggaga gctctatgga aatgaaatgg tttagggtac ggaatcttgc 1380
gattttgtga gtaccttttg tttgaggtaa aatcagagca ccggtgattt tgcttggtgt 1440
aataaaagta cggttgtttg gtcctcgatt ctggtagtga tgcttctcga tttgacgaag 1500
ctatcctttg tttattccct attgaacaaa aataatccaa ctttgaagac ggtcccgttg 1560
atgagattga atgattgatt cttaagcctg tccaaaattt cgcagctggc ttgtttagat 1620
acagtagtcc ccatcacgaa attcatggaa acagttataa tcctcaggaa caggggattc 1680
cctgttcttc cgatttgctt tagtcccaga attttttttc ccaaatatct taaaaagtca 1740
ctttctggtt cagttcaatg aattgattgc tacaaataat gcttttatag cgttatccta 1800
gctgtagttc agttaatagg taatacccct atagtttagt caggagaaga acttatccga 1860
tttctgatct ccatttttaa ttatatgaaa tgaactgtag cataagcagt attcatttgg 1920
attatttttt ttattagctc tcaccccttc attattctga gctgaaagtc tggcatgaac 1980
tgtcctcaat tttgttttca aattcacatc gattatctat gcattatcct cttgtatcta 2040
cctgtagaag tttctttttg gttattcctt gactgcttga ttacagaaag aaatttatga 2100
agetgtaatc gggatagtta tactgcttgt tcttatgatt catttccttt gtgcagttct 2160
tggtgtagct tgccactttc accagcaaag ttc 2193
<210>146
<211>12
<212>PRT
<213>人工序列
<220>
<223>框I
<220>
<221>变体
<222>(3)..(3)
<223>/取代=″Lys″
<220>
<221>变体
<222>(4)..(4)
<223>/取代=″Met″/取代=″Phe″/取代=″His″
<220>
<221>变体
<222>(6)..(6)
<223>/取代=″Glu″
<220>
<221>变体
<222>(7)..(7)
<223>/取代=″Asp″
<220>
<221>变体
<222>(9)..(9)
<223>/取代=″Asn″
<220>
<221>变体
<222>(10)..(10)
<223>Xaa可以使任何天然发生的氨基酸
<400>146
Ile Gln Gln Tyr Leu Asp Glu Asn Lys Xaa Leu Ile
1 5 10
<210>147
<211>10
<212>PRT
<213>人工序列
<220>
<223>框II
<220>
<221>变体
<222>(3)..(3)
<223>/取代=″Leu″/取代=″Val″
<220>
<221>变体
<222>(7)..(7)
<223>/取代=″Thr″
<400>147
Asn Leu Met Tyr Leu Ala Ala Ile Ala Asp
1 5 10
<210>148
<211>53
<212>DNA
<213>人工序列
<220>
<223>引物:prm06681
<400>148
ggggacaagt ttgtacaaaa aagcaggctt aaacaatgca acagcacctg atg 53
<210>149
<211>50
<212>DNA
<213>人工序列
<220>
<223>引物:prm06682
<400>149
ggggaccac tttgtacaaga aagctgggtc atcattaaga ttccttgtgc 50
<210>150
<211>615
<212>DNA
<213>欧洲油菜
<400>150
atgcaacagc acctgatgca gatgcagccc atgatggctg gttactaccc cagcaatgtc 60
acctctgatc atattcagca gtacttggac gagaacaaat cgttgattct gaagatagtt 120
gaatctcaaa actcgggaaa gctcagcgag tgtgccgaga accaggcaag gcttcaacgc 180
aacttaatgt acttagctgc aattgcagat tctcagcctc aacctccaag catgcatagc 240
cagtatggaa ctgctggtgg tggtgggttg atgcagggag aaggagggtc acactatttg 300
caacagcaac aggcaattca acagcagcag agtcagcagt ctctaatggc ggctcgatct 360
tcaatgttgt atgctcagca gcagcaacag ccttatgcaa cgcttcagca gcagcaattg 420
caccatagcc agcttgggat gagctcaagc agcggaggag gaagcagcgg tctccatatg 480
ctacagggag aggctggtgg gtttcatgat tttggccgtg agaagttgga aatgggaagt 540
ggtgaaggca gaggaggaag ctcaggggat ggtggagaaa ccctttactt gaagtcatca 600
gatgatggga ac tga 615
<210>151
<211>204
<212>PRT
<213>欧洲油菜
<400>151
Met Gln Gln His Leu Met Gln Met Gln Pro Met Met Ala Gly Tyr Tyr
1 5 10 15
Pro Ser Asn Val Thr Ser Asp His Ile Gln Gln Tyr Leu Asp Glu Asn
20 25 30
Lys Ser Leu Ile Leu Lys Ile Val Glu Ser Gln Asn Ser Gly Lys Leu
35 40 45
Ser Glu Cys Ala Glu Asn Gln Ala Arg Leu Gln Arg Asn Leu Met Tyr
50 55 60
Leu Ala Ala Ile Ala Asp Ser Gln Pro Gln Pro Pro Ser Met His Ser
65 70 75 80
Gln Tyr Gly Thr Ala Gly Gly Gly Gly Leu Met Gln Gly Glu Gly Gly
85 90 95
Ser His Tyr Leu Gln Gln Gln Gln Ala Ile Gln Gln Gln Gln Ser Gln
100 105 110
Gln Ser Leu Met Ala Ala Arg Ser Ser Met Leu Tyr Ala Gln Gln Gln
115 120 125
Gln Gln Pro Tyr Ala Thr Leu Gln Gln Gln Gln Leu His His Ser Gln
130 135 140
Leu Gly Met Ser Ser Ser Ser Gly Gly Gly Ser Ser Gly Leu His Met
145 150 155 160
Leu Gln Gly Glu Ala Gly Gly Phe His Asp Phe Gly Arg Glu Lys Leu
165 170 175
Glu Met Gly Ser Gly Glu Gly Arg Gly Gly Ser Ser Gly Asp Gly Gly
180 185 190
Glu Thr Leu Tyr Leu Lys Ser Ser Asp Asp Gly Asn
195 200
<210>152
<211>639
<212>DNA
<213>大豆
<400>152
atgcagcagc acctgatgca gatgcagccc atgatggctg cctactaccc caacaacgtc 60
accactgatc acattcaaca gtacctggat gagaacaagt ccttgattct gaagattgtt 120
gaaagccaga attctggcaa gctgagcgag tgtgccgaga accaatcaag gctgcagaga 180
aatctcatgt acctagctgc aatagctgat tctcaaccac aaccatctcc attggctggt 240
cagtatcctt ctagtggact tgtgcagcag ggagcacact acatgcaggc tcaacaggct 300
cagcagatgt cacaacaaca gctaatggct tcgcgctcct cgctcctgta ctcccaacag 360
cctttctcag tgcttcaaca gcagcaaggc atgcacagcc aacttggcat gagctccagt 420
ggaagtcaag gcctccacat gctgcaaagt gaagccacta atgttggagg caatgcaacc 480
ataggaaccg gaggagggtt tccggacttt gtacgcattg gtagtggcaa gcaagatatt 540
ggaatctctg gtgaaggcag aggaggaaac tctagtggcc actctggtga tggtggtgag 600
acacttaatt acctgaaagc tgctggtgat ggaaactga 639
<210>153
<211>212
<212>PRT
<21>大豆
<400>153
Met Gln Gln His Leu Met Gln Met Gln Pro Met Met Ala Ala Tyr Tyr
1 5 10 15
Pro Asn Asn Val Thr Thr Asp His Ile Gln Gln Tyr Leu Asp Glu Asn
20 25 30
Lys Ser Leu Ile Leu Lys Ile Val Glu Ser Gln Asn Ser Gly Lys Leu
35 40 45
Ser Glu Cys Ala Glu Asn Gln Ser Arg Leu Gln Arg Asn Leu Met Tyr
50 55 60
Leu Ala Ala Ile Ala Asp Ser Gln Pro Gln Pro Ser Pro Leu Ala Gly
65 70 75 80
Gln Tyr Pro Ser Ser Gly Leu Val Gln Gln Gly Ala His Tyr Met Gln
85 90 95
Ala Gln Gln Ala Gln Gln Met Ser Gln Gln Gln Leu Met Ala Ser Arg
100 105 110
Ser Ser Leu Leu Tyr Ser Gln Gln Pro Phe Ser Val Leu Gln Gln Gln
115 120 125
Gln Gly Met His Ser Gln Leu Gly Met Ser Ser Ser Gly Ser Gln Gly
130 135 140
Leu His Met Leu Gln Ser Glu Ala Thr Asn Val Gly Gly Asn Ala Thr
145 150 155 160
Ile Gly Thr Gly Gly Gly Phe Pro Asp Phe Val Arg Ile Gly Ser Gly
165 170 175
Lys Gln Asp Ile Gly Ile Ser Gly Glu Gly Arg Gly Gly Asn Ser Ser
180 185 190
Gly His Ser Gly Asp Gly Gly Glu Thr Leu Asn Tyr Leu Lys Ala Ala
195 200 205
Gly Asp Gly Asn
210
<210>154
<211>1248
<212>DNA
<213>菜茵衣藻(Chlamydomonas reinhardtii)
<400>154
atggccgcca ccatgctccg ctccagcacc cagtcgggca ttgccgctaa ggccggccgc 60
aaggaggctg tcagcgtccg cgcggtcgcc cagccccagc gccaggctgg tgctgccagc 120
gtcttctcct cgtcgtcgtc gggcgctgct gctcgccgcg gggtcgtcgc tcaggccacc 180
gctgttgcca cccccgcggc caagcctgcg gccaagacca gccagtatga gctgttcacg 240
ctcaccacct ggctgctgaa ggaggagatg aagggcacaa tcgatggcga gcttgtgacc 300
gtcatctcgt cggtgtcgct ggcctgcaag caaatcgcgt cgctggtgaa ccgcgctggt 360
atctccaacc tgaccggtgt ggctggcaac cagaacgtgc agggtgagga ccagaagaag 420
ctggacgtgg tgtccaacga ggtcttcaag aactgcctgg cctcctgcgg ccgcacgggt 480
gtgatcgcct ccgaggagga ggaccagccc gtggccgtgg aggagaccta ctcgggcaac 540
tacatcgtgg tgttcgaccc cctggacggc tcgtccaaca tcgacgccgg catctccgtc 600
ggctccatct tcggcatcta cgagcccagc gaggagtgcc ccattgacgc catggacgac 660
ccccagaaga tgatggagca gtgcgtcatg aacgtgtgcc agcccggctc gcgcctcaag 720
tgcgccggct actgcctgta cagcagcagc accatcatgg tgctgaccat cggcaacggt 780
gtgttcggct tcacgctgga ccccctggtc ggcgagttcg tgctgaccca ccccaacgtg 840
cagatccccg aggtgggcaa gatctacccg ttcaacgagg gcaactacgg cctgtgggac 900
gacagcgtta aggcttacat ggacagcctg aaggacccca agaagtggga cggcaagccc 960
tactcggccc gctacatcgg ctccctggtc ggtgacttcc accgcaccct gctgtacgga 1020
ggcatctacg gctaccccgg cgacgccaag aacaagaacg gcaagctccg cctgctgtac 1080
gagtgcgcgc ccatgtcgtt cattgccgag caggccggcg gcctcggctc caccggccag 1140
gagcgcgtgc tggacgtgaa ccccgagaag gtgcaccagc gcgtgccgct gttcatcggc 1200
tccaagaagg aggtcgagta cctggagtcc ttcaccaaga agcactaa 1248
<210>155
<211>415
<212>PRT
<213>莱茵衣藻
<400>155
Met Ala Ala Thr Met Leu Arg Ser Ser Thr Gln Ser Gly Ile Ala Ala
1 5 10 15
Lys Ala Gly Arg Lys Glu Ala Val Ser Val Arg Ala Val Ala Gln Pro
20 25 30
Gln Arg Gln Ala Gly Ala Ala Ser Val Phe Ser Ser Ser Ser Ser Gly
35 40 45
Ala Ala Ala Arg Arg Gly Val Val Ala Gln Ala Thr Ala Val Ala Thr
50 55 60
Pro Ala Ala Lys Pro Ala Ala Lys Thr Ser Gln Tyr Glu Leu Phe Thr
65 70 75 80
Leu Thr Thr Trp Leu Leu Lys Glu Glu Met Lys Gly Thr Ile Asp Gly
85 90 95
Glu Leu Val Thr Val Ile Ser Ser Val Ser Leu Ala Cys Lys Gln Ile
100 105 110
Ala Ser Leu Val Asn Arg Ala Gly Ile Ser Asn Leu Thr Gly Val Ala
115 120 125
Gly Asn Gln Asn Val Gln Gly Glu Asp Gln Lys Lys Leu Asp Val Val
130 135 140
Ser Asn Glu Val Phe Lys Asn Cys Leu Ala Ser Cys Gly Arg Thr Gly
145 150 155 160
Val Ile Ala Ser Glu Glu Glu Asp Gln Pro Val Ala Val Glu Glu Thr
165 170 175
Tyr Ser Gly Asn Tyr Ile Val Val Phe Asp Pro Leu Asp Gly Ser Ser
180 185 190
Asn Ile Asp Ala Gly Ile Ser Val Gly Ser Ile Phe Gly Ile Tyr Glu
195 200 205
Pro Ser Glu Glu Cys Pro Ile Asp Ala Met Asp Asp Pro Gln Lys Met
210 215 220
Mct Glu Gln Cys Val Met Asn Val Cys Gln Pro Gly Ser Arg Leu Lys
225 230 235 240
Cys Ala Gly Tyr Cys Leu Tyr Ser Ser Ser Thr Ile Met Val Leu Thr
245 250 255
Ile Gly Asn Gly Val Phe Gly Phe Thr Leu Asp Pro Leu Val Gly Glu
260 265 270
Phe Val Leu Thr His Pro Asn Val Gln Ile Pro Glu Val Gly Lys Ile
275 280 285
Tyr Pro Phe Asn Glu Gly Asn Tyr Gly Leu Trp Asp Asp Ser Val Lys
290 295 300
Ala Tyr Met Asp Ser Leu Lys Asp Pro Lys Lys Trp Asp Gly Lys Pro
305 310 315 320
Tyr Ser Ala Arg Tyr Ile Gly Ser Leu Val Gly Asp Phe His Arg Thr
325 330 335
Leu Leu Tyr Gly Gly Ile Tyr Gly Tyr Pro Gly Asp Ala Lys Asn Lys
340 345 350
Asn Gly Lys Leu Arg Leu Leu Tyr Glu Cys Ala Pro Met Ser Phe Ile
355 360 365
Ala Glu Gln Ala Gly Gly Leu Gly Ser Thr Gly Gln Glu Arg Val Leu
370 375 380
Asp Val Asn Pro Glu Lys Val His Gln Arg Val Pro Leu Phe Ile Gly
385 390 395 400
Ser Lys Lys Glu Val Glu Tyr Leu Glu Ser Phe Thr Lys Lys His
405 410 415
<210>156
<211>1239
<212>DNA
<213>Bigelowiella natans
<400>156
atggctgccg tgctctttcg cggaggtgtg ctgtcttcca ccatgactgc ggctcgcaca 60
ttcgcagcgc catctgtgca cacccgtggc atgcacatgt cagtcaagag cagtaaccct 120
ttctctcagg ctggtcgtcg tgctgctgtt agatccagtg tcgcaccctc ccctgtccaa 180
gactctgctg gtactatcgt tgatgacgga actgtcacat taacaagatt catgattgag 240
gaggcaatga agagcaagac tcctgggcag gaggacatgg ttcgtttgat ttcttccatc 300
tcagttgcat gcaaacgcat tgcatccatg gtgcaaactg caggaatctc cggatctaca 360
ggtctggctg aaggtggtgg atcagtcaac gttcaaggcg aggaacagaa gaaacttgat 420
gtcatttcta acgatgtact aaagtctgcc cttcgtcctt ctggaaaact tggagtaatt 480
gcctctgagg aggaagataa tccagttgtc gttgatgaac tttactccgg cgaatatgtt 540
gctactttcg atccgctcga tggatcttcc aatattgatg ctgcaatttc cactggaact 600
atcttcggag tgttcaaagc tccagaagag tgcttgatcg gggattctga taatctcagt 660
attgcagagc agcaatgttt ggaggcaaca cttcaacctg gaactaacct tgttgctgct 720
ggatactgca tgtattcgtc ctccaccatc cttgttctca ccaccggaga cgggctcaat 780
ggatttactc ttgacccttc cattggagag ttcatcctca cccatcctaa tatccagatt 840
cctagccgtg gaaagatcta ttctatgaac gaagcaaact acttcgattg ggaccctaag 900
cttcagacct acgttgataa ccttaagaag gcagaaggtc aaactggaga aaagtacagc 960
tctcgctaca tcggatccat ggtcggagat gtgcaccgta cccttctcta tggaggcatc 1020
ttcgcttacc ctggagataa gaagaacgtc aacggaaaac ttcgccttct gtacgaagct 1080
gctccaatgt cccttatctt cgaacaagcg ggtggaaaat ctattactgg acctggtgga 1140
cgtgtgttgg acttagttcc tgataaggtt caccagcgtt gtcctgtgtt cattggatcc 1200
cctgatgatg tggatgaagt tgaaaaggct ctcgcataa 1239
<210>157
<211>412
<212>PRT
<213>Bigelowiella natans
<400>157
Met Ala Ala Val Leu Phe Arg Gly Gly Val Leu Ser Ser Thr Met Thr
1 5 10 15
Ala Ala Arg Thr Phe Ala Ala Pro Ser Val His Thr Arg Gly Met His
20 25 30
Met Ser Val Lys Ser Ser Asn Pro Phe Ser Gln Ala Gly Arg Arg Ala
35 40 45
Ala Val Arg Ser Ser Val Ala Pro Ser Pro Val Gln Asp Ser Ala Gly
50 55 60
Thr Ile Val Asp Asp Gly Thr Val Thr Leu Thr Arg Phe Met Ile Glu
65 70 75 80
Glu Ala Met Lys Ser Lys Thr Pro Gly Gln Glu Asp Met Val Arg Leu
85 90 95
Ile Ser Ser Ile Ser Val Ala Cys Lys Arg Ile Ala Ser Met Val Gln
100 105 110
Thr Ala Gly Ile Ser Gly Ser Thr Gly Leu Ala Glu Gly Gly Gly Ser
115 120 125
Val Asn Val Gln Gly Glu Glu Gln Lys Lys Leu Asp Val Ile Ser Asn
130 135 140
Asp Val Leu Lys Ser Ala Leu Arg Pro Ser Gly Lys Leu Gly Val Ile
145 150 155 160
Ala Ser Glu Glu Glu Asp Asn Pro Val Val Val Asp Glu Leu Tyr Ser
165 170 175
Gly Glu Tyr Val Ala Thr Phe Asp Pro Leu Asp Gly Ser Ser Asn Ile
180 185 190
Asp Ala Ala Ile Ser Thr Gly Thr Ile Phe Gly Val Phe Lys Ala Pro
195 200 205
Glu Glu Cys Leu Ile Gly Asp Ser Asp Asn Leu Ser Ile Ala Glu Gln
210 215 220
Gln Cys Leu Glu Ala Thr Leu Gln Pro Gly Thr Asn Leu Val Ala Ala
225 230 235 240
Gly Tyr Cys Met Tyr Ser Ser Ser Thr Ile Leu Val Leu Thr Thr Gly
245 250 255
Asp Gly Leu Asn Gly Phe Thr Leu Asp Pro Ser Ile Gly Glu Phe Ile
260 265 270
Leu Thr His Pro Asn Ile Gln Ile Pro Ser Arg Gly Lys Ile Tyr Ser
275 280 285
Met Asn Glu Ala Asn Tyr Phe Asp Trp Asp Pro Lys Leu Gln Thr Tyr
290 295 300
Val Asp Asn Leu Lys Lys Ala Glu Gly Gln Thr Gly Glu Lys Tyr Ser
305 310 315 320
Ser Arg Tyr Ile Gly Ser Met Val Gly Asp Val His Arg Thr Leu Leu
325 330 335
Tyr Gly Gly Ile Phe Ala Tyr Pro Gly Asp Lys Lys Asn Val Asn Gly
340 345 350
Lys Leu Arg Leu Leu Tyr Glu Ala Ala Pro Met Ser Leu Ile Phe Glu
355 360 365
Gln Ala Gly Gly Lys Ser Ile Thr Gly Pro Gly Gly Arg Val Leu Asp
370 375 380
Leu Val Pro Asp Lys Val His Gln Arg Cys Pro Val Phe Ile Gly Ser
385 390 395 400
Pro Asp Asp Val Asp Glu Val Glu Lys Ala Leu Ala
405 410
<210>158
<211>1230
<212>DNA
<213>Aquilegia formosa x Aquilegia pubescens
<400>158
atggttgcag cagctatccc tacttcttgt caactgctct tctccacctc ttcttcgacc 60
acttctcgtc tatatcctcc ttatcttgat gccaaaactc tcttctcatt tcctacaaac 120
aagagacatg taagcattgt tagaactccg gcaggtgtac ggtgtcaagc attaggagca 180
gaggtagtag tgaccaagag gagtgcattt gagatacaaa ctctaacagg atggttattg 240
aaacaagaac aaacaggggt tatagatgca gagttaacta tagttttgtc tagcatttca 300
atggcctgta agcagattgc ttcattggtg cagagggcaa gtatttccaa cttaactgga 360
gttcaaggag ctgttaatat tcaaggtgaa gatcagaaga agcttgatgt catctctaac 420
gaggtgttct ctaattgcct tagatcaagt ggaagaacag ggattatagc atcagaagaa 480
gaggatgtac cagttgcagt ggaggaaagc tactctggca actatattgt cgtttttgat 540
cctcttgacg ggtcatcaaa cattgatgcc gctgtgtcaa ctggatccat atttggaatt 600
tatagtccga acgatgagtg tcttactgaa gtcgatgata atgccacagt gcttcagcaa 660
gtggaacaga agtgcatcat caatgtgtgt caacctggca acaacttgtt ggcagctggc 720
tactgcatgt actcaagctc tgtaatcttt gtgctttcca ttggacaagg ggttttctca 780
tttaccttag accctatgta cggagaattc gtcttgacac aggaaaacat tcaaatacct 840
aaatcaggta aaatctactc attcaacgaa ggcaactacc aattatggga tgataagttg 900
aagaagtata tcgatgacct taaggaccct ggtcctagtg gcaaaccata ctcttccaga 960
tacattggaa gcttggttgg cgatttccac cggacccttc tttatggagg gatatatgga 1020
taccctaggg ataagaatag aaaaaatggg aagctaaggc tactgtatga gtgtgcacct 1080
atgagttatt tagttgaaca agcaggagga aaaggatcag atggacacca aagagtactc 1140
gatattgaac cggtggagat tcatcagcgt gttccacttt tcattggcag cgttgaagaa 1200
gttgagaaac tagagaagtt cttggcttga 1230
<210>159
<211>409
<212>PRT
<213>Aquilegia formosa x Aquilegia pubescens
<400>159
Met Val Ala Ala Ala Ile Pro Thr Ser Cys Gln Leu Leu Phe Ser Thr
1 5 10 15
Ser Ser Ser Thr Thr Ser Arg Leu Tyr Pro Pro Tyr Leu Asp Ala Lys
20 25 30
Thr Leu Phe Ser Phe Pro Thr Asn Lys Arg His Val Ser Ile Val Arg
35 40 45
Thr Pro Ala Gly Val Arg Cys Gln Ala Leu Gly Ala Glu Val Val Val
50 55 60
Thr Lys Arg Ser Ala Phe Glu Ile Gln Thr Leu Thr Gly Trp Leu Leu
65 70 75 80
Lys Gln Glu Gln Thr Gly Val Ile Asp Ala Glu Leu Thr Ile Val Leu
85 90 95
Ser Ser Ile Ser Met Ala Cys Lys Gln Ile Ala Ser Leu Val Gln Arg
100 105 110
Ala Ser Ile Ser Asn Leu Thr Gly Val Gln Gly Ala Val Asn Ile Gln
115 120 125
Gly Glu Asp Gln Lys Lys Leu Asp Val Ile Ser Asn Glu Val Phe Ser
130 135 140
Asn Cys Leu Arg Ser Ser Gly Arg Thr Gly Ile Ile Ala Ser Glu Glu
145 150 155 160
Glu Asp Val Pro Val Ala Val Glu Glu Ser Tyr Ser Gly Asn Tyr Ile
165 170 175
Val Val Phe Asp Pro Leu Asp Gly Ser Ser Asn Ile Asp Ala Ala Val
180 185 190
Ser Thr Gly Ser Ile Phe Gly Ile Tyr Ser Pro Asn Asp Glu Cys Leu
195 200 205
Thr Glu Val Asp Asp Asn Ala Thr Val Leu Gln Gln Val Glu Gln Lys
210 215 220
Cys Ile Ile Asn Val Cys Gln Pro Gly Asn Asn Leu Leu Ala Ala Gly
225 230 235 240
Tyr Cys Met Tyr Ser Ser Ser Val Ile Phe Val Leu Ser Ile Gly Gln
245 250 255
Gly Val Phe Ser Phe Thr Leu Asp Pro Met Tyr Gly Glu Phe Val Leu
260 265 270
Thr Gln Glu Asn Ile Gln Ile Pro Lys Ser Gly Lys Ile Tyr Ser Phe
275 280 285
Asn Glu Gly Asn Tyr Gln Leu Trp Asp Asp Lys Leu Lys Lys Tyr Ile
290 295 300
Asp Asp Leu Lys Asp Pro Gly Pro Ser Gly Lys Pro Tyr Ser Ser Arg
305 310 315 320
Tyr Ile Gly Ser Leu Val Gly Asp Phe His Arg Thr Leu Leu Tyr Gly
325 330 335
Gly Ile Tyr Gly Tyr Pro Arg Asp Lys Asn Arg Lys Asn Gly Lys Leu
340 345 350
Arg Leu Leu Tyr Glu Cys Ala Pro Met Ser Tyr Leu Val Glu Gln Ala
355 360 365
Gly Gly Lys Gly Ser Asp Gly His Gln Arg Val Leu Asp Ile Glu Pro
370 375 380
Val Glu Ile His Gln Arg Val Pro Leu Phe Ile Gly Ser Val Glu Glu
385 390 395 400
Val Glu Lys Leu Glu Lys Phe Leu Ala
405
<210>160
<211>1254
<212>DNA
<213>拟南芥
<400>160
atggcagcat cggccgcaac aacgacgtcg tctcaccttc ttctctcaag ctcacgtcac 60
gtggcttcat catcccagcc ttcaatcctt tcaccgagat ctctcttctc caacaacggg 120
aaacgagcac caactggagt gagaaaccat cagtatgcga gtggagtgag gtgtatggcc 180
gtagcggcgg atgcttctga gacgaaaacg gcggcgagga agaagagtgg atacgaactt 240
caaacgttga cgggctggtt gctgagacaa gagatgaaag gagagataga tgcagagctg 300
acgatagtga tgtcgagtat atcattggct tgtaagcaga tcgcttcact tgttcaacgt 360
gccggaatat ctaacctgac cggagttcaa ggcgccatta atattcaggg agaggatcag 420
aagaagcttg acgtcatctc taatgaggtg ttttccaact gtttgagatc aagtggaaga 480
acgggaatca tagcctcgga ggaagaggac gtgccagttg cggtggagga gagttactcc 540
ggcaactacg tcgtcgtgtt tgaccctctt gatggttcct ccaacattga cgctgccgtc 600
tctactggtt ctatcttcgg tatctatagc cccaatgacg aatgcattgt cgacgactcc 660
gacgatatct cagctcttgg gtcagaagaa caaaggtgta tagtaaacgt gtgccagcca 720
gggaacaact tgttagcagc cggctactgt atgtactcga gctcggtcat cttcgttctt 780
actctaggca aaggcgtttt ctccttcacg cttgatccaa tgtacggtga gtttgtcctc 840
acgcaagaaa acattgagat ccccaaagcc gggagaatct actctttcaa cgaagggaat 900
taccagatgt gggacgataa actaaagaag tacattgatg accttaagga ccctggtcca 960
actgggaagc cttactcggc aaggtacatt ggaagtttgg ttggagattt tcacaggact 1020
ttgttgtacg gtgggattta cgggtaccct cgtgacgcaa agagcaaaaa tggaaagctt 1080
aggcttttgt atgagtgtgc accaatgagt ttcattgttg aacaagctgg agggaaaggt 1140
tctgatggac attcgagagt actagatatc caaccgactg agatacatca gagggttcct 1200
ctatacattg gaagcacaga ggaagtagag aagttggaga agtacttggc ttga 1254
<210>161
<211>417
<212>PRT
<213>拟南芥
<400>161
Met Ala Ala Ser Ala Ala Thr Thr Thr Ser Ser His Leu Leu Leu Ser
1 5 10 15
Ser Ser Arg His Val Ala Ser Ser Ser Gln Pro Ser Ile Leu Ser Pro
20 25 30
Arg Ser Leu Phe Ser Asn Asn Gly Lys Arg Ala Pro Thr Gly Val Arg
35 40 45
Asn His Gln Tyr Ala Ser Gly Val Arg Cys Met Ala Val Ala Ala Asp
50 55 60
Ala Ser Glu Thr Lys Thr Ala Ala Arg Lys Lys Ser Gly Tyr Glu Leu
65 70 75 80
Gln Thr Leu Thr Gly Trp Leu Leu Arg Gln Glu Met Lys Gly Glu Ile
85 90 95
Asp Ala Glu Leu Thr Ile Val Met Ser Ser Ile Ser Leu Ala Cys Lys
100 105 110
Gln Ile Ala Ser Leu Val Gln Arg Ala Gly Ile Ser Asn Leu Thr Gly
115 120 125
Val Gln Gly Ala Ile Asn Ile Gln Gly Glu Asp Gln Lys Lys Leu Asp
130 135 140
Val Ilc Ser Asn Glu Val Phe Ser Asn Cys Leu Arg Ser Ser Gly Arg
145 150 155 160
Thr Gly Ile Ile Ala Ser Glu Glu Glu Asp Val Pro Val Ala Val Glu
165 170 175
Glu Ser Tyr Ser Gly Asn Tyr Val Val Val Phe Asp Pro Leu Asp Gly
180 185 190
Ser Ser Asn Ile Asp Ala Ala Val Ser Thr Gly Ser Ile Phe Gly Ile
195 200 205
Tyr Ser Pro Asn Asp Glu Cys Ile Val Asp Asp Ser Asp Asp Ile Ser
210 215 220
Ala Leu Gly Ser Glu Glu Gln Arg Cys Ile Val Asn ValCys Gln Pro
225 230 235 240
Gly Asn Asn Leu Leu Ala Ala Gly Tyr Cys Met Tyr Ser Ser Ser Val
245 250 255
Ile Phe Val Leu Thr Leu Gly Lys Gly Val Phe Ser Phe Thr Leu Asp
260 265 270
Pro Met Tyr Gly Glu Phe Val Leu Thr Gln Glu Asn Ile Glu Ile Pro
275 280 285
Lys Ala Gly Arg Ile Tyr Ser Phe Asn Glu Gly Asn Tyr Gln Met Trp
290 295 300
Asp Asp Lys Leu Lys Lys Tyr Ile Asp Asp Leu Lys Asp Pro Gly Pro
305 310 315 320
Thr Gly Lys Pro Tyr Ser Ala Arg Tyr Ile Gly Ser Leu Val Gly Asp
325 330 335
Phe His Arg Thr Leu Leu Tyr Gly Gly Ile Tyr Gly Tyr Pro Arg Asp
340 345 350
Ala Lys Ser Lys Asn Gly Lys Leu Arg Leu Leu Tyr Glu Cys Ala Pro
355 360 365
Met Ser Phe Ile Val Glu Gln Ala Gly Gly Lys Gly Ser Asp Gly His
370 375 380
Ser Arg Val Leu Asp Ile Gln Pro Thr Glu Ile His Gln Arg Val Pro
385 390 395 400
Leu Tyr Ile Gly Ser Thr Glu Glu Val Glu Lys Leu Glu Lys Tyr Leu
405 410 415
Ala
210>162
<211>1254
<212>DNA
<213>欧洲油菜
<400>162
atggcagcaa ccgccgcgac aacgtcatcg tctcatcttc ttctctcaag ctctcgccac 60
gtggcagcct catctcagcc acaaatcctt ttccagagat ctctgttttc cggcgggaaa 120
cgatcggcag ctggaaaaaa ccatcatgct agtggtggag tgaggtgtat ggcggttgca 180
gcggatgctt cggcggaggc taagccggcg gcagcgagga agaagagtgg gtacgagctt 240
cagacgctga cgggttggtt gctgagacaa gagcagaaag gagagataga tacagagctg 300
acgatagtga tgtcgagcat agcgatggct tgtaagcaga tcgcttcgct tgtacagcgc 360
gccggaatct ctaatctgac cggcgttcaa ggagccgtta acattcaggg agaggatcag 420
aaaaagctcg acgtcgtctc taatgaggta ttttcaaact gtttgagatc aagtggaagg 480
acagggatca ttgcgtcaga ggaagaggac gtccccgtag cagttgaaga gagttactcc 540
ggaaactaca ttgtcgtctt tgatcctctc gacggttcct ccaacatcga cgctgcagtc 600
tccactggtt caatcttcgg tatctacagc cccaatgacg agtgtatcgt tgacgactcc 660
gacgatatct cctctcttgg ttcagaagaa caaaggtgta tagtaaacgt gtgtcaacca 720
gggaacaact tgctcgcagc tggctactgt atgtactcga gctcagtcat cttcgttctc 780
accttaggca agggcgtttt ctccttcaca ctcgacccaa tgtacggcga gttcgtcctc 840
actcaagaga acattgagat ccccaaagca gggaaaatct actctttcaa cgaagggaac 900
taccagatgt gggacgagaa actgaagaag tacattgatg atcttaagga ccctggtcca 960
agtgggaagc cttactctgc aaggtacatt ggtagtttgg tcggagactt tcacagaact 1020
ttgttgtacg gtgggattta cgggtaccct cgtgacgcca agagcaaaaa cggtaagctt 1080
aggcttttgt atgagtgtgc accgatgagt ttcatcgttg aacaagctgg aggaaaagga 1140
tcagatggcc accaaagagt actagatatc caacccaccg agatacatca gagggttcca 1200
ctttacattg gaagcaaaga agaagtagag aagctggaga agtacttggc ttga 1254
<210>163
<211>417
<212>PRT
<213>欧洲油菜
<400>163
Met Ala Ala Thr Ala Ala Thr Thr Ser Ser Ser His Leu Leu Leu Ser
1 5 10 15
Ser Ser Arg His Val Ala Ala Ser Ser Gln Pro Gln Ile Leu Phe Gln
20 25 30
Arg Ser Leu Phe Ser Gly Gly Lys Arg Ser Ala Ala Gly Lys Asn His
35 40 45
His Ala Ser Gly Gly Val Arg Cys Met Ala Val Ala Ala Asp Ala Ser
50 55 60
Ala Glu Ala Lys Pro Ala Ala Ala Arg Lys Lys Ser Gly Tyr Glu Leu
65 70 75 80
Gln Thr Leu Thr Gly Trp Leu Leu Arg Gln Glu Gln Lys Gly Glu Ile
85 90 95
Asp Thr Glu Leu Thr Ile Val Met Ser Ser Ile Ala Met Ala Cys Lys
100 105 110
Gln Ile Ala Ser Leu Val Gln Arg Ala Gly Ile Ser Asn Leu Thr Gly
115 120 125
Val Gln Gly Ala Val Asn Ile Gln Gly Glu Asp Gln Lys Lys Leu Asp
130 135 140
Val Val Ser Asn Glu Val Phe Ser Asn Cys Leu Arg Ser Ser Gly Arg
145 150 155 160
Thr Gly Ile Ile Ala Ser Glu Glu Glu Asp Val Pro Val Ala Val Glu
165 170 175
Glu Ser Tyr Ser Gly Asn Tyr Ile Val Val Phe Asp Pro Leu Asp Gly
180 185 190
Ser Ser Asn Ile Asp Ala Ala Val Ser Thr Gly Ser Ile Phe Gly Ile
195 200 205
Tyr Ser Pro Asn Asp Glu Cys Ile Val Asp Asp Ser Asp Asp Ile Ser
210 215 220
Ser Leu Gly Ser Glu Glu Gln Arg Cys Ile Val Asn Val Cys Gln Pro
225 230 235 240
Gly Asn Asn Leu Leu Ala Ala Gly Tyr Cys Met Tyr Ser Ser Ser Val
245 250 255
Ile Phe Val Leu Thr Leu Gly Lys Gly Val Phe Ser Phe Thr Leu Asp
260 265 270
Pro Met Tyr Gly Glu Phe Val Leu Thr Gln Glu Asn Ile Glu Ile Pro
275 280 285
Lys Ala Gly Lys Ile Tyr Ser Phe Asn Glu Gly Asn Tyr Gln Met Trp
290 295 300
Asp Glu Lys Leu Lys Lys Tyr Ile Asp Asp Leu Lys Asp Pro Gly Pro
305 310 315 320
Ser Gly Lys Pro Tyr Ser Ala Arg Tyr Ile Gly Ser Leu Val Gly Asp
325 330 335
Phe His Arg Thr Leu Leu Tyr Gly Gly Ile Tyr Gly Tyr Pro Arg Asp
340 345 350
Ala Lys Ser Lys Asn Gly Lys Leu Arg Leu Leu Tyr Glu Cys Ala Pro
355 360 365
Met Ser Phe Ile Val Glu Gln Ala Gly Gly Lys Gly Ser Asp Gly His
370 375 380
Gln Arg Val Leu Asp Ile Gln Pro Thr Glu Ile His Gln Arg Val Pro
385 390 395 400
Leu Tyr Ile Gly Ser Lys Glu Glu Val Glu Lys Leu Glu Lys Tyr Leu
405 410 415
Ala
<210>164
<211>1130
<212>DNA
<213>Cyanidioschyzon merolae
<400>164
atggcgaagc aagcaccgca cgctttcgtt agccttgggg ctcctaagct gcgctcaaca 60
aacatatggg gaagggtatc ggtgtcggtc ttgccgctgg aaacaaggca tcaacgtcgc 120
tttggtgcag tgagactgcg cgcagcttta gacctaccca tgacactcgg acagtgggtt 180
ctccaacagg agaggcagca tccagagacc gctgatttgg ctcctttgat aacagccaca 240
gcgacagctg gcaagcagat tgcctcactg gtcgcccgag cgggcgtgag caacttgact 300
ggccttcagg gctcggtcaa cgtgcagggc gaggagcaga aaaagctgga cgtgttgacg 360
aacgaggtgc tcaagaacgc gctacgctca acagggaaac taggtgtctt ggcttcggaa 420
gaggaaaacg agccagtgtc gctcatggaa gaggcgtata caggtgactt tattgctgcg 480
tttgacccgt tggacggatc ctcgaatttg gatgcagcga tcgccacggg tacgattttt 540
ggtgtaatgc gcagcggcga gcactgtctg acgggacccg aggacgcgga tataagtcag 600
cgacaaatgc agtgcctcgt gcagacgctg caaccgggtg cgaatctggt ggcagcgggc 660
tacattctct actcctcatc ggtgattttc atgctgtcta ttggtcacgg agtgcagggt 720
ttttctctgg acccagcgat tggcgagttt gttttgacgc acccagatgt tcgtgttccg 780
gagcgtggca agatctactc cttcaacgag gcaaactcgg ataactggga ccctgttctt 840
caagaatata ttcgatcgat gaagaaaaag ggctattctt cgcgctacat aggatctctc 900
gttggcgatg tccatcgcac gctgatttac ggcggcgttt ttggataccc tggtgataag 960
aagaacccga acggcaagtt gcgtcttctg tacgagtgcg cacctatggc gtatctcatg 1020
gagcaggccg gcggtatagc gaccacggga aagcaaagaa ttctggatat tgttccgcga 1080
gatgtccatc agcgagagcc gttcatttgc ggaagcccca gggatgttga 1130
<210>165
<211>391
<212>PRT
<213>Cyanidioschyzon merolae
<400>165
Met Ala Lys Gln Ala Pro His Ala Phe Val Ser Leu Gly Ala Pro Lys
1 5 10 15
Leu Arg Ser Thr Asn Ile Trp Gly Arg Val Ser Val Ser Val Leu Pro
20 25 30
Leu Glu Thr Arg His Gln Arg Arg Phe Gly Ala Val Arg Leu Arg Ala
35 40 45
Ala Leu Asp Leu Pro Met Thr Leu Gly Gln Trp Val Leu Gln Gln Glu
50 55 60
Arg Gln His Pro Glu Thr Ala Asp Leu Ala Pro Leu Ile Thr Ala Thr
65 70 75 80
Ala Thr Ala Gly Lys Gln Ile Ala Ser Leu Val Ala Arg Ala Gly Val
85 90 95
Ser Asn Leu Thr Gly Leu Gln Gly Ser Val Asn Val Gln Gly Glu Glu
100 105 110
Gln Lys Lys Leu Asp Val Leu Thr Asn Glu Val Leu Lys Asn Ala Leu
115 120 125
Arg Ser Thr Gly Lys Leu Gly Val Leu Ala Ser Glu Glu Glu Asn Glu
130 135 140
Pro Val Ser Leu Met Glu Glu Ala Tyr Thr Gly Asp Phe Ile Ala Ala
145 150 155 160
Phe Asp Pro Leu Asp Gly Ser Ser Asn Leu Asp Ala Ala Ile Ala Thr
165 170 175
Gly Thr Ile Phe Gly Val Met Arg Ser Gly Glu His Cys Leu Thr Gly
180 185 190
Pro Glu Asp Ala Asp Ile Ser Gln Arg Gln Met Gln Cys Leu Val Gln
195 200 205
Thr Leu Gln Pro Gly Ala Asn Leu Val Ala Ala Gly Tyr Ile Leu Tyr
210 215 220
Ser Ser Ser Val Ile Phe Met Leu Ser Ile Gly His Gly Val Gln Gly
225 230 235 240
Phe Ser Leu Asp Pro Ala Ile Gly Glu Phe Val Leu Thr His Pro Asp
245 250 255
Val Arg Val Pro Glu Arg Gly Lys Ile Tyr Ser Phe Asn Glu Ala Asn
260 265 270
Ser Asp Asn Trp Asp Pro Val Leu Gln Glu Tyr Ile Arg Ser Met Lys
275 280 285
Lys Lys Gly Tyr Ser Ser Arg Tyr Ile Gly Ser Leu Val Gly Asp Val
290 295 300
His Arg Thr Leu Ile Tyr Gly Gly Val Phe Gly Tyr Pro Gly Asp Lys
305 310 315 320
Lys Asn Pro Asn Gly Lys Leu Arg Leu Leu Tyr Glu Cys Ala Pro Met
325 330 335
Ala Tyr Leu Met Glu Gln Ala Gly Gly Ile Ala Thr Thr Gly Lys Gln
340 345 350
Arg Ile Leu Asp Ile Val Pro Arg Asp Val His Gln Arg Glu Pro Phe
355 360 365
Ile Cys Gly Ser Pro Arg Asp Val Glu Asp Leu Leu Lys Ile Tyr Gln
370 375 380
Gly Ser Met Ala Met Arg Gly
385 390
<210>166
<211>1218
<212>DNA
<213>大豆
<400>166
atggttgcaa tggcagcagc aacagcatcc acccagttga ttttctcaaa gccttgttcc 60
ccttcacgtc tatgcccctt ccaactatgt gtctttgaca ctaaacaagt gctatcaagt 120
ggcaggagaa ggcatgtggg gggttctgga gttaggtgca tggctgtggg ggaagcagca 180
accactggga caaagaagag aagtggatat gagcttcaaa cactcactag ctggttgctg 240
aagcaggagc aagctggggt gattgatgca gaactcacta ttgtgctgtc tagcatttcc 300
atggcatgca aacagattgc ttctttggtg caaagagcta acatttccaa cctcactggg 360
gttcaaggtg ctgtcaatgt tcaaggggaa gaccagaaaa agcttgatgt tgtttcaaat 420
gaggttttct caaactgctt gaggtcaagt gggaggacag ggataatagc atcagaggag 480
gaagatgtgc cagtggcagt agaagagagt tattctggaa actacattgt ggtgtttgac 540
ccacttgatg ggtcatccaa tattgatgct gcagcgtcaa ctgggtccaa tttttggata 600
tacagcccca atgatgagtg tcttgctgac attgatgatg accccaccct tgacacaaca 660
gaacaaagat gtattgtgaa cgtgtgccaa cctggaagca accttcttgc agctggttac 720
tgcatgtatt ctagctcaat aatctttgtt ctcacacttg gaaatggagt gtttgtgttt 780
acattggacc cgatgtatgg cgaattcgtt ttgactcagg aaaacctcca gatacctaga 840
gcaggcaaaa tctatgcatt caatgaaggt aattatcagt tgtgggatga gaagctaaag 900
aaatatattg atgatctcaa ggacccaggt caaagcggca agccttattc tgcaaggtac 960
attggtagct tggtaggaga tttccacagg acactgctat atggtggcat ttacgggtac 1020
cccagggaca agaaaagcaa gaatgggaaa ctaaggctcc tgtatgaatg tgctcctatt 1080
aacttcattg tagaacaagc tggtggaaaa ggtacagatg gccttcaagt actccggctt 1140
caagggacag agattcatca acgtgtgcca ctgtacattg gggaagaggt agagaaggtg 1200
gaaaagtact tggcttaa 1218
<210>167
<211>405
<212>PRT
<213>大豆
<400>167
Met Val Ala Met Ala Ala Ala Thr Ala Ser Thr Gln Leu Ile Phe Ser
1 5 10 15
Lys Pro Cys Ser Pro Ser Arg Leu Cys Pro Phe Gln Leu Cys Val Phe
20 25 30
Asp Thr Lys Gln Val Leu Ser Ser Gly Arg Arg Arg His Val Gly Gly
35 40 45
Ser Gly Val Arg Cys Met Ala Val Gly Glu Ala Ala Thr Thr Gly Thr
50 55 60
Lys Lys Arg Ser Gly Tyr Glu Leu Gln Thr Leu Thr Ser Trp Leu Leu
65 70 75 80
Lys Gln Glu Gln Ala Gly Val Ile Asp Ala Glu Leu Thr Ile Val Leu
85 90 95
Ser Ser Ile Ser Met Ala Cys Lys Gln Ile Ala Ser Leu Val Gln Arg
100 105 110
Ala Asn Ile Ser Asn Leu Thr Gly Val Gln Gly Ala Val Asn Val Gln
115 120 125
Gly Glu Asp Gln Lys Lys Leu Asp Val Val Ser Asn Glu Val Phe Ser
130 135 140
Asn Cys Leu Arg Ser Ser Gly Arg Thr Gly Ile Ile Ala Ser Glu Glu
145 150 155 160
Glu Asp Val Pro Val Ala Val Glu Glu Ser Tyr Ser Gly Asn Tyr Ile
165 170 175
Val Val Phe Asp Pro Leu Asp Gly Ser Ser Asn Ile Asp Ala Ala Ala
180 185 190
Ser Thr Gly Ser Asn Phe Trp Ile Tyr Ser Pro Asn Asp Glu Cys Leu
195 200 205
Ala Asp Ile Asp Asp Asp Pro Thr Leu Asp Thr Thr Glu Gln Arg Cys
210 215 220
Ile Val Asn Val Cys Gln Pro Gly Ser Asn Leu Leu Ala Ala Gly Tyr
225 230 235 240
Cys Met Tyr Ser Ser Ser Ile Ile Phe Val Leu Thr Leu Gly Asn Gly
245 250 255
Val Phe Val Phe Thr Leu Asp Pro Met Tyr Gly Glu Phe Val Leu Thr
260 265 270
Gln Glu Asn Leu Gln Ile Pro Arg Ala Gly Lys Ile Tyr Ala Phe Asn
275 280 285
Glu Gly Asn Tyr Gln Leu Trp Asp Glu Lys Leu Lys Lys Tyr Ile Asp
290 295 300
Asp Leu Lys Asp Pro Gly Gln Ser Gly Lys Pro Tyr Ser Ala Arg Tyr
305 310 315 320
Ile Gly Ser Leu Val Gly Asp Phe His Arg Thr Leu Leu Tyr Gly Gly
325 330 335
Ile Tyr Gly Tyr Pro Arg Asp Lys Lys Ser Lys Asn Gly Lys Leu Arg
340 345 350
Leu Leu Tyr Glu Cys Ala Pro Ile Asn Phe Ile Val Glu Gln Ala Gly
355 360 365
Gly Lys Gly Thr Asp Gly Leu Gln Val Leu Arg Leu Gln Gly Thr Glu
370 375 380
Ile His Gln Arg Val Pro Leu Tyr Ile Gly Glu Glu Val Glu Lys Val
385 390 395 400
Glu Lys Tyr Leu Ala
405
<210>168
<211>1212
<212>DNA
<213>番茄
<400>168
atggcagcaa cagcaacaac ttcatattta agtgctctag acaaaaagac tccattttta 60
tttgccttgg acaaaaagac tccattttta tgcccaaaaa acagcacaaa gagaaggtca 120
tttaatggag gagttaagtg catggcaata gagacagctt caggtgttac acaaaccaag 180
aaaaagagtg gctatgagtt acaaacttta acaagttggc tattgagaca agaacaagct 240
ggagttattg atgctgaact taccatagta atttcaagta tttcaatggc ttgtaaacag 300
attgcttctt tggtccaaag agctggaatt tctaacctta ctggagttca aggtgctgtc 360
aatattcaag gagaagatca gaagaaactt gatgttgtct ctaatgaggt tttctcgaat 420
tgtctaagat caagtggaag gactgggatt atagcatcag aagaagagga tgtacctgtg 480
gcagtggaag agagttactc aggcaactac attgtggtgt ttgatcctct tgatggatca 540
tcaaacattg atgctgctgt atctaccggt tctatctttg gaatatacag cccgaatgat 600
gagtgcctag ctgatcttgg agatgattcc acgcttgaca atatagagca aaagtgcatc 660
gtgaatgtat gtcaaccagg gacaaacctt cttgcagcag gatactgcat gtactcaagc 720
tctgtgattt tcgtactcac cttgggaaat ggcgtttttt cctttaactt ggatccaatg 780
tatggagaat ttgttctgac tcaagaaaat gtccaaatac caaagtctgg aaagatctat 840
tcattcaatg aaggaaacta ccagctctgg gatgacaagt tgaaaaaata tatcgatgac 900
ttgaaagacc ctggtcctag tggcaagcct tactctgcaa ggtacattgg tagtttggta 960
ggtgacttcc atagaactct tctatatggt ggcatttatg gttatcctag agacagaaag 1020
agcaagaatg gaaagttgag gcttttgtac gaatgtgctc ccatgagctt cattgtggaa 1080
caagctggtg gcaaaggatc cgatggtcac caaagagttc tcgatatcca accaactgag 1140
atacatcaac gagttccatt gtacattgga agcacagaag aagttgaaaa attggagaag 1200
tacttgtctt aa 1212
<210>169
<211>403
<212>PRT
<213>番茄
<400>169
Met Ala Ala Thr Ala Thr Thr Ser Tyr Leu Ser Ala Leu Asp Lys Lys
1 5 10 15
Thr Pro Phe Leu Phe Ala Leu Asp Lys Lys Thr Pro Phe Leu Cys Pro
20 25 30
Lys Asn Ser Thr Lys Arg Arg Ser Phe Asn Gly Gly Val Lys Cys Met
35 40 45
Ala Ile Glu Thr Ala Ser Gly Val Thr Gln Thr Lys Lys Lys Ser Gly
50 55 60
Tyr Glu Leu Gln Thr Leu Thr Ser Trp Leu Leu Arg Gln Glu Gln Ala
65 70 75 80
Gly Val Ile Asp Ala Glu Leu Thr Ile Val Ile Ser Ser Ile Ser Met
85 90 95
Ala Cys Lys Gln Ile Ala Ser Leu Val Gln Arg Ala Gly Ile Ser Asn
100 105 110
Leu Thr Gly Val Gln Gly Ala Val Asn Ile Gln Gly Glu Asp Gln Lys
115 120 125
Lys Leu Asp Val Val Ser Asn Glu Val Phe Ser Asn Cys Leu Arg Ser
130 135 140
Ser Gly Arg Thr Gly Ile Ile Ala Ser Glu Glu Glu Asp Val Pro Val
145 150 155 160
Ala Val Glu Glu Ser Tyr Ser Gly Asn Tyr Ile Val Val Phe Asp Pro
165 17 0175
Leu Asp Gly Ser Ser Asn Ile Asp Ala Ala Val Ser Thr Gly Ser Ile
180 185 190
Phe Gly Ile Tyr Ser Pro Asn Asp Glu Cys Leu Ala Asp Leu Gly Asp
195 200 205
Asp Ser Thr Leu Asp Asn Ile Glu Gln Lys Cys Ile Val Asn Val Cys
210 215 220
Gln Pro Gly Thr Asn Leu Leu Ala Ala Gly Tyr Cys Met Tyr Ser Ser
225 230 235 240
Ser Val Ile Phe Val Leu Thr Leu Gly Asn Gly Val Phe Ser Phe Asn
245 250 255
Leu Asp Pro Met Tyr Gly Glu Phe Val Leu Thr Gln Glu Asn Val Gln
260 265 270
Ile Pro Lys Ser Gly Lys Ile Tyr Ser Phe Asn Glu Gly Asn Tyr Gln
275 28 0285
Leu Trp Asp Asp Lys Leu Lys Lys Tyr Ile Asp Asp Leu Lys Asp Pro
290 295 300
Gly Pro Ser Gly Lys Pro Tyr Ser Ala Arg Tyr Ile Gly Ser Leu Val
305 310 315 320
Gly Asp Phe His Arg Thr Leu Leu Tyr Gly Gly Ile Tyr Gly Tyr Pro
325 330 335
Arg Asp Arg Lys Ser Lys Asn Gly Lys Leu Arg Leu Leu Tyr Glu Cys
340 345 350
Ala Pro Met Ser Phe Ile Val Glu Gln Ala Gly Gly Lys Gly Ser Asp
355 360 365
Gly His Gln Arg Val Leu Asp Ile Gln Pro Thr Glu Ile His Gln Arg
370 375 380
Val Pro Leu Tyr Ile Gly Ser Thr Glu Glu Val Glu Lys Leu Glu Lys
385 390 395 400
Tyr Leu Ser
<210>170
<211>1236
<212>DNA
<213>蒺藜苜蓿
<400>170
atggttgcaa tggcagcagc aacagcatca tcacaattaa tattctcaaa accttgttct 60
ccctcacgtc tatgtccctt ccaactttgt gttttcgaca cgaaatcagt gttatcaagt 120
tcaagaagaa agcatgtgag tggctctgga ggagtgagat gcatggctgt tggtgaagta 180
gctgctgaga caaagaaaag aagtagttat gagcttataa cattgactag ttggttgttg 240
aagcaagaac aaacaggggt tattgatgct gaacttacta ttgttttgaa tagtatttcg 300
ttggcatgta aacagattgc ttctttggtt caaagagcta atatttctaa ccttactggt 360
gttcaaggtg ctgtaaatat tcaaggggag gatcagaaaa aacttgatgt tgtctcaaat 420
gaggtattct caaattgttt gaggtcaagt gggaggacag ggattatagc atcagaggaa 480
gaggatgtgc cagtggcagt agaagagagt tattcaggaa actacattgt ggtctttgat 540
ccacttgatg gttcatcgaa tattgatgct gcagtttcaa ctggttctat ttttgggatt 600
tacagcccca atgatgagtg tcttgctgac gtaggcaatg agtccgatga ccccacactt 660
ggcacagaag aacaacgatg cattgtgaat gtgtgccaac caggaagcaa ccttctagca 720
gccggttact gcatgtattc tagctcagta atcttcgttc taacaatcgg caaaggagtt 780
ttcgtattca cattagatcc aatgtatggg gaatttgttt tgactcaaga aaatctccaa 840
ataccaaaat cagggaaaat ttattctttc aatgaaggaa attacaagtt atgggatgac 900
aacttgaaga aatacatcga tgatctcaag gaaccgggtg ctaatggcaa accttattca 960
gcaaggtata ttggtagttt ggtaggtgat ttccatagga cactgctata tggtggcatt 1020
tatggttacc ctagggacaa gaaaagtaag aatggaaggc ttaggctttt atatgagtgt 1080
gctccaatga gtttcattgt agaacaggct ggtggaaaag gttcagatgg tcatcaaaga 1140
gtacttgaca ttcaacccac cgaaattcat caacgtgttc cactgtacat tgggagcaca 1200
gaggaagtgg agaaggttga aaagtacttg gcttaa 1236
<210>171
<211>411
<212>PRT
<213>蒺藜苜蓿
<400>171
Met Val Ala Met Ala Ala Ala Thr Ala Ser Ser Gln Leu Ile Phe Ser
1 5 10 15
Lys Pro Cys Ser Pro Ser Arg Leu Cys Pro Phe Gln Leu Cys Val Phe
20 25 30
Asp Thr Lys Ser Val Leu Ser Ser Ser Arg Arg Lys His Val Ser Gly
35 40 45
Ser Gly Gly Val Arg Cys Met Ala Val Gly Glu Val Ala Ala Glu Thr
50 55 60
Lys Lys Arg Ser Ser Tyr Glu Leu Ile Thr Leu Thr Ser Trp Leu Leu
65 70 75 80
Lys Gln Glu Gln Thr Gly Val Ile Asp Ala Glu Leu Thr Ile Va1 Leu
85 90 95
Asn Ser Ile Ser Leu Ala Cys Lys Gln Ile Ala Ser Leu Val Gln Arg
100 105 110
Ala Asn Ile Ser Asn Leu Thr Gly Val Gln Gly Ala Val Asn Ile Gln
115 120 125
Gly Glu Asp Gln Lys Lys Leu Asp Val Val Ser Asn Glu Val Phe Ser
130 135 140
Asn Cys Leu Arg Ser Ser Gly Arg Thr Gly Ile Ile Ala Ser Glu Glu
145 150 155 160
Glu Asp Val Pro Val Ala Val Glu Glu Ser Tyr Ser Gly Asn Tyr Ile
165 170 175
Val Val Phe Asp Pro Leu Asp Gly Ser Ser Asn Ile Asp Ala Ala Val
180 185 190
Ser Thr Gly Ser Ile Phe Gly Ile Tyr Ser Pro Asn Asp Glu Cys Leu
195 200 205
Ala Asp Val Gly Asn Glu Ser Asp Asp Pro Thr Leu Gly Thr Glu Glu
210 215 220
Gln Arg Cys Ile Val Asn Val Cys Gln Pro Gly Ser Asn Leu Leu Ala
225 230 235 240
Ala Gly Tyr Cys Met Tyr Ser Ser Ser Val Ile Phe Val Leu Thr Ile
245 250 255
Gly Lys Gly Val Phe Val Phe Thr Leu Asp Pro Met Tyr Gly Glu Phe
260 265 270
Val Leu Thr Gln Glu Asn Leu Gln Ile Pro Lys Ser Gly Lys Ile Tyr
275 280 285
Ser Phe Asn Glu Gly Asn Tyr Lys Leu Trp Asp Asp Asn Leu Lys Lys
290 295 300
Tyr Ile Asp Asp Leu Lys Glu Pro Gly Ala Asn Gly Lys Pro Tyr Ser
305 310 315 320
Ala Arg Tyr Ile Gly Ser Leu Val Gly Asp Phe His Arg Thr Leu Leu
325 330 335
Tyr Gly Gly Ile Tyr Gly Tyr Pro Arg Asp Lys Lys Ser Lys Asn Gly
340 345 350
Arg Leu Arg Leu Leu Tyr Glu Cys Ala Pro Met Ser Phe Ile Val Glu
355 36 0365
Gln Ala Gly Gly Lys Gly Ser Asp Gly His Gln Arg Val Leu Asp Ile
370 375 380
Gln Pro Thr Glu Ile His Gln Arg Val Pro Leu Tyr Ile Gly Ser Thr
385 390 395 400
Glu Glu Val Glu Lys Val Glu Lys Tyr Leu Ala
405 410
<210>172
<211>1236
<212>DNA
<213>烟草(Nicotiana tabacum)
<400>172
atggcagcat catcagcaac agcaacagca acaacttcat ttttatgtgc tttagacaaa 60
aagactccat ttttatgtac tctagacaaa aaaggtactc catttttatg cccaaaaggc 120
agcagcacaa caaagagaag gtcatttaat ggaggagtga agtgcatggc aatagagaca 180
acagcaggag ctacagagac caagaaaaga agtggctatg agttacaaac tttaacaagc 240
tggctattaa ggcaagaaca agctgggagt attgatgctg aacttaccat agtgatttca 300
agtatttcta tggcttgtaa gcagattgct tctttggttc agagagctgg aatttctaac 360
cttactggag ttcaaggtgc tgtcaatatt caaggagaag accagaagaa gcttgatgtt 420
gtctctaacg aggttttctc gaattgtcta aggtcgagtg gaaggactgg gattatagca 480
tcagaggaag aggatgtacc agtggcagtg gaagagagtt actcaggaaa ctacattgtg 540
gtgtttgacc ctcttgatgg atcatcaaac attgatgctg ctgtttctac tggttctatt 600
ttcggaatat acagcccaaa tgatgagtgc ctcgcagatc atggagatga ttccacgctt 660
gacaatgttg aacagaggtg tattgtgaat gtatgccaac cagggagcaa ccttcttgca 720
gcaggctact gcatgtactc aagctctgtg atttttgtgg tcaccttggg aaacggagtc 780
tttgccttca acttggatcc gatgtatgga gaattcgttc tgacccaaga aaacatccaa 840
ataccaaaat ctggaaagat ctattcgttc aacgaaggaa actaccagct ttgggatgac 900
aaactgaaga aatacatcga tgacttgaag gaccctggtc ctagcggcaa gccttactct 960
gctaggtaca ttggtagttt ggttggtgac ttccatagaa ctcttctata tggtggcatt 1020
tatggctatc ctagagataa aaagagtaag aatggaaagt tgaggctttt gtatgagtgt 1080
gcccctatga gcttcctcgt ggaacaagct ggtggcaaag gatccgatgg ccaccaaaga 1140
gttcttgata tccaaccaac tgagatacac cagcgagtcc cattgtacat tggaagcaca 1200
gaagaagttg aaaagttgga gaagtattta tcttaa 1236
<210>173
<211>411
<212>PRT
<213>烟草
<400>173
Met Ala Ala Ser Ser Ala Thr Ala Thr Ala Thr Thr Ser Phe Leu Cys
1 5 10 15
Ala Leu Asp Lys Lys Thr Pro Phe Leu Cys Thr Leu Asp Lys Lys Gly
20 25 30
Thr Pro Phe Leu Cys ProLys Gly Ser Ser Thr Thr Lys Arg Arg Ser
35 40 45
Phe Asn Gly Gly Val Lys Cys Met Ala Ile Glu Thr Thr Ala Gly Ala
50 55 60
Thr Glu Thr Lys Lys Arg Ser Gly Tyr Glu Leu Gln Thr Leu Thr Ser
65 70 75 80
Trp Leu Leu Arg Gln Glu Gln Ala Gly Ser Ile Asp Ala Glu Leu Thr
85 90 95
Ile Val Ile Ser Ser Ile Ser Met Ala Cys Lys Gln Ile Ala Ser Leu
100 105 110
yal Gln Arg Ala Gly Ile Ser Asn Leu Thr Gly Val Gln Gly Ala Val
115 120 125
Asn Ile Gln Gly Glu Asp Gln Lys Lys Leu Asp Val Val Ser Asn Glu
130 135 140
Val Phe Ser Asn Cys Leu Arg Ser Ser Gly Arg Thr Gly Ile Ile Ala
145 150 155 160
Ser Glu Glu Glu Asp Val Pro Val Ala Val Glu Glu Ser Tyr Ser Gly
165 170 175
Asn Tyr Ile Val Val Phe Asp Pro Leu Asp Gly Ser Ser Asn Ile Asp
180 185 190
Ala Ala Val Ser Thr Gly Ser Ile Phe Gly Ile Tyr Ser Pro Asn Asp
195 200 205
Glu Cys Leu Ala Asp His Gly Asp Asp Ser Thr Leu Asp Asn Val Glu
210 215 220
Gln Arg Cys Ile Val Asn Val Cys Gln Pro Gly Ser Asn Leu Leu Ala
225 230 235 240
Ala Gly Tyr Cys Met Tyr Ser Ser Ser Val Ile Phe Val Val Thr Leu
245 250 255
Gly Asn Gly Val Phe Ala Phe Asn Leu Asp Pro Met Tyr Gly Glu Phe
260 265 270
Val Leu Thr Gln Glu Asn Ile Gln Ile Pro Lys Ser Gly Lys Ile Tyr
275 280 285
Ser Phe Asn Glu Gly Asn Tyr Gln Leu Trp Asp Asp Lys Leu Lys Lys
290 295 300
Tyr Ile Asp Asp Leu Lys Asp Pro Gly Pro Ser Gly Lys Pro Tyr Ser
305 310 315 320
Ala Arg Tyr Ile Gly Ser Leu Val Gly Asp Phe His Arg Thr Leu Leu
325 330 335
Tyr Gly Gly Ile Tyr Gly Tyr Pro Arg Asp Lys Lys Ser Lys Asn Gly
340 345 350
lys Leu Arg Leu Leu Tyr Glu Cys Ala Pro Met Ser Phe Leu Val Glu
355 360 365
Gln Ala Gly Gly Lys Gly Ser Asp Gly His Gln Arg Val Leu Asp Ile
370 375 380
Gln Pro Thr Glu Ile His Gln Arg Val Pro Leu Tyr Ile Gly Ser Thr
385 390 395 400
Glu Glu Val Glu Lys Leu Glu Lys Tyr Leu Ser
405 410
<210>174
<211>1221
<212>DNA
<213>稻
<400>174
atggccgccg cagccacgac atcctcccac ctgctcctgc tctcccgcca gcaggcggcg 60
gcctcgctcc aatgcggcct ctccttccgg aggcagcccg gcaggctcgc cggtgggtcg 120
tcggccccga gcgtgcggtg catggcggcc gtcgacacgg cctcggcgcc cgccgcgacg 180
gaggctagca agaagagcag ctacgagatc accacgctga cgacgtggct gctgaagcag 240
gagcaggccg ggaccatcga cggcgagatg accatcgtgc tggccagcat ctccacggcg 300
tgcaagcaga tcgcctcgct ggtgcagcgc gcgcccatct ccaacctcac cggcgtccag 360
ggcgccgtca acgtgcaggg cgaggaccag aaaaaactcg acgtcgtctc caacgaggtg 420
ttctccaact gcctcaaatc gagcgggcgc accggcgtga tcgcgtcgga ggaggaggac 480
gtgccggtgg ccgtggagga gagctactcg ggcaactaca tcgtggtgtt cgacccgctc 540
gacggctcct ccaacatcga cgccgccgtc tccaccggct ccatcttcgg catctacagc 600
cccaacgacg agtgcctagc cgacatcgcc gacgaccaaa atcttgacca ggtggagcag 660
aggtgcatcg tgagcgtgtg ccagccgggg agcaacctgc tcgccgccgg ctactgcatg 720
tactcgagct cggtcatctt cgtgctcacc atcgggacag gggtgtacgt gttcacgctg 780
gacccgatgt acggcgagtt cgtgctgacg caggagaagg tgcagatccc caaggcaggc 840
aagatctatg ccttcaacga gggcaactac gcgctctggg acgacaagct caagagctac 900
atggacagcc tcaaggagcc cgggccgtcc gggaagccat actccgcgcg ctacatcggc 960
agcctcgtcg gcgacttcca ccgcacgctg ctctacggcg gcatctacgg ctaccccagg 1020
gaccagaaga gcaagaacgg caagctgcgg ctgctgtacg agtgcgcgcc gatgagcttc 1080
atcgtcgagc aggccggcgg caagggctcc gatggccacc agaggatact tgacatcatg 1140
cctacggaga tccatcagag agtgccgctg tacatcggga gcgtggagga agtggagaag 1200
gtcgagaagt tcttggcttg a 1221
<210>175
<211>406
<212>PRT
<213>稻
<400>175
Met Ala Ala Ala Ala Thr Thr Ser Ser His Leu Leu Leu Leu Ser Arg
1 5 10 15
Gln Gln Ala Ala Ala Ser Leu Gln Cys Gly Leu Ser Phe Arg Arg Gln
20 25 30
Pro Gly Arg Leu Ala Gly Gly Ser Ser Ala Pro Ser Val Arg Cys Met
35 40 45
Ala Ala Val Asp Thr Ala Ser Ala Pro Ala Ala Thr Glu Ala Ser Lys
50 55 60
Lys Ser Ser Tyr Glu Ile Thr Thr Leu Thr Thr Trp Leu Leu Lys Gln
65 70 75 80
Glu Gln Ala Gly Thr Ile Asp Gly Glu Met Thr Ile Val Leu Ala Ser
85 90 95
Ile Ser Thr Ala Cys Lys Gln Ile Ala Ser Leu Val Gln Arg Ala Pro
100 105 110
Ile Ser Asn Leu Thr Gly Val Gln Gly Ala Val Asn Val Gln Gly Glu
115 120 125
Asp Gln Lys Lys Leu Asp Val Val Ser Asn Glu Val Phe Ser Asn Cys
130 135 140
Leu Lys Ser Ser Gly Arg Thr Gly Val Ile Ala Ser Glu Glu Glu Asp
145 150 155 160
Val Pro Val Ala Val Glu Glu Ser Tyr Ser Gly Asn Tyr Ile Val Val
165 170 175
Phe Asp Pro Leu Asp Gly Ser Ser Asn Ile Asp Ala Ala Val Ser Thr
180 185 190
Gly Ser Ile Phe Gly Ile Tyr Ser Pro Asn Asp Glu Cys Leu Ala Asp
195 200 205
Ile Ala Asp Asp Gln Asn Leu Asp Gln Val Glu Gln Arg Cys Ile Val
210 215 220
Ser Val Cys Gln Pro Gly Ser Asn Leu Leu Ala Ala Gly Tyr Cys Met
225 230 235 240
Tyr Ser Ser Ser Val Ile Phe Val Leu Thr Ile Gly Thr Gly Val Tyr
245 250 255
Val Phe Thr Leu Asp Pro Met Tyr Gly Glu Phe Val Leu Thr Gln Glu
260 265 270
Lys Val Gln Ile Pro Lys Ala Gly Lys Ile Tyr Ala Phe Asn Glu Gly
275 280 285
Asn Tyr Ala Leu Trp Asp Asp Lys Leu Lys Ser Tyr Met Asp Ser Leu
290 295 300
Lys Glu Pro Gly Pro Ser Gly Lys Pro Tyr Ser Ala Arg Tyr Ile Gly
305 310 315 320
Ser Leu Val Gly Asp Phe Hi s Arg Thr Leu Leu Tyr Gly Gly Ile Tyr
325 330 335
Gly Tyr Pro Arg Asp Gln Lys Ser Lys Asn Gly Lys Leu Arg Leu Leu
340 345 350
Tyr Glu Cys Ala Pro Met Ser Phe Ile Val Glu Gln Ala Gly Gly Lys
355 360 365
Gly Ser Asp Gly His Gln Arg Ile Leu Asp Ile Met Pro Thr Glu Ile
370 375 380
His Gln Arg Val Pro Leu Tyr Ile Gly Ser Val Glu Glu Val Glu Lys
385 390 395 400
Val Glu Lys Phe Leu Ala
405
<210>176
<211>1143
<212>DNA
<213>Ostreococcus lucimarinus
<400>176
atgtctgccg ccacctccgc ctgcgctcgc gcgatcgtcg cgacgaagaa gaccaccgcg 60
gcgcgccgcg cgggcaagtc ggcgacgcgg gcgacgccgc gatccgtcgc ggcgcgcgcg 120
gggggcgcgg gcacgccgtt cacgacgtgg atcttgcaac aagagatgga agaaaagatc 180
gacggcgaac tcgcggtcgt gttgtcgagc atcggcttgg cgtgcaagca aatcgcgagc 240
ttggtgcaac gcgccgggct tcaaggcatg acgggtttgg cgggcgagac gaacgtgcaa 300
ggtgaagacc aaaagaagct cgacgtcatc tccaacgatg tgttctgcga tgtcttgcgt 360
caaaccggcc gcacgggcgt gattgcgtcc gaggaagaag acgtgccggt cgccgtcgaa 420
gaaaccttcg gcggtaacta cgtcgtcgtc ttcgatccgc tcgatggctc ttccaacatc 480
gacgccgccg tttccacggg ttccatctgg ggcatctacg agtccgactc cacgtgcatc 540
ccggattttg gcaccgaaga tgcggccaag attgaagaga agtgcgtcat gaacgtgtgc 600
caaccgggga acaacttgtt gtgcgcgggc tactgcatgt actcctcttc caccatcctc 660
gtcttgaccc tcggtgaggg tgtgtacggt ttcaccctcg acccgaccgt cggcgagttc 720
atcatgtccc acgacaacat caaggttccg gaatctggta agatttactc cttcaacgaa 780
ggcaactacg acatgtggac tccgggcttg aagaagtaca tggactccct caagactggc 840
ggcgcggaac aaggcaccaa gccgtacagc gcccgttaca tcggttccct cgtcggtgac 900
ttccacagaa ccatcttgta cggaggcatc tacggctacc cgggcgactc caagaacccg 960
aacggtaagc ttcgcctctt gtacgagtgc gcgccgatgt ccttcatcgc cgaacaagcc 1020
ggcggtatgg gttccaccgg taaggagcgc gtccttgacg ttgtcccgga aaagtttcac 1080
caacgtgtgc cgttcttcac cggctccaag aaggaagtgc agtacttgga atccttcatg 1140
tag 1143
<210>177
<211>380
<212>PRT
<213>Ostreococcus lucimarinus
<40>177
Met Ser Ala Ala Thr Ser Ala Cys Ala Arg Ala Ile Val Ala Thr Lys
1 5 10 15
Lys Thr Thr Ala Ala Arg Arg Ala Gly Lys Ser Ala Thr Arg Ala Thr
20 25 30
Pro Arg Ser Val Ala Ala Arg Ala Gly Gly Ala Gly Thr Pro Phe Thr
35 40 45
Thr Trp Ile Leu Gln Gln Glu Met Glu Glu Lys Ile Asp Gly Glu Leu
50 55 60
Ala Val Val Leu Ser Ser Ile Gly Leu Ala Cys Lys Gln Ile Ala Ser
65 70 75 80
Leu Val Gln Arg Ala Gly Leu Gln Gly Met Thr Gly Leu Ala Gly Glu
85 90 95
Thr Asn Val Gln Gly Glu Asp Gln Lys Lys Leu Asp Val Ile Ser Asn
100 105 110
Asp Val Phe Cys Asp Val Leu Arg Gln Thr Gly Arg Thr Gly Val Ile
115 120 125
Ala Ser Glu Glu Glu Asp Val Pro Val Ala Val Glu Glu Thr Phe Gly
130 135 140
Gly Asn Tyr Val Val Val Phe Asp Pro Leu Asp Gly Ser Ser Asn Ile
145 150 155 160
Asp Ala Ala Val Ser Thr Gly Ser Ile Trp Gly Ile Tyr Glu Ser Asp
165 170 175
Ser Thr Cys Ile Pro Asp Phe Gly Thr Glu Asp Ala Ala Lys Ile Glu
180 185 190
Glu Lys Cys Val Met Asn Val Cys Gln Pro Gly Asn Asn Leu Leu Cys
195 200 205
Ala Gly Tyr Cys Met Tyr Ser Ser Ser Thr Ile Leu Val Leu Thr Leu
210 215 220
Gly Glu Gly Val Tyr Gly Phe Thr Leu Asp Pro Thr Val Gly Glu Phe
225 230 235 240
Ile Met Ser His Asp Asn Ile Lys Val Pro Glu Ser Gly Lys Ile Tyr
245 250 255
Ser Phe Asn Glu Gly Asn Tyr Asp Met Trp Thr Pro Gly Leu Lys Lys
260 265 270
Tyr Met Asp Ser Leu Lys Thr Gly Gly Ala Glu Gln Gly Thr Lys Pro
275 280 285
Tyr Ser Ala Arg Tyr Ile Gly Ser Leu Val Gly Asp Phe His Arg Thr
290 295 300
Ile Leu Tyr Gly Gly Ile Tyr Gly Tyr Pro Gly Asp Ser Lys Asn Pro
305 310 315 320
Asn Gly Lys Leu Arg Leu Leu Tyr Glu Cys Ala Pro Met Ser Phe Ile
325 330 335
Ala Glu Gln Ala Gly Gly Met Gly Ser Thr Gly Lys Glu Arg Val Leu
340 345 350
Asp Val Val Pro Glu Lys Phe His Gln Arg Val Pro Phe Phe Thr Gly
355 360 365
Ser Lys Lys Glu Val Gln Tyr Leu Glu Ser Phe Met
370 375 380
<210>178
<211>1134
<212>DNA
<213>Ostreococcus tauri
<400>178
atgtctgcgt gtatttctgc ctctgtgacg cgcgcgcgaa cggcgcgcgc gcccgcggct 60
cgccgcgcgg cgagtaaggc gcgggcgtcg ccgcgcgccg tcgcggcgcg cgcggggggc 120
gttggtacgc cgtacacgac gtggattctc cagcaagaga tgcaagagaa cattgatggt 180
gaattggcgg tggttttgtc ctccatcggt ctcgcgtgca agcaaatcgc gagcctcgtc 240
cagcgcgcgg gtctcgcggg catgactggt ttggcgggcg agcaaaacgt gcaaggcgag 300
gaccagaaga agctcgacgt catctccaac gatgttttct gcaacgtatt gcgccaatcc 360
ggccgcacgg gcgtcatcgc ctccgaagaa gaagacgttc cggtcgccgt cgaggaaacg 420
tacggcggta actacgtcgt cgtcttcgat ccgcttgatg gttcctccaa tatcgacgcc 480
gccgtctcca cgggatccat ctggggtatc tacgagtccg actcctcgtg tattcccgac 540
ttcggctccg atgactccgc caaggttgaa gagaagtgcg tcatgaacgt ttgccaaccg 600
ggcagcaact tgctctgcgc gggttactgc atgtactcct cgtccaccat cctcgtcatc 660
accatcggcc aaggcgtgtt cggttttacc ctcgacccga ccgtcggtga gttcatcatg 720
tcccacgaga acatcaaggt tccggactct ggcaagattt actctttcaa cgaaggcaac 780
tacgccatgt ggtccgacgg tttgaagaag tacatggact ccctcaagac gggcggcaag 840
gacggtggca agccgtacag cgcccgctac atcggttcgc tcgtcggtga cttccaccgc 900
acgatccttt acggaggcat ctacggttac ccgggtgacg cgaagaaccc gaacggtaag 960
ctccgcctcc tgtacgagtg cgcgccgatg tccatgatcg ctgaacaagc cggtggtaag 1020
ggctccaccg gtgtcgcgcg tgtcctggac atcgttccgg aaaaggttca ccagcgcgtg 1080
ccgttcttcg ttggctccaa gaacgaggtt gcctacttgg agtccttcat gtga 1134
<210>179
<211>377
<212>PRT
<213>Ostreococcus tauri
<400>179
Met Ser Ala Cys Ile Ser Ala Ser Val Thr Arg Ala Arg Thr Ala Arg
1 5 10 15
Ala Pro Ala Ala Arg Arg Ala Ala Ser Lys Ala Arg Ala Ser Pro Arg
20 25 30
Ala Val Ala Ala Arg Ala Gly Gly Val Gly Thr Pro Tyr Thr Thr Trp
35 40 45
Ile Leu Gln Gln Glu Met Gln Glu Asn Ile Asp Gly Glu Leu Ala Val
50 55 60
Val Leu Ser Ser Ile Gly Leu Ala Cys Lys Gln Ile Ala Ser Leu Val
65 70 75 80
Gln Arg Ala Gly Leu Ala Gly Met Thr Gly Leu Ala Gly Glu Gln Asn
85 90 95
Val Gln Gly Glu Asp Gln Lys Lys Leu Asp Val Ile Ser Asn Asp Val
100 105 110
Phe Cys Asn Val Leu Arg Gln Ser Gly Arg Thr Gly Val Ile Ala Ser
115 120 125
Glu Glu Glu Asp Val Pro Val Ala Val Glu Glu Thr Tyr Gly Gly Asn
130 135 140
Tyr Val Val Val Phe Asp Pro Leu Asp Gly Ser Ser Asn Ile Asp Ala
145 150 155 160
Ala Val Ser Thr Gly Ser Ile Trp Gly Ile Tyr Glu Ser Asp Ser Ser
165 170 175
Cys Ile Pro Asp Phe Gly Ser Asp Asp Ser Ala Lys Val Glu Glu Lys
180 185 190
Cys Val Met Asn Val Cys Gln Pro Gly Ser Asn Leu Leu Cys Ala Gly
195 200 205
Tyr Cys Met Tyr Ser Ser Ser Thr Ile Leu Val Ile Thr Ile Gly Gln
210 215 220
Gly Val Phe Gly Phe Thr Leu Asp Pro Thr Val Gly Glu Phe Ile Met
225 230 235 240
Ser His Glu Asn Ile Lys Val Pro Asp Ser Gly Lys Ile Tyr Ser Phe
245 250 255
Asn Glu Gly Asn Tyr Ala Met Trp Ser Asp Gly Leu Lys Lys Tyr Met
260 265 270
Asp Ser Leu Lys Thr Gly Gly Lys Asp Gly Gly Lys Pro Tyr Ser Ala
275 280 285
Arg Tyr Ile Gly Ser Leu Val Gly Asp Phe His Arg Thr Ile Leu Tyr
290 295 300
Gly Gly Ile Tyr Gly Tyr Pro Gly Asp Ala Lys Asn Pro Asn Gly Lys
305 310 315 320
Leu Arg Leu Leu Tyr Glu Cys Ala Pro Met Ser Met Ile Ala Glu Gln
325 330 335
Ala Gly Gly Lys Gly Ser Thr Gly Val Ala Arg Val Leu Asp Ile Val
340 345 350
Pro Glu Lys Val His Gln Arg Val Pro Phe Phe Val Gly Ser Lys Asn
355 360 365
Glu Val Ala Tyr Leu Glu Ser Phe Met
370 375
<210>180
<211>1254
<212>DNA
<213>三角褐指藻(Phaeodactylum tricornutum)
<400>180
atgtttattt tgaagtcccc ggcgctttgg ttgcttcttt acccagttgt tgcttttacg 60
gcggcgaggg cgaactcgat tcgtccagcg gccgcgttat ctgtcttcga tctgtcgagc 120
gtggaggcag taccgtctag aaagaccaag gccccaattt tcgatgaagt ttgcgacaca 180
actggagtca ctctcaaacg cttcatgacc gaggtttctc tactgaatcc tgaaatcgaa 240
gagctgacga cgctgtttgg tgcgattgaa accgcttgca aagccattgc aaatcttgtc 300
aagcgatcgc cgcttccctc cagtgacacg ttgggtcttc agggagaaat caacgttcaa 360
ggcgaagacc aaaagaaatt agatgtgatc gccaacgata ttttgaagcg agcactccgc 420
ttcacgggcc gcctcggagt cttagcctcg gaagaagagg atactcccgt cgatttgatg 480
ccaagggatc ctagtaccaa aaaagttcta atcgatgagg gagaaaagta tgtcgctgtc 540
ttcgatccgc tcgatggtag ctcaaacgtt gatgcaggca taccgacagg cacaataatt 600
gggatatacg agcacgacga aacttgcaag attgatcctg atgctttgga agaggatcgg 660
accaaacaag aaaacctatg cctcgcaaat actctgcagc ccggcaccaa cttggtagca 720
gcggcgtact gtttatattc ttcgtcaaca tttttggtgt tgacgctggg agctggaaca 780
tatggattca cgctagatga gactatcggt gaatttgtct tgagccatcc aaacattaag 840
attcctgaat gctcatccat tatgtcgttc aacgaggcaa atactcccag ctgggatcgt 900
ccgcttcaag acactttcgc aaagtggagg acagggacag gaaagagcgg caagaaattt 960
tcaagtcgct acattggttc tatggtaggg gatgtccatc ggacgctcct gtacggagga 1020
gtttttgggt atcctggcga caaaaagaat cccaacggga agctacgcct gctttatgaa 1080
ggagctccaa tgtcattcat catggaacag gcgggtggat tgtcgaccac tggcacgcag 1140
cgtgtcatgg aaatctcccc agatacggtc catcaacgtg tgccgattat catgggatcc 1200
agacaagatg tcgaagaggt catggacgcc tataaaaact ttggcatcga ataa 1254
<210>181
<211>417
<212>PRT
<213>三角褐指藻
<400>181
Met Phe Ile Leu Lys Ser Pro Ala Leu Trp Leu Leu Leu Tyr Pro Val
1 5 10 15
Val Ala Phe Thr Ala Ala Arg Ala Asn Ser Ile Arg Pro Ala Ala Ala
20 25 30
Leu Ser Val Phe Asp Leu Ser Ser Val Glu Ala Val Pro Ser Arg Lys
35 40 45
Thr Lys Ala Pro Ile Phe Asp Glu Val Cys Asp Thr Thr Gly Val Thr
50 55 60
Leu Lys Arg Phe Met Thr Glu Val Ser Leu Leu Asn Pro Glu Ile Glu
65 70 75 80
Glu Leu Thr Thr Leu Phe Gly Ala Ile Glu Thr Ala Cys Lys Ala Ile
85 90 95
Ala Asn Leu Val Lys Arg Ser Pro Leu Pro Ser Ser Asp Thr Leu Gly
100 105 110
Leu Gln Gly Glu Ile Asn Val Gln Gly Glu Asp Gln Lys Lys Leu Asp
115 120 125
Val Ile Ala Asn Asp Ile Leu Lys Arg Ala Leu Arg Phe Thr Gly Arg
130 135 140
Leu Gly Val Leu Ala Ser Glu Glu Glu Asp Thr Pro ValAsp Leu Met
145 150 155 160
Pro Arg Asp Pro Ser Thr Lys Lys Val Leu Ile Asp Glu Gly Glu Lys
165 170 175
Tyr Val Ala Val Phe Asp Pro Leu Asp Gly Ser Ser Asn Val Asp Ala
180 185 190
Gly Ile Pro Thr Gly Thr Ile Ile Gly Ile Tyr Glu His Asp Glu Thr
195 200 205
Cys Lys Ile Asp Pro Asp Ala Leu Glu Glu Asp Arg Thr Lys Gln Glu
210 215 220
Asn Leu Cys Leu Ala Asn Thr Leu Gln Pro Gly Thr Asn Leu Val Ala
225 230 235 240
Ala Ala Tyr Cys Leu Tyr Ser Ser Ser Thr Phe Leu Val Leu Thr Leu
245 250 255
Gly Ala Gly Thr Tyr Gly Phe Thr Leu Asp Glu Thr Ile Gly Glu Phe
260 265 270
Val Leu Ser His Pro Asn Ile Lys Ile Pro Glu Cys Ser Ser Ile Met
275 280 285
Ser Phe Asn Glu Ala Asn Thr Pro Ser Trp Asp Arg Pro Leu Gln Asp
290 295 300
Thr Phe Ala Lys Trp Arg Thr Gly Thr Gly Lys Ser Gly Lys Lys Phe
305 310 315 320
Ser Ser Arg Tyr Ile Gly Ser Met Val Gly Asp Val His Arg Thr Leu
325 330 335
Leu Tyr Gly Gly Val Phe Gly Tyr Pro Gly Asp Lys Lys Asn Pro Asn
340 345 350
Gly Lys Leu Arg Leu Leu Tyr Glu Gly Ala Pro Met Ser Phe Ile Met
355 360 365
Glu Gln Ala Gly Gly Leu Ser Thr Thr Gly Thr Gln Arg Val Met Glu
370 375 380
Ile Ser Pro Asp Thr Val His Gln Arg Val Pro Ile Ile Met Gly Ser
385 390 395 400
Arg Gln Asp Val Glu Glu Val Met Asp Ala Tyr Lys Asn Phe Gly Ile
405 410 415
Glu
<210>182
<211>1233
<212>DNA
<213>成熟豌豆(Pisum sativa)
<400>182
atggttgcaa tggcagcagc aacagcctca tctcagttaa tattctcaaa accttactct 60
ccttcacgtc tttgcccctt ccaactctgt gtctttgatg caaaatcagt gttatcaagt 120
tcaaggagaa agcatgtgaa tggctctggt gttagatgta tggctgtgaa ggaagcaact 180
agtgagacaa agaaaagaag tggatatgag attataacac tgactagttg gttgttgcag 240
caagaacaaa aagggattat tgatgcagaa cttactattg tactttctag tatttctatg 300
gcatgtaaac aaattgcttc tttggttcaa agagccaata tttctaacct cactggtact 360
caaggtgctg taaatattca aggggaagac cagaaaaaac ttgatgttat ctcaaatgag 420
gtattctcaa attgcttgag gtcaagtggg aggacaggga taattgcgtc ggaggaagag 480
gatgtcgcgg tggcagtaga agagagttat tcaggaaact acattgttgt atttgatcca 540
cttgatggtt catccaatct tgatgctgca gtctcaaccg gttccatttt cgggatttac 600
agccccaatg acgagtgtct tcctgatttt ggtgatgact ctgatgacaa cacacttggc 660
acagaagaac aaaggtgcat tgtgaatgtg tgtcaaccag gaagcaacct tctagcagct 720
ggctactgca tgtattctag ttcagtagct tttgttctta ccataggcaa aggagtgttt 780
gtattcacat tagatccatt gtacggagaa ttcgttttga ctcaagagaa tctccaaata 840
ccgaaatcag gggaaatcta ttctttcaat gaagggaatt acaagttgtg ggatgaaaac 900
ttgaagaaat atattgatga tcttaaggaa ccaggtccta gtggcaagcc ttattcagca 960
aggtatattg gtagtttggt tggtgatttt cacaggacac tgttatatgg tggcatttat 1020
ggatacccta gggacaagaa aagtaagaat gggaagctta ggcttttata tgaatgtgct 1080
ccaatgagct tcattgttga acaggctggt ggaaaaggtt cagatggtca tcaaagagta 1140
cttgacattc aacccacaga gattcatcaa cgtgttccac tttacattgg gagcacagaa 1200
gaggtggaga aggttgaaaa gtacttagct taa 1233
<210>183
<211>410
<212>PRT
<213>成熟豌豆
<400>183
Met Val Ala Met Ala Ala Ala Thr Ala Ser Ser Gln Leu Ile Phe Ser
1 5 10 15
Lys Pro Tyr Ser Pro Ser Arg Leu Cys Pro Phe Gln Leu Cys Val Phe
20 25 30
Asp Ala Lys Ser Val Leu Ser Ser Ser Arg Arg Lys His Val Asn Gly
35 40 45
Ser Gly Val Arg Cys Met Ala Val Lys Glu Ala Thr Ser Glu Thr Lys
50 55 60
Lys Arg Ser Gly Tyr Glu Ile Ile Thr Leu Thr Ser Trp Leu Leu Gln
65 70 75 80
Gln Glu Gln Lys Gly Ile Ile Asp Ala Glu Leu Thr Ile Val Leu Ser
85 90 95
Sey Ile Ser Met Ala Cys Lys Gln Ile Ala Ser Leu Val Gln Arg Ala
100 105 110
Asn Ile Ser Asn Leu Thr Gly Thr Gln Gly Ala Val Asn Ile Gln Gly
115 120 125
Glu Asp Gln Lys Lys Leu Asp Val Ile Ser Asn Glu Val Phe Ser Asn
130 135 140
Cys Leu Arg Ser Ser Gly Arg Thr Gly Ile Ile Ala Ser Glu Glu Glu
145 150 155 160
Asp Val Ala Val Ala Val Glu Glu Ser Tyr Ser Gly Asn Tyr Ile Val
165 170 175
Val Phe Asp Pro Leu Asp Gly Ser Ser Asn Leu Asp Ala Ala Val Ser
180 185 190
Thr Gly Ser Ile Phe Gly Ile Tyr Ser Pro Asn Asp Glu Cys Leu Pro
195 200 205
Asp Phe Gly Asp Asp Ser Asp Asp Asn Thr Leu Gly Thr Glu Glu Gln
210 215 220
Arg Cys Ile Val Asn Val Cys Gln Pro Gly Ser Asn Leu Leu Ala Ala
225 230 235 240
Gly Tyr Cys Met Tyr Ser Ser Ser Val Ala Phe Val Leu Thr Ile Gly
245 250 255
Lys Gly Val Phe Val Phe Thr Leu Asp Pro Leu Tyr Gly Glu Phe Val
260 265 270
Leu Thr Gln Glu Asn Leu Gln Ile Pro Lys Ser Gly Glu Ile Tyr Ser
275 280 285
Phe Asn Glu Gly Asn Tyr Lys Leu Trp Asp Glu Asn Leu Lys Lys Tyr
290 295 300
Ile Asp Asp Leu Lys Glu Pro Gly Pro Ser Gly Lys Pro Tyr Ser Ala
305 310 315 320
Arg Tyr Ile Gly Ser Leu Val Gly Asp Phe His Arg Thr Leu Leu Tyr
325 330 335
Gly Gly Ile Tyr Gly Tyr Pro Arg Asp Lys Lys Ser Lys Asn Gly Lys
340 345 350
Leu Arg Leu Leu Tyr Glu Cys Ala Pro Met Ser Phe Ile Val Glu Gln
355 360 365
Ala Gly Gly Lys Gly Ser Asp Gly His Gln Arg Val Leu Asp Ile Gln
370 375 380
Pro Thr Glu Ile His Gln Arg Val Pro Leu Tyr Ile Gly Ser Thr Glu
385 390 395 400
Glu Val Glu Lys Val Glu Lys Tyr Leu Ala
405 410
<210>184
<211>1242
<212>DNA
<213>枸桔(Poncirus trifoliata)
<400>184
atggttgcag cagcagcgac aacatcatca cagcttctct tttcaagctc tcactctttc 60
tctcggctct ctccttacca aatatgtgtc ttcgattcca aagcactcgt gtcgtcatgt 120
cccagcaacg ttatgaagag aagacatgtt ggtgttgctg ctggggttcg gtgcatggct 180
gttgggacaa catcggaggt tgcaaccaag aagagaagtt cgtatgagat tgaaacgctg 240
acaaactggc tgttgaagca agaacagtct ggcgttattg atgctgagct cactattgtg 300
ctttccagca tttcaacggc gtgcaagcag attgcttctt tggtgcaaag agctggcatt 360
tccaacttga ctggaattca gggtgctgtc aatgttcaag gcgaggacca gaagaagctc 420
gacgtcgttt caaatgaggt gttctcaaac tgtttgagat caagtgggcg aactgggatt 480
atagcatcag aggaagagga tgtaccagtg gcggtagaag agagctactc tggaaactat 540
attgtagttt ttgatccact tgatggatca tccaacattg atgctgcagt gtctactgga 600
tccatctttg gcatatacag cccaaatgat gagtgtcttg ccgatattgg tgatgattct 660
actctgggca atactgaaca aagatgtgta gtgaacgtgt gccagccagg aagcaacctt 720
cttgctgcag gctattgcat gtattcaagc tctgtaatct ttgtgataac tttaggcaac 780
ggagtctttg cattcaccct ggatcccatg tatggagaat ttgttttgac acaagagaac 840
attcagatac ccaaaaccgg aaagatctat gcttttaatg aaggcaacta ccagctttgg 900
gatgacaagt tgaagaagta cattgacgat cttaaggatc caggacccag cggcaagccc 960
tattctgcta ggtacattgg cagcttggtt ggtgatttcc atcgaactct gctctacggc 1020
ggcatttatg gctatccaag agacaagaag agcaagaatg gaaagctgag gctcttgtat 1080
gaatgtgcac caatgagctt catagtggaa caagcaggag gcaaaggatc tgacggccat 1140
caaagagtac ttgacattca acctactgag attcaccagc gtattccttt aaagattgga 1200
agccaggagg aagtggagaa actggagaag tatttggcct aa 1242
<210>185
<211>413
<212>PRT
<213>枸桔
<400>185
Met Val Ala Ala Ala Ala Thr Thr Ser Ser Gln Leu Leu Phe Ser Ser
1 5 10 15
Ser His Ser Phe Ser Arg Leu Ser Pro Tyr Gln Ile Cys Val Phe Asp
20 25 30
Ser Lys Ala Leu Val Ser Ser Cys Pro Ser Asn Val Met Lys Arg Arg
35 40 45
His Val Gly Val Ala Ala Gly Val Arg Cys Met Ala Val Gly Thr Thr
50 55 60
Ser Glu Val Ala Thr Lys Lys Arg Ser Ser Tyr Glu Ile Glu Thr Leu
65 70 75 80
Thr Asn Trp Leu Leu Lys Gln Glu Gln Ser Gly Val Ile Asp Ala Glu
85 90 95
Leu Thr Ile Val Leu Ser Ser Ile Ser Thr Ala Cys Lys Gln Ile Ala
100 105 110
Ser Leu Val Gln Arg Ala Gly Ile Ser Asn Leu Thr Gly Ile Gln Gly
115 120 125
Ala Val Asn Val Gln Gly Glu Asp Gln Lys Lys Leu Asp Val Val Ser
130 135 140
Asn Glu Val Phe Ser Asn Cys Leu Arg Ser Ser Gly Arg Thr Gly Ile
145 150 155 160
Ile Ala Ser Glu Glu Glu Asp Val Pro Val Ala Val Glu Glu Ser Tyr
165 170 175
Ser Gly Asn Tyr Ile Val Val Phe Asp Pro Leu Asp Gly Ser Ser Asn
180 185 190
Ile Asp Ala Ala Val Ser Thr Gly Ser Ile Phe Gly Ile Tyr Ser Pro
195 200 205
Asn Asp Glu Cys Leu Ala Asp Ile Gly Asp Asp Ser Thr Leu Gly Asn
210 215 220
Thr Glu Gln Arg Cys Val Val Asn Val Cys Gln Pro Gly Ser Asn Leu
225 230 235 240
Leu Ala Ala Gly Tyr Cys Met Tyr Ser Ser Ser Val Ile Phe Val Ile
245 250 255
Thr Leu Gly Asn Gly Val Phe Ala Phe Thr Leu Asp Pro Met Tyr Gly
260 265 270
Glu Phe Val Leu Thr Gln Glu Asn Ile Gln Ile Pro Lys Thr Gly Lys
275 280 285
Ile Tyr Ala Phe Asn Glu Gly Asn Tyr Gln Leu Trp Asp Asp Lys Leu
290 295 300
Lys Lys Tyr Ile Asp Asp Leu Lys Asp Pro Gly Pro Ser Gly Lys Pro
305 310 315 320
Tyr Ser Ala Arg Tyr Ile Gly Ser Leu Val Gly Asp Phe His Arg Thr
325 330 335
Leu Leu Tyr Gly Gly Ile Tyr Gly Tyr Pro Arg Asp Lys Lys Ser Lys
340 345 350
Asn Gly Lys Leu Arg Leu Leu Tyr Glu Cys Ala Pro Met Ser Phe Ile
355 360 365
Val Glu Gln Ala Gly Gly Lys Gly Ser Asp Gly His Gln Arg Val Leu
370 375 380
Asp Ile Gln Pro Thr Glu Ile His Gln Arg Ile Pro Leu Lys Ile Gly
385 390 395 400
Ser Gln Glu Glu Val Glu Lys Leu Glu Lys Tyr Leu Ala
405 410
<210>186
<211>1245
<212>DNA
<213>美洲山杨(Populus tremuloides)
<400>186
atggttgcac aagcagcagc aataacaact tcatcatcac atcttctctt ctcaacctca 60
cgctcactgt ctcgcccatc tccttcccag ttatgtgtct ttgactcaaa aacacttgtg 120
tcatacccca acagcactag tacttacaag aaaaaacgtg gtggtgatgg gctcaagtgc 180
atggctgtga gcacagcctc ggatgctaaa acaaagaaga gtacgtttga gattcaaaca 240
ctgactggtt ggctgttgaa gcaagaacaa gctggtgtta ttgatgctga gctcactatt 300
gttatatcaa gcat ttcaat ggcatgtaagcagattgctt ctttggtgca aagagctagc 360
atttctaact taactggagt tcaaggttct gttaacgttc aaggagaaga tcagaagaag 420
cttgacgtgg tctctaatga ggtgttctct agctgcttga gatcaagtgg gaggacagga 480
atcatagcat cagaggaaga ggacgtgcca gtggcagtgg aggagagtta ctctggaaac 540
tatatagtgg tttttgaccc actcgatgga tcatccaaca ttgatgctgc agtgtctact 600
ggttccatct ttggaatata cagccccaat gacgaatgcc tggccgatat tggagatgac 660
tccactcttg atcaaacgga acagaggtgt attgtgaatg tgtgccagcc aggaaataac 720
ctccttgttg ctggctactg catgtattca agctcagtga tttttgtgct aactattgga 780
aaaggcgtgt tctctttcag cttggatcca atgtatggag agtttgtttt aactcaagaa 840
aacatccaga taccaaaggc tggaaagatt tattcattta atgaaggaaa ctaccagttg 900
tgggatgaca agctgaagaa gtacattgat gaccttaaag accctggtcc gagtggcaag 960
ccctactccg ctagatacat tggaagcttg gtcggtgact tccaccggac gctgctgtac 1020
ggtggcattt atgggtaccc cagggacaag aagagcaaga atgggaagct gaggcttctg 1080
tatgagtgtg caccgatgag ctttatagtg gaacaagctg gtgggaaagg atcagacggg 1140
catcagagag tactggatat cactcctact gagatacacc agcgtgttcc gctttacata 1200
gggagcgtgg aggaagtgga gaaattggag aagtatttgg cttga 1245
<210>187
<211>414
<212>PRT
<213>美洲山杨
<400>187
Met Val Ala Gln Ala Ala Ala Ile Thr Thr Ser Ser Ser His Leu Leu
1 5 10 15
Phe Ser Thr Ser Arg Ser Leu Ser Arg Pro Ser Pro Ser Gln Leu Cys
20 25 30
Val Phe Asp Ser Lys Thr Leu Val Ser Tyr Pro Asn Ser Thr Ser Thr
35 40 45
Tyr Lys Lys Lys Arg Gly Gly Asp Gly Leu Lys Cys Met Ala Val Ser
50 55 60
Thr Ala Ser Asp Ala Lys Thr Lys Lys Ser Thr Phe Glu Ile Gln Thr
65 70 75 80
Leu Thr Gly Trp Leu Leu Lys Gln Glu Gln Ala Gly Val Ile Asp Ala
85 90 95
Glu Leu Thr Ile Val Ile Ser Ser Ile Ser Met Ala Cys Lys Gln Ile
100 105 110
Ala Ser Leu Val Gln Arg Ala Ser Ile Ser Asn Leu Thr Gly Val Gln
115 120 125
Gly Ser Val Asn Val Gln Gly Glu Asp Gln Lys Lys Leu Asp Val Val
130 135 140
Ser Asn Glu Val Phe Ser Ser Cys Leu Arg Ser Ser Gly Arg Thr Gly
145 150 155 160
Ile Ile Ala Ser Glu Glu Glu Asp Val Pro Val Ala Val Glu Glu Ser
165 170 175
Tyr Ser Gly Asn Tyr Ile Val Val Phe Asp Pro Leu Asp Gly Ser Ser
180 185 190
Asn Ile Asp Ala Ala Val Ser Thr Gly Ser Ile Phe Gly Ile Tyr Ser
195 200 205
Pro Asn Asp Glu Cys Leu Ala Asp Ile Gly Asp Asp Ser Thr Leu Asp
210 215 220
Gln Thr Glu Gln Arg Cys Ile Val Asn Val Cys Gln Pro Gly Asn Asn
225 230 235 240
Leu Leu Val Ala Gly Tyr Cys Met Tyr Ser Ser Ser Val Ile Phe Val
245 250 255
Leu Thr Ile Gly Lys Gly Val Phe Ser Phe Ser Leu Asp Pro Met Tyr
260 265 270
Gly Glu Phe Val Leu Thr Gln Glu Asn Ile Gln Ile Pro Lys Ala Gly
275 280 285
Lys Ile Tyr Ser Phe Asn Glu Gly Asn Tyr Gln Leu Trp Asp Asp Lys
290 295 300
Leu Lys Lys Tyr Ile Asp Asp Leu Lys Asp Pro Gly Pro Ser Gly Lys
305 310 315 320
Pro Tyr Ser Ala Arg Tyr Ile Gly Ser Leu Val Gly Asp Phe His Arg
325 330 335
Thr Leu Leu Tyr Gly Gly Ile Tyr Gly Tyr Pro Arg Asp Lys Lys Ser
340 345 350
Lys Asn Gly Lys Leu Arg Leu Leu Tyr Glu Cys Ala Pro Met Ser Phe
355 360 365
Ile Val Glu Gln Ala Gly Gly Lys Gly Ser Asp Gly His Gln Arg Val
370 375 380
Leu Asp Ile Thr Pro Thr Glu Ile His Gln Arg Val Pro Leu Tyr Ile
385 390 395 400
Gly Ser Val Glu Glu Val Glu Lys Leu Glu Lys Tyr Leu Ala
405 410
<210>188
<211>1227
<212>DNA
<213>马铃薯
<400>188
atggcagcat cagcagccac agcaacagca acaacttcat atttaagtgc tctagacaaa 60
aagactccat ttttatttgc cttagacaaa aagactccat ttttatgccc aaaaagcagc 120
acgaagagaa ggtcatttaa tggaggagta aagtgcatgg caatagagac aacttcaggt 180
tttacagcaa ccaagaaaag gagtggctat gagctgcaaa ctttaacaag ttggctatta 240
agacaagaac aagctggagt gattgatgct gaacttacca tagttatttc aagtatttca 300
atggcttgta aacagattgc ttccttagtc caaagagctg gaatttctaa ccttactgga 360
gttcaaggtg ctgtcaatat tcaaggagaa gatcagaaga aacttgatgt tgtctctaat 420
gaggttttct caaattgtct aagatcaagt ggaaggactg ggattatagc atcagaagaa 480
gaggatgtac ctgtggcagt ggaagagagt tactcaggca actacattgt ggtgtttgat 540
cctcttgatg gatcatcaaa cattgatgct gctgtgtcta ccggttctat ctttggaata 600
tacaacccga atgatgagtg cctcgctgat catggagatg attccacgct tgacaatata 660
gagcagaagt gcattgtgaa tgtatgtcaa ccagggacaa accttcttgc agcaggatac 720
tgcatgtact caagctctgt gatattcgta ctcaccttgg gaaatggcgt tttttccttt 780
aacttggatc cgatgtacgg agaatttgtt ctgactcaag aaaatgtcca aataccaaag 840
tctggaaaga tctattcatt caatgaagga aactaccagc tctgggatga caagttgaag 900
aaatatatcg atgacttgaa ggaccctggc cctagtggca agccttactc tgcaaggtac 960
attggtagtt tggttggtga cttccataga actcttctat atggtggcat ttatggttat 1020
cctagagacc aaaagagcaa gaatggaaag ttgaggcttt tgtacgagtg tgctcccatg 1080
agcttcattg tggaacaagc tggtggtaaa ggatccgatg gtcaccaaag agttctcgat 1140
atccaaccaa ctgaggtaca tcaacgagtt ccattgtaca ttggaagcac agaagaagtt 1200
gaaaaattgg agaagtactt gtcttaa 1227
<210>189
<211>408
<212>PRT
<213>马铃薯
<400>189
Met Ala Ala Ser Ala Ala Thr Ala Thr Ala Thr Thr Ser Tyr Leu Ser
1 5 10 15
Ala Leu Asp Lys Lys Thr Pro Phe Leu Phe Ala Leu Asp Lys Lys Thr
20 25 30
Pro Phe Leu Cys Pro Lys Ser Ser Thr Lys Arg Arg Ser Phe Asn Gly
35 40 45
Gly Val Lys Cys Met Ala Ile Glu Thr Thr Ser Gly Phe Thr Ala Thr
50 55 60
Lys Lys Arg Ser Gly Tyr Glu Leu Gln Thr Leu Thr Ser Trp Leu Leu
65 70 75 80
Arg Gln Glu Gln Ala Gly Val Ile Asp Ala Glu Leu Thr Ile Val Ile
85 90 95
Ser Ser Ile Ser Met Ala Cys Lys Gln Ile Ala Ser Leu Val Gln Arg
100 105 110
Ala Gly Ile Ser Asn Leu Thr Gly Val Gln Gly Ala Val Asn Ile Gln
115 120 125
Gly Glu Asp Gln Lys Lys Leu Asp Val Val Ser Asn Glu Val Phe Ser
130 135 140
Asn Cys Leu Arg Ser Ser Gly Arg Thr Gly Ile Ile Ala Ser Glu Glu
145 150 155 160
Glu Asp Val Pro Val Ala Val Glu Glu Ser Tyr Ser Gly Asn Tyr Ile
165 170 175
Val Val Phe Asp Pro Leu Asp Gly Ser Ser Asn Ile Asp Ala Ala Val
180 185 190
Ser Thr Gly Ser Ile Phe Gly Ile Tyr Asn Pro Asn Asp Glu Cys Leu
195 200 205
Ala Asp His Gly Asp Asp Ser Thr Leu Asp Asn Ile Glu Gln Lys Cys
210 215 220
Ile Val Asn Val Cys Gln Pro Gly Thr Asn Leu Leu Ala Ala Gly Tyr
225 230 235 240
Cys Met Tyr Ser Ser Ser Val Ile Phe Val Leu Thr Leu Gly Asn Gly
245 250 255
Val Phe Ser Phe Asn Leu Asp Pro Met Tyr Gly Glu Phe Val Leu Thr
260 265 270
Gln Glu Asn Val Gln Ile Pro Lys Ser Gly Lys Ile Tyr Ser Phe Asn
275 280 285
Glu Gly Asn Tyr Gln Leu Trp Asp Asp Lys Leu Lys Lys Tyr Ile Asp
290 295 300
Asp Leu Lys Asp Pro Gly Pro Ser Gly Lys Pro Tyr Ser Ala Arg Tyr
305 310 315 320
Ile Gly Ser Leu Val Gly Asp Phe His Arg Thr Leu Leu Tyr Gly Gly
325 330 335
Ile Tyr Gly Tyr Pro Arg Asp Gln Lys Ser Lys Asn Gly Lys Leu Arg
340 345 350
Leu Leu Tyr Glu Cys Ala Pro Met Ser Phe Ile Val Glu Gln Ala Gly
355 360 365
Gly Lys Gly Ser Asp Gly His Gln Arg Val Leu Asp Ile Gln Pro Thr
370 375 380
Glu Val His Gln Arg Val Pro Leu Tyr Ile Gly Ser Thr Glu Glu Val
385 390 395 400
Glu Lys Leu Glu Lys Tyr Leu Ser
405
<210>190
<211>1248
<212>DNA
<213>菠菜(Spinacia oleracea)
<400>190
atggcatcaa taggaccagc aacaacaact gcagtaaaac tgcgtagctc aatcttcaat 60
cctcagtcat ctactctttc cccgtctcaa caatgcatta catttacaaa gtcccttcac 120
tcgtttccta ctgccacccg acataatgtg gcttccgggg ttcgttgtat ggcagccgta 180
ggagaggcgg ctacagaaac aaaggcaagg actagaagta agtacgaaat tgaaacacta 240
acaggctggc tgcttaaaca agaaatggca ggtgttattg atgctgaact taccatcgtt 300
ctttctagca tttcattggc ttgtaaacaa attgcttcct tggttcaacg agctggtatt 360
tctaacttga ctggaattca aggtgctgtc aatatccaag gagaggatca gaagaaactt 420
gatgttgt ctccaatgaggt gttttcgagc tgcttgagat cgagtggaag aacaggaata 480
atagcatcag aagaagagga tgtaccagtg gcagtggaag agagttactc tggaaactat 540
attgttgtgt ttgatccact tgatggttca tccaacattg atgcagctgt ctccactggt 600
tccatctttg gcatttatag ccctaacgat gagtgcattg ttgactctga tcacgacgat 660
gagtcacagc taagtgcaga agaacagagg tgtgtagtga atgtatgtca accaggggat 720
aacctattag cagcagggta ttgtatgtac tcaagctctg ttatcttcgt acttacaatt 780
ggtaaaggtg tgtatgcatt cacattagat ccaatgtatg gtgaattcgt actcacttca 840
gagaaaatcc aaatcccaaa agctgggaag atctattcat tcaatgaagg taactacaaa 900
atgtgggatg ataaattgaa gaagtacatg gatgatctta aagagccagg agagtcacag 960
aaaccgtact cgtctcgtta catagggagt ttagttgggg actttcatag aacactttta 1020
tatggtggga tttatggtta cccaagagat gcaaagagta agaatgggaa attgaggctt 1080
ttgtatgaat gtgcacctat gagttttatt gttgaacaag ctggtggtaa aggttctgat 1140
ggtcatcaaa gaattcttga cattcaaccc accgagatac atcaacgtgt gccactgtac 1200
atcgggagtg tggaggaagt agagaaatta gagaagtact tagcataa 1248
<210>191
<211>415
<212>PRT
<213>菠菜
<400>191
Met Ala Ser Ile Gly Pro Ala Thr Thr Thr Ala Val Lys Leu Arg Ser
1 5 10 15
Ser Ile Phe Asn Pro Gln Ser Ser Thr Leu Ser Pro Ser Gln Gln Cys
20 25 30
Ile Thr Phe Thr Lys Ser Leu His Ser Phe Pro Thr Ala Thr Arg His
35 40 45
Asn Val Ala Ser Gly Val Arg Cys Met Ala Ala Val Gly Glu Ala Ala
50 55 60
Thr Glu Thr Lys Ala Arg Thr Arg Ser Lys Tyr Glu Ile Glu Thr Leu
65 70 75 80
Thr Gly Trp Leu Leu Lys Gln Glu Met Ala Gly Val Ile Asp Ala Glu
85 90 95
Leu Thr Ile Val Leu Ser Ser Ile Ser Leu Ala Cys Lys Gln Ile Ala
100 105 110
Ser Leu Val Gln Arg Ala Gly Ile Ser Asn Leu Thr Gly Ile Gln Gly
115 120 125
Ala Val Asn Ile Gln Gly Glu Asp Gln Lys Lys Leu Asp Val Val Ser
130 135 140
Asn Glu Val Phe Ser Ser Cys Leu Arg Ser Ser Gly Arg Thr Gly Ile
145 150 155 160
Ile Ala Ser Glu Glu Glu Asp Val Pro Val Ala Val Glu Glu Ser Tyr
165 170 175
Ser Gly Asn Tyr Ile Val Val Phe Asp Pro Leu Asp Gly Ser Ser Asn
180 185 190
Ile Asp Ala Ala Val Ser Thr Gly Ser Ile Phe Gly Ile Tyr Ser Pro
195 200 205
Asn Asp Glu Cys Ile Val Asp Ser Asp His Asp Asp Glu Ser Gln Leu
210 215 220
Ser Ala Glu Glu Gln Arg Cys Val Val Asn Val Cys Gln Pro Gly Asp
225 230 235 240
Asn Leu Leu Ala Ala Gly Tyr Cys Met Tyr Ser Ser Ser Val Ile Phe
245 250 255
Val Leu Thr Ile Gly Lys Gly Val Tyr Ala Phe Thr Leu Asp Pro Met
260 265 270
Tyr Gly Glu Phe Val Leu Thr Ser Glu Lys Ile Gln Ile Pro Lys Ala
275 280 285
Gly Lys Ile Tyr Ser Phe Asn Glu Gly Asn Tyr Lys Met Trp Asp Asp
290 295 300
Lys Leu Lys Lys Tyr Met Asp Asp Leu Lys Glu Pro Gly Glu Ser Gln
305 310 315 320
Lys Pro Tyr Ser Ser Arg Tyr Ile Gly Ser Leu Val Gly Asp Phe His
325 330 335
Arg Thr Leu Leu Tyr Gly Gly Ile Tyr Gly Tyr Pro Arg Asp Ala Lys
340 345 350
Ser Lys Asn Gly Lys Leu Arg Leu Leu Tyr Glu Cys Ala Pro Met Ser
355 360 365
Phe Ile Val Glu Gln Ala Gly Gly Lys Gly Ser Asp Gly His Gln Arg
370 375 380
Ile Leu Asp Ile Gln Pro Thr Glu Ile His Gln Arg Val Pro Leu Tyr
385 390 395 400
Ile Gly Ser Val Glu Glu Val Glu Lys Leu Glu Lys Tyr Leu Ala
405 410 415
<210>192
<211>1230
<212>DNA
<213>普通小麦
<400>192
atggccgccg cgaccaccac cacctcccgc ccgcttctgc tgtcccgcca gcaggcggcg 60
gctagctccc tccaatgccg cctccccagg aggcccggaa gcagcctctt tgccggccag 120
ggccaggcgt cgactccgaa tgtgcggtgc atggcagtcg tggacacggc ctcggcgccg 180
gcgccggcgg cggctaggaa gaggagcagc tacgacatga tcacgctgac gacgtggctg 240
ctgaagcagg agcaggaggg ggtcatcgac aacgagatga ccatcgtgct gtccagcata 300
tccacggcgt gcaagcagat cgcctcgttg gtgcagcgcg cgcccatctc caacctcacc 360
ggcgtccagg gcgccaccaa cgtgcagggc gaggaccaga agaagctcga cgtcatctcc 420
aacgaggtgt tctcgaactg cctgaggtgg agtggccgca ccggcgtgat cgcatcggag 480
gaggaggacg tgccggtggc ggtggaggag agctactcgg gcaactacat cgtggtgttc 540
gacccgctcg acggctcctc caacatcgac gccgccgtct ccaccggctc catcttcggc 600
atctacagcc catccgacga gtgccacatt ggcgacgacg caacccttga cgaagtgacg 660
cagatgtgca tagtgaacgt gtgccagcca gggagcaacc tgctcgccgc cggctactgc 720
atgtactcga gctcggtcat cttcgtgctc accatcggca ccggggtgta cgtgttcacg 780
ctggacccga tgtacggcga gttcgtgctg acgcaggaga aggtgcagat cccaaagtcg 840
ggcaagatct actccttcaa cgagggcaac tacgcgctct gggacgacaa gctcaagaag 900
tacatggaca gcctcaagga gcccggcacc tccggcaagc cctactccgc gcgctacatc 960
ggcagcctcg tcggcgactt ccaccgcacc atgctctacg gcggcatcta cgggtacccc 1020
agcgaccaga agagcaagaa cggcaagctg cggctgctct acgagtgcgc gcccatgagc 1080
ttcatcgccg agcaggccgg cggcaaaggc tccgacggcc accagagggt actcgacatc 1140
atgcccacag cggtccatca gagagtgcct ctgtacgtcg ggagcgtgga ggaagtggag 1200
aaggtggaga aattcttgtc ttcagagtag 1230
<210>193
<211>409
<212>PRT
<213>普通小麦
<400>193
Met Ala Ala Ala Thr Thr Thr Thr Ser Arg Pro Leu Leu Leu Ser Arg
1 5 10 15
Gln Gln Ala Ala Ala Ser Ser Leu Gln Cys Arg Leu Pro Arg Arg Pro
20 25 30
Gly Ser Ser Leu Phe Ala Gly Gln Gly Gln Ala Ser Thr Pro Asn Val
35 40 45
Arg Cys Met Ala Val Val Asp Thr Ala Ser Ala Pro Ala Pro Ala Ala
50 55 60
Ala Arg Lys Arg Ser Ser Tyr Asp Met Ile Thr Leu Thr Thr Trp Leu
65 70 75 80
Leu Lys Gln Glu Gln Glu Gly Val Ile Asp Asn Glu Met Thr Ile Val
85 90 95
Leu Ser Ser Ile Ser Thr Ala Cys Lys Gln Ile Ala Ser Leu Val Gln
100 105 110
Arg Ala Pro Ile Ser Asn Leu Thr Gly Val Gln Gly Ala Thr Asn Val
115 120 125
Gln Gly Glu Asp Gln Lys Lys Leu Asp Val Ile Ser Asn Glu Val Phe
130 135 140
Ser Asn Cys Leu Arg Trp Ser Gly Arg Thr Gly Val Ile Ala Ser Glu
145 150 155 160
Glu Glu Asp Val Pro Val Ala Val Glu Glu Ser Tyr Ser Gly Asn Tyr
165 170 175
Ile Val Val Phe Asp Pro Leu Asp Gly Ser Ser Asn Ile Asp Ala Ala
180 185 190
Val Ser Thr Gly Ser Ile Phe Gly Ile Tyr Ser Pro Ser Asp Glu Cys
195 200 205
His Ile Gly Asp Asp Ala Thr Leu Asp Glu Val Thr Gln Met Cys Ile
210 215 220
Val Asn Val Cys Gln Pro Gly Ser Asn Leu Leu Ala Ala Gly Tyr Cys
225 230 235 240
Met Tyr Ser Ser Ser Val Ile Phe Val Leu Thr Ile Gly Thr Gly Val
245 250 255
Tyr Val Phe Thr Leu Asp Pro Met Tyr Gly Glu Phe Val Leu Thr Gln
260 265 270
Glu Lys Val Gln Ile Pro Lys Ser Gly Lys Ile Tyr Ser Phe Asn Glu
275 280 285
Gly Asn Tyr Ala Leu Trp Asp Asp Lys Leu Lys Lys Tyr Met Asp Ser
290 295 300
Leu Lys Glu Pro Gly Thr Ser Gly Lys Pro Tyr Ser Ala Arg Tyr Ile
305 310 315 320
Gly Ser Leu Val Gly Asp Phe His Arg Thr Met Leu Tyr Gly Gly Ile
325 330 335
Tyr Gly Tyr Pro Ser Asp Gln Lys Ser Lys Asn Gly Lys Leu Arg Leu
340 345 350
Leu Tyr Glu Cys Ala Pro Met Ser Phe Ile Ala Glu Gln Ala Gly Gly
355 360 365
Lys Gly Ser Asp Gly His Gln Arg Val Leu Asp Ile Met Pro Thr Ala
370 375 380
Val His Gln Arg Val Pro Leu Tyr Val Gly Ser Val Glu Glu Val Glu
385 390 395 400
Lys Val Glu Lys Phe Leu Ser Ser Glu
405
<210>194
<211>1242
<212>DNA
<213>玉蜀黍
<400>194
atggccgccg ccgccaccac ctcctcatcc tcccacttgc tcctcctctc ccgccagcag 60
gcggcctccc tacgatgccg cctctccttc ctcggccagc ccgccagaag gtccggcagg 120
gtcacggccc aggcgccggc cgctaaggac gtgcggtgca tggcggccgt ggacactgcg 180
gcgtccgcgg cggcggcgga gacgagcccc aagtcgagca gctacgagat cgtgacgctc 240
acgacgtggc tgctgcagca ggagcggacc ggcgcgatcg acaacgagat gaccatcgtg 300
ctggccagca tatccacggc gtgcaagcag atcgccgcgc tggtgcagcg cgcgcccatc 360
tccaacctca cgggcgttca gggcgccgtc aacgtgcagg gcgaggacca gaagaagctc 420
gatgtcgtct ccaacgaggt gttctccaac tgcctcaagt cgagcgggcg caccggcgtg 480
atcgcctcgg aggaggagga cgtgcccgta gcggtggagc agagctactc cggcaactac 540
atcgtcgtgt tcgaccctct cgacggctcc tccaacatcg acgccgccgt ctccactggc 600
tccatcttcg gcatctacaa ccccaacgac gagtgcctcg ccgacgtcga cgacaacgac 660
acccttgatt cggtggagca gaggtgcatc gtgaacgtgt gccagccggg gagcaacctg 720
ctggccgccg gctactgcat gtactcgagc tcggtgatct tcgtgctcac cgtcggcacc 780
ggggtgtacg tgttcacgct ggaccccatg tacggcgagt tcgtgctgac gcaggagaag 840
gtgcagatcc ccaaggcggg caagatctac gccttcaacg agggcaacta cgcgctctgg 900
gacgacaagc tgaagctgta catggacagc ctcaaggagc ccggcgactc ggggaagccc 960
tactccgcgc ggtacatcgg cagcctcgtc ggcgacttcc accgcactct gctctacgga 1020
gggatctacg ggtaccccag ggacaagaag agcaagaacg gcaagctgcg gcttctctac 1080
gagtgcgccc ccatgagctt catcgtcgag caggccggtg gcaagggctc tgacggccac 1140
cagagaattc ttgacatcac acctacagag atccaccaaa gagtgcctct gtacattggg 1200
agcgtggagg aagtggacaa ggtggagaaa ttcctggctt ga 1242
<210>195
<211>413
<212>PRT
<213>玉蜀黍
<400>195
Met Ala Ala Ala Ala Thr Thr Ser Ser Ser Ser His Leu Leu Leu Leu
1 5 10 15
Ser Arg Gln Gln Ala Ala Ser Leu Arg Cys Arg Leu Ser Phe Leu Gly
20 25 30
Gln Pro Ala Arg Arg Ser Gly Arg Val Thr Ala Gln Ala Pro Ala Ala
35 40 45
Lys Asp Val Arg Cys Met Ala Ala Val Asp Thr Ala Ala Ser Ala Ala
50 55 60
Ala Ala Glu Thr Ser Pro Lys Ser Ser Ser Tyr Glu Ile Val Thr Leu
65 70 75 80
Thr Thr Trp Leu Leu Gln Gln Glu Arg Thr Gly Ala Ile Asp Asn Glu
85 90 95
Met Thr Ile Val Leu Ala Ser Ile Ser Thr Ala Cys Lys Gln Ile Ala
100 105 110
Ala Leu Val Gln Arg Ala Pro Ile Ser Asn Leu Thr Gly Val Gln Gly
115 120 125
Ala Val Asn Val Gln Gly Glu Asp Gln Lys Lys Leu Asp Val Val Ser
130 135 140
Asn Glu Val Phe Ser Asn Cys Leu Lys Ser Ser Gly Arg Thr Gly Val
145 150 155 160
Ile Ala Ser Glu Glu Glu Asp Val Pro Val Ala Val Glu Gln Ser Tyr
165 170 175
Ser Gly Asn Tyr Ile Val Val Phe Asp Pro Leu Asp Gly Ser Ser Asn
180 185 190
Ile Asp Ala Ala Val Ser Thr Gly Ser Ile Phe Gly Ile Tyr Asn Pro
195 200 205
Asn Asp Glu Cys Leu Ala Asp Val Asp Asp Asn Asp Thr Leu Asp Ser
210 215 220
Val Glu Gln Arg Cys Ile Val Asn Val Cys Gln Pro Gly Ser Asn Leu
225 230 235 240
Leu Ala Ala Gly Tyr Cys Met Tyr Ser Ser Ser Val Ile Phe Val Leu
245 250 255
Thr Val Gly Thr Gly Val Tyr Val Phe Thr Leu Asp Pro Met Tyr Gly
260 265 270
Glu Phe Val Leu Thr Gln Glu Lys Val Gln Ile Pro Lys Ala Gly Lys
275 280 285
Ile Tyr Ala Phe Asn Glu Gly Asn Tyr Ala Leu Trp Asp Asp Lys Leu
290 295 300
Lys Leu Tyr Met Asp Ser Leu Lys Glu Pro Gly Asp Ser Gly Lys Pro
305 310 315 320
Tyr Ser Ala Arg Tyr Ile Gly Ser Leu Val Gly Asp Phe His Arg Thr
325 330 335
Leu Leu Tyr Gly Gly Ile Tyr Gly Tyr Pro Arg Asp Lys Lys Ser Lys
340 345 350
Asn Gly Lys Leu Arg Leu Leu Tyr Glu Cys Ala Pro Met Ser Phe Ile
355 360 365
Val Glu Gln Ala Gly Gly Lys Gly Ser Asp Gly His Gln Arg Ile Leu
370 375 380
Asp Ile Thr Pro Thr Glu Ile His Gln Arg Val Pro Leu Tyr Ile Gly
385 390 395 400
Ser Val Glu Glu Val Asp Lys Val Glu Lys Phe Leu Ala
405 410
<210>196
<211>1266
<212>DNA
<213>小立碗藓(Physicomitrella patens)
<400>196
atggcgacca cacaagcgat tctctctgcc acccttgcca tagccccggc ttccagctgc 60
gagacttcgt cacggagccc ggcgtccacc aaaacttgtc tctcagtggc aggatcgtcg 120
ctgcatggct cagtggccgg actcggagct gggaaacaga ttgtgagcgt gcagaggaag 180
agcgttgccg tgagggccgc cgttgcagct gagactgccg ctcccaagca gcaggcgaag 240
agccagtatg acatcactac cctgacgacg tggttgctga agaaagagca ggcgggcgtc 300
atcgatggcg agctcaccat tgtgctctcc agcatcgccc tggcttgcaa gcaaattgcg 360
tctctggtgc agagggctgg catctccaac atgactgggt tgcaaggagc tgctaacatt 420
caaggggagg accagaagaa gctagacgtt atttcgaacg aggtgttctc aagctgtctg 480
cgctcaagcg gacggacagg catcatcgct tctgaggaag aagacacccc ggttgcagtg 540
gaggagagct actctggcaa ctacattgtg gtgttcgacc ctcttgacgg ctcttccaac 600
atcgatgctg ctgtttccac ggggtcaatc tggggaatct acaagcccaa cgaggaatgc 660
ctgaccaatc tcggagagga gccaactatt gatgagatcg ccgaaaactg cgtcgtcaat 720
gtctgtcaac cagggagcaa tttgttgtcc gccgggtact gcatgtactc gagctccgtc 780
atcctcgttc tctcagtcgg tgatggagtc tacggcttca ctctggaccc tctctacgga 840
gaattcgtcc tctcgcacga caacatccaa attccaaaat ctggtaagat ctattccatg 900
aatgaaggca actacgccct ctgggatgac aacctcaaga agtacgtcga cagcttgaag 960
gaccccggtc ccagcggcaa gccctactcc gctcgttaca tcggcagtct ggtgggcgac 1020
ttccacagga caatgctgta tggtggcatc tatggctacc ccagggattc caagagcaag 1080
aacgggaagt tgaggttgct ttacgagtgt gctcccatga gctacctcgc tgaacaagca 1140
ggtgggaagg gctccgacgg tcaccagagg attctggaca tccaacctga gcaggttcac 1200
caacgtgtgc cattgtacgt tggaagcacg gaggaggtgg agaagttgga gaagttctta 1260
gcttaa 1266
<210>197
<211>421
<212>PRT
<213>小立碗藓
<400>197
Met Ala Thr Thr Gln Ala Ile Leu Ser Ala Thr Leu Ala Ile Ala Pro
1 5 10 15
Ala Ser Ser Cys Glu Thr Ser Ser Arg Ser Pro Ala Ser Thr Lys Thr
20 25 30
Cys Leu Ser Val Ala Gly Ser Ser Leu His Gly Ser Val Ala Gly Leu
35 40 45
Gly Ala Gly Lys Gln Ile Val Ser Val Gln Arg Lys Ser Val Ala Val
50 55 60
Arg Ala Ala Val Ala Ala Glu Thr Ala Ala Pro Lys Gln Gln Ala Lys
65 70 75 80
Ser Gln Tyr Asp Ile Thr Thr Leu Thr Thr Trp Leu Leu Lys Lys Glu
85 90 95
Gln Ala Gly Val Ile Asp Gly Glu Leu Thr Ile Val Leu Ser Ser Ile
100 105 110
Ala Leu Ala Cys Lys Gln Ile Ala Ser Leu Val Gln Arg Ala Gly Ile
115 120 125
Ser Asn Met Thr Gly Leu Gln Gly Ala Ala Asn Ile Gln Gly Glu Asp
130 135 140
Gln Lys Lys Leu Asp Val Ile Ser Asn Glu Val Phe Ser Ser Cys Leu
145 150 155 160
Arg Ser Ser Gly Arg Thr Gly Ile Ile Ala Ser Glu Glu Glu Asp Thr
165 170 175
Pro Val Ala Val Glu Glu Ser Tyr Ser Gly Asn Tyr Ile Val Val Phe
180 185 190
Asp Pro Leu Asp Gly Ser Ser Asn Ile Asp Ala Ala Val Ser Thr Gly
195 200 205
Ser Ile Trp Gly Ile Tyr Lys Pro Asn Glu Glu Cys Leu Thr Asn Leu
210 215 220
Gly Glu Glu Pro Thr Ile Asp Glu Ile Ala Glu Asn Cys Val Val Asn
225 230 235 240
Val Cys Gln Pro Gly Ser Asn Leu Leu Ser Ala Gly Tyr Cys Met Tyr
245 250 255
Ser Ser Ser Val Ile Leu Val Leu Ser Val Gly Asp Gly Val Tyr Gly
260 265 270
Phe Thr Leu Asp Pro Leu Tyr Gly Glu Phe Val Leu Ser His Asp Asn
275 280 285
Ile Gln Ile Pro Lys Ser Gly Lys Ile Tyr Ser Met Asn Glu Gly Asn
290 295 300
Tyr Ala Leu Trp Asp Asp Asn Leu Lys Lys Tyr Val Asp Ser Leu Lys
305 310 315 320
Asp Pro Gly Pro Ser Gly Lys Pro Tyr Ser Ala Arg Tyr Ile Gly Ser
325 330 335
Leu Val Gly Asp Phe His Arg Thr Met Leu Tyr Gly Gly Ile Tyr Gly
340 345 350
Tyr Pro Arg Asp Ser Lys Ser Lys Asn Gly Lys Leu Arg Leu Leu Tyr
355 360 365
Glu Cys Ala Pro Met Ser Tyr Leu Ala Glu Gln Ala Gly Gly Lys Gly
370 375 380
Ser Asp Gly His Gln Arg Ile Leu Asp Ile Gln Pro Glu Gln Val His
385 390 395 400
Gln Arg Val Pro Leu Tyr Val Gly Ser Thr Glu Glu Val Glu Lys Leu
405 410 415
Glu Lys Phe Leu Ala
420
<210>198
<211>1263
<212>DNA
<213>Galderia sulphuraria
<400>198
ggcacgagga aagatgtgca agtatacttt attcaagtcc tactatatct ttacaaagaa 60
gagtgtcaag aaataaccac tgcaaaagat atcttcctta taagatggat atccatcaaa 120
atgatagctg ttcaacccca acccaaaaag actcccgtag cagaatattt acaaacctca 180
caagacacac caacttcact cactcgttac ttgttggaag tagccaaaca aaataaggat 240
atgggagata tggtggcatt gataaacggt attcaatttg cttgcaaaaa gatagcttca 300
ttggttggta aagcaggggt cactgacttg atgggaatct atcaacaagg catagtcaac 360
gttcacggag aagaacagaa aaagttggat gttctttcta atgaagtatt gaagaacgct 420
ctcaaatatt cgggaaaaat ggctgtcata gcttcggaag aagaagacgt tcctatcatg 480
gtagaagaaa gttattccgg taactatgta gtcgtgtttg atccattaga tggttcttcc 540
aatttggatg ctggattgcc tactggaact atatttggag tgtttcaaca acaattctcg 600
tgtctcattc atgactatga ggagtccatc gataacatgg aattggcttg tttacaaaac 660
actttacaac caggacgtag attgattgcc gctggatatt gtatctattc ttcttctacc 720
atgttggtac tctcattggg taatggtctt cattgtttta ctttggatac ggaagttggt 780
gaatttgtat tgactcgtgc taacatccaa attceacaaa gaggtaatat ttattctttc 840
aacgagtcca acttttatca atgggataaa ggagttcaag attatataga gaggttaaaa 900
aaaggaaaca atcaaacaaa ttgtcgttat tccgcaagat atgttggctc catggttgct 960
gatgtacatc gtacaatatt gtatggcgga atatttggtt atccagcaga taaaaagaat 1020
gtctctggta aattgagatt ggtatatgaa tgtgcaccga tggcatattt ggttgaacaa 1080
gcaggaggta aagcaaccac gggaatagaa aatattttag atttgacacc aaaagatatt 1140
cacgaaagga agcctcttat attaggttct ccagcagata tcgaagaatt tctgcaagta 1200
tatggaatgt cacgagttga tagagaagat atgcatatgt gggataactt gagtagttta 1260
taa 1263
<210>199
<211>420
<212>PRT
<213>Galderia sulphuraria
<400>199
Gly Thr Arg Lys Asp Val Gln Val Tyr Phe Ile Gln Val Leu Leu Tyr
1 5 10 15
Leu Tyr Lys Glu Glu Cys Gln Glu Ile Thr Thr Ala Lys Asp Ile Phe
20 25 30
Leu Ile Arg Trp Ile Ser Ile Lys Met Ile Ala Val Gln Pro Gln Pro
35 40 45
Lys Lys Thr Pro Val Ala Glu Tyr Leu Gln Thr Ser Gln Asp Thr Pro
50 55 60
Thr Ser Leu Thr Arg Tyr Leu Leu Glu Val Ala Lys Gln Asn Lys Asp
65 70 75 80
Met Gly Asp Met Val Ala Leu Ile Asn Gly Ile Gln Phe Ala Cys Lys
85 90 95
Lys Ile Ala Ser Leu Val Gly Lys Ala Gly Val Thr Asp Leu Met Gly
100 105 110
Ile Tyr Gln Gln Gly Ile Val Asn Val His Gly Glu Glu Gln Lys Lys
115 120 125
Leu Asp Val Leu Ser Asn Glu Val Leu Lys Asn Ala Leu Lys Tyr Ser
130 135 140
Gly Lys Met Ala Val Ile Ala Ser Glu Glu Glu Asp Val Pro Ile Met
145 150 155 160
Val Glu Glu Ser Tyr Ser Gly Asn Tyr Val Val Val Phe Asp Pro Leu
165 170 175
Asp Gly Ser Ser Asn Leu Asp Ala Gly Leu Pro Thr Gly Thr Ile Phe
180 185 190
Gly Val Phe Gln Gln Gln Phe Ser Cys Leu Ile His Asp Tyr Glu Glu
195 200 205
Ser Ile Asp Asn Met Glu Leu Ala Cys Leu Gln Asn Thr Leu Gln Pro
210 215 220
Gly Arg Arg Leu Ile Ala Ala Gly Tyr Cys Ile Tyr Ser Ser Ser Thr
225 230 235 240
Met Leu Val Leu Ser Leu Gly Asn Gly Leu His Cys Phe Thr Leu Asp
245 250 255
Thr Glu Val Gly Glu Phe Val Leu Thr Arg Ala Asn Ile Gln Ile Pro
260 265 270
Gln Arg Gly Asn Ile Tyr Ser Phe Asn Glu Ser Asn Phe Tyr Gln Trp
275 280 285
Asp Lys Gly Val Gln Asp Tyr Ile Glu Arg Leu Lys Lys Gly Asn Asn
290 295 300
Gln Thr Asn Cys Arg Tyr Ser Ala Arg Tyr Val Gly Ser Met Val Ala
305 310 315 320
Asp Val His Arg Thr Ile Leu Tyr Gly Gly Ile Phe Gly Tyr Pro Ala
325 330 335
Asp Lys Lys Asn Val Ser Gly Lys Leu Arg Leu Val Tyr Glu Cys Ala
340 345 350
Pro Met Ala Tyr Leu Val Glu Gln Ala Gly Gly Lys Ala Thr Thr Gly
355 360 365
Ile Glu Asn Ile Leu Asp Leu Thr Pro Lys Asp Ile His Glu Arg Lys
370 375 380
Pro Leu Ile Leu Gly Ser Pro Ala Asp Ile Glu Glu Phe Leu Gln Val
385 390 395 400
Tyr Gly Met Ser Arg Val Asp Arg Glu Asp Met His Met Trp Asp Asn
405 410 415
Leu Ser Ser Leu
420
<210>200
<211>710
<212>DNA
<213>地钱(Marchantia polymorpha)
<400>200
gaggaggata ccccagtcgc cgtcgaagag agctactcag gaaactacgt cgttgtcttc 60
gatcctctcg atggatcctc caacatcgac gctgcggtat ctaccggatc catctttgga 120
atctacaggc ccactgagga gtgtcttgca gacatggacg acgactcaca gctcggtatg 180
gtggaacaaa actgcatcgt gaacgtatgc cagcccggta gcaacctcct atccgctggg 240
tactgcatgt actccagctc cgtcattttg gtgttgtcag tcggagacgg tgtctatgga 300
ttcacactgg atcccctgta cggtgaattc gtcatgaccc acgacaacat caagatccca 360
aagaagggat cgatctactc gttcaatgaa ggtaactacg cactctggga tgacaagctc 420
aagaagtaca tcgactcact gaaggacccc gaacccaccg gcaagcctta ctctgctcgt 480
tacatcggta gtctggtcgg tgacttccac agaaccatgc tctatggtgg catctacgga 540
taccctgccg acaagaaaag caagaacgga aagttgagac ttctgtacga gtgtgctcct 600
atgagctact tggcagagca ggccggagga aagggttctg atggttaccg cagagttctg 660
gaaatcgagc ctgagcaggt acatcagcga gtgccacttt tcgtcggaag 710
<210>201
<211>236
<212>PRT
<213>地钱
<400>201
Glu Glu Asp Thr Pro Val Ala Val Glu Glu Ser Tyr Ser Gly Asn Tyr
1 5 10 15
Val Val Val Phe Asp Pro Leu Asp Gly Ser Ser Asn Ile Asp Ala Ala
20 25 30
Val Ser Thr Gly Ser Ile Phe Gly Ile Tyr Arg Pro Thr Glu Glu Cys
35 40 45
Leu Ala Asp Met Asp Asp Asp Ser Gln Leu Gly Met Val Glu Gln Asn
50 55 60
Cys Ile Val Asn Val Cys Gln Pro Gly Ser Asn Leu Leu Ser Ala Gly
65 70 75 80
Tyr Cys Met Tyr Ser Ser Ser Val Ile Leu Val Leu Ser Val Gly Asp
85 90 95
Gly Val Tyr Gly Phe Thr Leu Asp Pro Leu Tyr Gly Glu Phe Val Met
100 105 110
Thr His Asp Asn Ile Lys Ile Pro Lys Lys Gly Ser Ile Tyr Ser Phe
115 120 125
Asn Glu Gly Asn Tyr Ala Leu Trp Asp Asp Lys Leu Lys Lys Tyr Ile
130 135 140
Asp Ser Leu Lys Asp Pro Glu Pro Thr Gly Lys Pro Tyr Ser Ala Arg
145 150 155 160
Tyr Ile Gly Ser Leu Val Gly Asp Phe His Arg Thr Met Leu Tyr Gly
165 170 175
Gly Ile Tyr Gly Tyr Pro Ala Asp Lys Lys Ser Lys Asn Gly Lys Leu
180 185 190
Arg Leu Leu Tyr Glu Cys Ala Pro Met Ser Tyr Leu Ala Glu Gln Ala
195 200 205
Gly Gly Lys Gly Ser Asp Gly Tyr Arg Arg Val Leu Glu Ile Glu Pro
210 215 220
Glu Gln Val His Gln Arg Val Pro Leu Phe Val Gly
225 230 235
<210>202
<211>765
<212>DNA
<213>孔雀草(Tagetes patula)
<400>202
atcattgcat cggaggaaga agacgtgccg gtggctgtgg aagagagtta ctccggaaac 60
tacattgtcg tgtttgatcc ccttgatggg tcatctaata ttgatgctgc tgtttcaacc 120
gattctattt tcggaatcta tagccccaat gatgagtgtc tcgctgatat tagtgacgac 180
tccacgctag acagtgtgga acaaaaatgt attgtcaacg tatgccagcc cggaagcaat 240
ctactagcag ccggttactg tatgtactca agctccgtaa tcttcgtgct ctcgatcggt 300
actggtgtct acgcgttcac attagaccca atgtacggtg agtttgtact cactcaagaa 360
aagattcaaa tcccgaaatc ggggaagatt tactcgttta acgaaggaaa ctatcaacta 420
tgggacgata aattgaagaa gtacatggat gatctaaagg acccgggccc cacgggcaag 480
ccgtattcgg ctcgctacat tggtagcttg gttggtgatt ttcataggac attattgtac 540
ggagggattt acgggtaccc acgtgacaaa aagagcaaga acgggaagct tcggttgttg 600
tatgagtgtg caccgatgag ttacttggtt gaacaagcgg gtggaaaggg gtcggatgga 660
catcaacgag tgctcgacat tcaaccaacc gagattcatc agcgcgttcc gctatacatt 720
gggagcgtag aggaagtgga aaaattggag aagtatttgg cttga 765
<210>203
<211>254
<212>PRT
<213>孔雀草
<400>203
Ile Ile Ala Ser Glu Glu Glu Asp Val Pro Val Ala Val Glu Glu Ser
1 5 10 15
Tyr Ser Gly Asn Tyr Ile Val Val Phe Asp Pro Leu Asp Gly Ser Ser
20 25 30
Asn Ile Asp Ala Ala Val Ser Thr Gly Ser Ile Phe Gly Ile Tyr Ser
35 40 45
Pro Asn Asp Glu Cys Leu Ala Asp Ile Ser Asp Asp Ser Thr Leu Asp
50 55 60
Ser Val Glu Gln Lys Cys Ile Val Asn Val Cys Gln Pro Gly Ser Asn
65 70 75 80
Leu Leu Ala Ala Gly Tyr Cys Met Tyr Ser Ser Ser Val Ile Phe Val
85 90 95
Leu Ser Ile Gly Thr Gly Val Tyr Ala Phe Thr Leu Asp Pro Met Tyr
100 105 110
Gly Glu Phe Val Leu Thr Gln Glu Lys Ile Gln Ile Pro Lys Ser Gly
115 120 125
Lys Ile Tyr Ser Phe Asn Glu Gly Asn Tyr Gln Leu Trp Asp Asp Lys
130 135 140
Leu Lys Lys Tyr Met Asp Asp Leu Lys Asp Pro Gly Pro Thr Gly Lys
145 150 155 160
Pro Tyr Ser Ala Arg Tyr Ile Gly Ser Leu Val Gly Asp Phe His Arg
165 170 175
Thr Leu Leu Tyr Gly Gly Ile Tyr Gly Tyr Pro Arg Asp Lys Lys Ser
180 185 190
Lys Asn Gly Lys Leu Arg Leu Leu Tyr Glu Cys Ala Pro Met Ser Tyr
195 200 205
Leu Val Glu Gln Ala Gly Gly Lys Gly Ser Asp Gly His Gln Arg Val
210 215 220
Leu Asp Ile Gln Pro Thr Glu Ile His Gln Arg Val Pro Leu Tyr Ile
225 230 235 240
Gly Ser Val Glu Glu Val Glu Lys Leu Glu Lys Tyr Leu Ala
245 250
<210>204
<211>795
<212>DNA
<213>亚麻(Linum usitatissimum)
<220>
<221>misc_feature
<222>(738)..(738)
<223>n是a、c、g或t
<400>204
gaggaggaac aacgtcgccg ggggttctgg tttcaaatgc tctgccgtcg ggacgcgccg 60
tcggaggcgg caacgacgac gaagaagagg agtagctacg agattctgac gctgacgacc 120
tggcttctgc agcaggaaca ggccggagtg atcgacgccg agctcacgat tgtgctctcc 180
agcatctcca cggcgtgtaa gcagatcgct tctctagttc agcgatccgg gatttctaac 240
ctcaccggcg tccagggcgc cgtcaatgtc cagggtgagg atcagaagaa gctcgacgtc 300
gtttcgaacg aggtgttttc aaattgcttg aggtcgagcg gcaggacggg gatcatagcg 360
tcggaggaag aagacgtgcc ggtcgccgtg gaggaaagct actccggtaa ctatatcgta 420
gtgttcgatc cacttgatgg atcgtcaaac atcgatgccg cagtctccac cggctcaatc 480
ttcggaatct acagtcccaa cgatgagtgc ctggccgaca tcggagacgg agacgagtca 540
aatctagata ctcaggagca gaagtgtgtg gtgagcgtgt gccagccggg gagcaaccta 600
ctcgccgccg gctactgcat gtactcaagc tcggtgatct tcgtcctcac gatcggaaac 660
ggcgttttcg ccttcaatct ggacccaatg tacggcgagt tggtgttgac tcaagagaac 720
attcagatcc cgaaagcngg aaagatctac tcattcaacg aaggggacta ccaaatgtgg 780
gatgagaaat tgaag 795
<210>205
<211>265
<212>PRT
<213>亚麻
<400>205
Glu Glu Glu Gln Arg Arg Arg Gly Phe Trp Phe Gln Met Leu Cys Arg
1 5 10 15
Arg Asp Ala Pro Ser Glu Ala Ala Thr Thr Thr Lys Lys Arg Ser Ser
20 25 30
Tyr Glu Ile Leu Thr Leu Thr Thr Trp Leu Leu Gln Gln Glu Gln Ala
35 40 45
Gly Val Ile Asp Ala Glu Leu Thr Ile Val Leu Ser Ser Ile Ser Thr
50 55 60
Ala Cys Lys Gln Ile Ala Ser Leu Val Gln Arg Ser Gly Ile Ser Asn
65 70 75 80
Leu Thr Gly Val Gln Gly Ala Val Asn Val Gln Gly Glu Asp Gln Lys
85 90 95
Lys Leu Asp Val Val Ser Asn Glu Val Phe Ser Asn Cys Leu Arg Ser
100 105 110
Ser Gly Arg Thr Gly Ile Ile Ala Ser Glu Glu Glu Asp Val Pro Val
115 120 125
Ala Val Glu Glu Ser Tyr Ser Gly Asn Tyr Ile Val Val Phe Asp Pro
130 135 140
Leu Asp Gly Ser Ser Asn Ile Asp Ala Ala Val Ser Thr Gly Ser Ile
145 150 155 160
Phe Gly Ile Tyr Ser Pro Asn Asp Glu Cys Leu Ala Asp Ile Gly Asp
165 170 175
Gly Asp Glu Ser Asn Leu Asp Thr Gln Glu Gln Lys Cys Val Val Ser
180 185 190
Val Cys Gln Pro Gly Ser Asn Leu Leu Ala Ala Gly Tyr Cys Met Tyr
195 200 205
Ser Ser Ser Val Ile Phe Val Leu Thr Ile Gly Asn Gly Val Phe Ala
210 215 220
Phe Asn Leu Asp Pro Met Tyr Gly Glu Leu Val Leu Thr Gln Glu Asn
225 230 235 240
Ile Gln Ile Pro Lys Ala Gly Lys Ile Tyr Ser Phe Asn Glu Gly Asp
245 250 255
Tyr Gln Met Trp Asp Glu Lys Leu Lys
260 265
<210>206
<211>50
<212>DNA
<213>人工序列
<220>
<223>引物:prm08448
<400>206
ggggacaagt ttgtacaaaa aagcaggctt aaacaatggc cgccaccatg 50
<210>207
<211>50
<212>DNA
<213>人工序列
<220>
<223>引物:prm08449
<400>207
ggggaccact ttgtacaaga aagctgggta gctgcttagt gcttcttggt 50
<210>208
<211>1167
<212>DNA
<213>稻
<400>208
atccaagcca agaagaggga gagcaccaag gacacgcgac tagcagaagc cgagcgaccg 60
ccttcttcga tccatatctt ccggtcgagt tcttggtcga tctcttccct cctccacctc 120
ctcctcacag ggtatgtgcc cttcggttgt tcttggattt attgttctag gttgtgtagt 180
acgggcgttg atgttaggaa aggggatctg tatctgtgat gattcctgtt cttggatttg 240
ggatagaggg gttcttgatg ttgcatgtta tcggttcggt ttgattagta gtatggtttt 300
caatcgtctg gagagctcta tggaaatgaa atggtttagg gtacggaatc ttgcgatttt 360
gtgagtacct tttgtttgag gtaaaatcag agcaccggtg attttgcttg gtgtaataaa 420
agtacggttg tttggtcctc gattctggta gtgatgcttc tcgatttgac gaagctatcc 480
tttgtttatt ccctattgaa caaaaataat ccaactttga agacggtccc gttgatgaga 540
ttgaatgatt gattcttaag cctgtccaaa atttcgcagc tggcttgttt agatacagta 600
gtccccatca cgaaattcat ggaaacagtt ataatcctca ggaacagggg attccctgtt 660
cttccgattt gctttagtcc cagaattttt tttcccaaat atcttaaaaa gtcactttct 720
ggttcagttc aatgaattga ttgctacaaa taatgctttt atagcgttat cctagctgta 780
gttcagttaa taggtaatac ccctatagtt tagtcaggag aagaacttat ccgatttctg 840
atctccattt ttaattatat gaaatgaact gtagcataag cagtattcat ttggattatt 900
ttttttatta gctctcaccc cttcattatt ctgagctgaa agtctggcat gaactgtcct 960
caattttgtt ttcaaattca catcgattat ctatgcatta tcctcttgta tctacctgta 1020
gaagtttctt tttggttatt ccttgactgc ttgattacag aaagaaattt atgaagctgt 1080
aatcgggata gttatactgc ttgttcttat gattcatttc ctttgtgcag ttcttggtgt 1140
agcttgccac tttcaccagc aaagttc 1167
<210>209
<211>1629
<212>DNA
<213>稻
<400>209
atgatgggtt gcttcactgt cctgagatcc aagaagaaga agcctcttgc tctcaccaag 60
aaatcggttg atgcaaggga aagcacgtcc tcaagactcc cagagccaga agcgcatgtg 120
ccatcgttac aatctgctcc tcctagtttt aggaacaagg ctaaaatcca ccaatcggaa 180
aagaaagctt cttacagcag agcgcgcgtg ctgtctgctc cttccagcct aattgtggtt 240
gatcaggatg gtcttccata tgccgaattc gatgatcaag atgactccag gggcaaggga 300
ggttctataa agggccaccg tttctctaat ccactgcccc ttcctctccc atcaccagaa 360
ggaaaatcat tgaggaactt tggcagcttc aaagccatca atgcaagtgg accactcgat 420
gcttcaggcc ctctgccact tcctccaaag aagtgtgatg ggcttaagaa tttctcctat 480
gaggaacttt catcagcttg ccaatggttt tctggtgacc agtgtgtttc cgaaagtttg 540
acatcaacat catacaaggc gtcctttagg gatgatttta ccgacccaaa gaccattgaa 600
gcaatagtat ctcggttgct ctcctccact cagagtttga aagagtttaa aacacaagtg 660
aataccttgg catcacttca gcatcccaac ttatgtaaac taatcggctt tcacgcaaga 720
gaagaatcta atgaaaggat gttggtctat gagcgactcc atcatggcag cttagataaa 780
ctactctttg gaagatcgga tggtcgtttc atggactggt cagcacgttt gaaggttgct 840
cttggtgctg ctagaggcct ggctttccta catgatgaag ggccttttca ggccatgtac 900
aatgacttct caacctcaaa catccaaatt gacaaagatt tcactgcaaa gctatcagga 960
tatggatgtg ttggattcaa taccgaggag gaaatatcaa atgcatctgt ggctgctgca 1020
aacctctcag tggaaacctt ggagaaaggt gtactgactc ccaagagcaa cgtatggtgc 1080
tttggagttg tcctgctgga gctaataaca ggaaggaaga accttgatgt ccgttcctca 1140
aaagaagaac gcaatattgt caagtggagt aggcctttcc tcaccgatga tagtcgccta 1200
tcgttaatca tggactcccg tataaaagga cgcttcccta ccaaggctgc tcggattgta 1260
gcagatatca tattgagatg ccttaataaa gatccatcag agaggcctac catgagggcc 1320
gttgtggagt ccctagcaag cgtccaggac ataaaggttc catgtcgata tcctttgcaa 1380
gagccatctg ctgccccaag aaaggtgatg ttaaaatcta caagtctcaa tggcatcatt 1440
catcaccatc ctgtcgtaac cttctcaccg tcacctcctt cgcgaaacca acatttgctc 1500
tcgccaaggt catccacgtc tgcactgctt cctccaagga ccagctgtgc tctggatgac 1560
cctagagtaa gctctatcaa gaaatcgcct tcccctattt tacggagatc tggtgttgag 1620
ggtttttga 1629
<210>210
<211>542
<212>PRT
<213>稻
<400>210
Met Met Gly Cys Phe Thr Val Leu Arg Ser Lys Lys Lys Lys Pro Leu
1 5 10 15
Ala Leu Thr Lys Lys Ser Val Asp Ala Arg Glu Ser Thr Ser Ser Arg
20 25 30
Leu Pro Glu Pro Glu Ala His Val Pro Ser Leu Gln Ser Ala Pro Pro
35 40 45
Ser Phe Arg Asn Lys Ala Lys Ile His Gln Ser Glu Lys Lys Ala Ser
50 55 60
Tyr Ser Arg Ala Arg Val Leu Ser Ala Pro Ser Ser Leu Ile Val Val
65 70 75 80
Asp Gln Asp Gly Leu Pro Tyr Ala Glu Phe Asp Asp Gln Asp Asp Ser
85 90 95
Arg Gly Lys Gly Gly Ser Ile Lys Gly His Arg Phe Ser Asn Pro Leu
100 105 110
Pro Leu Pro Leu Pro Ser Pro Glu Gly Lys Ser Leu Arg Asn Phe Gly
115 120 125
Ser Phe Lys Ala Ile Asn Ala Ser Gly Pro Leu Asp Ala Ser Gly Pro
130 135 140
Leu Pro Leu Pro Pro Lys Lys Cys Asp Gly Leu Lys Asn Phe Ser Tyr
145 150 155 160
Glu Glu Leu Ser Ser Ala Cys Gln Trp Phe Ser Gly Asp Gln Cys Val
165 170 175
Ser Glu Ser Leu Thr Ser Thr Ser Tyr Lys Ala Ser Phe Arg Asp Asp
180 185 190
Phe Thr Asp Pro Lys Thr Ile Glu Ala Ile Val Ser Arg Leu Leu Ser
195 200 205
Ser Thr Gln Ser Leu Lys Glu Phe Lys Thr Gln Val Asn Thr Leu Ala
210 215 220
Ser Leu Gln His Pro Asn Leu Cys Lys Leu Ile Gly Phe His Ala Arg
225 230 235 240
Glu Glu Ser Asn Glu Arg Met Leu Val Tyr Glu Arg Leu His His Gly
245 250 255
Ser Leu Asp Lys Leu Leu Phe Gly Arg Ser Asp Gly Arg Phe Met Asp
260 265 270
Trp Ser Ala Arg Leu Lys Val Ala Leu Gly Ala Ala Arg Gly Leu Ala
275 280 285
Phe Leu His Asp Glu Gly Pro Phe Gln Ala Met Tyr Asn Asp Phe Ser
290 295 300
Thr Ser Asn Ile Gln Ile Asp Lys Asp Phe Thr Ala Lys Leu Ser Gly
305 310 315 320
Tyr Gly Cys Val Gly Phe Asn Thr Glu Glu Glu Ile Ser Asn Ala Ser
325 330 335
Val Ala Ala Ala Asn Leu Ser Val Glu Thr Leu Glu Lys Gly Val Leu
340 345 350
Thr Pro Lys Ser Asn Val Trp Cys Phe Gly Val Val Leu Leu Glu Leu
355 360 365
Ile Thr Gly Arg Lys Asn Leu Asp Val Arg Ser Ser Lys Glu Glu Arg
370 375 380
Asn Ile Val Lys Trp Ser Arg Pro Phe Leu Thr Asp Asp Ser Arg Leu
385 390 395 400
Ser Leu Ile Met Asp Ser Arg Ile Lys Gly Arg Phe Pro Thr Lys Ala
405 410 415
Ala Arg Ile Val Ala Asp Ile Ile Leu Arg Cys Leu Asn Lys Asp Pro
420 425 430
Ser Glu Arg Pro Thr Met Arg Ala Val Val Glu Ser Leu Ala Ser Val
435 440 445
Gln Asp Ile Lys Val Pro Cys Arg Tyr Pro Leu Gln Glu Pro Ser Ala
450 455 460
Ala Pro Arg Lys Val Met Leu Lys Ser Thr Ser Leu Asn Gly Ile Ile
465 470 475 480
His His His Pro Val Val Thr Phe Ser Pro Ser Pro Pro Ser Arg Asn
485 490 495
Gln His Leu Leu Ser Pro Arg Ser Ser Thr Ser Ala Leu Leu Pro Pro
500 505 510
Arg Thr Ser Cys Ala Leu Asp Asp Pro Arg Val Ser Ser Ile Lys Lys
515 520 525
Ser Pro Ser Pro Ile Leu Arg Arg Ser Gly Val Glu Gly Phe
530 535 540
<210>211
<211>1674
<212>DNA
<213>拟南芥
<400>211
atggttttgg ggtgtttccc tttgaaaagc aagaagaaac gtggctctgt ttctatgaag 60
cggttggatc ttgaagaaag caagccaact gctttacctg agccaccaaa gattccaagt 120
cgtaatttac aatcaggtcc tccgagtttc agaaatcgtg tgaagccaat tcaatcaaac 180
aacggtggaa acggagagat gagtagccga gcaagagtca tgtttgctcc gtcaagcatc 240
cacggtgcag cggaacggga tttgcttgct ggtgtttacc acgacgagca agatgaacaa 300
ccaagagatc cacgtacttc tactaaagaa tctagccctc aaccacttcc gttaccgtca 360
ccaagaactg gttcttcatt gaagaattgg ggaagcttta agtcgtttaa cggaagcagc 420
ggtcggttat catcatccgc agctgtatct ggacctttac ctttgccacc tagcgggtca 480
gttaggagct tttcatatga tgaagtaatg gctgcgtgta acgctttttc ttcagaccga 540
tgtgtcatgg aaggtctttc atctgttatg tacatggctt cctttggtga tgaggcttcg 600
acctcaggtt taaagaaggt tgacgcaact gttgtacgac ttcacgtaac tactcagagt 660
attagggagt tcattaatga agtcaacaca ttggcgtcgc tgcaacacca gaacctttgt 720
aagctggtag gctatcatgc tcgtgacggt tctgacacaa gaatgttggt gtacgagagg 780
cttgctctgg gcagcttgga ccgtttactg catgggagat cagatgggcc tcctcttgat 840
tggaacacta gaatgaagat tgcactatgt gcagctcagg gtctaacctt cttgcacgaa 900
gaaggccctt ttcaggcaat gtacaatgaa ttttcgacgg caaatatcca agtcgataaa 960
gatttcagcg ccaagctatc aggatacggt tgtgcaggcc atgcgcctga gacagagaca 1020
tctaatagtt cggcacttgc taatctctct gtcgagactc tagagagagg gcttttgacc 1080
ccgaagagca atgtgtggag ctatggaata gttcttcttg agatgttaac gggtcggaaa 1140
aatatggacg ggtcttaccc gaaagaagag aggaacttag tgaaatggag cagagctttt 1200
ctagcagatg attgcaggct ctcgcttata atggatcctc agcttaaagg tcggtttccg 1260
gcaaaagcgg cgaggagcat agcagatata gcacagaaat gtctgcaggt ggagccatca 1320
gagcgtccaa ccatgagaaa catcgtggat caactcaaga tcatacagga catgaagtac 1380
tcgtgtaggt tcccgttaag agaacccgca ccagtcgcgg caaggaaaca tatgggaaga 1440
tcaagcagtc tcaacacgat tatttggacc ccggcatcag tgccaccaag gtcaagtttt 1500
tcaccgtcac ctccaccacg acgaccgtct gtttcaccca caaggggacg gacgctcgtg 1560
tttcccccag tgtttccgcc gcgagcgtgt tcatctttgg aggaaatggc tcgggaagag 1620
gttcgaagat cgtcttcagc cagtggtagg agaactagcc tcgaagggtt ttga 1674
<210>212
<211>557
<212>PRT
<213>拟南芥
<400>212
Met Val Leu Gly Cys Phe Pro Leu Lys Ser Lys Lys Lys Arg Gly Ser
1 5 10 15
Val Ser Met Lys Arg Leu Asp Leu Glu Glu Ser Lys Pro Thr Ala Leu
20 25 30
Pro Glu Pro Pro Lys Ile Pro Ser Arg Asn Leu Gln Ser Gly Pro Pro
35 40 45
Ser Phe Arg Asn Arg Val Lys Pro Ile Gln Ser Asn Asn Gly Gly Asn
50 55 60
Gly Glu Met Ser Ser Arg Ala Arg Val Met Phe Ala Pro Ser Ser Ile
65 70 75 80
His Gly Ala Ala Glu Arg Asp Leu Leu Ala Gly Val Tyr His Asp Glu
85 90 95
Gln Asp Glu Gln Pro Arg Asp Pro Arg Thr Ser Thr Lys Glu Ser Ser
100 105 110
Pro Gln Pro Leu Pro Leu Pro Ser Pro Arg Thr Gly Ser Ser Leu Lys
115 120 125
Asn Trp Gly Ser Phe Lys Ser Phe Asn Gly Ser Ser Gly Arg Leu Ser
130 135 140
Ser Ser Ala Ala Val Ser Gly Pro Leu Pro Leu Pro Pro Ser Gly Ser
145 150 155 160
Val Arg Ser Phe Ser Tyr Asp Glu Val Met Ala Ala Cys Asn Ala Phe
165 170 175
Ser Ser Asp Arg Cys Val Met Glu Gly Leu Ser Ser Val Met Tyr Met
180 185 190
Ala Ser Phe Gly Asp Glu Ala Ser Thr Ser Gly Leu Lys Lys Val Asp
195 200 205
Ala Thr Val Val Arg Leu His Val Thr Thr Gln Ser Ile Arg Glu Phe
210 215 220
Ile Asn Glu Val Asn Thr Leu Ala Ser Leu Gln His Gln Asn Leu Cys
225 230 235 240
Lys Leu Val Gly Tyr His Ala Arg Asp Gly Ser Asp Thr Arg Met Leu
245 250 255
Val Tyr Glu Arg Leu Ala Leu Gly Ser Leu Asp Arg Leu Leu His Gly
260 265 270
Arg Ser Asp Gly Pro Pro Leu Asp Trp Asn Thr Arg Met Lys Ile Ala
275 280 285
Leu Cys Ala Ala Gln Gly Leu Thr Phe Leu His Glu Glu Gly Pro Phe
290 295 300
Gln Ala Met Tyr Asn Glu Phe Ser Thr Ala Asn Ile Gln Val Asp Lys
305 310 315 320
Asp Phe Ser Ala Lys Leu Ser Gly Tyr Gly Cys Ala Gly His Ala Pro
325 330 335
Glu Thr Glu Thr Ser Asn Ser Ser Ala Leu Ala Asn Leu Ser Val Glu
340 345 350
Thr Leu Glu Arg Gly Leu Leu Thr Pro Lys Ser Asn Val Trp Ser Tyr
355 360 365
Gly Ile Val Leu Leu Glu Met Leu Thr Gly Arg Lys Asn Met Asp Gly
370 375 380
Ser Tyr Pro Lys Glu Glu Arg Asn Leu Val Lys Trp Ser Arg Ala Phe
385 390 395 400
Leu Ala Asp Asp Cys Arg Leu Ser Leu Ile Met Asp Pro Gln Leu Lys
405 410 415
Gly Arg Phe Pro Ala Lys Ala Ala Arg Ser Ile Ala Asp Ile Ala Gln
420 425 430
Lys Cys Leu Gln Val Glu Pro Ser Glu Arg Pro Thr Met Arg Asn Ile
435 440 445
Val Asp Gln Leu Lys Ile Ile Gln Asp Met Lys Tyr Ser Cys Arg Phe
450 455 460
Pro Leu Arg Glu Pro Ala Pro Val Ala Ala Arg Lys His Met Gly Arg
465 470 475 480
Ser Ser Ser Leu Asn Thr Ile Ile Trp Thr Pro Ala Ser Val Pro Pro
485 490 495
Arg Ser Ser Phe Ser Pro Ser Pro Pro Pro Arg Arg Pro Ser Val Ser
500 505 510
Pro Thr Arg Gly Arg Thr Leu Val Phe Pro Pro Val Phe Pro Pro Arg
515 520 525
Ala Cys Ser Ser Leu Glu Glu Met Ala Arg Glu Glu Val Arg Arg Ser
530 535 540
Ser Ser Ala Ser Gly Arg Arg Thr Ser Leu Glu Gly Phe
545 550 555
<210>213
<211>2069
<212>DNA
<213>两色蜀黍
<400>213
ctactggatt aaccccccgc gtgcgttccc tccctctgtc agtctgtctc tctcttggcg 60
tcgactgggc gaccgtcgca gccgccctaa gccaggtacc cagaccatct tcgggccctt 120
cgccggcgac gagcaccacc aggaattttc ccagctgtag caatgatggg ttgcttcact 180
gttctcagat ccaagaagaa gaaaatccct tttgataatc ctcttcttcc aagcaagaaa 240
tcggttgatg caagggaaag tacgtcgtct agacttccgg aaccagaagt tcatgtgcca 300
tctttgcaat cagctctctc ctagttttag gaacaggact aagatatccc agtcgtcaaa 360
taaagtttca aacagcagag ctcgcgtgtt gtctgctccg tcaaccctta ttgtggttga 420
tcagtttggc tttccatatg ctgaataccg agatcaagac gactccagag ataaggaagg 480
ttcaacaaag gggcatcgct tttcaaatcc tttgcccctt cctcttcctt caccggaagg 540
acattctttt aggaactctg gtagcttcaa agctagcaac gtaagtgggc cattggagat 600
gtccagccct ctcccattgc ctccaaagaa atgtgatgga cttagaatct tttcttacga 660
ggaggttttg tctgcttgcc aatggttttc aagtgatcag tgtgtttcag aagcacttgg 720
ttcaacatca tacaaggcaa catttaggga tgaatttatt gatacaaaga ccactgaagc 780
aacggtagct cgattactcc cctccactca gagtttgaag gagtttaaaa cacaagcaac 840
tacattggca ttgcttcagc atcccaattt atgtaaactg attggctatt atgcaaaaga 900
agattctaat gaaaggatgt tggtctatga acggcttcat catgggagct tagataagct 960
actctttgga agaccagatg gtcgtttcat ggactggtct aaacgtttga aggttgccct 1020
tggtgcggcc agaggtcttg ctttcttgca tgatgaagga ccctttcagg ccatgtacag 1080
cgagttctca actttgaaca tccaaataga taaagatttc actgctaagc tttcaggata 1140
tggttgtgtt ggcttcaata ctgaggagat atctaatgca cctgcgtctg cagcaaacct 1200
ttcggtggag accttggaga agggtttact cactcccaag agcaatgtct ggagctttgg 1260
agttgtgtta ctggagctaa taactggaag gaagaacctt gatgccaatt cttctaaaga 1320
agaacgcaat attgtcaggt ggagtaggcc tttccttact gatgatagtc gcctatctct 1380
gatcatggac tcccgtataa aagggcgctt tcctactaag gctgctcgga tagtagcaga 1440
catcattctg aaatgcttgc ataatgatcc atccgagagg ccgaccatga gggatgttgt 1500
ggaggctcta gcaagagtcc aggagataaa ggttccgtgc agatatcctt tgcaagaacc 1560
ttctgctgca ccaagaaaag taatgctaaa atctacatcc ctcaatggaa ttgtgcctca 1620
tcatcctgtc ataaccttct ctccatcgcc gccttcgcat aaccagcact tgatttcacc 1680
aaggtcatca acatctgcct tgtttcatcc aaggacatgc tcttctactc tggatgatcc 1740
cggtgtaagc tctataaaga aaacacctcc tattatgcgt aggtctagcg ttgaaggctt 1800
ttgattgtcc atattgttct tttatttctt tttctcggat ttatttgttt ctttgttagc 1860
ctagtgattt tagctgtgtt ctgtattgta agacaagtgg ccttatgtag tgcccttgag 1920
tctcgagtaa taactaagca gagcaggatg aattgtaaat agtatcaggt tgtagatacc 1980
tttttgtgct ctaattgggt ggaagcagcg tgctgagtct gagtaggcct tgtaacctca 2040
taaataaact cgtttcccag tttctgtcc 2069
<210>214
<211>1360
<212>DNA
<213>甘蔗
<400>214
agaaacactt ggttcaacat catacaaggc aacatttagg gatgaattta ttgatacaaa 60
gaccactgaa gcaacggtag ctcgattact cccctccact cagagtttga aggagtttaa 120
aacacaagcg accacattgg catcacttca gcatcccaat ttgtgtaaac tgattggcta 180
ttatgcaaaa gaagattcta atgaaaggat gttggtctat gaacggcttc atcatgggag 240
cttagataag ctactctttg gaagaccaga tggtcgtttc atggactggt ctaaacgttt 300
gaaggtttcc cttggtgctg cccgaggtct agctttcttg catgatgaag gaccctttca 360
ggccatgtac agtgagttct caactttgaa catccaaata gataaagatt tcactgctaa 420
gctttcagga tatggttgtg ttggcttcaa tactgaggag atatctaatg cacctgcgtc 480
tgcagcaaac ctttcggtgg agaccttgga gaagggttta ctcactccca agagcaacgt 540
ctggagcttt ggagttgtgt tactggagct aataactgga aggaagaacc ttgatgccaa 600
ttcttccaaa gaagaacgca atattgtcag gtggagtagg cctttcctta ctgatgatag 660
tcgcctatct ctgatcatgg actcccgtat aaaagggcgc tttccaacta aggctgctcg 720
gatagtagca gacatcattc tgaaatgctt gcataaagat ccatcagaga ggccgaccat 780
gagggatgtt gtggaggccc tagcaagagt ccaggaaata aaggttccat gcagatatcc 840
tctgcaagaa ccttttgctg caccaagaaa aataatgtta aaatctacat ccctcaatgg 900
aattgtgcct catcatcctg tcataacctt ctccccttcg ccgccttcac ataaccaaca 960
cttgatttca ccaaggtcat caacatctgc cttgtttcat ccaaggacat gctcttctac 1020
tctggatgat cccggtgtaa gctctataaa gaaaacacct cctattatgc gtaggtctag 1080
cgtcgaaggc ttttgattgt ccatattgtt cttttatttc cttttcttgg atttattagt 1140
ttctttggta gcctagtgat tctagctatg ttctgtattg caagacaagc ggccttaatg 1200
tagtgccctt gggtctagag taataactaa gcagagcagg atgaattgta aataggatca 1260
ggttgtagat acctttttgt gctctaattg ggtggaagca gcgtgctaag tgagccttgt 1320
aacctcccaa tgcaataaac tcgtttttca gtttttgttc 1360
<210>215
<211>2062
<212>DNA
<213>蒺藜苜蓿
<400>215
acgaggctat tctctctctt tctctctcta catttctcaa cattcttcaa atttctctct 60
ccaaaacctt cacttcgcag ctttttcaat ctgctttctt tgactctgta acagtttttt 120
tcgtggaaga atcagaacca caaaaaagtt tcgattttta cccatttctt caacccgtga 180
tcgcttcact gtaattggca tgagcttcca tttctcgttc tgacaaaaac aggtatctat 240
aacatcctag ttctgtacat agaatggggt gttttactat attgaagaga aagaagaaaa 300
agcctgatca gattgtgtat gtaaaacgcg taagccctgg cgaagattca cctacagtac 360
tgcccgaacc ccaaactcat acccgctcac tccagtctgc gcctcctagt tttaagatca 420
gagtgaaacc cattcaacct agcaataaag ccactaacaa tagaatacga gcattgtctg 480
ctccatcgag tcttgatgat gcagaacaag atgcattggc caccattgag tatgaagaac 540
aagaagggtc aaaataccga actggatcat ggaaggagca gcgttcgcct agtccacaac 600
cattaccgct tccatctcct aagggtggtg gtacattgaa gactgttgga agctttaagt 660
tggggatagc tagtagtcct ttatatgctt ctggaccttt gccgcttcca ccaactgggt 720
cactgagaaa cttttcttat gatgaacttg ctgctgcttg cctcaatttc tcttcagatc 780
gatacatgtc agaatctctt tcatccacca tgtataaagc ttcctttggt gatgatacct 840
caacttcaag ttcaaagaag tttgaagcta ctgtcacacg ccttcgccca tcatctcagg 900
gcctgaagga attcataaat gaggttaata ctcttgcatc attgcagcat ccgaacctct 960
gtagattgct aggatttcac gcaggtgatg gttcagagca tagaatgttg gtttatgaga 1020
ggctatacca tggaagcttg gaccgcttat tgtatgggag atctgatggg ccatcaattg 1080
attggaatac aagaatgaaa attgcaatat gtgctgcact aggtctttct ttcttgcatg 1140
aagaagggcc ttttcaggca atgtataatg aattttcaac agctaacatt cagattgaca 1200
aagatttcag tgcaaagctt tcaggatatg gttgtgttgg acatgttccg aaggaagaga 1260
tttcaagcag ttcatctgcc gttggaaacc tatcgatgga gacactggag aaaggaatgc 1320
ttactccgaa aagcaatgta tggagtttcg gaattttcct tctagagcta cttacaggaa 1380
gaaagaatct cgatagcccg tcacccaaag gaagagagaa atttggtgaa gtggagcagg 1440
cctttcctgt ctgataatca tcgtttgtca atgatcatgg atcctcaact taaaggtcgc 1500
tttccttcta aagcggcgag tacaatagct aacattgcac aaagatgcct tcaaatggag 1560
ccatcagaac gaccaaccat gggaacagtt gttgagcagc tgaaaaagat acaagatttg 1620
aagcattcta gcagattccc gctgcaagaa cctgcacaaa tgtcgagatc accaagtctt 1680
aacggtatca accaccc tgc accaaggccg agtttctctc catcaccatc atccagagcc 1740
ctggtatctg tctcacctcc aagatggtcg ggagtgtcaa ttcaacttcc acctcgcgcg 1800
ttttcttcaa ccctctattt ggaggagctt gataggcaag aaagccgcaa gtcagcttca 1860
gcctctagga aggctagtgt tgaaggattt tgattgtcga tagtgttcat tttttatttg 1920
ttattctttt tttggtgtag ttcaacagag atttatagga gataaagatt tgtaatcatc 1980
cctcagtgtg atgcagagag gatgctcttt tgtacatagt gcaaaggttg gtccccttgg 2040
ttcaattagt tactccattt tg 2062
<210>216
<211>2039
<212>DNA
<213>玉蜀黍
<400>216
ctcccccggc gtgcgctccc tcctgtctct cttggcgacg actgggcaac ggtcgcagct 60
gtatgttcga gcccttcgcc gacgacgttc accaccagga attttctcag ctgtgccaat 120
gatgggttgc ttcactgttc tcagatccaa gaagaagaaa agccattttg ataatcctct 180
tgtcccaagc aagaaatcag ttgatgcaag ggaaagtacg tcctctagac ttccggagcc 240
agaagttcat gtgccatctt tgcaatcagc tcctcctagt tttaggaaca gggtcaagat 300
atccgagtca tcaaatgaag tttcaaacag aaacagcagg gctcgcgtgc tgtctgctcc 360
atcagccctt attgtggttg atcagtttgg ctttccatat tcggaatacc gagatcaaga 420
tgactccagg gataaggaag gtttgacaaa ggggcatcgc ttttcaaatc ctttgcccct 480
tcctcttcct tcacgcgaag gacattcttt taggaactct ggtagcttca aagccagcaa 540
cgtaagcggg ccattggaga tgtctggccc tctcccattg cctctaaaga aatgtgatgg 600
acttagaatc ttctcttatg aggagatttc atctgcctgc caacgatttt ctagtgatca 660
gtgtgtttca gaaacacttg gttcaacatc atacaaggca acatttagag atgaatttat 720
tgatacgagg accactgaag caacagtagc tcgattactc ccctccactc agagtttgaa 780
ggagtttaaa acgcaagcga ccacattggc atcgcttcag catcccaatt tatgtaaact 840
gattggctat tatgcaaaag aagattctaa tgaaaggatg ttggtctatg aacggcttta 900
tcatggaagc ttagataagc tactctttgg aagatcagat ggtcgtttca tggactggtc 960
taaacgtttg aaggttgccc tgggtgctgc cagaggtcta gctttcttgc atgatgaagg 1020
accctttcag gccatgtaca gcgagttctc aactttgaac atccaaatag ataaaggttt 1080
cactgctaag ctttcaggat atggttgtgt tggcttcaat accgaggaga tatctaatgc 1140
acctgtgtct gcagcaaacc tttcggtgga gaccttggag aagggtttac tcactcccaa 1200
gagcaacgtc tggagctttg gagtcgtgtt actggagcta ataactggaa ggaagaacct 1260
tgatcccaat tattccaaag aagaacgcaa tattgtcaac tggagtaggc ctttccttac 1320
tgatgacagt cgcttgtctc ttatcatgga ctcccgtata aaagggcgct ttcccactaa 1380
ggctgctcgg atagtagcag acatcatttt gaaatgcctg cgtaaggatc catcggagag 1440
gcctaccatg agggatgttg tggaggccct agcaagagtc caggaaataa aggttccgtg 1500
cagatatcct ctgcaagaac cttctgctgc accaagaaaa gtgatgttga aatctacatc 1560
cctcaatggg attgtgcctc accatcctgt cataaccttc tctccatcgc cgccttcaca 1620
taaccagcac ttgatttcac caaggtcgtc gacatctgcc ttgtttcatc caagggcatg 1680
ctcttctacc ctggacgatc cgagtgtaag ttctataaag aaaacaccac ctattatgcg 1740
aaggtctagc gtcgaaggct tttgattgtc catattgttc ctttatttcc ttttcttgga 1800
tttatttgtt tctttgttag tagtgtagcg gtttttagct gtgttctgta ttgtaagaca 1860
agtggcctca tatgtagtgc ccttgggtct ggagtaaagc agaacaggat gaattgtaaa 1920
taggaccagg ttgtagatac cttttttttg tgctcgaatt gggtggaagc agcgtgccga 1980
gtgggccttg taacctcata atgcaataaa ctccgtttcc cagtttctgt aaaaaaaaa 2039
<210>217
<211>1479
<212>DNA
<213>大麦
<400>217
tgccgaattc ggcacgagaa agaggtccga ggggcttaag aacttctcgt acgatgagat 60
ttccactgct tgccagtggt tttctggcga tcatcgtgtc tcagaaactc tgacttcgac 120
atcatacaag gcattgttca gggatgattt cgttgaacca aagaagatgg aagcaatagt 180
agccaggtta ctcccttcca atcagagttt caaagaattt aaggcacaag taaatacgtt 240
ggcatcactt caacatccca atttatgtaa actcatcggc tatcacgcaa gagaagaatc 300
taatgaaagg atgttggtct atgagcggct ccatcatggc agtttagaca ggttactctt 360
tggaagaccg gaaggtcgtt tcatggactg gtctacacgt ttgaaggttg cccttggtgc 420
tgctaaaggt ctagctttcc tacacgatga aggacccttt caggcaatgt atgatgactt 480
ctcaacgtca aacatccaaa tagagaaaga tttcactgca aagctgtcgg gatatggttg 540
tgttggcttc aattctgacg aggaaagatc caaggcatct gtggctgcaa acctctcaga 600
ggaaaccttg gagaaaggcg tactgactcc gaagagcaac gtatggagct ttggagttgt 660
cttgctcgag ctaataacag gacggaagaa cctcgatgta cgttccacca aagaagaacg 720
taatattgtc aagtggggta ggcctttcct caccgacgat agtcgtctat ccctcatcat 780
ggatccccgt ataaaaggac gctttcctac caaggctgct cgaactgtgg cagacataat 840
tctgaagtgc cttcaaagag atccatcaga aaggcctacg atgagggccg tcgtggaggc 900
cctaacaagc gttcaggaca taaaggtccc ctgccggtat cctcttcaag taccgtcccg 960
ccgcacccga ggaaagtgat gctaaagtct acgagcctca atggcattgt tcctcagcat 1020
cccgtcatga ccttctcgcc gtcgcctcct tcgcgcaacc agcacctggc gtcgccaaga 1080
tcatcgactt ccgcgcttct tcccccaagg acctgctctt ccatcatcac cctggattac 1140
cccagggtaa gctcggtcaa gaagtcgcct tccggtatcc tgcggagacc tggcgtcgag 1200
ggtttttgat tgtccataca tggtcggatt tcttctcttt gccttggatt tatttgttgt 1260
tttggttagc ctagcgagtg gtctcagtgc tatgtgatat gtatatgttg gaaagacatc 1320
tgaaaaaagg gcagagtgaa gtgtagatag tagaaccagc tttgtagata cttgtcgttc 1380
tctgattgga tgggggtcat ggaagcagtg tgtgttagag tggggcttgt aaccccatta 1440
ttatgcaata aacgtgggtt ggtcggtcgt atttgctcg 1479
<210>218
<211>769
<212>DNA
<213>大豆
<400>218
gtaaattgct aggatttcat gcacgagagg gttcagaaca tagaatgttg gtttatgaaa 60
ggctatacca tggaagcttg gatcgcttat tgtatgggag atctgatggg ccatcaattg 120
attggaatac aagaatgaaa attgctatat gtgctgcaca aggtctaacc ttcttgcacg 180
aagaggggcc ttttcaggct atgtataatg agttctcaac agccaacata cagattgaca 240
aagatttcag cgcaaagctt tcaggatatg gttgtgttgg acatattccc gaagaagaga 300
tttcaagcag ctcatctgct gttggaaacc tatcaatgga aacactggag aaaggaatgc 360
tcactccaaa gagcaacgta tggagttttg gaatttttct tctggagcta cttactggaa 420
gaaagaatct tgatagccgt caccccaagg aagagaggaa tttagtcaag tggagccggc 480
ctttcttagc cgataactac cgtctgtcgt tgatcatgga tcctcaactc aaaggccgct 540
ttccttctaa agcagcaaga acaatagctg atattgcaca aagatgcctt caaaaggagc 600
catcagacag acctaccatg aggactgttg ttgagcatct caagataata caggatttga 660
aatattcgtg ccggttccct ctgcaagaac cagcatcaaa ctctggaaaa catatgtcaa 720
gatcaccaag tctcaatggc atcatctgcc ctgcaccaag ggtgagttt 769
<210>219
<211>1150
<212>DNA
<213>马铃薯
<400>219
ttcttagctc atcgaaacgt taaaccttac aatacttcaa acatcgatca atacaatttg 60
ctgaagcacg caatttttca aggactgtat aaacaacaaa gatgggttgt ttcacagttt 120
taaaaagtaa gaagaagaag tctgaacaga gtattcacat caaacgtgtg aatcctcagg 180
aacattctcc tactgcattg cccgagcctc aagtgcagac acggtcgttg cagtcggcac 240
ctccaagttt tagaactaga gtaaaacctg tacagtcgag taatagagtt acaagcagta 300
gggcgcgggc actctctgcc ccatctagcc tggactcagc agaacaagat gtagcatcaa 360
atgaatgtga ggaacatgat gagttcaaga gtcgtattgg ttcaatcaag gagtaccaat 420
caccaagtcc tcagcctctt cctcttccat ctccacagag tgccgctgcc actctcaaga 480
ctatgggaag ctttaaagtt ggcaacgcca gcggtccgtt aaatgcctct ggacccctgc 540
cactgcctcc tacactgcct tcaacattgc cttctactgg agcactcagg aacttctcat 600
ttgaagaact tgctgctgcc tgccaccgct tctctcctga acggtgtatg tcagaaggtc 660
tctcttctgt tatttacaga gcttcttttg gagatgatgc aactggtaca aagaagcttg 720
aagccactgt aacccggctt catccttctt cgcaggggtt gaaggaattt gtgactgagg 780
tgaacacact agcttctttg caacatccat cactttgtaa actgattggt ttccatgcca 840
cggggaaggt tccgagcaca gaatgttggt ttatgaaagg ctttttcatg gaagcttaga 900
ccggcttttg tttgggaggt ccgatggtcc cccgatagac tggaatgctc gaacgaaaat 960
tgctttatgt gctgctcaag gtctcacatt cctgcatgag gaaggacctt ttcaggcaat 1020
gttccatgaa ttttccactg caaatataca aattgataag gattgcagtg caaagctctc 1080
gggatatgga tgcattactc ctataccaga gacagacata tcatgcagtt cagctgccct 1140
ggcaatctct 1150
<210>220
<211>910
<212>DNA
<213>番茄
<400>220
catggaagct tacaccggct tttatttggg aggtcggatg gtcccccaat agactggaat 60
gctcgaataa aaattgcttt atgtgctgct caaggtctca cattcctgca tgaggaagga 120
ccttttcagg caatgttcca tgaattttcc actgcaaata tacaaattga taaggattgc 180
agtgcaaagc tctcgggata tggatgcatt actcatatac aagagacaga catatcatgc 240
agttcagctg ccctggcaaa tctctctgag gagactctgg agcgaggatt ggtaactcca 300
aagagtaatg tttggagttt tgggattgtt cttcttgagc tgctgactgg ccggaagaat 360
ttaagcagtc ggcatccaaa ggaagagagg aatttagtga agtggagcaa gctttttcta 420
gctgatgaca gtagattatc gctaatcatg gaccctcagt taaaaggtcg gttccctgcc 480
aaagcagcaa gaactgtggc tgatattgct caaagatgtc tgcaaaagga tccatctgaa 540
aggcccacca tgagaactgt agtggagcaa ctcaagactg tacaagttat gaagtaccct 600
tctcggtttc ctcttcaaga gccaagggca gttggtgtaa aacacatgtc aaagtgtccg 660
agcctaaatg gaattattac cccaacatca agattgagct tctccccttc accaccaacc 720
caccctatat ctatttctcc gacaaggaca gctgctccac tgctgtctct accttcatgt 780
tcctccatcc tctctatgga ggactttgat cgattggaaa atcgaaggcc atcatcttca 840
tctgttcgga ggtctagtgt cgaaggattt tgatcgattg tagagcactt ttttcttcaa 900
attgcttttc 910
<210>221
<211>681
<212>DNA
<213>番茄
<400>221
gagaggcttt ttcatggaag cttagacaga cttttgttcg gaagatcaga tggcccctct 60
atagattgga atgcgagaac caaaattgcc ctatgtgctg cacaaggtct tacatttcta 120
catgaggagg gaccttttca ggcaatgttc caagaatttt caactggaaa tatacaaatc 180
gacaaggatt ttagtgcaaa gctctcgggg tatggatgca ttacgaatat acaagagacg 240
gagatatctt gcaattcaat cgccctggcg aatctctcac aggagacact ggagagaggg 300
ttgataactc ctaagagcaa tgtttggagt ttcgggattg ttcttttaga actgctcact 360
ggccggaaga atcttgatgg tcggtattca aaggaagaga ggaatctagt caagtggagt 420
aggcctttcc ttgctgatga tggtagatta tcgcttatca tggatcctca gcttaaagga 480
cggtttcccg caaaagcagc ccgtacagtg gctgatattg cccaaagatg cctgcaaaag 540
gatccatctg aaaggcccac catgagaact atcttggacc aactcaaatc cgtacaagtg 600
atgaagtgcc cttcacggtt tcctctgcaa gaaccagcgg ttgttggtgg taaacacatg 660
tcaaagtctc caagcatgaa t 681
<210>222
<211>741
<212>DNA
<213>普通小麦
<400>222
tttcctccca aggctgctag gactgtggca gacatcattc tgaagtgcct tcatagggat 60
ccatccgaaa ggcctacgat gagggccgtc gtggagtctc tagcaagcgt ccaggacata 120
aaggtcccct gccggtatcc tcttcaagta ccgtccgccg caccgaggaa agtgatgcta 180
aaatccacga gtctcaacgg cattgttcct cagcatcctg tcatgacctt ctcgccgtcg 240
cctccttcgc gcaaccagca cctggtgtca ccgagatcat cgacgtctgc gctgcttccc 300
ccaaggaact gctcttccac catcaccctg gactacccca gggtaagctc ggtcaagaaa 360
tcgcccccca acatcatgcg gagacctggc gtcgagggtt tttgattgtc catatagtgt 420
cggattttct tctctttgcc ttgatttatt tgttgttttg gttagcctag cgagtgatct 480
cagtgctatg ggatatacta tgttgcaagg acatgtgaaa aagggcagag tgaagcgtag 540
atagtagaac cagcttgtag atacttgtcg ttctctgatt ggatgggggt catggaagaa 600
gtgtgtgttg agtggggctt gtaaccccac tatgcaataa acgtgggttg gttggtcggt 660
cggtatttgc tcgccgtcaa acatttcagc tgtttctttc ttctcttgaa tgctaagttt 720
tgttgctgct agtcgtggaa t 741
<210>223
<211>2039
212>DNA
<213>玉蜀黍
<400>223
ctcccccggc gtgcgctccc tcctgtctct cttggcgacg actgggcaac ggtcgcagct 60
gtatgttcga gcccttcgcc gacgacgttc accaccagga attttctcag ctgtgccaat 120
gatgggttgc ttcactgttc tcagatccaa gaagaagaaa agccattttg ataatcctct 180
tgtcccaagc aagaaatcag ttgatgcaag ggaaagtacg tcctctagac ttccggagcc 240
agaagttcat gtgccatctt tgcaatcagc tcctcctagt tttaggaaca gggtcaagat 300
atccgagtca tcaaatgaag tttcaaacag aaacagcagg gctcgcgtgc tgtctgctcc 360
atcagccctt attgtggttg atcagtttgg ctttccatat tcggaatacc gagatcaaga 420
tgactccagg gataaggaag gtttgacaaa ggggcatcgc ttttcaaatc ctttgcccct 480
tcctcttcct tcacgcgaag gacattcttt taggaactct ggtagcttca aagccagcaa 540
cgtaagcggg ccattggaga tgtctggccc tctcccattg cctctaaaga aatgtgatgg 600
acttagaatc ttctcttatg aggagatttc atctgcctgc caacgatttt ctagtgatca 660
gtgtgtttca gaaacacttg gttcaacatc atacaaggca acatttagag atgaatttat 720
tgatacgagg accactgaag caacagtagc tcgattactc ccctccactc agagtttgaa 780
ggagtttaaa acgcaagcga ccacattggc atcgcttcag catcccaatt tatgtaaact 840
gattggctat tatgcaaaag aagattctaa tgaaaggatg ttggtctatg aacggcttta 900
tcatggaagc ttagataagc tactctttgg aagatcagat ggtcgtttca tggactggtc 960
taaacgtttg aaggttgccc tgggtgctgc cagaggtcta gctttcttgc atgatgaagg 1020
accctttcag gccatgtaca gcgagttctc aactttgaac atccaaatag ataaaggttt 1080
cactgctaag ctttcaggat atggttgtgt tggcttcaat accgaggaga tatctaatgc 1140
acctgtgtct gcagcaaacc tttcggtgga gaccttggag aagggtttac tcactcccaa 1200
gagcaacgtc tggagctttg gagtcgtgtt actggagcta ataactggaa ggaagaacct 1260
tgatcccaat tattccaaag aagaacgcaa tattgtcaac tggagtaggc ctttccttac 1320
tgatgacagt cgcttgtctc ttatcatgga ctcccgtata aaagggcgct ttcccactaa 1380
ggctgctcgg atagtagcag acatcatttt gaaatgcctg cgtaaggatc catcggagag 1440
gcctaccatg agggatgttg tggaggccct agcaagagtc caggaaataa aggttccgtg 1500
cagatatcct ctgcaagaac cttctgctgc accaagaaaa gtgatgttga aatctacatc 1560
cctcaatggg attgtgcctc accatcctgt cataaccttc tctccatcgc cgccttcaca 1620
taaccagcac ttgatttcac caaggtcgtc gacatctgcc ttgtttcatc caagggcatg 1680
ctcttctacc ctggacgatc cgagtgtaag ttctataaag aaaacaccac ctattatgcg 1740
aaggtctagc gtcgaaggct tttgattgtc catattgttc ctttatttcc ttttcttgga 1800
tttatttgtt tctttgttag tagtgtagcg gtttttagct gtgttctgta ttgtaagaca 1860
agtggcctca tatgtagtgc ccttgggtct ggagtaaagc agaacaggat gaattgtaaa 1920
taggaccagg ttgtagatac cttttttttg tgctcgaatt gggtggaagc agcgtgccga 1980
gtgggccttg taacctcata atgcaataaa ctccgtttcc cagtttctgt aaaaaaaaa 2039
<210>224
<211>768
<212>DNA
<213>莴苣(Lactuca sativa)
<400>224
accgactgat ggccgctagt cggggaagaa cacgaagaat ccaaaacccg tggcagcggc 60
ggaggcggag gcgggttgcc gcctgtcccg cagccgctgc cgcttcctgc accgcattca 120
cgccaacttc gaaaaccatc gcggaatgct tttaaagatt gagtggcggt gagttgggca 180
tgctgccagc ctcttaatac ttccggaccc tctgccactt ccgccatcgg gaaccaccca 240
tcttccgcca atgattccgg catctttacc gacatctgga acacttaaga acttcacata 300
ttgaagaaat cgcagctgct tgccacaaca ttttcaccct gacagatgcg tgtctgaagg 360
tctttcttct gttatgtata gagcttcttt tggagaagat acttctaatt taaagaatct 420
tcaagccact gttaccagtc tccatccttc aactcagggt ttgaaggaat ttgtgagtga 480
agtgaacacg ctagcatcat tgcaacaccc ttatctctgt aaatagattg gtttccatgc 540
gcgtgaggga tctgatagaa gaatgttggt ttacgagagg ctttttcatg gaagcttaga 600
tcggctttta tatggtacaa cagatggccc acctattgat tgcaatgcaa gaatgaaagt 660
cgcactctgt gctgctcaag ggcttacttt tttgcatgag gaaggaccat ttcaggcgat 720
gtttcatgaa ttttccactg ctaatataca aattgataaa gattttag 768
<210>225
<211>1637
<212>DNA
<213>棉属某种(Gossypium spp.)
<400>225
ctttttcctc tcaaacctct ctcacactga taaacttttc tctccattac ctttctttga 60
cttgcaaagt tgttctcctc aaactaacca aacaagggat tctgggtttt cagctttctc 120
tgttttccta ctctctttcg cctttgcatg acctgcttac atagaaacat aaaagtccga 180
aatacaattt aggtggtttg tatataagat ggggtgtttt acagttttga gaagcaacaa 240
gaaaaagtcc aaacagtcag tttttgttaa acacattgct cataaagagc atattcctac 300
catgctgcct gagccccaaa ttcagacacg atcactgcaa tctgcacccc caagttttat 360
aaccagagta aaaccaattc aatctaataa caaggcaagc tgcaatagga cacgtgcatt 420
atctgctccg tcaagtcttg atgctgctga gcaagatgac cttgcgtcag ttgaatttga 480
agaacaagaa gagttgaaga gtcgtgttgg tttagtcaag gaacagaagt catcaagtcc 540
acagcctctt ccacttccat ctccccacag tactgcgctg aagacaatgg gaagttttaa 600
agcagggaat gttagtggcc ctctttttgc ttcgggacca ttacccctgc ctccctctgg 660
aacactacgt aacttcgcct acgaagaaat tgcagctgct tgccatcatt tctcttctga 720
tcgatgcaca tctgagggtc tatcttctgt tatgtacaag gcatccttcg gagatgacac 780
atcaagttca aagaagtttg aagctactgt tactcgcctt cacccatcca ctcagggttt 840
aagggaattt ataaacgaag taaacactct tgcatcattg caacatccaa atctctgtaa 900
attgcttggg taccatgcac gtgataattc agaacaacga atgttggtct atgagaggtt 960
atttcatgga agcttagacc ggcttttata cgggagatcg gatggaccgc cacttgattg 1020
gaatactcgc atgaaaattg ctttatgttc tgcacagggt cttactttct tgcatgagga 1080
aggaccattt caggcaatgt acaatgaatt ttcgactgcc aacatacaga tcgacaagga 1140
tttcagtgca aagctctcag gatatgggtg cgttggtcat atcccagaga cagaagagat 1200
ctccagtaat tcagttgctg tggcaaatat atccgtagag actctggaga gagggcgact 1260
aactccaaag agcaatgttt ggagttttgg gatcattcta cttgaattac tcactggccg 1320
gaagaacctt gacaaccgtt atcccaagga agagaggaac ctagtgaagt ggagccggcc 1380
attcctagcc gacaattgta gattgtcact catcatggat cctcagctca aaggtcgctt 1440
tcctatgaaa gctgcccgta cggtggctga cattgcacaa aggtgtctcc agatggaccc 1500
atcagagagg ccaaccatga gaaccatcgt tgagcatctc aaaatcatcc aagacctgaa 1560
atactcttgt cggtttcctc tgcaagatcc agcagcaatt gctggaaaac agatgtcaag 1620
gtcaccgagt ctcaacg 1637
<210>226
<211>2193
<212>DNA
<213>稻
<400>226
aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct 60
aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact 120
catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt 180
tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc 240
tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata 300
aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga 360
atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt 420
ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat 480
ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag 540
gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt 600
tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc 660
tgaattcaag cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat 720
aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa 780
aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca 840
acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag 900
tccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa 960
aaccaagcat cctcctcctc ccatctataa attcctcccc ccttttcccc tctctatata 1020
ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag 1080
cgaccgcctt cttcgatcca tatcttccgg tcgagttctt ggtcgatctc ttccctcctc 1140
cacctcctcc tcacagggta tgtgcccttc ggttgttctt ggatttattg ttctaggttg 1200
tgtagtacgg gcgttgatgt taggaaaggg gatctgtatc tgtgatgatt cctgttcttg 1260
gatttgggat agaggggttc ttgatgttgc atgttatcgg ttcggtttga ttagtagtat 1320
ggttttcaat cgtctggaga gctctatgga aatgaaatgg tttagggtac ggaatcttgc 1380
gattttgtga gtaccttttg tttgaggtaa aatcagagca ccggtgattt tgcttggtgt 1440
aataaaagta cggttgtttg gtcctcgatt ctggtagtga tgcttctcga tttgacgaag 1500
ctatcctttg tttattccct attgaacaaa aataatccaa ctttgaagac ggtcccgttg 1560
atgagattga atgattgatt cttaagcctg tccaaaattt cgcagctggc ttgtttagat 1620
acagtagtcc ccatcacgaa attcatggaa acagttataa tcctcaggaa caggggattc 1680
cctgttcttc cgatttgctt tagtcccaga attttttttc ccaaatatct taaaaagtca 1740
ctttctggtt cagttcaatg aattgattgc tacaaataat gcttttatag cgttatccta 1800
gctgtagttc agttaatagg taatacccct atagtttagt caggagaaga acttatccga 1860
tttctgatct ccatttttaa ttatatgaaa tgaactgtag cataagcagt attcatttgg 1920
attatttttt ttattagctc tcaccccttc attattctga gctgaaagtc tggcatgaac 1980
tgtcctcaat tttgttttca aattcacatc gattatctat gcattatcct cttgtatcta 2040
cctgtagaag tttctttttg gttattcctt gactgcttga ttacagaaag aaatttatga 2100
agctgtaatc gggatagtta tactgcttgt tcttatgatt catttccttt gtgcagttct 2160
tggtgtagct tgccactttc accagcaaag ttc 2193
<210>227
<211>56
<212>DNA
<213>人工序列
<220>
<223>引物:prm06729
<400>227
ggggacaagt ttgtacaaaa aagcaggctt aaacaatgat gggttgcttc actgtc 56
<210>228
<211>50
<212>DNA
<213>人工序列
<220>
<223>物:prm06730
<400>228
ggggaccact ttgtacaaga aagctgggta tggacaatca aaaaccctca 50
<210>229
<211>1176
<212>DNA
<213>拟南芥
<400>229
cttcaactgc tgcgtctagc tgtccttcct tcttcatttg cttcttcttc tctagctcag 60
cgcggatcgc tgcagtagta ccctgacgta gcctttcttc ttcctttact ttctcatctt 120
ctatctctca aaagaaaagc agacaacttt atttgcaaaa acagagtttt tttttcttat 180
cttgagaaag ttcaacagaa gatgatgttc gagaaagacg atctgggtct aagcttaggc 240
ttgaattttc caaagaaaca gatcaatctc aaatcaaatc catctgtttc tgttactcct 300
tcttcttctt cttttggatt attcagaaga tcttcatgga acgagagttt tacttcttca 360
gttccaaact cagattcgtc acaaaaagaa acaagaactt tcatccgagg aatcgacgtg 420
aacagaccac cgtctacagc ggaatacggc gacgaagacg ctggagtatc ttcacctaac 480
agtacagtct caagctctac agggaaaaga agcgagagag aagaagacac agatccacaa 540
ggctcaagag gaatcagtga cgatgaagat ggtgataact ccaggaaaaa gcttagactt 600
tccaaagatc aatctgctat tcttgaagag accttcaaag atcacagtac tctcaatccg 660
aagcagaagc aagcattggc taaacaatta gggttacgag caagacaagt ggaagtttgg 720
tttcagaaca gacgagcaag aacaaagctg aagcaaacgg aggtagactg cgagttctta 780
cggagatgct gcgagaatct aacggaagag aaccgtcggc tacaaaaaga agtaacggaa 840
ttgagagtac ttaagctctc tcctcagttc tacatgcaca tgagcccacc cactactttg 900
accatgtgcc cttcatgtga acacgtgtcg gtcccgccac cacaacctca ggctgctacg 960
tcagcgcacc accggtcgtt gccggtcaat gcgtgggctc ctgctacgag gatatctcac 1020
ggcttgactt ttgacgctct tcgtcctagg tcctaagtct ttttacttgc aaccaaaggg 1080
cattttggtc gttttttaag tttcatggac cagatatgca tgtagttgtt aacatgtatg 1140
tattttctta gaaagaaaga aaaacagattaatatt 1176
<210>230
<211>284
<212>PRT
<213>拟南芥
<400>230
Met Met Phe Glu Lys Asp Asp Leu Gly Leu Ser Leu Gly Leu Asn Phe
1 5 10 15
Pro Lys Lys Gln Ile Asn Leu Lys Ser Asn Pro Ser Val Ser Val Thr
20 25 30
Pro Ser Ser Ser Ser Phe Gly Leu Phe Arg Arg Ser Ser Trp Asn Glu
35 40 45
Ser Phe Thr Ser Ser Val Pro Asn Ser Asp Ser Ser Gln Lys Glu Thr
50 55 60
Arg Thr Phe Ile Arg Gly Ile Asp Val Asn Arg Pro Pro Ser Thr Ala
65 70 75 80
Glu Tyr Gly Asp Glu Asp Ala Gly Val Ser Ser Pro Asn Ser Thr Val
85 90 95
Ser Ser Ser Thr Gly Lys Arg Ser Glu Arg Glu Glu Asp Thr Asp Pro
100 105 110
Gln Gly Ser Arg Gly Ile Ser Asp Asp Glu Asp Gly Asp Asn Ser Arg
115 120 125
Lys Lys Leu Arg Leu Ser Lys Asp Gln Ser Ala Ile Leu Glu Glu Thr
130 135 140
Phe Lys Asp His Ser Thr Leu Asn Pro Lys Gln Lys Gln Ala Leu Ala
145 150 155 160
Lys Gln Leu Gly Leu Arg Ala Arg Gln Val Glu Val Trp Phe Gln Asn
165 170 175
Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu Phe
180 185 190
Leu Arg Arg Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg Leu Gln
195 200 205
Lys Glu Val Thr Glu Leu Arg Ala Leu Lys Leu Ser Pro Gln Phe Tyr
210 215 220
Met His Met Ser Pro Pro Thr Thr Leu Thr Met Cys Pro Ser Cys Glu
225 230 235 240
His Val Ser Val Pro Pro Pro Gln Pro Gln Ala Ala Thr Ser Ala His
245 250 255
His Arg Ser Leu Pro Val Asn Ala Trp Ala Pro Ala Thr Arg Ile Ser
260 265 270
His Gly Leu Thr Phe Asp Ala Leu Arg Pro Arg Ser
275 280
<210>231
<211>3171
<212>DNA
<213>拟南芥
<400>231
gacaatccga aattaggtaa ccatgttcat tgaatttatc gtttcaacac attcgaatca 60
ctgagtccta cgtttcagtt taattccctg atgcacattt tgaattcggt ttgcgtattg 120
gtcttcgagt tttccgtcgg cggccatgga cgcgttcaag gaggagatag aaatcgggag 180
ctcggtggag tctttaatgg agctattgga ttcgcagaag gtgctttttc atagccagat 240
cgatcagctc caagatgtcg tcgttgcgca atgcaaactt accggcgtta atccccttgc 300
gcaagaaatg gctgctggtg ctttgtccat taaaattgga aagcggccaa gagacttgtt 360
gaatcctaag gctgttaagt atctacaagc agttttcgca attaaagatg ctattagtaa 420
gagggaatct cgggagataa gtgctttatt tggcatcaca gtcgcccagg ttcgagaatt 480
ttttgttact caaaagacaa gagtgaggaa acaggtgagg ctttcaaggg agaaagtagt 540
tatgtccaat acgcatgctt tacaagatga tggtgttccg gaaaataaca atgccacaaa 600
tcatgttgaa cccgttccct tgaactctat acatccggag gcatgttcta taagctgggg 660
tgaaggtgaa acagtggcac ttattccacc tgaagatatt ccacctgaca tcagcgattc 720
agacaaatac tttgttgaga atatattttc tctgctgcgt aaagaggaaa cattttcagg 780
ccaggtgaaa ctaatggagt ggatcatgca gatacaagat gcttctgtgc tgatctggtt 840
tttatcaaaa ggaggggttt tgatacttac aacatggtta agtcaagctg ctagtgaaga 900
gcaaacaagt gtcttacttc ttatcctgaa ggttctttgt catttacctc tccacaaagc 960
atctcctgaa aatatgtctg ccatattaca aagcgttaat ggacttcgtt tctataggat 1020
atcagacata tcaaacaggg caaaaggttt gttatcaagg tggaccaagt tatttgcgaa 1080
aatccaagct atgaagaaac aaaatcgtaa cagttcgcaa attgattcgc agagtcaatt 1140
gcttctgaaa cagagtattg ctgaaatcat gggtgatagt agcaatcctg aagatattct 1200
tagtctctca aatggaaagt cagagaatgt caggaggatt gaatcgtcac agggtccaaa 1260
actgttgctt acttctgcag atgattccac caagaaacac atgcttggtt caaatccatc 1320
gtataacaaa gaacgcagga aagtacagat ggtggaacaa ccaggccaaa aagctgctgg 1380
aaagagtccg cagacagtaa gaataggaac ttcaggtcga agccgcccaa tgtctgctga 1440
tgatattcag aaagcaaaga tgcgtgccct ttatatgcag agcaagaaca gtaaaaagga 1500
tcctttacca agtgccattg gtgattcgaa aatcgttgct cctgagaagc ccttggctct 1560
tcattcagcc aaggattctc cacctattca gaacaatgaa gctaagactg aagacacacc 1620
tgtactctcg actgttcagc ccgtcaatgg attttcaact attcagcccg tcaatggacc 1680
ttcagctgtt cagcccgtca atggaccttt ggctgttcag cctgtcaatg gaccttcggc 1740
tcttcagccc gtcaatggac cttcggccgt aattgtcccg gtacaagctg atgaaattaa 1800
aaaaccttca acacctccta aaagcatttc tagtaaggtg ggagttatga tgaaaatgag 1860
ttcacaaact attctcaaga attgcaagag aaaacagatt gattggcatg taccaccagg 1920
aatggaactt gacgaactct ggagagtagc cgctggtggt aatagcaagg aggctgatgt 1980
tcagagaaac agaaaccggc gagaaagaga aacaacatat cagtctcttc aaactatacc 2040
gttgaaccct aaagaaccat gggataggga aatggactat gatgacagtt tgacccctga 2100
aattccatct caacagccac cagaagaaag tttaacggaa ccacaggatt cacttgatga 2160
acgaagaatt gctgctggtg ctgccacaac ctcttcatct ctaagcagtc ctgaacctga 2220
tctcgagtta ttagctgcgt tacttaagaa cccagatctt gtttatgcac taacttcggg 2280
aaaacccagt aatttagccg gccaagatat ggtaaaactg cttgatgtga ttaagactgg 2340
tgcaccaaac tcaagcagta gctcaaataa acaggttgaa gaaagggtcg aagtttccct 2400
tccatctccc actccatcaa ctaatcctgg aatgagtgga tggggacaag aagggattcg 2460
gaatccattt tcaaggcaaa accaagttgg tactgcagtt gctagatcgg gtacacagct 2520
tcgtgttggt tcaatgcaat ggcatcaaac aaatgaacaa tcaatcccac gacatgctcc 2580
atcagcatac agtaactcga tcacattggc tcacacagaa agagaacagc aacaatatat 2640
gcaaccaaaa cttcatcaca atttacattt tcaacaacaa caacaacaac caatctcaac 2700
aacctcgtat gcagttaggg aaccagtagg acaaatggga acaggtacat cgagttcatg 2760
gaggagtcag cagagtcaga acagttacta ctcacatcaa gaaaacgaga ttgcatcggc 2820
ttcacaagtt acttcatacc aagggaatag ccagtacatg agtagcaatc caggatatga 2880
atcatggagt cctgataata gcccaagtag gaaccagctt aacatgaggg gacaacaaca 2940
acaagcatca aggaaacatg attcttctac tcatccatat tggaaccaaa acaaaagatg 3000
gcgttaaacc atatataaga ctatggttct ttggtcctca atatttgctt gtcatggttg 3060
aattagcatt atactctgtt cagacacaga ttttcatttt taactcacaa cagattcatc 3120
agagataata aactaaaaga aagaatgaat ggataaagtt attactgtct c 3171
<210>232
<211>953
<212>PRT
<213>拟南芥
<400>232
Met Asp Ala Phe Lys Glu Glu Ile Glu Ile Gly Ser Ser Val Glu Ser
1 5 10 15
Leu Met Glu Leu Leu Asp Ser Gln Lys Val Leu Phe His Ser Gln Ile
20 25 30
Asp Gln Leu Gln Asp Val Val Val Ala Gln Cys Lys Leu Thr Gly Val
35 40 45
Asn Pro Leu Ala Gln Glu Met Ala Ala Gly Ala Leu Ser Ile Lys Ile
50 55 60
Gly Lys Arg Pro Arg Asp Leu Leu Asn Pro Lys Ala Val Lys Tyr Leu
65 70 75 80
Gln Ala Val Phe Ala Ile Lys Asp Ala Ile Ser Lys Arg Glu Ser Arg
85 90 95
Glu Ile Ser Ala Leu Phe Gly Ile Thr Val Ala Gln Val Arg Glu Phe
100 105 110
Phe Val Thr Gln Lys Thr Arg Val Arg Lys Gln Val Arg Leu Ser Arg
115 120 125
Glu Lys Val Val Met Ser Asn Thr His Ala Leu Gln Asp Asp Gly Val
130 135 140
Pro Glu Asn Asn Asn Ala Thr Asn His Val Glu Pro Val Pro Leu Asn
145 150 155 160
Ser Ile His Pro Glu Ala Cys Ser Ile Ser Trp Gly Glu Gly Glu Thr
165 170 175
Val Ala Leu Ile Pro Pro Glu Asp Ile Pro Pro Asp Ile Ser Asp Ser
180 185 190
Asp Lys Tyr Phe Val Glu Asn Ile Phe Ser Leu Leu Arg Lys Glu Glu
195 200 205
Thr Phe Ser Gly Gln Val Lys Leu Met Glu Trp Ile Met Gln Ile Gln
210 215 220
Asp Ala Ser Val Leu Ile Trp Phe Leu Ser Lys Gly Gly Val Leu Ile
225 230 235 240
Leu Thr Thr Trp Leu Ser Gln Ala Ala Ser Glu Glu Gln Thr Ser Val
245 250 255
Leu Leu Leu Ile Leu Lys Val Leu Cys His Leu Pro Leu His Lys Ala
260 265 270
Ser Pro Glu Asn Met Ser Ala Ile Leu Gln Ser Val Asn Gly Leu Arg
275 280 285
Phe Tyr Arg Ile Ser Asp Ile Ser Asn Arg Ala Lys Gly Leu Leu Ser
290 295 300
Arg Trp Thr Lys Leu Phe Ala Lys Ile Gln Ala Met Lys Lys Gln Asn
305 310 315 320
Arg Asn Ser Ser Gln Ile Asp Ser Gln Ser Gln Leu Leu Leu Lys Gln
325 330 335
Ser Ile Ala Glu Ile Met Gly Asp Ser Ser Asn Pro Glu Asp Ile Leu
340 345 350
Ser Leu Ser Asn Gly Lys Ser Glu Asn Val Arg Arg Ile Glu Ser Ser
355 360 365
Gln Gly Pro Lys Leu Leu Leu Thr Ser Ala Asp Asp Ser Thr Lys Lys
370 375 380
His Met Leu Gly Ser Asn Pro Ser Tyr Asn Lys Glu Arg Arg Lys Val
385 390 395 400
Gln Met Val Glu Gln Pro Gly Gln Lys Ala Ala Gly Lys Ser Pro Gln
405 410 415
Thr Val Arg Ile Gly Thr Ser Gly Arg Ser Arg Pro Met Ser Ala Asp
420 425 430
Asp Ile Gln Lys Ala Lys Met Arg Ala Leu Tyr Met Gln Ser Lys Asn
435 440 445
Ser Lys Lys Asp Pro Leu Pro Ser Ala Ile Gly Asp Ser Lys Ile Val
450 455 460
Ala Pro Glu Lys Pro Leu Ala Leu His Ser Ala Lys Asp Ser Pro Pro
465 470 475 480
Ile Gln Asn Asn Glu Ala Lys Thr Glu Asp Thr Pro Val Leu Ser Thr
485 490 495
Val Gln Pro Val Asn Gly Phe Ser Thr Ile Gln Pro Val Asn Gly Pro
500 505 510
Ser Ala Val Gln Pro Val Asn Gly Pro Leu Ala Val Gln Pro Val Asn
515 520 525
Gly Pro Ser Ala Leu Gln Pro Val Asn Gly Pro Ser Ala Val Ile Val
530 535 540
Pro Val Gln Ala Asp Glu Ile Lys Lys Pro Ser Thr Pro Pro Lys Ser
545 550 555 560
Ile Ser Ser Lys Val Gly Val Met Met Lys Met Ser Ser Gln Thr Ile
565 570 575
Leu Lys Asn Cys Lys Arg Lys Gln Ile Asp Trp His Val Pro Pro Gly
580 585 590
Met Glu Leu Asp Glu Leu Trp Arg Val Ala Ala Gly Gly Asn Ser Lys
595 600 605
Glu Ala Asp Val Gln Arg Asn Arg Asn Arg Arg Glu Arg Glu Thr Thr
610 615 620
Tyr Gln Ser Leu Gln Thr Ile Pro Leu Asn Pro Lys Glu Pro Trp Asp
625 630 635 640
Arg Glu Met Asp Tyr Asp Asp Ser Leu Thr Pro Glu Ile Pro Ser Gln
645 650 655
Gln Pro Pro Glu Glu Ser Leu Thr Glu Pro Gln Asp Ser Leu Asp Glu
660 665 670
Arg Arg Ile Ala Ala Gly Ala Ala Thr Thr Ser Ser Ser Leu Ser Ser
675 680 685
Pro Glu Pro Asp Leu Glu Leu Leu Ala Ala Leu Leu Lys Asn Pro Asp
690 695 700
Leu Val Tyr Ala Leu Thr Ser Gly Lys Pro Ser Asn Leu Ala Gly Gln
705 710 715 720
Asp Met Val Lys Leu Leu Asp Val Ile Lys Thr Gly Ala Pro Asn Ser
725 730 735
Ser Ser Ser Ser Asn Lys Gln Val Glu Glu Arg Val Glu Val Ser Leu
740 745 750
Pro Ser Pro Thr Pro Ser Thr Asn Pro Gly Met Ser Gly Trp Gly Gln
755 760 765
Glu Gly Ile Arg Asn Pro Phe Ser Arg Gln Asn Gln Val Gly Thr Ala
770 775 780
Val Ala Arg Ser Gly Thr Gln Leu Arg Val Gly Ser Met Gln Trp His
785 790 795 800
Gln Thr Asn Glu Gln Ser Ile Pro Arg His Ala Pro Ser Ala Tyr Ser
805 810 815
Asn Ser Ile Thr Leu Ala His Thr Glu Arg Glu Gln Gln Gln Tyr Met
820 825 830
Gln Pro Lys Leu His His Asn Leu His Phe Gln Gln Gln Gln Gln Gln
835 840 845
Pro Ile Ser Thr Thr Ser Tyr Ala Val Arg Glu Pro Val Gly Gln Met
850 855 860
Gly Thr Gly Thr Ser Ser Ser Trp Arg Ser Gln Gln Ser Gln Asn Ser
865 870 875 880
Tyr Tyr Ser His Gln Glu Asn Glu Ile Ala Ser Ala Ser Gln Val Thr
885 890 895
Ser Tyr Gln Gly Asn Ser Gln Tyr Met Ser Ser Asn Pro Gly Tyr Glu
900 905 910
Ser Trp Ser Pro Asp Asn Ser Pro Ser Arg Asn Gln Leu Asn Met Arg
915 920 925
Gly Gln Gln Gln Gln Ala Ser Arg Lys His Asp Ser Ser Thr His Pro
930 935 940
Tyr Trp Asn Gln Asn Lys Arg Trp Arg
945 950
<210>233
<211>501
<212>DNA
<213>稻
<400>233
atggagcagc agcttcctct tcttgcacct gactctaagg ctgccacgtc gtcccccttg 60
tgcctcacct tggacaaccc aacctccaca tccacctcgc cggcggtgcc gtcgtcggcg 120
ccgccgccgg cagccgcctt ggaaccttct agacaatctt tccatgagag ggaaacggat 180
gcaatcaaag ccaagatcat gtcgcacccc ctctacccgg ctctcctcag agccttcata 240
gattgccaga aggtcggagc tccgccggag gtcgtcggcc ggctttccgc cctcgccggc 300
gagctcgact cgcgtgcaga agacaggtac cttcaagggc agtcgtcaga cccggagctc 360
gacgagttta tggaaaccta cattgatatg ctggtgagct acaggcagga gctgacaaga 420
ccaattcaag aggccgacca gttcttcaga aacatggagg cacagatcga ctcgtttaca 480
ctagagatgt gcagtttctg a 501
<210>234
<211>166
<212>PRT
<213>稻
<400>234
Met Glu Gln Gln Leu Pro Leu Leu Ala Pro Asp Ser Lys Ala Ala Thr
1 5 10 15
Ser Ser Pro Leu Cys Leu Thr Leu Asp Asn Pro Thr Ser Thr Ser Thr
20 25 30
Ser Pro Ala Val Pro Ser Ser Ala Pro Pro Pro Ala Ala Ala Leu Glu
35 40 45
Pro Ser Arg Gln Ser Phe His Glu Arg Glu Thr Asp Ala Ile Lys Ala
50 55 60
Lys Ile Met Ser His Pro Leu Tyr Pro Ala Leu Leu Arg Ala Phe Ile
65 70 75 80
Asp Cys Gln Lys Val Gly Ala Pro Pro Glu Val Val Gly Arg Leu Ser
85 90 95
Ala Leu Ala Gly Glu Leu Asp Ser Arg Ala Glu Asp Arg Tyr Leu Gln
100 105 110
Gly Gln Ser Ser Asp Pro Glu Leu Asp Glu Phe Met Glu Thr Tyr Ile
115 120 125
Asp Met Leu Val Ser Tyr Arg Gln Glu Leu Thr Arg Pro Ile Gln Glu
130 135 140
Ala Asp Gln Phe Phe Arg Asn Met Glu Ala Gln Ile Asp Ser Phe Thr
145 150 155 160
Leu Glu Met Cys Ser Phe
165
<210>235
<211>879
<212>DNA
<213>稻
<400>235
atggctcagg aggacgtcgg tcacctgagc gacgccggcc tggcgctggg cctgtccctc 60
ggcgggggag gaggagggac gaccgacgcg gcggcggcgc accgtggcgg ctgccggcgg 120
ccgtcgccgt cgtcgcagtg cccgccgctg gagccgtcgc tgaccctgag cttgcccgac 180
gacgcggcgg ccggcgcggc cgcgaccgcg accgcgaccg cgtccggcgg gggcggccct 240
gcgcacagcg tgtcgtcgct gtccgtcggc gcggcggcgg cggcggccgt gaagagggag 300
cgcgcggagg aggccgacgg cgagagggtg tcgtcgacgg cggccgggcg tgacgacgac 360
gacgacggga gcacccgcaa gaagctccgg ctgaccaagg agcagtccgc gctcctggag 420
gaccgcttcc gggagcacag cacgctcaac ccgaagcaga aagtcgcttt agcgaagcaa 480
ctgaacctca ggccaaggca ggtggaggtc tggttccaaa acagaagagc aaggacaaag 540
ctgaagcaga cggaggtgga ctgcgagttc ctgaagcgct gctgcgagac gctcaccgag 600
gagaaccgtc ggctgcagcg cgagctgcag gagctccgcg cgctcaagtt cgccccgccg 660
ccgccgtcct cggcggccca ccagccgtcg ccggcgccac cggcgccgtt ctacatgcaa 720
ctcccggccg ccacgctcac catctgcccg tcctgcgagc gcgtcggcgg gcccgcgtcc 780
gccgccaagg tcgtcgccgc cgacgggacc aaggccggcc ccggccggac caccacccac 840
cacttcttca accccttcac ccactccgcc gcctgctga 879
<210>236
<211>292
<212>PRT
<213>稻
<400>236
Met Ala Gln Glu Asp Val Gly His Leu Ser Asp Ala Gly Leu Ala Leu
1 5 10 15
Gly Leu Ser Leu Gly Gly Gly Gly Gly Gly Thr Thr Asp Ala Ala Ala
20 25 30
Ala His Arg Gly Gly Cys Arg Arg Pro Ser Pro Ser Ser Gln Cys Pro
35 40 45
Pro Leu Glu Pro Ser Leu Thr Leu Ser Leu Pro Asp Asp Ala Ala Ala
50 55 60
Gly Ala Ala Ala Thr Ala Thr Ala Thr Ala Ser Gly Gly Gly Gly Pro
65 70 75 80
Ala His Ser Val Ser Ser Leu Ser Val Gly Ala Ala Ala Ala Ala Ala
85 90 95
Val Lys Arg Glu Arg Ala Glu Glu Ala Asp Gly Glu Arg Val Ser Ser
100 105 110
Thr Ala Ala Gly Arg Asp Asp Asp Asp Asp Gly Ser Thr Arg Lys Lys
115 120 125
Leu Arg Leu Thr Lys Glu Gln Ser Ala Leu Leu Glu Asp Arg Phe Arg
130 135 140
Glu His Ser Thr Leu Asn Pro Lys Gln Lys Val Ala Leu Ala Lys Gln
145 150 155 160
Leu Asn Leu Arg Pro Arg Gln Val Glu ValTrp Phe Gln Asn Arg Arg
165 170 175
Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu Phe Leu Lys
180 185 190
Arg Cys Cys Glu Thr Leu Thr Glu Glu Asn Arg Arg Leu Gln Arg Glu
195 200 205
Leu Gln Glu Leu Arg Ala Leu Lys Phe Ala Pro Pro Pro Pro Ser Ser
210 215 220
Ala Ala His Gln Pro Ser Pro Ala Pro Pro Ala Pro Phe Tyr Met Gln
225 230 235 240
Leu Pro Ala Ala Thr Leu Thr Ile Cys Pro Ser Cys Glu Arg Val Gly
245 250 255
Gly Pro Ala Ser Ala Ala Lys Val Val Ala Ala Asp Gly Thr Lys Ala
260 265 270
Gly Pro Gly Arg Thr Thr Thr His His Phe Phe Asn Pro Phe Thr His
275 280 285
Ser Ala Ala Cys
290
<210>237
<211>744
<212>DNA
<213>稻
<400>237
atggcgcaag atgatgagga cgtgggtcta gctctgggcc tctccctggg ctccggcggc 60
cacaggcggc agagagaaag tagagacgaa gcgccgtcgt cggcggcggc gtccctgctg 120
acgctgaggc tcccggcaga gagcgggggg cagccgcagg tggtggtgaa gagggaggtg 180
gtgcgggcgg aagaggagga gtacgaatac gagtacgaga gggcgctcta ctcgtcgtcg 240
gctgcggcgg cggacgacga cgagggctgc aacagccgga agaagctgag gctgagcaag 300
gagcagtcgg ctctgctgga ggatcgcttc aaggagcata gcactctcaa ccctaagcaa 360
aaggttgctt tggcgaagca gctaaacctg aggccaaggc aagttgaggt gtggttccaa 420
aacagaagag ccaggacgaa gctgaagcag acggaggtgg attgcgagct tctgaagcgc 480
tgctgcgaga cgctgacgga ggagaaccga cgcctccatc gtgagctcca gcagctcagg 540
gctctgaccc actccaccgc cgccggcttc ttcatggcca ccaccctccc cgtccccgcc 600
gccacgctct ccatctgccc ctcctgcgag cgcctcgcca ccgccgccgc cgccggagct 660
tcccccaccg ccgccgccga ccgcaccaac aagcccaccg ccccgcactt gttcagccct 720
ttcgccaagt ccgccgcctg ctag 744
<210>238
<211>247
<212>PRT
<213>稻
<400>238
Met Ala Gln Asp Asp Glu Asp Val Gly Leu Ala Leu Gly Leu Ser Leu
1 5 10 15
Gly Ser Gly Gly His Arg Arg Gln Arg Glu Ser Arg Asp Glu Ala Pro
20 25 30
Ser Ser Ala Ala Ala Ser Leu Leu Thr Leu Arg Leu Pro Ala Glu Ser
35 40 45
Gly Gly Gln Pro Gln Val Val Val Lys Arg Glu Val Val Arg Ala Glu
50 55 60
Glu Glu Glu Tyr Glu Tyr Glu Tyr Glu Arg Ala Leu Tyr Ser Ser Ser
65 70 75 80
Ala Ala Ala Ala Asp Asp Asp Glu Gly Cys Asn Ser Arg Lys Lys Leu
85 90 95
Arg Leu Ser Lys Glu Gln Ser Ala Leu Leu Glu Asp Arg Phe Lys Glu
100 105 110
His Ser Thr Leu Asn Pro Lys Gln Lys Val Ala Leu Ala Lys Gln Leu
115 120 125
Asn Leu Arg Pro Arg Gln Val Glu Val Trp Phe Gln Asn Arg Arg Ala
130 135 140
Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu Leu Leu Lys Arg
145 150 155 160
Cys Cys Glu Thr Leu Thr Glu Glu Asn Arg Arg Leu His Arg Glu Leu
165 170 175
Gln Gln Leu Arg Ala Leu Thr His Ser Thr Ala Ala Gly Phe Phe Met
180 185 190
Ala Thr Thr Leu Pro Val Pro Ala Ala Thr Leu Ser Ile Cys Pro Ser
195 200 205
Cys Glu Arg Leu Ala Thr Ala Ala Ala Ala Gly Ala Ser Pro Thr Ala
210 215 220
Ala Ala Asp Arg Thr Asn Lys Pro Thr Ala Pro His Leu Phe Ser Pro
225 230 235 240
Phe Ala Lys Ser Ala Ala Cys
245
<210>239
<211>1065
<212>DNA
<213>稻
<400>239
atggagctgg ggctgagctt gggggatgcg gtgaccgtgg cggatggcgg gaggctggag 60
ctggttcttg ggctcggggt tggggttggg gctggggtga ggagaggaga ggaggaggag 120
agggggagga gggaggatgt ggtgggagct gggaggtggg cggcgatggc ggcggcctcg 180
ccggagccgt cggtgcggct cagcctcgtg tcgagcctcg ggctccactg gccttccgag 240
accgggcgtt cggaggcggc ggcgcgtggg ttcgacgtga accgggcgcc gtcggtggcg 300
gcgggcgcgc cggggatgga ggacgacgag gagggcccgg gcgccgcgcc ggcgttgtcg 360
tcgtcgccca acgacagcgg gggatccttc ccgctggacc tctccgggca aggcctccgt 420
ggccacgccg aggcggcggc gcagggtggc ggcggcggcg gcggcggcga gcggtcgtcc 480
tcgcgcgcga gcgacgacga cgagggcgcg tccgcgcgca agaagctgcg actctccaag 540
gagcagtcgg cgttcctcga ggagagcttc aaggagcaca gcacgctgaa tcccaagcag 600
aaggtggcgc tggcgaagca gctcaacctc cggccgcggc aagtggaggt ctggttccag 660
aaccgccgag ccaggacgaa gctgaagcag acggaggtgg actgcgagta cctgaagcgc 720
tgctgcgaga cgctcaccga ggagaaccgg cggctgcaca aggagctcgc cgagctgcgc 780
gcgctcaaga cggcgcgccc cttctacatg cacctcccgg ccacgaccct ctccatgtgc 840
ccctcctgcg agcgtgtcgc ctccaacccg gccaccgctt cgacctccgc ccccgccgcg 900
gccacgtccc cggcggcggc gccgaccgcg gccgcaagaa ccgccgtcgc gtcgcccgag 960
ccgcaccggc cgtcgtcctt cgccgcgctg ttcgcggcac ccctcggctt cccgctgacc 1020
gccgcccagc cgcggccgcc gccgccggcg agcaactgcc tgtaa 1065
<210>240
<211>354
<212>PRT
<213>稻
<400>240
Met Glu Leu Gly Leu Ser Leu Gly Asp Ala Val Thr Val Ala Asp Gly
1 5 10 15
Gly Arg Leu Glu Leu Val Leu Gly Leu Gly Val Gly Val Gly Ala Gly
20 25 30
Val Arg Arg Gly Glu Glu Glu Glu Arg Gly Arg Arg Glu Asp Val Val
35 40 45
Gly Ala Gly Arg Trp Ala Ala Met Ala Ala Ala Ser Pro Glu Pro Ser
50 55 60
Val Arg Leu Ser Leu Val Ser Ser Leu Gly Leu His Trp Pro Ser Glu
65 70 75 80
Thr Gly Arg Ser Glu Ala Ala Ala Arg Gly Phe Asp Val Asn Arg Ala
85 90 95
Pro Ser Val Ala Ala Gly Ala Pro Gly Met Glu Asp Asp Glu Glu Gly
100 105 110
Pro Gly Ala Ala Pro Ala Leu Ser Ser Ser Pro Asn Asp Ser Gly Gly
115 120 125
Ser Phe Pro Leu Asp Leu Ser Gly Gln Gly Leu Arg Gly His Ala Glu
130 135 140
Ala Ala Ala Gln Gly Gly Gly Gly Gly Gly Gly Gly Glu Arg Ser Ser
145 150 155 160
Ser Arg Ala Ser Asp Asp Asp Glu Gly Ala Ser Ala Arg Lys Lys Leu
165 170 175
Arg Leu Ser Lys Glu Gln Ser Ala Phe Leu Glu Glu Ser Phe Lys Glu
180 185 190
His Ser Thr Leu Asn Pro Lys Gln Lys Val Ala Leu Ala Lys Gln Leu
195 200 205
Asn Leu Arg Pro Arg Gln Val Glu Val Trp Phe Gln Asn Arg Arg Ala
210 215 220
Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu Tyr Leu Lys Arg
225 230 235 240
Cys Cys Glu Thr Leu Thr Glu Glu Asn Arg Arg Leu His Lys Glu Leu
245 250 255
Ala Glu Leu Arg Ala Leu Lys Thr Ala Arg Pro Phe Tyr Met His Leu
260 265 270
Pro Ala Thr Thr Leu Ser Met Cys Pro Ser Cys Glu Arg Val Ala Ser
275 280 285
Asn Pro Ala Thr Ala Ser Thr Ser Ala Pro Ala Ala Ala Thr Ser Pro
290 295 300
Ala Ala Ala Pro Thr Ala Ala Ala Arg Thr Ala Val Ala Ser Pro Glu
305 310 315 320
Pro His Arg Pro Ser Ser Phe Ala Ala Leu Phe Ala Ala Pro Leu Gly
325 330 335
Phe Pro Leu Thr Ala Ala Gln Pro Arg Pro Pro Pro Pro Ala Ser Asn
340 345 350
Cys Leu
<210>241
<211>1089
<212>DNA
<213>稻
<400>241
atggagctgg ggttgagctt gggggaggct atggcggatg ctgggaggga gctggttctt 60
gggcttggga tggggaggag ggaggaggcg gcggaggcgg ggaggaggga tcatgaggtg 120
aggagggagc tggagttcgg gtcgatgtcg agcaggtgcg gtggttcttc gccggagccg 180
acggtgcggc tcacgcttct gcccatggtg cccggccttg gcctcccatg gccgccgccg 240
ccgccgccgt cgtccgagag caggcatttg gaggcgtcga cgcggggatt cgacgtgaac 300
cgcccgccgt cgtccggcgg cggcggcggc ggcggcggcg cggaggagga gcaggacgac 360
gtggccgggg cggcactctc gtcgtccccc aacaacagcg ccggatcctt cccgatggat 420
gacttctccg ggcacggcct cggcggcaac gacgcggccc ctggcggtgg cggcggcgac 480
cgctcgtgct cccgcgccag cgacgaggac gacggcggct ccgcgcgcaa gaagctccgc 540
ctctccaagg agcagtccgc gttcctcgag gagagcttca aggagcacag caccctaaac 600
cccaagcaga agctggcgct ggcgaagcag ctcaacctcc ggccgcgcca ggtggaggtg 660
tggttccaga accgccgcgc caggacgaag ctgaagcaga cggaggtgga ctgcgagtac 720
ctgaagcggt gctgcgagac gctgacggag gagaaccggc ggctgcagaa ggagctcgcc 780
gagctccggg cgctcaagac ggtgcacccc ttctacatgc acctcccggc gacgacactc 840
tccatgtgcc cctcctgcga gcgcgtcgcc tccaactccg ccccggccac cgcctcctcc 900
gccgcaacat cgtcgacggc cgcgccgccc gcggcaccct catccggcgg cattgcggcc 960
acctcctcct ccgccgccgc cgccgcggcg ccggaccaca ggccgtcgtc gttcgccgcg 1020
ctgttctcgt cgccgcgtgg cttcccgcta tccgtagccc cgcaggcgca gccgccgacg 1080
agctcgtga 1089
<210>242
<211>362
<212>PRT
<213>稻
<400>242
Met Glu Leu Gly Leu Ser Leu Gly Glu Ala Met Ala Asp Ala Gly Arg
1 5 10 15
Glu Leu Val Leu Gly Leu Gly Met Gly Arg Arg Glu Glu Ala Ala Glu
20 25 30
Ala Gly Arg Arg Asp His Glu Val Arg Arg Glu Leu Glu Phe Gly Ser
35 40 45
Met Ser Ser Arg Cys Gly Gly Ser Ser Pro Glu Pro Thr Val Arg Leu
50 55 60
Thr Leu Leu Pro Met Val Pro Gly Leu Gly Leu Pro Trp Pro Pro Pro
65 70 75 80
Pro Pro Pro Ser Ser Glu Ser Arg His Leu Glu Ala Ser Thr Arg Gly
85 90 95
PheAsp Val Asn Arg Pro Pro Ser Ser Gly Gly Gly Gly Gly Gly Gly
100 105 110
Gly Ala Glu Glu Glu Gln Asp Asp Val Ala Gly Ala Ala Leu Ser Ser
115 120 125
Ser Pro Asn Asn Ser Ala Gly Ser Phe Pro Met Asp Asp Phe Ser Gly
130 135 140
His Gly Leu Gly Gly Asn Asp Ala Ala Pro Gly Gly Gly Gly Gly Asp
145 150 155 160
Arg Ser Cys Ser Arg Ala Ser Asp Glu Asp Asp Gly Gly Ser Ala Arg
165 170 175
Lys Lys Leu Arg Leu Ser Lys Glu Gln Ser Ala Phe Leu Glu Glu Ser
180 185 190
Phe Lys Glu His Ser Thr Leu Asn Pro Lys Gln Lys Leu Ala Leu Ala
195 200 205
Lys Gln Leu Asn Leu Arg Pro Arg Gln Val Glu Val Trp Phe Gln Asn
210 215 220
Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu Tyr
225 230 235 240
Leu Lys Arg Cys Cys Glu Thr Leu Thr Glu Glu Asn Arg Arg Leu Gln
245 250 255
Lys Glu Leu Ala Glu Leu Arg Ala Leu Lys Thr Val His Pro Phe Tyr
260 265 270
Met His Leu Pro Ala Thr Thr Leu Ser Met Cys Pro Ser Cys Glu Arg
275 280 285
Val Ala Ser Asn Ser Ala Pro Ala Thr Ala Ser Ser Ala Ala Thr Ser
290 295 300
Ser Thr Ala Ala Pro Pro Ala Ala Pro Ser Ser Gly Gly Ile Ala Ala
305 310 315 320
Thr Ser Ser Ser Ala Ala Ala Ala Ala Ala Pro Asp His Arg Pro Ser
325 330 335
Ser Phe Ala Ala Leu Phe Ser Ser Pro Arg Gly Phe Pro Leu Ser Val
340 345 350
Ala Pro Gln Ala Gln Pro Pro Thr Ser Ser
355 360
<210>243
<211>771
<212>DNA
<213>稻
<400>243
atggagaggc aaggcttgga tcttggcctg agcctcgggc taggcttgac gacggcggcg 60
acatggccgg ctgctgggtt ctgtctgaac tccggcatgg cggagcagga agtgatcagg 120
cgtgatgatg tggttgcggc gacggcggcg gaggatgaga ggttcgcgtg ctcacccggc 180
agcccggtgt cgagcggcag cgggaagcga ggcagcggca gcggcagcgg cgacgaggtc 240
gacgacgccg gctgcgacgt cggcggcggc ggcgcgcgca agaagctgcg gttgtccaag 300
gaccaggccg ccgtcctcga ggagtgcttc aagacgcacc acaccctcac tccgaagcag 360
aaggtggcgc tggcgaagag cttgaacctg cggccgcggc aggtggaggt gtggttccag 420
aaccgccgcg cgaggacgaa gctgaagcag acggaggtgg actgcgagca cctcaagcgg 480
tggtgcgacc agctcgccga cgacaaccgc cgcctccaca aggagctcgc cgagctcagg 540
gcgctcaagg ccacgcccac accgcccgcc gccgcgccgc cattgaccac cctcacaatg 600
tgcctctcct gcaagcgcgt cgccaatgcc ggcgtgccct cgccggcggc ggcgatattc 660
cccggccacc cccagttctt gtgcggattc agagatcacg ccggagcagc gtcgtcgtcg 720
tacggcggcg catcatctgg actcgcgaag gcggtcaggg cggcgaggta g 771
<210>244
<211>256
<212>PRT
<213>稻
<400>244
Met Glu Arg Gln Gly Leu Asp Leu Gly Leu Ser Leu Gly Leu Gly Leu
1 5 10 15
Thr Thr Ala Ala Thr Trp Pro Ala Ala Gly Phe Cys Leu Asn Ser Gly
20 25 30
Met Ala Glu Gln Glu Val Ile Arg Arg Asp Asp Val Val Ala Ala Thr
35 40 45
Ala Ala Glu Asp Glu Arg Phe Ala Cys Ser Pro Gly Ser Pro Val Ser
50 55 60
Ser Gly Ser Gly Lys Arg Gly Ser Gly Ser Gly Ser Gly Asp Glu Val
65 70 75 80
Asp Asp Ala Gly Cys Asp Val Gly Gly Gly Gly Ala Arg Lys Lys Leu
85 90 95
Arg Leu Ser Lys Asp Gln Ala Ala Val Leu Glu Glu Cys Phe Lys Thr
100 105 110
His His Thr Leu Thr Pro Lys Gln Lys Val Ala Leu Ala Lys Ser Leu
115 120 125
Asn Leu Arg Pro Arg Gln Val Glu Val Trp Phe Gln Asn Arg Arg Ala
130 135 140
Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu His Leu Lys Arg
145 150 155 160
Trp Cys Asp Gln Leu Ala Asp Asp Asn Arg Arg Leu His Lys Glu Leu
165 170 175
Ala Glu Leu Arg Ala Leu Lys Ala Thr Pro Thr Pro Pro Ala Ala Ala
180 185 190
Pro Pro Leu Thr Thr Leu Thr Met Cys Leu Ser Cys Lys Arg Val Ala
195 200 205
Asn Ala Gly Val Pro Ser Pro Ala Ala Ala Ile Phe Pro Gly His Pro
210 215 220
Gln Phe Leu Cys Gly Phe Arg Asp His Ala Gly Ala Ala Ser Ser Ser
225 230 235 240
Tyr Gly Gly Ala Ser Ser Gly Leu Ala Lys Ala Val Arg Ala Ala Arg
245 250 255
<210>245
<211>927
<212>DNA
<213>稻
<400>245
atgatggatc tcggcctcag cctcggcctc ggcctcgcct cgcagggcag cctcacctcc 60
tccaccacca ccacctcctc ccccggcgcc ggatcatcct ccccgtgggc cgccgcgctc 120
aactccatcg tcggcgacgt gaggcgggat caggccgcgg cgcatgctgc cgcggcggtg 180
ggggttgggg ttgggggcga ggagatgtac caggggaggg cgtccacgtc gccggacagc 240
gcggcggcgc tgtcgagcgc gagcgggaag agggagaggg agctggagcg gtcgggatcc 300
ggggttgacg acgacgacgg cgcggacggc gccggcgggc ggaagaagct caggctgtcc 360
aaggaccagg ccgccgtgct cgaggagtgc ttcaagacgc actccactct caaccccaag 420
cagaaggtgg cgctggcgaa caggctgggg ctgcggccgc ggcaggtgga ggtgtggttc 480
cagaaccgga gggcgaggac gaagctgaag cagacggagg tggactgcga gtacctgaag 540
cggtggtgcg agcgcctcgc cgacgagaac aagcgcctcg agaaggagct cgccgacctc 600
agggcgctca aggccgcgcc ctcgccggcg tccgcgtccg cgatgcagcc ctcctcctcc 660
gccgccgcca cgctcaccat gtgcccctcc tgccgccgcg tcgccaccgc cggcgcgccg 720
caccagccta accaccaaca atgccatccc aaatctaaca ccaccatctc ctcctcctcc 780
accgccgccg ccgccgtcgc cgtcgccggc ggcaacgtgc tgcccagcca ctgccagttc 840
ttcccggccg ccgccgccgc cgccgaccgg acaagccaga gcacgtggaa cgccgccgcg 900
ccgctcgtca ccagagagct cttctag 927
<210>246
<211>308
<212>PRT
<213>稻
<400>246
Met Met Asp Leu Gly Leu Ser Leu Gly Leu Gly Leu Ala Ser Gln Gly
1 5 10 15
Ser Leu Thr Ser Ser Thr Thr Thr Thr Ser Ser Pro Gly Ala Gly Ser
20 25 30
Ser Ser Pro Trp Ala Ala Ala Leu Asn Ser Ile Val Gly Asp Val Arg
35 40 45
Arg Asp Gln Ala Ala Ala His Ala Ala Ala Ala Val Gly Val Gly Val
50 55 60
Gly Gly Glu Glu Met Tyr Gln Gly Arg Ala Ser Thr Ser Pro Asp Ser
65 70 75 80
Ala Ala Ala Leu Ser Ser Ala Ser Gly Lys Arg Glu Arg Glu Leu Glu
85 90 95
Arg Ser Gly Ser Gly Val Asp Asp Asp Asp Gly Ala Asp Gly Ala Gly
100 105 110
Gly Arg Lys Lys Leu Arg Leu Ser Lys Asp Gln Ala Ala Val Leu Glu
115 120 125
Glu Cys Phe Lys Thr His Ser Thr Leu Asn Pro Lys Gln Lys Val Ala
130 135 140
Leu Ala Asn Arg Leu Gly Leu Arg Pro Arg Gln Val Glu Val Trp Phe
145 150 155 160
Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys
165 170 175
Glu Tyr Leu Lys Arg Trp Cys Glu Arg Leu Ala Asp Glu Asn Lys Arg
180 185 190
Leu Glu Lys Glu Leu Ala Asp Leu Arg Ala Leu Lys Ala Ala Pro Ser
195 200 205
Pro Ala Ser Ala Ser Ala Met Gln Pro Ser Ser Ser Ala Ala Ala Thr
210 215 220
Leu Thr Met Cys Pro Ser Cys Arg Arg Val Ala Thr Ala Gly Ala Pro
225 230 235 240
His Gln Pro Asn His Gln Gln Cys His Pro Lys Ser Asn Thr Thr Ile
245 250 255
Ser Ser Ser Ser Thr Ala Ala Ala Ala Val Ala Val Ala Gly Gly Asn
260 265 270
Val Leu Pro Ser His Cys Gln Phe Phe Pro Ala Ala Ala Ala Ala Ala
275 280 285
Asp Arg Thr Ser Gln Ser Thr Trp Asn Ala Ala Ala Pro Leu Val Thr
290 295 300
Arg Glu Leu Phe
305
<210>247
<211>936
<212>DNA
<213>稻
<400>247
atggagatga tggttcatgg gaggagagac gagcagtatg gcgggctcag gctcgggctt 60
gggcttgggc tcagcctcgg cgtcgccggt ggtgcagccg acgacgagca gccgccgccg 120
cgccgtggtg ccgccccgcc gccgcagcag cagctgtgcg gctggaacgg cggcggtctc 180
ttctcctcgt cttcctccga tcatcggggg aggtcggcga tgatggcgtg ccacgacgtc 240
atcgagatgc cgttcctgcg ggggatcgac gtgaaccgtg cgccggcggc agagacgacc 300
acgacgacgg cgagggggcc cagctgcagc gaggaagacg aggagcccgg cgcgtcctcc 360
cccaacagca cgctctccag cctcagcggc aagcgcggcg caccatctgc cgccaccgcc 420
gccgccgccg ccgccagcga cgacgaggac tccggcggcg gatcccgcaa gaagctccgc 480
ctctccaagg accaagccgc cgtcctcgag gacaccttca aagagcacaa caccctcaat 540
cccaagcaga aggcggcgct ggcgaggcag ctgaatctga agccgcggca ggtggaggtg 600
tggttccaga acaggagggc gaggacgaag ctgaagcaga cggaggtgga ctgcgagctg 660
ctcaagcgct gctgcgagac gctcaccgac gagaaccgcc gcctccaccg cgagctccag 720
gagctccgcg ccctcaagct cgccaccgcc gccgccgcgc cgcaccacct ctacggcgcc 780
cgcgtcccgc cgcccaccac cctcaccatg tgcccctcct gcgagcgcgt cgcctccgca 840
gccaccacca cccgcaacaa ctccggcgcc gcccccgcgc ggccggtgcc cacccgcccg 900
tggccgccgg cggcggcgca gaggtcgtcg gcgtag 936
<210>248
<211>311
<212>PRT
<213>稻
<400>248
Met Glu Met Met Val His Gly Arg Arg Asp Glu Gln Tyr Gly Gly Leu
1 5 10 15
Arg Leu Gly Leu Gly Leu Gly Leu Ser Leu Gly Val Ala Gly Gly Ala
20 25 30
Ala Asp Asp Glu Gln Pro Pro Pro Arg Arg Gly Ala Ala Pro Pro Pro
35 40 45
Gln Gln Gln Leu Cys Gly Trp Asn Gly Gly Gly Leu Phe Ser Ser Ser
50 55 60
Ser Ser Asp His Arg Gly Arg Ser Ala Met Met Ala Cys His Asp Val
65 70 75 80
Ile Glu Met Pro Phe Leu Arg Gly Ile Asp Val Asn Arg Ala Pro Ala
85 90 95
Ala Glu Thr Thr Thr Thr Thr Ala Arg Gly Pro Ser Cys Ser Glu Glu
100 105 110
Asp Glu Glu Pro Gly Ala Ser Ser Pro Asn Ser Thr Leu Ser Ser Leu
115 120 125
Ser Gly Lys Arg Gly Ala Pro Ser Ala Ala Thr Ala Ala Ala Ala Ala
130 135 140
Ala Ser Asp Asp Glu Asp Ser Gly Gly Gly Ser Arg Lys Lys Leu Arg
145 150 155 160
Leu Ser Lys Asp Gln Ala Ala Val Leu Glu Asp Thr Phe Lys Glu His
165 170 175
Asn Thr Leu Asn Pro Lys Gln Lys Ala Ala Leu Ala Arg Gln Leu Asn
180 185 190
Leu Lys Pro Arg Gln Val Glu Val Trp Phe Gln Asn Arg Arg Ala Arg
195 200 205
Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu Leu Leu Lys Arg Cys
210 215 220
Cys Glu Thr Leu Thr Asp Glu Asn Arg Arg Leu His Arg Glu Leu Gln
225 230 235 240
Glu Leu Arg Ala Leu Lys Leu Ala Thr Ala Ala Ala Ala Pro His His
245 250 255
Leu Tyr Gly Ala Arg Val Pro Pro Pro Thr Thr Leu Thr Met Cys Pro
260 265 270
Ser Cys Glu Arg Val Ala Ser Ala Ala Thr Thr Thr Arg Asn Asn Ser
275 280 285
Gly Ala Ala Pro Ala Arg Pro Val Pro Thr Arg Pro Trp Pro Pro Ala
290 295 300
Ala Ala Gln Arg Ser Ser Ala
305 310
<210>249
<211>1674
<212>DNA
<213>拟南芥
<400>249
aaaatggaaa actcagacac tgattcagaa gttttctttt ggtttcagaa ccaaaaccaa 60
aaccatagcc ataagtttcc ttcttcttgt tttcctccga gctctcactc tgctttttat 120
ggatctagct caatgatcaa cacagagact gcaactatgg acgaagaaga cgtatgtgag 180
agctacatga tgcgtgagat aaccaagaaa cggaagctaa caccgatcca attgcgttta 240
ctagaggaga gtttcgaaga agagaaaaga ctcgaaccag acaggaaact ctggctagcc 300
gagaagctag ggctgcagcc aagccaagtc gctgtctggt tccaaaacag aagagctaga 360
tacaagacca aacagctcga acacgactgt gactctctta aagctagcta tgctaagctc 420
aagactgact gggacattct ctttgtacaa aaccaaaccc tcaagagcaa ggtacagttt 480
cttaatagat taacaagcca ctattttcaa gagtctgttc aaaattttga tgacacattc 540
aaacaggtcg atcttctcaa agagaagctg aaaatgcaag agaatcttga aactcagtct 600
attgagagga aaagacttgg ggaagaaggt agttcggtga aaagcgataa cacgcagtac 660
agtgaagaag aaggtttgga gaatcaatac agtttcccgg agcttgcagt tctcggattt 720
tattatgatc caaccttaac tgcttcaaat ctaagacaag aacctttgaa agtcacgtgt 780
gcggatcaga tgactcagat ccaaatatct gacgtcacag aacctgcgag ctccgcacat 840
aaaaaaattg aagtgacaca gcgaagttcg agtatgagcc gcaagagaga taaaccctac 900
acaaaccgtc acacaccggc gcgaatttcg aaacgccggc gaccatgggc gccttcgtca 960
tcggagcacg atgagattat cgacaaaccg atcaccaaac ctccgccgcc accggcgttg 1020
gtagttatgg gacttcccgc caactgttca gttctggagc taaaatctcg attcgagatc 1080
tacggttcaa tctcccgaat ccgaatccat aaagacggaa ttggctccgt ttcgtatcga 1140
accgccgagt cagcagaagc cgccattgct ggtagtcacg agccttcttt cggtatctcc 1200
atcgattcca aaaagttgga ggtggtttgg gcgacggatc cattggtgaa gtggaaggaa 1260
ggtgtgacgg cgggagaagg aaaggagaga acgtcgtcgt tttcgtcgaa gcttttacga 1320
cctgtgatgc ctttgagaaa acatgggaga agcagtaggt tagcgtcagc tattgttaat 1380
ccgagaagtg ataatactaa aggaattagt ggagatggag ggatatcatc tccggcgacg 1440
acaagtgaag ttaaacagag aaatatagta acctacgacg atatcgttta acaccattct 1500
actacaatta tagtaacttt gattctttta catattttgg caattttatg agtttagcta 1560
atcctgttgg taatctcagt tgtcgaatgt tgtgaaatga gttgagtttt gtttatttgt 1620
atgattgtaa cttataagaa agagaaggat tccaaaatgg gtagaagatt caaa 1674
<210>250
<211>495
<212>PRT
<213>拟南芥
<400>250
Met Glu Asn Ser Asp Thr Asp Ser Glu Val Phe Phe Trp Phe Gln Asn
1 5 10 15
Gln Asn Gln Asn His Ser His Lys Phe Pro Ser Ser Cys Phe Pro Pro
20 25 30
Ser Ser His Ser Ala Phe Tyr Gly Ser Ser Ser Met Ile Asn Thr Glu
35 40 45
Thr Ala Thr Met Asp Glu Glu Asp Val Cys Gl u SerTyr Met Met Arg
50 55 60
Glu Ile Thr Lys Lys Arg Lys Leu Thr Pro Ile Gln Leu Arg Leu Leu
65 70 75 80
Glu Glu Ser Phe Glu Glu Glu Lys Arg Leu Glu Pro Asp Arg Lys Leu
85 90 95
Trp Leu Ala Glu Lys Leu Gly Leu Gln Pro Ser Gln Val Ala Val Trp
100 105 110
Phe Gln Asn Arg Arg Ala Arg Tyr Lys Thr Lys Gln Leu Glu His Asp
115 120 125
Cys Asp Ser Leu Lys Ala Ser Tyr Ala Lys Leu Lys Thr Asp Trp Asp
130 135 140
Ile Leu Phe Val Gln Asn Gln Thr Leu Lys Ser Lys Val Gln Phe Leu
145 150 155 160
Asn Arg Leu Thr Ser His Tyr Phe Gln Glu Ser Val Gln Asn Phe Asp
165 170 175
AspThr Phe Lys Gln Val Asp Leu Leu Lys Glu Lys Leu Lys Met Gln
180 185 190
Glu Asn Leu Glu Thr Gln Ser Ile Glu Arg Lys Arg Leu Gly Glu Glu
195 200 205
Gly Ser Ser Val Lys Ser Asp Asn Thr Gln Tyr Ser Glu Glu Glu Gly
210 215 220
Leu Glu Asn Gln Tyr Ser Phe Pro Glu Leu Ala Val Leu Gly Phe Tyr
225 230 235 240
Tyr Asp Pro Thr Leu Thr Ala Ser Asn Leu Arg Gln Glu Pro Leu Lys
245 250 255
Val Thr Cys Ala Asp Gln Met Thr Gln Ile Gln Ile Ser Asp Val Thr
260 265 270
Glu Pro Ala Ser Ser Ala His Lys Lys Ile Glu ValThr Gln Arg Ser
275 280 285
Ser Ser Met Ser Arg Lys Arg Asp Lys Pro Tyr Thr Asn Arg His Thr
290 295 300
Pro Ala Arg Ile Ser Lys Arg Arg Arg Pro Trp Ala Pro Ser Ser Ser
305 310 315 320
Glu His Asp Glu Ile Ile Asp Lys Pro Ile Thr Lys Pro Pro Pro Pro
325 330 335
Pro Ala Leu Val Val Met Gly Leu Pro Ala Asn Cys Ser Val Leu Glu
340 345 350
Leu Lys Ser Arg Phe Glu Ile Tyr Gly Ser Ile Ser Arg Ile Arg Ile
355 360 365
His Lys Asp Gly Ile Gly Ser Val Ser Tyr Arg Thr Ala Glu Ser Ala
370 375 380
Glu Ala Ala Ile Ala Gly Ser His Glu Pro Ser Phe Gly Ile Ser Ile
385 390 395 400
Asp Ser Lys Lys Leu Glu Val Val Trp Ala Thr Asp Pro Leu Val Lys
405 410 415
Trp Lys Glu Gly Val Thr Ala Gly Glu Gly Lys Glu Arg Thr Ser Ser
420 425 430
Phe Ser Ser Lys Leu Leu Arg Pro Val Met Pro Leu Arg Lys His Gly
435 440 445
Arg Ser Ser Arg Leu Ala Ser Ala Ile Val Asn Pro Arg Ser Asp Asn
450 455 460
Thr Lys Gly Ile Ser Gly Asp Gly Gly Ile Ser Ser Pro Ala Thr Thr
465 470 475 480
Ser Glu Val Lys Gln Arg Asn Ile Val Thr Tyr Asp Asp Ile Val
485 490 495
<210>251
<211>1428
<212>DNA
<213>拟南芥
<400>251
aaggccacaa cagatcttct tgttcctctc tctcaatctc tctctctaaa actcttattt 60
tcttcgtaag agatggaact agcgttgtct ctaggcgaca atactaagaa acagttctct 120
tttatggaga agaactcgaa gattaataat ccctctgtct cgtcgacatc tacttccgag 180
aaggatcttg ggttctgcat ggctttagat gttgcttttg gtggtcacag atcgttgtca 240
tcctcttcgt ctccgtcggt agaggatgag aagaagaaac cggcgcccag agcaaaaaaa 300
tctgacgaat ttagggtttc gtcttctgta gatccaccat tacagcttca gcttcacttc 360
cctaattggc tccctgagaa cagtaaaggt cgacaaggag gaagaatgcc cttaggagca 420
gctacggttg tggaggagga agaggaggag gaggaagcgg tgcctagtat gtcagtatcg 480
ccgccggata gtgtaacgtc gtcgtttcaa ttggactttg ggattaaaag ttatggttat 540
gagagaagaa gcaataagag agatattgat gatgaagtgg agagatcagc ttcaagagcc 600
agcaacgaag acaacgatga cgagaatgga tccactagga agaaacttag actctccaaa 660
gaccaatctg cttttcttga agacagcttc aaagaacaca gtacccttaa tcctgttcgt 720
gtcccattct ttacagtttt tatttattta aaatttgtct ttcttgaatt tattctattt 780
ttttagtacc aaattttagc cttaatgctt ttttttttct ttctaaaaca ttgcagaaac 840
agaagattgc attggcgaag cagttgaatc ttcgtcctcg tcaggttgaa gtctggtttc 900
aaaacagacg agccaggaca aagctgaagc aaacggaagt ggactgtgaa tacctaaaga 960
gatgctgtga gtcactaacc gaagaaaacc ggaggcttca aaaagaggtt aaagaattga 1020
gaaccttgaa gacttccaca cccttttaca tgcaacttcc ggccactact ctcactatgt 1080
gcccttcttg tgaacgtgtt gccacttcag cagcacagcc ctccacgtca gctgcccaca 1140
acctctgttt gtccacgtca tcattgattc cggttaagcc tcggccggcc aaacaagttt 1200
catgaaagca cctgcgaaat acagtttgag caaacggtcg agctagagtg gttttaaaag 1260
ttgtcttctt gtgtatatat ttattttact tttcatattt tattagagac cgctattttg 1320
aaagacgaat agattgatta tccggttagt gttttgtttt tcttagatag gaccggataa 1380
aaaacagatg gagcaaaagg gttgacatgt tttattgaat gatagagg 1428
<210>252
<211>237
<212>PRT
<213>拟南芥
<400>252
Met Glu Leu Ala Leu Ser Leu Gly Asp Asn Thr Lys Lys Gln Phe Ser
1 5 10 15
Phe Met Glu Lys Asn Ser Lys Ile Asn Asn Pro Ser Val Ser Ser Thr
20 25 30
Ser Thr Ser Glu Lys Asp Leu Gly Phe Cys Met Ala Leu Asp Val Ala
35 40 45
Phe Gly Gly His Arg Ser Leu Ser Ser Ser Ser Ser Pro Ser Val Glu
50 55 60
Asp Glu Lys Lys Lys Pro Ala Pro Arg Ala Lys Lys Ser Asp Glu Phe
65 70 75 80
Arg Val Ser Ser Ser Val Asp Pro Pro Leu Gln Leu Gln Leu His Phe
85 90 95
Pro Asn Trp Leu Pro Glu Asn Ser Lys Gly Arg Gln Gly Gly Arg Met
100 105 110
Pro Leu Gly Ala Ala Thr Val Val Glu Glu Glu Glu Glu Glu Glu Glu
115 120 125
Ala Val Pro Ser Met Ser Val Ser Pro Pro Asp Ser Val Thr Ser Ser
130 135 140
Phe Gln Leu Asp Phe Gly Ile Lys Ser Tyr Gly Tyr Glu Arg Arg Ser
145 150 155 160
Asn Lys Arg Asp Ile Asp Asp Glu Val Glu Arg Ser Ala Ser Arg Ala
165 170 175
Ser Asn Glu Asp Asn Asp Asp Glu Asn Gly Ser Thr Arg Lys Lys Leu
180 185 190
Arg Leu Ser Lys Asp Gln Ser Ala Phe Leu Glu Asp Ser Phe Lys Glu
195 200 205
His Ser Thr Leu Asn Pro Val Arg Val Pro Phe Phe Thr Val Phe Ile
210 215 220
Tyr Leu Lys Phe Val Phe Leu Glu Phe Ile Leu Phe Phe
225 230 235
<210>253
<211>1167
<212>DNA
<213>拟南芥
<400>253
tgcccccagc tagtcacata ctcatgattg caaaatctct ctctctctct gcctctctat 60
atattaacct ttcttcttcc tttactttct catcttctat ctctcaaaag aaaagcagac 120
aactttattt gcaaaaacag agtttttttt tcttatcttg agaaagttca acagaagatg 180
atgttcgaga aagacgatct gggtctaagc ttaggcttga attttccaaa gaaacagatc 240
aatctcaaat caaatccatc tgtttctgtt actccttctt cttcttcttt tggattattc 300
agaagatctt catggaacga gagttttact tcttcagttc caaactcaga ttcgtcacaa 360
aaagaaacaa gaactttcat ccgaggaatc gacgtgaaca gaccaccgtc tacagcggaa 420
tacggcgacg aagacgctgg agtatcttca cctaacagta cagtctcaag ctctacaggg 480
aaaagaagcg agagagaaga agacacagat ccacaaggct caagaggaat cagtgacgat 540
gaagatggtg ataactccag gaaaaagctt agactttcca aagatcaatc tgctattctt 600
gaagagacct tcaaagatca cagtactctc aatccgaagc agaagcaagc attggctaaa 660
caattagggt tacgagcaag acaagtggaa gtttggtttc agaacagacg agcaagaaca 720
aagctgaagc aaacggaggt agactgcgag ttcttacgga gatgctgcga gaatctaacg 780
gaagagaacc gtcggctaca aaaagaagta acggaattga gagcacttaa gctctctcct 840
cagttctaca tgcacatgag cccacccact actttgacca tgtgcccttc atgtgaacac 900
gtgtcggtcc cgccaccaca acctcaggct gctacgtcag cgcaccaccg gtcgttgccg 960
gtcaatgcgt gggctcctgc gacgaggata tctcacggct tgacttttga cgctcttcgt 1020
cctaggtcct aagtcttttt acttgcaacc aaagggcatt ttggtcgttt tttaagtttc 1080
atggaccaga tatgcatgta gttgttaaca tgtatgtatt ttcttagaaa gaaagaaaaa 1140
cagattaata tttttctagc ttaaacc 1167
<210>254
<211>284
<212>PRT
<213>拟南芥
<400>254
Met Met Phe Glu Lys Asp Asp Leu Gly Leu Ser Leu Gly Leu Asn Phe
1 5 10 15
Pro Lys Lys Gln Ile Asn Leu Lys Ser Asn Pro Ser Val Ser Val Thr
20 25 30
Pro Ser Ser Ser Ser Phe Gly Leu Phe Arg Arg Ser Ser Trp Asn Glu
35 40 45
Ser Phe Thr Ser Ser Val Pro Asn Ser Asp Ser Ser Gln Lys Glu Thr
50 55 60
Arg Thr Phe Ile Arg Gly Ile Asp Val Asn Arg Pro Pro Ser Thr Ala
65 70 75 80
Glu Tyr Gly Asp Glu Asp Ala Gly Val Ser Ser Pro Asn Ser Thr Val
85 90 95
Ser Ser Ser Thr Gly Lys Arg Ser Glu Arg Glu Glu Asp Thr Asp Pro
100 105 110
Gln Gly Ser Arg Gly Ile Ser Asp Asp Glu Asp Gly Asp Asn Ser Arg
115 120 125
Lys Lys Leu Arg Leu Ser Lys Asp Gln Ser Ala Ile Leu Glu Glu Thr
130 135 140
Phe Lys Asp His Ser Thr Leu Asn Pro Lys Gln Lys Gln Ala Leu Ala
145 150 155 160
Lys Gln Leu Gly Leu Arg Ala Arg Gln Val Glu Val Trp Phe Gln Asn
165 170 175
Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu Phe
180 185 190
Leu Arg Arg Cys Cys Glu Asn Leu Thr Glu Glu Asn Arg Arg Leu Gln
195 200 205
Lys Glu Val Thr Glu Leu Arg Ala Leu Lys Leu Ser Pro Gln Phe Tyr
210 215 220
Met His Met Ser Pro Pro Thr Thr Leu Thr Met Cys Pro Ser Cys Glu
225 230 235 240
His Val Ser Val Pro Pro Pro Gln Pro Gln Ala Ala Thr Ser Ala His
245 250 255
His Arg Ser Leu Pro Val Asn Ala Trp Ala Pro Ala Thr Arg Ile Ser
260 265 270
His Gly Leu Thr Phe Asp Ala Leu Arg Pro Arg Ser
275 280
<210>255
<211>1194
<212>DNA
<213>拟南芥
<400>255
atttcacatc tctctctctc tataagaacc ctagaagaag gtttctcttg tcctccatac 60
acttagcaca actgataaat cttttgaggt aaaatcagct ttagatcaag gtttttctag 120
tcatctctac tcataaagat caaagctttt gctattctca ttttctacca agagacaata 180
tcatgatgat gggtaaagag gatttgggtt taagtcttag cttgggattt gcacaaaacc 240
atcctctcca gctaaatctt aaacccactt cttcaccaat gtccaatctc cagatgtttc 300
catggaacca aacccttgtt tcttcctcag atcaacaaaa gcaacagttt cttaggaaaa 360
tcgacgtgaa cagcttgcca acaacggtgg atttggaaga ggagacagga gtttcgtctc 420
caaacagtac gatctcgagc acagtgagtg gaaagaggag gagtactgaa agagaaggta 480
cctccggtgg tggttgcgga gatgaccttg acatcactct agatagatct tcctcacgtg 540
gaacctccga tgaagaggaa gattacggag gtgagacttg taggaagaag cttagactat 600
ccaaagatca atccgcagtt ctcgaagaca ctttcaaaga gcacaatact ctcaatccca 660
aacagaagct ggctttggct aagaagctag gtttaacagc aagacaagtg gaagtgtggt 720
tccaaaacag aagagcaagg acaaagttaa agcagaccga agtggattgc gagtatttga 780
aaagatgtgt tgagaaatta acggaagaga atcggcggct cgagaaagag gcagcggaac 840
taagagcatt aaagctttca ccgcggttgt atggtcagat gagtccaccg accacacttt 900
tgatgtgtcc atcgtgtgaa cgtgtggccg gaccatcctc atctaaccac aaccagcgat 960
ctgtctcatt gagtccatgg ctccaaatgg cccatgggtc aacctttgat gtgatgcgtc 1020
ctaggtctta actttaatgc tgcttctatg ggttgtgtgt gggtcattgt actttttaga 1080
ttattgactc tcagctaatg tatccttaaa agcctttttc tacttttaaa tttactttaa 1140
tctaattaaa ttagttattc ttgtcttctt gataacaaac aaatttataa taat 1194
<210>256
<211>282
<212>PRT
<213>拟南芥
<400>256
Met Met Met Gly Lys Glu Asp Leu Gly Leu Ser Leu Ser Leu Gly Phe
1 5 10 15
Ala Gln Asn His Pro Leu Gln Leu Asn Leu Lys Pro Thr Ser Ser Pro
20 25 30
Met Ser Asn Leu Gln Met Phe Pro Trp Asn Gln Thr Leu Val Ser Ser
35 40 45
Ser Asp Gln Gln Lys Gln Gln Phe Leu Arg Lys Ile Asp Val Asn Ser
50 55 60
Leu Pro Thr Thr Val Asp Leu Glu Glu Glu Thr Gly Val Ser Ser Pro
65 70 75 80
Asn Ser Thr Ile Ser Ser Thr Val Ser Gly Lys Arg Arg Ser Thr Glu
85 90 95
Arg Glu Gly Thr Ser Gly Gly Gly Cys Gly Asp Asp Leu Asp Ile Thr
100 105 110
Leu Asp Arg Ser Ser Ser Arg Gly Thr Ser Asp Glu Glu Glu Asp Tyr
115 120 125
Gly Gly Glu Thr Cys Arg Lys Lys Leu Arg Leu Ser Lys Asp Gln Ser
130 135 140
Ala Val Leu Glu Asp Thr Phe Lys Glu His Asn Thr Leu Asn Pro Lys
145 150 155 160
Gln Lys Leu Ala Leu Ala Lys Lys Leu Gly Leu Thr Ala Arg Gln Val
165 170 175
Glu Val Trp Phe Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr
180 185 190
Glu Val Asp Cys Glu Tyr Leu Lys Arg Cys Val Glu Lys Leu Thr Glu
195 200 205
Glu Asn Arg Arg Leu Glu Lys Glu Ala Ala Glu Leu Arg Ala Leu Lys
210 215 220
Leu Ser Pro Arg Leu Tyr Gly Gln Met Ser Pro Pro Thr Thr Leu Leu
225 230 235 240
Met Cys Pro Ser Cys Glu Arg Val Ala Gly Pro Ser Ser Ser Asn His
245 250 255
Asn Gln Arg Ser Val Ser Leu Ser Pro Trp Leu Gln Met Ala His Gly
260 265 270
Ser Thr Phe Asp Val Met Arg Pro Arg Ser
275 280
<210>257
<211>1284
<212>DNA
<213>拟南芥
<400>257
aataatgatg gattgtaatt agccacctga caaaatctct catcattcaa agtactatat 60
taatcccctc tcttcttcat taccatctca catctctctc tatttctctt ccacaaagag 120
tcctaacttc gagttgaaac aaacaccatt tctcatctct atctcagaaa gaacaaacca 180
tttcgtgttc tttctttctc tattctcata aggaaatata attcctgaaa ctgttgagtt 240
cttgtgaaag gaaataaaaa acatgatgat gggcaaagaa gatctaggtt tgagcctaag 300
cttagggttt tcacaaaatc acaatcctct tcagatgaat ctgaatccta actcttcatt 360
atcaaacaat ctccagagac tcccatggaa ccaaacattc gatcctacat cagatcttcg 420
caagatagac gtgaacagtt ttccatcaac ggttaactgc gaggaagaca caggagtttc 480
gtcaccaaac agtacgatct caagcaccat tagcgggaag agaagtgaga gagaaggaat 540
ctccggaacc ggcgttggct ccggcgacga tcacgacgag atcactccgg atcgagggta 600
ctcacgtgga acctcagatg aagaagaaga cgggggcgaa acgtcgagga agaagctcag 660
gttatcaaaa gatcagtctg cttttctcga agagactttc aaagaacaca acactctcaa 720
tcccaaacag aagctagctt tggctaagaa gctgaacttg acggcaagac aagtggaagt 780
gtggttccaa aacagaagag ctagaaccaa gttaaagcaa acggaggtag attgcgaata 840
cttgaaacgg tgcgtagaga agctaacgga agagaaccgg agacttcaga aagaggctat 900
ggagcttcga actctcaagc tgtctccaca attctacggt cagatgactc caccaactac 960
actcatcatg tgtccttcgt gcgagcgtgt gggtggccca tcatcatcga accatcacca 1020
caatcacagg cccgtttcta tcaatccgtg ggttgcttgt gctggtcagg tggctcatgg 1080
gctgaatttt gaagccttgc gtccacgatc gtgatttttt attttagtgg tgggaaaagg 1140
gtgttttggt atttttcgtt atcgttatat agtctatctg tgtggggtca ttgtaatttt 1200
ggatgattgg ccttctcatg aactagtcct atgtatgatg caaccttaaa aagatttaaa 1260
ttagcaaaaa ttagttacaa actt 1284
<210>258
<211>283
<212>PRT
<213>拟南芥
<400>258
Met Met Met Gly Lys Glu Asp Leu Gly Leu Ser Leu Ser Leu Gly Phe
1 5 10 15
Ser Gln Asn His Asn Pro Leu Gln Met Asn Leu Asn Pro Asn Ser Ser
20 25 30
Leu Ser Asn Asn Leu Gln Arg Leu Pro Trp Asn Gln Thr Phe Asp Pro
35 40 45
Thr Ser Asp Leu Arg Lys Ile Asp Val Asn Ser Phe Pro Ser Thr Val
50 55 60
Asn Cys Glu Glu Asp Thr Gly Val Ser Ser Pro Asn Ser Thr Ile Ser
65 70 75 80
Ser Thr Ile Ser Gly Lys Arg Ser Glu Arg Glu Gly Ile Ser Gly Thr
85 90 95
Gly Val Gly Ser Gly Asp Asp His Asp Glu Ile Thr Pro Asp Arg Gly
100 105 110
Tyr Ser Arg Gly Thr Ser Asp Glu Glu Glu Asp Gly Gly Glu Thr Ser
115 120 125
Arg Lys Lys Leu Arg Leu Ser Lys Asp Gln Ser Ala Phe Leu Glu Glu
130 135 140
Thr Phe Lys Glu His Asn Thr Leu Asn Pro Lys Gln Lys Leu Ala Leu
145 150 155 160
Ala Lys Lys Leu Asn Leu Thr Ala Arg Gln Val Glu Val Trp Phe Gln
165 170 175
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu
180 185 190
Tyr Leu Lys Arg Cys Val Glu Lys Leu Thr Glu Glu Asn Arg Arg Leu
195 200 205
Gln Lys Glu Ala Met Glu Leu Arg Thr Leu Lys Leu Ser Pro Gln Phe
210 215 220
Tyr Gly Gln Met Thr Pro Pro Thr Thr Leu Ile Met Cys Pro Ser Cys
225 230 235 240
Glu Arg Val Gly Gly Pro Ser Ser Ser Asn His His His Asn His Arg
245 250 255
Pro Val Ser Ile Asn Pro Trp Val Ala Cys Ala Gly Gln Val Ala His
260 265 270
Gly Leu Asn Phe Glu Ala Leu Arg Pro Arg Ser
275 280
<210>259
<211>957
<212>DNA
<213>拟南芥
<400>259
atgggggaaa gagatgatgg gttgggtttg agtctaagct tgggaaatag tcaacaaaaa 60
gaaccatctc tgaggttgaa tcttatgccg ttgacaactt cttcttcttc ttcttcgttt 120
caacacatgc acaatcagaa taacaatagc catccccaga agattcataa catctcttgg 180
actcatctgt ttcaatcttc tgggattaaa cgtacaactg cagagagaaa ctccgacgcc 240
gggtcatttc taagaggttt caacgtgaac agagctcagt cttcggtggc ggtagtggac 300
ttggaagaag aagccgccgt cgtctcgtct ccaaacagcg ccgtttcgag tctgagtgga 360
aataaaaggg atcttgcggt ggcgagagga ggagatgaaa acgaggcgga gagagcttct 420
tgctcacgcg gagggggaag cggtggtagc gacgatgaag acggcggaaa cggcgacgga 480
tcaaggaaga aactacggtt atcgaaggat caagctcttg ttctcgagga gacttttaaa 540
gaacatagca ctcttaatcc gaagcaaaag ctggctctag caaaacagtt gaatctaagg 600
gcaagacaag ttgaagtgtg gtttcagaac cgtagggcaa ggacgaagct gaaacaaacg 660
gaggttgatt gtgagtattt aaagagatgt tgcgataatc tgaccgagga gaatcgacgg 720
ct g cagaaag aagtgtcgga gctgagggcg ttgaagttgt ctccacatct ctacatgcac 780
atgactcctc ctactactct caccatgtgc ccttcttgcg aacgtgtctc ctcctctgcc 840
gccactgtga ccgctgctcc ttccactact actactccta cggtggtggg gcggccaagt 900
ccacagcgat taactccttg gactgctatt tctctccagc aaaaatcagg tcgctag 957
<210>260
<211>318
<212>PRT
<213>拟南芥
<400>260
Met Gly Glu Arg Asp Asp Gly Leu Gly Leu Ser Leu Ser Leu Gly Asn
1 5 10 15
Ser Gln Gln Lys Glu Pro Ser Leu Arg Leu Asn Leu Met Pro Leu Thr
20 25 30
Thr Ser Ser Ser Ser Ser Ser Phe Gln His Met His Asn Gln Asn Asn
35 40 45
Asn Ser His Pro Gln Lys Ile His Asn Ile Ser Trp Thr His Leu Phe
50 55 60
Gln Ser Ser Gly Ile Lys Arg Thr Thr Ala Glu Arg Asn Ser Asp Ala
65 70 75 80
Gly Ser Phe Leu Arg Gly Phe Asn Val Asn Arg Ala Gln Ser Ser Val
85 90 95
Ala Val Val Asp Leu Glu Glu Glu Ala Ala Val Val Ser Ser Pro Asn
100 105 110
Ser Ala Val Ser Ser Leu Ser Gly Asn Lys Arg Asp Leu Ala Val Ala
115 120 125
Arg Gly Gly Asp Glu Asn Glu Ala Glu Arg Ala Ser Cys Ser Arg Gly
130 135 140
Gly Gly Ser Gly Gly Ser Asp Asp Glu Asp Gly Gly Asn Gly Asp Gly
145 150 155 160
Ser Arg Lys Lys Leu Arg Leu Ser Lys Asp Gln Ala Leu Val Leu Glu
165 170 175
Glu Thr Phe Lys Glu His Ser Thr Leu Asn Pro Lys Gln Lys Leu Ala
180 185 190
Leu Ala Lys Gln Leu Asn Leu Arg Ala Arg Gln Val Glu Val Trp Phe
195 200 205
Gln Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys
210 215 220
Glu Tyr Leu Lys Arg Cys Cys Asp Asn Leu Thr Glu Glu Asn Arg Arg
225 230 235 240
Leu Gln Lys Glu Val Ser Glu Leu Arg Ala Leu Lys Leu Ser Pro His
245 250 255
Leu Tyr Met His Met Thr Pro Pro Thr Thr Leu Thr Met Cys Pro Ser
260 265 270
Cys Glu Arg Val Ser Ser Ser Ala Ala Thr Val Thr Ala Ala Pro Ser
275 280 285
Thr Thr Thr Thr Pro Thr Val Val Gly Arg Pro Ser Pro Gln Arg Leu
290 295 300
Thr Pro Trp Thr Ala Ile Ser Leu Gln Gln Lys Ser Gly Arg
305 310 315
<210>261
<211>1357
<212>DNA
<213>拟南芥
<400>261
ccacaacccc atatctcttt gtctgaaaaa actcttttgc atatataaat aaatataagc 60
catatctttt gaaactgtac tgctgcacaa gtgtagaggc agtggcacaa catctttaag 120
aaagagagag agaaagagtc atttattcat ttcctcgctt aaaaatcttg agcacccaga 180
cagaattctt ctttcttctt tctggggttg agaaaaatga gtgaaagaga tgatggattg 240
gggctaagtt tgagcttgag tttaggtttt aatcaaaagg acccgtcttc gaggttaaat 300
ccaatgcctc tggcttctta tgcatcttca tcacacatgc agcatatgca gcagagcaat 360
tataaccatc ctcaaaagat tcagaacact tggattaaca tgtttcagtc atcagagaga 420
aactcggaca tgagatcgtt tctccgggga atagacgtga acagagctcc atcgacggtg 480
gtggttgacg tggaggatga aggcgccgga gtttcgtctc cgaacagcac cgtctcaagc 540
gtgatgagcg ggaagaagag cgagcgagag ctaatggctg cggcaggtgc agttggagga 600
ggtagagtag aagataatga gattgagaga gcttcttgct cgctcggcgg tggtagcgac 660
gatgaagacg gtagcgggaa cggagatgac agttcgagga agaaactccg attgtctaaa 720
gaacaagctt tggttcttga agaaactttt aaagaacata gtacactcaa tccgaagcaa 780
aagatggctt tggctaagca attgaatctg aggacgagac aagttgaagt gtggttccaa 840
aaccgaaggg caaggacgaa gctgaagcaa acggaagtag actgtgaata tcttaagaga 900
tgttgcgaga atctaacgga tgagaatcgg agattgcaaa aggaagtgag tgagcttagg 960
gctttaaagc tttctccaca cttatacatg cacatgaaac ctcccactac tctcacaatg 1020
tgtccttctt gcgagcgagt cgctgttacg tcatcttcgt catcggtggc tcctcctgtg 1080
atgaattcat cgtctccgat gggtccgatg agtccgtggg ctgccatgcc tctacggcaa 1140
cgacctgctg ctggttctca ttagagttta attagtctaa agataatagg tttggtgatt 1200
tgtttttatt atattgttga acggacttgg aagttctttt caagagttgg tcccatgctc 1260
ttctttcctt tgttttattc agtttctatt tatagctgaa ttctggataa tggaaaatct 1320
actaatatta ttgtccaatt attagtttgg ggaaaga 1357
<210>262
<211>315
<212>PRT
<213>拟南芥
<400>262
Met Ser Glu Arg Asp Asp Gly Leu Gly Leu Ser Leu Ser Leu Ser Leu
1 5 10 15
Gly Phe Asn Gln Lys Asp Pro Ser Ser Arg Leu Asn Pro Met Pro Leu
20 25 30
Ala Ser Tyr Ala Ser Ser Ser His Met Gln His Met Gln Gln Ser Asn
35 40 45
Tyr Asn His Pro Gln Lys Ile Gln Asn Thr Trp Ile Asn Met Phe Gln
50 55 60
Ser Ser Glu Arg Asn Ser Asp Met Arg Ser Phe Leu Arg Gly Ile Asp
65 70 75 80
Val Asn Arg Ala Pro Ser Thr Val Val Val Asp Val Glu Asp Glu Gly
85 90 95
Ala Gly Val Ser Ser Pro Asn Ser Thr Val Ser Ser Val Met Ser Gly
100 105 110
Lys Lys Ser Glu Arg Glu Leu Met Ala Ala Ala Gly Ala Val Gly Gly
115 120 125
Gly Arg Val Glu Asp Asn Glu Ile Glu Arg Ala Ser Cys Ser Leu Gly
130 135 140
Gly Gly Ser Asp Asp Glu Asp Gly Ser Gly Asn Gly Asp Asp Ser Ser
145 150 155 160
Arg Lys Lys Leu Arg Leu Ser Lys Glu Gln Ala Leu Val Leu Glu Glu
165 170 175
Thr Phe Lys Glu His Ser Thr Leu Asn Pro Lys Gln Lys Met Ala Leu
180 185 190
Ala Lys Gln Leu Asn Leu Arg Thr Arg Gln Val Glu Val Trp Phe Gln
195 200 205
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu
210 215 220
Tyr Leu Lys Arg Cys Cys Glu Asn Leu Thr Asp Glu Asn Arg Arg Leu
225 230 235 240
Gln Lys Glu Val Ser Glu Leu Arg Ala Leu Lys Leu Ser Pro His Leu
245 250 255
Tyr Met His Met Lys Pro Pro Thr Thr Leu Thr Met Cys Pro Ser Cys
260 265 270
Glu Arg Val Ala Val Thr Ser Ser Ser Ser Ser Val Ala Pro Pro Val
275 280 285
Met Asn Ser Ser Ser Pro Met Gly Pro Met Ser Pro Trp Ala Ala Met
290 295 300
Pro Leu Arg Gln Arg Pro Ala Ala Gly Ser His
305 310 315
<210>263
<211>744
<212>DNA
<213>稻
<400>263
atgatggaga gggccgagga cctgcgcctg agcctcagtc tcagctcgcc gcttattgct 60
cctcgtactc accatgtcgc catgctgttc cacgctcctc cagagaaaag attcctggag 120
atgccgctgc tccctgctgc gaagcggagc gaggtcgtcg cggcagaaga ggagcgcgcg 180
ggcctgcgcg gcggcggcgg cagcgacgag gaggacggtg gctgcggcat cgacggctca 240
cgcaagaagc tccggctttc caaggaccag tccgccgtgc tcgaggacag cttccgggag 300
caccccaccc tcaaccccag gcagaaggca actttggcgc agcagctcgg gcttcggcct 360
cggcaggtcg aggtgtggtt tcagaacaga cgcgcaagga cgaagctgaa gcagacggag 420
gtggactgcg agttcctgaa gcgctgctgc gagacgctca cggaggagaa ccggaggctg 480
cagaaggagg tgcaggagct gcgagcgctc aagctcgtct cgccgcacct ctacatgaac 540
atgtccccgc ccaccacgct caccatgtgc ccctcctgcg agcgcgtctc caacaccaat 600
aacaactcca gcgccgccgc cgccgccgac cgccgcggca tcaggactac tactgccgca 660
ggcggcggca gcgtcgtcga caccgccgcc gacgggggca tcctctgcca ccgcccgatc 720
gccgtccggc cgcagcagtc atga 744
<210>264
<211>247
<212>PRT
<213>稻
<400>264
Met Met Glu Arg Ala Glu Asp Leu Arg Leu Ser Leu Ser Leu Ser Ser
1 5 10 15
Pro Leu Ile Ala Pro Arg Thr His His Val Ala Met Leu Phe His Ala
20 25 30
Pro Pro Glu Lys Arg Phe Leu Glu Met Pro Leu Leu Pro Ala Ala Lys
35 40 45
Arg Ser Glu Val Val Ala Ala Glu Glu Glu Arg Ala Gly Leu Arg Gly
50 55 60
Gly Gly Gly Ser Asp Glu Glu Asp Gly Gly Cys Gly Ile Asp Gly Ser
65 70 75 80
Arg Lys Lys Leu Arg Leu Ser Lys Asp Gln Ser Ala Val Leu Glu Asp
85 90 95
Ser Phe Arg Glu His Pro Thr Leu Asn Pro Arg Gln Lys Ala Thr Leu
100 105 110
Ala Gln Gln Leu Gly Leu Arg Pro Arg Gln Val Glu Val Trp Phe Gln
115 120 125
Asn Arg Arg Ala Arg Thr Lys Leu Lys Gln Thr Glu Val Asp Cys Glu
130 135 140
Phe Leu Lys Arg Cys Cys Glu Thr Leu Thr Glu Glu Asn Arg Arg Leu
145 150 155 160
Gln Lys Glu Val Gln Glu Leu Arg Ala Leu Lys Leu Val Ser Pro His
165 170 175
Leu Tyr Met Asn Met Ser Pro Pro Thr Thr Leu Thr Met Cys Pro Ser
180 185 190
Cys Glu Arg Val Ser Asn Thr Asn Asn Asn Ser Ser Ala Ala Ala Ala
195 200 205
Ala Asp Arg Arg Gly Ile Arg Thr Thr Thr Ala Ala Gly Gly Gly Ser
210 215 220
Val Val Asp Thr Ala Ala Asp Gly Gly Ile Leu Cys His Arg Pro Ile
225 230 235 240
Ala Val Arg Pro Gln Gln Ser
245
<210>265
<211>846
<212>DNA
<213>稻
<400>265
atgaggtcgt acatggacgg cggcggcgcg gcggcgtacg aggaggagga ggaggaggtt 60
gaggacgacg acggcggcgg cggcggcggc ggcggcggcg gcggtggggg gctcggggag 120
aagaagcggc ggctggcggc ggagcaggtg cgggcgctgg agcggagctt cgaggcggac 180
aacaagctgg acccggagcg gaaggcccgg atcgcccgcg accttcgcct ccaccctcgc 240
caggtcgccg tctggttcca gaaccgccgc gcgaggtgga agaccaagca gatcgagcgc 300
gacttcgccg ccctccgctc ccgccacgac gccctccgcc tcgagtgcga cgccctccgc 360
cgcgacaagg acgccctcgc cgccgagatc gccgacctcc gggacagggt ggacggccag 420
atgtccgtca agctggaggc cgtggccgcg gacgaacacc agccgcctcc gccgccgccg 480
ccgccgccac tggcgtataa cagcaaggtg gtggacggct cgacggacag cgactcgagc 540
gcggtgttca acgaggaggc gtcgccgtac tccggcgcgg ccatcgacca ccaccaccac 600
caaactccgg cgagctacga cacggcgggg ttcacctcct tcttcgcgcc atccaccacg 660
ctcacctcgt ccctctcctt cccttccatg ttccacgcgt catcgcattt cgatggccac 720
caagaactcc tcgtcggcgg cggcggcgcc ggcgcagtgg ccgacgccga cctcggaggc 780
gccggattct tcgccggcga cgagcacgcc ggcggcctct cctggtacgg cgccgagggt 840
tggtag 846
<210>266
<211>281
<212>PRT
<213>稻
<400>266
Met Arg Ser Tyr Met Asp Gly Gly Gly Ala Ala Ala Tyr Glu Glu Glu
1 5 10 15
Glu Glu Glu Val Glu Asp Asp Asp Gly Gly Gly Gly Gly Gly Gly Gly
20 25 30
Gly Gly Gly Gly Gly Leu Gly Glu Lys Lys Arg Arg Leu Ala Ala Glu
35 40 45
Gln Val Arg Ala Leu Glu Arg Ser Phe Glu Ala Asp Asn Lys Leu Asp
50 55 60
Pro Glu Arg Lys Ala Arg Ile Ala Arg Asp Leu Arg Leu His Pro Arg
65 70 75 80
Gln Val Ala Val Trp Phe Gln Asn Arg Arg Ala Arg Trp Lys Thr Lys
85 90 95
Gln Ile Glu Arg Asp Phe Ala Ala Leu Arg Ser Arg His Asp Ala Leu
100 105 110
Arg Leu Glu Cys Asp Ala Leu Arg Arg Asp Lys Asp Ala Leu Ala Ala
115 120 125
Glu Ile Ala Asp Leu Arg Asp Arg Val Asp Gly Gln Met Ser Val Lys
130 135 140
Leu Glu Ala Val Ala Ala Asp Glu His Gln Pro Pro Pro Pro Pro Pro
145 150 155 160
Pro Pro Pro Leu Ala Tyr Asn Ser Lys Val Val Asp Gly Ser Thr Asp
165 170 175
Ser Asp Ser Ser Ala Val Phe Asn Glu Glu Ala Ser Pro Tyr Ser Gly
180 185 190
Ala Ala Ile Asp His His His His Gln Thr Pro Ala Ser Tyr Asp Thr
195 200 205
Ala Gly Phe Thr Ser Phe Phe Ala Pro Ser Thr Thr Leu Thr Ser Ser
210 215 220
Leu Ser Phe Pro Ser Met Phe His Ala Ser Ser His Phe Asp Gly His
225 230 235 240
Gln Glu Leu Leu Val Gly Gly Gly Gly Ala Gly Ala Val Ala Asp Ala
245 250 255
Asp Leu Gly Gly Ala Gly Phe Phe Ala Gly Asp Glu His Ala Gly Gly
260 265 270
Leu Ser Trp Tyr Gly Ala Glu Gly Trp
275 280
<210>267
<211>918
<212>DNA
<213>稻
<400>267
atgaagaggc ccagctgcag aggctcctcc atggccatca tccatgacac ctctgatcaa 60
caagaggaca acatgaggtc gtacatggac ggcggcggcg cggcggcgta cgaggaggag 120
gaggaggagg ttgaggacga cgacggcggc ggcggcggcg gcggcggcgg cggcggtggg 180
gggctcgggg agaagaagcg gcggctggcg gcggagcagg tgcgggcgct ggagcggagc 240
ttcgaggcgg acaacaagct ggacccggag cggaaggccc ggatcgcccg cgaccttcgc 300
ctccaccctc gccaggtcgc cgtctggttc cagaaccgcc gcgcgaggtg gaagaccaag 360
cagatcgagc gcgacttcgc cgccctccgc tcccgccacg acgccctccg cctcgagtgc 420
gacgccctcc gccgcgacaa ggacgccctc gccgccgaga tcgccgacct ccgggacagg 480
gtggacggcc agatgtccgt caagctggag gccgtggccg cggacgaaca ccagccgcct 540
ccgccgccgc cgccgccgcc actggcgtat aacagcaagg tggtggacgg ctcgacggac 600
agcgactcga gcgcggtgtt caacgaggag gcgtcgccgt actccggcgc ggccatcgac 660
caccaccacc accaaactcc ggcgagctac gacacggcgg ggttcacctc cttcttcgcg 720
ccatccacca cgctcacctc gtccctctcc ttcccttcca tgttccacgc gtcatcgcat 780
ttcgatggcc accaagaact cctcgtcggc ggcggcggcg ccggcgcagt ggccgacgcc 840
gacctcggag gcgccggatt cttcgccggc gacgagcacg ccggcggcct ctcctggtac 900
ggcgccgagg gttggtag 918
<210>268
<211>305
<212>PRT
<213>稻
<400>268
Met Lys Arg Pro Ser Cys Arg Gly Ser Ser Met Ala Ile Ile His Asp
1 5 10 15
Thr Ser Asp Gln Gln Glu Asp Asn Met Arg Ser Tyr Met Asp Gly Gly
20 25 30
Gly Ala Ala Ala Tyr Glu Glu Glu Glu Glu Glu Val Glu Asp Asp Asp
35 40 45
Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Leu Gly Glu
50 55 60
Lys Lys Arg Arg Leu Ala Ala Glu Gln Val Arg Ala Leu Glu Arg Ser
65 70 75 80
Phe Glu Ala Asp Asn Lys Leu Asp Pro Glu Arg Lys Ala Arg Ile Ala
85 90 95
Arg Asp Leu Arg Leu His Pro Arg Gln Val Ala Val Trp Phe Gln Asn
100 105 110
Arg Arg Ala Arg Trp Lys Thr Lys Gln Ile Glu Arg Asp Phe Ala Ala
115 120 125
Leu Arg Ser Arg His Asp Ala Leu Arg Leu Glu Cys Asp Ala Leu Arg
130 135 140
Arg Asp Lys Asp Ala Leu Ala Ala Glu Ile Ala Asp Leu Arg Asp Arg
145 150 155 160
Val Asp Gly Gln Met Ser Val Lys Leu Glu Ala Val Ala Ala Asp Glu
165 170 175
His Gln Pro Pro Pro Pro Pro Pro Pro Pro Pro Leu Ala Tyr Asn Ser
180 185 190
Lys Val Val Asp Gly Ser Thr Asp Ser Asp Ser Ser Ala Val Phe Asn
195 200 205
Glu Glu Ala Ser Pro Tyr Ser Gly Ala Ala Ile Asp His His His His
210 215 220
Gln Thr Pro Ala Ser Tyr Asp Thr Ala Gly Phe Thr Ser Phe Phe Ala
225 230 235 240
Pro Ser Thr Thr Leu Thr Ser Ser Leu Ser Phe Pro Ser Met Phe His
245 250 255
Ala Ser Ser His Phe Asp Gly His Gln Glu Leu Leu Val Gly Gly Gly
260 265 270
Gly Ala Gly Ala Val Ala Asp Ala Asp Leu Gly Gly Ala Gly Phe Phe
275 280 285
Ala Gly Asp Glu His Ala Gly Gly Leu Ser Trp Tyr Gly Ala Glu Gly
290 295 300
Trp
305
<210>269
<211>936
<212>DNA
<213>稻
<400>269
atgaagaggc ccaccagcag cagccgaaaa tccaaaaaac aaggagagga cctggcgttc 60
tctgaggagg gcagcttgcc cgcggtgacc atggagcaga aagatgaagc cgagatggag 120
gaggtggacg aggaggagga ggaggaggtc gacgaagaca tggccggcgg gcacgcggcg 180
cagtcgccgt cgccgtcgtg cgggctgggc gagaagaagc ggcggctggc gctggagcag 240
gtgcgcgctc tggagcggag cttcgacacg gacaacaagc tggacccgga ccgcaaggcc 300
cgcatcgcgc gcgacctcgg cctgcagccg cgccaggtcg ccgtctggtt ccagaaccgc 360
cgcgcccggt ggaagacgaa gcagctcgag cgcgacttcg ccgccctccg cgcccgccac 420
gacgccctcc gcgccgactg cgacgccctg cgccgcgaca aggacgccct cgccgccgag 480
attcgggagc tgagggagaa gctgcccacc aagccggcgg acacggcggc atcggtgaag 540
gtagaagccg gcaatgacgc ggcggccggc gccgcggccg ccacggtgtg caaggacggc 600
tcgtcggacg acagcgactc cagcgtggtg ttcaacgacg aggcgtcgcc gtactccggc 660
gcggccttca ttggattcgg cccgtcgttc ttggtcgacg acgcgtcggc ggcaaccgtg 720
ggctgctcgt cgtcgctccc cgcgctcgag tccaaatggc acggtccgta ctccgacgac 780
tcgtgcaaag gcggcgtcta tggcttcacg gaggaatggc tcgctgcctg ctccggcgag 840
atggccggca acgacgccgc cggcttcttc tccgacgagc acgcctccaa cctcaacttc 900
ggttggtgcg cgagtggtaa cgagggttgg gaatga 936
<210>270
<211>311
<212>PRT
<213>稻
<400>270
Met Lys Arg Pro Thr Ser Ser Ser Arg Lys Ser Lys Lys Gln Gly Glu
1 5 10 15
Asp Leu Ala Phe Ser Glu Glu Gly Ser Leu Pro Ala Val Thr Met Glu
20 25 30
Gln Lys Asp Glu Ala Glu Met Glu Glu Val Asp Glu Glu Glu Glu Glu
35 40 45
Glu Val Asp Glu Asp Met Ala Gly Gly His Ala Ala Gln Ser Pro Ser
50 55 60
Pro Ser Cys Gly Leu Gly Glu Lys Lys Arg Arg Leu Ala Leu Glu Gln
65 70 75 80
Val Arg Ala Leu Glu Arg Ser Phe Asp Thr Asp Asn Lys Leu Asp Pro
85 90 95
Asp Arg Lys Ala Arg Ile Ala Arg Asp Leu Gly Leu Gln Pro Arg Gln
100 105 110
Val Ala Val Trp Phe Gln Asn Arg Arg Ala Arg Trp Lys Thr Lys Gln
115 120 125
Leu Glu Arg Asp Phe Ala Ala Leu Arg Ala Arg His Asp Ala Leu Arg
130 135 140
Ala Asp Cys Asp Ala Leu Arg Arg Asp Lys Asp Ala Leu Ala Ala Glu
145 150 155 160
Ile Arg Glu Leu Arg Glu Lys Leu Pro Thr Lys Pro Ala Asp Thr Ala
165 170 175
Ala Ser Val Lys Val Glu Ala Gly Asn Asp Ala Ala Ala Gly Ala Ala
180 185 190
Ala Ala Thr Val Cys Lys Asp Gly Ser Ser Asp Asp Ser Asp Ser Ser
195 200 205
Val Val Phe Asn Asp Glu Ala Ser Pro Tyr Ser Gly Ala Ala Phe Ile
210 215 220
Gly Phe Gly Pro Ser Phe Leu Val Asp Asp Ala Ser Ala Ala Thr Val
225 230 235 240
Gly Cys Ser Ser Ser Leu Pro Ala Leu Glu Ser Lys Trp His Gly Pro
245 250 255
Tyr Ser Asp Asp Ser Cys Lys Gly Gly Val Tyr Gly Phe Thr Glu Glu
260 265 270
Trp Leu Ala Ala Cys Ser Gly Glu Met Ala Gly Asn Asp Ala Ala Gly
275 280 285
Phe Phe Ser Asp Glu His Ala Ser Asn Leu Asn Phe Gly Trp Cys Ala
290 295 300
Ser Gly Asn Glu Gly Trp Glu
305 310
<210>271
<211>810
<212>DNA
<213>稻
<400>271
atgagaagtc cagcagcgct tctcccggtg gttgcagatg gtggtggtgg tgttggggtg 60
gaggaggaga tggatgtgga cgaggacatg gcgatgtgcg gcggccgcgg cggcggcggc 120
ggggagaaga agcggcggct gagcgtggag caggtgcgcg cgctggagcg gagcttcgag 180
acggagaaca agctggagcc ggagcggaag gcgcggctgg cgcgcgacct cgggctgcag 240
ccgcgccagg tcgccgtctg gttccagaac cgccgcgcgc ggtggaagac caagcagctc 300
gagcgcgact acgccgcgct ccgccaatcc tacgacgcgc tccgcgccga ccacgacgcg 360
cttcgccgcg acaaggacgc cctcctcgcc gagatcaagg agctgaaggg gaagctcggc 420
gacgaggacg ccgcggcgag cttctcgtcg gtgaaggagg aggaggaccc ggcggcgtcc 480
gacgccgacc ccccggccac cggcgcgccg cagggctcgt ccgagagcga ctcgagcgcg 540
gtgctgaacg acgcggagat ccttccacac aagccagcgc cggcggccgc cgccgacgcc 600
gcggcctcgg aggagacgga ggcggtggtg accggcgccg cgctgctcca ccacgccgag 660
gtgttcttcc acgggcagct tctcaaggtg gacgacgacg aggcggcgtt cctaggcgac 720
gacggcgcgg cgtgcggcgg cttcttcgcc gacgagcatc tcccgtcgct gccgtggtgg 780
gccgagccca ccgagcaatg gacgacctag 810
<210>272
<211>269
<212>PRT
<213>稻
<400>272
Met Arg Ser Pro Ala Ala Leu Leu Pro Val Val Ala Asp Gly Gly Gly
1 5 10 15
Gly Val Gly Val Glu Glu Glu Met Asp Val Asp Glu Asp Met Ala Met
20 25 30
Cys Gly Gly Arg Gly Gly Gly Gly Gly Glu Lys Lys Arg Arg Leu Ser
35 40 45
Val Glu Gln Val Arg Ala Leu Glu Arg Ser Phe Glu Thr Glu Asn Lys
50 55 60
Leu Glu Pro Glu Arg Lys Ala Arg Leu Ala Arg Asp Leu Gly Leu Gln
65 70 75 80
Pro Arg Gln Val Ala Val Trp Phe Gln Asn Arg Arg Ala Arg Trp Lys
85 90 95
Thr Lys Gln Leu Glu Arg Asp Tyr Ala Ala Leu Arg Gln Ser Tyr Asp
100 105 110
Ala Leu Arg Ala Asp His Asp Ala Leu Arg Arg Asp Lys Asp Ala Leu
115 120 125
Leu Ala Glu Ile Lys Glu Leu Lys Gly Lys Leu Gly Asp Glu Asp Ala
130 135 140
Ala Ala Ser Phe Ser Ser Val Lys Glu Glu Glu Asp Pro Ala Ala Ser
145 150 155 160
Asp Ala Asp Pro Pro Ala Thr Gly Ala Pro Gln Gly Ser Ser Glu Ser
165 170 175
Asp Ser Ser Ala Val Leu Asn Asp Ala Glu Ile Leu Pro His Lys Pro
180 185 190
Ala Pro Ala Ala Ala Ala Asp Ala Ala Ala Ser Glu Glu Thr Glu Ala
195 200 205
Val Val Thr Gly Ala Ala Leu Leu His His Ala Glu Val Phe Phe His
210 215 220
Gly Gln Leu Leu Lys Val Asp Asp Asp Glu Ala Ala Phe Leu Gly Asp
225 230 235 240
Asp Gly Ala Ala Cys Gly Gly Phe Phe Ala Asp Glu His Leu Pro Ser
245 250 255
Leu Pro Trp Trp Ala Glu Pro Thr Glu Gln Trp Thr Thr
260 265
<210>273
<211>834
<212>DNA
<213>稻
<400>273
atgaagcgac ccggcggtgc cggcggcggc ggaggcagcc catcgctcgt cacgatggct 60
aattctagtg atgatggata tggaggggtt gggatggagg cggaggggga cgtggaggag 120
gagatgatgg cgtgcggcgg cggcggggag aagaagcggc ggctgagcgt ggagcaggtt 180
cgcgcgctgg agcggagctt cgaggtggag aacaagcttg agcctgagcg gaaggcgcgg 240
ctggcgcgcg acctcggcct gcagccgcgc caggtcgccg tctggttcca gaaccgccgc 300
gcgcggtgga agaccaagca gctcgagcgc gactacgccg cgctccgcca ttcctacgac 360
tccctgcgcc tcgatcacga cgcgctccgc cgcgacaagg acgccctcct cgccgagatc 420
aaggagctga aggcgaagct cggggacgag gaggcggcgg cgagcttcac gtcggtgaag 480
gaggagccgg cggcctccga cgggccaccg gcggcgggat ttgggtcgtc cgacagcgac 540
tcaagcgcgg tgctgaacga cgtggacgcg gccggcgccg cgcccgcggc gacggacgcg 600
ctggctccgg aggcgtgcac gtttctcggc gcgccgcccg ccgcgggcgc gggcgcgggc 660
gcagcggcgg cggcgagcca cgaggaggtg ttcttccacg gcaatttcct caaggtggag 720
gaggacgaga cggggttcct cgacgacgac gagccgtgcg gcgggttctt cgccgacgat 780
cagcccccgc cgctgtcgtc gtggtgggcc gagcccacgg agcactggaa ctga 834
<210>274
<211>277
<212>PRT
<213>稻
<400>274
Met Lys Arg Pro Gly Gly Ala Gly Gly Gly Gly Gly Ser Pro Ser Leu
1 5 10 15
Val Thr Met Ala Asn Ser Ser Asp Asp Gly Tyr Gly Gly Val Gly Met
20 25 30
Glu Ala Glu Gly Asp Val Glu Glu Glu Met Met Ala Cys Gly Gly Gly
35 40 45
Gly Glu Lys Lys Arg Arg Leu Ser Val Glu Gln Val Arg Ala Leu Glu
50 55 60
Arg Ser Phe Glu Val Glu Asn Lys Leu Glu Pro Glu Arg Lys Ala Arg
65 70 75 80
Leu Ala Arg Asp Leu Gly Leu Gln Pro Arg Gln Val Ala Val Trp Phe
85 90 95
Gln Asn Arg Arg Ala Arg Trp Lys Thr Lys Gln Leu Glu Arg Asp Tyr
100 105 110
Ala Ala Leu Arg His Ser Tyr Asp Ser Leu Arg Leu Asp His Asp Ala
115 120 125
Leu Arg Arg Asp Lys Asp Ala Leu Leu Ala Glu Ile Lys Glu Leu Lys
130 135 140
Ala Lys Leu Gly Asp Glu Glu Ala Ala Ala Ser Phe Thr Ser Val Lys
145 150 155 160
Glu Glu Pro Ala Ala Ser Asp Gly Pro Pro Ala Ala Gly Phe Gly Ser
165 170 175
Ser Asp Ser Asp Ser Ser Ala Val Leu Asn Asp Val Asp Ala Ala Gly
180 185 190
Ala Ala Pro Ala Ala Thr Asp Ala Leu Ala Pro Glu Ala Cys Thr Phe
195 200 205
Leu Gly Ala Pro Pro Ala Ala Gly Ala Gly Ala Gly Ala Ala Ala Ala
210 215 220
Ala Ser His Glu Glu Val Phe Phe His Gly Asn Phe Leu Lys Val Glu
225 230 235 240
Glu Asp Glu Thr Gly Phe Leu Asp Asp Asp Glu Pro Cys Gly Gly Phe
245 250 255
Phe Ala Asp Asp Gln Pro Pro Pro Leu Ser Ser Trp Trp Ala Glu Pro
260 265 270
Thr Glu His Trp Asn
275
<210>275
<211>375
<212>DNA
<213>稻
<400>275
atgtcatcct ctctctttct tcttcctcct ctctttcttt ctctcttctc tccccttcgg 60
ctagccgcag ggagcacggg ctggggcggt agtgggcggg gacaagagag gcggagggag 120
ctgaagcggc gccggcggcg gcacacgctc tccagcctca gcggcaagcg tggtgcgcca 180
tctgccgctg ccgccgccgt cggcggcagc gacgacgagg actccgacga cggatcccgc 240
aagaagctcc gcctctccaa ggaccaagcc gccgtcctcg aggacacctt caacaagcac 300
aacaccctca accccaagca gaaggcggcg ctggcgaggc agctgaatct gaagccgcgg 360
caggtggagg tgtag 375
<210>276
<211>124
<212>PRT
<213>稻
<400>276
Met Ser Ser Ser Leu Phe Leu Leu Pro Pro Leu Phe Leu Ser Leu Phe
1 5 10 15
Ser Pro Leu Arg Leu Ala Ala Gly Ser Thr Gly Trp Gly Gly Ser Gly
20 25 30
Arg Gly Gln Glu Arg Arg Arg Glu Leu Lys Arg Arg Arg Arg Arg His
35 40 45
Thr Leu Ser Ser Leu Ser Gly Lys Arg Gly Ala Pro Ser Ala Ala Ala
50 55 60
Ala Ala Val Gly Gly Ser Asp Asp Glu Asp Ser Asp Asp Gly Ser Arg
65 70 75 80
Lys Lys Leu Arg Leu Ser Lys Asp Gln Ala Ala Val Leu Glu Asp Thr
85 90 95
Phe Asn Lys His Asn Thr Leu Asn Pro Lys Gln Lys Ala Ala Leu Ala
100 105 110
Arg Gln Leu Asn Leu Lys Pro Arg Gln Val Glu Val
115 120
<210>277
<211>1767
<212>DNA
<213>稻
<400>277
atgttttatt caagtccctt ttgttcatct cctttgcaga ttccatttct gacccaaatt 60
ttggctattc ctcatgatga gtttgtctca aactggtgct ctgttaatct gccagtgata 120
gaagaagacg ctaatcttga ttatgatcca tttggtgcag ctgagctggc actggcagct 180
gctggtaata agttaactga agctaaagca aactattctt gcccttttcg ccctatcagt 240
atgccttcta tagcatatgc gcagacaaga acatcatgtg tggtgaaaat aatagcaaat 300
ttgcatgttt ttgtcccaaa catatgcgaa gagcaagaaa gagacctttt tcttcagaaa 360
tttcagaagt acttggtatc agggaatcct agatcatcag ttgatcatcc agcatcagct 420
gatctcaagg ccactacagt ttgcagaaac ttgggatctt tgtctgagta tgctagatcg 480
ttaattccta ataacttgtt aaacgaggaa gatgtgcaat tgttaagtga atttgcttat 540
aagttacaaa cttggtgtaa atcacatgtt ggacagagta catcccaggc agtaaagatt 600
gatccgtcat cagaaagcaa ggaagacttt aagccactgc agcatccctt gataccaagt 660
actgttgttc cagattccag tataaataac cttccgaaga acatggaaga gcctacacca 720
acaaacatgg aagagcctgc accaacaccc tcaacaaagc aagagggaaa tgccagggat 780
gagactccta gaagcactgt cgctttaaat ggtgggttcc tgcagaattc agtcggccag 840
gacttagtcc atcttggtgt ggcgagaact agttcaggct ttctaggggg aggtaccagt 900
acaagtacag gatccctgcg ctgcaaaatg gatcttgatc ctgcatccag cagtatggac 960
catttcaaaa caccagatag aaaagaaagt ggtcttcagg atgatgagaa aggagacact 1020
cacatgtatg atgagagaca acctaagaga aggaagcgaa ccattatgaa tgataggcaa 1080
ataaacgaaa tcgagaaggc tcttattgat gagcctgaga tgcataagaa tgctgcttta 1140
ctgcaggcat ggtcagagaa gttaagtggg cagggctcgg agattacgtc atctcagcta 1200
aagaattggc tgaacaacag aaaagctaag cttgctcgta ttgcgaaaga aagaggagta 1260
ctatctgagg gtgagaacgc agataagcca tctacgccag ctactcccca ccactgtgac 1320
tcctcagaaa gtgctggcga ggagagctac ttgccacctg cgagggtcat gagtgctcta 1380
ggcatatcca agggcagcag atttgtgagc ccagatggca atgagacaac atcacaggca 1440
gaattcaatc aaaatatcat gcttagccgc cctttcacaa gatcattctc atttgaacct 1500
ggccgtcttg tttcgctcat tgataatgat gggaaggagg ttggcagggg aaagatcttc 1560
caagttgagg ggagactgca agggaaggcc ctgacagata ctcgcgtttg catcgttgat 1620
gttattgagc tcaagattga gaaatggcgg gagctacctc atccctcgga agcatcagga 1680
agaacattcc aagaggcaga atcaaggaac ggtggtgtga tgagggtcgc gtgggatgtc 1740
atcagactat ctccagtggt tcagtaa 1767
<210>278
<211>588
<212>PRT
<213>稻
<400>278
Met Phe Tyr Ser Ser Pro Phe Cys Ser Ser Pro Leu Gln Ile Pro Phe
1 5 10 15
Leu Thr Gln Ile Leu Ala Ile Pro His Asp Glu Phe Val Ser Asn Trp
20 25 30
Cys Ser Val Asn Leu Pro Val Ile Glu Glu Asp Ala Asn Leu Asp Tyr
35 40 45
Asp Pro Phe Gly Ala Ala Glu Leu Ala Leu Ala Ala Ala Gly Asn Lys
50 55 60
Leu Thr Glu Ala Lys Ala Asn Tyr Ser Cys Pro Phe Arg Pro Ile Ser
65 70 75 80
Met Pro Ser Ile Ala Tyr Ala Gln Thr Arg Thr Ser Cys Val Val Lys
85 90 95
Ile Ile Ala Asn Leu His Val Phe Val Pro Asn Ile Cys Glu Glu Gln
100 105 110
Glu Arg Asp Leu Phe Leu Gln Lys Phe Gln Lys Tyr Leu Val Ser Gly
115 120 125
Asn Pro Arg Ser Ser Val Asp His Pro Ala Ser Ala Asp Leu Lys Ala
130 135 140
Thr Thr Val Cys Arg Asn Leu Gly Ser Leu Ser Glu Tyr Ala Arg Ser
145 150 155 160
Leu Ile Pro Asn Asn Leu Leu Asn Glu Glu Asp Val Gln Leu Leu Ser
165 170 175
Glu Phe Ala Tyr Lys Leu Gln Thr Trp Cys Lys Ser His Val Gly Gln
180 185 190
Ser Thr Ser Gln Ala Val Lys Ile Asp Pro Ser Ser Glu Ser Lys Glu
195 200 205
Asp Phe Lys Pro Leu Gln His Pro Leu Ile Pro Ser Thr Val Val Pro
210 215 220
Asp Ser Ser Ile Asn Asn Leu Pro Lys Asn Met Glu Glu Pro Thr Pro
225 230 235 240
Thr Asn Met Glu Glu Pro Ala Pro Thr Pro Ser Thr Lys Gln Glu Gly
245 250 255
Asn Ala Arg Asp Glu Thr Pro Arg Ser Thr Val Ala Leu Asn Gly Gly
260 265 270
Phe Leu Gln Asn Ser Val Gly Gln Asp Leu Val His Leu Gly Val Ala
275 280 285
Arg Thr Ser Ser Gly Phe Leu Gly Gly Gly Thr Ser Thr Ser Thr Gly
290 295 300
Ser Leu Arg Cys Lys Met Asp Leu Asp Pro Ala Ser Ser Ser Met Asp
305 310 315 320
His Phe Lys Thr Pro Asp Arg Lys Glu Ser Gly Leu Gln Asp Asp Glu
325 330 335
Lys Gly Asp Thr His Met Tyr Asp Glu Arg Gln Pro Lys Arg Arg Lys
340 345 350
Arg Thr Ile Met Asn Asp Arg Gln Ile Asn Glu Ile Glu Lys Ala Leu
355 360 365
Ile Asp Glu Pro Glu Met His Lys Asn Ala Ala Leu Leu Gln Ala Trp
370 375 380
Ser Glu Lys Leu Ser Gly Gln Gly Ser Glu Ile Thr Ser Ser Gln Leu
385 390 395 400
Lys Asn Trp Leu Asn Asn Arg Lys Ala Lys Leu Ala Arg Ile Ala Lys
405 410 415
Glu Arg Gly Val Leu Ser Glu Gly Glu Asn Ala Asp Lys Pro Ser Thr
420 425 430
Pro Ala Thr Pro His His Cys Asp Ser Ser Glu Ser Ala Gly Glu Glu
435 440 445
Ser Tyr Leu Pro Pro Ala Arg Val Met Ser Ala Leu Gly Ile Ser Lys
450 455 460
Gly Ser Arg Phe Val Ser Pro Asp Gly Asn Glu Thr Thr Ser Gln Ala
465 470 475 480
Glu Phe Asn Gln Asn Ile Met Leu Ser Arg Pro Phe Thr Arg Ser Phe
485 490 495
Ser Phe Glu Pro Gly Arg Leu Val Ser Leu Ile Asp Asn Asp Gly Lys
500 505 510
Glu Val Gly Arg Gly Lys Ile Phe Gln Val Glu Gly Arg Leu Gln Gly
515 520 525
Lys Ala Leu Thr Asp Thr Arg Val Cys Ile Val Asp Val Ile Glu Leu
530 535 540
Lys Ile Glu Lys Trp Arg Glu Leu Pro His Pro Ser Glu Ala Ser Gly
545 550 555 560
Arg Thr Phe Gln Glu Ala Glu Ser Arg Asn Gly Gly Val Met Arg Val
565 570 575
Ala Trp Asp Val Ile Arg Leu Ser Pro Val Val Gln
580 585
<210>279
<211>6
<212>PRT
<213>人工序列
<220>
<223>基序I
<400>279
Arg Lys Lys Leu Arg Leu
1 5
<210>280
<211>24
<212>PRT
<213>人工序列
<220>
<223>基序II
<400>280
Thr Lys Leu Lys Gln Thr Gl u Val Asp Cys Glu Phe Leu Arg Arg Cys
1 5 10 15
Cys Glu Asn Leu Thr Glu Glu Asn
20
<210>281
<211>10
<212>PRT
<213>人工序列
<220>
<223>基序III
<400>281
Thr Leu Thr Met Cys Pro Ser Cys Glu Arg
1 5 10
<210>282
<211>2193
<212>DNA
<213>稻
<400>282
aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct 60
aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact 120
catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt 180
tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc 240
tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata 300
aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga 360
atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt 420
ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat 480
ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag 540
gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt 600
tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc 660
tgaattcaag cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat 720
aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa 780
aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca 840
acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag 900
tccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa 960
aaccaagcat cctcctcctc ccatctataa attcctcccc ccttttcccc tctctatata 1020
ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag 1080
cgaccgcctt cttcgatcca tatcttccgg tcgagttctt ggtcgatctc ttccctcctc 1140
cacctcctcc tcacagggta tgtgcccttc ggttgttctt ggatttattg ttctaggttg 1200
tgtagtacgg gcgttgatgt taggaaaggg gatctgtatc tgtgatgatt cctgttcttg 1260
gatttgggat agaggggttc ttgatgttgc atgttatcgg ttcggtttga ttagtagtat 1320
ggttttcaat cgtctggaga gctctatgga aatgaaatgg tttagggtac ggaatcttgc 1380
gattttgtga gtaccttttg tttgaggtaa aatcagagca ccggtgattt tgcttggtgt 1440
aataaaagta cggttgtttg gtcctcgatt ctggtagtga tgcttctcga tttgacgaag 1500
ctatcctttg tttattccct attgaacaaa aataatccaa ctttgaagac ggtcccgttg 1560
atgagattga atgattgatt cttaagcctg tccaaaattt cgcagctggc ttgtttagat 1620
acagtagtcc ccatcacgaa attcatggaa acagttataa tcctcaggaa caggggattc 1680
cctgttcttc cgatttgctt tagtcccaga attttttttc ccaaatatct taaaaagtca 1740
ctttctggtt cagttcaatg aattgattgc tacaaataat gcttttatag cgttatccta 1800
gctgtagttc agttaatagg taatacccct atagtttagt caggagaaga acttatccga 1860
tttctgatct ccatttttaa ttatatgaaa tgaactgtag cataagcagt attcatttgg 1920
attatttttt ttattagctc tcaccccttc attattctga gctgaaagtc tggcatgaac 1980
tgtcctcaat tttgttttca aattcacatc gattatctat gcattatcct cttgtatcta 2040
cctgtagaag tttctttttg gttattcctt gactgcttga ttacagaaag aaatttatga 2100
agctgtaatc gggatagtta tactgcttgt tcttatgatt catttccttt gtgcagttct 2160
tggtgtagct tgccactttc accagcaaag ttc 2193
<210>283
<211>58
<212>DNA
<213>人工序列
<220>
<223>引物:p01294
<400>283
ggggacaagt ttgtacaaaa aagcaggctt cacaatgatg ttcgagaaag acgatctg 58
<210>284
<211>52
<212>DNA
<213>人工序列
<220>
<223>引物:p00402
<400>284
ggggaccact ttgtacaaga aagctgggtt taggacctag gacgaagagc gt 52
<210>285
<211>622
<212>DNA
<213>拟南芥
<400>285
atgagcagac ccggagattg gaactgcagg tcatgcagcc atctcaactt ccagcgccgt 60
gactcttgcc agcgatgcgg tgactctcgt tccggccccg gtggagttgg tggcttagac 120
tttggtaatt tcggtggcag agccatgtct gctttcggat tcaccaccgg ctccgacgtt 180
cgtcccggtg attggtactg caccgtggga aactgcggga cacacaactt cgccagtcgc 240
tccacctgct tcaaatgcgg cactttcaag gacgagaccg gcgctggagg cggaggtggt 300
ggcatcggcg gtccggccat gtttgacgcc gacattatgc ggtctagagt ccccggtaac 360
ggtggtcgct ctagctggaa atccggcgac tggatttgca ctaggattgg ttgcaatgag 420
cataactttg caagcagaat ggaatgcttc aggtgcaatg caccaaggga cttcagcaac 480
agaacctctt tctaagttat acaaactgct tttgaagtag ccttgtctac ccagctttct 540
tgtacaaagt tggcattata agaaagcatt gcttatcaat ttgttgcaac gaacaggtca 600
ctatcagtca aaataaaatc at 622
<210>286
<211>164
<212>PRT
<213>拟南芥
<400>286
Met Ser Arg Pro Gly Asp Trp Asn Cys Arg Ser Cys Ser His Leu Asn
1 5 10 15
Phe Gln Arg Arg Asp Ser Cys Gln Arg Cys Gly Asp Ser Arg Ser Gly
20 25 30
Pro Gly Gly Val Gly Gly Leu Asp Phe Gly Asn Phe Gly Gly Arg Ala
35 40 45
Met Ser Ala Phe Gly Phe Thr Thr Gly Ser Asp Val Arg Pro Gly Asp
50 55 60
Trp Tyr Cys Thr Val Gly Asn Cys Gly Thr His Asn Phe Ala Ser Arg
65 70 75 80
Ser Thr Cys Phe Lys Cys Gly Thr Phe Lys Asp Glu Thr Gly Ala Gly
85 90 95
Gly Gly Gly Gly Gly Ile Gly Gly Pro Ala Met Phe Asp Ala Asp Ile
100 105 110
Met Arg Ser Arg Val Pro Gly Asn Gly Gly Arg Ser Ser Trp Lys Ser
115 120 125
Gly Asp Trp Ile Cys Thr Arg Ile Gly Cys Asn Glu His Asn Phe Ala
130 135 140
Ser Arg Met Glu Cys Phe Arg Cys Asn Ala Pro Arg Asp Phe Ser Asn
145 150 155 160
Arg Thr Ser Phe
<210>287
<211>717
<212>DNA
<213>陆地棉
<400>287
atgagcaggc caggagattg gaactgcagg tcatgccaac acctcaactt ccaaaggagg 60
gacaactgcc aacgttgcgg tgaatctcga tacggtgtta gagtcggctc gacattcggg 120
tttaccgctg gctcggacgt tcgacctggt gactggtatt gcacggctgg aaactgcggc 180
acccacaatt tcgccagccg gtctacttgt ttcaattgcg gcgcgttcaa ggacgagtcg 240
gctggaggtt tcgacttgga catgtctcga tcaagagggt tcggaggtaa ccgatccggc 300
tggaaatcag gggattggat atgtaccagg ttagggtgca atgaacataa ttttgctagc 360
agaatggaat gtttcagatg cagtgctcca agagaattca acaatagaac ttcatattaa 420
atcacatgca tgctactata tccatttttg ggtgttttga ggcaattaat aggagattat 480
aatgagagag tgttactggc tttgatgatg aacaccacaa gcattttgtc atgtttcttt 540
tataagattc atggcaatgt agtacttttt cttgtgatga ttatttatgg tttcaattct 600
atggttttat tgtcttttat tttagagagt tttatttata tttttgtaat ggtgctttgg 660
ctttattaaa agaagatgat tctcttctgt cttttcaaaa aaaaaaaaaa aaaaaaa 717
<210>288
<211>139
<212>PRT
<213>陆地棉
<400>288
Met Ser Arg Pro Gly Asp Trp Asn Cys Arg Ser Cys Gln His Leu Asn
1 5 10 15
Phe Gln Arg Arg Asp Asn Cys Gln Arg Cys Gly Glu Ser Arg Tyr Gly
20 25 30
Val Arg Val Gly Ser Thr Phe Gly Phe Thr Ala Gly Ser Asp Val Arg
35 40 45
Pro Gly Asp Trp Tyr Cys Thr Ala Gly Asn Cys Gly Thr His Asn Phe
50 55 60
Ala Ser Arg Ser Thr Cys Phe Asn Cys Gly Ala Phe Lys Asp Glu Ser
65 70 75 80
Ala Gly Gly Phe Asp Leu Asp Met Ser Arg Ser Arg Gly Phe Gly Gly
85 90 95
Asn Arg Ser Gly Trp Lys Ser Gly Asp Trp Ile Cys Thr Arg Leu Gly
100 105 110
Cys Asn Glu His Asn Phe Ala Ser Arg Met Glu Cys Phe Arg Cys Ser
115 120 125
Ala Pro Arg Glu Phe Ash Asn Arg Thr Ser Tyr
130 135
<210>289
<211>937
<212>DNA
<213>玉蜀黍
<400>289
cgggcacgac cagcaacaca acagccgagc tttgcttagg caagatgaac aggaagccag 60
gagactggga ctgcagggcg tgccagcacc tcaacttcag ccgccgagac atatgccagc 120
gctgcagcga gccacgtgga gttgctgatc gtggcagtgg cggcggcgga ggaggcgact 180
acgccagctt cggtggccgc ggtggctcct ccttcggcgg cggctttggc gctgctggct 240
ccgacgtccg ccctggtgac tggtactgct cctgcggcgc gcacaacttc gccagccgct 300
ccagctgctt caagtgctcc gcctacaagg aggaggccgc tgtgaacagt ggcgctggcg 360
gctttgatgg cgacatgtca cgctcacggg gctacggctt cggcagcggt gctgctgctg 420
ctgctggtgc tggcgctgcc cgtactacca accgccccgg ttggaagtcc ggagactgga 480
tctgcaccag atccggatgc aacgagcaca acttcgccag caggatggag tgcttcaggt 540
gcaacgcacc gcgggactct ggcactgagg tgtaggatcg agcaagttaa aaagtctgca 600
gcgccgaaga aagcgacgac aagaggagtc ctcatcacgt cgtaacgtaa gagagagagt 660
agtggatttg caacaaagaa aaaaaaaaga cggccgcgat gctctgttac tagctagcta 720
gttttgttca accacccatg ccgtctcttc tcttttatta gatttggttt ggttctcata 780
gccctttaat taccatttgg gacctatgtt tgctgttctg tttcccgttc gtctcctccg 840
catgtttgcg cttggatcga gtcttgtgat gtaacccccc aaaaaacgct tgcttaacta 900
gtactgttgc ttcttaataa aaaaaaaaaa aaaaaaa 937
<210>290
<211>176
<212>PRT
<213>玉蜀黍
<400>290
Met Asn Arg Lys Pro Gly Asp Trp Asp Cys Arg Ala Cys Gln His Leu
1 5 10 15
Asn Phe Ser Arg Arg Asp Ile Cys Gln Arg Cys Ser Glu Pro Arg Gly
20 25 30
Val Ala Asp Arg Gly Ser Gly Gly Gly Gly Gly Gly Asp Tyr Ala Ser
35 40 45
Phe Gly Gly Arg Gly Gly Ser Ser Phe Gly Gly Gly Phe Gly Ala Ala
50 55 60
Gly Ser Asp Val Arg Pro Gly Asp Trp Tyr Cys Ser Cys Gly Ala His
65 70 75 80
Asn Phe Ala Ser Arg Ser Ser Cys Phe Lys Cys Ser Ala Tyr Lys Glu
85 90 95
Glu Ala Ala Val Asn Ser Gly Ala Gly Gly Phe Asp Gly Asp Met Ser
100 105 110
Arg Ser Arg Gly Tyr Gly Phe Gly Ser Gly Ala Ala Ala Ala Ala Gly
115 120 125
Ala Gly Ala Ala Arg Thr Thr Asn Arg Pro Gly Trp Lys Ser Gly Asp
130 135 140
Trp Ile Cys Thr Arg Ser Gly Cys Asn Glu His Asn Phe Ala Ser Arg
145 150 155 160
Met Glu Cys Phe Arg Cys Asn Ala Pro Arg Asp Ser Gly Thr Glu Val
165 170 175
<210>291
<211>501
<212>DNA
<213>稻
<400>291
atgaacagga agccaggaga ctgggactgc agggcgtgcc agcacctcaa cttcagccgc 60
cgggacctat gccagcgctg cggcgagccg cgtggcgccg ctgatcgcgg cagcggtggt 120
ggcggtgact acgccaactt cggcggccgt ggtggttcct ccttcggtgg aggctttggc 180
actggctctg atgtccgccc aggtgactgg tactgcaact gcggcgcgca caacttcgcc 240
agccgctcca gctgcttcaa gtgcgctgct ttcaaggacg atgctgccgt caacagtggc 300
ggcgctggtg cctttgatgg tggggacatg tcgcgctcgc ggggctacgg cttcggcagc 360
ggcgccgtcc gcgccagccg ccctggctgg aagtctggcg actggatttg caccaggtct 420
ggatgcaatg agcacaactt cgccagcagg atggagtgct tcaggtgcaa cgcaccgcgg 480
gactccggca ctgaggtgta a 501
<210>292
<211>166
<212>PRT
<213>稻
<400>292
Met Asn Arg Lys Pro Gly Asp Trp Asp Cys Arg Ala Cys Gln His Leu
1 5 10 15
Asn Phe Ser Arg Arg Asp Leu Cys Gln Arg Cys Gly Glu Pro Arg Gly
20 25 30
Ala Ala Asp Arg Gly Ser Gly Gly Gly Gly Asp Tyr Ala Asn Phe Gly
35 40 45
Gly Arg Gly Gly Ser Ser Phe Gly Gly Gly Phe Gly Thr Gly Ser Asp
50 55 60
Val Arg Pro Gly Asp Trp Tyr Cys Asn Cys Gly Ala His Asn Phe Ala
65 70 75 80
Ser Arg Ser Ser Cys Phe Lys Cys Ala Ala Phe Lys Asp Asp Ala Ala
85 90 95
Val Asn Ser Gly Gly Ala Gly Ala Phe Asp Gly Gly Asp Met Ser Arg
100 105 110
Ser Arg Gly Tyr Gly Phe Gly Ser Gly Ala Val Arg Ala Ser Arg Pro
115 120 125
Gly Trp Lys Ser Gly Asp Trp Ile Cys Thr Arg Ser Gly Cys Asn Glu
130 135 140
His Asn Phe Ala Ser Arg Met Glu Cys Phe Arg Cys Asn Ala Pro Arg
145 150 155 160
Asp Ser Gly Thr Glu Val
165
<210>293
<211>859
<212>DNA
<213>拟南芥
<400>293
ataagctctt acactcattt caactctctt tttcgtttcc attaccctca gaagaagatg 60
aataggccgg gagattggaa ctgcagattg tgtagccacc tcaacttcca gaggagggat 120
tcatgccaac gttgtagaga gcctagaccg ggcgggatca gtaccgattt actcagcggt 180
tttggtggcc gtccggttag tagctccttc ggtttcaaca ccgggcccga tgtgcgaccc 240
ggggattggt attgcaacct tggggattgt gggacacata attttgccaa taggtccagt 300
tgtttcaagt gtggtgccgc aaaagatgag ttttcatgct caagtgctgc tgcaacaacc 360
gggtttatgg acatgaatgt tggtccgaga cgtggccttt ttggttttgg cggcagcagt 420
agtggtggtg gtggtacggg ccgttctcct tggaaatctg gagattggat ttgcccaagg 480
tcaggctgta acgaacataa cttcgcaagc aggtcagagt gtttcaggtg taacgcacca 540
aaggaacttg ccaccgaacc accctattag tcatttagtc ctcctacctt cttcatcatt 600
tccaatactc tggaagcatt agaggagagc agaaaggtga agaatcgaag caagataccg 660
accgccctta atctcttgat ttgtttaatt tcttagattt gactcgtttt atatctcgta 720
gtagtcagac ctatgttaga atgtaagcat gtcgagagtt ttccgaagca ttttgttctg 780
atatcggtct cctagctagt atgtaagttt gtttgaatgt attcttattt ctgataaagt 840
tgtttccttc tgattccgc 859
<210>294
<211>170
<212>PRT
<213>拟南芥
<400>294
Met Asn Arg Pro Gly Asp Trp Asn Cys Arg Leu Cys Ser His Leu Asn
1 5 10 15
Phe Gln Arg Arg Asp Ser Cys Gln Arg Cys Arg Glu Pro Arg Pro Gly
20 25 30
Gly Ile Ser Thr Asp Leu Leu Ser Gly Phe Gly Gly Arg Pro Val Ser
35 40 45
Ser Ser Phe Gly Phe Asn Thr Gly Pro Asp Val Arg Pro Gly Asp Trp
50 55 60
Tyr Cys Asn Leu Gly Asp Cys Gly Thr His Asn Phe Ala Asn Arg Ser
65 70 75 80
Ser Cys Phe Lys Cys Gly Ala Ala Lys Asp Glu Phe Ser Cys Ser Ser
85 90 95
Ala Ala Ala Thr Thr Gly Phe Met Asp Met Asn Val Gly Pro Arg Arg
100 105 110
Gly Leu Phe Gly Phe Gly Gly Ser Ser Ser Gly Gly Gly Gly Thr Gly
115 120 125
Arg Ser Pro Trp Lys Ser Gly Asp Trp Ile Cys Pro Arg Ser Gly Cys
130 135 140
Asn Glu His Asn Phe Ala Ser Arg Ser Glu Cys Phe Arg Cys Asn Ala
145 150 155 160
Pro Lys Glu Leu Ala Thr Glu Pro Pro Tyr
165 170
<210>295
<211>834
<212>DNA
<213>稻
<400>295
cctagtacta agaacagcaa ccacctctga aagctttaca agttcgcagg ggcttaactg 60
cgaatgaaca tccagaggaa gccaggagac tggaactgca aatcgtgcca gcatctcaac 120
ttcagccgcc gggactactg ccagcgctgc cataccccac gccaggacct gccgcttggc 180
gatggttatg tcccaggtgg tgtgctgtcc tccctggaca ttcgcccggg cgactggtac 240
tgcaactgcg gctatcacaa ctttgctagc cgagcaagct gcttcaaatg tggcgccatt 300
gtgaaggacc ttccagcagg ccaaggtggt ggtgttgcca acggtgactt tgcccgtgcc 360
ctcgacagca gcgcagttcg tgctgggtgg aaggcgggtg actggatttg cacaaggcct 420
ggttgcaacg tccacaactt tgcaagtagg attgagtgct ataggtgcaa tgcacctagg 480
gaagcaggta atgtgaagta agaaaagact gacgcgacca aagatcgtga gacgtgacga 540
gctggccgag gatgaataaa gtgactgctg tcagttgtca cattcacagg ctgcgatcca 600
gaaactatgg atgggactat gtagtaacgt gctgatatat tattgctaag tgttactact 660
gcatggttgc aagggtggta gaagtacctt agcttccaag atcgttgtaa tgtgtgagtt 720
taattttggc gttttaagta ataagtctag tgattgcagg attgtacggg gtaatgtact 780
tgcattatcc attataatct taagcatcca atataattat gcaaaaaaaa aaaa 834
<210>296
<211>145
<212>PRT
<213>稻
<400>296
Met Asn Ile Gln Arg Lys Pro Gly Asp Trp Asn Cys Lys Ser Cys Gln
1 5 10 15
His Leu Asn Phe Ser Arg Arg Asp Tyr Cys Gln Arg Cys His Thr Pro
20 25 30
Arg Gln Asp Leu Pro Leu Gly Asp Gly Tyr Val Pro Gly Gly Val Leu
35 40 45
Ser Ser Leu Asp Ile Arg Pro Gly Asp Trp Tyr Cys Asn Cys Gly Tyr
50 55 60
His Asn Phe Ala Ser Arg Ala Ser Cys Phe Lys Cys Gly Ala Ile Val
65 70 75 80
Lys Asp Leu Pro Ala Gly Gln Gly Gly Gly Val Ala Asn Gly Asp Phe
85 90 95
Ala Arg Ala Leu Asp Ser Ser Ala Val Arg Ala Gly Trp Lys Ala Gly
l00 105 110
Asp Trp Ile Cys Thr Arg Pro Gly Cys Asn Val His Asn Phe Ala Ser
115 120 125
Arg Ile Glu Cys Tyr Arg Cys Asn Ala Pro Arg Glu Ala Gly Asn Val
130 135 140
Lys
145
<210>297
<211>958
<212>DNA
<213>稻
<400>297
aagcctccat ccatccatcc attcatcaga gctcaagctc aagcaagcaa gcttgctagc 60
tagctgctga gcagcattcc agtctgctcc agctagctca gctctctctg ctctgctctt 120
tgctcgataa cgaccatcat cttcttcttc ttcttcttct tcttcttctt cttcttcttg 180
tacattctat ttgctcgata gatagataga tagatagata ggtagataga gatggagacg 240
aaggcggcgg cgatggcgat gaggaagccg ggggactgga gctgcaggtc gtgccagtac 300
gtgaacttct gcaagaggga ggcgtgccag cggtgcgggg aggcgaagct cggggtggag 360
cggacggact acgccgccat gggcggcggg tgggaggtga agcccggcga ctggtgctgc 420
cgctgctgcg ccgtcaacaa ctacgccagc cgcggcagct gcttcaagtg cggcgccgcc 480
aagaacgact ccgccgccgc cgtcgcccag ggctggggct tctccgtcgc ctcccaggcc 540
ggctggaaga acggcgactg gatctgcccc agaatggaat gcaacgtgca gaactacgct 600
aacagaaccg agtgcttccg gtgcaatttc cccagatact acgttgattg atctgacata 660
tatgatatat gccttgcact gagaagaaat gaaagggaaa taaaatttac gagatcgaag 720
atcgacggac aagattgatc ggccaccggt catgcccttc agggttttct tttttctatt 780
tttttttaga ataaccctcg ataacctgag ggtttttttt catttgtaag agcggtaacg 840
gtactaaaaa aacacaaaaa cggcacaaaa ttgtggctga tgactgatca gtcttcctct 900
tttttttccc aataaaaggc agataattaa gaaagcaaaa ttattaaaaa aaaaaaaa 958
<210>298
<211>139
<212>PRT
<213>稻
<400>298
Met Glu Thr Lys Ala Ala Ala Met Ala Met Arg Lys Pro Gly Asp Trp
1 5 10 15
Ser Cys Arg Ser Cys Gln Tyr Val Asn Phe Cys Lys Arg Glu Ala Cys
20 25 30
Gln Arg Cys Gly Glu Ala Lys Leu Gly Val Glu Arg Thr Asp Tyr Ala
35 40 45
Ala Met Gly Gly Gly Trp Glu Val Lys Pro Gly Asp Trp Cys Cys Arg
50 55 60
Cys Cys Ala Val Asn Asn Tyr Ala Ser Arg Gly Ser Cys Phe Lys Cys
65 70 75 80
Gly Ala Ala Lys Asn Asp Ser Ala Ala Ala Val Ala Gln Gly Trp Gly
85 90 95
Phe Ser Val Ala Ser Gln Ala Gly Trp Lys Asn Gly Asp Trp Ile Cys
100 105 110
Pro Arg Met Glu Cys Asn Val Gln Asn Tyr Ala Asn Arg Thr Glu Cys
115 120 125
Phe Arg Cys Asn Phe Pro Arg Tyr Tyr Val Asp
130 135
<210>299
<211>519
<212>DNA
<213>甜菜(Beta vulgaris)
<400>299
atgagtaggc caggtgattg gaattgtagg tcatgcagcc acttgaactt ccaaaggagg 60
gactcctgcc agcgctgtgg ggacgtacgt cctgacggcc gaggcggcgg agggggagga 120
ggagactttg gcagtagctt tggagggagg tcaggtgggt ccccctttgg tgggggtttt 180
gcagggcccg atgttaggcc cggtgattgg tattgtagca ttggcaactg tggggcccac 240
aactttgcca gcaggtctag ctgcttcaag tgtggggcct acaaagagga agctggctgt 300
ggtgatagca tgggccgttc acgtggagga ttttcctttg gtggcatcgg cggtggcggt 360
agcggtgccg ctaccggccg ctcaggctgg aaatccggtg actggatttg cactaggtcg 420
ggttgcaacg agcataactt cgctagtagg actgagtgct tcagatgcag ggaaccaagg 480
gactccggta atgcaatgct aaaggaagta ccatgctga 519
<210>300
<211>172
<212>PRT
<213>甜菜
<400>300
Met Ser Arg Pro Gly Asp Trp Asn Cys Arg Ser Cys Ser His Leu Asn
1 5 10 15
Phe Gln Arg Arg Asp Ser Cys Gln Arg Cys Gly Asp Val Arg Pro Asp
20 25 30
Gly Arg Gly Gly Gly Gly Gly Gly Gly Asp Phe Gly Ser Ser Phe Gly
35 40 45
Gly Arg Ser Gly Gly Ser Pro Phe Gly Gly Gly Phe Ala Gly Pro Asp
50 55 60
Val Arg Pro Gly Asp Trp Tyr Cys Ser Ile Gly Asn Cys Gly Ala His
65 70 75 80
Asn Phe Ala Ser Arg Ser Ser Cys Phe Lys Cys Gly Ala Tyr Lys Glu
85 90 95
Glu Ala Gly Cys Gly Asp Ser Met Gly Arg Ser Arg Gly Gly Phe Ser
100 105 110
Phe Gly Gly Ile Gly Gly Gly Gly Ser Gly Ala Ala Thr Gly Arg Ser
115 120 125
Gly Trp Lys Ser Gly Asp Trp Ile Cys Thr Arg Ser Gly Cys Asn Glu
130 135 140
His Asn Phe Ala Ser Arg Thr Glu Cys Phe Arg Cys Arg Glu Pro Arg
145 150 155 160
Asp Ser Gly Asn Ala Met Leu Lys Glu Val Pro Cys
165 170
<210>301
<211>807
<212>DNA
<213>拟南芥
<400>301
atgggagacg gaagagaagg agactgggaa tgtttaggat gcagaaacag gaattatgcg 60
tttagatcat tctgtaacag atgcaagcag cctcgtctta tcatggataa taatacttct 120
ccaaactcta agtggcttcc tcgtatcggc gattggatct gcactggttg tactaacaac 180
aattatgcat cacgagaaaa gtgcaagaaa tgtgggcaat ctaaggaagt agcagcattg 240
tcagcacttg ctatccctgg agcttctctt caaactcatc tccattactt cacccgtgga 300
cctgagtcac atgatcaacc tggttcttta ctcgcattct ctaacgctac aaatcaagct 360
tcggttcata aagaatggag gagtggtgac tggatttgca gatgtggttt tcacaattat 420
tcctctcgta tacagtgcaa aaagtgcaat gaaatagctc cactagccct tggtacaaag 480
agattagcat cagaagcttt ggctcatgaa tgggatagca aaagactgaa tcaaggatat 540
acaagcatgc aaacacagtc agcgatatat gcatcttttc ctggtatgag cctaggaagg 600
gtctcaaatt ggcaacttcc tctcccgttt ctacaacaac actcaacacc tgctttactt 660
ggaatgggag tgaaacaatg gcgtgatggc gactggatgt gtacaaattg caagaatcac 720
aattatgcat cacgagcaga gtgcaatagg tgcaagacta cacgagatat ccttgatcag 780
gacataactc caacagaaca atcttga 807
<210>302
<211>268
<212>PRT
<213>拟南芥
<400>302
Met Gly Asp Gly Arg Glu Gly Asp Trp Glu Cys Leu Gly Cys Arg Asn
1 5 10 15
Arg Asn Tyr Ala Phe Arg Ser Phe Cys Asn Arg Cys Lys Gln Pro Arg
20 25 30
Leu Ile Met Asp Asn Asn Thr Ser Pro Asn Ser Lys Trp Leu Pro Arg
35 40 45
Ile Gly Asp Trp Ile Cys Thr Gly Cys Thr Asn Asn Asn Tyr Ala Ser
50 55 60
Arg Glu Lys Cys Lys Lys Cys Gly Gln Ser Lys Glu Val Ala Ala Leu
65 70 75 80
Ser Ala Leu Ala Ile Pro Gly Ala Ser Leu Gln Thr His Leu His Tyr
85 90 95
Phe Thr Arg Gly Pro Glu Ser His Asp Gln Pro Gly Ser Leu Leu Ala
100 105 110
Phe Ser Asn Ala Thr Asn Gln Ala Ser Val His Lys Glu Trp Arg Ser
115 120 125
Gly Asp Trp Ile Cys Arg Cys Gly Phe His Asn Tyr Ser Ser Arg Ile
130 135 140
Gln Cys Lys Lys Cys Asn Glu Ile Ala Pro Leu Ala Leu Gly Thr Lys
145 150 155 160
Arg Leu Ala Ser Glu Ala Leu Ala His Glu Trp Asp Ser Lys Arg Leu
165 170 175
Asn Gln Gly Tyr Thr Ser Met Gln Thr Gln Ser Ala Ile Tyr Ala Ser
180 185 190
Phe Pro Gly Met Ser Leu Gly Arg Val Ser Asn Trp Gln Leu Pro Leu
195 200 205
Pro Phe Leu Glu Gln His Ser Thr Pro Ala Leu Leu Gly Met Gly Val
210 215 220
Lys Gln Trp Arg Asp Gly Asp Trp Met Cys Thr Asn Cys Lys Asn His
225 230 235 240
Asn Tyr Ala Ser Arg Ala Glu Cys Asn Arg Cys Lys Thr Thr Arg Asp
245 250 255
Ile Leu Asp Gln Asp Ile Thr Pro Thr Glu Gln Ser
260 265
<210>303
<211>1264
<212>DNA
<213>拟南芥
<400>303
ctatttctcc taccgtcgaa ctaaatccta gggcacaggt gaaatcgccg agtgacgtct 60
agccaccgca ccgcctcctt ctccggttat ctcgctacta atcagactat tccacagcta 120
tgtcacaggt agacaacaga aattcatcag cagccaagcg tgctagaact gacggggggc 180
gtagagaaga tgattggatc tgcccaagtt gtggcaatgt caacttttca ttcaggacaa 240
cttgcaatat gcgtaattgc actcagccta gacctgcaga tcataatgga aagtctgctc 300
ccaaacctat gcaacatcaa caaggtttct catcacccgg ggcatactta ggatctgggg 360
gtccccctcc agtatatatg ggcgggtcac catatggatc tcctctcttt aatggatcat 420
ctatgcctcc ttatgacgtc ccattttctg ggggttcgcc ttaccatttt aactataata 480
gccgaatgcc tgccggagct cattacagac cattacatat gtctggacca ccaccatacc 540
atggcggatc tatgatggga agtggtggta tgtatggaat gcctccacca atagacaggt 600
atggccttgg tatggcaatg ggtcctggtt ctgccgctgc catgatgcca agaccaaggt 660
tttacccaga tgaaaaatca caaaagagag attcaactcg cgataatgat tggacatgtc 720
cgaattgtgg taatgtaaac ttctcattca gaactgtatg taacatgagg aagtgcaaca 780
ctccaaagcc tggttctcag cagggtggaa gctcagataa aatatccaaa caaaatgcac 840
cggaagggag ctggaagtgt gataactgtg gaaatataaa ctacccattc aggagcaaat 900
gcaacaggca aaactgtgga gctgataagc ctggggatcg gtcgaatgga tctccgtccc 960
gtgcaccaga agagaacgat cagtgagtcg tagacatgtt tgggggttga gaagggtgag 1020
tctaatccag cgggtgtcgt aatgtcagtc aatgtctcgt caggtcaggt cgtccatgtt 1080
gctgcgtcgt cagtcaagtt gcttctatgc atttgtctct ttacttccct tgcgtggttg 1140
tggattgtat taataatgca aaaattgttt atttactttg tcgtcctcgt ggatcttgtc 1200
ttgctataga atcctcctcc aggtccatac tgttttacat cctaatctta agtaagttgg 1260
cacc 1264
<210>304
<211>288
<212>PRT
<213>拟南芥
<400>304
Met Ser Gln Val Asp Asn Arg Asn Ser Ser Ala Ala Lys Arg Ala Arg
1 5 10 15
Thr Asp Gly Gly Arg Arg Glu Asp Asp Trp Ile Cys Pro Ser Cys Gly
20 25 30
Asn Val Asn Phe Ser Phe Arg Thr Thr Cys Asn Met Arg Asn Cys Thr
35 40 45
Gln Pro Arg Pro Ala Asp His Asn Gly Lys Ser Ala Pro Lys Pro Met
50 55 60
Gln His Gln Gln Gly Phe Ser Ser Pro Gly Ala Tyr Leu Gly Ser Gly
65 70 75 80
Gly Pro Pro Pro Val Tyr Met Gly Gly Ser Pro Tyr Gly Ser Pro Leu
85 90 95
Phe Asn Gly Ser Ser Met Pro Pro Tyr Asp Val Pro Phe Ser Gly Gly
100 105 110
Ser Pro Tyr His Phe Asn Tyr Asn Ser Arg Met Pro Ala Gly Ala His
115 120 125
Tyr Arg Pro Leu His Met Ser Gly Pro Pro Pro Tyr His Gly Gly Ser
130 135 140
Met Met Gly Ser Gly Gly Met Tyr Gly Met Pro Pro Pro Ile Asp Arg
145 150 155 160
Tyr Gly Leu Gly Met Ala Met Gly Pro Gly Ser Ala Ala Ala Met Met
165 170 175
Iro Arg Pro Arg Phe Tyr Pro Asp Glu Lys Ser Gln Lys Arg Asp Ser
180 185 190
Thr Arg Asp Asn Asp Trp Thr Cys Pro Asn Cys Gly Asn Val Asn Phe
195 200 205
Ser Phe Arg Thr Val Cys Asn Met Arg Lys Cys Asn Thr Pro Lys Pro
210 215 220
Gly Ser Gln Gln Gly Gly Ser Ser Asp Lys Ile Ser Lys Gln Asn Ala
225 230 235 240
Pro Glu Gly Ser Trp Lys Cys Asp Asn Cys Gly Asn Ile Asn Tyr Pro
245 250 255
Phe Arg Ser Lys Cys Asn Arg Gln Asn Cys Gly Ala Asp Lys Pro Gly
260 265 270
Asp Arg Ser Asn Gly Ser Pro Ser Arg Ala Pro Glu Glu Asn Asp Gln
275 280 285
<210>305
<211>1853
<212>DNA
<213>稻
<400>305
cagtttccac tttcttccaa agccgaaaaa tcgagagaga aagagcaaaa ccctaaccgc 60
ggcgctccgc ccccttccgc cgccggattc ctcctcctcc ttcgtccgcc ttcgccggcg 120
ccgccctgct ccgaaggagc ccaggccttg tcgccgcgtc gcttgccccg ccgccggttt 180
cagcagcagc cacccccacc accatgtctt ctcaggtcga caaccgtagc caatctgctg 240
gaaagcgtgc ccgcaccgac ggtgggcggc gtgaggacga ctgggtttgc cccagctgcc 300
agaacgtcaa cttcgccttc cgcaccacct gcaacatgcg caattgcaac caatccaggc 360
ccaccgacta tacgaaggat atgcagaaac ctatgcagac accgccgccc catttcccca 420
tgtcaggggg atacatgagc ccagggacgc cgccatccat gtacctcggg ggtggtgctc 480
ccccttatgg cacctccctc tatggcggac ctgctttacc acgttatggt attgctcagt 540
tccctggggg ttctggatat ccatatggct atggtggccg cctgccaatg gggagcccct 600
atgggccgcc gatgcatatg gcagggcctc catattctgc tggatccatg atgggaccag 660
gtggaatgta tgggatgccc atggacagat atagcttggg cttacctgct ggtcctggtc 720
caatgggcgc gagggctggt tcatattccg aggaaggatc ccagaagaag cctgcaggag 780
ctgggcgtga taatgattgg aaatgcccta attgcaacaa cattaacttt gcattccgga 840
cagtctgtaa catgagaaag tgcaatacac caagacctga aaaccagggg tccaaacctg 900
atggtgcaag aggtccaaaa ccaaagatgc cagaaggtag ttggaagtgc gagaagtgca 960
ataacataaa ctatccattc cgcacaaaat gtaaccgtcc aagttgcgag gctgaaaagc 1020
catttcagac aaacaatgct aatgagtcat ctgctgatca ggacaatcag ttgttgtcat 1080
gtaatattgt gaagctttta tcaaagctgc aactttcaca tgactttcaa gacaataatg 1140
agcaaacaaa ggtggatcct cccggtggcc ctgctggagt accgacaagt tcgcacgccc 1200
tgcgaatggc agctctcagt gagttgcaga acagtgttaa gagctgatac ccttttcatt 1260
ttccaaacaa ggtgagaact ttgatccatg tggatgtgct tctatcagga gcagctgaca 1320
gtattgcatg cagtgatctt gctaaggaag ttggagatgg gaaacatcgt gtgatggcca 1380
gccttgatgt aagaatgcaa atcagtctta ctccgtacca tatctgtgtg gagtgtgcac 1440
accggaagca tagtcatttt ttgaatggtc gattgcttct tccacagtaa agtctataat 1500
accagtgtgc aggtgttttt ttccctttct ttcagtgtga aggtgttttt ttaccccttt 1560
ctttcgttca ttcattcttt ttctttttcc ttgttgagac ggtatcctgg agcactttgt 1620
aatactctaa tgtgcttcgg aaagtagaat ataagttgtg cttatgggcg ggccaaaatg 1680
ctttggccgt tagttgcatg acagcctttc caacatgctg ctgcctagcc gtagttctcc 1740
caaaaatgaa accatcttga gatccgtttg cggttgaact gaaattagac ggtatctctg 1800
gtttcaacat catcctttaa accctggatg aaagatttgc aatattcctg cgg 1853
<210>306
<211>347
<212>PRT
<213>稻
<400>306
Met Ser Ser Gln Val Asp Asn Arg Ser Gln Ser Ala Gly Lys Arg Ala
1 5 10 15
Arg Thr Asp Gly Gly Arg Arg Glu Asp Asp Trp Val Cys Pro Ser Cys
20 25 30
Gln Asn Val Asn Phe Ala Phe Arg Thr Thr Cys Asn Met Arg Asn Cys
35 40 45
Asn Gln Ser Arg Pro Thr Asp Tyr Thr Lys Asp Met Gln Lys Pro Met
50 55 60
Gln Thr Pro Pro Pro His Phe Pro Met Ser Gly Gly Tyr Met Ser Pro
65 70 75 80
Gly Thr Pro Pro Ser Met Tyr Leu Gly Gly Gly Ala Pro Pro Tyr Gly
85 90 95
Thr Ser Leu Tyr Gly Gly Pro Ala Leu Pro Arg Tyr Gly Ile Ala Gln
100 105 110
Phe Pro Gly Gly Ser Gly Tyr Pro Tyr Gly Tyr Gly Gly Arg Leu Pro
115 120 125
Met Gly Ser Pro Tyr Gly Pro Pro Met His Met Ala Gly Pro Pro Tyr
130 135 140
Ser Ala Gly Ser Met Met Gly Pro Gly Gly Met Tyr Gly Met Pro Met
145 150 155 160
Asp Arg Tyr Ser Leu Gly Leu Pro Ala Gly Pro Gly Pro Met Gly Ala
165 170 175
Arg Ala Gly Ser Tyr Ser Glu Glu Gly Ser Gln Lys Lys Pro Ala Gly
180 185 190
Ala Gly Arg Asp Asn Asp Trp Lys Cys Pro Asn Cys Asn Asn Ile Asn
195 200 205
Phe Ala Phe Arg Thr Val Cys Asn Met Arg Lys Cys Asn Thr Pro Arg
210 215 220
Pro Glu Asn Gln Gly Ser Lys Pro Asp Gly Ala Arg Gly Pro Lys Pro
225 230 235 240
Lys Met Pro Glu Gly Ser Trp Lys Cys Glu Lys Cys Asn Asn Ile Asn
245 250 255
Tyr Pro Phe Arg Thr Lys Cys Asn Arg Pro Ser Cys Glu Ala Glu Lys
260 265 270
Pro Phe Gln Thr Asn Asn Ala Asn Glu Ser Ser Ala Asp Gln Asp Asn
275 280 285
Gln Leu Leu Ser Cys Asn Ile Val Lys Leu Leu Ser Lys Leu Gln Leu
290 295 300
Ser His Asp Phe Gln Asp Asn Asn Glu Gln Thr Lys Val Asp Pro Pro
305 310 315 320
Gly Gly Pro Ala Gly Val Pro Thr Ser Ser His Ala Leu Arg Met Ala
325 330 335
Ala Leu Ser Glu Leu Gln Asn Ser Val Lys Ser
340 345
<210>307
<211>1078
<212>DNA
<213>稻
<400>307
ctggtctctc gctctcttcg ctcgcggcgg cttctccgcc tccgcctccg ccgccctctc 60
ctcctctcgc ctcgccgccg gcgccgccag ccaccgcgcg ggtcgggcgg gccgtatctt 120
cctttctgtt ccgatggctt ccgcgaaggt ggagaaccgc ggcggcggtg ggttcggttc 180
gaagaggtca cgcaacgacg tgtctgtaag ggagggggac tggacttgtc ctcagtgtgg 240
taatgtcaac ttcagtttta gaaatgtttg caaccgcgga gcctgtggtg caccccgtcc 300
atcaccgagt ctaagcccaa gagtgccacc tcctcctgct gctggatatg atcggccaca 360
tcttggatat gatcggccac atctgtttta tggtagtgct ggcaccccac ctcctattcc 420
tcttggatct ggtagctatg gtgcccccta tccacatctt ggcttgcggt atggatatgg 480
tccaccagta ggacctcctg cttcatatgg ccttttttct tcttatggtc aacctggacc 540
aatgggcagt ccgatgggag gcatgggcta tggccctgga cctgagctag gccgatatgg 600
ttatggtttt agaggatctc caatgccggt ttctagccca tggtctggtg gagcattagt 660
ggaaaataat gacagctctg cttcacgcaa gcgtcgtgga ggcccagatg gaatggctga 720
gaatgactgg atctgcccaa agtgtgagaa tgtcaacttt tccttcagaa acagttgcaa 780
tatgaagaaa tgtggagctc caaggccaag ccctggatct aatgctaccc catgtcgcaa 840
agacaaggac gctccggaag ggagctggac ctgcccggag tgcaacaacc tgaactaccc 900
tttccgcacg gcgtgcaatc ggaaaggctg cggaagcagc aggccggcag cggccacggc 960
gaactaggac cctactaact ttgcgccggc gattgggggc agagagagta ttgttgtatc 1020
ctagctatat acaagttaat ttaaactgta aacggctcaa atatattttc ttgtggcc 1078
<210>308
<211>277
<212>PRT
<213>稻
<400>308
Met Ala Ser Ala Lys Val Glu Asn Arg Gly Gly Gly Gly Phe Gly Ser
1 5 10 15
Lys Arg Ser Arg Asn Asp Val Ser Val Arg Glu Gly Asp Trp Thr Cys
20 25 30
Pro Gln Cys Gly Asn Val Asn Phe Ser Phe Arg Asn Val Cys Asn Arg
35 40 45
Gly Ala Cys Gly Ala Pro Arg Pro Ser Pro Ser Leu Ser Pro Arg Val
50 55 60
Pro Pro Pro Pro Ala Ala Gly Tyr Asp Arg Pro His Leu Gly Tyr Asp
65 70 75 80
Arg Pro His Leu Phe Tyr Gly Ser Ala Gly Thr Pro Pro Pro Ile Pro
85 90 95
Leu Gly Ser Gly Ser Tyr Gly Ala Pro Tyr Pro His Leu Gly Leu Arg
100 105 110
Tyr Gly Tyr Gly Pro Pro Val Gly Pro Pro Ala Ser Tyr Gly Leu Phe
115 120 125
Ser Ser Tyr Gly Gln Pro Gly Pro Met Gly Ser Pro Met Gly Gly Met
130 135 140
Gly Tyr Gly Pro Gly Pro Glu Leu Gly Arg Tyr Gly Tyr Gly Phe Arg
145 150 155 160
Gly Ser Pro Met Pro Val Ser Ser Pro Trp Ser Gly Gly Ala Leu Val
165 170 175
Glu Asn Asn Asp Ser Ser Ala Ser Arg Lys Arg Arg Gly Gly Pro Asp
180 185 190
Gly Met Ala Glu Asn Asp Trp Ile Cys Pro Lys Cys Glu Asn Val Asn
195 200 205
Phe Ser Phe Arg Asn Ser Cys Asn Met Lys Lys Cys Gly Ala Pro Arg
210 215 220
Pro Ser Pro Gly Ser Asn Ala Thr Pro Cys Arg Lys Asp Lys Asp Ala
225 230 235 240
Pro Glu Gly Ser Trp Thr Cys Pro Glu Cys Asn Asn Leu Asn Tyr Pro
245 250 255
Phe Arg Thr Ala Cys Asn Arg Lys Gly Cys Gly Ser Ser Arg Pro Ala
260 265 270
Ala Ala Thr Ala Asn
275
<210>309
<211>662
<212>DNA
<213>芜青(Brassica rapa)
<400>309
ggtcttgttt tctttcaata aacacataat aagatagctt ccaagttcat caagaaataa 60
acgtaagcgc acgcatacaa taacctatcg aagatgagca gacccggaga ctggaactgt 120
agatcatgca cccacctcaa cttccagcgc cgtgattctt gccagcgatg cggtgactcc 180
cgtttgggtg caggtggagt cggtggctta gagtttggtg atttcggcgg cagaggtatg 240
tctgcttttg gattcaccac gggctccgac gttcgtccag gtgactggta ctgcacagtt 300
ggaaactgcg ggacacataa ctttgccagc cgctccacct gcttcaaatg cggcactttc 360
aaggacgaat ccctcggtgg gggcggcggc ggtggcgtag gcgtaaggcg gtccggtcat 420
gttgacgctg acgttatgcg gtctagagtc tccggcaacg gtggccgctc cagctggaaa 480
tccggtgatt ggatttgcac caggcttggt tgcaatgagc ataactttgc aagcagaatg 540
gagtgcttca gatgcaatgc accaagggac ttcagcatga gaacctcttt ctaagttaca 600
caataatgcc tttgaagtag ccttgtttcc aatctcttgg gcaccgtttc aatcaatgga 660
aa 662
<210>310
<211>166
<212>PRT
<213>芜青
<400>310
Met Ser Arg Pro Gly Asp Trp Asn Cys Arg Ser Cys Thr His Leu Asn
1 5 10 15
Phe Gln Arg Arg Asp Ser Cys Gln Arg Cys Gly Asp Ser Arg Leu Gly
20 25 30
Ala Gly Gly Val Gly Gly Leu Glu Phe Gly Asp Phe Gly Gly Arg Gly
35 40 45
Met Ser Ala Phe Gly Phe Thr Thr Gly Ser Asp Val Arg Pro Gly Asp
50 55 60
Trp Tyr Cys Thr Val Gly Asn Cys Gly Thr His Asn Phe Ala Ser Arg
65 70 75 80
Ser Thr Cys Phe Lys Cys Gly Thr Phe Lys Asp Glu Ser Leu Gly Gly
85 90 95
Gly Gly Gly Gly Gly Val Gly Val Arg Arg Ser Gly His Val Asp Ala
100 105 110
Asp Val Met Arg Ser Arg Val Ser Gly Asn Gly Gly Arg Ser Ser Trp
115 120 125
Lys Ser Gly Asp Trp Ile Cys Thr Arg Leu Gly Cys Asn Glu His Asn
130 135 140
Phe Ala Ser Arg Met Glu Cys Phe Arg Cys Asn Ala Pro Arg Asp Phe
145 150 155 160
Ser Met Arg Thr Ser Phe
165
<210>311
<211>749
<212>DNA
<213>乳浆大戟
<400>311
attttccctt cttcacccaa atatctctca ccttttaaca agagaaaagc aaaaagaaga 60
tgagcagacc aggagattgg aactgcaggt cctgccagca tctcaacttc cagagaaggg 120
actcgtgcca gcgctgtggg gactccaggt ccgggactgg aggttcagga gctgactttg 180
gcgggtttgg aagccgggtt gggtcctcat tcgggttcag caccgggtct gatgttcgac 240
ccggtgactg gtactgtact gctggcaact gtggggccca caactttgcc agccgggcaa 300
gttgcttcaa atgtggagtt tataaggatg attctggggc ccctggcggg tttgattccg 360
atatcctccg ggcctctaga ggttttggta gtggcagcaa tcgctcttct tggaaatctg 420
gtgattggat ctgcactcgg tggggatgta atgaacacaa ctttgcaagc agaatggagt 480
gtttcaaatg cagtgcccct agggacctta gtaacagaac ttcatactag acattttgga 540
tggtgcagca gccaagaaag agaattaaga ttactacttt taaattttat tttattttta 600
ctatttgttt tgggtgttat tagagtggaa aacaaacatg gcttaaaaac ccatgtttca 660
tccctaattt aagctaagga agcaaacccc ttttggcatt ttgtaaggca gatttaggat 720
tgtagtactt aattaattag tgggttgtt 749
<210>312
<211>156
<212>PRT
<213>乳浆大戟
<400>312
Met Ser Arg Pro Gly Asp Trp Asn Cys Arg Ser Cys Gln His Leu Asn
1 5 10 15
Phe Gln Arg Arg Asp Ser Cys Gln Arg Cys Gly Asp Ser Arg Ser Gly
20 25 30
Thr Gly Gly Ser Gly Ala Asp Phe Gly Gly Phe Gly Ser Arg Val Gly
35 40 45
Ser Ser Phe Gly Phe Ser Thr Gly Ser Asp Val Arg Pro Gly Asp Trp
50 55 60
Tyr Cys Thr Ala Gly Asn Cys Gly Ala His Asn Phe Ala Ser Arg Ala
65 70 75 80
Ser Cys Phe Lys Cys Gly Val Tyr Lys Asp Asp Ser Gly Ala Pro Gly
85 90 95
Gly Phe Asp Ser Asp Ile Leu Arg Ala Ser Arg Gly Phe Gly Ser Gly
100 105 110
Ser Asn Arg Ser Ser Trp Lys Ser Gly Asp Trp Ile Cys Thr Arg Trp
115 120 125
Gly Cys Asn Glu His Asn Phe Ala Ser Arg Met Glu Cys Phe Lys Cys
130 135 140
Ser Ala Pro Arg Asp Leu Ser Asn Arg Thr Ser Tyr
145 150 155
<210>313
<211>646
<212>DNA
<213>陆地棉
<400>313
ctccattctc ttatttaact caaactcacc accttttcca tttttctaat taagaaaaga 60
aaagatgagc aggccaggag attggaactg caggtcgtgc caacacctaa acttccaaag 120
gagggactcc tgccaacgct gcggggaatt ccggtcgggt gatcacttcg gtagctacgg 180
tggtggcagg ggtggctcct cctttggatt cgccaccggc tccgacgtcc gacctggtga 240
ttggtactgc actgcgggaa actgcggtac ccacaatttc gccagtcgtt ccagctgctt 300
caaatgtggt gcattcaagg acgaccctgc cggaggtttc gacagcgacg ttccgcgttc 360
tagaggattt ggcggcggta atcgatccgg ctggaaatcc ggcgactgga tatgtaccag 420
gtcgggatgc aatgagcata actttgctag ccgaatggaa tgtttcagat gcagtgcccc 480
aagagactt caccgctagaa cttcatacta aatacaagct atccagtttt gggtgttgca 540
aaccaagaga gactcaaatg agagaaaaaa ttttacgggg ttagggttac ccgggtaaat 600
atatggcttg ggggggtgtg gcaccagggt tgaaaacacc agggtg 646
<210>314
<211>148
<212>PRT
<213>陆地棉
<400>314
Met Ser Arg Pro Gly Asp Trp Asn Cys Arg Ser Cys Gln His Leu Asn
1 5 10 15
Phe Gln Arg Arg Asp Ser Cys Gln Arg Cys Gly Glu Phe Arg Ser Gly
20 25 30
Asp His Phe Gly Ser Tyr Gly Gly Gly Arg Gly Gly Ser Ser Phe Gly
35 40 45
Phe Ala Thr Gly Ser Asp Val Arg Pro Gly Asp Trp Tyr Cys Thr Ala
50 55 60
Gly Asn Cys Gly Thr His Asn Phe Ala Ser Arg Ser Ser Cys Phe Lys
65 70 75 80
Cys Gly Ala Phe Lys Asp Asp Pro Ala Gly Gly Phe Asp Ser Asp Val
85 90 95
Pro Arg Ser Arg Gly Phe Gly Gly Gly Asn Arg Ser Gly Trp Lys Ser
100 105 110
Gly Asp Trp Ile Cys Thr Arg Ser Gly Cys Asn Glu His Asn Phe Ala
115 120 125
Ser Arg Met Glu Cys Phe Arg Cys Ser Ala Pro Arg Asp Phe Thr Ala
130 135 140
Arg Thr Ser Tyr
145
<210>315
<211>613
<212>DNA
<213>葡萄
<400>315
ggtcttcttc catctctgca cagttatcct gatatttcct tggaaaacat gagcaggcca 60
ggagattgga actgcaggtc atgccagcac atgaacttcc aaaggcgcga ttcctgccaa 120
cgctgcggtg acccaaaatc gggtgggggt gactttggaa gctttggtgg gaggggtgga 180
tcctcctttg ggttcacggg ctcggatgtc cgcccagggg actggtactg caatgcaggc 240
aactgtggag ctcacaactt tgctagccgc tctaactgct tcaagtgtgg tgcattcaaa 300
gatgagtctg ctgggggcta cgattccgac atgtcacgct cccgaggttt cgggttcggc 360
ggtggcagcg gccggtctgg gtggaaatcc ggtgattgga tatgcagcag gtctggatgc 420
aatgagcaca actttgctag cagaatggaa tgtttcagat gcaatgcccc gagggacttg 480
agtaacaaaa cttcatacta gacatatatc ttccattttt gggtactgca gccagccaag 540
agagaccaaa tcatagaata tctattaatc cttgtgttgt tattaatttc tttgctttgg 600
gtgctaggtt ctt 613
<210>316
<211>150
<212>PRT
<213>葡萄
<400>316
Met Ser Arg Pro Gly Asp Trp Asn Cys Arg Ser Cys Gln His Met Asn
1 5 10 15
Phe Gln Arg Arg Asp Ser Cys Gln Arg Cys Gly Asp Pro Lys Ser Gly
20 25 30
Gly Gly Asp Phe Gly Ser Phe Gly Gly Arg Gly Gly Ser Ser Phe Gly
35 40 45
Phe Thr Gly Ser Asp Val Arg Pro Gly Asp Trp Tyr Cys Asn Ala Gly
50 55 60
Asn Cys Gly Ala His Asn Phe Ala Ser Arg Ser Asn Cys Phe Lys Cys
65 70 75 80
Gly Ala Phe Lys Asp Glu Ser Ala Gly Gly Tyr Asp Ser Asp Met Ser
85 90 95
Arg Ser Arg Gly Phe Gly Phe Gly Gly Gly Ser Gly Arg Ser Gly Trp
100 105 110
Lys Ser Gly Asp Trp Ile Cys Ser Arg Ser Gly Cys Asn Glu His Asn
115 120 125
Phe Ala Ser Arg Met Glu Cys Phe Arg Cys Asn Ala Pro Arg Asp Leu
130 135 140
Ser Asn Lys Thr Ser Tyr
145 150
<210>317
<211>844
<212>DNA
<213>毛果杨(Populus trichocarpa)
<400>317
tcagaccatt tccctttcat cttctagcta gcatagcttc tctcagaggt ttttgaaacc 60
cctttttgcc attcttctct cacttagtat acttagtctt ctctaatcaa ttcataagca 120
aatatgaaca ggccaggaga ctggaactgc aggtcatgcc aacacctcaa tttccagagg 180
cgtgactctt gccaacgttg tggggacccc aggtccgcag gtgattttgg gggtttcggt 240
gggcggggtg gctcatcact tgggttcacc gggtcggatg ttcgtcccgg tgattggtac 300
tgcactgccg gaaactgcgg ggcccacaac tttgctagcc gttctagttg cttcaaatgt 360
ggagtgtaca aggaaatgga ctccgccggg ggcttcgatt ctgatttttc tcgaactaga 420
gggtttggtg ggagcactgg aggtggcaat cgatctggat ggaaatccgg agactggatt 480
tgcactaggt ggggatgcaa cgaacataac tttgctagca gaatggagtg cttcaagtgc 540
aatgccccaa gagatcttag caacagaact tcatactaga tacaatttct ccatttcctg 600
ggactgcacc agccaagaac aaagacaaca tgattaaaaa atatatatca ctacttttca 660
ttttcttctt gatttctttt tgtattagct agctagggtc ttgaggcgag acatggttta 720
agaaccatgt ttactgcttt gagctatata taacccttgg cattttgtca ggcttcctgt 780
aggaagtata tcgttgtctt tgtgggcttt tgatctatta tattcattat tgtaaccaag 840
ggag 844
<210>318
<211>151
<212>PRT
<213>毛果杨
<400>318
Met Asn Arg Pro Gly Asp Trp Asn Cys Arg Ser Cys Gln His Leu Asn
1 5 10 15
Phe Gln Arg Arg Asp Ser Cys Gln Arg Cys Gly Asp Pro Arg Ser Ala
20 25 30
Gly Asp Phe Gly Gly Phe Gly Gly Arg Gly Gly Ser Ser Leu Gly Phe
35 40 45
Thr Gly Ser Asp Val Arg Pro Gly Asp Trp Tyr Cys Thr Ala Gly Asn
50 55 60
Cys Gly Ala His Asn Phe Ala Ser Arg Ser Ser Cys Phe Lys Cys Gly
65 70 75 80
Val Tyr Lys Glu Met Asp Ser Ala Gly Gly Phe Asp Ser Asp Phe Ser
85 90 95
Arg Thr Arg Gly Phe Gly Gly Ser Thr Gly Gly Gly Asn Arg Ser Gly
100 105 110
Trp Lys Ser Gly Asp Trp Ile Cys Thr Arg Trp Gly Cys Asn Glu His
115 120 125
Asn Phe Ala Ser Arg Met Glu Cys Phe Lys Cys Asn Ala Pro Arg Asp
130 135 140
Leu Ser Asn Arg Thr Ser Tyr
145 150
<210>319
<211>785
<212>DNA
<213>陆地棉
<400>319
ccttgcgtcc gctttcttct tcattgttcc tgtctttgct tactcacccc ttatatatct 60
gctttctcaa gtaggggaga aaatatgagc aggccaggag actggaattg caggtcatgc 120
caacacctca acttccaaag gagggactca tgccagcgct gtggagaacc aagacctggt 180
ggtggtgaca gaggcggcga ctatggaagc tttggtggca ggggtggctc atctttcggg 240
tttactggac ccgatgttag gcctggtgac tggtattgca ctgtgggcaa ctgcggtgct 300
cacaacttcg ccagcaggtc gagctgcttc aaatgtggtg cggccaaaga tgaatcatcc 360
ggaggatttg aaagtgacat cccacgtatg aggggttatg gttttagcac tggcagctct 420
agtcgctcta actggaaatc tggagactgg atttgcacca ggtcgggttg caatgaacac 480
aacttcgcca gcaggatgga atgtttcaga tgcaatgcac caagggactc cacccacaaa 540
tcttcatact aattaataaa attttcattt ttgggtactg cagtcgcaag agagagatca 600
gacaaggcaa tcccagatct tgctttcttt ttcttttgtt tgtttcttta ttttagatct 660
ttagatgaat catgtttgaa agacttcagt tgaagtactt aagctaatat caaagtacat 720
agggcatgca tgtaattgat gtatggtatc agcaatgtta tatcagtgtc tttgtgccaa 780
aaaaa 785
<210>320
<211>155
<212>PRT
<213>陆地棉
<400>320
Met Ser Arg Pro Gly Asp Trp Asn Cys Arg Ser Cys Gln His Leu Asn
1 5 10 15
Phe Gln Arg Arg Asp Ser Cys Gln Arg Cys Gly Glu Pro Arg Pro Gly
20 25 30
Gly Gly Asp Arg Gly Gly Asp Tyr Gly Ser Phe Gly Gly Arg Gly Gly
35 40 45
Ser Ser Phe Gly Phe Thr Gly Pro Asp Val Arg Pro Gly Asp Trp Tyr
50 55 60
Cys Thr Val Gly Asn Cys Gly Ala His Asn Phe Ala Ser Arg Ser Ser
65 70 75 80
Cys Phe Lys Cys Gly Ala Ala Lys Asp Glu Ser Ser Gly Gly Phe Glu
85 90 95
Ser Asp Ile Pro Arg Met Arg Gly Tyr Gly Phe Ser Thr Gly Ser Ser
100 105 110
Ser Arg Ser Asn Trp Lys Ser Gly Asp Trp Ile Cys Thr Arg Ser Gly
115 120 125
Cys Asn Glu His Asn Phe Ala Ser Arg Met Glu Cys Phe Arg Cys Asn
130 135 140
Ala Pro Arg Asp Ser Thr His Lys Ser Ser Tyr
145 150 155
<210>321
<211>760
<212>DNA
<213>野莴苣
<400>321
gtattcggaa tcctcaaaga aacacacact tcctatccat cacaagaaag atgagcaggc 60
caggagattg gaactgcagg tcatgccagc acttgaactt ccagaggagg gactcttgcc 120
aaagatgtgg ggagacgagg tatggtggtg ggggtggtgt gtttggtggt agaggaagta 180
tcatcagccc ttcagcattt ggcttcacag gcccagatgt ccgaccgggt gattggtact 240
gcaatgttgg caactgcggg gctcacaact ttgctagccg ctcgagctgc ttcaagtgtg 300
gtgcgttcaa ggatgactta gcttgtagtg gtggtggtgg tggtggtggt ggcgtttttg 360
atggtgatat gtcacgtggc aggggtttcg ggtttggtgg aggaagtggt ggtggaggtg 420
gtggcagcag ccgttcaggg tggaagtccg gtgactggat atgcggcagg cctggttgca 480
atgagcacaa ctttgcaagc agaatggaat gttttaggtg caacgcacct cgggaatcgg 540
gtaacaagtc tccttattaa gcaggttgcg gcatttccag ttccgggtat catggacttg 600
ctatctacca aacaggaaga gagataagtg atcgatcaga cagaatcatg aagagcatcc 660
agttgatagg aaattctaaa ctgaccccct ttttgcccat atcataatat gcaatcctat 720
ctttgatttt ttttttcctt ttgttttatt tttttttttt 760
<210>322
<211>169
<212>PRT
<213>野莴苣
<400>322
Met Ser Arg Pro Gly Asp Trp Asn Cys Arg Ser Cys Gln His Leu Asn
1 5 10 15
Phe Gln Arg Arg Asp Ser Cys Gln Arg Cys Gly Glu Thr Arg Tyr Gly
20 25 30
Gly Gly Gly Gly Val Phe Gly Gly Arg Gly Ser Ile Ile Ser Pro Ser
35 40 45
Ala Phe Gly Phe Thr Gly Pro Asp Val Arg Pro Gly Asp Trp Tyr Cys
50 55 60
Asn Val Gly ASn Cys Gly Ala His Asn Phe Ala Ser Arg Ser Ser Cys
65 70 75 80
Phe Lys Cys Gly Ala Phe Lys Asp Asp Leu Ala Cys Ser Gly Gly Gly
85 90 95
Gly Gly Gly Gly Gly Val Phe Asp Gly Asp Met Ser Arg Gly Arg Gly
100 105 110
Phe Gly Phe Gly Gly Gly Ser Gly Gly Gly Gly Gly Gly Ser Ser Arg
115 120 125
Ser Gly Trp Lys Ser Gly Asp Trp Ile Cys Gly Arg Pro Gly Cys Asn
130 135 140
Glu His Asn Phe Ala Ser Arg Met Glu Cys Phe Arg Cys Asn Ala Pro
145 150 155 160
Arg Glu Ser Gly Asn Lys Ser Pro Tyr
165
<210>323
<211>517
<212>DNA
<213>大豆
<400>323
tttctgcatc tctaatactt caactcactg tattatcttg agtaattttg cagagaagta 60
aaatatgagc aggccaggag actggaattg caggtcgtgc cagcacctga actttcagag 120
gagagactca tgccagcgat gtggggactc aaaatatgga gatagagttg ttgattttgg 180
tggttttgga ggaagaggag ggtcctcatt tggtttaact ggctcagatg ttcgccccgg 240
cgactggtac tgtgctgctg ctaactgtgg tgcacacaac tttgctagcc gctcaagctg 300
cttcaagtgt ggtgctttca aggatgactt ggctggagga ggctataaca gttctgacat 360
cttgcgctcc agagcttttg gtggcagtgg aagacctgga tggaaatctg gtgattggat 420
atgcagcaga tcaggatgca atgagcacaa ctttgctagc agaatggaat gttttaaatg 480
cagtgctccc agggacacgt actagaaaaa atgagtt 517
<210>324
<211>146
<212>PRT
<213>大豆
<400>324
Met Ser Arg Pro Gly Asp Trp Asn Cys Arg Ser Cys Gln His Leu Asn
1 5 10 15
Phe Gln Arg Arg Asp Ser Cys Gln Arg Cys Gly Asp Ser Lys Tyr Gly
20 25 30
Asp Arg Val Val Asp Phe Gly Gly Phe Gly Gly Arg Gly Gly Ser Ser
35 40 45
Phe Gly Leu Thr Gly Ser Asp Val Arg Pro Gly Asp Trp Tyr Cys Ala
50 55 60
Ala Ala Asn Cys Gly Ala His Asn Phe Ala Ser Arg Ser Ser Cys Phe
65 70 75 80
Lys Cys Gly Ala Phe Lys Asp Asp Leu Ala Gly Gly Gly Tyr Asn Ser
85 90 95
Ser Asp Ile Leu Arg Ser Arg Ala Phe Gly Gly Ser Gly Arg Pro Gly
100 105 110
Trp Lys Ser Gly Asp Trp Ile Cys Ser Arg Ser Gly Cys Asn Glu His
115 120 125
Asn Phe Ala Ser Arg Met Glu Cys Phe Lys Cys Ser Ala Pro Arg Asp
130 135 140
Thr Tyr
145
<210>325
<211>889
<212>DNA
<213>毛果杨
<400>325
gacaagttcc ttaaacaatc tattgctctt tcaactacta gctaggttac acttcatttc 60
tgtacgtgtt aattctccta tctttctcct ttctgctttc tcgagatgag cagaccagga 120
gattggaatt gcaggtcatg ccagcacttg aactttcaaa ggagggactc atgccagcgt 180
tgcggtgatc caaggcccgg agagagagat cactatggaa gtttcggtgg aagatcatca 240
gggggctcat tcggatttac gggccctgat gttaggcctg gtgattggta ttgcacggct 300
ggcaattgtg gagctcacaa ctttgctagt cgttcaagct gcttcaagtg tggtgtgtcc 360
aaggatgaat cctctggtgg tggacttgat gctgatatgt cacggatgag aggttatggc 420
ttcggcggag gcggaggcgg aggcagtggc tctagccgta attggaaatc cggagactgg 480
atttgcacca ggtccggttg caacgagcac aactttgcta gcaggactga atgctataga 540
tgcaatgcac caagagaatc tagcagcaac aagtcttcgt attaatcatc gatatcgata 600
gcatttttgt gtcctgcagt gctgcaagga gggaattaac gaagaaggct catgagaaat 660
cttggattca tctttttgct cttaattact tctatttttg ttcttttgga tagctgtact 720
cttaagctga gaagctttag aaggatcatg ggagtgaaat taagttcaag gagagctata 780
tatatatcat tagccagtaa tttgtcaggt tccctaaata tagacatgta gttctgtact 840
tggtatcaat gtctttgtgt tttgagacgg gtttaagccc ttgtcgttc 889
<210>326
<211>159
<212>PRT
<213>毛果杨
<400>326
Met Ser Arg Pro Gly Asp Trp Asn Cys Arg Ser Cys Gln His Leu Asn
1 5 10 15
Phe Gln Arg Arg Asp Ser Cys Gln Arg Cys Gly Asp Pro Arg Pro Gly
20 25 30
Glu Arg Asp His Tyr Gly Ser Phe Gly Gly Arg Ser Ser Gly Gly Ser
35 40 45
Phe Gly Phe Thr Gly Pro Asp Val Arg Pro Gly Asp Trp Tyr Cys Thr
50 55 60
Ala Gly Asn Cys Gly Ala His Asn Phe Ala Ser Arg Ser Ser Cys Phe
65 70 75 80
Lys Cys Gly Val Ser Lys Asp Glu Ser Ser Gly Gly Gly Leu Asp Ala
85 90 95
Asp Met Ser Arg Met Arg Gly Tyr Gly Phe Gly Gly Gly Gly Gly Gly
100 105 110
Gly Ser Gly Ser Ser Arg Asn Trp Lys Ser Gly Asp Trp Ile Cys Thr
115 120 125
Arg Ser Gly Cys Asn Glu His Asn Phe Ala Ser Arg Thr Glu Cys Tyr
130 135 140
Arg Cys Asn Ala Pro Arg Glu Ser Ser Ser Asn Lys Ser Ser Tyr
145 150 155
<210>327
<211>723
<212>DNA
<213>Populus fremontii x Populus angustifolia
<400>327
agggaaaaag aaagcctaac cctcctgcct gcctcaagct taccccatta tcgaggtcta 60
aaacaagtat aaaaacagcc ttagccccaa tacgtaaatc acaagttcct taaacaatct 120
attgctcttt caactactag gtttcccact tcatttctgt gcctactgat tctcctctct 180
ttcaactttc tgccttctca agctagctag agaagggaag atgagcagac caggagattg 240
gaattgcagg tcatgccaac acttgaactt ccagaggagg gactcgtgcc agcgttgtgg 300
ggacccaagg cccggagaga gagatcatta tggaagtttt ggtggaagat cagggggctc 360
gttcggattt acggggcctg atgttaggcc cggtgactgg tattgctcgg ttggcaactg 420
tggagctcac aactttgcta gtcgttcaag ctgcttcaag tgtggtatgt ccaaggatga 480
atcctctggt ggtgggcttg atgctgacat ttcatggatg agaggttatg gcttcggcgg 540
aggcagcgcc tctagccgct ctaattggaa atccggagac tggatttgca ccaggtcagg 600
ttgcaacgag cacaactttg ctagcaggac tgagtgttac agatgcaatg caccaagaga 660
atcaggcagc aacaagtctt cgtattaatc atcaacatcg atcgcatttt tgtgtactgc 720
agt 723
<210>328
<211>155
<212>PRT
<213>Populus fremontii x Populus angustifolia
<400>328
Met Ser Arg Pro Gly Asp Trp Asn Cys Arg Ser Cys Gln His Leu Asn
1 5 10 15
Phe Gln Arg Arg Asp Ser Cys Gln Arg Cys Gly Asp Pro Arg Pro Gly
20 25 30
Glu Arg Asp His Tyr Gly Ser Phe Gly Gly Arg Ser Gly Gly Ser Phe
35 40 45
Gly Phe Thr Gly Pro Asp Val Arg Pro Gly Asp Trp Tyr Cys Ser Val
50 55 60
Gly Asn Cys Gly Ala His Asn Phe Ala Ser Arg Ser Ser Cys Phe Lys
65 70 75 80
Cys Gly Met Ser Lys Asp Glu Ser Ser Gly Gly Gly Leu Asp Ala Asp
85 90 95
Ile Ser Trp Met Arg Gly Tyr Gly Phe Gly Gl y Gly Ser Ala Ser Ser
100 105 110
Arg Ser Asn Trp Lys Ser Gly Asp Trp Ile Cys Thr Arg Ser Gly Cys
115 120 125
Asn Glu His Asn Phe Ala Ser Arg Thr Glu Cys Tyr Arg Cys Asn Ala
130 135 140
Pro Arg Glu Ser Gly Ser Asn Lys Ser Ser Tyr
145 150 155
<210>329
<211>920
<212>DNA
<213>稻
<400>329
cacctcacag cattttccac cttagagctc accaacacag cagctgatac ttgtttaggg 60
taagacaaga tgaacaggaa gccaggagac tgggactgca gggcgtgcca gcacctcaac 120
ttcagccgcc gggacctatg ccagcgctgc ggcgggccgc gtggcgccgc tgatcgcggc 180
agcggtggtg gcggtgacta cgccaacttc ggcggccgtg gtggttcctc cttcggtgga 240
ggctttggca ctggctctga tgtccgccca ggtgactggt actgcaactg cggcgcgcac 300
aacttcgcca gccgctccag ctgcttcaag tgcgctgctt tcaaggacga tgctgccgtc 360
aacagtggcg gcgctggtgc ctttgacggt ggggacatgt cgcgctcgcg gggctacggc 420
ttcggcagcg gcgccgtccg cgccagccgc cctggctgga agtctggcga ctggatttgc 480
accaggtctg gatgcaatga gcacaacttc gccagcagga tggagtgctt caggtgcaac 540
gcaccgcggg actccggcac tgaggtgtaa tttgccgtac gtgtccgatc gatctggatc 600
cgatgaggct tgcagcagtg acgacgagca gcagaagcag cgttaagagt tgtgatgtct 660
acataagaag aagaagaaag tagaatgcaa aagaaatctc cccatggttt tactagtttt 720
gtttcttccc gttttagatt tggttctgat tcccatttgg gaggacccgt cgacccctga 780
ttatctatgt tttacccgtt ttatttcctg tttctttcgg catgtttgct cttcgatcga 840
gtcgtgtaac ccgaaacgct tgcgcttgag aagtattatt attattaact agtatgttgc 900
ttcttaaaaa aaaaaaaaaa 920
<210>330
<211>166
<212>PRT
<213>稻
<400>330
Met Asn Arg Lys Pro Gly Asp Trp Asp Cys Arg Ala Cys Gln His Leu
1 5 10 15
Asn Phe Ser Arg Arg Asp Leu Cys Gln Arg Cys Gly Gly Pro Arg Gly
20 25 30
Ala Ala Asp Arg Gly Ser Gly Gly Gly Gly Asp Tyr Ala Asn Phe Gly
35 40 45
Gly Arg Gly Gly Ser Ser Phe Gly Gly Gly Phe Gly Thr Gly Ser Asp
50 55 60
Val Arg Pro Gly Asp Trp Tyr Cys Asn Cys Gly Ala His Asn Phe Ala
65 70 75 80
Ser Arg Ser Ser Cys Phe Lys Cys Ala Ala Phe Lys Asp Asp Ala Ala
85 90 95
Val Asn Ser Gly Gly Ala Gly Ala Phe Asp Gly Gly Asp Met Ser Arg
100 105 110
Ser Arg Gly Tyr Gly Phe Gly Ser Gly Ala Val Arg Ala Ser Arg Pro
115 120 125
Gly Trp Lys Ser Gly Asp Trp Ile Cys Thr Arg Ser Gly Cys Asn Glu
130 135 140
His Asn Phe Ala Ser Arg Met Glu Cys Phe Arg Cys Asn Ala Pro Arg
145 150 155 160
Asp Ser Gly Thr Glu Val
165
<210>331
<211>703
<212>DNA
<213>柳枝稷
<400>331
ccacgcgtcc gcagaactcc ttgtcctagg ccccagaaac acaaacgacc gctctttgtt 60
taggcaagat gaacaggaag cctggagact gggattgcag ggcttgccaa cacctcaact 120
tcagtcggcg ggacctatgc cagcgctgtg gtgagccacg tggagctgct gaccgtggca 180
gcggcggtgg aggtgactat gccaacttcg gtggccgtgg tggctcctcc ttcggcggtg 240
gctttggtgc tggctctgat gtccgccctg gtgactggtt atgttcctgc ggcgcgcaca 300
acttcgccag ccgctccaac tgcttcaagt gctctgcctt caaggaggag gctgctgtca 360
acagtggtgc tggtggcttt gatggtgaca tgtcacgctc gcgctacggc ttcggtggcg 420
gtgctgcccg caccaaccgc cctggttgga agtctggaga ctggatctgc accaggtccg 480
gatgcaacga gcacaacttt gccagcagga tggagtgttt caggtgcaac gcaccacggg 540
actccggcac tgaggtgtag gatcggagct ggtgcttcga acggaccccg acgagcagaa 600
gcagcaagaa acctgataag aagagtagta gatttgcaaa aggcatcccg gatgctctat 660
tactgttttg ttccacccct accgcttcct tttagaattt ggt 703
<210>332
<211>163
<212>PRT
<213>柳枝稷
<400>332
Met Asn Arg Lys Pro Gly Asp Trp Asp Cys Arg Ala Cys Gln His Leu
1 5 10 15
Asn Phe Ser Arg Arg Asp Leu Cys Gln Arg Cys Gly Glu Pro Arg Gly
20 25 30
Ala Ala Asp Arg Gly Ser Gly Gly Gly Gly Asp Tyr Ala Asn Phe Gly
35 40 45
Gly Arg Gly Gly Ser Ser Phe Gly Gly Gly Phe Gly Ala Gly Ser Asp
50 55 60
Val Arg Pro Gly Asp Trp Leu Cys Ser Cys Gly Ala His Asn Phe Ala
65 70 75 80
Ser Arg Ser Asn Cys Phe Lys Cys Ser Ala Phe Lys Glu Glu Ala Ala
85 90 95
Val Asn Ser Gly Ala Gly Gly Phe Asp Gly Asp Met Ser Arg Ser Arg
100 105 110
Tyr Gly Phe Gly Gly Gly Ala Ala Arg Thr Asn Arg Pro Gly Trp Lys
115 120 125
Ser Gly Asp Trp Ile Cys Thr Arg Ser Gly Cys Asn Glu His Asn Phe
130 135 140
Ala Ser Arg Met Glu Cys Phe Arg Cys Asn Ala Pro Arg Asp Ser Gly
145 150 155 160
Thr Glu Val
<210>333
<211>435
<212>DNA
<213>蒺藜苜蓿
<400>333
atgaacagga aaatgagctg gtctggagga gattggatgt gtggtgcttg cgagcacata 60
aatttcaaga agagagaagc atgccaaaat tgtggatacc caaagtatgg aggccctgac 120
ccatcgacct atagatataa caggactgaa acgttggcag gggactggtt ttgcacttct 180
atgaactgtg gagctcacaa ctatgcaagc cgatcaaact gctatagatg tggtgcattt 240
aaagatcctt attcttctgg atatgggggt aacatggtgg gttctggagg atatggatca 300
gattgtagtt ctcccccagg atggaaaagt ggagactgga tttgccctag aattggctgt 360
ggaatccata attatgcaag caggacagag tgctacaaat gcaaaatgcc aagggattat 420
ggtggtgcag actga 435
<210>334
<211>144
<212>PRT
<213>蒺藜苜蓿
<400>334
Met Asn Arg Lys Met Ser Trp Ser Gly Gly Asp Trp Met Cys Gly Ala
1 5 10 15
Cys Glu His Ile Asn Phe Lys Lys Arg Glu Ala Cys Gln Asn Cys Gly
20 25 30
Tyr Pro Lys Tyr Gly Gly Pro Asp Pro Ser Thr Tyr Arg Tyr Asn Arg
35 40 45
Thr Glu Thr Leu Ala Gly Asp Trp Phe Cys Thr Ser Met Asn Cys Gly
50 55 60
Ala His Asn Tyr Ala Ser Arg Ser Asn Cys Tyr Arg Cys Gly Ala Phe
65 70 75 80
Lys Asp Pro Tyr Ser Ser Gly Tyr Gly Gly Asn Met Val Gly Ser Gly
85 90 95
Gly Tyr Gly Ser Asp Cys Ser Ser Pro Pro Gly Trp Lys Ser Gly Asp
100 105 110
Trp Ile Cys Pro Arg Ile Gly Cys Gly Ile His Asn Tyr Ala Ser Arg
115 120 125
Thr Glu Cys Tyr Lys Cys Lys Met Pro Arg Asp Tyr Gly Gly Ala Asp
130 135 140
<210>335
<211>513
<212>DNA
<213>蒺藜苜蓿
<400>335
atgagcagac caggagattg gaactgcagg acatgcaacc acctcaactt tcaaagaaga 60
gaatcttgcc aacgatgtgg ggagtcaaga atgacttctg gctgcggcgc cgttgatttt 120
ggtggctcct ttcttggtgg aagaggctct agctcccctt ttcctttcac caccggccct 180
gatgtccgtc ctggtgactg gtattgcact gttggaaact gtggagctca caactttgcc 240
agccgctcca gctgcttcaa atgtggtgcc cctaaggata ttgatacctt ctcctctgac 300
tcctcagaca tgccacgatt attgagatca ccatacggtt ttggagcagg cagcgctggt 360
ggcggtgcct ccactcgccc cggctggaaa tccggtgact ggatatgcac caggtctggg 420
tgtaacgagc ataacttcgc caatagaatg gaatgctacc gatgcaacgg tccaagggac 480
tctagtactg gaagatcttc ctatttatcg tga 513
<210>336
<211>170
<212>PRT
<213>蒺藜苜蓿
<400>336
Met Ser Arg Pro Gly Asp Trp Asn Cys Arg Thr Cys Asn His Leu Asn
1 5 10 15
Phe Gln Arg Arg Glu Ser Cys Gln Arg Cys Gly Glu Ser Arg Met Thr
20 25 30
Ser Gly Cys Gly Ala Val Asp Phe Gly Gly Ser Phe Leu Gly Gly Arg
35 40 45
Gly Ser Ser Ser Pro Phe Pro Phe Thr Thr Gly Pro Asp Val Arg Pro
50 55 60
Gly Asp Trp Tyr Cys Thr Val Gly Asn Cys Gly Ala His Asn Phe Ala
65 70 75 80
Ser Arg Ser Ser Cys Phe Lys Cys Gly Ala Pro Lys Asp Ile Asp Thr
85 90 95
Phe Ser Ser Asp Ser Ser Asp Met Pro Arg Leu Leu Arg Ser Pro Tyr
100 105 110
Gly Phe Gly Ala Gly Ser Ala Gly Gly Gly Ala Ser Thr Arg Pro Gly
115 120 125
Trp Lys Ser Gly Asp Trp Ile Cys Thr Arg Ser Gly Cys Asn Glu His
130 135 140
Asn Phe Ala Asn Arg Met Glu Cys Tyr Arg Cys Asn Gly Pro Arg Asp
145 150 155 160
Ser Ser Thr Gly Arg Ser Ser Tyr Leu Ser
165 170
<210>337
<211>826
<212>DNA
<213>丝兰(Yucca filamentosa)
<400>337
ggcacaagct ctcacgcaac cccttgtctc cattttactc ttccttcctc tttcaaggga 60
cttgagaaga tgaacaggaa gccaggagac tggaactgca ggtcatgcca gcaccttaat 120
ttcagccgca gggactcgtg ccagcgctgc ggcgaccccc ggtcgatcgg cagcgagcga 180
tcggactacc cgggcttcgt cgggggccgc ggggggtcct cattcgggtt cagcggctcg 240
gacgtcaggc ccggggactg gtactgccag tgcggggccc acaacttcgc cagccgctcg 300
agctgcttca agtgcaatgc tttcaaggat gagtccgccg ctagcggcgg cctcgacggc 360
ggcgacatgc tgagatccag ggggtttggc ttcggcggcg gcggcggcgc tcgcagtggc 420
tggaagtctg gtgactggat ttgcaacagg tctggctgca atgagcacaa cttcgctagc 480
aggatggaat gcttccgatg caatgcacct cgagattcgg gcactgaggt ttaaggagac 540
agccaagaga gaagtgacga gatgagatca gtgatgatga taccagtagt aatctcgagt 600
tattactagt tttgccacca gccccaactt tatctccttt tgatgttttt ttagagcccc 660
cttctaaacg gaggtgtctt ctctttttca tccgtttgtt tgcttttgaa agcttgcact 720
taccctttac acccccccgc ccccctccac cttgtagttt gtgttgagag tgtctttgta 780
agtctttgga gaagggctcc tttagcttct tgggggagtc ccttct 826
<210>338
<211>154
<212>PRT
<213>丝兰
<400>338
Met Asn Arg Lys Pro Gly Asp Trp Asn Cys Arg Ser Cys Gln His Leu
1 5 10 15
Asn Phe Ser Arg Arg Asp Ser Cys Gln Arg Cys Gly Asp Pro Arg Ser
20 25 30
Ile Gly Ser Glu Arg Ser Asp Tyr Pro Gly Phe Val Gly Gly Arg Gly
35 40 45
Gly Ser Ser Phe Gly Phe Ser Gly Ser Asp Val Arg Pro Gly Asp Trp
50 55 60
Tyr Cys Gln Cys Gly Ala His Asn Phe Ala Ser Arg Ser Ser Cys Phe
65 70 75 80
Lys Cys Asn Ala Phe Lys Asp Glu Ser Ala Ala Ser Gly Gly Leu Asp
85 90 95
Gly Gly Asp Met Leu Arg Ser Arg Gly Phe Gly Phe Gly Gly Gly Gly
100 105 110
Gly Ala Arg Ser Gly Trp Lys Ser Gly Asp Trp Ile Cys Asn Arg Ser
115 120 125
Gly Cys Asn Glu His Asn Phe Ala Ser Arg Met Glu Cys Phe Arg Cys
130 135 140
Asn Ala Pro Arg Asp Ser Gly Thr Glu Val
145 150
<210>339
<211>614
<212>DNA
<213>大麦
<400>339
cggcacgagg cacttctcat cttggagctc agcagcacag catccaagct ttttcttcgg 60
caagatgaac aggaagccag gagactggga ctgcaggtcg tgccagcacc tcaacttcag 120
tcgccgggac ctatgccagc gctgcggtga gccacgtagt gccgctgacc gtggcagcgt 180
cggtggtgct cttggtggtg actacgccaa ctttggcggc cgtggcgggg gtggttcctc 240
atttggtgcc ggctttggtg ccggctctga cgtccgcccg ggtgactggt actgcacctg 300
tggagcgcac aacttcgcca gccgctccag ctgcttcaag tgtgctgctt tcaaggagga 360
agctgccgtc aatggtggcg ctggtggctt tgatggtgac atgtcacgct caaggggctt 420
tggctttggc gctgtcggtg gcatgggtgg cggcatggga gccggcgcag ccggtggtcg 480
tgccagtcgc cctggctgga agtctcgcga ctggatttgc accaggtctg gatgcaacga 540
gcacaacttc gccagcaggc aggagtgctt caggtgcaac gcgccgaggg actccggtag 600
cgccacacca tacg 614
<210>340
<211>183
<212>PRT
<213>大麦
<400>340
Met Asn Arg Lys Pro Gly Asp Trp Asp Cys Arg Ser Cys Gln His Leu
1 5 10 15
Asn Phe Ser Arg Arg Asp Leu Cys Gln Arg Cys Gly Glu Pro Arg Ser
20 25 30
Ala Ala Asp Arg Gly Ser Val Gly Gly Ala Leu Gly Gly Asp Tyr Ala
35 40 45
Asn Phe Gly Gly Arg Gly Gly Gly Gly Ser Ser Phe Gly Ala Gly Phe
50 55 60
Gly Ala Gly Ser Asp Val Arg Pro Gly Asp Trp Tyr Cys Thr Cys Gly
65 70 75 80
Ala His Asn Phe Ala Ser Arg Ser Ser Cys Phe Lys Cys Ala Ala Phe
85 90 95
Lys Glu Glu Ala Ala Val Asn Gly Gly Ala Gly Gly Phe Asp Gly Asp
100 105 110
Met Ser Arg Ser Arg Gly Phe Gly Phe Gly Ala Val Gly Gly Met Gly
115 120 125
Gly Gly Met Gly Ala Gly Ala Ala Gly Gly Arg Ala Ser Arg Pro Gly
130 135 140
Trp Lys Ser Arg Asp Trp Ile Cys Thr Arg Ser Gly Cys Asn Glu His
145 150 155 160
Asn Phe Ala Ser Arg Gln Gl u Cys Phe Arg Cys Asn Ala Pro Arg Asp
165 170 175
Ser Gly Ser Ala Thr Pro Tyr
180
<210>341
<211>54
<212>DNA
<213>人工序列
<220>
<223>引物:prm5539
<400>341
ggggacaagt ttgtacaaaa aagcaggctt aaacaatgag cagacccgga gatt 54
<210>342
<211>51
<212>DNA
<213>人工序列
<220>
<223>引物:prm5540
<400>342
ggggaccact ttgtacaaga aagctgggta gacaaggcta cttcaaaagc a 51
<210>343
<211>2193
<212>DNA
<213>稻
<400>343
aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct 60
aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact 120
catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt 180
tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc 240
tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata 300
aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga 360
atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt 420
ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat 480
ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag 540
gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt 600
tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc 660
tgaattcaag cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat 720
aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa 780
aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca 840
acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag 900
tccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa 960
aaccaagcat cctcctcctc ccatctataa attcctcccc ccttttcccc tctctatata 1020
ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag 1080
cgaccgcctt cttcgatcca tatcttccgg tcgagttctt ggtcgatctc ttccctcctc 1140
cacctcctcc tcacagggta tgtgcccttc ggttgttctt ggatttattg ttctaggttg 1200
tgtagtacgg gcgttgatgt taggaaaggg gatctgtatc tgtgatgatt cctgttcttg 1260
gatttgggat agaggggttc ttgatgttgc atgttatcgg ttcggtttga ttagtagtat 1320
ggttttcaat cgtctggaga gctctatgga aatgaaatgg tttagggtac ggaatcttgc 1380
gattttgtga gtaccttttg tttgaggtaa aatcagagca ccggtgattt tgcttggtgt 1440
aataaaagta cggttgtttg gtcctcgatt ctggtagtga tgcttctcga tttgacgaag 1500
ctatcctttg tttattccct attgaacaaa aataatccaa ctttgaagac ggtcccgttg 1560
atgagattga atgattgatt cttaagcctg tccaaaattt cgcagctggc ttgtttagat 1620
acagtagtcc ccatcacgaa attcatggaa acagttataa tcctcaggaa caggggattc 1680
cctgttcttc cgatttgctt tagtcccaga attttttttc ccaaatatct taaaaagtca 1740
ctttctggtt cagttcaatg aattgattgc tacaaataat gcttttatag cgttatccta 1800
gctgtagttc agttaatagg taatacccct atagtttagt caggagaaga acttatccga 1860
tttctgatct ccatttttaa ttatatgaaa tgaactgtag cataagcagt attcatttgg 1920
attatttttt ttattagctc tcaccccttc attattctga gctgaaagtc tggcatgaac 1980
tttcctcaat tttgttttca aattcacatc gattatctat gcattatcct cttgtatcta 2040
cctgtagaag tttctttttg gttattcctt gactgcttga ttacagaaag aaatttatga 2100
agctgtaatc gggatagtta tactgcttgt tcttatgatt catttccttt gtgcagttct 2160
tggtgtagct tgccactttc accagcaaag ttc 2193
<210>344
<211>3
<212>PRT
<213>人工序列
<220>
<223>基序序列1
<220>
<221>变体
<222>(1)..(1)
<223>/取代=″Arg″/取代=″Asp″/取代=″Asn″
<400>344
Gly Asp Trp
1
<210>345
<211>3
<212>PRT
<213>人工序列
<220>
<223>基序序列2
<400>345
Gly Ser Trp
1
<210>346
<211>5
<212>PRT
<213>人工序列
<220>
<223>基序序列3
<220>
<221>变体
<222>(3)..(3)
<223>/取代=″Cys″/取代=″Ser″
<220>
<221>变体
<222>(4)..(4)
<223>/取代=″Lys″
<400>346
Asn Phe Gln Arg Arg
1 5
<210>347
<211>5
<212>PRT
<213>人工序列
<220>
<223>基序序列4
<220>
<221>变体
<222>(2)..(2)
<223>/取代=″Tyr″
<220>
<221>变体
<222>(3)..(3)
<223>/取代=″Ser″/取代=″Pro″
<220>
<221>变体
<222>(4)..(4)
<223>/取代=″Ser″/取代=″Phe″
<400>347
Asn Phe Ala Asn Arg
1 5