CN200880001514.1
2008.01.07
CN101578371A
2009.11.11
授权
有权
授权|||专利申请权的转移IPC(主分类):C12N 15/82变更事项:申请人变更前权利人:拜尔生物科学公司变更后权利人:拜尔作物科学公司变更事项:地址变更前权利人:比利时根特变更后权利人:比利时迪海姆登记生效日:20120424|||实质审查的生效|||公开
C12N15/82
拜尔生物科学公司
S·恩格勒恩; A·阿廖利
比利时根特
2007.1.11 EP 07000550.9; 2007.1.11 US 60/884,564
北京市中咨律师事务所
黄革生;史文静
本发明公开了改变产纤维植物(例如棉花)的纤维性质(例如纤维长度)的方法和手段。本发明还提供了具有纤维优先性或纤维选择性表达模式的植物启动子。
1. 纤维细胞优先性启动子,其包含选自以下核苷酸序列的核苷酸序列:a)核苷酸序列,其包含SEQ ID No 9的第2149位核苷酸至第2307位核苷酸的核苷酸序列;b)核苷酸序列,其包含SEQ ID No 10的第3109位核苷酸至第3269位核苷酸的核苷酸序列;c)核苷酸序列,其包含与a)或b)提到的任何所述核苷酸序列具有至少70%,优选至少80%,更优选至少90%,特别是至少95%序列同一性或者更特别是与a)或b)提到的任何所述核苷酸序列相同的核苷酸序列;或d)核苷酸序列,其包含大约150bp至大约1000bp的DNA片段的核苷酸序列,所述DNA片段在严谨条件下与具有a)、b)或c)提到的所述核苷酸序列的DNA片段杂交。2. 权利要求1的纤维细胞优先性启动子,其包含SEQ ID No 9的第465位至第2307位的核苷酸序列。3. 权利要求1的纤维细胞优先性启动子,其包含SEQ ID No 9的第1374位至第2307位的核苷酸序列。4. 权利要求1的纤维细胞优先性启动子,其包含SEQ ID No 9的第1531位至第2307位的核苷酸序列。5. 权利要求1的纤维细胞优先性启动子,其包含SEQ ID No 10的第1397位至第3269位的核苷酸序列。6. 权利要求1的纤维细胞优先性启动子,其包含SEQ ID No 10的第2371位至第3269位的核苷酸序列。7. 权利要求1的纤维细胞优先性启动子,其包含SEQ ID No 10的第2718位至第3269位的核苷酸序列。8. 纤维细胞优先性启动子区域,其包含权利要求1至7中任意一项的纤维细胞优先性启动子。9. 权利要求8的纤维细胞优先性启动子区域,其还包含SEQ ID 9的第2308位核苷酸至第2409位核苷酸的核苷酸序列。10. 权利要求8的纤维细胞优先性启动子区域,其还包含SEQ ID 10的第3270位核苷酸至第3372位核苷酸的核苷酸序列。11. 嵌合基因,其包含下述有效相连的DNA区域:a)权利要求1至7中任意一项的纤维细胞特异性启动子;b)异源DNA区域,其编码感兴趣的生物活性RNA;以及c)转录终止和聚腺苷化信号。12. 权利要求11的嵌合基因,其中所述生物活性RNA编码感兴趣的蛋白质。13. 权利要求12的嵌合基因,其中所述异源DNA区域编码选自N-乙酰葡糖胺转移酶,优选地,NodC型的N-乙酰葡糖胺转移酶,纤维素合酶,蔗糖合酶,优选地,C型的蔗糖合酶;蔗糖磷酸合酶;β-1,3-内切葡聚糖酶,木聚糖合酶(cslF)、木葡聚糖合酶(cslD)和1,3-1,4葡聚糖合酶(cslC)的分子。14. 权利要求11的嵌合基因,其中所述生物活性RNA是核酶、微小RNA、双链发夹RNA。15. 权利要求12的嵌合基因,其中所述生物活性RNA下调内源棉花基因,例如β-1,3-内切葡聚糖酶的表达。16. 植物细胞,其包含权利要求11至15中任意一项的嵌合基因。17. 植物,其在其细胞中包含权利要求11至15中任意一项的嵌合基因。18. 权利要求17的植物,其是棉花植物。19. 在其细胞中包含权利要求11至15中任意一项的嵌合基因的植物的种子。20. 在产纤维植物,例如棉花植物的纤维细胞中优先表达生物活性RNA的方法,所述方法包括:a)向所述植物的细胞提供权利要求11至15中任意一项的的嵌合基因,以及b)种植所述植物。21. 权利要求20的方法,其中所述植物是棉花植物。22. 权利要求1至7中任意一项的纤维特异性和/或纤维优先性启动子用于在产纤维植物的纤维细胞中优先表达生物活性RNA的用途。23. 权利要求22的用途,其中所述植物是棉花植物。24. 经分离的DNA分子,其包含编码下述蛋白质的核苷酸序列,所述蛋白质包含编码β-1,3-内切葡聚糖酶并且与SEQ ID No 11或SEQ ID No12的氨基酸序列具有至少95%序列同一性、优选相同的氨基酸序列。25. 经分离的DNA分子,其包含选自SEQ ID No 1、SEQ ID No 2、SEQ ID No 3和SEQ ID No 4的核苷酸序列。26. 经分离的DNA分子,其包含选自下述的核苷酸序列:SEQ ID No9的第2410-2443位的核苷酸序列和SEQ ID No 9的第2556-3499位核苷酸序列或SEQ ID No 10的第3373-3406位核苷酸序列和SEQ ID No 10的第3501-4444位核苷酸序列。27. 权利要求24至27中任意一项的经分离的DNA分子用于分离纤维细胞优先性启动子或启动子区域的用途。28. 分离纤维细胞优先性启动子区域的方法,所述方法包括下述步骤:a)鉴定编码下述RNA转录本的基因组片段,可从所述RNA转录本合成下述cDNA,所述cDNA包含SEQ ID No 1、SEQ ID No 2、SEQ ID No3或SEQ ID No 4或其功能等价物的核苷酸序列;b)分离编码下述蛋白质的核苷酸序列上游的DNA区域,所述蛋白质具有SEQ ID No 11或SEQ ID No 12或其功能等价物的氨基酸。29. 通过权利要求28的方法获得的纤维细胞优先性启动子或启动子区域。30. 增加棉花植物纤维长度的方法,所述方法包括下述步骤:向所述棉花植物的细胞中引入下述嵌合基因,所述嵌合基因包含下述有效相连的DNA元件:(a)可植物表达的启动子,优选地,控制在所述纤维细胞中优先转录的可植物表达的启动子;(b)转录的DNA区域,当其被转录时,其产生下述生物活性RNA分子,所述分子能降低对于所述产纤维植物内源的β-1,3-内切葡聚糖酶编码基因的表达,所述β-1,3-内切葡聚糖酶涉及从所述胞间连丝去除胼胝质,以及(c)3’末端区域,其包含在所述植物的细胞中有功能的转录终止和聚腺苷化信号,所述方法特征在于,所述内源β-1,3-内切葡聚糖酶编码基因是所述棉花植物的D亚基因组中包含的β-1,3-内切葡聚糖酶编码基因。31. 权利要求30的方法,其中所述启动子是来自棉花的纤维特异性β微管蛋白启动子、来自棉花的纤维特异性肌动蛋白启动子、来自棉花的脂转移蛋白质基因的纤维特异性启动子、来自棉花的扩展蛋白基因的启动子或来自棉花几丁质酶基因的启动子或权利要求1至7中任意一项所述的启动子。32. 权利要求31的方法,其中所述D亚基因组中包含的所述β-1,3-内切葡聚糖酶编码基因表征为:具有SEQ ID No 10第3407-3500位的核苷酸序列的内含子序列的存在。33. 权利要求31的方法,其中所述D亚基因组中包含的所述β-1,3-内切葡聚糖酶编码基因表征为:翻译起始密码子下游大约326个核苷酸处(不包括该翻译起始密码子)核苷酸序列AAGATC的存在。34. 权利要求31的方法,其中所述D亚基因组中包含的所述β-1,3-内切葡聚糖酶编码基因表征为:用具有SEQ ID No 5和SEQ ID No 6的核苷酸序列的寡核苷酸进行PCR扩增,再用AlwI限制性酶消化后,对大约538bp的片段和大约118bp的片段的鉴定。35. 权利要求31的方法,其中所述内源基因编码包含SEQ ID No 12的氨基酸序列的蛋白质或者其中所述基因包含SEQ ID No 2的核苷酸序列。36. 权利要求30至35中任意一项的方法,其中所述棉花植物是陆地棉(Gossypium hirsutum)。37. 权利要求30至35中任意一项的方法,其中所述生物活性RNA是反义RNA,所述反义RNA包含与SEQ ID No 3的核苷酸序列互补序列具有至少94%序列同一性的至少19个核苷酸。38. 权利要求30至35中任意一项的方法,其中所述生物活性RNA是正义RNA,所述正义RNA包含与SEQ ID No 3的核苷酸序列具有至少94%序列同一性的至少19个核苷酸。39. 权利要求30至35中任意一项的方法,其中所述生物活性RNA是双链RNA分子,所述双链RNA分子包含与SEQ ID No 3的核苷酸序列互补序列具有至少94%序列同一性的至少19个核苷酸以及与所述至少19个核苷酸的互补序列基本上相似的互补RNA链。40. 权利要求37至39中任意一项的方法,其中所述19个核苷酸包含特异于如图2所示的D亚基因组Ghgluc1基因的至少一个核苷酸。41. 权利要求39的方法,其中所述双链RNA是从包含SEQ ID No 15、SEQ ID No 16、SEQ ID No 20或SEQ ID No 21的核苷酸序列的前微小RNA加工的微小RNA。42. 权利要求30至41中任意一项的方法,其中所述纤维是棉绒纤维。43. 权利要求30至41中任意一项的方法,其中所述纤维是绒毛纤维。44. 权利要求30至43中任意一项的方法,其还包括(a)种植根据所述方法获得的植物;以及(b)从所述产纤维植物分离纤维。45. 减少产纤维植物的纤维长度的方法,所述方法包括下述步骤:将嵌合基因引入所述产纤维植物的细胞,其中,所述嵌合基因包含下述有效相连的DNA片段:(a)根据权利要求1b、5、6或7的可植物表达的启动子;(b)DNA区域,其编码β-1,3-葡聚糖酶蛋白质;以及(c)3’末端区域,其包含在所述植物的细胞中有功能的转录终止和聚腺苷化信号。46. 权利要求17的方法,其中编码所述β-1,3葡聚糖酶蛋白质的所述DNA区域编码与SEQ ID No 11或SEQ ID No 12的氨基酸序列具有至少95%序列同一性的氨基酸序列。47. 权利要求30至46中任意一项所述的嵌合基因。48. 产纤维植物的细胞,其包含权利要求47的嵌合基因。49. 产纤维植物,其包含权利要求47的嵌合基因。50. 权利要求49的产纤维植物,其中所述植物的纤维长度较之未经转化的对照植物有所增加。51. 权利要求49或50中任意一项的产纤维植物,其中所述植物是棉花。52. 权利要求51的棉花植物,其是陆地棉。53. 权利要求49至52中任意一项的产纤维植物的种子,所述种子包含权利要求47的嵌合基因。54. 根据权利要求30至46中任意一项的方法生产的纤维。
亚基因组特异性等位基因在棉花中的差异表达及其用途 发明领域 本发明涉及农业领域,更具体地,涉及分子生物学技术用于改造产纤维植物(特别是棉花植物)和/或加速对此类含纤维植物的培育的用途。本发明提供了改造纤维品质的方法和手段,例如,增加纤维长度(特别是棉绒纤维长度)或用于减少绒毛(fuzz)纤维的长度。本发明还提供了在多个棉花品种和相关祖先植物中鉴定与纤维长度相关的分子标记的方法。此外,本发明提供了具有纤维优先或纤维选择性表达模式的植物启动子。启动子还被暂时调节。 发明背景 棉花提供了很多用于纺织工业的高品质纤维。对棉花纤维特征进行修饰使其更好地适应工业需求,是通过经典方法或通过对棉花植物的基因组遗传改造来进行培育中的重大努力。 世界范围内种植的棉花中大约90%都是陆地棉(Gossypium hirsutumL.),而海岛棉(Gossypium barbadense)占大约8%。和大多数开花植物一样,棉花的基因组被认为已经历了一个或多个多倍体化事件,并且已通过将分歧基因组在共有的核中连起来而进化过。棉花商业主要由两种“AD”四倍体物种的改进形式(陆地棉和海岛棉(Gossypium barbadense L.))占主导。四倍体棉花被认为在大约1-2百万年前于新世界(New World)形成,其通过母本旧世界(Old World)“A”基因组分类群类似的草棉(Gossypium herbaceum)和亲本新世界“D”基因组分类群类似的雷蒙德氏棉(Gossypium raimondii)或拟似棉(Gossypium gossypioides)之间的杂交形成。野生的A基因组二倍体和AD四倍体棉属(Gossypium)分类群产生可纺纤维。一种A基因组二倍体物种,树棉(Gossypium arboreum),在亚洲仍被广为培育和培养。其密切相关并且可能的祖先——A基因组二倍体物种草棉(G.herbaceum)也产生可纺纤维。虽然D基因组二倍体的种子是被柔毛的(pubescent),但是不能产生可纺纤维。还没有种植来自其它认可的二倍体棉属基因组(B、C、E、F和G)的分类群。人类强有力的定向选择一贯以来产生了具有比A基因组二倍体栽培种更高产量和/或品质特征的AD四倍体棉花。对陆地棉(G.hirsutum)(AADD)的选择性培育强调最大产量,而海岛棉(G.barbadense)(AADD)则以其纤维优秀的长度、强度和精细度见长(Jiang等人1998-Proc Natl Acad Sci US A.1998 April 14;95(8):4419-4424)。 棉花纤维是在开花期或恰在开花之前从胚珠外珠被表皮启动的单细胞。之后,纤维迅速延伸大约3周,这之后它们转而进行强烈的次生细胞壁纤维素合成。纤维细胞仅在其基底末端(basal ends)与下面的种皮相互连接,溶质、水和其它分子经由胞间连丝或质膜流入。Ruan等人2001(Plant Cell 13:47-63)展示了纤维延伸期间胞间连丝的暂时闭合。Ruan等人2004(Plant Physiology-卷136:第4104-4113页)对纤维长度有所不同的不同棉花基因型的胞间连丝闭合持续时间进行了比较,并且发现胞间连丝闭合的持续时间和纤维长度之间有正相关。此外,显微证据表明,纤维基底处胼胝质沉积和降解与胞间连丝闭合和重开的时机相关。此外,纤维中的β-1,3-内切葡聚糖酶基因(GhGluc1)(令胼胝质降解)与纤维基底处胞间连丝的重开相关。 W02005/017157描述了在产纤维植物(例如棉花)中通过改变纤维延伸期(如Ruan等人2001所述)调节纤维长度的方法和手段。可通过干扰纤维细胞基底处胞间连丝中的胼胝质沉积来增加或减少纤维延伸期。 此外,通过遗传工程修饰纤维,以含有仅在纤维细胞中特异性表达或优先表达和/或仅从特定纤维发育阶段开始表达的启动子也是令人感兴趣的。 WO2004/018620涉及编码内源棉花几丁质酶及其下述启动子的经分离的核酸分子,所述启动子在次生壁沉积期间优先在纤维中表达。还公开了核酸分子编码的多肽,将经分离的核酸分子与启动子连接起来的DNA构建体,并入有DNA构建体的表达系统、宿主细胞、植物或植物种子。文献还涉及将经分离的启动子与第二DNA连接起来的DNA构建体以及含有所述DNA构建体的表达系统、宿主细胞、植物或植物种子。还公开了赋予针对昆虫和真菌的抗性、调节纤维的纤维素含量的方法以及在次生壁沉积期间优先在纤维中表达基因的方法。 具有下述备选启动子可能是有用的,所述启动子将在次生壁沉积期间驱动优先和/或强烈地在纤维中发生的基因表达,即,例如从次生壁沉积的启动到其终止或者例如从成熟阶段开始,强烈且持续地表达(例如,>其最大活性的50%)。次生壁沉积的启动被定义为:由于含有超过40%(w/w)纤维素的新的壁物质的合成,任何细胞的干重/单位表面积开始增加或棉花纤维的干重/单位长度开始增加的时间。在陆地棉的棉花纤维的情况下,当棉花植物在典型条件下于温室中或田间(日间温度26-34℃,夜间温度20-26℃,光强度超过或等于1000爱因斯坦/m2/s,有足够的水和矿物质营养)生长时,这预计在14-17DPA之间发生。在陆地棉的棉花纤维的情况下,次生细胞壁形成的终点和成熟期的开始通常在35DPA左右。 此外,具有下述备选启动子可能是有用的,所述启动子将驱动仅在或优先在纤维中发生的基因表达,同时排除或最小化在其它组织中的表达。 下文在不同实施方案、实施例、图和权利要求中描述的本发明提供了用于调节纤维长度的改进方法和手段,这通过在特定时间点减少或增加纤维细胞基底处的胼胝质沉积来实现。下文描述的本发明还提供了纤维特异性和/或纤维优先性的启动子和启动子区域。 发明内容 在本发明的一种实施方案中,提供了纤维细胞优先性的启动子,其包含选自以下核苷酸序列的核苷酸序列: a)核苷酸序列,其包含SEQ ID No 9的第2149位核苷酸至第2307位核苷酸的核苷酸序列; b)核苷酸序列,其包含SEQ ID No 10的第3109位核苷酸至第3269位核苷酸的核苷酸序列; c)核苷酸序列,其包含与a)或b)提到的任何核苷酸序列具有至少70%,优选至少80%,更优选至少90%,特别是至少95%序列同一性或者更特别是与a)或b)提到的任何核苷酸序列相同的核苷酸序列;或 d)核苷酸序列,其包含大约150bp至大约1000bp的DNA片段的核苷酸序列,所述DNA片段能在严谨条件下与具有a)、b)或c)提到的核苷酸序列的DNA片段杂交。 纤维细胞优先性启动子可包含SEQ ID No 9的第465位至第2307位的核苷酸序列;或SEQ ID No 9的第1374位至第2307位的核苷酸序列;或SEQ ID No 9的第1531位至第2307位的核苷酸序列;或SEQ ID No 10的第1397位至第3269位的核苷酸序列;或SEQ ID No 10的第2371位至第3269位的核苷酸序列;或SEQ ID No 10的第2718位至第3269位的核苷酸序列。 在另一实施方案中,本发明提供了下述纤维细胞优先性启动子区域,其包含本文所述的纤维细胞优先性启动子,还包含SEQ ID 9的第2308位核苷酸至第2409位核苷酸或第3270位至第3372位核苷酸的核苷酸序列。 在本发明的还一实施方案中,提供了包含下述有效相连的DNA区域的嵌合基因: a)本文所述的纤维细胞优先性启动子 b)异源DNA区域,其编码感兴趣的生物活性RNA;以及 c)转录终止和聚腺苷化信号。 生物活性RNA可编码感兴趣的蛋白,例如,N-乙酰葡糖胺转移酶(优选地,NodC型的N-乙酰葡糖胺转移酶)、纤维素合酶、蔗糖合酶(优选地,C型的蔗糖合酶)、蔗糖磷酸合酶或β-1,3-内切葡聚糖酶。生物活性RNA还可以是抑制性RNA或沉默RNA,例如核酶、微小RNA、双链发夹RNA,特别是被靶向以下调内源棉花基因(例如,β-1,3-内切葡聚糖酶木聚糖合酶(cslF)、木葡聚糖合酶(cslD)或1,3-1,4葡聚糖合酶(cslC))表达的。 本发明还提供了包含此类嵌合基因的植物细胞和植物(例如棉花植物)及其种子。还提供了在其细胞中包含根据权利要求11至15中任意一项所述的嵌合基因的植物种子。 本发明还提供了在产纤维植物(例如棉花植物)的纤维细胞中优先表达生物活性RNA的方法,所述方法包括下述步骤:向植物的细胞提供根据本发明的嵌合基因,并种植所述植物。 在另一实施方案中,本发明涉及本发明的纤维特异性和/或纤维优先性启动子用于在产纤维植物(例如棉花植物)的纤维细胞中优先表达生物活性RNA的用途。 本发明还提供了:经分离的DNA分子,其包含编码下述蛋白的核苷酸序列,所述蛋白包含编码β-1,3-内切葡聚糖酶并且与SEQ ID No 11或SEQ ID No 12的氨基酸序列具有至少95%序列同一性、优选相同的氨基酸序列;经分离的DNA分子,其包含选自SEQ ID No 1、SEQ ID No 2、SEQID No 3和SEQ ID No 4的核苷酸序列,或经分离的DNA分子,其包含选自下述的核苷酸序列:SEQ ID No 9的第2410-2443位的核苷酸序列和SEQID No 9的第2556-3499位核苷酸序列或SEQ ID No 10的第3373至3406位核苷酸序列和SEQ ID No 10的第3501-4444位核苷酸序列。这些经分离的DNA分子可用于分离纤维细胞优先性启动子或启动子区域。 本发明还提供了分离纤维细胞优先性启动子区域的方法,所述方法包括下述步骤: -鉴定编码下述RNA转录本的基因组片段,可从所述RNA转录本合成下述cDNA,所述cDNA包含SEQ ID No 1、SEQ ID No 2、SEQ ID No3或SEQ ID No 4或其功能等价物的核苷酸序列; -分离编码下述蛋白的核苷酸序列上游的DNA区域,所述蛋白具有SEQ ID No 11或SEQ ID No 12或其功能等价物的氨基酸。 本发明还提供了通过此方法获得的纤维选择性启动子和启动子区域。 根据本发明的第二方面,提供了在产纤维植物中改变纤维性质的方法,特别是增加棉花植物的纤维长度,所述方法包括:向棉花植物的细胞中引入嵌合基因,所述嵌合基因包含下述有效相连的DNA元件: (a)可植物表达的启动子,优选地,控制在纤维细胞中优先转录的可植物表达的启动子,例如,来自棉花的纤维特异性β微管蛋白启动子、来自棉花的纤维特异性肌动蛋白启动子、来自棉花的脂转移蛋白基因的纤维特异性启动子、来自棉花的扩展蛋白基因的启动子或来自棉花几丁质酶基因的启动子或本文所述的启动子; (b)转录的DNA区域,当其被转录时,其产生下述生物活性RNA分子,所述分子能降低产纤维植物内源的β-1,3-内切葡聚糖酶编码基因的表达,所述β-1,3-内切葡聚糖酶涉及从胞间连丝去除胼胝质,以及 (c)3’末端区域,其包含在植物细胞中有功能的转录终止和聚腺苷化信号, 所述方法特征在于,仅内源β-1,3-内切葡聚糖酶编码基因的特定亚基因组等位基因的表达被下调。在一种优选的实施方案中,β-1,3-内切葡聚糖酶编码基因包含在棉花植物的D亚基因组中。包含在D亚基因组中的β-1,3-内切葡聚糖酶编码基因的可表征为:具有SEQ ID No 10第3407-3500位的核苷酸序列的内含子序列的存在;或可被表征为:翻译起始密码子下游大约326个核苷酸处(不包括翻译起始密码子)核苷酸序列AAGATC的存在。方便地,包含在D亚基因组中的β-1,3-内切葡聚糖酶编码基因可这样来表征:用具有SEQ ID No 5和SEQ ID No 6的核苷酸序列的寡核苷酸进行PCR扩增,再用AlwI限制性酶消化后,对大约538bp的片段和大约118bp的片段的鉴定。β-1,3-内切葡聚糖酶编码基因还可编码包含SEQ ID No 12的氨基酸序列的蛋白或者其中所述基因包含SEQ ID No 2的核苷酸序列。棉花植物可以是陆地棉(Gossypium hirsutum)。 生物活性RNA可以是反义RNA,其包含与SEQ ID No 3的核苷酸序列互补序列具有至少94%序列同一性的至少19个核苷酸,或者生物活性RNA可以是正义RNA,其包含与SEQ ID No 3的核苷酸序列具有至少94%序列同一性的至少19个核苷酸,或者生物活性RNA可以是双链RNA分子,其包含与SEQ ID No 3的核苷酸序列互补序列具有至少94%序列同一性的至少19个核苷酸和与所述至少19个核苷酸的互补序列基本上相似的互补RNA链。优选地,提到的19个核苷酸包含特异于图2所示的D亚基因组Ghgluc1基因的至少一个核苷酸。在根据本发明的另一实施方案中,双链RNA是从包含SEQ ID No 15、SEQ ID No 16、SEQ ID No 20或SEQID No 21的核苷酸序列的前微小RNA加工的微小RNA。 本发明还提供了减少产纤维植物的纤维长度的方法,所述方法包括下述步骤:将嵌合基因引入产纤维植物的细胞,其中,所述嵌合基因包含下述有效相连的DNA片段: (a)根据权利要求1b、5、6或7的可植物表达的启动子; (b)DNA区域,其编码β-1,3-葡聚糖酶蛋白,例如,具有下述氨基酸序列的蛋白,所述氨基酸序列与SEQ ID No 11或SEQ ID No 12的氨基酸序列具有至少95%的序列同一性;以及 (c)3’末端区域,其包含在植物细胞中有功能的转录终止和聚腺苷化信号。 本发明的另一实施方案涉及本文所述的嵌合基因或包含此类嵌合基因的产纤维植物或产纤维植物的细胞。 在又一实施方案中,本发明提供了根据本文所述的方法生产的纤维。 附图简述 图1:对来自陆地棉的亚基因组D和亚基因组A的β-1,3-内切葡聚糖酶基因的启动子序列的比对。亚基因组A的启动子的核苷酸序列(上面的序列)对应于SEQ ID No 9的第1460位至第2408位的核苷酸序列。亚基因组D的启动子的核苷酸序列(下面的序列)对应于SEQ ID No 10的第2372位至3372位的核苷酸序列。核苷酸序列的差异由灰色的盒表示。另一启动子区域中不具有对应核苷酸的核苷酸通过核苷酸序列中没有示出核苷酸的破折号来表示。两条启动子区域间的总体同源性为大约71%的序列同一性。 图2:对来自陆地棉的亚基因组D和亚基因组A的β-1,3-内切葡聚糖酶基因的编码区域(没有内含子)的比对。亚基因组A等位基因的编码区域的核苷酸序列(上面的序列)对应于SEQ ID No 9的第2410位至2443位和第2556-3499位的核苷酸序列。亚基因组D等位基因的编码区域的核苷酸序列(下面的序列)对应于SEQ ID No 10的第3373位至3406位和第3501-4444位的核苷酸序列。核苷酸序列的差异由灰色的盒表示。另一启动子区域中不具有对应核苷酸的核苷酸通过核苷酸序列中没有示出核苷酸的破折号来表示。两条启动子区域间的总体同源性为大约97%的序列同一性。 图3:对来自陆地棉的亚基因组D和亚基因组A的β-1,3-内切葡聚糖酶基因的内含子序列的比对。上面的序列对应于亚基因组A等位基因内含子的核苷酸序列,而下面的序列对应于亚基因组D等位基因内含子的核苷酸序列。 图4:对亚基因组A等位基因(上面的序列,对应于SEQ ID No 11)和亚基因组D等位基因(下面的序列,对应于SEQ ID No 12)编码的β-1,3-内切葡聚糖酶的氨基酸序列的比对。 图5:对SEQ ID No 1至4的从第201至211位核苷酸的核苷酸序列的比对。β-1,3-内切葡聚糖酶基因的仅亚基因组A等位基因核苷酸序列中存在的Alw1限制性酶识别位点被下划线并以斜体示出。 图6:纤维生长曲线(图A)与β-1,3-内切葡聚糖酶基因(GhGluc1)(图B)之间的关联。来自陆地棉的(发育中)纤维的cDNA文库的DNA被提取并均衡(equalized)。使用寡核苷酸引物SE002和SE003(SEQ IDNo 5和6)来扩增PCR片段,用AlwI来消化。针对A-基因组变体的PCR扩增产物产生了3条片段(479bp+118bp+59bp),而针对D-基因组变体的仅产生了2条片段(538bp+118bp)。 图7:通过RT-PCR,对棉花叶、根和茎中GhGluc1的表达分析。对从棉花叶、根和茎提取的RNA进行RT-PCR分析,以检测葡聚糖酶1或蛋白质磷酸酶2A(pp2A)的表达。用来自Invitrogen的SuperScript第一链合成系统(SuperScript First-Strand Synthesis System)来进行第一链cDNA合成。道1:100bp梯度;道2:棉花叶RNA样品+Gluc1特异性引物+逆转录酶;道3:棉花叶RNA样品+Gluc1特异性引物-逆转录酶;道4:棉花根RNA样品+Gluc1特异性引物+逆转录酶;道5:棉花根RNA样品+Gluc1特异性引物-逆转录酶;道6:棉花茎RNA样品+Gluc1特异性引物+逆转录酶;道7:棉花茎RNA样品+Gluc1特异性引物-逆转录酶;道8:基因组DNA(Fibermax 400ng)+Gluc1特异性引物;道9:100bp梯度;道10:棉花叶RNA样品+pp2A特异性引物+逆转录酶;道11:棉花叶RNA样品+pp2A特异性引物-逆转录酶;道12:棉花根RNA样品+pp2A特异性引物+逆转录酶;道13:棉花根RNA样品+pp2A特异性引物-逆转录酶;道14:棉花茎RNA样品+pp2A特异性引物+逆转录酶;道15:棉花茎RNA样品+pp2A特异性引物-逆转录酶;道16:100bp梯度;道17:阳性对照RNA(随试剂盒提供的)。 实施方式详述 本发明基于出人意料的发现:纤维特异性的β-1,3-内切葡聚糖酶基因(GhGluc1)的A和D亚基因组特异性等位基因的表达时机至少在陆地棉中有所不同。虽然D亚基因组特异性等位基因表达的启动与迅速延伸期(开花后大约14至17天(下文中称为“DPA”))相关联,但A亚基因组的表达的启动却延迟到纤维成熟后期(大约35-40DPA)开始,这取决于生长条件。 因此,在一个方面,本发明涉及对新颖的纤维特异性启动子的鉴定,所述启动子在来自迅速延伸期(rapid elongation phase)末的纤维细胞或来自纤维成熟期启动的纤维细胞中优先表达。此类启动子具有下述用处,例如,用于产生新颖生物分子的嵌合基因(例如编码增强的XET、纤维素结合结构域(CBD)、根肿胀(RSW)突变体基因、着色、塑料、纤维素消化性、新颖的细胞壁复合物/性质)在纤维发育后期的表达。启动子还可用于指导20、30、40DPA时纤维中的基因表达;例如,在棉花纤维发育后期(20、30、40DPA)几丁质的产生,或者用于40DPA时纤维中的基因表达,例如,在棉花纤维发育的非常后期(40DPA)几丁质的产生。根据本发明的启动子还可用于指导CesA基因在40DPA的表达,用于增强的纤维素生物合成以及增强的纤维性质,或用于产生内源棉花基因的被指导为阶段特异性沉默的生物活性RNA,例如,沉默β-1,3-内切葡聚糖酶,以使得纤维生长更长。启动子还可用于嵌合基因(编码例如胼胝质合酶)的阶段特异性表达,以改变纤维性质和品质。 在另一个方面,本发明涉及对纤维特异性β-1,3-内切葡聚糖酶基因的一种亚基因组特异性等位基因表达的沉默,特别是沉默D-亚基因组特异性等位基因,以防止胼胝质降解,以及由此增加迅速纤维延伸期和纤维长度,例如,棉花中的,特别是陆地棉中的。 根据本发明第一方面的一种实施方案,本发明提供了纤维特异性和/或纤维优先性启动子片段,所述片段可分离自棉花,特别是陆地棉物种,并且,其存在于编码纤维特异性β-1,3-内切葡聚糖酶(具有包含SEQ ID No11、12、7或8的氨基酸序列或其变体的氨基酸序列)的核酸序列的上游。 在本文中使用时,术语“启动子”指在转录起始期间被DNA依赖性的RNA聚合酶识别并结合(直接或间接)的任何DNA。启动子包括转录起始位点和用于转录起始因子和RNA聚合酶的结合位点,启动子可包含多种其它位点(例如增强子),这些位点上可结合基因表达调控蛋白。 术语“调控区域”在本文中使用时表示参与驱动转录和控制(即调控)给定DNA序列(例如编码蛋白或多肽的DNA)转录的水平和时机的任何DNA。例如,5’调控区域(或“启动子区域”)是位于编码序列上游(即,5’)的DNA序列,其包含启动子和5’非翻译前导序列。3’调控区域是位于编码序列下游(即3’)的DNA序列,其包含合适的转录3’末端形成(和/或调控)信号,包括一个或多个聚腺苷化信号。 术语“基因”表示包含下述DNA区域(“转录的DNA区域”)的任何DNA片段,所述DNA区域在合适调控区域(例如可植物表达的启动子区域)控制下在细胞中转录为RNA分子(例如mRNA)。基因由此可包含若干有效相连的DNA片段,例如启动子、5’非翻译前导序列、编码区域和3’非翻译区域(包含聚腺苷化位点)。内源植物基因是在植物物种中天然发现的基因。嵌合基因是在植物物种中正常情况下不会发现的任何基因,或者任何这样的基因:其中启动子天然状态下并不与转录的DNA区域(“异源”DNA区域)的部分或全部或基因的至少一个其它调控区域相连。 术语“基因表达”指这样的过程,其中,在调控区域(特别是启动子)控制下的DNA区域被转录为生物活性RNA,即,能与另一核酸相互作用或能被翻译为生物活性多肽或蛋白质的RNA。当基因表达的终产物是生物活性RNA,例如反义RNA或核酶时,基因被说成是编码RNA的。当基因表达的终产物是功能活性或生物活性蛋白质或多肽的时候,基因就被说成是编码蛋白质的。 在关于根据本发明的DNA表达的方面,术语“纤维选择性”或“纤维细胞选择性”或“纤维特异性”或“纤维细胞特异性”指:DNA在植物(例如棉花植物)纤维细胞中的高度特异性表达(对于实际目的而言)(“纤维细胞-选择性”)。换句话说,DNA在不同于纤维细胞的组织中的转录水平低于检测或非常低(相对每微克总RNA低于大约0.2皮克(picogrammes))。 在关于根据本发明的DNA表达的方面,术语“纤维优先性”或“纤维细胞优先性”指这样的表达模式,其中DNA主要在纤维细胞或纤维中表达,但是可在植物的其它组织中鉴定到表达。优选地,在纤维细胞中的表达是在其它组织中的表达的大约2至大约10倍高。 SEQ ID No 9和SEQ ID No 10的核苷酸序列代表分别编码A亚基因组和D亚基因组的纤维选择性β-1,3-内切葡聚糖酶的基因组DNA分子的核苷酸序列。SEQ ID No 9的转录起始位点已被确定为第2308位,而SEQ IDNo 10的转录起始位点已被确定为第3270位。因此,在本发明的一种实施方案中,提供了具有SEQ ID No 9的第1位核苷酸至第2307或2308位核苷酸的核苷酸序列的纤维选择性启动子;在本发明的另一实施方案中,提供了具有SEQ ID No 10的第1位核苷酸至第3269或3270位核苷酸的核苷酸序列的纤维选择性启动子。 SEQ ID No 9的核苷酸序列的翻译起始位点已被确定为位于第2410至2412位的ATG密码子。编码β-1,3-内切葡聚糖酶的A亚基因组等位基因的纤维选择性启动子的5’非翻译区域因此具有SEQ ID No 9的第2308位核苷酸至第2409位核苷酸的核苷酸序列。A亚基因组等位基因的纤维选择性启动子区域因此是包含SEQ ID No 9的第1至2409位核苷酸的启动子区域。 类似地,SEQ ID No 10的核苷酸序列的翻译起始位点已被确定为位于第3373至3375位的ATG密码子。编码β-1,3-内切葡聚糖酶的D亚基因组等位基因的纤维选择性启动子的5’非翻译区域因此具有SEQ ID No 10的第3270位核苷酸至第3372位核苷酸的核苷酸序列。D亚基因组等位基因的纤维选择性启动子区域因此是包含SEQ ID No 10的第1至3372位核苷酸的启动子区域。 对SEQ ID No 9和SEQ ID No 10的纤维选择性启动子区域的比对(图1)揭示了ATG翻译起始密码子上游大约1000个核苷酸的核苷酸序列间的一般序列同源性,特别是在ATG翻译起始密码子上游大约150个核苷酸的区域中。因此,在本发明的另一实施方案中,提供了这样的纤维选择性启动子,其包含SEQ ID No 9的第2149位核苷酸至第2307位核苷酸的核苷酸序列,或包含SEQ ID No 10的第3109位核苷酸至第3269位核苷酸的核苷酸序列。 不言而喻,启动子或启动子区域可被包含在较大的核苷酸序列中。纤维细胞选择性启动子区域因此可被确定为编码SEQ ID No 9或10示出的mRNA编码的蛋白的第一个氨基酸的密码子上游(即,位于其5’)的区域。此类启动子区域可以至少在起始密码子上游大约400至500bp,至少大约1000bp,至少1200bp,至少大约1300bp或者至少大约1500至2000bp。为方便而言,优选地,此类启动子区域不延伸超过起始密码子上游大约3000至5000bp。片段大小可部分由方便的限制性位点的存在来确定。例如,对于编码β-1,3-内切葡聚糖酶的A亚基因组等位基因的纤维选择性启动子区域而言,可以方便地克隆大约1945bp的片段(SEQ ID No 9的第465位核苷酸至第2409位核苷酸)。合适的限制性酶的存在允许方便地产生大约1036bp(SEQ ID No 9的第1374核苷酸至第2409位核苷酸)或大约879bp(SEQ ID No 9的第1531位核苷酸至第2409位核苷酸)的启动子区域。对于编码β-1,3-内切葡聚糖酶的D亚基因组等位基因的纤维选择性启动子区域而言,可以方便地克隆大约1976bp的片段(SEQ ID No 10的第1397位核苷酸至第3372位核苷酸)。合适的限制性酶的存在允许方便地产生大约1002bp(SEQ ID No 10的第1397核苷酸至第3372位核苷酸)或大约655bp(SEQ ID No 10的第2371位核苷酸至第3372位核苷酸)的启动子区域。 还应当清楚,可以从其它棉花植物或棉花祖先植物中分离出等价的纤维选择性启动子或启动子区域。为达到此目的,可使用本文所述的启动子片段作为探针,鉴定下述其它植物中在严谨杂交条件下杂交的核苷酸序列,从而从其它棉花植物,例如海岛棉(包括所谓的PIMA品种)或从其它品种分离启动子片段。 “严谨杂交条件”在本文中使用时表示:如果在探针和靶序列之间有至少95%以及优选至少97%的序列同一性,那么一般来说将发生杂交。严谨杂交条件的例子是:在包含50%甲酰胺、5x SSC(150mM NaCl、15mM柠檬酸三钠)、50mM磷酸钠(pH 7.6)、5x Denhardt’s溶液、10%硫酸葡聚糖和20μg/ml变性的经剪切载体DNA(例如鲑精DNA)的溶液中过夜孵育,接着在0.1x SSC中于大约65℃洗杂交支持物(support)。其它杂交和洗涤条件是公知的,并且在Sambrook等人,Molecular Cloning:ALaboratory Manual,第二版,Cold Spring Harbor,NY(1989),特别是第11章中有例示。 从其它棉花植物或棉花祖先植物中分离的这些等价纤维选择性启动子可代表变体启动子,其中一个或多个核苷酸已通过取代、缺失或插入而被替代。根据本发明的变体纤维选择性启动子还可合成产生。图1显示了对来自陆地棉的A和D亚基因组的纤维选择性启动子的比对和变化位置,其中核苷酸序列可明显改变,而不会对纤维选择性转录起始能力造成显著影响,这用灰色的盒来示出。从图1及其图例,还可明显看出,两条示例纤维选择启动子片段间的总体序列同一性可低至大约71%序列同一性。 因此,在本发明的另一实施方案中,提供了这样的纤维选择性启动子和启动子区域,其包含与本文所述的纤维选择性启动子和启动子区域具有至少70%或至少80%或至少90%或至少95%的序列同一性的核苷酸序列。 就本发明的目的而言,两条相关核苷酸或氨基酸序列的“序列同一性”(表示为百分比)指两条被最优对齐的序列中具有相同残基的位置的数量(x100)除以比较的位置数量。空位(即,比对中,在一条序列中存在残基而在另一条中不存在残基的位置)被认为是具有不相同残基的位置。对两条序列的比对是通过Needleman和Wunsch算法(Needleman和Wunsch1970)来进行的。可使用标准软件程序(例如GAP,其是Wisconsin PackageVersion 10.1(Genetics Computer Group,Madision,Wisconsin,USA)的一部分),使用缺省计分矩阵(其中空位产生罚分为50和空位延伸罚分为3),来方便地进行上述计算机辅助的序列比对。 应当清楚,参照相应DNA分子的核苷酸序列来定义RNA分子的核苷酸序列时,核苷酸序列中的胸腺嘧啶(T)都应当被替换为尿嘧啶(U)。提到RNA还是DNA分子将从本申请的上下文中清楚可见。 可以通过将此类DNA分子与编码易于计分的标记的编码区域(例如,β-葡糖醛酸糖苷酶基因)有效相连,将此类嵌合基因引入产纤维植物,并分析标记在纤维细胞中的表达模式(优选地,纤维发育期间)(与标记在植物其它部分中的表达模式相比较),来方便地测试鉴定或产生的启动子或启动子区域的纤维选择性表达能力。 不言而喻,本发明的启动子和启动子区域还可包含已知能提高转录效率的其它元件,例如增强子、内含子等。 此外,示例的纤维选择性启动子区域的示例性5’UTR序列在核苷酸序列上相当相似,预计5’UTR序列是可互换的。 本发明还包括下述DNA分子,其包含与编码生物活性RNA、肽或蛋白质的一个或多个异源区域有效相连的本发明的纤维选择性启动子或启动子区域。本发明的启动子可用于表达任何期望的异源编码区域。 可使用本发明的启动子来表达的其它编码蛋白的DNA分子的例子包括但不限于:同源和异源的纤维素合酶(CesA基因),天然和突变形式的均可(Arioli等人,″Molecular Analysis of Cellulose Biosynthesis inArabidopsis,″Science,279:717-720(1998);Holland等人,″AComparative Analysis of the Plant Cellulose Synthase(CesA)GeneFamily,″Plant Physio.,123:1313-1324(2000));可调节纤维素的碳分配的基因(Delmer,″Cellulose Biosynthesis in Developing Cotton Fibers″在:A.S.Basra(编著),Cotton Fibers:Developmental Biology QuRlityImprovement,and Textile Processing,The Haworth Press,New York,第85-112页(1999)中),例如蔗糖合酶(Amor等人,″AMembrane-Associated Form of Sucrose Synthase and Its Potential RoleSynthesis of Cellulose and Callose in Plants,″Proc.Natl.Acad.Sci.USA,92:9353-9357(1995))、蔗糖磷酸合酶(Haigler等人,″Transgenic CottonOver-Expressing Sucrose Phosphate Synthase Produces Higher QualityFibers with Increased Cellulose Content and Has Enhanced Seed CottonYield″Abstract 477.在:Proceedings of Plant Biology 2000,7月15-19,SanDiego,CA.American Society of Plant Physiologists,Rockville,MD,(2000))、UDPG-焦磷酸化酶(Waffler和Meier,″Enzyme Activities inDeveloping Cotton Fibers,″Plant Phvsiol.Biochem.32:697-702(1994))、无机焦磷酸酶(pyrophosphosphatase)(Geigenberger等人,″Overexpression of Pyrophosphatase Leads to Increased SucroseDegradation and Starch Synthesis,Increased Activities of Enzymes forSucrose-Starch Interconversions,and Increased Levels of Nucleotides inGrowing Potato Tubers,″Planta,205:428-437(1998))、己糖激酶(Smeekens,″Sugar Regulation of Gene Expression″Curr.Op.Plant Biol.,1:230-234(1998))和转化酶(Sturm和Tang,″The Sucrose-CleavingEnzymes of Plants are Crucial for Development,Growth,and CarbonPartitioning,″Trends Plant Sci.,4:401-407(1999));可能影响纤维素的分子性质和生物物理性质(包括多聚化程度、结晶程度、微晶大小和微原纤维定向)的基因(即,编码蛋白(包括共结晶蛋白聚合物或纤维素结合结构域以及多糖合成和其它酶)的基因)(Delmer,″Cellulose Biosynthesis:Exciting Times for a Difficult Field of Study,″Ann.Rev.Plant Physio.Mol.Biol.50:245-276(1999);Delmer,″Cellulose Biosynthesis in DevelopingCotton Fibers.在:A.S.Basra(编著),Cotton Fibers:DevelopmentalBiology,Quality Improvement,and Textile Processing,The Haworth Press,New York,第85-112页(1999);Hsieh,″Structural Development of CottonFibers.在:A.S.Basra(编著),Cotton Fibers:Developmental Biology,Quality Improvement,and Textile Processing,The Haworth Press,NewYork,第137-166页(1999));能延长延伸生长和/或改变次生壁沉积程度或时机的转录因子,例如MYB基因(Wilkins和Jernstedt,″MolecularGenetics of Developing Cotton Fibers.在:A.S.Basra(编著),CottonFibers:Developmental Biology.Quality Improvement,and TextileProcessing,The Haworth Press,New York,第231-270页(1999));影响植物激素合成和改变纤维性质的基因(John,″Genetic EngineeringStrategies for Cotton Fiber Modification.在:A.S.Basra(编著),CottonFibers:Developmental Biology,Quality Improvement,and TextileProcessing,The Haworth Press,New York,第271-289页(1999));针对细胞骨架元件或细胞骨架相关蛋白(可能影响纤维性质)的基因(Seagull,″Cytoskeletal Involvement in Cotton Fiber Growth and Development,″Micron,24:643-660(1993));用于脂类合成或对可能改变膜性质以及由此改善纤维品质(包括在胁迫环境条件下)的酶进行修饰的基因(Haigler,″The Crystallinity of Cotton Cellulose in Relation to CottonImprovement,″Proc.Cotton Fiber Cellulose:Structure.Function andUtilization Conference,National Cotton Council of America:Memphis,TN.,第211-225页(1992));可能通过增加或减少的活性来延长或增加次生壁沉积期间的延伸生长的酶,例如,木葡聚糖内转移酶、过氧化物酶、扩展蛋白或液泡ATP酶(Wilkins和Jernstedt,″Molecular Genetics ofDeveloping Cotton Fibers.在:A.S.Basra(编著),Cotton Fibers:Developmental Biology Quality Improvement,and Textile Processing,TheHaworth Press,New York,第231-270页(1999));针对可能留在纤维网眼(lumen)中或整合进细胞壁以增加纤维强度或改变其纺织性质的蛋白或塑料聚合物的基因(John,″Genetic Engineering Strategies for CottonFiber Modification,″在:A.S.Basra(编著),Cotton Fibers:DevelopmentalBiology.Quality Improvement,and Textile Processing,The Haworth Press,New York,第271-289页(1999);Guda等人,″Hyperexpression of anEnvironmentally Friendly Synthetic PolymerGene,″BiotechnologY Letters,17:745-750(1995));针对植物细胞壁基质生物合成酶或其调控蛋白的基因,使得其它碳水化合物可以被整合进细胞壁并且改变纤维性质(Haigler,″The Relationship Between Polymerization and Crystallization inCelluloseBiogenesis,″在C.H.Haigler和P.Weimer编著,Biosynthesis andBiodegradation of Cellulose,New York:Marcel Dekker,第99-124页(1991);Andrawis等人,″Cotton Fiber Annexins:A Potential Role in theRegulation of Callose Synthase,″Plant J.,3:763-772(1993));针对单宁、木栓质或染料等分子的、可能向纤维赋予有价值的颜色的基因(Ryser,″Cotton Fiber Initiation and Histodifferentiation,″在:A.S.Basra(编著),Cotton Fibers:Developmental Biology.Quality Improvement,and TextileProcessing,The Haworth Press,New York,第1-46页(1999));针对角质、木栓质或蜡等分子的、可能改变棉花纤维的吸收性和强度的基因(May,″Genetic Variation in Fiber Quality,″在:A.S.Basra(编著),Cotton Fibers:Developmental Biology,Quality Improvement,and TextileProcessing,The Haworth Press,New York,第183-230页(1999);Ryser,″Cotton Fiber Initiation and Histodifferentiation,″在:A.S.Basra(编著),Cotton Fibers:Developmental Biology.Quality Improvement,and TextileProcessing,The Haworth Press,New York,第1--46(1999));以及针对信号转导分子的基因,例如Rac,其可调节纤维发育阶段的转变(Delmer等人,″Genes Encoding Small GTP-Binding Proteins Analogous toMammalian rac are Preferentially Expressed in Developing Cotton Fibers,″Mol.Gen.Genet.,248:43-51(1995))。 特别优选的蛋白编码区域是N-乙酰葡糖胺合酶编码区域,如例如WO2006/136351所述,或蔗糖合酶基因,如WO2002/45485或EP06015433.3(通过引用并入本文)所述。 生物活性RNA还可编码所谓的反义RNA、正义RNA、双链RNA,如WO 99/53053所述,或可编码合成的微小RNA分子,其是根据本领域公知的规则,将所述分子设计来下调产纤维植物细胞中包含的其它基因或者甚至是以产纤维植物为食的病原体或有害生物中包含的基因的表达。 本发明还提供了在产纤维植物的纤维细胞中特异性表达蛋白质或生物活性RNA的方法,所述方法包括下述步骤:将包含本文所述的纤维选择性启动子或启动子区域(与编码生物活性RNA分子的转录的DNA区域有效相连)的DNA分子引入产纤维植物的纤维细胞。 在本发明的第二个方面,提供了在产纤维植物中改变纤维的纤维长度的方法,这是通过特异性改变编码纤维选择性的β-1,3-内切葡聚糖酶的亚基因组等位基因之一的表达来实现的。如上文所述,对表达的这种改变可防止或增强在纤维细胞基底处堵住胞间连丝的胼胝质的降解,由此增加或减少迅速纤维延伸期以及纤维长度,例如在棉花中,特别是在陆地棉中。对纤维长度的调节还可影响纤维的强度和其它品质或性质。因此,本发明还涉及通过本文所述的方法来改变纤维性质或纤维的品质。 在本发明第二方面的一种实施方案中,提供了增加棉花植物(特别是陆地棉植物)纤维长度的方法,这通过向所述棉花植物的细胞中引入嵌合基因来实现,其中,所述嵌合基因包含下述有效相连的DNA元件: a.可植物表达的启动子 b.转录的DNA区域,当其被转录时,其产生下述生物活性RNA分子,所述分子能降低D基因组中包含的纤维选择性β-1,3-内切葡聚糖酶的表达,以及 c.3’末端区域,其包含在所述植物细胞中有功能的转录终止和聚腺苷化信号。 如本发明的发明人所揭示的,棉花植物纤维细胞中β-1,3-内切葡聚糖酶的表达增加(以前被报道为与胞间连丝的重开相关,以及标志着迅速纤维延伸期的末尾)是特异性地由于D亚基因组特异性等位基因在该时间的表达启动导致的,而A亚基因组特异性等位基因仅在纤维发育的后期表达,至少在陆地棉中是这样。因此,WO 2005/017157所述的方法可被进一步改进(至少针对陆地棉而言),这通过特异性地改变编码纤维选择性β-1,3-内切葡聚糖酶的特定亚基因组等位基因的表达模式来实现。 如本文所述,可以以多种方式来识别编码纤维选择性β-1,3-内切葡聚糖酶的D亚基因组特异性等位基因。从不同棉花植物的D亚基因组以及从具有D样基因组的二倍体棉花祖先植物分离编码纤维选择性β-1,3-内切葡聚糖酶的(基因组)核酸揭示:A-亚基因组等位基因中的内含子在内含子序列中具有大约18nt长的插入(见图3),而其在D-亚基因组等位基因的内含子序列中不存在。 此外,对编码区域(cDNA;图2)的核苷酸序列和被编码的氨基酸序列(图4)的比较揭示了A和D-亚基因组等位基因和被编码的蛋白质间的大量特征性不同,这由图中灰色的盒示出。 非常方便地,可以通过多态性来区分A和D亚基因组等位基因,这导致:A亚基因组等位基因的基因组克隆中翻译起始密码子下游大约326个核苷酸处存在AlwI限制性酶识别位点,而在编码纤维选择性β-1,3-内切葡聚糖酶的D亚基因组等位基因中并不存在。用于区分A和D亚基因组等位基因(都在基因组DNA或cDNA水平上)的一种可能的方法是PCR扩增,其中使用cDNA或基因组DNA作为模板,并且使用具有SEQ ID No 5和6的核苷酸序列的寡核苷酸作为引物,之后再用AlwI限制性酶来消化扩增的PCR产物。对于两种亚基因组等位基因而言,通过PCR产生的产物均为大约656bp,当PCR产物产生自D-亚基因组等位基因模板时,其被切割为538和118bp的片段,而扩增自A-亚基因组等位基因模板的通过PCR产生的产物被切割为分别为476bp、118bp和59bp的三条片段。118bp的存在用作为内对照,用于限制性酶反应正确发挥功能。 本领域可获得若干种方法,来生产沉默RNA分子,即,当表达的时候,降低特定基因或基因的组的表达的RNA分子,包括所谓的“正义”或“反义”RNA技术。 因此,在一种实施方案中,编码抑制性RNA分子的嵌合基因基于所谓的反义技术。换句话说,嵌合基因的编码区域包含纤维选择性β-1,3-内切葡聚糖酶的核苷酸序列的互补序列的至少19或20个连续核苷酸的核苷酸序列。可通过将包含来自纤维选择性β-1,3-内切葡聚糖酶编码基因的至少19或20个核苷酸的DNA片段(按照本申请别处所述分离或鉴定的)以反方向与可植物表达的启动子和3’末端形成区域(涉及转录终止和聚腺苷化)有效相连,来构建此类嵌合基因。 在另一实施方案中,编码抑制性RNA分子的嵌合基因基于所谓的共阻遏技术。换句话说,嵌合基因的编码区域包含纤维选择性β-1,3-内切葡聚糖酶基因的核苷酸序列的至少19或20个连续核苷酸的核苷酸序列。可通过将包含来自纤维选择性β-1,3-内切葡聚糖酶基因的至少19或20个核苷酸的DNA片段以正向与可植物表达的启动子和3’末端形成区域(涉及转录终止和聚腺苷化)有效相连,来构建此类嵌合基因。 上述嵌合基因降低纤维选择性β-1,3-内切葡聚糖酶基因表达的效率可被进一步增强,这通过将导致异常的、未聚腺苷化的抑制性RNA分子表达或者导致抑制性RNA分子驻留在细胞核中的DNA元件包括进去来实现。适于该目的的一种此类DNA元件是编码自剪接核酶的DNA区域,如WO 00/01133(通过引用并入本文)所述。适于该目的的另一此类DNA元件是编码RNA核定位或驻留信号的DNA区域,如作为WO03/076619公开的PCT/AU03/00292(通过引用并入本文)所述。 下调感兴趣基因表达的一种方便并且非常有效的方法使用了所谓的双链RNA(dsRNA)或干扰RNA(RNAi),如例如WO99/53050(通过引用并入本文)所述。在该技术中,RNA分子被引入植物细胞,其中所述RNA分子能在至少大约19至大约21个核苷酸上形成双链RNA区域,并且其中,该双链RNA区域的一条链在核苷酸序列上与靶基因大致相同(“正义区域”),而另一条链在核苷酸序列上与靶基因的互补序列或与正义区域的互补序列大致相同(“反义区域”)。预计对于靶基因表达的沉默而言,19个连续核苷酸序列的核苷酸序列可具有一处错配,或者正义和反义区域可有一个核苷酸不同。为实现对此类RNA分子或编码嵌合基因的构建,可以使用WO 02/059294描述的载体。 因此,在本发明的一种实施方案中,提供了用于增加产纤维植物(例如棉花)的纤维长度的方法,所述方法包括下述步骤:将嵌合基因引入产纤维植物的细胞,其中所述嵌合基因包含下述有效相连的DNA元件: (a)可植物表达的启动子,优选地,控制优先在纤维细胞中转录的可植物表达的启动子; (b)转录的DNA区域,当其被转录时,其产生下述双链RNA分子,所述分子能特异性降低纤维选择性β-1,3-内切葡聚糖酶亚基因组等位基因的表达,且所述RNA分子包含第一和第二RNA区域,其中, i)所述第一RNA区域包含与所述亚基因组等位基因的核苷酸序列具有至少大约94%序列同一性的至少19个连续核苷酸的核苷酸序列; ii)所述第二RNA区域包含与所述第一RNA区域的至少19个连续核苷酸互补的核苷酸序列; iii)所述第一和第二RNA区域能碱基配对,以在所述第一和第二区域的至少19个连续核苷酸之间形成双链RNA分子;以及 (c)3’末端区域,其包含在植物细胞中有功能的转录终止和聚腺苷化信号。 第一或第二RNA区域(正义或反义区域)的长度可从大约19个核苷酸(nt)至多达与参与胼胝质去除的内源基因的长度(以核苷酸计)相等的长度。正义或反义核苷酸序列的总长度因此可以是至少25nt,或者至少大约50nt,或者至少大约100nt,或者至少大约150nt,或者至少大约200nt,或者至少大约500nt。预计,正义或反义核苷酸序列的总长没有上限。但是就实际原因(例如,嵌合基因的稳定性)而言,预计正义或反义核苷酸序列的长度应当不超过5000nt,特别应当不超过2500nt,其可限于大约1000nt。 应当预计到,正义或反义区域的总长越长,这些区域和纤维选择性β-1,3-内切葡聚糖酶基因或其互补序列中相应序列之间的序列同一性的需求的严谨度就越低。优选地,感兴趣的核酸应当与相应靶序列具有至少大约75%的序列同一性,特别地,至少大约80%,更特别地,至少大约85%,相当特别地,大约90%,尤其是大约95%,更尤其大约100%,相当尤其地,与靶序列或其互补序列的相应部分相同。但是,优选地,感兴趣的核酸总是包括与靶核酸的相应部分具有100%序列同一性的大约19个连续核苷酸(特别地,大约25nt,更特别地,大约50nt,尤其大约100nt,相当尤其地,大约150nt)的序列。优选地,为计算序列同一性和设计相应的正义或反义序列,应当对空位数量最小化,特别是对于较短的正义序列来说。 根据本发明的编码dsRNA的嵌合基因可包含内含子,例如异源内含子,其位于例如正义和反义RNA区域间的间隔序列中(根据WO 99/53050(通过引用并入本文)的公开内容)。 对于本发明来说优选地,反义、正义或双链RNA分子包括的靶特异性基因序列包含至少一个,并且优选更多个特异于其表达将被下调的亚基因组等位基因的核苷酸。此类特异性核苷酸至少在图2中通过灰色的盒示出。 在优选的实施方案中,生物活性RNA被特异性改造,以下调纤维选择性的β-1,3-内切葡聚糖酶编码基因(GhGluc1)的D-亚基因组等位基因。在另一优选的实施方案中,生物活性RNA被特异性改造,以下调纤维选择性的β-1,3-内切葡聚糖酶编码基因(GhGluc1)的A-亚基因组等位基因。 使用合成的微小RNA用于下调特定基因在植物细胞中的表达,提供了靶基因的非常高的序列特异性,因此允许方便地在密切相关的等位基因之间辨别其表达将被下调的靶基因。 因此,在本发明的另一实施方案中,生物活性RNA或沉默RNA或抑制性RNA分子可以是被设计、合成和/或调节来靶向产纤维植物(例如棉花植物)中的特异性亚基因组等位基因并导致其切割的微小RNA分子,所述等位基因优选是纤维选择性β-1,3-内切葡聚糖酶编码基因的D-亚基因组等位基因。已经描述了多种方法,用于产生和使用针对特定靶基因的miRNA(包括但不限于Schwab等人,(2006,Plant Cell,18(5):1121-1133),WO2006/044322,WO2005/047505,EP 06009836,它们通过引用并入本文)。通常,对存在的miRNA骨架在靶基因识别部分进行修饰,使得产生的miRNA现在能指导RISC复合物切割从靶核酸转录的RNA分子。可对miRNA骨架进行修饰或合成,使得miRNA现在包含编码纤维选择性β-1,3-内切葡聚糖酶的核苷酸序列(例如序列表中列出的序列)的亚基因组等位基因之一的21个连续核苷酸,并且允许根据下文所述的规则的错配。 因此,在一种实施方案中,本发明提供了下调表达或增加植物对于不利生长条件的抗性的方法,所述方法包括下述步骤: a.将嵌合基因引入所述植物的细胞,所述嵌合基因包含下述有效相连的DNA区域: i.可植物表达的启动子; ii.DNA区域,当其引入植物细胞并在其中转录时,所述区域被加工为miRNA,其中所述miRNA能识别并指导对植物的纤维选择性β-1,3-内切葡聚糖酶编码基因的一种亚基因组等位基因而非另一种亚基因组等位基因的mRNA的切割;以及 iii.任选地,涉及转录终止和聚腺苷化的3’DNA区域。 提到的被加工为miRNA的DNA区域可包含与纤维选择性β-1,3-内切葡聚糖酶编码基因的至少21个连续核苷酸的核苷酸序列基本上互补的核苷酸序列,其中允许下述错配中的一处或多处: a.miRNA 5’末端的核苷酸与RNA分子中相应核苷酸序列间的一处错配; b.miRNA第1位至第9位核苷酸中任意一个与RNA分子中相应核苷酸序列之间的一处错配; c.miRNA的第12位至第21位核苷酸中的任意一个与RNA分子中相应核苷酸序列之间的三处错配,但不超过两处连续错配。 在本文中使用时,“miRNA”是长度为大约20至22个核苷酸的RNA分子,其可被载入RISC复合物中,并指导对另一RNA分子的切割,其中,这另一RNA分子包含与miRNA分子的核苷酸序列基本上互补的核苷酸序列,其中可存在下述错配中的一处或多处: a.所述miRNA 5’末端的核苷酸与靶RNA分子中相应核苷酸序列间的一处错配; b.所述miRNA第1位至第9位核苷酸中任意一个与靶RNA分子中相应核苷酸序列之间的一处错配; c.所述miRNA的第12位至第21位核苷酸中的任意一个与靶RNA分子中相应核苷酸序列之间的三处错配,但不超过两处连续错配。 d.在miRNA的第10和第11位不允许错配(所有miRNA位置都是从miRNA分子5’末端开始示出的)。 miRNA是通过蛋白质(例如DCL蛋白质)从“前miRNA”分子来加工的,所述蛋白是存在于任何植物细胞中并被装载到RISC复合物上的,其可在那儿指导对靶RNA分子的切割。 在本文中使用时,“前miRNA”分子是大约100至大约200个核苷酸的RNA分子,优选地,大约100至大约130个核苷酸,其可采用下述二级结构,所述二级结构包含双链RNA茎和单链RNA环,还在双链RNA茎中包含miRNA的核苷酸序列(及其互补序列)。优选地,miRNA及其互补序列位于miRNA双链RNA茎游离末端的大约10至大约20个核苷酸处。单链环区域的序列和长度并非关键,其可相当大程度地变化,例如,长度上30至50nt之间。合成的前-miRNA的一个例子在图1中示出。优选地,未成对和成对RNA结构间自由能的差别在-20至-60kcal/摩尔之间,特别地,大约-40kcal/摩尔。miRNA和miRNA*之间的互补性无须完美,可以忍耐未配对核苷酸的大约1至3个凸起(bulge)。可通过本领域传统的计算机算法(例如mFOLD)来预测RNA分子采用的二级结构。通过5’末端互补性的程度,来确定来自前miRNA的双链RNA茎的特定链(其被通过DCL活性释放并且装载到RISC复合物上),其中,在其5’末端涉及被切割的dsRNA茎的不同链的核苷酸之间的氢结合最少的链被装载到RISC复合物上,并将决定靶RNA分子降解的序列特异性。但是,如果经验上来自特定的合成前miRNA分子的miRNA分子不具有功能性(因为“错误的”链被装载到RISC复合物上),将立刻显而易见:该问题可通过将miRNA分子的位置与其在前miRNA分子的dsRNA茎的各链上的互补序列相交换来解决。如本领域已知的,A和U之间的结合涉及两个氢键或G和U之间涉及两个氢键的结合要比G和C之间涉及三个氢键的结合弱。 天然存在的miRNA分子可被包含在它们的天然存在的前-miRNA分子中,但是他们还可被引入已有的前-miRNA分子骨架,这通过将从此类已有的前-miRNA分子正常加工得到的miRNA分子的核苷酸序列换成感兴趣的另一miRNA的核苷酸序列来实现。前-miRNA的骨架还可以是完全合成的。类似地,合成的miRNA分子可被包含在已有的前-miRNA分子骨架或合成的前-miRNA骨架中,或从其加工而来。 前-miRNA分子(以及由此还有miRNA分子)可被方便地引入植物细胞,这通过向植物细胞提供包含可植物表达的启动子的基因来实现,所述启动子与转录时产生前-miRNA分子的DNA区域有效相连。可植物表达的启动子可以是与前-miRNA分子天然相关的启动子,或者其可以是异源启动子。 用于对GhGluc1基因的D-亚基因组等位基因的表达进行特异性下调的合适miRNA和前微小RNA分子示于序列表编号SEQ ID No 15、16、20和21中。 用于对GhGluc1基因的A-亚基因组等位基因的表达进行特异性下调的合适miRNA和前微小RNA分子示于序列表编号SEQ ID No 13、14、17、18和19中。 在本文中使用时,术语“可植物表达的启动子”表示能控制(起始)在植物细胞中的转录的DNA序列。这包括植物来源的任何启动子,还包括能指导在植物细胞中转录的非植物来源的任何启动子,即,病毒或细菌来源的某些启动子,例如CaMV35S,地三叶病毒启动子No 4或No 7或T-DNA基因启动子等。 能控制优先在纤维细胞中转录的起始和保持的可植物表达的启动子是这样的启动子,其驱动有效相连的DNA区域在纤维细胞和下面的表皮细胞中转录至比在植物其它组织或细胞中更高的水平。此类启动子包括来自棉花的来自纤维特异性β-微管蛋白基因的启动子(如WO0210377所述)、来自棉花的来自纤维特异性肌动蛋白基因的启动子(如WO0210413所述)、来自棉花的纤维特异性脂转移蛋白基因的启动子(如US5792933所述)、来自棉花的扩展蛋白基因的启动子(WO9830698)或来自棉花中几丁质酶基因的启动子(US2003106097)或US6259003或US6166294中描述的纤维特异性基因的启动子。还可使用本文所述的纤维选择性启动子。 对于某些应用而言,减少产纤维植物(例如棉花植物)中纤维长度可能是有好处的。例如,减少棉花植物中绒毛纤维的量,由此留下更多能量和材料用于在棉花植物中掺入棉绒纤维将是有好处的。这可方便地通过在纤维细胞发育的早期阶段在纤维细胞中(过)表达β-1,3-内切葡聚糖酶来实现,例如使用本文所述的、在迅速延伸期末尾表达的纤维选择性启动子来实现。 本发明还包括本文所述的嵌合基因以及包含这些嵌合基因的植物、种子、组织以及从此类植物产生的纤维。 还可通过分离出编码具有弱酶活性的变体蛋白或不再编码功能性β-1,3-内切葡聚糖酶的D-亚基因组等位基因变体,来增加或改变棉花中的纤维品质和纤维长度或其它纤维性质。 用于转化植物的方法是本领域公知的,这与本发明并不太相关。用于转化棉花植物的方法也是本领域公知的。农杆菌介导的棉花转化已被描述过,例如,在美国专利5,004,863或美国专利6,483,013中,在例如WO92/15675中报道了通过粒子轰击进行的棉花转化。 可以使用本领域公知的方法,以稳定方式或以瞬时方式,将根据本发明的嵌合基因引入植物。嵌合基因可被引入植物,或可在植物细胞内部产生,如例如EP 1339859所述。 可通过在棉花植物(可由其获得胚胎发生性愈伤组织)进行转化来引入嵌合基因,所述植物例如Coker 312、Coker310、Coker 5Acala SJ-5、GSC25110、FIBERMAX 819、Siokra 1-3、T25、GSA75、Acala SJ2、Acala SJ4、Acala SJ5、Acala SJ-C1、Acala B1644、Acala B1654-26、AcalaB1654-43、Acala B3991、Acala GC356、Acala GC510、Acala GAM1、AcalaC1、Acala Royale、Acala Maxxa、Acala Prema、Acala B638、Acala B1810、Acala B2724、Acala B4894、Acala B5002、非Acala“picker”Siokra、“stripper”品种FC2017、Coker 315、STONEVILLE 506、STONEVILLE825、DP50、DP61、DP90、DP77、DES119、McN235、HBX87、HBX191、HBX107、FC 3027、CHEMBRED A1、CHEMBRED A2、CHEMBRED A3、CHEMBRED A4、CHEMBRED B1、CHEMBRED B2、CHEMBRED B3、CHEMBRED C1、CHEMBRED C2、CHEMBRED C3、CHEMBRED C4、PAYMASTER 145、HS26、HS46、SICALA、PIMA S6 ORO BLANCOPIMA、FIBERMAX FM5013、FIBERMAX FM5015、FIBERMAXFM5017、FIBERMAX FM989、FlBERMAX FM832、FIBERMAX FM966、FIBERMAX FM958、FIBERMAX FM989、FIBERMAX FM958、FIBERMAX FM832、FIBERMAX FM991、FIBERMAX FM819、FIBERMAX FM800、FIBERMAX FM960、FIBERMAX FM966、FIBERMAX FM981、FIBERMAX FM5035、FIBERMAX FM5044、FIBERMAX FM5045、FIBERMAX FM5013、FIBERMAX FM5015、FIBERMAX FM5017或FIBERMAX FM5024和具有源于它们的基因型的植物。 在本文中使用时“棉花”包括陆地棉或海岛棉。“棉花祖先植物”包括树棉(Gossypium arboretum)、草棉、雷蒙德氏棉和长萼棉(Gossypiumlongicalyx)。 本发明的方法和手段还可用于其它植物物种,例如,大麻、黄麻、亚麻和木质植物,包括但不限于松属(Pinus spp.)、杨属(Populus spp.)、云杉属(Picea spp.)、桉属(Eucalyptus spp.)等。 获得的经转化植物可用于传统培育体系,以产生更多具有相同特征的经转化植物,或在相同或相关植物物种的其它品种中或杂交植物中引入根据本发明的嵌合基因。从经转化的植物获得的种子含有作为稳定的基因组插入的本发明嵌合基因,其也是本发明所包括的。 在本发明的另一实施方案中,提供了针对β-1,3-内切葡聚糖酶产生的抗体,特别是能识别具有SEQ ID No 11和12的氨基酸序列的β-1,3-内切葡聚糖酶蛋白的抗体。 在本文中使用时,“包含”应当被解释为:其特指出了提到的特征、整数、步骤或组分的存在,但是并不排除一种或多种特征、整数、步骤或组分或它们的组的存在或添加。因此,例如,包含核苷酸序列或氨基酸序列的核酸或蛋白可包含比实际提到的那些更多的核苷酸或氨基酸,即,其被嵌入更大的核酸或蛋白中。包含功能或结构上确定的DNA区域的嵌合基因还可包含其它DNA区域等。 下述非限制性实施例描述了对棉花中A和D亚型的两种β-1,3-内切葡聚糖酶和它们的启动子区域的鉴定,以及对次生植物细胞壁合成中表达和参与时机的分析。还描述了嵌合基因及其用途,所述嵌合基因用于改变纤维特征、用于在产纤维植物(例如棉花)中的纤维特异性表达和纤维优先性表达。除非另有指明,在实施例中,所有重组DNA技术都是按照标准方案来进行的,如Sambrook等人(1989)Molecular Cloning:ALaboratory Manual,第二版,Cold Spring Harbor Laboratory Press,NY和Ausubel等人(1994)Current Protocols in Molecular Biology,CurrentProtocols,USA的第1和2卷所述。用于植物分子工作的标准材料和方法被描述于Plant Molecular Biology Labfax(1993),由R.D.D.Croy,BIOSScientific Publications Ltd(UK)和Blackwell Scientific Publications,UK共同出版。 在说明书和实施例全文中,参考序列表中示出的下述序列: SEQ ID No 1:来自陆地棉Fiber Max966,亚型A的β-1,3-内切葡聚糖酶的经扩增基因组片段 SEQ ID No 2:来自陆地棉Fiber Max966,亚型D的β-1,3-内切葡聚糖酶的经扩增基因组片段 SEQ ID No 3:来自树棉的β-1,3-内切葡聚糖酶的经扩增基因组片段 SEQ ID No 4:来自雷蒙德氏棉的β-1,3-内切葡聚糖酶的经扩增基因组片段 SEQ ID No 5:用于扩增β-1,3-内切葡聚糖酶基因组片段的反向引物(SE002) SEQ ID No 6:用于扩增β-1,3-内切葡聚糖酶基因组片段的正向引物(SE003) SEQ ID No 7:来自陆地棉Fiber Max966,亚型A的β-1,3-内切葡聚糖酶的经扩增基因组片段编码的氨基酸序列 SEQ ID No 8:来自陆地棉Fiber Max966,亚型D的β-1,3-内切葡聚糖酶的经扩增基因组片段编码的氨基酸序列 SEQ ID No 9:来自陆地棉Fiber Max966,亚型A的β-1,3-内切葡聚糖酶的完整基因组克隆的核苷酸序列,其包括启动子序列 SEQ ID No 10:来自陆地棉Fiber Max966,亚型D的β-1,3-内切葡聚糖酶的完整基因组克隆的核苷酸序列,其包括启动子序列 SEQ ID No 11:来自陆地棉Fiber Max966,亚型A的完整β-1,3-内切葡聚糖酶的氨基酸序列 SEQ ID No 12:来自陆地棉Fiber Max966,亚型D的完整β-1,3-内切葡聚糖酶的氨基酸序列 SEQ ID No 13:前-miRA1的核苷酸序列 SEQ ID No 14:前-miRA1的核苷酸序列,具有克隆位点 SEQ ID No 15:前-miRD1的核苷酸序列 SEQ ID No 16:前-miRD1的核苷酸序列,具有克隆位点 SEQ ID No 17:前-miRA2的核苷酸序列 SEQ ID No 18:前-miRA2aa的核苷酸序列 SEQ ID No 19:前-miRA2aa的核苷酸序列,具有克隆位点 SEQ ID No 20:前-miRD2的核苷酸序列 SEQ ID No 21:前-miRD2的核苷酸序列,具有克隆位点 实施例1:在棉花植物和棉花祖先植物中鉴定编码纤维选择性β-1,3-葡聚糖酶的A和D-亚基因组特异性等位基因 已经提出,胼胝质涉及在生长中的纤维细胞中保持膨胀的过程。在纤维和非纤维棉花细胞之间的桥连结构(作为胞间连丝已知)的基底去除胼胝质消除了膨压。这导致了迅速纤维延伸的终止。因此应当通过延迟对胼胝质的去除来增强纤维长度。 β-1,3-葡聚糖酶催化β-1,3-D-葡聚糖(胼胝质)中β-1,3-D-糖苷键的水解。当胼胝质在纤维基底沉积时,GhGluc1编码的纤维特异性β-1,3-葡聚糖酶是无法检测到的,但在胼胝质降解的时候其变得显而易见。 简言之,胞间连丝闭合看起来在延伸棉花纤维的方面具有重要作用。胼胝质沉积和降解应当分别参与胞间连丝闭合和重开。GhGluc1的表达可通过降解胼胝质由此开启胞间连丝从而在该过程中具有作用(Ruan等人,2004,Plant Physiology-136:4104-4113)。 基于GhGluc1的核苷酸序列(EMBL登录号D88416)(被描述于Ruan等人,2004,Plant Physiology-136:4104-4113中),设计了2条引物(SE002:ggccgaagccgatcttatctagg(反向引物;SEQ ID No 5)和SE003:cggcaacaatcttccatctccag(正向引物;SEQ ID No 6)),来扩增用于陆地棉(AD基因组)、树棉(G.arboreum)(A基因组)和雷蒙德氏棉(G.raimondii)(D基因组)的基因组DNA片段。对这些片段进行了测序(见SEQ ID No 1-4)。对于陆地棉而言,获得了2条共有序列,对于树棉而言,获得了1条共有序列,对于雷蒙德氏棉而言,获得了1条共有序列。 两条陆地棉序列和两种二倍体之间多态性的总览 因此,一种类型的序列对应于A基因组序列,另一种类型对应于D基因组。 在扩增的PCR片上进行AlwI(识别位点=GGATC)消化,hirsutum或基因组中两种亚基因组变体均可被区分(见图5)。因此,可使用下述方法来区分GhGluc1的A和D亚基因组等位基因。所使用的引物如下所述: a.SE002:GGCCGAAGCCGATCTTATCTAGG(SEQ ID No 5) b.SE003:CGGCAACAATCTTCCATCTCCAG(SEQ ID No 6) 预计的PCR产物长度为655bp。 PCR条件: 1x 模板DNA (200ng/μl) 1μl 5x GreenGoTaq缓 冲液 5μl SE002(10μM) 0.75μl SE003(10μM) 0.75μl dNTP’s(20mM) 0.5μl GoTaq聚合酶 0.25μl MQ水 16.75μl 25μlPCR情况: 95℃-5min 72℃-10min PCR扩增后,使用10μ模板;1μl AlwI酶、2μl NEB 4限制性缓冲液、7μl MQ水进行AlwI消化(在37℃孵育3小时),来消化PCR片段。在用EtBr染色的1.5%TAE凝胶上分析得到的片段。 A亚基因组等位基因特异性PCR片段的预计条带大小是:479+118+59bp。D亚基因组等位基因特异性PCR片段的预计条带大小是:538+118bp。 实施例2:陆地棉中编码纤维选择性β-1,3-葡聚糖酶的A和D亚基因组特异性等位基因的差异表达和与纤维发育阶段的关联性 针对陆地棉来分析纤维生长/发育模式期间的等位基因特异性表达。提取从纤维细胞和种子(5DPA时)和从纤维细胞(10、15、20和40DPA)产生的cDNA文库的DNA,对浓度加以均衡,进行上文提到的PCR扩增。条带强度的差异对应于表达的相对差异(图6,道2、4、6、8和10)。包括了阳性对照(基因组DNA,图6,道12)。按照实施例1所述进行AlwI消化,以在GhGluc1基因的2种亚基因组等位基因间进行区分(图6,道3、5、7、9、11和13)。 表达模式可被总结为下表: 5dpa 10dpa 15dpa 20dpa 30dpa 40dpa / / D D A和D A和D在纤维发育的迅速延伸期(5和10dpa)没有GhGluc1表达。因此,胼胝质堵塞没有降解;细胞中膨胀没有释放,延伸仍继续。我们相信,5dpa的模糊条带表明种子中有一些表达(纤维中没有)。在延伸期和次生细胞壁形成期之间的过渡时(15DPA),GhGluc1表达。迅速延伸停止时,这在细胞中释放了膨胀。仅GhGluc1基因的D基因组样变体表达。在20DPA时,表达要比15DPA时多(更强的条带)。A基因组样的变体在15和20DPA时不表达。A基因组样变体以及D基因组样变体在30和40DPA时表达,并可能在成熟或其它纤维性质方面发挥作用。 实施例3:分离和鉴定编码纤维选择性β-1,3-葡聚糖酶的A和D-亚基因组特异性等位基因的启动子区域 用包含GhGluc1的A和D亚基因组特异性等位基因的核苷酸序列的PCR片段来筛选含有陆地棉品种的基因组DNA克隆的BAC文库。鉴定了4个不同的克隆,每种亚基因组变体2个。鉴定了针对每种等位基因变体的基因组片段的核苷酸序列,它们被示为SEQ ID No 9(A基因组)和SEQID No 10(D基因组)。 对于A基因组变体而言,可在第2278至2281位鉴定出TATA框;在第2308位鉴定出转录起始位点。5’非翻译前导序列从第2308位核苷酸延伸至第2409位;翻译起始密码子位于第2410-2412位。编码序列由内含子序列(2444-2555)分开的两个外显子(nt 2410至2443和nt 2556至3499)构成。翻译终止密码子位于第3497至3499位,聚腺苷化位点位于第3624位。 对于D基因组变体而言,可在第3242至3245位鉴定出TATA框;在第3270位鉴定出转录起始位点。5’非翻译前导序列从第3270位核苷酸延伸至第3372位;翻译起始密码子位于第3373-3375位。编码序列由内含子序列(nt 3407-3500)分开的两个外显子(nt 3373-3406和nt 3501-4444)构成。翻译终止密码子位于第4442至4444位,聚腺苷化位点位于第4566位。 融合的编码区域的核苷酸序列已被比对(图2),差异被示出;类似地,内含子核苷酸序列也已被比对(图3)。图4显示了对编码的蛋白的比对,而图1显示了对位于编码区域上游的核苷酸序列的比对。 实施例4:包含与标记基因有效相连的不同纤维选择性启动子区域的嵌合基因构建体 使用标准重组技术将下述DNA片段有效相连: a.A等位基因特异性启动子的核苷酸序列,其包含SEQ ID No 9的第465位核苷酸至第2409位核苷酸的核苷酸序列 b.β-葡糖醛酸糖苷酶编码区域(GUS) c.包含转录终止和聚腺苷化信号(CaMV)3’35S的片段(下文中示为Gluc1-SGA(A1.9)) 和 d.A等位基因特异性启动子的核苷酸序列,其包含SEQ ID No 9的第1374位核苷酸至第2409位核苷酸的核苷酸序列 e.β-葡糖醛酸糖苷酶编码区域(GUS) f.包含转录终止和聚腺苷化信号(CaMV)3’35S的片段 和 g.A等位基因特异性启动子的核苷酸序列,其包含SEQ ID No 9的第1531位核苷酸至第2409位核苷酸的核苷酸序列 h.β-葡糖醛酸糖苷酶编码区域(GUS) i.包含转录终止和聚腺苷化信号(CaMV)3’35S的片段 和 j.D等位基因特异性启动子的核苷酸序列,其包含SEQ ID No 10的第1397位核苷酸至第3372位核苷酸的核苷酸序列(下文中示为Gluc1-SGD(D2.0)) k.β-葡糖醛酸糖苷酶编码区域(GUS) l.包含转录终止和聚腺苷化信号(CaMV)3’35S的片段 和 m.D等位基因特异性启动子的核苷酸序列,其包含SEQ ID No 10的第2371位核苷酸至第3372位核苷酸的核苷酸序列 n.β-葡糖醛酸糖苷酶编码区域(GUS) 包含转录终止和聚腺苷化信号(CaMV)3’35S的片段 或 o.D等位基因特异性启动子的核苷酸序列,其包含SEQ ID No 10的第2718位核苷酸至第3372位核苷酸的核苷酸序列 p.β-葡糖醛酸糖苷酶编码区域(GUS) q.包含转录终止和聚腺苷化信号(CaMV)3’35S的片段 在存在嵌合选择性标记基因的情况下,将上述嵌合基因分别克隆进T-DNA载体,并引入包含卸甲的辅助Ti质粒的根瘤农杆菌(Agrobacteriumtumefaciens)菌株。根据WO00/71733所述的方法,用农杆菌菌株来产生转基因棉花。来自这些植物的纤维细胞和其它组织被组织化学染色。 主要在纤维细胞和纤维中观察到了不同嵌合构建体的表达。 实施例5:包含与N-乙酰葡糖胺转移酶编码区域有效相连的不同纤维选择性启动子区域的嵌合基因构建体 使用目前的重组DNA技术,装配与实施例4的构建体相似的构建体,但是其中Gus编码区域被换为NodC编码区域(见WO2006/136531,具体地,其中的SEQ ID 1至9,该文献通过引用并入本文),之前是Cab22非翻译前导序列。 在存在嵌合选择性标记基因的情况下,将上述嵌合基因分别克隆进T-DNA载体,并引入包含卸甲的辅助Ti质粒的根瘤农杆菌菌株。根据WO00/71733所述的方法,用农杆菌菌株来产生转基因棉花。针对带正电的寡糖的存在,对来自这些植物的纤维细胞和其它组织进行了分析,如WO2006/136531所述。 实施例6:通过特异性下调编码纤维选择性β-1,3-葡聚糖酶的D-亚基因组特异性等位基因,来增加陆地棉中的纤维长度 使用本领域已知的设计规则,设计了对GhGluc1的A或D亚基因组等位基因变体特异的合成前微小RNA。 用于对GhGluc1基因的D-亚基因组等位基因的表达进行特异性下调的合适miRNA和前微小RNA分子示于序列表编号SEQ ID No 15、16、20和21中。 用于对GhGluc1基因的A-亚基因组等位基因的表达进行特异性下调的合适miRNA和前微小RNA分子示于序列表编号SEQ ID No 13、14、17、18和19中。 如实施例4所述,在CaMV 35S启动子的控制下或在纤维特异性和/或纤维优先性启动子的控制下,克隆了编码前微小RNA的核苷酸序列。 在存在嵌合选择性标记基因的情况下,将上述嵌合基因分别克隆进T-DNA载体,并引入包含卸甲的辅助Ti质粒的根瘤农杆菌菌株。根据WO00/71733所述的方法,用农杆菌菌株来产生转基因棉花。针对增加的纤维长度,对来自这些植物或其后代的纤维进行了分析。 实施例7:对gluc1启动子对纤维的特异性的分析 从棉花叶、根和茎分离RNA,针对gluc1基因和蛋白磷酸酶2A基因(普遍存在并保守的丝氨酸/苏氨酸磷酸酶,其具有广泛的底物特异性和不同细胞功能)的表达对RNA加以分析。使用用于RT-PCR(Invitrogen)的SuperScript第一链合成系统来进行第一链cDNA合成,之后加入gluc1或pp2A特异性引物,进行RT-PCR反应。结果示于表7中。道17中的阳性结果表明成功实现了第一链合成。使用pp2A特异性引物,在叶、根和茎RNA样品中,道10、12、14中的阳性结果特异性地表明了叶、根和茎样品中的第一链合成是有成效的。道11、13、15是阴性对照,其省略了来自反应的逆转录酶。道8是基因组DNA构成的阳性对照,用于验证gluc1特异性PCR反应的正确性。在道2、4、6中,没有检测到信号,这表明,在棉花叶、根和茎中不存在Gluc1表达。道3、5和7是省略了逆转录酶的阴性对照。 总之,在棉花叶、根和茎组织中没有检测到Gluc1表达。 实施例8:用含有的农杆菌菌株进行棉花胚珠转化 用携带不同嵌合gluc1启动子::GUS融合基因(在实施例4中示为Gluc1-SGA(A1.9)和Gluc1-SGD(D2.0))的根瘤农杆菌转化后,在0DPA、1DPA和2DPA分离棉花花的胚珠,将其用于胚珠培养实验(如例如Feng和Brown,2000,In vitro Cellular & Developmental Biology,卷36,Number 4第293-299页所述)。在1周、2周、3周、4周或5周后,针对GUS表达通过组织化学方法来分析初始的纤维细胞/纤维。培养的胚珠作为阳性对照被包括进来,其已经过了具有嵌合CaMV35启动子::Gus融合基因的农杆菌菌株的感染。注意:使用的GUS编码区域含有内含子序列,以避免感染性农杆菌中偶然的GUS表达。结果概括于表1中。 表1:对经培养和转染的棉花胚珠的Gus组织化学分析 7DPA 14DPA 21DPA 28DPA 35DPA CaMV35S-gus + + + + + Gluc1-SGA-gus - - - - + Gluc1-SGD-gus - + + + -这些数据确证了针对来自GhGluc1的不同亚基因组等位基因的启动子而言从实施例2的数据推断的表达模式。 序列表 <110>拜尔生物科学公司(Bayer BioScience N.V.) Engelen,Steven Arioli,Tony <120>亚基因组特异性等位基因在棉花中的差异表达及其用途 <130>BCS 07-2001 <150>EP07000550.9 <151>2007-01-11 <150>US60/884,564 <151>2007-01-11 <160>21 <170>PatentIn版本3.3 <210>1 <211>689 <212>DNA <213>陆地棉(Gossypium hirsutum) <400>1 tggccgtgat attggtgttt gctatggttt gaacggcaac aatcttccat ctccaggaga 60 tgttattaat cttttcaaaa ctagtggcat aaacaatatc aggctctacc agccttaccc 120 tgaagtgctc gaagcagcaa ggggatcggg aatatccctc tcgatgagta cgacaaacga 180 ggacatacaa agcctcgcaa cggatcaaag tgcagccgat gcatgggtta acaccaacat 240 cgtcccttat aaggaagatg ttcaattcag gttcatcatc attgggaatg aagccattcc 300 aggacagtca agctcttaca ttcctggtgc catgaacaac ataatgaact cgctggcctc 360 atttgggcta ggcacgacga aggttacgac cgtggtcccg atgaatgccc taagtacctc 420 gtaccctcct tcagacggcg cttttggaag cgatataaca tcgatcatga ctagtatcat 480 ggccattctg gttcgacagg attcgcccct cctgatcaat gtgtaccctt attttgccta 540 tgcctcagac cccactcata tttccctcaa ctacgccttg ttcacctcga ccgcaccggt 600 ggtggtcgac caaggcttgg aatactacaa cctctttgac ggcatggtcg atgctttcaa 660 tgccgcccta gataagatcg gcttcggcc 689 <210>2 <211>689 <212>DNA <213>陆地棉 <400>2 tggccgtgat attggtgttt gctatggttt gaacggcaac aatcttccat ctccaggaga 60 tgttattaat ctttacaaaa ctagtggcat aaacaatatc aggctctacc agccttaccc 120 tgaagtgctc gaagcagcaa ggggatcggg aatatccctc tcgatgggtc cgagaaacga 180 ggacatacaa agcctcgcaa aagatcaaag tgcagccgat gcatgggtta acaccaacat 240 cgtcccttat aaggacgatg ttcagttcaa gttgatcact attgggaatg aagccatttc 300 aggacaatca agctcttaca ttcctgatgc catgaacaac ataatgaact cgctcgcctt 360 atttgggtta ggcacgacga aggttacgac cgtggtcccg atgaatgccc taagtacctc 420 gtaccctcct tcagacggcg cttttggaag cgatataaca tcgatcatga ctagtatcat 480 ggccattctg gctgtacagg attcgcccct cctgatcaat gtgtaccctt attttgccta 540 tgcctcagac cccactcata tttccctcga ttacgccttg ttcacctcga ccgcaccggt 600 ggtggtcgac caaggcttgg aatactacaa cctctttgac ggcatggtcg atgctttcaa 660 tgccgcccta gataagatcg gcttcggcc 689 <210>3 <211>655 <212>DNA <213>树棉(Gossypium arboreum) <400>3 cggcaacaat cttccatctc caggagatgt tattaatctt tacaaaacta gtggcataaa 60 caatatcagg ctctaccagc cttacctgaa gtgctcgaag gagcaagggg atcgggaata 120 tccctctcga tgagtacgac aaacgaggac atacaaagcc tcgcaacgga tcaaagtgca 180 gccgatgcat gggttaacac caacatcgtc ccttataagg acgatgttca attcaggttc 240 atcatcattg ggaatgaagc cattccagga cagtcaagct cttacattcc tggtgccatg 300 aacaacataa tgaactcgct cgcctcattt gggctaggca cgacgaaggt tacgaccgtg 360 gtcccgatga atgccctaag tacctcgtac cctccttcag acggcgcttt tggaagcgat 420 ataacatcga tcatgactag tatcatggcc attctggttc gacaggattc gcccctcctg 480 atcaatgtgt acccttattt tgcctatgcc tcagacccca ctcatatttc cctcaactac 540 gccttgttca cctcgaccgc accggtggtg gtcgaccaag gcttggaata ctacaacctc 600 tttgacggca tggtcgatgc tttcaatgcc gccctagata agatcggctt cggcc 655 <210>4 <211>656 <212>DNA <213>雷蒙德氏棉(Gossypium raimondii) <400>4 cggcaacaat cttccatctc caggagatgt tattaatctt tacaaaacta gtggcataaa 60 caatatcagg ctctaccagc cttaccctga agtgctcgaa gcagcaaggg gatcgggaat 120 atccctctcg atgggtccga gaaacgagga catacaaagc ctcgcaaaag atcaaagtgc 180 agccgatgca tgggttaaca ccaacatcgt cccttataag gacgatgttc agttcaaatt 240 gatcactatt gggaatgaag ccatttcagg acaatcaagc tcttacattc ctgatgccat 300 gaacaacata atgaactcgc tcgcctcatt tgggttaggc acaacgaagg ttacgaccgt 360 ggtcccgatg aatgccctaa gtacctcgta ccctccttca gacggcgctt ttggaagcga 420 tataacatcg atcatgacta gtatcatggc cattctggct gtacaggatt cgcccctcct 480 gatcaatgtg tacccttatt ttgcctatgc ctcagacccc actcatattt ccctcgatta 540 cgccttgttc acctcgaccg caccggtggt ggtcgaccaa ggcttggaat actacaacct 600 ctttgacggc atggtcgatg ctttcaatgc cgccctagat aagatcggct tcggcc 656 <210>5 <211>23 <212>DNA <213>人工 <220> <223>用于扩增内切葡聚糖酶基因组片段的寡核苷酸引物 <400>5 ggccgaagcc gatcttatct agg 23 <210>6 <211>23 <212>DNA <213>人工 <220> <223>用于扩增内切葡聚糖酶基因组片段的寡核苷酸引物 <400>6 cggcaacaat cttccatctc cag 23 <210>7 <211>229 <212>PRT <213>陆地棉 <400>7 Gly Arg Asp Ile Gly Val Cys Tyr Gly Leu Asn Gly Asn Asn Leu Pro 1 5 10 15 Ser Pro Gly Asp Val Ile Asn Leu Phe Lys Thr Ser Gly Ile Asn Asn 20 25 30 Ile Arg Leu Tyr Gln Pro Tyr Pro Glu Val Leu Glu Ala Ala Arg Gly 35 40 45 Ser Gly Ile Ser Leu Ser Met Ser Thr Thr Asn Glu Asp Ile Gln Ser 50 55 60 Leu Ala Thr Asp Gln Ser Ala Ala Asp Ala Trp Val Asn Thr Asn Ile 65 70 75 80 Val Pro Tyr Lys Glu Asp Val Gln Phe Arg Phe Ile Ile Ile Gly Asn 85 90 95 Glu Ala Ile Pro Gly Gln Ser Ser Ser Tyr Ile Pro Gly Ala Met Asn 100 105 110 Asn Ile Met Asn Ser Leu Ala Ser Phe Gly Leu Gly Thr Thr Lys Val 115 120 125 Thr Thr Val Val Pro Met Asn Ala Leu Ser Thr Ser Tyr Pro Pro Ser 130 135 140 Asp Gly Ala Phe Gly Ser Asp Ile Thr Ser Ile Met Thr Ser Ile Met 145 150 155 160 Ala Ile Leu Val Arg Gln Asp Ser Pro Leu Leu Ile Asn Val Tyr Pro 165 170 175 Tyr Phe Ala Tyr Ala Ser Asp Pro Thr His Ile Ser Leu Asn Tyr Ala 180 185 190 Leu Phe Thr Ser Thr Ala Pro Val Val Val Asp Gln Gly Leu Glu Tyr 195 200 205 Tyr Asn Leu Phe Asp Gly Met Val Asp Ala Phe Asn Ala Ala Leu Asp 210 215 220 Lys Ile Gly Phe Gly 225 <210>8 <211>229 <212>PRT <213>陆地棉 <400>8 Gly Arg Asp Ile Gly Val Cys Tyr Gly Leu Asn Gly Asn Asn Leu Pro 1 5 10 15 Ser Pro Gly Asp Val Ile Asn Leu Tyr Lys Thr Ser Gly Ile Asn Asn 20 25 30 Ile Arg Leu Tyr Gln Pro Tyr Pro Glu Val Leu Glu Ala Ala Arg Gly 35 40 45 Ser Gly Ile Ser Leu Ser Met Gly Pro Arg Asn Glu Asp Ile Gln Ser 50 55 60 Leu Ala Lys Asp Gln Ser Ala Ala Asp Ala Trp Val Asn Thr Asn Ile 65 70 75 80 Val Pro Tyr Lys Asp Asp Val Gln Phe Lys Leu Ile Thr Ile Gly Asn 85 90 95 Glu Ala Ile Ser Gly Gln Ser Ser Ser Tyr Ile Pro Asp Ala Met Asn 100 105 110 Asn Ile Met Asn Ser Leu Ala Leu Phe Gly Leu Gly Thr Thr Lys Val 115 120 125 Thr Thr Val Val Pro Met Asn Ala Leu Ser Thr Ser Tyr Pro Pro Ser 130 135 140 Asp Gly Ala Phe Gly Ser Asp Ile Thr Ser Ile Met Thr Ser Ile Met 145 150 155 160 Ala Ile Leu Ala Val Gln Asp Ser Pro Leu Leu Ile Asn Val Tyr Pro 165 170 175 Tyr Phe Ala Tyr Ala Ser Asp Pro Thr His Ile Ser Leu Asp Tyr Ala 180 185 190 Leu Phe Thr Ser Thr Ala Pro Val Val Val Asp Gln Gly Leu Glu Tyr 195 200 205 Tyr Asn Leu Phe Asp Gly Met Val Asp Ala Phe Asn Ala Ala Leu Asp 210 215 220 Lys Ile Gly Phe Gly 225 <210>9 <211>6009 <212>DNA <213>陆地棉 <220> <221>misc_feature <222>(2278)..(2281) <223>TATA框 <220> <221>misc_feature <222>(2308)..(2308) <223>转录起始位点 <220> <221>misc_feature <222>(2308)..(2409) <223>5’非翻译前导序列 <220> <221>misc_feature <222>(2410)..(2412) <223>翻译起始密码子(ATG) <220> <221>misc_feature <222>(2410)..(2443) <223>编码序列部分I <220> <221>misc_feature <222>(2444)..(2555) <223>内含子序列 <220> <221>misc_feature <222>(2556)..(3499) <223>编码序列部分II <220> <221>misc_feature <222>(3497)..(3499) <223>翻译终止密码子 <220> <221>misc_feature <222>(3624)..(3624) <223>聚腺苷酸化位点 <400>9 cgcggcatat aattttatgt gtgtaatttg ttgggttaat tacttaaaat agtatatttt 60 taattgctgt aattaatgta agataatttt tattatttga atcattgcac aaaattaaaa 120 tagaataatt tatttaacaa ttcaaatata ataataatcc aaattataat tatagtattt 180 ttacaatatt caatatacaa tatagtttta cttcatacaa ttaatataaa aaaatattat 240 tcaaaataat aactaataaa cataattacc atatattaat tattttgata tttcgaacat 300 aacgctaata aaaaatttcc taatcattat taaatcattt gtataaacta taaagaaatt 360 gatatattgt aaattaaact ttattcattt tttttcttaa tactcaataa attaatcata 420 ataactcata aataatatat aattaaaata atcataacat ggtagattat ataaataggg 480 ggcgaatcta gggagctggc atgaccccta aaatagaatt ttctattttg acctatcaaa 540 atttttaaaa ttttaaatta gtaaaggtaa atttgtactt tgacctctta aaatgataaa 600 attttacttt aatcctttaa aatttacatt tttactatca taaaaattac aatttgattt 660 tgcccctaaa atttttttct agcttagccc tgtatataaa tatattattt ataattttta 720 tatttaaaat ataaagtttt taattataca aataattaaa atctgatatt taaaactaaa 780 gtaatttctt ttttcttttt actttttttt aattgcaaca taatggttta aatatctata 840 taacgtatga agtaatttga tataaatttt attttaattt attattatat aaattcattt 900 agtaaaaact tttaatagaa tcaaaatttt tatttgtaaa ttcgataact tttcttatca 960 agtatatttg tgagaaccaa atatttagta aaattaatat tcttatttat aaatatgata 1020 aatcttataa aaaaatattt aaaatgaaaa aaattgtaca aatattataa aaaaatattt 1080 aaaatgaaaa acattgtaca aaggctatat aagaagttca aaagtttctt cgaccatgta 1140 ctcttataga gattatagat agattataaa actatatgta gtttctctta acttttaaat 1200 aagaggataa atgtatttta atgtactcaa acttatatat ttttatattg acaataatat 1260 caatatcaac ctaattaaga ttcattctaa cattaatgtt gaagattttt aataaaagaa 1320 aaggttaata aattaattag aacacaaaca aacacaaatt taagtggtat gtaaggtcct 1380 tgacccaaag gaaaaatttg ttacgtcgat taaattataa attaatttaa agtaaaatta 1440 cattttaacc taaaaaaaga gaaaagtata tctaatttct tcgaaaatgg aaagaaaatt 1500 ataaatttat ggcatttcta aaaaaattct gaattcgcta ctaaaagatg aaattataaa 1560 atccgaagca ttaccagaag atggatcacc aaatcacaaa caatcaatga aaagtaatga 1620 taattaattg aaagtgagca tttaattttg atagccatat acttcctgct gaatttatag 1680 gttctcatta atgcaattaa attatattcg acaccttttg aatgaaataa aatgacacaa 1740 gaggaaagac ggttcatcta ttttttcttt caatcgccca tcaaaatacc aaaaatgtaa 1800 ctacatgcaa aaaatcaaat atgaaaaata ttcatatttt gatattttaa tatattgtgt 1860 gttcaaaacg taaatgtatt gaaaaattat gatggtgttg ttgctgtatg tccataaaat 1920 tcaatgtact cacatttatc aaatgtatac tttgagagaa gttattttga taatactcaa 1980 gtttttttta tagatgggaa aattttttaa attatttttt gattttgatg aaatgtatat 2040 ataaatttta attcgataca tataaatata tatgtaaatt ttaaatttaa atttaataat 2100 atacaattaa gaaaataatt tataaatatt ttccgattaa aaataaatct ggaaagaaga 2160 aatgtcaaca ctttttcatt aaatacaatt aggatgggac acgatacctt catgcattga 2220 tatctcaggt ggtccaaaaa ctcggaatcc tttttgaaaa aaaacttcca gagagagtat 2280 ataaatccag cagtaggcac aagaaacgag caccagttat tgactttcct ttgtaaaaaa 2340 aaaaagtgct gagatcaaga aatatagtga aatatgggtc caagattttc tgggttttta 2400 atctaagcaa tgctgttttt aactcaactc ctctctctaa caggtaaaac aaacttctct 2460 acagtgattt tacagtaaat atggctttga aaaatataca acaaaacatt tatcttcaat 2520 ccattttaat tactgatcta ctatatatgt tgcagatggc cgtgatattg gtgtttgcta 2580 tggtttgaac ggcaacaatc ttccatctcc aggagatgtt attaatcttt tcaaaactag 2640 tggcataaac aatatcaggc tctaccagcc ttaccctgaa gtgctcgaag cagcaagggg 2700 atcgggaata tccctctcga tgagtacgac aaacgaggac atacaaagcc tcgcaacgga 2760 tcaaagtgca gccgatgcat gggttaacac caacatcgtc ccttataagg aagatgttca 2820 attcaggttc atcatcattg ggaatgaagc cattccagga cagtcaagct cttacattcc 2880 tggtgccatg aacaacataa tgaactcgct ggcctcattt gggctaggca cgacgaaggt 2940 tacgaccgtg gtcccgatga atgccctaag tacctcgtac cctccttcag acggcgcttt 3000 tggaagcgat ataacatcga tcatgactag tatcatggcc attctggttc gacaggattc 3060 gcccctcctg atcaatgtgt acccttattt tgcctatgcc tcagacccca ctcatatttc 3120 cctcaactac gccttgttca cctcgaccgc accggtggtg gtcgaccaag gcttggaata 3180 ctacaacctc tttgacggca tggtcgatgc tttcaatgcc gccctagata agatcggctt 3240 cggccaaatt actctcattg tagccgaaac tggatggccg accgccggta acgagcctta 3300 cacgagtgtc gcgaacgctc aaacttataa caagaacttg ttgaatcatg tgacgcagaa 3360 agggactccg aaaagacctg aatatataat gccgacgttt ttcttcgaga tgttcaacga 3420 gaacttgaag caacccacag ttgagcagaa tttcggattc ttcttcccca atatgaaccc 3480 tgtttatcca ttttggtgaa cttgaaatgt tattgttggc tatttaaatc ttttgccaga 3540 gacgcttcat atagtttctg catattttga aagtggaaaa tcaatctaaa tataaataag 3600 ttttatttgt tgttttttaa ttaaataaaa ttttaaatat tttaaaaaca tctttattgg 3660 taattaaata ttaaataaaa agtttaatat tcaaatttta tcaattcaaa aataaaataa 3720 aaatatatta aatttatttt tacgaataaa ttgattttct attaatgcag attttaaata 3780 atttgatata aattttcaat tcaacaatag taattttgat cacatcaaag gagaaaggga 3840 aagatttaac tttaattggt gacctaatat aacacgttga aaacggagtt cccaataagg 3900 caaaatgact tgtaatgacg aaagagatgt ccaagtgaaa tctgctttaa agtgaaagaa 3960 gcataaaagg ataactaaat aactcatgat ctaaattgaa gttctataaa atgcaacttt 4020 catctagaaa caaggtatgt cttaaatgat gttttatgaa tttgtcttaa ttgggtttta 4080 tgcaatgaat tcatggatag cacatctcta attatacgtt gctggtttat atgagagtgg 4140 tgcagaagtt aattgtgctt taaatacttg cttagtgttt atgaaatttg aaaagtgtta 4200 tatacttata ataaaaataa ttcgattcgg aatccaattc agggttcgac tcaatataat 4260 aaaattttac agatatcttg aaggggatct tcttcttctc tacttctcga gcagtgttat 4320 atatttacaa taaagataac tcaattcgag atccgaccta atataataaa attctacaga 4380 catatcaaag agggagatct tcttcttccc tacatcttga ccttcttgat caaaatgacc 4440 ttccttatat ttttacatac gttgattata tgaatcaaaa gaaagatacc aaaaagtttt 4500 taaaaataaa caacggggtt cttatgtaga gatgcttatg ggccgggccg gactcaacta 4560 aaaatttagg cacattcatt gggcccaggt cgggcctaac ccaaaaatgg gcctaaaatt 4620 ttgcccaagc ttgactcaaa taaaaatgct aaaattcggg cctgaccccg tattaatttt 4680 atattatttt atataacttt taaatatata taatatataa aaaatactaa aaaaattaaa 4740 ataaatattt cccaactaaa ctaaaattat taagaaaaat aattcatatt agcgtataaa 4800 ttggaaattg accaaaatta aaattattgt atagttaatc tatattaaaa ggacatgtaa 4860 ttaaaaacca ttaaaactat tatacaataa attaaatctt cattgtatac atagaaaggc 4920 attaataatt aaaaaactat attaagatat aaactaaatt caaaattatt aaaaacaaga 4980 actaaataaa aaagcaattg aaaattacga attaatgtta aaatcaaatg ttaaaatcaa 5040 gggacttaaa taaaaatatc ccaaaataca aaacattagc ttcctttccc atccacgtga 5100 atgcaaagtt tacatggtgt ttcctagtgt ttgtgcgact ccaacctttt atttacctct 5160 ttttttcttt atttgaacaa ttatttgata atgattagaa ttttgggatt gttgctcatc 5220 gtacgtgcaa cacttaaaat cactatgatt tttcataatt tatataacct atatcgtttt 5280 ggaaattaat tttatttttt atattatttt aataaaaata ccatctacct tttttaattt 5340 atgatccctt tcatatttaa aaattcaaat tgacaattgt ctaactaaac accgtcacac 5400 tccaataaga ttgtaatttc ctccatcttg atattacact caaaagcatg ttgccaacaa 5460 acaaatcaac tagccttttt ctaccactat tcatcatctt cttaagagtg tgtttatgtc 5520 atgtgccgag attttaggta tggtcacgtt gtggctttaa actcaaatct attgcccatg 5580 agtctaagtt agcctccgat cctcactaaa gagaggcttg gcacacttta cctagccaag 5640 tacacaagga atagagctat tagaaagcat taaagagtta ggagaatgtg gaagtgtttt 5700 tattactcaa agctaacttg gatacaaata aaggagggag cctctccttt aggcaagctt 5760 cttttgatct gatggttaca attaatctcg aataggaggg gtcaaacttc tcactcagtt 5820 tcatattatc tcttggtgct tggttggcct ccgccttgag acaactttag ataacaccta 5880 gtcttaacac ttttagcttc acattgtacg catccttcat tactcaaatg ccacaaagcc 5940 tccttactta aggctcttgg tcgctcccac taccttcggc tttagactca tctaagatct 6000 tcccaatcg 6009 <210>10 <211>6877 <212>DNA <213>陆地棉 <220> <221>misc_feature <222>(3242)..(3245) <223>TATA框 <220> <221>misc_feature <222>(3270)..(3270) <223>转录起始位点 <220> <221>misc_feature <222>(3270)..(3372) <223>5’非翻译前导序列 <220> <221>misc_feature <222>(3373)..(3375) <223>翻译起始密码子(ATG) <220> <221>misc_feature <222>(3373)..(3406) <223>编码序列部分I <220> <221>misc_feature <222>(3407)..(3500) <223>内含子序列 <220> <221>misc_feature <222>(3501)..(4444) <223>编码序列部分II <220> <221>misc_feature <222>(4442)..(4444) <223>终止密码子 <220> <221>misc_feature <222>(4566)..(4566) <223>聚腺苷酸化位点 <400>10 ttcaaactta ctcgcttgca caaaaataat tttataaaag tatttaaaat ataaaatttt 60 tatgttgata atatttttat atacatttta tattttaaga aataataatt ttttaggaat 120 tagaaaaaaa atgtagaata atatcattga tattttaatt tttcaaaaaa ttaaaaataa 180 gttcacgtag tctaatttta tctattttaa tttttatact ttcaaattga gataaatatc 240 aaagaacttt tggttcaata tgcaatttga tacttaaatt ttaatttgat gtaattatta 300 catgaaactt ggcttgtggt ttatacgtat acatgaaatt tttattttga ttcaattgta 360 cgcatttaaa gaaatgaaaa tggttctaat tcaataatat tattagtgat ttgtgaaatt 420 taaaactttt atgcattaaa ccacacaaaa tcagagttta tgtatgatat tgcacattgg 480 actatagttc atgcatattt tttatatttt atccatgtca aattttgaaa tttcattctt 540 aacttatatg atagcagtta aatttgttaa gtcaaactct agtattagtt atatactata 600 cataacttgt agagtttagt ttaagttcac taatttgatt attttttatc tgtttatttt 660 ttcaatttca agatttaagt tttaagctta acttaaacaa tagtcattaa atttattaac 720 taaaatgtcc tggggttttt tgtaagtatt ataatatgtt tgccacgtga gattttggta 780 aaagtagagt ttaacttaac aaatttaatg gctactactt agtaaggatt agaatttcaa 840 aattaaaaaa aaaattatag aggctaaaga tgatcaaatt agaggtttaa attaagtcaa 900 attaaaatag ttctggatat taactattta aattaattaa tgtcattata aaattagagg 960 tctaaattat gtaaaattaa aatataaaaa ctaaatctcg aatgtgagta tagtataagg 1020 atcaaaagtg attttggtca ttttctttta tttacaaata ttcttagaga tgctctttta 1080 tatataatgg tttctaatgt gatatgcgcg gcatataatt ttatgtgttt aatttatttt 1140 attaattatt taaataatat atttttaatt actataatta atgtaaaata ttttttatta 1200 tttgaatcac tgcacaaaat taaaatatac taacttaatt aacaattcaa atataataat 1260 aatctaaatt ataattaaag catttttaca atattcagta tataatatag ttttacttta 1320 tataattaat acaaagaaat attattcaaa ataataacta atcaacataa ttactatata 1380 tcaattattt tgatatttcg aacataatgc taataaaaaa tttcctaatc attattaaat 1440 catttgtata aactataaag aaattgatat attgtaaatt aaacttttaa ctattcaatt 1500 ttttcttaat agtcaataaa ttaatcataa taattcataa ttaatatata attaacataa 1560 ccataacata gaatttttta ttttggccca ttaaaatttt taaaatttta aattagtaaa 1620 ggaaaaatta cactttgacc ccttaaaaat gataaaattt tattttaatc ctttaaaatt 1680 gacattttta ctattgtaaa aattacaatt taattttgcc cccctaaaaa atttttctag 1740 cttcgccctt gtgtataaat atattaatta caatttttat atttgaatta tataaataat 1800 taaattttga tatttaaaac taaagtaatc tctttttttt ttactttttt ttaattgaaa 1860 cataatggtt taaatatcta tattacgtat gaagtaattt aatataaatt ttattttaat 1920 ttattattat ataaattcat ttagtaaaaa cttttaatag aatcaaaatt tttatttgta 1980 aattcgataa cttttcttat caagtaaatt tgttgaatta aatatttagt aaaattaata 2040 tttttattta taaatatgat aaatcttata aaaaataaaa aaatatttaa aatgaaaaac 2100 attgtacaaa ggctatataa gaagttcaaa agtttcttcg accctgtact ctaatagaga 2160 ttatagatag attatagaac tattcatagt ttctcttaac ctttaaataa gaattttagt 2220 gtactcaaac ttacatattt ttatattgat aataatgtca ataccagccg agttaagatt 2280 cactcgacat taatgttgaa aatttttaat aaaagaaaat gttgataagt taattagaac 2340 acaagcaagc acaaatttaa gtggtaagta aggtccttga ccctaatgga aaaattgtta 2400 tgttgattaa attataaatt aatttaaggt aaaattatat tttgacctaa aaaaatgaaa 2460 aaaatatatc tagtttcttc gaaaatgaaa agaaaataat aaattgatac attataaaat 2520 ttatggcatt tctaaaaaaa ttctgaattt gatgaaatta taataaaaaa aaagtttaaa 2580 aacatataga tttcaagaat agtgggaaaa ttatatttga acaacactga agaaatccaa 2640 agcattagca gaaaatggat caccaaatca caaacaatca gtgaaaagta atgataatta 2700 attgaaagtg agcatttaaa tttgatagcc atatacttcc tgctgaattt ataggttctc 2760 attaatgcaa ttaaattata tttgtcactt tttgaatgaa ataaatgaca cagttcatct 2820 attttttttc tttcaatcgc ccatcaaaat accgaaaatg taactacatt aaaaaagatc 2880 gaaaaatatt catattttga tattttaata gattgtgtgt tcaaggcgta atgtactaaa 2940 aaattatgat ggtgttgtcg ctgtatgtcc ataaaattca atgtattcgc atgtatcaaa 3000 tgtaaatttt gacacaagtt attctaataa taatcaagtt atttttatac atgagataca 3060 tctcaaaatt atttttatat atccgaaaaa tcataacgta cgatcaaact agaaagagga 3120 agtgtcaaaa cctattcatt atatgcaaat atgatgggac acgataccct catgcattga 3180 tatctcatat tgtccaaaaa ctcagaatcc tttttgaaaa aaaaaaattc cagagagagt 3240 gtataaatcc agcagtgtgc acaagaaacg agcaccagtt attgacattc ctttgtaaaa 3300 aaaaaaagaa gctgagatca agaaatatag tgaaatatgg gtccaacatt ttctgggttt 3360 ttaatctcag caatggtgtt tttaactcaa ctcctctctc taacaggtaa aacaaacttc 3420 tctacagtga ttttacggta agtatggctt tgaaaaatat acaacaaaac atttatactg 3480 atctaccata tatgttgcag atggccgtga tattggtgtt tgctatggtt tgaacggcaa 3540 caatcttcca tctccaggag atgttattaa tctttacaaa actagtggca taaacaatat 3600 caggctctac cagccttacc ctgaagtgct cgaagcagca aggggatcgg gaatatccct 3660 ctcgatgggt ccgagaaacg aggacataca aagcctcgca aaagatcaaa gtgcagccga 3720 tgcatgggtt aacaccaaca tcgtccctta taaggacgat gttcagttca agttgatcac 3780 tattgggaat gaagccattt caggacaatc aagctcttac attcctgatg ccatgaacaa 3840 cataatgaac tcgctcgcct tatttgggtt aggcacgacg aaggttacga ccgtggtccc 3900 gatgaatgcc ctaagtacct cgtaccctcc ttcagacggc gcttttggaa gcgatataac 3960 atcgatcatg actagtatca tggccattct ggctgtacag gattcgcccc tcctgatcaa 4020 tgtgtaccct tattttgcct atgcctcaga ccccactcat atttccctcg attacgcctt 4080 gttcacctcg accgcaccgg tggtggtcga ccaaggcttg gaatactaca acctctttga 4140 cggcatggtc gatgctttca atgccgccct agataagatc ggcttcggcc aaattactct 4200 cattgtagcc gaaactggat ggccgaccgc cggtaacgag ccttacacga gtgtcgcgaa 4260 cgctcaaact tataacaaga acttgttaaa tcatgtgacg cagaagggga ctccgaaaag 4320 acctgaatat ataatgccga cgtttttctt cgagatgttc aacgaggatt tgaagcaacc 4380 cacagttgag cagaatttcg gattcttctt ccccaatatg aaccctgttt atccattttg 4440 gtgaagttga aatgttgttg gctatttaaa tcttttgcca gagacgcttc atatagtttc 4500 tgcatatttt gaaagtggaa aatcaatcta aatattaata agttttatgt gttgtttttt 4560 aattaaataa aattttaaat attttaaaaa tatctttatt ggtaattaaa tattaaataa 4620 aaagtttaat attcaaattt tatcaattca aaaataaaat aaaaatatat taaatttatt 4680 tttacgaata aattgatttt ctattaatac agattttgaa taatttgata taaattttaa 4740 attcaacaat agtaattttg atcacatcaa aggagaaagg gaaagattta actttaattg 4800 gtgacctaat ataacacgtt gaaaacggag ctcccaggaa ggcaaaatga cttgtaatga 4860 cgaaagagat gtccaagtag aatctgcatt aaagtgaaaa aagcataaaa ggataagtaa 4920 actcatgatc tgacataaat tgaagttcta taaaatgcaa ctttcatcta gaaacaaggt 4980 atgtcttaaa tgatgtttta tgaatttgtc ttaactgggt tttatgcaat gaattcatgg 5040 atagcacctc actaattata cgttgctggt ttatatgaga gtggtgcaga agttaattgt 5100 gctttaaata cttgcttagt gttcaagaaa tttgaaaagt attatatatt tataataaaa 5160 ataattcaga tccgactcaa tctagtaaaa ttttacaaac attctaaagg ggatcttctt 5220 ttttctctac ttattgatca gtgttatata cttataataa agacaacctg atttgagatc 5280 cggcctaata taataaaatt ctacagacat ctcaagggag agatcttctt cttccctaca 5340 tcttgacctt tttgatcaaa atttcctccc ctctatttcc acattggttg atcatatgaa 5400 tcaacagaaa ggtaccaaaa agtttttaaa aataaacaaa ggggttctta tgaaattcat 5460 atgatatatt gggtctaatt attagaatca attttaagtt taaacaaatt taaaattcaa 5520 aactcaattc catttttgtt tgaacggaaa gttactaatt gttaagaaaa ataattcata 5580 ttagcgtata aattggaaat tgaccaaaac taaaattatt gtatagttaa tctatattaa 5640 aaggacatgt aattaaaaac cattaaaact attatagaat aaattaaatc ttcattctat 5700 acatacaaag tcattaataa ttaaaaaact atattaagat ataaactata ttcaaaaaat 5760 attaaaaaca ataactaaat aaaaaaaaca attgaaaatt acgaattaat gttaaaatca 5820 agggacttaa ataaaaatat cccaaaatac aaaacattag cttcctttcc catccacgtg 5880 attgcaaagt ttacatggtg tttcctagtg cttgtgcgac tccaaccttt tatttacttt 5940 tttcttttct ttatttgaac aattatttga taatgattag aattttggga ttgttgctca 6000 tcgtacgtgc aacacttaaa atcactatga tttttcataa tttatataac ctatatcgtt 6060 ttggaaatta atgttattat ttatattgtt ttaataaaaa taccatctac ctcttttaat 6120 ttatgatcca tttcttattt gaaaattcaa attgacagtt gtctaactaa acaccatcgc 6180 actccaataa aattgtaatt ttttctatcg tgaatagtac actcaaaagt atgttgttaa 6240 caaacaaatc aattagcctt tttctacctc tattcatcat cttcttaata gcgtgtttat 6300 gtcacgtgtt gagattttag ttccggtcac gtgtggcctt aaacccgaat ttcttacgca 6360 tgagtctaag ttagcctctg atcctcgcta tggagatgct tggcacagtt tacctaggta 6420 agtaaacaag gaatagagct attagaaagc atcagagagt taggagaatg tggaagtgtt 6480 tctattactc aaagctaact tggatacaaa taaaagaggg agcctctcct ttaggcaagc 6540 ctattttgat ctgacggttg caattaatct cgaataggag gggtcgaact tctcactcag 6600 tttcacatta tctcttggtg cttagttggc ctccgccttg agacacattc aaataacacc 6660 tagtcttaac acttttggct tcttattgtg cgtatccttc attactcaaa tgccacaaag 6720 cctcattact taagactctc ggtcgctccc actaccttcg actttagact catctaagat 6780 cttcccaatc gtagacaact tggccttggt ggggaaatct tgcaccctac ggggccttac 6840 ataagaagca attaaatggc tttctctcac ccacctt 6877 <210>11 <211>325 <212>PRT <213>陆地棉 <400>11 Met Leu Phe Leu Thr Gln Leu Leu Ser Leu Thr Asp Gly Arg Asp Ile 1 5 10 15 Gly Val Cys Tyr Gly Leu Asn Gly Asn Asn Leu Pro Ser Pro Gly Asp 20 25 30 Val Ile Asn Lcu Phe Lys Thr Ser Gly Ile Asn Asn Ile Arg Leu Tyr 35 40 45 Gln Pro Tyr Pro Glu Val Leu Glu Ala Ala Arg Gly Ser Gly Ile Ser 50 55 60 Leu Ser Met Ser Thr Thr Asn Glu Asp Ile Gln Ser Leu Ala Thr Asp 65 70 75 80 Gln Ser Ala Ala Asp Ala Trp Val Asn Thr Asn Ile Val Pro Tyr Lys 85 90 95 Glu Asp Val Gln Phe Arg Phe Ile Ile Ile Gly Asn Glu Ala Ile Pro 100 105 110 Gly Gln Ser Ser Ser Tyr Ile Pro Gly Ala Met Asn Asn Ile Met Asn 115 120 125 Ser Leu Ala Ser Phe Gly Leu Gly Thr Thr Lys Val Thr Thr Val Val 130 135 140 Pro Met Asn Ala Leu Ser Thr Ser Tyr Pro Pro Ser Asp Gly Ala Phe 145 150 155 160 Gly Ser Asp Ile Thr Ser Ile Met Thr Ser Ile Met Ala Ile Leu Val 165 170 175 Arg Gln Asp Ser Pro Leu Leu Ile Asn Val Tyr Pro Tyr Phe Ala Tyr 180 185 190 Ala Ser Asp Pro Thr His Ile Ser Leu Asn Tyr Ala Leu Phe Thr Ser 195 200 205 Thr Ala Pro Val Val Val Asp Gln Gly Leu Glu Tyr Tyr Asn Leu Phe 210 215 220 Asp Gly Met Val Asp Ala Phe Asn Ala Ala Leu Asp Lys Ile Gly Phe 225 230 235 240 Gly Gln Ile Thr Leu Ile Val Ala Glu Thr Gly Trp Pro Thr Ala Gly 245 250 255 Asn Glu Pro Tyr Thr Ser Val Ala Asn Ala Gln Thr Tyr Asn Lys Asn 260 265 270 Leu Leu Asn His Val Thr Gln Lys Gly Thr Pro Lys Arg Pro Glu Tyr 275 280 285 Ile Met Pro Thr Phe Phe Phe Glu Met Phe Asn Glu Asn Leu Lys Gln 290 295 300 Pro Thr Val Glu Gln Asn Phe Gly Phe Phe Phe Pro Asn Met Asn Pro 305 310 315 320 Val Tyr Pro Phe Trp 325 <210>12 <211>325 <212>PRT <213>陆地棉 <400>12 Met Val Phe Leu Thr Gln Leu Leu Ser Leu Thr Asp Gly Arg Asp Ile 1 5 10 15 Gly Val Cys Tyr Gly Leu Asn Gly Asn Asn Leu Pro Ser Pro Gly Asp 20 25 30 Val Ile Asn Leu Tyr Lys Thr Ser Gly Ile Asn Asn Ile Arg Leu Tyr 35 40 45 Gln Pro Tyr Pro Glu Val Leu Glu Ala Ala Arg Gly Ser Gly Ile Ser 50 55 60 Leu Ser Met Gly Pro Arg Asn Glu Asp Ile Gln Ser Leu Ala Lys Asp 65 70 75 80 Gln Ser Ala Ala Asp Ala Trp Val Asn Thr Asn Ile Val Pro Tyr Lys 85 90 95 Asp Asp Val Gln Phe Lys Leu Ile Thr Ile Gly Asn Glu Ala Ile Ser 100 105 110 Gly Gln Ser Ser Ser Tyr Ile Pro Asp Ala Met Asn Asn Ile Met Asn 115 120 125 Ser Leu Ala Leu Phe Gly Leu Gly Thr Thr Lys Val Thr Thr Val Val 130 135 140 Pro Met Asn Ala Leu Ser Thr Ser Tyr Pro Pro Ser Asp Gly Ala Phe 145 150 155 160 Gly Ser Asp Ile Thr Ser Ile Met Thr Ser Ile Met Ala Ile Leu Ala 165 170 175 Val Gln Asp Ser Pro Leu Leu Ile Asn Val Tyr Pro Tyr Phe Ala Tyr 180 185 190 Ala Ser Asp Pro Thr His Ile Ser Leu Asp Tyr Ala Leu Phe Thr Ser 195 200 205 Thr Ala Pro Val Val Val Asp Gln Gly Leu Glu Tyr Tyr Asn Leu Phe 210 215 220 Asp Gly Met Val Asp Ala Phe Asn Ala Ala Leu Asp Lys Ile Gly Phe 225 230 235 240 Gly Gln Ile Thr Leu Ile Val Ala Glu Thr Gly Trp Pro Thr Ala Gly 245 250 255 Asn Glu Pro Tyr Thr Ser Val Ala Asn Ala Gln Thr Tyr Asn Lys Asn 260 265 270 Leu Leu Asn His Val Thr Gln Lys Gly Thr Pro Lys Arg Pro Glu Tyr 275 280 285 Ile Met Pro Thr Phe Phe Phe Glu Met Phe Asn Glu Asp Leu Lys Gln 290 295 300 Pro Thr Val Glu Gln Asn Phe Gly Phe Phe Phe Pro Asn Met Asn Pro 305 310 315 320 Val Tyr Pro Phe Trp 325 <210>13 <211>134 <212>DNA <213>人工 <220> <223>前-miRA1 <220> <221>misc_feature <222>(17)..(36) <223>miRNA链I <220> <221>misc_feature <222>(87)..(107) <223>miRNA链II <400>13 tctagggtaa gggaggtcct gtcgaaccag aatggcacag ggtactttct tgcatgcttg 60 agcctttcat gcttgaagct ctgcgccatt ctcgttcaga caggatccac ttttctctct 120 ctctctcact cact 134 <210>14 <211>146 <212>DNA <213>人工 <220> <223>具有克隆位点的前miRA1 <400>14 ccatggtcta gggtaaggga ggtcctgtcg aaccagaatg gcacagggta ctttcttgca 60 tgcttgagcc tttcatgctt gaagctctgc gccattctcg ttcagacagg atccactttt 120 ctctctctct ctcactcact gctagc 146 <210>15 <211>134 <212>DNA <213>人工 <220> <223>前-miRD1 <220> <221>misc_feature <222>(17)..(36) <223>miRNA链I <220> <221>misc_feature <222>(87)..(107) <223>miRNA链II <400>15 tctagggtaa gggaggatcc tgtacagcca gaatggacag ggtactttct tgcatgcttg 60 agcctttcat gcttgaagct ctgcccattc tgcctgtaac aggattccac ttttctctct 120 ctctctcact cact 134 <210>16 <211>146 <212>DNA <213>人工 <220> <223>具有克隆位点的前-miRD1 <400>16 ccatggtcta gggtaaggga ggatcctgta cagccagaat ggacagggta ctttcttgca 60 tgcttgagcc tttcatgctt gaagctctgc ccattctgcc tgtaacagga ttccactttt 120 ctctctctct ctcactcact gctagc 146 <210>17 <211>134 <212>DNA <213>人工 <220> <223>前-miRA2 <220> <221>misc_feature <222>(17)..(36) <223>微小RNA链I <220> <221>misc_feature <222>(87)..(107) <223>微小RNA链II <400>17 tctagggtaa gggaggttcc caatgatgat gaacctacag ggtactttct tgcatgcttg 60 agcctttcat gcttgaagct ctgcaggttc atcatcaatt gggaatccac ttttctctct 120 ctctctcact cact 134 <210>18 <211>134 <212>DNA <213>人工 <220> <223>前-miRA2aa <220> <221>misc_feature <222>(17)..(36) <223>微小RNA链I <220> <221>misc_feature <222>(87)..(107) <223>微小RNA链II <400>18 tctagggtaa gggaggttcc caatgatgat gaacctacag ggtactttct tgcatgcttg 60 agcctttcat gcttgaagct ctgcaggttc ataatcactt gggaatccac ttttctctct 120 ctctctcact cact 134 <210>19 <211>146 <212>DNA <213>人工 <220> <223>具有克隆位点的前-miRA2aa <400>19 ccatggtcta gggtaaggga ggttcccaat gatgatgaac ctacagggta ctttcttgca 60 tgcttgagcc tttcatgctt gaagctctgc aggttcataa tcacttggga atccactttt 120 ctctctctct ctcactcact gctagc 146 <210>20 <211>134 <212>DNA <213>人工 <220> <223>前-miRD2 <220> <221>misc_feature <222>(17)..(36) <223>微小RNA链I <220> <221>misc_feature <222>(87)..(107) <223>微小RNA链II <400>20 tctagggtaa gggaggattc ccaatagtga tcaactacag ggtactttct tgcatgcttg 60 agcctttcat gcttgaagct ctgcagttga tccctatatg ggaattccac ttttctctct 120 ctctctcact cact 134 <210>21 <211>146 <212>DNA <213>人工 <220> <223>具有克隆位点的前-miRD2 <400>21 ccatggtcta gggtaaggga ggattcccaa tagtgatcaa ctacagggta ctttcttgca 60 tgcttgagcc tttcatgctt gaagctctgc agttgatccc tatatgggaa ttccactttt 120 ctctctctct ctcactcact gctagc 146
《亚基因组特异性等位基因在棉花中的差异表达及其用途.pdf》由会员分享,可在线阅读,更多相关《亚基因组特异性等位基因在棉花中的差异表达及其用途.pdf(78页珍藏版)》请在专利查询网上搜索。
本发明公开了改变产纤维植物(例如棉花)的纤维性质(例如纤维长度)的方法和手段。本发明还提供了具有纤维优先性或纤维选择性表达模式的植物启动子。。
copyright@ 2017-2020 zhuanlichaxun.net网站版权所有经营许可证编号:粤ICP备2021068784号-1