亚基因组特异性等位基因在棉花中的差异表达及其用途.pdf

摘要
申请专利号：	CN200880001514.1	申请日：	2008.01.07
公开号：	CN101578371A	公开日：	2009.11.11
当前法律状态：	授权	有效性：	有权
法律详情：	授权\|\|\|专利申请权的转移IPC(主分类):C12N 15/82变更事项:申请人变更前权利人:拜尔生物科学公司变更后权利人:拜尔作物科学公司变更事项:地址变更前权利人:比利时根特变更后权利人:比利时迪海姆登记生效日:20120424\|\|\|实质审查的生效\|\|\|公开
IPC分类号：	C12N15/82	主分类号：	C12N15/82
申请人：	拜尔生物科学公司
发明人：	S·恩格勒恩; A·阿廖利
地址：	比利时根特
优先权：	2007.1.11 EP 07000550.9; 2007.1.11 US 60/884,564
专利代理机构：	北京市中咨律师事务所	代理人：	黄革生;史文静
PDF下载：	PDF下载

内容摘要

本发明公开了改变产纤维植物(例如棉花)的纤维性质(例如纤维长度)的方法和手段。本发明还提供了具有纤维优先性或纤维选择性表达模式的植物启动子。

权利要求书

1.  纤维细胞优先性启动子，其包含选自以下核苷酸序列的核苷酸序列：
a)核苷酸序列，其包含SEQ ID No 9的第2149位核苷酸至第2307位核苷酸的核苷酸序列；
b)核苷酸序列，其包含SEQ ID No 10的第3109位核苷酸至第3269位核苷酸的核苷酸序列；
c)核苷酸序列，其包含与a)或b)提到的任何所述核苷酸序列具有至少70％，优选至少80％，更优选至少90％，特别是至少95％序列同一性或者更特别是与a)或b)提到的任何所述核苷酸序列相同的核苷酸序列；或
d)核苷酸序列，其包含大约150bp至大约1000bp的DNA片段的核苷酸序列，所述DNA片段在严谨条件下与具有a)、b)或c)提到的所述核苷酸序列的DNA片段杂交。

2.  权利要求1的纤维细胞优先性启动子，其包含SEQ ID No 9的第465位至第2307位的核苷酸序列。

3.  权利要求1的纤维细胞优先性启动子，其包含SEQ ID No 9的第1374位至第2307位的核苷酸序列。

4.  权利要求1的纤维细胞优先性启动子，其包含SEQ ID No 9的第1531位至第2307位的核苷酸序列。

5.  权利要求1的纤维细胞优先性启动子，其包含SEQ ID No 10的第1397位至第3269位的核苷酸序列。

6.  权利要求1的纤维细胞优先性启动子，其包含SEQ ID No 10的第2371位至第3269位的核苷酸序列。

7.  权利要求1的纤维细胞优先性启动子，其包含SEQ ID No 10的第2718位至第3269位的核苷酸序列。

8.  纤维细胞优先性启动子区域，其包含权利要求1至7中任意一项的纤维细胞优先性启动子。

9.  权利要求8的纤维细胞优先性启动子区域，其还包含SEQ ID 9的第2308位核苷酸至第2409位核苷酸的核苷酸序列。

10.  权利要求8的纤维细胞优先性启动子区域，其还包含SEQ ID 10的第3270位核苷酸至第3372位核苷酸的核苷酸序列。

11.  嵌合基因，其包含下述有效相连的DNA区域：
a)权利要求1至7中任意一项的纤维细胞特异性启动子；
b)异源DNA区域，其编码感兴趣的生物活性RNA；以及
c)转录终止和聚腺苷化信号。

12.  权利要求11的嵌合基因，其中所述生物活性RNA编码感兴趣的蛋白质。

13.  权利要求12的嵌合基因，其中所述异源DNA区域编码选自N-乙酰葡糖胺转移酶，优选地，NodC型的N-乙酰葡糖胺转移酶，纤维素合酶，蔗糖合酶，优选地，C型的蔗糖合酶；蔗糖磷酸合酶；β-1，3-内切葡聚糖酶，木聚糖合酶(cslF)、木葡聚糖合酶(cslD)和1，3-1，4葡聚糖合酶(cslC)的分子。

14.  权利要求11的嵌合基因，其中所述生物活性RNA是核酶、微小RNA、双链发夹RNA。

15.  权利要求12的嵌合基因，其中所述生物活性RNA下调内源棉花基因，例如β-1，3-内切葡聚糖酶的表达。

16.  植物细胞，其包含权利要求11至15中任意一项的嵌合基因。

17.  植物，其在其细胞中包含权利要求11至15中任意一项的嵌合基因。

18.  权利要求17的植物，其是棉花植物。

19.  在其细胞中包含权利要求11至15中任意一项的嵌合基因的植物的种子。

20.  在产纤维植物，例如棉花植物的纤维细胞中优先表达生物活性RNA的方法，所述方法包括：
a)向所述植物的细胞提供权利要求11至15中任意一项的的嵌合基因，以及
b)种植所述植物。

21.  权利要求20的方法，其中所述植物是棉花植物。

22.  权利要求1至7中任意一项的纤维特异性和/或纤维优先性启动子用于在产纤维植物的纤维细胞中优先表达生物活性RNA的用途。

23.  权利要求22的用途，其中所述植物是棉花植物。

24.  经分离的DNA分子，其包含编码下述蛋白质的核苷酸序列，所述蛋白质包含编码β-1，3-内切葡聚糖酶并且与SEQ ID No 11或SEQ ID No12的氨基酸序列具有至少95％序列同一性、优选相同的氨基酸序列。

25.  经分离的DNA分子，其包含选自SEQ ID No 1、SEQ ID No 2、SEQ ID No 3和SEQ ID No 4的核苷酸序列。

26.  经分离的DNA分子，其包含选自下述的核苷酸序列：SEQ ID No9的第2410-2443位的核苷酸序列和SEQ ID No 9的第2556-3499位核苷酸序列或SEQ ID No 10的第3373-3406位核苷酸序列和SEQ ID No 10的第3501-4444位核苷酸序列。

27.  权利要求24至27中任意一项的经分离的DNA分子用于分离纤维细胞优先性启动子或启动子区域的用途。

28.  分离纤维细胞优先性启动子区域的方法，所述方法包括下述步骤：
a)鉴定编码下述RNA转录本的基因组片段，可从所述RNA转录本合成下述cDNA，所述cDNA包含SEQ ID No 1、SEQ ID No 2、SEQ ID No3或SEQ ID No 4或其功能等价物的核苷酸序列；
b)分离编码下述蛋白质的核苷酸序列上游的DNA区域，所述蛋白质具有SEQ ID No 11或SEQ ID No 12或其功能等价物的氨基酸。

29.  通过权利要求28的方法获得的纤维细胞优先性启动子或启动子区域。

30.  增加棉花植物纤维长度的方法，所述方法包括下述步骤：向所述棉花植物的细胞中引入下述嵌合基因，所述嵌合基因包含下述有效相连的DNA元件：
(a)可植物表达的启动子，优选地，控制在所述纤维细胞中优先转录的可植物表达的启动子；
(b)转录的DNA区域，当其被转录时，其产生下述生物活性RNA分子，所述分子能降低对于所述产纤维植物内源的β-1，3-内切葡聚糖酶编码基因的表达，所述β-1，3-内切葡聚糖酶涉及从所述胞间连丝去除胼胝质，以及
(c)3’末端区域，其包含在所述植物的细胞中有功能的转录终止和聚腺苷化信号，
所述方法特征在于，所述内源β-1，3-内切葡聚糖酶编码基因是所述棉花植物的D亚基因组中包含的β-1，3-内切葡聚糖酶编码基因。

31.  权利要求30的方法，其中所述启动子是来自棉花的纤维特异性β微管蛋白启动子、来自棉花的纤维特异性肌动蛋白启动子、来自棉花的脂转移蛋白质基因的纤维特异性启动子、来自棉花的扩展蛋白基因的启动子或来自棉花几丁质酶基因的启动子或权利要求1至7中任意一项所述的启动子。

32.  权利要求31的方法，其中所述D亚基因组中包含的所述β-1，3-内切葡聚糖酶编码基因表征为：具有SEQ ID No 10第3407-3500位的核苷酸序列的内含子序列的存在。

33.  权利要求31的方法，其中所述D亚基因组中包含的所述β-1，3-内切葡聚糖酶编码基因表征为：翻译起始密码子下游大约326个核苷酸处(不包括该翻译起始密码子)核苷酸序列AAGATC的存在。

34.  权利要求31的方法，其中所述D亚基因组中包含的所述β-1，3-内切葡聚糖酶编码基因表征为：用具有SEQ ID No 5和SEQ ID No 6的核苷酸序列的寡核苷酸进行PCR扩增，再用AlwI限制性酶消化后，对大约538bp的片段和大约118bp的片段的鉴定。

35.  权利要求31的方法，其中所述内源基因编码包含SEQ ID No 12的氨基酸序列的蛋白质或者其中所述基因包含SEQ ID No 2的核苷酸序列。

36.  权利要求30至35中任意一项的方法，其中所述棉花植物是陆地棉(Gossypium hirsutum)。

37.  权利要求30至35中任意一项的方法，其中所述生物活性RNA是反义RNA，所述反义RNA包含与SEQ ID No 3的核苷酸序列互补序列具有至少94％序列同一性的至少19个核苷酸。

38.  权利要求30至35中任意一项的方法，其中所述生物活性RNA是正义RNA，所述正义RNA包含与SEQ ID No 3的核苷酸序列具有至少94％序列同一性的至少19个核苷酸。

39.  权利要求30至35中任意一项的方法，其中所述生物活性RNA是双链RNA分子，所述双链RNA分子包含与SEQ ID No 3的核苷酸序列互补序列具有至少94％序列同一性的至少19个核苷酸以及与所述至少19个核苷酸的互补序列基本上相似的互补RNA链。

40.  权利要求37至39中任意一项的方法，其中所述19个核苷酸包含特异于如图2所示的D亚基因组Ghgluc1基因的至少一个核苷酸。

41.  权利要求39的方法，其中所述双链RNA是从包含SEQ ID No 15、SEQ ID No 16、SEQ ID No 20或SEQ ID No 21的核苷酸序列的前微小RNA加工的微小RNA。

42.  权利要求30至41中任意一项的方法，其中所述纤维是棉绒纤维。

43.  权利要求30至41中任意一项的方法，其中所述纤维是绒毛纤维。

44.  权利要求30至43中任意一项的方法，其还包括
(a)种植根据所述方法获得的植物；以及
(b)从所述产纤维植物分离纤维。

45.  减少产纤维植物的纤维长度的方法，所述方法包括下述步骤：将嵌合基因引入所述产纤维植物的细胞，其中，所述嵌合基因包含下述有效相连的DNA片段：
(a)根据权利要求1b、5、6或7的可植物表达的启动子；
(b)DNA区域，其编码β-1，3-葡聚糖酶蛋白质；以及
(c)3’末端区域，其包含在所述植物的细胞中有功能的转录终止和聚腺苷化信号。

46.  权利要求17的方法，其中编码所述β-1，3葡聚糖酶蛋白质的所述DNA区域编码与SEQ ID No 11或SEQ ID No 12的氨基酸序列具有至少95％序列同一性的氨基酸序列。

47.  权利要求30至46中任意一项所述的嵌合基因。

48.  产纤维植物的细胞，其包含权利要求47的嵌合基因。

49.  产纤维植物，其包含权利要求47的嵌合基因。

50.  权利要求49的产纤维植物，其中所述植物的纤维长度较之未经转化的对照植物有所增加。

51.  权利要求49或50中任意一项的产纤维植物，其中所述植物是棉花。

52.  权利要求51的棉花植物，其是陆地棉。

53.  权利要求49至52中任意一项的产纤维植物的种子，所述种子包含权利要求47的嵌合基因。

54.  根据权利要求30至46中任意一项的方法生产的纤维。

说明书

亚基因组特异性等位基因在棉花中的差异表达及其用途
发明领域
本发明涉及农业领域，更具体地，涉及分子生物学技术用于改造产纤维植物(特别是棉花植物)和/或加速对此类含纤维植物的培育的用途。本发明提供了改造纤维品质的方法和手段，例如，增加纤维长度(特别是棉绒纤维长度)或用于减少绒毛(fuzz)纤维的长度。本发明还提供了在多个棉花品种和相关祖先植物中鉴定与纤维长度相关的分子标记的方法。此外，本发明提供了具有纤维优先或纤维选择性表达模式的植物启动子。启动子还被暂时调节。
发明背景
棉花提供了很多用于纺织工业的高品质纤维。对棉花纤维特征进行修饰使其更好地适应工业需求，是通过经典方法或通过对棉花植物的基因组遗传改造来进行培育中的重大努力。
世界范围内种植的棉花中大约90％都是陆地棉(Gossypium hirsutumL.)，而海岛棉(Gossypium barbadense)占大约8％。和大多数开花植物一样，棉花的基因组被认为已经历了一个或多个多倍体化事件，并且已通过将分歧基因组在共有的核中连起来而进化过。棉花商业主要由两种“AD”四倍体物种的改进形式(陆地棉和海岛棉(Gossypium barbadense L.))占主导。四倍体棉花被认为在大约1-2百万年前于新世界(New World)形成，其通过母本旧世界(Old World)“A”基因组分类群类似的草棉(Gossypium herbaceum)和亲本新世界“D”基因组分类群类似的雷蒙德氏棉(Gossypium raimondii)或拟似棉(Gossypium gossypioides)之间的杂交形成。野生的A基因组二倍体和AD四倍体棉属(Gossypium)分类群产生可纺纤维。一种A基因组二倍体物种，树棉(Gossypium arboreum)，在亚洲仍被广为培育和培养。其密切相关并且可能的祖先——A基因组二倍体物种草棉(G.herbaceum)也产生可纺纤维。虽然D基因组二倍体的种子是被柔毛的(pubescent)，但是不能产生可纺纤维。还没有种植来自其它认可的二倍体棉属基因组(B、C、E、F和G)的分类群。人类强有力的定向选择一贯以来产生了具有比A基因组二倍体栽培种更高产量和/或品质特征的AD四倍体棉花。对陆地棉(G.hirsutum)(AADD)的选择性培育强调最大产量，而海岛棉(G.barbadense)(AADD)则以其纤维优秀的长度、强度和精细度见长(Jiang等人1998-Proc Natl Acad Sci US A.1998 April 14；95(8)：4419-4424)。
棉花纤维是在开花期或恰在开花之前从胚珠外珠被表皮启动的单细胞。之后，纤维迅速延伸大约3周，这之后它们转而进行强烈的次生细胞壁纤维素合成。纤维细胞仅在其基底末端(basal ends)与下面的种皮相互连接，溶质、水和其它分子经由胞间连丝或质膜流入。Ruan等人2001(Plant Cell 13：47-63)展示了纤维延伸期间胞间连丝的暂时闭合。Ruan等人2004(Plant Physiology-卷136：第4104-4113页)对纤维长度有所不同的不同棉花基因型的胞间连丝闭合持续时间进行了比较，并且发现胞间连丝闭合的持续时间和纤维长度之间有正相关。此外，显微证据表明，纤维基底处胼胝质沉积和降解与胞间连丝闭合和重开的时机相关。此外，纤维中的β-1，3-内切葡聚糖酶基因(GhGluc1)(令胼胝质降解)与纤维基底处胞间连丝的重开相关。
W02005/017157描述了在产纤维植物(例如棉花)中通过改变纤维延伸期(如Ruan等人2001所述)调节纤维长度的方法和手段。可通过干扰纤维细胞基底处胞间连丝中的胼胝质沉积来增加或减少纤维延伸期。
此外，通过遗传工程修饰纤维，以含有仅在纤维细胞中特异性表达或优先表达和/或仅从特定纤维发育阶段开始表达的启动子也是令人感兴趣的。
WO2004/018620涉及编码内源棉花几丁质酶及其下述启动子的经分离的核酸分子，所述启动子在次生壁沉积期间优先在纤维中表达。还公开了核酸分子编码的多肽，将经分离的核酸分子与启动子连接起来的DNA构建体，并入有DNA构建体的表达系统、宿主细胞、植物或植物种子。文献还涉及将经分离的启动子与第二DNA连接起来的DNA构建体以及含有所述DNA构建体的表达系统、宿主细胞、植物或植物种子。还公开了赋予针对昆虫和真菌的抗性、调节纤维的纤维素含量的方法以及在次生壁沉积期间优先在纤维中表达基因的方法。
具有下述备选启动子可能是有用的，所述启动子将在次生壁沉积期间驱动优先和/或强烈地在纤维中发生的基因表达，即，例如从次生壁沉积的启动到其终止或者例如从成熟阶段开始，强烈且持续地表达(例如，＞其最大活性的50％)。次生壁沉积的启动被定义为：由于含有超过40％(w/w)纤维素的新的壁物质的合成，任何细胞的干重/单位表面积开始增加或棉花纤维的干重/单位长度开始增加的时间。在陆地棉的棉花纤维的情况下，当棉花植物在典型条件下于温室中或田间(日间温度26-34℃，夜间温度20-26℃，光强度超过或等于1000爱因斯坦/m²/s，有足够的水和矿物质营养)生长时，这预计在14-17DPA之间发生。在陆地棉的棉花纤维的情况下，次生细胞壁形成的终点和成熟期的开始通常在35DPA左右。
此外，具有下述备选启动子可能是有用的，所述启动子将驱动仅在或优先在纤维中发生的基因表达，同时排除或最小化在其它组织中的表达。
下文在不同实施方案、实施例、图和权利要求中描述的本发明提供了用于调节纤维长度的改进方法和手段，这通过在特定时间点减少或增加纤维细胞基底处的胼胝质沉积来实现。下文描述的本发明还提供了纤维特异性和/或纤维优先性的启动子和启动子区域。
发明内容
在本发明的一种实施方案中，提供了纤维细胞优先性的启动子，其包含选自以下核苷酸序列的核苷酸序列：
a)核苷酸序列，其包含SEQ ID No 9的第2149位核苷酸至第2307位核苷酸的核苷酸序列；
b)核苷酸序列，其包含SEQ ID No 10的第3109位核苷酸至第3269位核苷酸的核苷酸序列；
c)核苷酸序列，其包含与a)或b)提到的任何核苷酸序列具有至少70％，优选至少80％，更优选至少90％，特别是至少95％序列同一性或者更特别是与a)或b)提到的任何核苷酸序列相同的核苷酸序列；或
d)核苷酸序列，其包含大约150bp至大约1000bp的DNA片段的核苷酸序列，所述DNA片段能在严谨条件下与具有a)、b)或c)提到的核苷酸序列的DNA片段杂交。
纤维细胞优先性启动子可包含SEQ ID No 9的第465位至第2307位的核苷酸序列；或SEQ ID No 9的第1374位至第2307位的核苷酸序列；或SEQ ID No 9的第1531位至第2307位的核苷酸序列；或SEQ ID No 10的第1397位至第3269位的核苷酸序列；或SEQ ID No 10的第2371位至第3269位的核苷酸序列；或SEQ ID No 10的第2718位至第3269位的核苷酸序列。
在另一实施方案中，本发明提供了下述纤维细胞优先性启动子区域，其包含本文所述的纤维细胞优先性启动子，还包含SEQ ID 9的第2308位核苷酸至第2409位核苷酸或第3270位至第3372位核苷酸的核苷酸序列。
在本发明的还一实施方案中，提供了包含下述有效相连的DNA区域的嵌合基因：
a)本文所述的纤维细胞优先性启动子
b)异源DNA区域，其编码感兴趣的生物活性RNA；以及
c)转录终止和聚腺苷化信号。
生物活性RNA可编码感兴趣的蛋白，例如，N-乙酰葡糖胺转移酶(优选地，NodC型的N-乙酰葡糖胺转移酶)、纤维素合酶、蔗糖合酶(优选地，C型的蔗糖合酶)、蔗糖磷酸合酶或β-1，3-内切葡聚糖酶。生物活性RNA还可以是抑制性RNA或沉默RNA，例如核酶、微小RNA、双链发夹RNA，特别是被靶向以下调内源棉花基因(例如，β-1，3-内切葡聚糖酶木聚糖合酶(cslF)、木葡聚糖合酶(cslD)或1，3-1，4葡聚糖合酶(cslC))表达的。
本发明还提供了包含此类嵌合基因的植物细胞和植物(例如棉花植物)及其种子。还提供了在其细胞中包含根据权利要求11至15中任意一项所述的嵌合基因的植物种子。
本发明还提供了在产纤维植物(例如棉花植物)的纤维细胞中优先表达生物活性RNA的方法，所述方法包括下述步骤：向植物的细胞提供根据本发明的嵌合基因，并种植所述植物。
在另一实施方案中，本发明涉及本发明的纤维特异性和/或纤维优先性启动子用于在产纤维植物(例如棉花植物)的纤维细胞中优先表达生物活性RNA的用途。
本发明还提供了：经分离的DNA分子，其包含编码下述蛋白的核苷酸序列，所述蛋白包含编码β-1，3-内切葡聚糖酶并且与SEQ ID No 11或SEQ ID No 12的氨基酸序列具有至少95％序列同一性、优选相同的氨基酸序列；经分离的DNA分子，其包含选自SEQ ID No 1、SEQ ID No 2、SEQID No 3和SEQ ID No 4的核苷酸序列，或经分离的DNA分子，其包含选自下述的核苷酸序列：SEQ ID No 9的第2410-2443位的核苷酸序列和SEQID No 9的第2556-3499位核苷酸序列或SEQ ID No 10的第3373至3406位核苷酸序列和SEQ ID No 10的第3501-4444位核苷酸序列。这些经分离的DNA分子可用于分离纤维细胞优先性启动子或启动子区域。
本发明还提供了分离纤维细胞优先性启动子区域的方法，所述方法包括下述步骤：
-鉴定编码下述RNA转录本的基因组片段，可从所述RNA转录本合成下述cDNA，所述cDNA包含SEQ ID No 1、SEQ ID No 2、SEQ ID No3或SEQ ID No 4或其功能等价物的核苷酸序列；
-分离编码下述蛋白的核苷酸序列上游的DNA区域，所述蛋白具有SEQ ID No 11或SEQ ID No 12或其功能等价物的氨基酸。
本发明还提供了通过此方法获得的纤维选择性启动子和启动子区域。
根据本发明的第二方面，提供了在产纤维植物中改变纤维性质的方法，特别是增加棉花植物的纤维长度，所述方法包括：向棉花植物的细胞中引入嵌合基因，所述嵌合基因包含下述有效相连的DNA元件：
(a)可植物表达的启动子，优选地，控制在纤维细胞中优先转录的可植物表达的启动子，例如，来自棉花的纤维特异性β微管蛋白启动子、来自棉花的纤维特异性肌动蛋白启动子、来自棉花的脂转移蛋白基因的纤维特异性启动子、来自棉花的扩展蛋白基因的启动子或来自棉花几丁质酶基因的启动子或本文所述的启动子；
(b)转录的DNA区域，当其被转录时，其产生下述生物活性RNA分子，所述分子能降低产纤维植物内源的β-1，3-内切葡聚糖酶编码基因的表达，所述β-1，3-内切葡聚糖酶涉及从胞间连丝去除胼胝质，以及
(c)3’末端区域，其包含在植物细胞中有功能的转录终止和聚腺苷化信号，
所述方法特征在于，仅内源β-1，3-内切葡聚糖酶编码基因的特定亚基因组等位基因的表达被下调。在一种优选的实施方案中，β-1，3-内切葡聚糖酶编码基因包含在棉花植物的D亚基因组中。包含在D亚基因组中的β-1，3-内切葡聚糖酶编码基因的可表征为：具有SEQ ID No 10第3407-3500位的核苷酸序列的内含子序列的存在；或可被表征为：翻译起始密码子下游大约326个核苷酸处(不包括翻译起始密码子)核苷酸序列AAGATC的存在。方便地，包含在D亚基因组中的β-1，3-内切葡聚糖酶编码基因可这样来表征：用具有SEQ ID No 5和SEQ ID No 6的核苷酸序列的寡核苷酸进行PCR扩增，再用AlwI限制性酶消化后，对大约538bp的片段和大约118bp的片段的鉴定。β-1，3-内切葡聚糖酶编码基因还可编码包含SEQ ID No 12的氨基酸序列的蛋白或者其中所述基因包含SEQ ID No 2的核苷酸序列。棉花植物可以是陆地棉(Gossypium hirsutum)。
生物活性RNA可以是反义RNA，其包含与SEQ ID No 3的核苷酸序列互补序列具有至少94％序列同一性的至少19个核苷酸，或者生物活性RNA可以是正义RNA，其包含与SEQ ID No 3的核苷酸序列具有至少94％序列同一性的至少19个核苷酸，或者生物活性RNA可以是双链RNA分子，其包含与SEQ ID No 3的核苷酸序列互补序列具有至少94％序列同一性的至少19个核苷酸和与所述至少19个核苷酸的互补序列基本上相似的互补RNA链。优选地，提到的19个核苷酸包含特异于图2所示的D亚基因组Ghgluc1基因的至少一个核苷酸。在根据本发明的另一实施方案中，双链RNA是从包含SEQ ID No 15、SEQ ID No 16、SEQ ID No 20或SEQID No 21的核苷酸序列的前微小RNA加工的微小RNA。
本发明还提供了减少产纤维植物的纤维长度的方法，所述方法包括下述步骤：将嵌合基因引入产纤维植物的细胞，其中，所述嵌合基因包含下述有效相连的DNA片段：
(a)根据权利要求1b、5、6或7的可植物表达的启动子；
(b)DNA区域，其编码β-1，3-葡聚糖酶蛋白，例如，具有下述氨基酸序列的蛋白，所述氨基酸序列与SEQ ID No 11或SEQ ID No 12的氨基酸序列具有至少95％的序列同一性；以及
(c)3’末端区域，其包含在植物细胞中有功能的转录终止和聚腺苷化信号。
本发明的另一实施方案涉及本文所述的嵌合基因或包含此类嵌合基因的产纤维植物或产纤维植物的细胞。
在又一实施方案中，本发明提供了根据本文所述的方法生产的纤维。

附图简述
图1：对来自陆地棉的亚基因组D和亚基因组A的β-1，3-内切葡聚糖酶基因的启动子序列的比对。亚基因组A的启动子的核苷酸序列(上面的序列)对应于SEQ ID No 9的第1460位至第2408位的核苷酸序列。亚基因组D的启动子的核苷酸序列(下面的序列)对应于SEQ ID No 10的第2372位至3372位的核苷酸序列。核苷酸序列的差异由灰色的盒表示。另一启动子区域中不具有对应核苷酸的核苷酸通过核苷酸序列中没有示出核苷酸的破折号来表示。两条启动子区域间的总体同源性为大约71％的序列同一性。
图2：对来自陆地棉的亚基因组D和亚基因组A的β-1，3-内切葡聚糖酶基因的编码区域(没有内含子)的比对。亚基因组A等位基因的编码区域的核苷酸序列(上面的序列)对应于SEQ ID No 9的第2410位至2443位和第2556-3499位的核苷酸序列。亚基因组D等位基因的编码区域的核苷酸序列(下面的序列)对应于SEQ ID No 10的第3373位至3406位和第3501-4444位的核苷酸序列。核苷酸序列的差异由灰色的盒表示。另一启动子区域中不具有对应核苷酸的核苷酸通过核苷酸序列中没有示出核苷酸的破折号来表示。两条启动子区域间的总体同源性为大约97％的序列同一性。
图3：对来自陆地棉的亚基因组D和亚基因组A的β-1，3-内切葡聚糖酶基因的内含子序列的比对。上面的序列对应于亚基因组A等位基因内含子的核苷酸序列，而下面的序列对应于亚基因组D等位基因内含子的核苷酸序列。
图4：对亚基因组A等位基因(上面的序列，对应于SEQ ID No 11)和亚基因组D等位基因(下面的序列，对应于SEQ ID No 12)编码的β-1，3-内切葡聚糖酶的氨基酸序列的比对。
图5：对SEQ ID No 1至4的从第201至211位核苷酸的核苷酸序列的比对。β-1，3-内切葡聚糖酶基因的仅亚基因组A等位基因核苷酸序列中存在的Alw1限制性酶识别位点被下划线并以斜体示出。
图6：纤维生长曲线(图A)与β-1，3-内切葡聚糖酶基因(GhGluc1)(图B)之间的关联。来自陆地棉的(发育中)纤维的cDNA文库的DNA被提取并均衡(equalized)。使用寡核苷酸引物SE002和SE003(SEQ IDNo 5和6)来扩增PCR片段，用AlwI来消化。针对A-基因组变体的PCR扩增产物产生了3条片段(479bp+118bp+59bp)，而针对D-基因组变体的仅产生了2条片段(538bp+118bp)。
图7：通过RT-PCR，对棉花叶、根和茎中GhGluc1的表达分析。对从棉花叶、根和茎提取的RNA进行RT-PCR分析，以检测葡聚糖酶1或蛋白质磷酸酶2A(pp2A)的表达。用来自Invitrogen的SuperScript第一链合成系统(SuperScript First-Strand Synthesis System)来进行第一链cDNA合成。道1：100bp梯度；道2：棉花叶RNA样品+Gluc1特异性引物+逆转录酶；道3：棉花叶RNA样品+Gluc1特异性引物-逆转录酶；道4：棉花根RNA样品+Gluc1特异性引物+逆转录酶；道5：棉花根RNA样品+Gluc1特异性引物-逆转录酶；道6：棉花茎RNA样品+Gluc1特异性引物+逆转录酶；道7：棉花茎RNA样品+Gluc1特异性引物-逆转录酶；道8：基因组DNA(Fibermax 400ng)+Gluc1特异性引物；道9：100bp梯度；道10：棉花叶RNA样品+pp2A特异性引物+逆转录酶；道11：棉花叶RNA样品+pp2A特异性引物-逆转录酶；道12：棉花根RNA样品+pp2A特异性引物+逆转录酶；道13：棉花根RNA样品+pp2A特异性引物-逆转录酶；道14：棉花茎RNA样品+pp2A特异性引物+逆转录酶；道15：棉花茎RNA样品+pp2A特异性引物-逆转录酶；道16：100bp梯度；道17：阳性对照RNA(随试剂盒提供的)。
实施方式详述
本发明基于出人意料的发现：纤维特异性的β-1，3-内切葡聚糖酶基因(GhGluc1)的A和D亚基因组特异性等位基因的表达时机至少在陆地棉中有所不同。虽然D亚基因组特异性等位基因表达的启动与迅速延伸期(开花后大约14至17天(下文中称为“DPA”))相关联，但A亚基因组的表达的启动却延迟到纤维成熟后期(大约35-40DPA)开始，这取决于生长条件。
因此，在一个方面，本发明涉及对新颖的纤维特异性启动子的鉴定，所述启动子在来自迅速延伸期(rapid elongation phase)末的纤维细胞或来自纤维成熟期启动的纤维细胞中优先表达。此类启动子具有下述用处，例如，用于产生新颖生物分子的嵌合基因(例如编码增强的XET、纤维素结合结构域(CBD)、根肿胀(RSW)突变体基因、着色、塑料、纤维素消化性、新颖的细胞壁复合物/性质)在纤维发育后期的表达。启动子还可用于指导20、30、40DPA时纤维中的基因表达；例如，在棉花纤维发育后期(20、30、40DPA)几丁质的产生，或者用于40DPA时纤维中的基因表达，例如，在棉花纤维发育的非常后期(40DPA)几丁质的产生。根据本发明的启动子还可用于指导CesA基因在40DPA的表达，用于增强的纤维素生物合成以及增强的纤维性质，或用于产生内源棉花基因的被指导为阶段特异性沉默的生物活性RNA，例如，沉默β-1，3-内切葡聚糖酶，以使得纤维生长更长。启动子还可用于嵌合基因(编码例如胼胝质合酶)的阶段特异性表达，以改变纤维性质和品质。
在另一个方面，本发明涉及对纤维特异性β-1，3-内切葡聚糖酶基因的一种亚基因组特异性等位基因表达的沉默，特别是沉默D-亚基因组特异性等位基因，以防止胼胝质降解，以及由此增加迅速纤维延伸期和纤维长度，例如，棉花中的，特别是陆地棉中的。
根据本发明第一方面的一种实施方案，本发明提供了纤维特异性和/或纤维优先性启动子片段，所述片段可分离自棉花，特别是陆地棉物种，并且，其存在于编码纤维特异性β-1，3-内切葡聚糖酶(具有包含SEQ ID No11、12、7或8的氨基酸序列或其变体的氨基酸序列)的核酸序列的上游。
在本文中使用时，术语“启动子”指在转录起始期间被DNA依赖性的RNA聚合酶识别并结合(直接或间接)的任何DNA。启动子包括转录起始位点和用于转录起始因子和RNA聚合酶的结合位点，启动子可包含多种其它位点(例如增强子)，这些位点上可结合基因表达调控蛋白。
术语“调控区域”在本文中使用时表示参与驱动转录和控制(即调控)给定DNA序列(例如编码蛋白或多肽的DNA)转录的水平和时机的任何DNA。例如，5’调控区域(或“启动子区域”)是位于编码序列上游(即，5’)的DNA序列，其包含启动子和5’非翻译前导序列。3’调控区域是位于编码序列下游(即3’)的DNA序列，其包含合适的转录3’末端形成(和/或调控)信号，包括一个或多个聚腺苷化信号。
术语“基因”表示包含下述DNA区域(“转录的DNA区域”)的任何DNA片段，所述DNA区域在合适调控区域(例如可植物表达的启动子区域)控制下在细胞中转录为RNA分子(例如mRNA)。基因由此可包含若干有效相连的DNA片段，例如启动子、5’非翻译前导序列、编码区域和3’非翻译区域(包含聚腺苷化位点)。内源植物基因是在植物物种中天然发现的基因。嵌合基因是在植物物种中正常情况下不会发现的任何基因，或者任何这样的基因：其中启动子天然状态下并不与转录的DNA区域(“异源”DNA区域)的部分或全部或基因的至少一个其它调控区域相连。
术语“基因表达”指这样的过程，其中，在调控区域(特别是启动子)控制下的DNA区域被转录为生物活性RNA，即，能与另一核酸相互作用或能被翻译为生物活性多肽或蛋白质的RNA。当基因表达的终产物是生物活性RNA，例如反义RNA或核酶时，基因被说成是编码RNA的。当基因表达的终产物是功能活性或生物活性蛋白质或多肽的时候，基因就被说成是编码蛋白质的。
在关于根据本发明的DNA表达的方面，术语“纤维选择性”或“纤维细胞选择性”或“纤维特异性”或“纤维细胞特异性”指：DNA在植物(例如棉花植物)纤维细胞中的高度特异性表达(对于实际目的而言)(“纤维细胞-选择性”)。换句话说，DNA在不同于纤维细胞的组织中的转录水平低于检测或非常低(相对每微克总RNA低于大约0.2皮克(picogrammes))。
在关于根据本发明的DNA表达的方面，术语“纤维优先性”或“纤维细胞优先性”指这样的表达模式，其中DNA主要在纤维细胞或纤维中表达，但是可在植物的其它组织中鉴定到表达。优选地，在纤维细胞中的表达是在其它组织中的表达的大约2至大约10倍高。
SEQ ID No 9和SEQ ID No 10的核苷酸序列代表分别编码A亚基因组和D亚基因组的纤维选择性β-1，3-内切葡聚糖酶的基因组DNA分子的核苷酸序列。SEQ ID No 9的转录起始位点已被确定为第2308位，而SEQ IDNo 10的转录起始位点已被确定为第3270位。因此，在本发明的一种实施方案中，提供了具有SEQ ID No 9的第1位核苷酸至第2307或2308位核苷酸的核苷酸序列的纤维选择性启动子；在本发明的另一实施方案中，提供了具有SEQ ID No 10的第1位核苷酸至第3269或3270位核苷酸的核苷酸序列的纤维选择性启动子。
SEQ ID No 9的核苷酸序列的翻译起始位点已被确定为位于第2410至2412位的ATG密码子。编码β-1，3-内切葡聚糖酶的A亚基因组等位基因的纤维选择性启动子的5’非翻译区域因此具有SEQ ID No 9的第2308位核苷酸至第2409位核苷酸的核苷酸序列。A亚基因组等位基因的纤维选择性启动子区域因此是包含SEQ ID No 9的第1至2409位核苷酸的启动子区域。
类似地，SEQ ID No 10的核苷酸序列的翻译起始位点已被确定为位于第3373至3375位的ATG密码子。编码β-1，3-内切葡聚糖酶的D亚基因组等位基因的纤维选择性启动子的5’非翻译区域因此具有SEQ ID No 10的第3270位核苷酸至第3372位核苷酸的核苷酸序列。D亚基因组等位基因的纤维选择性启动子区域因此是包含SEQ ID No 10的第1至3372位核苷酸的启动子区域。
对SEQ ID No 9和SEQ ID No 10的纤维选择性启动子区域的比对(图1)揭示了ATG翻译起始密码子上游大约1000个核苷酸的核苷酸序列间的一般序列同源性，特别是在ATG翻译起始密码子上游大约150个核苷酸的区域中。因此，在本发明的另一实施方案中，提供了这样的纤维选择性启动子，其包含SEQ ID No 9的第2149位核苷酸至第2307位核苷酸的核苷酸序列，或包含SEQ ID No 10的第3109位核苷酸至第3269位核苷酸的核苷酸序列。
不言而喻，启动子或启动子区域可被包含在较大的核苷酸序列中。纤维细胞选择性启动子区域因此可被确定为编码SEQ ID No 9或10示出的mRNA编码的蛋白的第一个氨基酸的密码子上游(即，位于其5’)的区域。此类启动子区域可以至少在起始密码子上游大约400至500bp，至少大约1000bp，至少1200bp，至少大约1300bp或者至少大约1500至2000bp。为方便而言，优选地，此类启动子区域不延伸超过起始密码子上游大约3000至5000bp。片段大小可部分由方便的限制性位点的存在来确定。例如，对于编码β-1，3-内切葡聚糖酶的A亚基因组等位基因的纤维选择性启动子区域而言，可以方便地克隆大约1945bp的片段(SEQ ID No 9的第465位核苷酸至第2409位核苷酸)。合适的限制性酶的存在允许方便地产生大约1036bp(SEQ ID No 9的第1374核苷酸至第2409位核苷酸)或大约879bp(SEQ ID No 9的第1531位核苷酸至第2409位核苷酸)的启动子区域。对于编码β-1，3-内切葡聚糖酶的D亚基因组等位基因的纤维选择性启动子区域而言，可以方便地克隆大约1976bp的片段(SEQ ID No 10的第1397位核苷酸至第3372位核苷酸)。合适的限制性酶的存在允许方便地产生大约1002bp(SEQ ID No 10的第1397核苷酸至第3372位核苷酸)或大约655bp(SEQ ID No 10的第2371位核苷酸至第3372位核苷酸)的启动子区域。
还应当清楚，可以从其它棉花植物或棉花祖先植物中分离出等价的纤维选择性启动子或启动子区域。为达到此目的，可使用本文所述的启动子片段作为探针，鉴定下述其它植物中在严谨杂交条件下杂交的核苷酸序列，从而从其它棉花植物，例如海岛棉(包括所谓的PIMA品种)或从其它品种分离启动子片段。
“严谨杂交条件”在本文中使用时表示：如果在探针和靶序列之间有至少95％以及优选至少97％的序列同一性，那么一般来说将发生杂交。严谨杂交条件的例子是：在包含50％甲酰胺、5x SSC(150mM NaCl、15mM柠檬酸三钠)、50mM磷酸钠(pH 7.6)、5x Denhardt’s溶液、10％硫酸葡聚糖和20μg/ml变性的经剪切载体DNA(例如鲑精DNA)的溶液中过夜孵育，接着在0.1x SSC中于大约65℃洗杂交支持物(support)。其它杂交和洗涤条件是公知的，并且在Sambrook等人，Molecular Cloning：ALaboratory Manual，第二版，Cold Spring Harbor，NY(1989)，特别是第11章中有例示。
从其它棉花植物或棉花祖先植物中分离的这些等价纤维选择性启动子可代表变体启动子，其中一个或多个核苷酸已通过取代、缺失或插入而被替代。根据本发明的变体纤维选择性启动子还可合成产生。图1显示了对来自陆地棉的A和D亚基因组的纤维选择性启动子的比对和变化位置，其中核苷酸序列可明显改变，而不会对纤维选择性转录起始能力造成显著影响，这用灰色的盒来示出。从图1及其图例，还可明显看出，两条示例纤维选择启动子片段间的总体序列同一性可低至大约71％序列同一性。
因此，在本发明的另一实施方案中，提供了这样的纤维选择性启动子和启动子区域，其包含与本文所述的纤维选择性启动子和启动子区域具有至少70％或至少80％或至少90％或至少95％的序列同一性的核苷酸序列。
就本发明的目的而言，两条相关核苷酸或氨基酸序列的“序列同一性”(表示为百分比)指两条被最优对齐的序列中具有相同残基的位置的数量(x100)除以比较的位置数量。空位(即，比对中，在一条序列中存在残基而在另一条中不存在残基的位置)被认为是具有不相同残基的位置。对两条序列的比对是通过Needleman和Wunsch算法(Needleman和Wunsch1970)来进行的。可使用标准软件程序(例如GAP，其是Wisconsin PackageVersion 10.1(Genetics Computer Group，Madision，Wisconsin，USA)的一部分)，使用缺省计分矩阵(其中空位产生罚分为50和空位延伸罚分为3)，来方便地进行上述计算机辅助的序列比对。
应当清楚，参照相应DNA分子的核苷酸序列来定义RNA分子的核苷酸序列时，核苷酸序列中的胸腺嘧啶(T)都应当被替换为尿嘧啶(U)。提到RNA还是DNA分子将从本申请的上下文中清楚可见。
可以通过将此类DNA分子与编码易于计分的标记的编码区域(例如，β-葡糖醛酸糖苷酶基因)有效相连，将此类嵌合基因引入产纤维植物，并分析标记在纤维细胞中的表达模式(优选地，纤维发育期间)(与标记在植物其它部分中的表达模式相比较)，来方便地测试鉴定或产生的启动子或启动子区域的纤维选择性表达能力。
不言而喻，本发明的启动子和启动子区域还可包含已知能提高转录效率的其它元件，例如增强子、内含子等。
此外，示例的纤维选择性启动子区域的示例性5’UTR序列在核苷酸序列上相当相似，预计5’UTR序列是可互换的。
本发明还包括下述DNA分子，其包含与编码生物活性RNA、肽或蛋白质的一个或多个异源区域有效相连的本发明的纤维选择性启动子或启动子区域。本发明的启动子可用于表达任何期望的异源编码区域。
可使用本发明的启动子来表达的其它编码蛋白的DNA分子的例子包括但不限于：同源和异源的纤维素合酶(CesA基因)，天然和突变形式的均可(Arioli等人，″Molecular Analysis of Cellulose Biosynthesis inArabidopsis，″Science，279：717-720(1998)；Holland等人，″AComparative Analysis of the Plant Cellulose Synthase(CesA)GeneFamily，″Plant Physio.，123：1313-1324(2000))；可调节纤维素的碳分配的基因(Delmer，″Cellulose Biosynthesis in Developing Cotton Fibers″在：A.S.Basra(编著)，Cotton Fibers：Developmental Biology QuRlityImprovement，and Textile Processing，The Haworth Press，New York，第85-112页(1999)中)，例如蔗糖合酶(Amor等人，″AMembrane-Associated Form of Sucrose Synthase and Its Potential RoleSynthesis of Cellulose and Callose in Plants，″Proc.Natl.Acad.Sci.USA，92：9353-9357(1995))、蔗糖磷酸合酶(Haigler等人，″Transgenic CottonOver-Expressing Sucrose Phosphate Synthase Produces Higher QualityFibers with Increased Cellulose Content and Has Enhanced Seed CottonYield″Abstract 477.在：Proceedings of Plant Biology 2000，7月15-19，SanDiego，CA.American Society of Plant Physiologists，Rockville，MD，(2000))、UDPG-焦磷酸化酶(Waffler和Meier，″Enzyme Activities inDeveloping Cotton Fibers，″Plant Phvsiol.Biochem.32：697-702(1994))、无机焦磷酸酶(pyrophosphosphatase)(Geigenberger等人，″Overexpression of Pyrophosphatase Leads to Increased SucroseDegradation and Starch Synthesis，Increased Activities of Enzymes forSucrose-Starch Interconversions，and Increased Levels of Nucleotides inGrowing Potato Tubers，″Planta，205：428-437(1998))、己糖激酶(Smeekens，″Sugar Regulation of Gene Expression″Curr.Op.Plant Biol.，1：230-234(1998))和转化酶(Sturm和Tang，″The Sucrose-CleavingEnzymes of Plants are Crucial for Development，Growth，and CarbonPartitioning，″Trends Plant Sci.，4：401-407(1999))；可能影响纤维素的分子性质和生物物理性质(包括多聚化程度、结晶程度、微晶大小和微原纤维定向)的基因(即，编码蛋白(包括共结晶蛋白聚合物或纤维素结合结构域以及多糖合成和其它酶)的基因)(Delmer，″Cellulose Biosynthesis：Exciting Times for a Difficult Field of Study，″Ann.Rev.Plant Physio.Mol.Biol.50：245-276(1999)；Delmer，″Cellulose Biosynthesis in DevelopingCotton Fibers.在：A.S.Basra(编著)，Cotton Fibers：DevelopmentalBiology，Quality Improvement，and Textile Processing，The Haworth Press，New York，第85-112页(1999)；Hsieh，″Structural Development of CottonFibers.在：A.S.Basra(编著)，Cotton Fibers：Developmental Biology，Quality Improvement，and Textile Processing，The Haworth Press，NewYork，第137-166页(1999))；能延长延伸生长和/或改变次生壁沉积程度或时机的转录因子，例如MYB基因(Wilkins和Jernstedt，″MolecularGenetics of Developing Cotton Fibers.在：A.S.Basra(编著)，CottonFibers：Developmental Biology.Quality Improvement，and TextileProcessing，The Haworth Press，New York，第231-270页(1999))；影响植物激素合成和改变纤维性质的基因(John，″Genetic EngineeringStrategies for Cotton Fiber Modification.在：A.S.Basra(编著)，CottonFibers：Developmental Biology，Quality Improvement，and TextileProcessing，The Haworth Press，New York，第271-289页(1999))；针对细胞骨架元件或细胞骨架相关蛋白(可能影响纤维性质)的基因(Seagull，″Cytoskeletal Involvement in Cotton Fiber Growth and Development，″Micron，24：643-660(1993))；用于脂类合成或对可能改变膜性质以及由此改善纤维品质(包括在胁迫环境条件下)的酶进行修饰的基因(Haigler，″The Crystallinity of Cotton Cellulose in Relation to CottonImprovement，″Proc.Cotton Fiber Cellulose：Structure.Function andUtilization Conference，National Cotton Council of America：Memphis，TN.，第211-225页(1992))；可能通过增加或减少的活性来延长或增加次生壁沉积期间的延伸生长的酶，例如，木葡聚糖内转移酶、过氧化物酶、扩展蛋白或液泡ATP酶(Wilkins和Jernstedt，″Molecular Genetics ofDeveloping Cotton Fibers.在：A.S.Basra(编著)，Cotton Fibers：Developmental Biology Quality Improvement，and Textile Processing，TheHaworth Press，New York，第231-270页(1999))；针对可能留在纤维网眼(lumen)中或整合进细胞壁以增加纤维强度或改变其纺织性质的蛋白或塑料聚合物的基因(John，″Genetic Engineering Strategies for CottonFiber Modification，″在：A.S.Basra(编著)，Cotton Fibers：DevelopmentalBiology.Quality Improvement，and Textile Processing，The Haworth Press，New York，第271-289页(1999)；Guda等人，″Hyperexpression of anEnvironmentally Friendly Synthetic PolymerGene，″BiotechnologY Letters，17：745-750(1995))；针对植物细胞壁基质生物合成酶或其调控蛋白的基因，使得其它碳水化合物可以被整合进细胞壁并且改变纤维性质(Haigler，″The Relationship Between Polymerization and Crystallization inCelluloseBiogenesis，″在C.H.Haigler和P.Weimer编著，Biosynthesis andBiodegradation of Cellulose，New York：Marcel Dekker，第99-124页(1991)；Andrawis等人，″Cotton Fiber Annexins：A Potential Role in theRegulation of Callose Synthase，″Plant J.，3：763-772(1993))；针对单宁、木栓质或染料等分子的、可能向纤维赋予有价值的颜色的基因(Ryser，″Cotton Fiber Initiation and Histodifferentiation，″在：A.S.Basra(编著)，Cotton Fibers：Developmental Biology.Quality Improvement，and TextileProcessing，The Haworth Press，New York，第1-46页(1999))；针对角质、木栓质或蜡等分子的、可能改变棉花纤维的吸收性和强度的基因(May，″Genetic Variation in Fiber Quality，″在：A.S.Basra(编著)，Cotton Fibers：Developmental Biology，Quality Improvement，and TextileProcessing，The Haworth Press，New York，第183-230页(1999)；Ryser，″Cotton Fiber Initiation and Histodifferentiation，″在：A.S.Basra(编著)，Cotton Fibers：Developmental Biology.Quality Improvement，and TextileProcessing，The Haworth Press，New York，第1--46(1999))；以及针对信号转导分子的基因，例如Rac，其可调节纤维发育阶段的转变(Delmer等人，″Genes Encoding Small GTP-Binding Proteins Analogous toMammalian rac are Preferentially Expressed in Developing Cotton Fibers，″Mol.Gen.Genet.，248：43-51(1995))。
特别优选的蛋白编码区域是N-乙酰葡糖胺合酶编码区域，如例如WO2006/136351所述，或蔗糖合酶基因，如WO2002/45485或EP06015433.3(通过引用并入本文)所述。
生物活性RNA还可编码所谓的反义RNA、正义RNA、双链RNA，如WO 99/53053所述，或可编码合成的微小RNA分子，其是根据本领域公知的规则，将所述分子设计来下调产纤维植物细胞中包含的其它基因或者甚至是以产纤维植物为食的病原体或有害生物中包含的基因的表达。
本发明还提供了在产纤维植物的纤维细胞中特异性表达蛋白质或生物活性RNA的方法，所述方法包括下述步骤：将包含本文所述的纤维选择性启动子或启动子区域(与编码生物活性RNA分子的转录的DNA区域有效相连)的DNA分子引入产纤维植物的纤维细胞。
在本发明的第二个方面，提供了在产纤维植物中改变纤维的纤维长度的方法，这是通过特异性改变编码纤维选择性的β-1，3-内切葡聚糖酶的亚基因组等位基因之一的表达来实现的。如上文所述，对表达的这种改变可防止或增强在纤维细胞基底处堵住胞间连丝的胼胝质的降解，由此增加或减少迅速纤维延伸期以及纤维长度，例如在棉花中，特别是在陆地棉中。对纤维长度的调节还可影响纤维的强度和其它品质或性质。因此，本发明还涉及通过本文所述的方法来改变纤维性质或纤维的品质。
在本发明第二方面的一种实施方案中，提供了增加棉花植物(特别是陆地棉植物)纤维长度的方法，这通过向所述棉花植物的细胞中引入嵌合基因来实现，其中，所述嵌合基因包含下述有效相连的DNA元件：
a.可植物表达的启动子
b.转录的DNA区域，当其被转录时，其产生下述生物活性RNA分子，所述分子能降低D基因组中包含的纤维选择性β-1，3-内切葡聚糖酶的表达，以及
c.3’末端区域，其包含在所述植物细胞中有功能的转录终止和聚腺苷化信号。
如本发明的发明人所揭示的，棉花植物纤维细胞中β-1，3-内切葡聚糖酶的表达增加(以前被报道为与胞间连丝的重开相关，以及标志着迅速纤维延伸期的末尾)是特异性地由于D亚基因组特异性等位基因在该时间的表达启动导致的，而A亚基因组特异性等位基因仅在纤维发育的后期表达，至少在陆地棉中是这样。因此，WO 2005/017157所述的方法可被进一步改进(至少针对陆地棉而言)，这通过特异性地改变编码纤维选择性β-1，3-内切葡聚糖酶的特定亚基因组等位基因的表达模式来实现。
如本文所述，可以以多种方式来识别编码纤维选择性β-1，3-内切葡聚糖酶的D亚基因组特异性等位基因。从不同棉花植物的D亚基因组以及从具有D样基因组的二倍体棉花祖先植物分离编码纤维选择性β-1，3-内切葡聚糖酶的(基因组)核酸揭示：A-亚基因组等位基因中的内含子在内含子序列中具有大约18nt长的插入(见图3)，而其在D-亚基因组等位基因的内含子序列中不存在。
此外，对编码区域(cDNA；图2)的核苷酸序列和被编码的氨基酸序列(图4)的比较揭示了A和D-亚基因组等位基因和被编码的蛋白质间的大量特征性不同，这由图中灰色的盒示出。
非常方便地，可以通过多态性来区分A和D亚基因组等位基因，这导致：A亚基因组等位基因的基因组克隆中翻译起始密码子下游大约326个核苷酸处存在AlwI限制性酶识别位点，而在编码纤维选择性β-1，3-内切葡聚糖酶的D亚基因组等位基因中并不存在。用于区分A和D亚基因组等位基因(都在基因组DNA或cDNA水平上)的一种可能的方法是PCR扩增，其中使用cDNA或基因组DNA作为模板，并且使用具有SEQ ID No 5和6的核苷酸序列的寡核苷酸作为引物，之后再用AlwI限制性酶来消化扩增的PCR产物。对于两种亚基因组等位基因而言，通过PCR产生的产物均为大约656bp，当PCR产物产生自D-亚基因组等位基因模板时，其被切割为538和118bp的片段，而扩增自A-亚基因组等位基因模板的通过PCR产生的产物被切割为分别为476bp、118bp和59bp的三条片段。118bp的存在用作为内对照，用于限制性酶反应正确发挥功能。
本领域可获得若干种方法，来生产沉默RNA分子，即，当表达的时候，降低特定基因或基因的组的表达的RNA分子，包括所谓的“正义”或“反义”RNA技术。
因此，在一种实施方案中，编码抑制性RNA分子的嵌合基因基于所谓的反义技术。换句话说，嵌合基因的编码区域包含纤维选择性β-1，3-内切葡聚糖酶的核苷酸序列的互补序列的至少19或20个连续核苷酸的核苷酸序列。可通过将包含来自纤维选择性β-1，3-内切葡聚糖酶编码基因的至少19或20个核苷酸的DNA片段(按照本申请别处所述分离或鉴定的)以反方向与可植物表达的启动子和3’末端形成区域(涉及转录终止和聚腺苷化)有效相连，来构建此类嵌合基因。
在另一实施方案中，编码抑制性RNA分子的嵌合基因基于所谓的共阻遏技术。换句话说，嵌合基因的编码区域包含纤维选择性β-1，3-内切葡聚糖酶基因的核苷酸序列的至少19或20个连续核苷酸的核苷酸序列。可通过将包含来自纤维选择性β-1，3-内切葡聚糖酶基因的至少19或20个核苷酸的DNA片段以正向与可植物表达的启动子和3’末端形成区域(涉及转录终止和聚腺苷化)有效相连，来构建此类嵌合基因。
上述嵌合基因降低纤维选择性β-1，3-内切葡聚糖酶基因表达的效率可被进一步增强，这通过将导致异常的、未聚腺苷化的抑制性RNA分子表达或者导致抑制性RNA分子驻留在细胞核中的DNA元件包括进去来实现。适于该目的的一种此类DNA元件是编码自剪接核酶的DNA区域，如WO 00/01133(通过引用并入本文)所述。适于该目的的另一此类DNA元件是编码RNA核定位或驻留信号的DNA区域，如作为WO03/076619公开的PCT/AU03/00292(通过引用并入本文)所述。
下调感兴趣基因表达的一种方便并且非常有效的方法使用了所谓的双链RNA(dsRNA)或干扰RNA(RNAi)，如例如WO99/53050(通过引用并入本文)所述。在该技术中，RNA分子被引入植物细胞，其中所述RNA分子能在至少大约19至大约21个核苷酸上形成双链RNA区域，并且其中，该双链RNA区域的一条链在核苷酸序列上与靶基因大致相同(“正义区域”)，而另一条链在核苷酸序列上与靶基因的互补序列或与正义区域的互补序列大致相同(“反义区域”)。预计对于靶基因表达的沉默而言，19个连续核苷酸序列的核苷酸序列可具有一处错配，或者正义和反义区域可有一个核苷酸不同。为实现对此类RNA分子或编码嵌合基因的构建，可以使用WO 02/059294描述的载体。
因此，在本发明的一种实施方案中，提供了用于增加产纤维植物(例如棉花)的纤维长度的方法，所述方法包括下述步骤：将嵌合基因引入产纤维植物的细胞，其中所述嵌合基因包含下述有效相连的DNA元件：
(a)可植物表达的启动子，优选地，控制优先在纤维细胞中转录的可植物表达的启动子；
(b)转录的DNA区域，当其被转录时，其产生下述双链RNA分子，所述分子能特异性降低纤维选择性β-1，3-内切葡聚糖酶亚基因组等位基因的表达，且所述RNA分子包含第一和第二RNA区域，其中，
i)所述第一RNA区域包含与所述亚基因组等位基因的核苷酸序列具有至少大约94％序列同一性的至少19个连续核苷酸的核苷酸序列；
ii)所述第二RNA区域包含与所述第一RNA区域的至少19个连续核苷酸互补的核苷酸序列；
iii)所述第一和第二RNA区域能碱基配对，以在所述第一和第二区域的至少19个连续核苷酸之间形成双链RNA分子；以及
(c)3’末端区域，其包含在植物细胞中有功能的转录终止和聚腺苷化信号。
第一或第二RNA区域(正义或反义区域)的长度可从大约19个核苷酸(nt)至多达与参与胼胝质去除的内源基因的长度(以核苷酸计)相等的长度。正义或反义核苷酸序列的总长度因此可以是至少25nt，或者至少大约50nt，或者至少大约100nt，或者至少大约150nt，或者至少大约200nt，或者至少大约500nt。预计，正义或反义核苷酸序列的总长没有上限。但是就实际原因(例如，嵌合基因的稳定性)而言，预计正义或反义核苷酸序列的长度应当不超过5000nt，特别应当不超过2500nt，其可限于大约1000nt。
应当预计到，正义或反义区域的总长越长，这些区域和纤维选择性β-1，3-内切葡聚糖酶基因或其互补序列中相应序列之间的序列同一性的需求的严谨度就越低。优选地，感兴趣的核酸应当与相应靶序列具有至少大约75％的序列同一性，特别地，至少大约80％，更特别地，至少大约85％，相当特别地，大约90％，尤其是大约95％，更尤其大约100％，相当尤其地，与靶序列或其互补序列的相应部分相同。但是，优选地，感兴趣的核酸总是包括与靶核酸的相应部分具有100％序列同一性的大约19个连续核苷酸(特别地，大约25nt，更特别地，大约50nt，尤其大约100nt，相当尤其地，大约150nt)的序列。优选地，为计算序列同一性和设计相应的正义或反义序列，应当对空位数量最小化，特别是对于较短的正义序列来说。
根据本发明的编码dsRNA的嵌合基因可包含内含子，例如异源内含子，其位于例如正义和反义RNA区域间的间隔序列中(根据WO 99/53050(通过引用并入本文)的公开内容)。
对于本发明来说优选地，反义、正义或双链RNA分子包括的靶特异性基因序列包含至少一个，并且优选更多个特异于其表达将被下调的亚基因组等位基因的核苷酸。此类特异性核苷酸至少在图2中通过灰色的盒示出。
在优选的实施方案中，生物活性RNA被特异性改造，以下调纤维选择性的β-1，3-内切葡聚糖酶编码基因(GhGluc1)的D-亚基因组等位基因。在另一优选的实施方案中，生物活性RNA被特异性改造，以下调纤维选择性的β-1，3-内切葡聚糖酶编码基因(GhGluc1)的A-亚基因组等位基因。
使用合成的微小RNA用于下调特定基因在植物细胞中的表达，提供了靶基因的非常高的序列特异性，因此允许方便地在密切相关的等位基因之间辨别其表达将被下调的靶基因。
因此，在本发明的另一实施方案中，生物活性RNA或沉默RNA或抑制性RNA分子可以是被设计、合成和/或调节来靶向产纤维植物(例如棉花植物)中的特异性亚基因组等位基因并导致其切割的微小RNA分子，所述等位基因优选是纤维选择性β-1，3-内切葡聚糖酶编码基因的D-亚基因组等位基因。已经描述了多种方法，用于产生和使用针对特定靶基因的miRNA(包括但不限于Schwab等人，(2006，Plant Cell，18(5)：1121-1133)，WO2006/044322，WO2005/047505，EP 06009836，它们通过引用并入本文)。通常，对存在的miRNA骨架在靶基因识别部分进行修饰，使得产生的miRNA现在能指导RISC复合物切割从靶核酸转录的RNA分子。可对miRNA骨架进行修饰或合成，使得miRNA现在包含编码纤维选择性β-1，3-内切葡聚糖酶的核苷酸序列(例如序列表中列出的序列)的亚基因组等位基因之一的21个连续核苷酸，并且允许根据下文所述的规则的错配。
因此，在一种实施方案中，本发明提供了下调表达或增加植物对于不利生长条件的抗性的方法，所述方法包括下述步骤：
a.将嵌合基因引入所述植物的细胞，所述嵌合基因包含下述有效相连的DNA区域：
i.可植物表达的启动子；
ii.DNA区域，当其引入植物细胞并在其中转录时，所述区域被加工为miRNA，其中所述miRNA能识别并指导对植物的纤维选择性β-1，3-内切葡聚糖酶编码基因的一种亚基因组等位基因而非另一种亚基因组等位基因的mRNA的切割；以及
iii.任选地，涉及转录终止和聚腺苷化的3’DNA区域。
提到的被加工为miRNA的DNA区域可包含与纤维选择性β-1，3-内切葡聚糖酶编码基因的至少21个连续核苷酸的核苷酸序列基本上互补的核苷酸序列，其中允许下述错配中的一处或多处：
a.miRNA 5’末端的核苷酸与RNA分子中相应核苷酸序列间的一处错配；
b.miRNA第1位至第9位核苷酸中任意一个与RNA分子中相应核苷酸序列之间的一处错配；
c.miRNA的第12位至第21位核苷酸中的任意一个与RNA分子中相应核苷酸序列之间的三处错配，但不超过两处连续错配。
在本文中使用时，“miRNA”是长度为大约20至22个核苷酸的RNA分子，其可被载入RISC复合物中，并指导对另一RNA分子的切割，其中，这另一RNA分子包含与miRNA分子的核苷酸序列基本上互补的核苷酸序列，其中可存在下述错配中的一处或多处：
a.所述miRNA 5’末端的核苷酸与靶RNA分子中相应核苷酸序列间的一处错配；
b.所述miRNA第1位至第9位核苷酸中任意一个与靶RNA分子中相应核苷酸序列之间的一处错配；
c.所述miRNA的第12位至第21位核苷酸中的任意一个与靶RNA分子中相应核苷酸序列之间的三处错配，但不超过两处连续错配。
d.在miRNA的第10和第11位不允许错配(所有miRNA位置都是从miRNA分子5’末端开始示出的)。
miRNA是通过蛋白质(例如DCL蛋白质)从“前miRNA”分子来加工的，所述蛋白是存在于任何植物细胞中并被装载到RISC复合物上的，其可在那儿指导对靶RNA分子的切割。
在本文中使用时，“前miRNA”分子是大约100至大约200个核苷酸的RNA分子，优选地，大约100至大约130个核苷酸，其可采用下述二级结构，所述二级结构包含双链RNA茎和单链RNA环，还在双链RNA茎中包含miRNA的核苷酸序列(及其互补序列)。优选地，miRNA及其互补序列位于miRNA双链RNA茎游离末端的大约10至大约20个核苷酸处。单链环区域的序列和长度并非关键，其可相当大程度地变化，例如，长度上30至50nt之间。合成的前-miRNA的一个例子在图1中示出。优选地，未成对和成对RNA结构间自由能的差别在-20至-60kcal/摩尔之间，特别地，大约-40kcal/摩尔。miRNA和miRNA^＊之间的互补性无须完美，可以忍耐未配对核苷酸的大约1至3个凸起(bulge)。可通过本领域传统的计算机算法(例如mFOLD)来预测RNA分子采用的二级结构。通过5’末端互补性的程度，来确定来自前miRNA的双链RNA茎的特定链(其被通过DCL活性释放并且装载到RISC复合物上)，其中，在其5’末端涉及被切割的dsRNA茎的不同链的核苷酸之间的氢结合最少的链被装载到RISC复合物上，并将决定靶RNA分子降解的序列特异性。但是，如果经验上来自特定的合成前miRNA分子的miRNA分子不具有功能性(因为“错误的”链被装载到RISC复合物上)，将立刻显而易见：该问题可通过将miRNA分子的位置与其在前miRNA分子的dsRNA茎的各链上的互补序列相交换来解决。如本领域已知的，A和U之间的结合涉及两个氢键或G和U之间涉及两个氢键的结合要比G和C之间涉及三个氢键的结合弱。
天然存在的miRNA分子可被包含在它们的天然存在的前-miRNA分子中，但是他们还可被引入已有的前-miRNA分子骨架，这通过将从此类已有的前-miRNA分子正常加工得到的miRNA分子的核苷酸序列换成感兴趣的另一miRNA的核苷酸序列来实现。前-miRNA的骨架还可以是完全合成的。类似地，合成的miRNA分子可被包含在已有的前-miRNA分子骨架或合成的前-miRNA骨架中，或从其加工而来。
前-miRNA分子(以及由此还有miRNA分子)可被方便地引入植物细胞，这通过向植物细胞提供包含可植物表达的启动子的基因来实现，所述启动子与转录时产生前-miRNA分子的DNA区域有效相连。可植物表达的启动子可以是与前-miRNA分子天然相关的启动子，或者其可以是异源启动子。
用于对GhGluc1基因的D-亚基因组等位基因的表达进行特异性下调的合适miRNA和前微小RNA分子示于序列表编号SEQ ID No 15、16、20和21中。
用于对GhGluc1基因的A-亚基因组等位基因的表达进行特异性下调的合适miRNA和前微小RNA分子示于序列表编号SEQ ID No 13、14、17、18和19中。
在本文中使用时，术语“可植物表达的启动子”表示能控制(起始)在植物细胞中的转录的DNA序列。这包括植物来源的任何启动子，还包括能指导在植物细胞中转录的非植物来源的任何启动子，即，病毒或细菌来源的某些启动子，例如CaMV35S，地三叶病毒启动子No 4或No 7或T-DNA基因启动子等。
能控制优先在纤维细胞中转录的起始和保持的可植物表达的启动子是这样的启动子，其驱动有效相连的DNA区域在纤维细胞和下面的表皮细胞中转录至比在植物其它组织或细胞中更高的水平。此类启动子包括来自棉花的来自纤维特异性β-微管蛋白基因的启动子(如WO0210377所述)、来自棉花的来自纤维特异性肌动蛋白基因的启动子(如WO0210413所述)、来自棉花的纤维特异性脂转移蛋白基因的启动子(如US5792933所述)、来自棉花的扩展蛋白基因的启动子(WO9830698)或来自棉花中几丁质酶基因的启动子(US2003106097)或US6259003或US6166294中描述的纤维特异性基因的启动子。还可使用本文所述的纤维选择性启动子。
对于某些应用而言，减少产纤维植物(例如棉花植物)中纤维长度可能是有好处的。例如，减少棉花植物中绒毛纤维的量，由此留下更多能量和材料用于在棉花植物中掺入棉绒纤维将是有好处的。这可方便地通过在纤维细胞发育的早期阶段在纤维细胞中(过)表达β-1，3-内切葡聚糖酶来实现，例如使用本文所述的、在迅速延伸期末尾表达的纤维选择性启动子来实现。
本发明还包括本文所述的嵌合基因以及包含这些嵌合基因的植物、种子、组织以及从此类植物产生的纤维。
还可通过分离出编码具有弱酶活性的变体蛋白或不再编码功能性β-1，3-内切葡聚糖酶的D-亚基因组等位基因变体，来增加或改变棉花中的纤维品质和纤维长度或其它纤维性质。
用于转化植物的方法是本领域公知的，这与本发明并不太相关。用于转化棉花植物的方法也是本领域公知的。农杆菌介导的棉花转化已被描述过，例如，在美国专利5,004,863或美国专利6,483,013中，在例如WO92/15675中报道了通过粒子轰击进行的棉花转化。
可以使用本领域公知的方法，以稳定方式或以瞬时方式，将根据本发明的嵌合基因引入植物。嵌合基因可被引入植物，或可在植物细胞内部产生，如例如EP 1339859所述。
可通过在棉花植物(可由其获得胚胎发生性愈伤组织)进行转化来引入嵌合基因，所述植物例如Coker 312、Coker310、Coker 5Acala SJ-5、GSC25110、FIBERMAX 819、Siokra 1-3、T25、GSA75、Acala SJ2、Acala SJ4、Acala SJ5、Acala SJ-C1、Acala B1644、Acala B1654-26、AcalaB1654-43、Acala B3991、Acala GC356、Acala GC510、Acala GAM1、AcalaC1、Acala Royale、Acala Maxxa、Acala Prema、Acala B638、Acala B1810、Acala B2724、Acala B4894、Acala B5002、非Acala“picker”Siokra、“stripper”品种FC2017、Coker 315、STONEVILLE 506、STONEVILLE825、DP50、DP61、DP90、DP77、DES119、McN235、HBX87、HBX191、HBX107、FC 3027、CHEMBRED A1、CHEMBRED A2、CHEMBRED A3、CHEMBRED A4、CHEMBRED B1、CHEMBRED B2、CHEMBRED B3、CHEMBRED C1、CHEMBRED C2、CHEMBRED C3、CHEMBRED C4、PAYMASTER 145、HS26、HS46、SICALA、PIMA S6 ORO BLANCOPIMA、FIBERMAX FM5013、FIBERMAX FM5015、FIBERMAXFM5017、FIBERMAX FM989、FlBERMAX FM832、FIBERMAX FM966、FIBERMAX FM958、FIBERMAX FM989、FIBERMAX FM958、FIBERMAX FM832、FIBERMAX FM991、FIBERMAX FM819、FIBERMAX FM800、FIBERMAX FM960、FIBERMAX FM966、FIBERMAX FM981、FIBERMAX FM5035、FIBERMAX FM5044、FIBERMAX FM5045、FIBERMAX FM5013、FIBERMAX FM5015、FIBERMAX FM5017或FIBERMAX FM5024和具有源于它们的基因型的植物。
在本文中使用时“棉花”包括陆地棉或海岛棉。“棉花祖先植物”包括树棉(Gossypium arboretum)、草棉、雷蒙德氏棉和长萼棉(Gossypiumlongicalyx)。
本发明的方法和手段还可用于其它植物物种，例如，大麻、黄麻、亚麻和木质植物，包括但不限于松属(Pinus spp.)、杨属(Populus spp.)、云杉属(Picea spp.)、桉属(Eucalyptus spp.)等。
获得的经转化植物可用于传统培育体系，以产生更多具有相同特征的经转化植物，或在相同或相关植物物种的其它品种中或杂交植物中引入根据本发明的嵌合基因。从经转化的植物获得的种子含有作为稳定的基因组插入的本发明嵌合基因，其也是本发明所包括的。
在本发明的另一实施方案中，提供了针对β-1，3-内切葡聚糖酶产生的抗体，特别是能识别具有SEQ ID No 11和12的氨基酸序列的β-1，3-内切葡聚糖酶蛋白的抗体。
在本文中使用时，“包含”应当被解释为：其特指出了提到的特征、整数、步骤或组分的存在，但是并不排除一种或多种特征、整数、步骤或组分或它们的组的存在或添加。因此，例如，包含核苷酸序列或氨基酸序列的核酸或蛋白可包含比实际提到的那些更多的核苷酸或氨基酸，即，其被嵌入更大的核酸或蛋白中。包含功能或结构上确定的DNA区域的嵌合基因还可包含其它DNA区域等。
下述非限制性实施例描述了对棉花中A和D亚型的两种β-1，3-内切葡聚糖酶和它们的启动子区域的鉴定，以及对次生植物细胞壁合成中表达和参与时机的分析。还描述了嵌合基因及其用途，所述嵌合基因用于改变纤维特征、用于在产纤维植物(例如棉花)中的纤维特异性表达和纤维优先性表达。除非另有指明，在实施例中，所有重组DNA技术都是按照标准方案来进行的，如Sambrook等人(1989)Molecular Cloning：ALaboratory Manual，第二版，Cold Spring Harbor Laboratory Press，NY和Ausubel等人(1994)Current Protocols in Molecular Biology，CurrentProtocols，USA的第1和2卷所述。用于植物分子工作的标准材料和方法被描述于Plant Molecular Biology Labfax(1993)，由R.D.D.Croy，BIOSScientific Publications Ltd(UK)和Blackwell Scientific Publications，UK共同出版。
在说明书和实施例全文中，参考序列表中示出的下述序列：
SEQ ID No 1：来自陆地棉Fiber Max966，亚型A的β-1，3-内切葡聚糖酶的经扩增基因组片段
SEQ ID No 2：来自陆地棉Fiber Max966，亚型D的β-1，3-内切葡聚糖酶的经扩增基因组片段
SEQ ID No 3：来自树棉的β-1，3-内切葡聚糖酶的经扩增基因组片段
SEQ ID No 4：来自雷蒙德氏棉的β-1，3-内切葡聚糖酶的经扩增基因组片段
SEQ ID No 5：用于扩增β-1，3-内切葡聚糖酶基因组片段的反向引物(SE002)
SEQ ID No 6：用于扩增β-1，3-内切葡聚糖酶基因组片段的正向引物(SE003)
SEQ ID No 7：来自陆地棉Fiber Max966，亚型A的β-1，3-内切葡聚糖酶的经扩增基因组片段编码的氨基酸序列
SEQ ID No 8：来自陆地棉Fiber Max966，亚型D的β-1，3-内切葡聚糖酶的经扩增基因组片段编码的氨基酸序列
SEQ ID No 9：来自陆地棉Fiber Max966，亚型A的β-1，3-内切葡聚糖酶的完整基因组克隆的核苷酸序列，其包括启动子序列
SEQ ID No 10：来自陆地棉Fiber Max966，亚型D的β-1，3-内切葡聚糖酶的完整基因组克隆的核苷酸序列，其包括启动子序列
SEQ ID No 11：来自陆地棉Fiber Max966，亚型A的完整β-1，3-内切葡聚糖酶的氨基酸序列
SEQ ID No 12：来自陆地棉Fiber Max966，亚型D的完整β-1，3-内切葡聚糖酶的氨基酸序列
SEQ ID No 13：前-miRA1的核苷酸序列
SEQ ID No 14：前-miRA1的核苷酸序列，具有克隆位点
SEQ ID No 15：前-miRD1的核苷酸序列
SEQ ID No 16：前-miRD1的核苷酸序列，具有克隆位点
SEQ ID No 17：前-miRA2的核苷酸序列
SEQ ID No 18：前-miRA2aa的核苷酸序列
SEQ ID No 19：前-miRA2aa的核苷酸序列，具有克隆位点
SEQ ID No 20：前-miRD2的核苷酸序列
SEQ ID No 21：前-miRD2的核苷酸序列，具有克隆位点
实施例1：在棉花植物和棉花祖先植物中鉴定编码纤维选择性β-1，3-葡聚糖酶的A和D-亚基因组特异性等位基因
已经提出，胼胝质涉及在生长中的纤维细胞中保持膨胀的过程。在纤维和非纤维棉花细胞之间的桥连结构(作为胞间连丝已知)的基底去除胼胝质消除了膨压。这导致了迅速纤维延伸的终止。因此应当通过延迟对胼胝质的去除来增强纤维长度。
β-1，3-葡聚糖酶催化β-1，3-D-葡聚糖(胼胝质)中β-1，3-D-糖苷键的水解。当胼胝质在纤维基底沉积时，GhGluc1编码的纤维特异性β-1，3-葡聚糖酶是无法检测到的，但在胼胝质降解的时候其变得显而易见。
简言之，胞间连丝闭合看起来在延伸棉花纤维的方面具有重要作用。胼胝质沉积和降解应当分别参与胞间连丝闭合和重开。GhGluc1的表达可通过降解胼胝质由此开启胞间连丝从而在该过程中具有作用(Ruan等人，2004，Plant Physiology-136：4104-4113)。
基于GhGluc1的核苷酸序列(EMBL登录号D88416)(被描述于Ruan等人，2004，Plant Physiology-136：4104-4113中)，设计了2条引物(SE002：ggccgaagccgatcttatctagg(反向引物；SEQ ID No 5)和SE003：cggcaacaatcttccatctccag(正向引物；SEQ ID No 6))，来扩增用于陆地棉(AD基因组)、树棉(G.arboreum)(A基因组)和雷蒙德氏棉(G.raimondii)(D基因组)的基因组DNA片段。对这些片段进行了测序(见SEQ ID No 1-4)。对于陆地棉而言，获得了2条共有序列，对于树棉而言，获得了1条共有序列，对于雷蒙德氏棉而言，获得了1条共有序列。
两条陆地棉序列和两种二倍体之间多态性的总览

因此，一种类型的序列对应于A基因组序列，另一种类型对应于D基因组。
在扩增的PCR片上进行AlwI(识别位点＝GGATC)消化，hirsutum或基因组中两种亚基因组变体均可被区分(见图5)。因此，可使用下述方法来区分GhGluc1的A和D亚基因组等位基因。所使用的引物如下所述：
a.SE002：GGCCGAAGCCGATCTTATCTAGG(SEQ ID No 5)
b.SE003：CGGCAACAATCTTCCATCTCCAG(SEQ ID No 6)
预计的PCR产物长度为655bp。
PCR条件：

1x 模板DNA (200ng/μl) 1μl 5x GreenGoTaq缓冲液 5μl SE002(10μM) 0.75μl SE003(10μM) 0.75μl dNTP’s(20mM) 0.5μl GoTaq聚合酶 0.25μl MQ水 16.75μl 25μl

PCR情况：
95℃-5min

72℃-10min
PCR扩增后，使用10μ模板；1μl AlwI酶、2μl NEB 4限制性缓冲液、7μl MQ水进行AlwI消化(在37℃孵育3小时)，来消化PCR片段。在用EtBr染色的1.5％TAE凝胶上分析得到的片段。
A亚基因组等位基因特异性PCR片段的预计条带大小是：479+118+59bp。D亚基因组等位基因特异性PCR片段的预计条带大小是：538+118bp。
实施例2：陆地棉中编码纤维选择性β-1，3-葡聚糖酶的A和D亚基因组特异性等位基因的差异表达和与纤维发育阶段的关联性
针对陆地棉来分析纤维生长/发育模式期间的等位基因特异性表达。提取从纤维细胞和种子(5DPA时)和从纤维细胞(10、15、20和40DPA)产生的cDNA文库的DNA，对浓度加以均衡，进行上文提到的PCR扩增。条带强度的差异对应于表达的相对差异(图6，道2、4、6、8和10)。包括了阳性对照(基因组DNA，图6，道12)。按照实施例1所述进行AlwI消化，以在GhGluc1基因的2种亚基因组等位基因间进行区分(图6，道3、5、7、9、11和13)。
表达模式可被总结为下表：
5dpa 10dpa 15dpa 20dpa 30dpa 40dpa / / D D A和D A和D

在纤维发育的迅速延伸期(5和10dpa)没有GhGluc1表达。因此，胼胝质堵塞没有降解；细胞中膨胀没有释放，延伸仍继续。我们相信，5dpa的模糊条带表明种子中有一些表达(纤维中没有)。在延伸期和次生细胞壁形成期之间的过渡时(15DPA)，GhGluc1表达。迅速延伸停止时，这在细胞中释放了膨胀。仅GhGluc1基因的D基因组样变体表达。在20DPA时，表达要比15DPA时多(更强的条带)。A基因组样的变体在15和20DPA时不表达。A基因组样变体以及D基因组样变体在30和40DPA时表达，并可能在成熟或其它纤维性质方面发挥作用。
实施例3：分离和鉴定编码纤维选择性β-1，3-葡聚糖酶的A和D-亚基因组特异性等位基因的启动子区域
用包含GhGluc1的A和D亚基因组特异性等位基因的核苷酸序列的PCR片段来筛选含有陆地棉品种的基因组DNA克隆的BAC文库。鉴定了4个不同的克隆，每种亚基因组变体2个。鉴定了针对每种等位基因变体的基因组片段的核苷酸序列，它们被示为SEQ ID No 9(A基因组)和SEQID No 10(D基因组)。
对于A基因组变体而言，可在第2278至2281位鉴定出TATA框；在第2308位鉴定出转录起始位点。5’非翻译前导序列从第2308位核苷酸延伸至第2409位；翻译起始密码子位于第2410-2412位。编码序列由内含子序列(2444-2555)分开的两个外显子(nt 2410至2443和nt 2556至3499)构成。翻译终止密码子位于第3497至3499位，聚腺苷化位点位于第3624位。
对于D基因组变体而言，可在第3242至3245位鉴定出TATA框；在第3270位鉴定出转录起始位点。5’非翻译前导序列从第3270位核苷酸延伸至第3372位；翻译起始密码子位于第3373-3375位。编码序列由内含子序列(nt 3407-3500)分开的两个外显子(nt 3373-3406和nt 3501-4444)构成。翻译终止密码子位于第4442至4444位，聚腺苷化位点位于第4566位。
融合的编码区域的核苷酸序列已被比对(图2)，差异被示出；类似地，内含子核苷酸序列也已被比对(图3)。图4显示了对编码的蛋白的比对，而图1显示了对位于编码区域上游的核苷酸序列的比对。
实施例4：包含与标记基因有效相连的不同纤维选择性启动子区域的嵌合基因构建体
使用标准重组技术将下述DNA片段有效相连：
a.A等位基因特异性启动子的核苷酸序列，其包含SEQ ID No 9的第465位核苷酸至第2409位核苷酸的核苷酸序列
b.β-葡糖醛酸糖苷酶编码区域(GUS)
c.包含转录终止和聚腺苷化信号(CaMV)3’35S的片段(下文中示为Gluc1-SGA(A1.9))
和
d.A等位基因特异性启动子的核苷酸序列，其包含SEQ ID No 9的第1374位核苷酸至第2409位核苷酸的核苷酸序列
e.β-葡糖醛酸糖苷酶编码区域(GUS)
f.包含转录终止和聚腺苷化信号(CaMV)3’35S的片段
和
g.A等位基因特异性启动子的核苷酸序列，其包含SEQ ID No 9的第1531位核苷酸至第2409位核苷酸的核苷酸序列
h.β-葡糖醛酸糖苷酶编码区域(GUS)
i.包含转录终止和聚腺苷化信号(CaMV)3’35S的片段
和
j.D等位基因特异性启动子的核苷酸序列，其包含SEQ ID No 10的第1397位核苷酸至第3372位核苷酸的核苷酸序列(下文中示为Gluc1-SGD(D2.0))
k.β-葡糖醛酸糖苷酶编码区域(GUS)
l.包含转录终止和聚腺苷化信号(CaMV)3’35S的片段
和
m.D等位基因特异性启动子的核苷酸序列，其包含SEQ ID No 10的第2371位核苷酸至第3372位核苷酸的核苷酸序列
n.β-葡糖醛酸糖苷酶编码区域(GUS)
包含转录终止和聚腺苷化信号(CaMV)3’35S的片段
或
o.D等位基因特异性启动子的核苷酸序列，其包含SEQ ID No 10的第2718位核苷酸至第3372位核苷酸的核苷酸序列
p.β-葡糖醛酸糖苷酶编码区域(GUS)
q.包含转录终止和聚腺苷化信号(CaMV)3’35S的片段
在存在嵌合选择性标记基因的情况下，将上述嵌合基因分别克隆进T-DNA载体，并引入包含卸甲的辅助Ti质粒的根瘤农杆菌(Agrobacteriumtumefaciens)菌株。根据WO00/71733所述的方法，用农杆菌菌株来产生转基因棉花。来自这些植物的纤维细胞和其它组织被组织化学染色。
主要在纤维细胞和纤维中观察到了不同嵌合构建体的表达。
实施例5：包含与N-乙酰葡糖胺转移酶编码区域有效相连的不同纤维选择性启动子区域的嵌合基因构建体
使用目前的重组DNA技术，装配与实施例4的构建体相似的构建体，但是其中Gus编码区域被换为NodC编码区域(见WO2006/136531，具体地，其中的SEQ ID 1至9，该文献通过引用并入本文)，之前是Cab22非翻译前导序列。
在存在嵌合选择性标记基因的情况下，将上述嵌合基因分别克隆进T-DNA载体，并引入包含卸甲的辅助Ti质粒的根瘤农杆菌菌株。根据WO00/71733所述的方法，用农杆菌菌株来产生转基因棉花。针对带正电的寡糖的存在，对来自这些植物的纤维细胞和其它组织进行了分析，如WO2006/136531所述。
实施例6：通过特异性下调编码纤维选择性β-1，3-葡聚糖酶的D-亚基因组特异性等位基因，来增加陆地棉中的纤维长度
使用本领域已知的设计规则，设计了对GhGluc1的A或D亚基因组等位基因变体特异的合成前微小RNA。
用于对GhGluc1基因的D-亚基因组等位基因的表达进行特异性下调的合适miRNA和前微小RNA分子示于序列表编号SEQ ID No 15、16、20和21中。
用于对GhGluc1基因的A-亚基因组等位基因的表达进行特异性下调的合适miRNA和前微小RNA分子示于序列表编号SEQ ID No 13、14、17、18和19中。
如实施例4所述，在CaMV 35S启动子的控制下或在纤维特异性和/或纤维优先性启动子的控制下，克隆了编码前微小RNA的核苷酸序列。
在存在嵌合选择性标记基因的情况下，将上述嵌合基因分别克隆进T-DNA载体，并引入包含卸甲的辅助Ti质粒的根瘤农杆菌菌株。根据WO00/71733所述的方法，用农杆菌菌株来产生转基因棉花。针对增加的纤维长度，对来自这些植物或其后代的纤维进行了分析。
实施例7：对gluc1启动子对纤维的特异性的分析
从棉花叶、根和茎分离RNA，针对gluc1基因和蛋白磷酸酶2A基因(普遍存在并保守的丝氨酸/苏氨酸磷酸酶，其具有广泛的底物特异性和不同细胞功能)的表达对RNA加以分析。使用用于RT-PCR(Invitrogen)的SuperScript第一链合成系统来进行第一链cDNA合成，之后加入gluc1或pp2A特异性引物，进行RT-PCR反应。结果示于表7中。道17中的阳性结果表明成功实现了第一链合成。使用pp2A特异性引物，在叶、根和茎RNA样品中，道10、12、14中的阳性结果特异性地表明了叶、根和茎样品中的第一链合成是有成效的。道11、13、15是阴性对照，其省略了来自反应的逆转录酶。道8是基因组DNA构成的阳性对照，用于验证gluc1特异性PCR反应的正确性。在道2、4、6中，没有检测到信号，这表明，在棉花叶、根和茎中不存在Gluc1表达。道3、5和7是省略了逆转录酶的阴性对照。
总之，在棉花叶、根和茎组织中没有检测到Gluc1表达。
实施例8：用含有的农杆菌菌株进行棉花胚珠转化
用携带不同嵌合gluc1启动子::GUS融合基因(在实施例4中示为Gluc1-SGA(A1.9)和Gluc1-SGD(D2.0))的根瘤农杆菌转化后，在0DPA、1DPA和2DPA分离棉花花的胚珠，将其用于胚珠培养实验(如例如Feng和Brown，2000，In vitro Cellular & Developmental Biology，卷36，Number 4第293-299页所述)。在1周、2周、3周、4周或5周后，针对GUS表达通过组织化学方法来分析初始的纤维细胞/纤维。培养的胚珠作为阳性对照被包括进来，其已经过了具有嵌合CaMV35启动子::Gus融合基因的农杆菌菌株的感染。注意：使用的GUS编码区域含有内含子序列，以避免感染性农杆菌中偶然的GUS表达。结果概括于表1中。
表1：对经培养和转染的棉花胚珠的Gus组织化学分析
7DPA 14DPA 21DPA 28DPA 35DPA CaMV35S-gus + + + + + Gluc1-SGA-gus - - - - + Gluc1-SGD-gus - + + + -

这些数据确证了针对来自GhGluc1的不同亚基因组等位基因的启动子而言从实施例2的数据推断的表达模式。
序列表
<110>拜尔生物科学公司(Bayer BioScience N.V.)
     Engelen，Steven
     Arioli，Tony
<120>亚基因组特异性等位基因在棉花中的差异表达及其用途
<130>BCS 07-2001
<150>EP07000550.9
<151>2007-01-11
<150>US60/884,564
<151>2007-01-11
<160>21
<170>PatentIn版本3.3
<210>1
<211>689
<212>DNA
<213>陆地棉(Gossypium hirsutum)
<400>1
tggccgtgat attggtgttt gctatggttt gaacggcaac aatcttccat ctccaggaga    60
tgttattaat cttttcaaaa ctagtggcat aaacaatatc aggctctacc agccttaccc    120
tgaagtgctc gaagcagcaa ggggatcggg aatatccctc tcgatgagta cgacaaacga    180
ggacatacaa agcctcgcaa cggatcaaag tgcagccgat gcatgggtta acaccaacat    240
cgtcccttat aaggaagatg ttcaattcag gttcatcatc attgggaatg aagccattcc    300
aggacagtca agctcttaca ttcctggtgc catgaacaac ataatgaact cgctggcctc    360
atttgggcta ggcacgacga aggttacgac cgtggtcccg atgaatgccc taagtacctc    420
gtaccctcct tcagacggcg cttttggaag cgatataaca tcgatcatga ctagtatcat    480
ggccattctg gttcgacagg attcgcccct cctgatcaat gtgtaccctt attttgccta    540
tgcctcagac cccactcata tttccctcaa ctacgccttg ttcacctcga ccgcaccggt    600
ggtggtcgac caaggcttgg aatactacaa cctctttgac ggcatggtcg atgctttcaa    660
tgccgcccta gataagatcg gcttcggcc                                      689
<210>2
<211>689
<212>DNA
<213>陆地棉
<400>2
tggccgtgat attggtgttt gctatggttt gaacggcaac aatcttccat ctccaggaga    60
tgttattaat ctttacaaaa ctagtggcat aaacaatatc aggctctacc agccttaccc    120
tgaagtgctc gaagcagcaa ggggatcggg aatatccctc tcgatgggtc cgagaaacga    180
ggacatacaa agcctcgcaa aagatcaaag tgcagccgat gcatgggtta acaccaacat    240
cgtcccttat aaggacgatg ttcagttcaa gttgatcact attgggaatg aagccatttc    300
aggacaatca agctcttaca ttcctgatgc catgaacaac ataatgaact cgctcgcctt    360
atttgggtta ggcacgacga aggttacgac cgtggtcccg atgaatgccc taagtacctc    420
gtaccctcct tcagacggcg cttttggaag cgatataaca tcgatcatga ctagtatcat    480
ggccattctg gctgtacagg attcgcccct cctgatcaat gtgtaccctt attttgccta    540
tgcctcagac cccactcata tttccctcga ttacgccttg ttcacctcga ccgcaccggt    600
ggtggtcgac caaggcttgg aatactacaa cctctttgac ggcatggtcg atgctttcaa    660
tgccgcccta gataagatcg gcttcggcc                                      689
<210>3
<211>655
<212>DNA
<213>树棉(Gossypium arboreum)
<400>3
cggcaacaat cttccatctc caggagatgt tattaatctt tacaaaacta gtggcataaa    60
caatatcagg ctctaccagc cttacctgaa gtgctcgaag gagcaagggg atcgggaata    120
tccctctcga tgagtacgac aaacgaggac atacaaagcc tcgcaacgga tcaaagtgca    180
gccgatgcat gggttaacac caacatcgtc ccttataagg acgatgttca attcaggttc    240
atcatcattg ggaatgaagc cattccagga cagtcaagct cttacattcc tggtgccatg    300
aacaacataa tgaactcgct cgcctcattt gggctaggca cgacgaaggt tacgaccgtg    360
gtcccgatga atgccctaag tacctcgtac cctccttcag acggcgcttt tggaagcgat    420
ataacatcga tcatgactag tatcatggcc attctggttc gacaggattc gcccctcctg    480
atcaatgtgt acccttattt tgcctatgcc tcagacccca ctcatatttc cctcaactac    540
gccttgttca cctcgaccgc accggtggtg gtcgaccaag gcttggaata ctacaacctc    600
tttgacggca tggtcgatgc tttcaatgcc gccctagata agatcggctt cggcc         655
<210>4
<211>656
<212>DNA
<213>雷蒙德氏棉(Gossypium raimondii)
<400>4
cggcaacaat cttccatctc caggagatgt tattaatctt tacaaaacta gtggcataaa    60
caatatcagg ctctaccagc cttaccctga agtgctcgaa gcagcaaggg gatcgggaat    120
atccctctcg atgggtccga gaaacgagga catacaaagc ctcgcaaaag atcaaagtgc    180
agccgatgca tgggttaaca ccaacatcgt cccttataag gacgatgttc agttcaaatt    240
gatcactatt gggaatgaag ccatttcagg acaatcaagc tcttacattc ctgatgccat    300
gaacaacata atgaactcgc tcgcctcatt tgggttaggc acaacgaagg ttacgaccgt    360
ggtcccgatg aatgccctaa gtacctcgta ccctccttca gacggcgctt ttggaagcga    420
tataacatcg atcatgacta gtatcatggc cattctggct gtacaggatt cgcccctcct    480
gatcaatgtg tacccttatt ttgcctatgc ctcagacccc actcatattt ccctcgatta    540
cgccttgttc acctcgaccg caccggtggt ggtcgaccaa ggcttggaat actacaacct    600
ctttgacggc atggtcgatg ctttcaatgc cgccctagat aagatcggct tcggcc        656
<210>5
<211>23
<212>DNA
<213>人工
<220>
<223>用于扩增内切葡聚糖酶基因组片段的寡核苷酸引物
<400>5
ggccgaagcc gatcttatct agg    23
<210>6
<211>23
<212>DNA
<213>人工
<220>
<223>用于扩增内切葡聚糖酶基因组片段的寡核苷酸引物
<400>6
cggcaacaat cttccatctc cag    23
<210>7
<211>229
<212>PRT
<213>陆地棉
<400>7
Gly Arg Asp Ile Gly Val Cys Tyr Gly Leu Asn Gly Asn Asn Leu Pro
1               5                   10                  15
Ser Pro Gly Asp Val Ile Asn Leu Phe Lys Thr Ser Gly Ile Asn Asn
            20                  25                  30
Ile Arg Leu Tyr Gln Pro Tyr Pro Glu Val Leu Glu Ala Ala Arg Gly
        35                  40                  45
Ser Gly Ile Ser Leu Ser Met Ser Thr Thr Asn Glu Asp Ile Gln Ser
    50                  55                  60
Leu Ala Thr Asp Gln Ser Ala Ala Asp Ala Trp Val Asn Thr Asn Ile
65                  70                  75                  80
Val Pro Tyr Lys Glu Asp Val Gln Phe Arg Phe Ile Ile Ile Gly Asn
                85                  90                  95
Glu Ala Ile Pro Gly Gln Ser Ser Ser Tyr Ile Pro Gly Ala Met Asn
            100                 105                 110
Asn Ile Met Asn Ser Leu Ala Ser Phe Gly Leu Gly Thr Thr Lys Val
        115                 120                 125
Thr Thr Val Val Pro Met Asn Ala Leu Ser Thr Ser Tyr Pro Pro Ser
    130                 135                 140
Asp Gly Ala Phe Gly Ser Asp Ile Thr Ser Ile Met Thr Ser Ile Met
145                 150                 155                 160
Ala Ile Leu Val Arg Gln Asp Ser Pro Leu Leu Ile Asn Val Tyr Pro
                165                 170                 175
Tyr Phe Ala Tyr Ala Ser Asp Pro Thr His Ile Ser Leu Asn Tyr Ala
            180                 185                 190
Leu Phe Thr Ser Thr Ala Pro Val Val Val Asp Gln Gly Leu Glu Tyr
        195                 200                 205
Tyr Asn Leu Phe Asp Gly Met Val Asp Ala Phe Asn Ala Ala Leu Asp
    210                 215                 220
Lys Ile Gly Phe Gly
225
<210>8
<211>229
<212>PRT
<213>陆地棉
<400>8
Gly Arg Asp Ile Gly Val Cys Tyr Gly Leu Asn Gly Asn Asn Leu Pro
1               5                   10                  15
Ser Pro Gly Asp Val Ile Asn Leu Tyr Lys Thr Ser Gly Ile Asn Asn
            20                  25                  30
Ile Arg Leu Tyr Gln Pro Tyr Pro Glu Val Leu Glu Ala Ala Arg Gly
        35                  40                  45
Ser Gly Ile Ser Leu Ser Met Gly Pro Arg Asn Glu Asp Ile Gln Ser
    50                  55                  60
Leu Ala Lys Asp Gln Ser Ala Ala Asp Ala Trp Val Asn Thr Asn Ile
65                  70                  75                  80
Val Pro Tyr Lys Asp Asp Val Gln Phe Lys Leu Ile Thr Ile Gly Asn
                85                  90                  95
Glu Ala Ile Ser Gly Gln Ser Ser Ser Tyr Ile Pro Asp Ala Met Asn
            100                 105                 110
Asn Ile Met Asn Ser Leu Ala Leu Phe Gly Leu Gly Thr Thr Lys Val
        115                 120                 125
Thr Thr Val Val Pro Met Asn Ala Leu Ser Thr Ser Tyr Pro Pro Ser
    130                 135                 140
Asp Gly Ala Phe Gly Ser Asp Ile Thr Ser Ile Met Thr Ser Ile Met
145                 150                 155                 160
Ala Ile Leu Ala Val Gln Asp Ser Pro Leu Leu Ile Asn Val Tyr Pro
                165                 170                 175
Tyr Phe Ala Tyr Ala Ser Asp Pro Thr His Ile Ser Leu Asp Tyr Ala
            180                 185                 190
Leu Phe Thr Ser Thr Ala Pro Val Val Val Asp Gln Gly Leu Glu Tyr
        195                 200                 205
Tyr Asn Leu Phe Asp Gly Met Val Asp Ala Phe Asn Ala Ala Leu Asp
    210                 215                 220
Lys Ile Gly Phe Gly
225
<210>9
<211>6009
<212>DNA
<213>陆地棉
<220>
<221>misc_feature
<222>(2278)..(2281)
<223>TATA框
<220>
<221>misc_feature
<222>(2308)..(2308)
<223>转录起始位点
<220>
<221>misc_feature
<222>(2308)..(2409)
<223>5’非翻译前导序列
<220>
<221>misc_feature
<222>(2410)..(2412)
<223>翻译起始密码子(ATG)
<220>
<221>misc_feature
<222>(2410)..(2443)
<223>编码序列部分I
<220>
<221>misc_feature
<222>(2444)..(2555)
<223>内含子序列
<220>
<221>misc_feature
<222>(2556)..(3499)
<223>编码序列部分II
<220>
<221>misc_feature
<222>(3497)..(3499)
<223>翻译终止密码子
<220>
<221>misc_feature
<222>(3624)..(3624)
<223>聚腺苷酸化位点
<400>9
cgcggcatat aattttatgt gtgtaatttg ttgggttaat tacttaaaat agtatatttt    60
taattgctgt aattaatgta agataatttt tattatttga atcattgcac aaaattaaaa    120
tagaataatt tatttaacaa ttcaaatata ataataatcc aaattataat tatagtattt    180
ttacaatatt caatatacaa tatagtttta cttcatacaa ttaatataaa aaaatattat    240
tcaaaataat aactaataaa cataattacc atatattaat tattttgata tttcgaacat    300
aacgctaata aaaaatttcc taatcattat taaatcattt gtataaacta taaagaaatt    360
gatatattgt aaattaaact ttattcattt tttttcttaa tactcaataa attaatcata    420
ataactcata aataatatat aattaaaata atcataacat ggtagattat ataaataggg    480
ggcgaatcta gggagctggc atgaccccta aaatagaatt ttctattttg acctatcaaa    540
atttttaaaa ttttaaatta gtaaaggtaa atttgtactt tgacctctta aaatgataaa    600
attttacttt aatcctttaa aatttacatt tttactatca taaaaattac aatttgattt    660
tgcccctaaa atttttttct agcttagccc tgtatataaa tatattattt ataattttta    720
tatttaaaat ataaagtttt taattataca aataattaaa atctgatatt taaaactaaa    780
gtaatttctt ttttcttttt actttttttt aattgcaaca taatggttta aatatctata    840
taacgtatga agtaatttga tataaatttt attttaattt attattatat aaattcattt    900
agtaaaaact tttaatagaa tcaaaatttt tatttgtaaa ttcgataact tttcttatca    960
agtatatttg tgagaaccaa atatttagta aaattaatat tcttatttat aaatatgata   1020
aatcttataa aaaaatattt aaaatgaaaa aaattgtaca aatattataa aaaaatattt   1080
aaaatgaaaa acattgtaca aaggctatat aagaagttca aaagtttctt cgaccatgta   1140
ctcttataga gattatagat agattataaa actatatgta gtttctctta acttttaaat   1200
aagaggataa atgtatttta atgtactcaa acttatatat ttttatattg acaataatat   1260
caatatcaac ctaattaaga ttcattctaa cattaatgtt gaagattttt aataaaagaa   1320
aaggttaata aattaattag aacacaaaca aacacaaatt taagtggtat gtaaggtcct   1380
tgacccaaag gaaaaatttg ttacgtcgat taaattataa attaatttaa agtaaaatta   1440
cattttaacc taaaaaaaga gaaaagtata tctaatttct tcgaaaatgg aaagaaaatt   1500
ataaatttat ggcatttcta aaaaaattct gaattcgcta ctaaaagatg aaattataaa   1560
atccgaagca ttaccagaag atggatcacc aaatcacaaa caatcaatga aaagtaatga   1620
taattaattg aaagtgagca tttaattttg atagccatat acttcctgct gaatttatag   1680
gttctcatta atgcaattaa attatattcg acaccttttg aatgaaataa aatgacacaa   1740
gaggaaagac ggttcatcta ttttttcttt caatcgccca tcaaaatacc aaaaatgtaa   1800
ctacatgcaa aaaatcaaat atgaaaaata ttcatatttt gatattttaa tatattgtgt   1860
gttcaaaacg taaatgtatt gaaaaattat gatggtgttg ttgctgtatg tccataaaat   1920
tcaatgtact cacatttatc aaatgtatac tttgagagaa gttattttga taatactcaa   1980
gtttttttta tagatgggaa aattttttaa attatttttt gattttgatg aaatgtatat   2040
ataaatttta attcgataca tataaatata tatgtaaatt ttaaatttaa atttaataat   2100
atacaattaa gaaaataatt tataaatatt ttccgattaa aaataaatct ggaaagaaga   2160
aatgtcaaca ctttttcatt aaatacaatt aggatgggac acgatacctt catgcattga   2220
tatctcaggt ggtccaaaaa ctcggaatcc tttttgaaaa aaaacttcca gagagagtat   2280
ataaatccag cagtaggcac aagaaacgag caccagttat tgactttcct ttgtaaaaaa   2340
aaaaagtgct gagatcaaga aatatagtga aatatgggtc caagattttc tgggttttta   2400
atctaagcaa tgctgttttt aactcaactc ctctctctaa caggtaaaac aaacttctct   2460
acagtgattt tacagtaaat atggctttga aaaatataca acaaaacatt tatcttcaat   2520
ccattttaat tactgatcta ctatatatgt tgcagatggc cgtgatattg gtgtttgcta   2580
tggtttgaac ggcaacaatc ttccatctcc aggagatgtt attaatcttt tcaaaactag   2640
tggcataaac aatatcaggc tctaccagcc ttaccctgaa gtgctcgaag cagcaagggg   2700
atcgggaata tccctctcga tgagtacgac aaacgaggac atacaaagcc tcgcaacgga   2760
tcaaagtgca gccgatgcat gggttaacac caacatcgtc ccttataagg aagatgttca   2820
attcaggttc atcatcattg ggaatgaagc cattccagga cagtcaagct cttacattcc   2880
tggtgccatg aacaacataa tgaactcgct ggcctcattt gggctaggca cgacgaaggt   2940
tacgaccgtg gtcccgatga atgccctaag tacctcgtac cctccttcag acggcgcttt   3000
tggaagcgat ataacatcga tcatgactag tatcatggcc attctggttc gacaggattc   3060
gcccctcctg atcaatgtgt acccttattt tgcctatgcc tcagacccca ctcatatttc   3120
cctcaactac gccttgttca cctcgaccgc accggtggtg gtcgaccaag gcttggaata   3180
ctacaacctc tttgacggca tggtcgatgc tttcaatgcc gccctagata agatcggctt   3240
cggccaaatt actctcattg tagccgaaac tggatggccg accgccggta acgagcctta   3300
cacgagtgtc gcgaacgctc aaacttataa caagaacttg ttgaatcatg tgacgcagaa   3360
agggactccg aaaagacctg aatatataat gccgacgttt ttcttcgaga tgttcaacga   3420
gaacttgaag caacccacag ttgagcagaa tttcggattc ttcttcccca atatgaaccc   3480
tgtttatcca ttttggtgaa cttgaaatgt tattgttggc tatttaaatc ttttgccaga   3540
gacgcttcat atagtttctg catattttga aagtggaaaa tcaatctaaa tataaataag   3600
ttttatttgt tgttttttaa ttaaataaaa ttttaaatat tttaaaaaca tctttattgg   3660
taattaaata ttaaataaaa agtttaatat tcaaatttta tcaattcaaa aataaaataa   3720
aaatatatta aatttatttt tacgaataaa ttgattttct attaatgcag attttaaata   3780
atttgatata aattttcaat tcaacaatag taattttgat cacatcaaag gagaaaggga   3840
aagatttaac tttaattggt gacctaatat aacacgttga aaacggagtt cccaataagg   3900
caaaatgact tgtaatgacg aaagagatgt ccaagtgaaa tctgctttaa agtgaaagaa   3960
gcataaaagg ataactaaat aactcatgat ctaaattgaa gttctataaa atgcaacttt   4020
catctagaaa caaggtatgt cttaaatgat gttttatgaa tttgtcttaa ttgggtttta   4080
tgcaatgaat tcatggatag cacatctcta attatacgtt gctggtttat atgagagtgg   4140
tgcagaagtt aattgtgctt taaatacttg cttagtgttt atgaaatttg aaaagtgtta   4200
tatacttata ataaaaataa ttcgattcgg aatccaattc agggttcgac tcaatataat   4260
aaaattttac agatatcttg aaggggatct tcttcttctc tacttctcga gcagtgttat   4320
atatttacaa taaagataac tcaattcgag atccgaccta atataataaa attctacaga   4380
catatcaaag agggagatct tcttcttccc tacatcttga ccttcttgat caaaatgacc   4440
ttccttatat ttttacatac gttgattata tgaatcaaaa gaaagatacc aaaaagtttt   4500
taaaaataaa caacggggtt cttatgtaga gatgcttatg ggccgggccg gactcaacta   4560
aaaatttagg cacattcatt gggcccaggt cgggcctaac ccaaaaatgg gcctaaaatt   4620
ttgcccaagc ttgactcaaa taaaaatgct aaaattcggg cctgaccccg tattaatttt   4680
atattatttt atataacttt taaatatata taatatataa aaaatactaa aaaaattaaa   4740
ataaatattt cccaactaaa ctaaaattat taagaaaaat aattcatatt agcgtataaa   4800
ttggaaattg accaaaatta aaattattgt atagttaatc tatattaaaa ggacatgtaa   4860
ttaaaaacca ttaaaactat tatacaataa attaaatctt cattgtatac atagaaaggc   4920
attaataatt aaaaaactat attaagatat aaactaaatt caaaattatt aaaaacaaga   4980
actaaataaa aaagcaattg aaaattacga attaatgtta aaatcaaatg ttaaaatcaa   5040
gggacttaaa taaaaatatc ccaaaataca aaacattagc ttcctttccc atccacgtga   5100
atgcaaagtt tacatggtgt ttcctagtgt ttgtgcgact ccaacctttt atttacctct   5160
ttttttcttt atttgaacaa ttatttgata atgattagaa ttttgggatt gttgctcatc   5220
gtacgtgcaa cacttaaaat cactatgatt tttcataatt tatataacct atatcgtttt   5280
ggaaattaat tttatttttt atattatttt aataaaaata ccatctacct tttttaattt   5340
atgatccctt tcatatttaa aaattcaaat tgacaattgt ctaactaaac accgtcacac   5400
tccaataaga ttgtaatttc ctccatcttg atattacact caaaagcatg ttgccaacaa   5460
acaaatcaac tagccttttt ctaccactat tcatcatctt cttaagagtg tgtttatgtc   5520
atgtgccgag attttaggta tggtcacgtt gtggctttaa actcaaatct attgcccatg   5580
agtctaagtt agcctccgat cctcactaaa gagaggcttg gcacacttta cctagccaag   5640
tacacaagga atagagctat tagaaagcat taaagagtta ggagaatgtg gaagtgtttt   5700
tattactcaa agctaacttg gatacaaata aaggagggag cctctccttt aggcaagctt   5760
cttttgatct gatggttaca attaatctcg aataggaggg gtcaaacttc tcactcagtt   5820
tcatattatc tcttggtgct tggttggcct ccgccttgag acaactttag ataacaccta   5880
gtcttaacac ttttagcttc acattgtacg catccttcat tactcaaatg ccacaaagcc   5940
tccttactta aggctcttgg tcgctcccac taccttcggc tttagactca tctaagatct   6000
tcccaatcg                                                           6009
<210>10
<211>6877
<212>DNA
<213>陆地棉
<220>
<221>misc_feature
<222>(3242)..(3245)
<223>TATA框
<220>
<221>misc_feature
<222>(3270)..(3270)
<223>转录起始位点
<220>
<221>misc_feature
<222>(3270)..(3372)
<223>5’非翻译前导序列
<220>
<221>misc_feature
<222>(3373)..(3375)
<223>翻译起始密码子(ATG)
<220>
<221>misc_feature
<222>(3373)..(3406)
<223>编码序列部分I
<220>
<221>misc_feature
<222>(3407)..(3500)
<223>内含子序列
<220>
<221>misc_feature
<222>(3501)..(4444)
<223>编码序列部分II
<220>
<221>misc_feature
<222>(4442)..(4444)
<223>终止密码子
<220>
<221>misc_feature
<222>(4566)..(4566)
<223>聚腺苷酸化位点
<400>10
ttcaaactta ctcgcttgca caaaaataat tttataaaag tatttaaaat ataaaatttt    60
tatgttgata atatttttat atacatttta tattttaaga aataataatt ttttaggaat    120
tagaaaaaaa atgtagaata atatcattga tattttaatt tttcaaaaaa ttaaaaataa    180
gttcacgtag tctaatttta tctattttaa tttttatact ttcaaattga gataaatatc    240
aaagaacttt tggttcaata tgcaatttga tacttaaatt ttaatttgat gtaattatta    300
catgaaactt ggcttgtggt ttatacgtat acatgaaatt tttattttga ttcaattgta    360
cgcatttaaa gaaatgaaaa tggttctaat tcaataatat tattagtgat ttgtgaaatt    420
taaaactttt atgcattaaa ccacacaaaa tcagagttta tgtatgatat tgcacattgg    480
actatagttc atgcatattt tttatatttt atccatgtca aattttgaaa tttcattctt    540
aacttatatg atagcagtta aatttgttaa gtcaaactct agtattagtt atatactata    600
cataacttgt agagtttagt ttaagttcac taatttgatt attttttatc tgtttatttt    660
ttcaatttca agatttaagt tttaagctta acttaaacaa tagtcattaa atttattaac    720
taaaatgtcc tggggttttt tgtaagtatt ataatatgtt tgccacgtga gattttggta   780
aaagtagagt ttaacttaac aaatttaatg gctactactt agtaaggatt agaatttcaa   840
aattaaaaaa aaaattatag aggctaaaga tgatcaaatt agaggtttaa attaagtcaa   900
attaaaatag ttctggatat taactattta aattaattaa tgtcattata aaattagagg   960
tctaaattat gtaaaattaa aatataaaaa ctaaatctcg aatgtgagta tagtataagg   1020
atcaaaagtg attttggtca ttttctttta tttacaaata ttcttagaga tgctctttta   1080
tatataatgg tttctaatgt gatatgcgcg gcatataatt ttatgtgttt aatttatttt   1140
attaattatt taaataatat atttttaatt actataatta atgtaaaata ttttttatta   1200
tttgaatcac tgcacaaaat taaaatatac taacttaatt aacaattcaa atataataat   1260
aatctaaatt ataattaaag catttttaca atattcagta tataatatag ttttacttta   1320
tataattaat acaaagaaat attattcaaa ataataacta atcaacataa ttactatata   1380
tcaattattt tgatatttcg aacataatgc taataaaaaa tttcctaatc attattaaat   1440
catttgtata aactataaag aaattgatat attgtaaatt aaacttttaa ctattcaatt   1500
ttttcttaat agtcaataaa ttaatcataa taattcataa ttaatatata attaacataa   1560
ccataacata gaatttttta ttttggccca ttaaaatttt taaaatttta aattagtaaa   1620
ggaaaaatta cactttgacc ccttaaaaat gataaaattt tattttaatc ctttaaaatt   1680
gacattttta ctattgtaaa aattacaatt taattttgcc cccctaaaaa atttttctag   1740
cttcgccctt gtgtataaat atattaatta caatttttat atttgaatta tataaataat   1800
taaattttga tatttaaaac taaagtaatc tctttttttt ttactttttt ttaattgaaa   1860
cataatggtt taaatatcta tattacgtat gaagtaattt aatataaatt ttattttaat   1920
ttattattat ataaattcat ttagtaaaaa cttttaatag aatcaaaatt tttatttgta   1980
aattcgataa cttttcttat caagtaaatt tgttgaatta aatatttagt aaaattaata   2040
tttttattta taaatatgat aaatcttata aaaaataaaa aaatatttaa aatgaaaaac   2100
attgtacaaa ggctatataa gaagttcaaa agtttcttcg accctgtact ctaatagaga   2160
ttatagatag attatagaac tattcatagt ttctcttaac ctttaaataa gaattttagt   2220
gtactcaaac ttacatattt ttatattgat aataatgtca ataccagccg agttaagatt   2280
cactcgacat taatgttgaa aatttttaat aaaagaaaat gttgataagt taattagaac   2340
acaagcaagc acaaatttaa gtggtaagta aggtccttga ccctaatgga aaaattgtta   2400
tgttgattaa attataaatt aatttaaggt aaaattatat tttgacctaa aaaaatgaaa   2460
aaaatatatc tagtttcttc gaaaatgaaa agaaaataat aaattgatac attataaaat   2520
ttatggcatt tctaaaaaaa ttctgaattt gatgaaatta taataaaaaa aaagtttaaa   2580
aacatataga tttcaagaat agtgggaaaa ttatatttga acaacactga agaaatccaa   2640
agcattagca gaaaatggat caccaaatca caaacaatca gtgaaaagta atgataatta   2700
attgaaagtg agcatttaaa tttgatagcc atatacttcc tgctgaattt ataggttctc   2760
attaatgcaa ttaaattata tttgtcactt tttgaatgaa ataaatgaca cagttcatct   2820
attttttttc tttcaatcgc ccatcaaaat accgaaaatg taactacatt aaaaaagatc   2880
gaaaaatatt catattttga tattttaata gattgtgtgt tcaaggcgta atgtactaaa   2940
aaattatgat ggtgttgtcg ctgtatgtcc ataaaattca atgtattcgc atgtatcaaa   3000
tgtaaatttt gacacaagtt attctaataa taatcaagtt atttttatac atgagataca   3060
tctcaaaatt atttttatat atccgaaaaa tcataacgta cgatcaaact agaaagagga   3120
agtgtcaaaa cctattcatt atatgcaaat atgatgggac acgataccct catgcattga   3180
tatctcatat tgtccaaaaa ctcagaatcc tttttgaaaa aaaaaaattc cagagagagt   3240
gtataaatcc agcagtgtgc acaagaaacg agcaccagtt attgacattc ctttgtaaaa   3300
aaaaaaagaa gctgagatca agaaatatag tgaaatatgg gtccaacatt ttctgggttt   3360
ttaatctcag caatggtgtt tttaactcaa ctcctctctc taacaggtaa aacaaacttc   3420
tctacagtga ttttacggta agtatggctt tgaaaaatat acaacaaaac atttatactg   3480
atctaccata tatgttgcag atggccgtga tattggtgtt tgctatggtt tgaacggcaa   3540
caatcttcca tctccaggag atgttattaa tctttacaaa actagtggca taaacaatat   3600
caggctctac cagccttacc ctgaagtgct cgaagcagca aggggatcgg gaatatccct   3660
ctcgatgggt ccgagaaacg aggacataca aagcctcgca aaagatcaaa gtgcagccga   3720
tgcatgggtt aacaccaaca tcgtccctta taaggacgat gttcagttca agttgatcac   3780
tattgggaat gaagccattt caggacaatc aagctcttac attcctgatg ccatgaacaa   3840
cataatgaac tcgctcgcct tatttgggtt aggcacgacg aaggttacga ccgtggtccc   3900
gatgaatgcc ctaagtacct cgtaccctcc ttcagacggc gcttttggaa gcgatataac   3960
atcgatcatg actagtatca tggccattct ggctgtacag gattcgcccc tcctgatcaa   4020
tgtgtaccct tattttgcct atgcctcaga ccccactcat atttccctcg attacgcctt   4080
gttcacctcg accgcaccgg tggtggtcga ccaaggcttg gaatactaca acctctttga   4140
cggcatggtc gatgctttca atgccgccct agataagatc ggcttcggcc aaattactct   4200
cattgtagcc gaaactggat ggccgaccgc cggtaacgag ccttacacga gtgtcgcgaa   4260
cgctcaaact tataacaaga acttgttaaa tcatgtgacg cagaagggga ctccgaaaag   4320
acctgaatat ataatgccga cgtttttctt cgagatgttc aacgaggatt tgaagcaacc   4380
cacagttgag cagaatttcg gattcttctt ccccaatatg aaccctgttt atccattttg   4440
gtgaagttga aatgttgttg gctatttaaa tcttttgcca gagacgcttc atatagtttc   4500
tgcatatttt gaaagtggaa aatcaatcta aatattaata agttttatgt gttgtttttt   4560
aattaaataa aattttaaat attttaaaaa tatctttatt ggtaattaaa tattaaataa   4620
aaagtttaat attcaaattt tatcaattca aaaataaaat aaaaatatat taaatttatt   4680
tttacgaata aattgatttt ctattaatac agattttgaa taatttgata taaattttaa   4740
attcaacaat agtaattttg atcacatcaa aggagaaagg gaaagattta actttaattg   4800
gtgacctaat ataacacgtt gaaaacggag ctcccaggaa ggcaaaatga cttgtaatga   4860
cgaaagagat gtccaagtag aatctgcatt aaagtgaaaa aagcataaaa ggataagtaa   4920
actcatgatc tgacataaat tgaagttcta taaaatgcaa ctttcatcta gaaacaaggt   4980
atgtcttaaa tgatgtttta tgaatttgtc ttaactgggt tttatgcaat gaattcatgg   5040
atagcacctc actaattata cgttgctggt ttatatgaga gtggtgcaga agttaattgt   5100
gctttaaata cttgcttagt gttcaagaaa tttgaaaagt attatatatt tataataaaa   5160
ataattcaga tccgactcaa tctagtaaaa ttttacaaac attctaaagg ggatcttctt   5220
ttttctctac ttattgatca gtgttatata cttataataa agacaacctg atttgagatc   5280
cggcctaata taataaaatt ctacagacat ctcaagggag agatcttctt cttccctaca   5340
tcttgacctt tttgatcaaa atttcctccc ctctatttcc acattggttg atcatatgaa   5400
tcaacagaaa ggtaccaaaa agtttttaaa aataaacaaa ggggttctta tgaaattcat   5460
atgatatatt gggtctaatt attagaatca attttaagtt taaacaaatt taaaattcaa   5520
aactcaattc catttttgtt tgaacggaaa gttactaatt gttaagaaaa ataattcata   5580
ttagcgtata aattggaaat tgaccaaaac taaaattatt gtatagttaa tctatattaa   5640
aaggacatgt aattaaaaac cattaaaact attatagaat aaattaaatc ttcattctat   5700
acatacaaag tcattaataa ttaaaaaact atattaagat ataaactata ttcaaaaaat   5760
attaaaaaca ataactaaat aaaaaaaaca attgaaaatt acgaattaat gttaaaatca   5820
agggacttaa ataaaaatat cccaaaatac aaaacattag cttcctttcc catccacgtg   5880
attgcaaagt ttacatggtg tttcctagtg cttgtgcgac tccaaccttt tatttacttt   5940
tttcttttct ttatttgaac aattatttga taatgattag aattttggga ttgttgctca   6000
tcgtacgtgc aacacttaaa atcactatga tttttcataa tttatataac ctatatcgtt   6060
ttggaaatta atgttattat ttatattgtt ttaataaaaa taccatctac ctcttttaat   6120
ttatgatcca tttcttattt gaaaattcaa attgacagtt gtctaactaa acaccatcgc   6180
actccaataa aattgtaatt ttttctatcg tgaatagtac actcaaaagt atgttgttaa   6240
caaacaaatc aattagcctt tttctacctc tattcatcat cttcttaata gcgtgtttat   6300
gtcacgtgtt gagattttag ttccggtcac gtgtggcctt aaacccgaat ttcttacgca   6360
tgagtctaag ttagcctctg atcctcgcta tggagatgct tggcacagtt tacctaggta   6420
agtaaacaag gaatagagct attagaaagc atcagagagt taggagaatg tggaagtgtt   6480
tctattactc aaagctaact tggatacaaa taaaagaggg agcctctcct ttaggcaagc   6540
ctattttgat ctgacggttg caattaatct cgaataggag gggtcgaact tctcactcag   6600
tttcacatta tctcttggtg cttagttggc ctccgccttg agacacattc aaataacacc   6660
tagtcttaac acttttggct tcttattgtg cgtatccttc attactcaaa tgccacaaag   6720
cctcattact taagactctc ggtcgctccc actaccttcg actttagact catctaagat   6780
cttcccaatc gtagacaact tggccttggt ggggaaatct tgcaccctac ggggccttac   6840
ataagaagca attaaatggc tttctctcac ccacctt                            6877
<210>11
<211>325
<212>PRT
<213>陆地棉
<400>11
Met Leu Phe Leu Thr Gln Leu Leu Ser Leu Thr Asp Gly Arg Asp Ile
1               5                   10                  15
Gly Val Cys Tyr Gly Leu Asn Gly Asn Asn Leu Pro Ser Pro Gly Asp
            20                  25                  30
Val Ile Asn Lcu Phe Lys Thr Ser Gly Ile Asn Asn Ile Arg Leu Tyr
        35                  40                  45
Gln Pro Tyr Pro Glu Val Leu Glu Ala Ala Arg Gly Ser Gly Ile Ser
    50                  55                  60
Leu Ser Met Ser Thr Thr Asn Glu Asp Ile Gln Ser Leu Ala Thr Asp
65                  70                  75                  80
Gln Ser Ala Ala Asp Ala Trp Val Asn Thr Asn Ile Val Pro Tyr Lys
                85                  90                  95
Glu Asp Val Gln Phe Arg Phe Ile Ile Ile Gly Asn Glu Ala Ile Pro
            100                 105                 110
Gly Gln Ser Ser Ser Tyr Ile Pro Gly Ala Met Asn Asn Ile Met Asn
        115                 120                 125
Ser Leu Ala Ser Phe Gly Leu Gly Thr Thr Lys Val Thr Thr Val Val
    130                 135                 140
Pro Met Asn Ala Leu Ser Thr Ser Tyr Pro Pro Ser Asp Gly Ala Phe
145                 150                 155                 160
Gly Ser Asp Ile Thr Ser Ile Met Thr Ser Ile Met Ala Ile Leu Val
                165                 170                 175
Arg Gln Asp Ser Pro Leu Leu Ile Asn Val Tyr Pro Tyr Phe Ala Tyr
            180                 185                 190
Ala Ser Asp Pro Thr His Ile Ser Leu Asn Tyr Ala Leu Phe Thr Ser
        195                 200                 205
Thr Ala Pro Val Val Val Asp Gln Gly Leu Glu Tyr Tyr Asn Leu Phe
    210                 215                 220
Asp Gly Met Val Asp Ala Phe Asn Ala Ala Leu Asp Lys Ile Gly Phe
225                 230                 235                 240
Gly Gln Ile Thr Leu Ile Val Ala Glu Thr Gly Trp Pro Thr Ala Gly
                245                 250                 255
Asn Glu Pro Tyr Thr Ser Val Ala Asn Ala Gln Thr Tyr Asn Lys Asn
            260                 265                 270
Leu Leu Asn His Val Thr Gln Lys Gly Thr Pro Lys Arg Pro Glu Tyr
        275                 280                 285
Ile Met Pro Thr Phe Phe Phe Glu Met Phe Asn Glu Asn Leu Lys Gln
    290                 295                 300
Pro Thr Val Glu Gln Asn Phe Gly Phe Phe Phe Pro Asn Met Asn Pro
305                 310                 315                 320
Val Tyr Pro Phe Trp
                325
<210>12
<211>325
<212>PRT
<213>陆地棉
<400>12
Met Val Phe Leu Thr Gln Leu Leu Ser Leu Thr Asp Gly Arg Asp Ile
1               5                   10                  15
Gly Val Cys Tyr Gly Leu Asn Gly Asn Asn Leu Pro Ser Pro Gly Asp
            20                  25                  30
Val Ile Asn Leu Tyr Lys Thr Ser Gly Ile Asn Asn Ile Arg Leu Tyr
        35                  40                  45
Gln Pro Tyr Pro Glu Val Leu Glu Ala Ala Arg Gly Ser Gly Ile Ser
    50                  55                  60
Leu Ser Met Gly Pro Arg Asn Glu Asp Ile Gln Ser Leu Ala Lys Asp
65                  70                  75                  80
Gln Ser Ala Ala Asp Ala Trp Val Asn Thr Asn Ile Val Pro Tyr Lys
                85                  90                  95
Asp Asp Val Gln Phe Lys Leu Ile Thr Ile Gly Asn Glu Ala Ile Ser
            100                 105                 110
Gly Gln Ser Ser Ser Tyr Ile Pro Asp Ala Met Asn Asn Ile Met Asn
        115                 120                 125
Ser Leu Ala Leu Phe Gly Leu Gly Thr Thr Lys Val Thr Thr Val Val
    130                 135                 140
Pro Met Asn Ala Leu Ser Thr Ser Tyr Pro Pro Ser Asp Gly Ala Phe
145                 150                 155                 160
Gly Ser Asp Ile Thr Ser Ile Met Thr Ser Ile Met Ala Ile Leu Ala
                165                 170                 175
Val Gln Asp Ser Pro Leu Leu Ile Asn Val Tyr Pro Tyr Phe Ala Tyr
            180                 185                 190
Ala Ser Asp Pro Thr His Ile Ser Leu Asp Tyr Ala Leu Phe Thr Ser
        195                 200                 205
Thr Ala Pro Val Val Val Asp Gln Gly Leu Glu Tyr Tyr Asn Leu Phe
    210                 215                 220
Asp Gly Met Val Asp Ala Phe Asn Ala Ala Leu Asp Lys Ile Gly Phe
225                 230                 235                 240
Gly Gln Ile Thr Leu Ile Val Ala Glu Thr Gly Trp Pro Thr Ala Gly
                245                 250                 255
Asn Glu Pro Tyr Thr Ser Val Ala Asn Ala Gln Thr Tyr Asn Lys Asn
            260                 265                 270
Leu Leu Asn His Val Thr Gln Lys Gly Thr Pro Lys Arg Pro Glu Tyr
        275                 280                 285
Ile Met Pro Thr Phe Phe Phe Glu Met Phe Asn Glu Asp Leu Lys Gln
    290                 295                 300
Pro Thr Val Glu Gln Asn Phe Gly Phe Phe Phe Pro Asn Met Asn Pro
305                 310                 315                 320
Val Tyr Pro Phe Trp
                325
<210>13
<211>134
<212>DNA
<213>人工
<220>
<223>前-miRA1
<220>
<221>misc_feature
<222>(17)..(36)
<223>miRNA链I
<220>
<221>misc_feature
<222>(87)..(107)
<223>miRNA链II
<400>13
tctagggtaa gggaggtcct gtcgaaccag aatggcacag ggtactttct tgcatgcttg    60
agcctttcat gcttgaagct ctgcgccatt ctcgttcaga caggatccac ttttctctct    120
ctctctcact cact                                                      134
<210>14
<211>146
<212>DNA
<213>人工
<220>
<223>具有克隆位点的前miRA1
<400>14
ccatggtcta gggtaaggga ggtcctgtcg aaccagaatg gcacagggta ctttcttgca    60
tgcttgagcc tttcatgctt gaagctctgc gccattctcg ttcagacagg atccactttt    120
ctctctctct ctcactcact gctagc                                         146
<210>15
<211>134
<212>DNA
<213>人工
<220>
<223>前-miRD1
<220>
<221>misc_feature
<222>(17)..(36)
<223>miRNA链I
<220>
<221>misc_feature
<222>(87)..(107)
<223>miRNA链II
<400>15
tctagggtaa gggaggatcc tgtacagcca gaatggacag ggtactttct tgcatgcttg    60
agcctttcat gcttgaagct ctgcccattc tgcctgtaac aggattccac ttttctctct    120
ctctctcact cact                                                      134
<210>16
<211>146
<212>DNA
<213>人工
<220>
<223>具有克隆位点的前-miRD1
<400>16
ccatggtcta gggtaaggga ggatcctgta cagccagaat ggacagggta ctttcttgca    60
tgcttgagcc tttcatgctt gaagctctgc ccattctgcc tgtaacagga ttccactttt    120
ctctctctct ctcactcact gctagc                                         146
<210>17
<211>134
<212>DNA
<213>人工
<220>
<223>前-miRA2
<220>
<221>misc_feature
<222>(17)..(36)
<223>微小RNA链I
<220>
<221>misc_feature
<222>(87)..(107)
<223>微小RNA链II
<400>17
tctagggtaa gggaggttcc caatgatgat gaacctacag ggtactttct tgcatgcttg    60
agcctttcat gcttgaagct ctgcaggttc atcatcaatt gggaatccac ttttctctct    120
ctctctcact cact                                                      134
<210>18
<211>134
<212>DNA
<213>人工
<220>
<223>前-miRA2aa
<220>
<221>misc_feature
<222>(17)..(36)
<223>微小RNA链I
<220>
<221>misc_feature
<222>(87)..(107)
<223>微小RNA链II
<400>18
tctagggtaa gggaggttcc caatgatgat gaacctacag ggtactttct tgcatgcttg    60
agcctttcat gcttgaagct ctgcaggttc ataatcactt gggaatccac ttttctctct    120
ctctctcact cact                                                      134
<210>19
<211>146
<212>DNA
<213>人工
<220>
<223>具有克隆位点的前-miRA2aa
<400>19
ccatggtcta gggtaaggga ggttcccaat gatgatgaac ctacagggta ctttcttgca    60
tgcttgagcc tttcatgctt gaagctctgc aggttcataa tcacttggga atccactttt    120
ctctctctct ctcactcact gctagc                                         146
<210>20
<211>134
<212>DNA
<213>人工
<220>
<223>前-miRD2
<220>
<221>misc_feature
<222>(17)..(36)
<223>微小RNA链I
<220>
<221>misc_feature
<222>(87)..(107)
<223>微小RNA链II
<400>20
tctagggtaa gggaggattc ccaatagtga tcaactacag ggtactttct tgcatgcttg    60
agcctttcat gcttgaagct ctgcagttga tccctatatg ggaattccac ttttctctct    120
ctctctcact cact                                                      134
<210>21
<211>146
<212>DNA
<213>人工
<220>
<223>具有克隆位点的前-miRD2
<400>21
ccatggtcta gggtaaggga ggattcccaa tagtgatcaa ctacagggta ctttcttgca    60
tgcttgagcc tttcatgctt gaagctctgc agttgatccc tatatgggaa ttccactttt    120
ctctctctct ctcactcact gctagc                  146