《具有增强的产量相关性状的植物和用于产生该植物的方法.pdf》由会员分享,可在线阅读,更多相关《具有增强的产量相关性状的植物和用于产生该植物的方法.pdf(324页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 102971427 A (43)申请公布日 2013.03.13 CN 102971427 A *CN102971427A* (21)申请号 201180024343.6 (22)申请日 2011.03.18 10157064.6 2010.03.19 EP 10176777.0 2010.09.15 EP 61/315,437 2010.03.19 US 61/382,936 2010.09.15 US C12N 15/82(2006.01) C12N 15/29(2006.01) C12N 15/54(2006.01) A01H 5/00(2006.01) (71。
2、)申请人 巴斯夫植物科学有限公司 地址 德国路德维希港 (72)发明人 Y海茨费尔德 (74)专利代理机构 北京市中咨律师事务所 11247 代理人 陈迎春 黄革生 (54) 发明名称 具有增强的产量相关性状的植物和用于产生 该植物的方法 (57) 摘要 本发明提供了核酸和编码的果糖磷酸激酶 (PFK) 。 本发明还提供了用于在植物中通过调节编 码果糖磷酸激酶的核酸分子的表达而增强产量相 关性状的方法。具有编码果糖磷酸激酶的核酸的 受调节表达的植物相对于对照植物具有增加的产 量相关性状。 (30)优先权数据 (85)PCT申请进入国家阶段日 2012.11.16 (86)PCT申请的申请数据 。
3、PCT/IB2011/051140 2011.03.18 (87)PCT申请的公布数据 WO2011/114312 EN 2011.09.22 (51)Int.Cl. 权利要求书 3 页 说明书 78 页 序列表 239 页 附图 3 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书 3 页 说明书 78 页 序列表 239 页 附图 3 页 1/3 页 2 1. 用于在植物中相对于对照植物增强产量的方法, 包括调节编码多肽的核酸分子在 植物中的表达, 其中所述多肽包含至少一个 Interpro 结构域 IPR000023 或 Interpro 结构 域 IPR012。
4、004 结构域, 优选地含有二者, 并且其中所述多肽在氨基端氨基酸序列中包含 SAT 区。 2. 权利要求 1 的方法, 其中所述多肽包含一个或多个以下基序 : 基序 1(SEQ ID NO : 82) : PKTIDNDILPAVLIDKRSTFGFDTAVEEAQRAINASAHYVIEAE ; 基序 2(SEQ ID NO : 83) : AVIPRSANASDNVIYLCTLVLAGQHSNAVIHGAMFAGYFTSGFI T ; 或 基序 3(SEQ ID NO : 84) : AACIVTCGGLCPGLNTDVIREILV ; 优选地, 所述多肽包含一个或多个以下基序 : 基序。
5、 4(SEQ ID NO : 85) : PKTIDNDILLMIDKTFGFDTAVEEAQRKAINSAAYKIVEAHRSAYHNG ; 基序 5(SEQ ID NO : 86) : ASCVRATNASDAGRILYCTVILGQNAVHGAAFAGFYSTGITVGILCV NTHYVA ; 或 基序 6(SEQ ID NO : 87) : RAGPRKEEKIYFYEDPEEVKAAIVTCGGLCPGLNDVIVRQILVIFTLE。 3. 权利要求 1 或 2 的方法, 其中所述受调控的表达通过在植物中引入和表达果糖磷酸 激酶 (PFK) 之编码核酸分子而实现。 4. 权利要求。
6、 1-3 中任一项的方法, 其中所述多肽通过核酸分子编码, 所述核酸分子包 含选自下述的核酸分子 : (i)SEQ ID NO : 80、 1、 3、 5、 9、 11、 13、 15、 17、 19、 21、 23、 25、 27、 29、 31、 33、 35、 37、 47、 49、 51、 53、 55、 57、 59、 61、 63、 65、 67、 69、 71、 73 或 75 的任意之一所示的核酸 ; (ii)SEQ ID NO : 80、 1、 3、 5、 7、 9、 11、 13、 15、 17、 19、 21、 23、 25、 27、 29、 31、 33、 35、 37。
7、、 39、 41、 43、 45、 47、 49、 51、 53、 55、 57、 59、 61、 63、 65、 67、 69、 71、 73 或 75 的任意之一所示的核酸的 互补序列 ; (iii)SEQ ID NO : 81、 2、 4、 6、 8、 10、 12、 14、 16、 18、 20、 22、 24、 26、 28、 30、 32、 34、 36、 38、 40、 42、 44、 46、 48、 50、 52、 54、 56、 58、 60、 62、 64、 66、 68、 70、 72、 74 或 76 的任意之一所示的多 肽的编码核酸, 优选地, 由于遗传密码的简并性,。
8、 所述分离的核酸可以衍生自 SEQ ID NO : 81、 2、 4、 6、 10、 12、 14、 16、 18、 20、 22、 24、 26、 28、 30、 32、 34、 36、 38、 48、 50、 52、 54、 56、 58、 60、 62、 64、 66、 68、 70、 72、 74 或 76 的任意之一所示的多肽序列, 并进一步优选地赋予相对于对 照植物而言增强的产量相关性状。 (iv) 核酸, 其以递增优选顺序与 SEQ ID NO : 80、 1、 3、 5、 7、 9、 11、 13、 15、 17、 19、 21、 23、 25、 27、 29、 31、 33、。
9、 35、 37、 39、 41、 43、 45、 47、 49、 51、 53、 55、 57、 59、 61、 63、 65、 67、 69、 71、 73 或 75 的核酸序列的任一具有至少 30、 31、 32、 33、 34、 35、 36、 37、 38、 39、 40、 41、 42、 43、 44、 45、 46、 47、 48、 49、 50、 51、 52、 53、 54、 55、 56、 57、 58、 59、 60、 61、 62、 63、 64、 65、 66、 67、 68、 69、 权 利 要 求 书 CN 102971427 A 2 2/3 页 3 70、 71、。
10、 72、 73、 74、 75、 76、 77、 78、 79、 80、 81、 82、 83、 84、 85、 86、 87、 88、 89、 90、 91、 92、 93、 94、 95、 96、 97、 98或 99的 序列同一性, 并进一步优选地赋予相对于对照植物而言增强的产量相关性状, 其中所述核 酸编码的多肽不是 SEQ ID NO : 8、 40、 42、 44、 46 的任意之一所示的任一多肽序列的多肽 ; (v) 第一核酸分子, 其在严格杂交条件下与第二核酸分子杂交, 并优选地赋予相对于对 照植物而言增强的产量相关性状, 其中所述第一核酸编码的多肽不是SEQ ID NO : 。
11、8、 40、 42、 44、 46 的任意之一所示的任一多肽序列的多肽, 并且所述第二核酸分子是 (i) 至 (iv) 的核 酸分子 ; (vi) 编码所述多肽的核酸, 所述多肽以递增优选顺序与 SEQ ID NO : 81、 2、 4、 6、 10、 12、 14、 16、 18、 20、 22、 24、 26、 28、 30、 32、 34、 36、 38、 48、 50、 52、 54、 56、 58、 60、 62、 64、 66、 68、 70、 72、 74 或 76 的任意之一所示的氨基酸序列具有至少 50、 51、 52、 53、 54、 55、 56、 57、 58、 59、。
12、 60、 61、 62、 63、 64、 65、 66、 67、 68、 69、 70、 71、 72、 73、 74、 75、 76、 77、 78、 79、 80、 81、 82、 83、 84、 85、 86、 87、 88、 89、 90、 91、 92、 93、 94、 95、 96、 97、 98或 99的序列 同一性, 其中所述核酸编码的多肽不是 SEQ ID NO : 8、 40、 42、 44、 46 的任意之一所示的任一 多肽序列的多肽, 并优选地赋予相对于对照植物而言增强的产量相关性状。 5. 任一前述权利要求的方法, 其中所述增强的产量相关性状包括相对于对照植物而言 增。
13、加的产量, 优选增加的种子产量和 / 或枝条生物量。 6. 权利要求 1-5 中任一项的方法, 其中所述增强的产量相关性状是在非胁迫条件下获 得的。 7. 权利要求 1-5 中任一项的方法, 其中所述增强的产量相关性状是在干旱胁迫、 盐胁 迫或氮缺乏条件下获得的。 8. 权利要求 1-7 中任一项的方法, 其中所述核酸与组成型启动子, 优选地与 GOS2 启动 子, 最优选地与来自稻的 GOS2 启动子有效连接。 9. 权利要求 1-8 中任一项的方法, 其中所述核酸分子或所述多肽分别是植物来源的, 优选来自双子叶植物, 进一步优选来自杨柳科 (Salicaceae), 更优选来自杨属 (Po。
14、pulus), 最优选来自毛果杨 (Populustrichocarpa)。 10. 通过权利要求 1-9 中任一项方法可获得的植物或其部分, 包括种子, 其中所述植物 或其部分包含编码如在权利要求 1-9 中任一项所定义的所述多肽之重组核酸。 11. 构建体, 包含 : (i) 编码如权利要求 1-7 中任一项所定义的所述多肽的核酸 ; (ii) 能够驱动 (a) 的核酸序列表达的一个或多个控制序列 ; 和任选的 (iii) 转录终止序列。 12.权利要求11的构建体, 其中所述控制序列之一是组成型启动子, 优选GOS2启动子, 最优选来自稻的 GOS2 启动子。 13.权利要求11或12的。
15、构建体在用于制造植物的方法中的用途, 其中所述植物相对于 对照植物而言具有增加的产量, 特别是增加的种子产量和 / 或枝条生物量。 14. 用权利要求 11 或 12 的构建体转化的或者通过权利要求 1-9 中任一项的方法可获 得的植物、 植物部分或植物细胞, 其中所述植物或其部分包含编码如在权利要求 1-10 中任 权 利 要 求 书 CN 102971427 A 3 3/3 页 4 一项所定义的所述多肽之重组核酸。 15. 用于生产相对于对照植物具有增加的产量, 特别是增加的生物量和 / 或增加的种 子产量的转基因植物的方法, 包括 : (i) 在植物中引入和表达如权利要求 1-7 中任一。
16、项所定义的所述多肽之编码核酸 ; 和 (ii) 在促进植物生长和发育的条件下培养植物细胞。 16. 相对于对照植物而言具有增加的产量, 特别是增加的生物量和 / 或增加的种子产 量的植物, 获得自权利要求 3 中所定义的核酸受调控的表达, 所述核酸编码权利要求 1 或 2 中所定义的多肽, 或者源于权利要求 10 或 14 的转基因植物的转基因植物细胞。 17. 权利要求 10、 14 或 16 的植物, 或源自它的转基因植物细胞, 其中所述植物是作物 植物, 例如糖萝卜、 苜蓿、 三叶草、 菊苣、 胡箩卜、 木薯、 棉花、 大豆、 低芥酸油菜或者单子叶植 物, 例如甘蔗或者谷物, 例如稻、 。
17、玉米、 小麦、 大麦、 粟、 黑麦、 黑小麦、 高粱、 野小麦、 德国小 麦、 黑麦属、 一粒系小麦、 teff、 蜀黍和燕麦。 18. 用于生产产品的方法, 所述方法包括培养权利要求 10、 14、 16 或 17 的植物, 以及从 (i) 所述植物或 (ii) 所述植物的部分, 包括种子中生产所述产品或者通过 (i) 所述植物或 (ii) 所述植物的部分, 包括种子生产所述产品的步骤。 19. 权利要求 10 的植物的可收获部分, 其中所述可收获部分优选是枝条和 / 或根生物 量和 / 或种子。 20. 来自权利要求 10 的植物和 / 或权利要求 18 的植物的可收获部分的产品。 21.。
18、 如在权利要求 1-7 中任一项所定义的多肽之编码核酸相对于对照植物在增加产 量, 特别是增加种子产量和 / 或生物量中的用途。 22. 包含在植物细胞中的权利要求 11 或 12 的构建体。 23. 前述权利要求中的任一项, 其中所述核酸编码的多肽不是选自如下所示的序列的 多肽 (i)SEQ ID NO : 8、 40、 42、 44、 46 的任意之一, 和 / 或 (ii) 表 3 或表 4 或表 5 的任一多肽, 和 / 或 (iii) 在 UniProtKB/TrEMBL 数据库中公开为 B9HFR9 的序列。 权 利 要 求 书 CN 102971427 A 4 1/78 页 5 。
19、具有增强的产量相关性状的植物和用于产生该植物的方法 0001 以下优先申请 : US 61/315437、 EP 10157064.6、 US 61/382936、 EP10176777.0 引 入作为参考。 0002 本发明一般地涉及分子生物学领域, 并涉及通过调节编码果糖磷酸激酶 (PFK) 的 核酸在植物中的表达而增强产量相关性状的方法。 本发明还涉及具有调节了编码果糖磷酸 激酶 (PFK, EC : 2.7.1.11) 之核酸的表达的植物, 所述植物相对于相应的野生型植物或其他 对照植物而言具有增强的产量相关性状。本发明还提供可用于本发明方法的构建体。 0003 具有特殊经济意义的性状。
20、涉及增加的产量。 产量通常定义为作物生产的可测量的 经济价值。这可以就数量和 / 或品质方面进行定义。产量直接取决于几个因素, 例如器官 的数目和大小、 植物构造 ( 例如枝的数目 )、 种子生产, 以及叶衰老等等。根发育、 养分摄入 量、 胁迫耐性和早期萌发势 (early vigor) 也可以是决定产量的重要因素。因此, 优化前述 因素可以对增加作物产量有贡献。 0004 在田间条件下, 植物性能, 例如就生长、 发育、 生物量积累和种子生产而言, 取决于 植物对大量环境条件、 改变和胁迫的耐受性和适应性能力。 0005 农业生物技术人员使用几种参数的测量, 其指示转基因对作物产量的可能影。
21、响。 对于饲料作物如苜蓿、 青贮谷物和干草, 植物生物量与总产量相关。 然而, 对于谷物作物, 已 经将其他参数用于估计产量, 例如植物大小, 如通过植物总干重和鲜重、 地上和地下干重和 鲜重、 叶面积、 茎体积、 植物高度、 叶长、 根长、 分蘖数和叶数所测量。 早期发育阶段的植物大 小通常将与晚期发育阶段的植物大小有关。 具有更大叶面积的较大植物通常能够比较小的 植物吸收更多的光和二氧化碳, 因此很可能在同期增重更多。植物大小和生长速率存在着 强遗传组分, 因此, 种种多样化基因型植物在一种环境条件下的大小很可能与另一种环境 条件下的大小有关。以这种方式, 可以将标准环境用于模拟 (app。
22、roximate) 田地中作物所 遭遇的多样化动态环境。 表现出一种非生物胁迫耐受性的植物通常表现出另一种环境胁迫 耐受性。 在机制水平还不能理解这种交叉耐受的现象。 然而, 合理的期望是由于转基因的表 达, 表现出对低温, 例如寒冷温度和 / 或冰冻温度增强的耐受性的植物还表现出对干旱和 / 或盐和 / 或其他非生物胁迫的耐受。已经表征了植物中参与胁迫应答、 水使用和 / 或生物 量的一些基因, 但到目前为止, 研发具有改进产量的转基因作物植物的成功还是受限的。 0006 因此, 存在鉴定在最佳和 / 或亚最佳培育条件下, 当过表达或下调时, 赋予对多种 胁迫增加的耐受性和 / 或改进产量的。
23、基因的需求。 0007 目前发现, 可以通过调节植物中编码果糖磷酸激酶 (PFK) 多肽之核酸的表达而增 加产量和改进植物的多种产量相关性状。 0008 发明概述 0009 目前已令人惊讶地发现, 调节编码果糖磷酸激酶 (PFK) 之核酸的表达产生相对于 对照植物具有增强的产量和改进的产量相关性状, 特别是增加的种子生物量、 饱满种子数 和枝条生物量的植物, 优选在低氮条件下产生这样的植物。 0010 根据一个实施方案, 提供了相对于对照植物改进植物产量相关性状的方法, 所述 方法包括在植物中调节编码果糖磷酸激酶 (PFK) 之核酸的表达。 说 明 书 CN 102971427 A 5 2/7。
24、8 页 6 0011 因此, 根据本发明, 此处鉴定的基因可以相对于对照植物用于增强产量相关性状, 例如增加的种子生物量、 饱满种子数和枝条生物量, 优选在低氮条件下。 可以在转基因植物 及其合适的对照植物的田间试验中测定增加的产量。备选地, 可以在最佳的可控生长条件 下在模式植物中测定转基因增加产量的能力。可以通过与对照植物比较, 测量以下表型的 任意之一或者任意组合, 来测定增加的产量性状 : 植物的干可收获部分的产量、 植物的地上 干可收获部分的产量、 植物的地下干可收获部分的产量、 植物的鲜重可收获部分的产量、 植 物的地上鲜重可收获部分的产量、 植物的地下鲜重可收获部分的产量、 植物。
25、的果实 ( 鲜的 和干的二者 ) 的产量、 种子 ( 鲜的和干的 ) 的产量、 粒干重等。可以通过改善的种子产量、 固有生长和发育的修饰来证明植物增加的固有生产力, 改善的种子产量例如是增加的种子 / 粒大小、 增加的穗数、 每穗增加的种子数、 改善的种子饱满 / 改善的种子组分等, 固有生长 和发育例如是植物高度、 植物生长速率、 荚数、 节间数、 开花时间、 炸荚性 (podshattering)、 结瘤和氮固定的效率、 碳同化的效率、 幼苗萌发势 / 早期萌发势的改善、 增强的萌发效率、 植物结构的改善、 细胞周期修饰等。 0012 产量相关性状还可以被改善以增加植物对非生物环境胁迫的耐。
26、受性。 非生物胁迫 包括干旱、 低温、 盐度、 渗透胁迫、 遮光、 高植物密度、 机械胁迫和氧化胁迫。 可以监测以测定 对非生物环境胁迫增强的耐受的其他表型, 包括但不限于枯萎 ; 叶变褐 ; 涨压 ; 叶或针状叶 下垂和/或脱落 ; 叶或针状叶早衰 ; 叶或针状叶中叶绿素的丢失和/或叶变黄。 可以在田间 试验中的作物植物中或者在可控培育条件下的模式植物中监测上述任一产量相关的表型, 以证明转基因植物具有对非生物环境胁迫增加的耐受性。 0013 定义 0014 多肽 / 蛋白质 0015 术语 “多肽” 和 “蛋白质” 在本文中可互换使用, 指通过肽键连接在一起的处于任 意长度的氨基酸聚合形式。
27、。 0016 多核苷酸 / 核酸 / 核酸序列 / 核苷酸序列 0017 术语 “多核苷酸” 、“核酸序列” 、“核苷酸序列” 、“核酸” 、“核酸分子” 在本文中可互 换使用并且指任意长度聚合无分支形式的核苷酸, 即核糖核苷酸或脱氧核糖核苷酸或这二 者组合。 0018 同源物 0019 蛋白质的 “同源物” 包括这样的肽、 寡肽、 多肽、 蛋白质及酶, 它们相对于非修饰的 所讨论蛋白质具有氨基酸替换、 缺失和 / 或插入并且与其所源自的非修饰蛋白质具有相似 生物学活性和功能活性。 0020 缺失指从蛋白质中移除一个或多个氨基酸。 0021 插入指一个或多个氨基酸残基在蛋白质中预定位点内的引入。
28、。 插入可以包含氨基 端融合和 / 或羧基端融合以及单个或多个氨基酸的序列内插入。通常, 在氨基酸序列内部 的插入会比氨基端融合或羧基端融合小, 约 1-10 个残基的级别。氨基端或羧基端融合蛋白 或融合肽的例子包括如酵母双杂交系统中所用转录激活物的结合结构域或激活结构域、 噬 菌体外壳蛋白、 ( 组氨酸 )-6- 标签、 谷胱甘肽 S- 转移酶 - 标签、 蛋白 A、 麦芽糖结合蛋白、 二 氢叶酸还原酶、 Tag 100 表位、 c-myc 表位、- 表位、 lacZ、 CMP( 钙调蛋白结合肽 )、 HA 表位、 蛋白 C 表位和 VSV 表位。 说 明 书 CN 102971427 A 。
29、6 3/78 页 7 0022 替换指以具有相似特性 ( 如相似疏水性、 亲水性、 抗原性、 形成或破坏 - 螺旋结 构或 - 折叠结构的倾向 ) 的其它氨基酸替换蛋白质的氨基酸。氨基酸替换一般是单个残 基的, 不过可以是簇集性的, 这取决于置于多肽的功能性约束, 并且可以在 1-10 个氨基酸 的范围内 ; 插入通常会是约1-10个氨基酸残基级别。 氨基酸替换优选地是保守性氨基酸替 换。保守性替换表是本领域众所周知的 ( 见例如 Creighton(1984)Proteins.W.H.Freeman 和 Company( 编著 ) 和下表 1)。 0023 表 1 : 保守性氨基酸替换的例子。
30、 0024 残基保守性替换残基 保守性替换 AlaSerLeuIle ; Val ArgLysLysArg ; Gln AsnGln ; HisMetLeu ; Ile AspGluPheMet ; Leu ; Tyr GlnAsnSerThr ; Gly CysSerThrSer ; Val GluAspTrpTyr GlyProTyrTrp ; Phe HisAsn ; GlnValIle ; Leu IleLeu, Val 0025 0026 氨基酸替换、 缺失和 / 或插入可以使用本领域众所周知的肽合成技术如固相肽合 成法等或通过重组 DNA 操作而容易地进行。用于操作 DNA 序列以。
31、产生蛋白质的替换、 插入 或缺失变体的方法是本领域众所周知的。例如, 用于在 DNA 中的预定位点处产生替换突 变的技术是本领域技术人员众所周知的并且包括 M13 诱变法、 T7-Gen 体外诱变法 (USB, Clevelaand, OH)、 QuickChange 位点定向诱变法 (Stratagene, SanDiego, CA)、 PCR- 介导的 位点定向诱变或其它位点定向诱变法。 0027 衍生物 0028 “衍生物” 包括这样的肽、 寡肽、 多肽, 其中与天然存在形式的蛋白质 ( 如目的蛋 白 ) 的氨基酸序列相比, 它们包含以非天然存在的氨基酸残基对氨基酸的替换或非天然存 在的。
32、氨基酸残基的添加。蛋白质的 “衍生物” 也包含这样的肽、 寡肽、 多肽, 其中与多肽的天 然存在形式的氨基酸序列相比, 它们包含天然存在的经改变 ( 糖基化、 酰化、 异戊二烯化、 磷酸化、 肉豆蔻酰化、 硫酸化等 ) 的氨基酸残基或非天然的经改变的氨基酸残基。与衍生 说 明 书 CN 102971427 A 7 4/78 页 8 物所来源的氨基酸序列相比, 该衍生物可以也包含与所述氨基酸序列共价或非共价结合的 一个或多个非氨基酸取代基或添加 ( 例如报道分子或其它配体 ), 如为促进检测该衍生物 而结合的报道分子, 和与天然存在的蛋白质的氨基酸序列相对比的非天然存在的氨基酸残 基。此外,“衍。
33、生物” 还包括天然存在形式蛋白质与标签肽 ( 如 FLAG、 HIS6 或硫氧还蛋白 ) 的融合体 ( 标签肽的综述参阅 Terpe, Appl.Microbiol.Biotechnol.60, 523-533, 2003)。 0029 直向同源物 / 旁系同源物 0030 直向同源物和旁系同源物包含用来描述基因先祖关系的进化概念。 旁系同源物是 相同物种内起源于先祖基因复制的基因 ; 直向同源物是来自不同生物的起源于物种形成的 基因, 并且也来源于共同的先祖基因。 0031 结构域, 基序 / 共有序列 / 特征序列 0032 术语 “结构域” 指依据进化相关蛋白质的序列比对结果而在特定位置。
34、处保守的一 组氨基酸。尽管在其它位置处的氨基酸可以在同源物之间变动, 然而在特定位置处的高度 保守的氨基酸指示在蛋白质的结构、 稳定性或功能方面可能是必需的氨基酸。结构域因通 过在蛋白质同源物家族的比对序列中的高保守程度而被鉴定, 它们可以用作鉴定物以确定 任意的所讨论多肽是否属于先前已鉴定的多肽家族。 0033 术语 “基序” 或 “共有序列” 或 “特征序列” 指在进化相关蛋白质的序列中的短保守 区。 基序往往是结构域的高度保守部分, 不过也可以仅包括结构域的部分, 或可以位于保守 结构域之外 ( 若基序的全部氨基酸位于定义的结构域之外 )。 0034 存在用于鉴定结构域的专门数据库, 例。
35、如 SMART(Schultz 等 (1998)Proc.Natl. Acad.Sci.USA 95, 5857-5864 ; Letunic 等 (2002)Nucleic AcidsRes 30, 242-244), InterPro(Mulder 等,(2003)Nucl.Acids.Res.31, 315-318),Prosite(Bucher 和 Bairoch(1994), A generalized profile syntax forbiomolecular sequences motifs and its function in automatic sequenceinter。
36、pretation.(In)ISMB-94 ; Proceedings 2nd International Conferenceon Intelligent Systems for Molecular Biology.Altman R., Brutlag D., KarpP., Lathrop R., Searls D. 编著, 第 53-61 页, AAAI Press, Menlo Park ; Hulo 等, Nucl.Acids.Res.32 : D134-D137, (2004) 或 者 Pfam(Bateman 等, Nucleic Acids Research 30(1) : 2。
37、76-280(2002)。用于计算机分析蛋白质序列的一组工具可获得 自 ExPASy 蛋白组服务器 (Swiss Institute ofBioinformatics(Gasteiger 等, ExPASy : the proteomics server for in-depthprotein knowledge and analysis, Nucleic Acids Res.31 : 3784-3788(2003)。还可以使用常规技术 ( 如通过序列比对 ) 来鉴定结构域或基 序。 0035 比对序列以进行比较的方法为本领域所众所周知, 这些方法包括 GAP、 BESTFIT、 BLAST、。
38、 FASTA 和 TFASTA。GAP 利用 Needleman 和 Wunsch(1970)J Mol Biol 48 : 443-453) 的算法来寻找两序列间使匹配数最高并使空位数最少的全局比对 ( 即在完整 序列上 )。BLAST 算法 (Altschul 等 (1990)J Mol Biol 215 : 403-10) 在两序列间计算 百分比序列同一性并进行相似性的统计学分析。用于进行 BLAST 分析的软件在国家生物 技术信息中心 (National Centre for Biotechnology Information(NCBI) 向公众提 供。可以使用例如默认配对比对参数的 。
39、ClustalW 多重序列比对算法 (1.83 版 )( 采用 默认配对比对参数 ) 和百分比评分法来容易地鉴定同源物。也可以使用 MatGAT 软件包 说 明 书 CN 102971427 A 8 5/78 页 9 (Campanella 等, BMC Bioinformatics.2003 Jul 10 ; 4 : 29.MatGAT : an application that generatessimilarity/identity matrices using protein or DNA sequence)中提供的方 法之一来确定全局的相似性和同一性百分比。本领域技术人员会意识到, 。
40、可以进行少量手 动编辑以优化保守性基序之间的比对。此外, 还可以使用特定的结构域代替使用全长序列 来鉴定同源物。 序列同一性值可以是采用上述程序使用默认参数在完整的核酸或氨基酸序 列上或在所选择的结构域或保守的基序上测定的。对于局部比对, Smith-Waterman 算法是 特别有用的 (Smith TF, Waterman MS(1981)J.Mol.Biol 147(1) ; 195-7)。 0036 交互 BLAST 0037 通常, 这包括以查询序列 ( 例如, 利用实施例章节表 A 中所列的任一序列 ) 针对任 何序列数据库如可公共获得的 NCBI 数据库进行 BLAST 的首次 。
41、BLAST。当从核苷酸序列开 始时, 通常使用 BLASTN 或 TBLASTX( 利用标准默认值 ), 而当从蛋白质序列开始时, 则使用 BLASTP或TBLASTN(利用标准默认值)。 BLAST结果可以任选地过滤。 接着使用过滤的结果或 者未过滤的结果的全长序列针对查询序列来源生物的序列进行反向 BLAST( 二次 BLAST)。 然后比较首次和二次 BLAST 的结果。如果首次 BLAST 中的高排名命中来自查询序列来源的 相同物种, 然后反向 BLAST 理想地导致查询序列处于最高命中之列, 则找到了旁系同源物 ; 如果首次 BLAST 中高排名命中不来自查询序列来源的相同物种, 且。
42、优选地在反向 BLAST 时 导致查询序列在最高命中之列, 则找到了直向同源物。 0038 高排名的命中是那些 E 值低的命中。E 值越低, 分值越具有显著性 ( 或者换句话 说, 偶然发现此命中的几率越低 )。E 值的计算是本领域众所周知的。除了 E 值之外, 还对 比较进行同一性百分比评分。同一性百分比是指两比较核酸 ( 或多肽 ) 序列之间在特定长 度上的相同核苷酸 ( 或氨基酸 ) 数。在大家族的情况下可以使用 ClustalW, 继之以邻接树 来辅助相关基因的聚类可视化, 和鉴定直向同源物和旁系同源物。 0039 杂交 0040 如本文中所定义的术语 “杂交” 是其中基本上同源的互补。
43、核苷酸序列彼此退火的 过程。杂交过程可以完全在溶液中进行, 即两种互补性核酸均处于溶液中。杂交过程也可 以在互补性核酸之一固定到基质如磁珠、 琼脂糖 (Sepharose) 珠或任何其它树脂的情况下 发生。 杂交过程也可以在互补性核酸之一固定至固相支持体如硝酸纤维素膜或尼龙膜上或 通过例如照相平版印刷术固定至例如硅酸玻璃支持物 ( 后者称作核酸阵列或微阵列或称 作核酸芯片 ) 上的情况下进行。为使杂交发生, 通常将核酸分子热变性或化学变性以使双 链解链成为两条单链和 / 或去除来自单链核酸的发夹或其它二级结构。 0041 术语 “严格性” 指在其中发生杂交的条件。杂交的严格性受条件如温度、 盐。
44、浓度、 离子强度和杂交缓冲液组成影响。通常, 将低严格性条件选择为在确定的离子强度及 pH 时 低于特定序列热解链温度 (Tm) 约 30。中等严格性条件是此时温度低于 Tm约 20, 高严 格性条件是此时温度低于 Tm约 10。高严格性杂交条件一般用于分离与靶核酸序列具有 高序列相似性的杂交序列。然而, 核酸可以在序列上有所偏差但因遗传密码子的简并性而 依旧编码基本上相同的多肽。 因而有时候可能需要中等严格性杂交条件来鉴定此类核酸分 子。 0042 Tm是在确定的离子强度及 pH 下 50的靶序列与完全匹配的探针杂交时的温度。 Tm取决于溶液条件和探针的碱基组成及长度。例如, 较长的序列在较。
45、高温度下特异性地杂 说 明 书 CN 102971427 A 9 6/78 页 10 交。从低于 Tm约 16直至 32获得最大杂交速率。一价阳离子在杂交溶液中的存在降低 了两条核酸链间的静电排斥, 因而促进杂交分子形成 ; 这种作用对于高达 0.4M 的钠浓度是 明显的 ( 对于更高浓度, 这种效应可以忽略 )。甲酰胺降低 DNA-DNA 和 DNA-RNA 双链体的解 链温度, 每百分数甲酰胺降低 0.6 至 0.7, 并且添加 50甲酰胺允许在 30 至 45进行杂 交, 虽然杂交速率会降低。碱基对错配降低了杂交速率及双链体的热稳定性。平均而言并 且对于大的探针来说, 每碱基错配 Tm下。
46、降约 1。取决于杂交分子的类型, Tm可以使用下 列等式计算 : 0043 1)DNA-DNA 杂交分子 (Meinkoth 和 Wahl, Anal.Biochem., 138 : 267-284, 1984) : 0044 Tm 81.5 +16.6xlog10Na+a+0.41x G/Cb-500xLc-1-0.61x甲酰胺 0045 2)DNA-RNA 或 RNA-RNA 杂交分子 : 0046 Tm 79.8+18.5(log10Na+a)+0.58( G/Cb)+11.8( G/Cb)2-820/Lc 0047 3)oligo-DNA 或 oligo-RNAd杂交分子 : 0048。
47、 对于 20 个核苷酸 : Tm 2(ln) 0049 对于 20-35 个核苷酸 : Tm 22+1.46(ln) 0050 a 或对于其它一价阳离子, 但是仅在 0.01-0.4M 范围内是精确的。 0051 b 仅对于 GC 在 30至 75范围内是精确的。 0052 cL 双链体的长度 ( 以碱基对计 )。 0053 d oligo, 寡核苷酸 ; l n, 引物的有效长度 2(G/C 数 )+(A/T 数 )。 0054 可以使用众多已知技术的任何一种来控制非特异性结合, 如例如用含蛋白质的溶 液封闭薄膜、 添加异源性 RNA、 异源性 DNA 及 SDS 至杂交缓冲液并且用 RNA。
48、 酶处理。对于非 同源性探针, 一系列杂交可以通过改变以下条件之一进行 : (i) 逐渐降低退火温度 ( 例如从 68至 42 ) 或 (ii) 逐渐降低甲酰胺浓度 ( 例如从 50至 0 )。技术人员了解杂交期 间可以加以改变和将维持或改变严格性条件的多种参数。 0055 除杂交条件之外, 杂交特异性一般还取决于杂交后洗涤的功能。为除去因非特异 性杂交所致的背景, 样品用稀释的盐溶液洗涤。此类洗涤的关键因素包括最终洗涤溶液的 离子强度及温度 : 盐浓度越低并且洗涤温度越高, 则洗涤的严格性越高。 洗涤条件一般在杂 交严格性上或低于杂交严格性而进行。阳性杂交产生至少两倍于背景信号的信号。通常, 用于核酸杂交分析法或基因扩增检测方法的合适严格性条件如上所述。 也可以选择更严格 或更不严格的条件。 技术人员了解洗涤期间可以加以改变和将维持或改变严格性条件的多 种参数。 0056 例如, 用于长度大于50个核苷酸的DNA杂交分子的常见高严格性杂交条件包括在 65于 1SSC 中或在 42于 1SSC 和 50甲酰胺中杂交, 随后在 65于 0.3SSC 中洗 涤。用于长度大于 50 个核苷酸的 DNA 杂交分子的中。