从烟草克隆细胞色素 P450 基因 本申请是中国发明申请 ( 发明名称 : 从烟草克隆细胞色素 P450 基因 ; 申请日 : 2004 年 10 月 15 日 ; 申请号 : 200480030385.0( 国际申请号 : PCT/US2004/034065) 的分案申 请。
技术领域 本 发 明 涉 及 从 烟 草 克 隆 细 胞 色 素 P450 基 因。 具 体 而 言, 本发明涉及在烟草 (Nicotiana) 植物中编码细胞色素 P450 酶 ( 下文称为 P450 和 P450 酶 ) 的核酸序列和使用 那些核酸序列来改变植物表型的方法。
背景技术 细胞色素 P450 催化各种化学上不同的底物的酶反应, 包括内源性和异源底物的 氧化、 过氧化和还原性代谢。在植物中, p450 参与包括植物产物合成在内的生化途径, 所 述产物例如是苯丙素 (phenylpropanoids)、 生物碱、 萜类、 脂质、 生氰糖苷 (cyanogenic glycoside) 和 葡 糖 异 硫 氰 酸 盐 (glucosinolates)(Chappel, Annu.Rev.Plant Physiol. Plant Mol.Biol.198, 49 : 311-343)。 细 胞 色 素 p450 也 称 为 血 红 素 - 硫 醇 盐 蛋 白 (heme-thiolate protein), 通常用作多组分电子转移链 ( 称为含 p450 的单加氧酶系统 ) 中的末端氧化酶。所催化的特定反应包括脱甲基化、 羟基化、 环氧化、 N- 氧化、 磺基氧化 (sulfooxidation)、 N-、 S- 和 O- 脱烷基化、 脱硫作用、 脱氨基作用和偶氮基、 硝基和 N- 氧化 物基团的还原。
烟草植物 p450 酶的各种作用涉及产生各种植物代谢物, 例如苯丙素、 生物碱、 萜 类、 脂质、 生氰糖苷、 葡糖异硫氰酸盐和其它化学物质的宿主。近年来, 人们开始了解一些 p450 酶影响植物中植物代谢物的组成。例如, 长期以来人们希望通过育种改变植物的所选 脂肪酸的特性来改善特定植物的风味和香味 ; 然而涉及控制这些叶子组成的水平的机理知 之甚少。下调与改变脂肪酸有关的 p450 酶可有助于积累提供更适宜的叶子表型质量的所 需脂肪酸。p450 酶的功能及其在植物组成中广泛的作用仍有待发现。例如, 特定类型的 p450 酶发现可催化脂肪酸分解为挥发性 C6- 和 C9- 醛和醇, 而主要是这些物质导致水果和 蔬菜具有 “新鲜翠绿” 的气味。可改变其它作为新目标的 p450 酶的水平, 通过改变烟草叶 子中的脂质组成和相关的降解代谢物来提高叶子组成的质量。 叶子中的几种这些成分受老 化的影响, 而老化刺激叶子质量特性的成熟。其它人也报道 p450 酶在改变涉及植物病原体 相互作用和疾病抗性的脂肪酸中起作用。
在 其 它 例 子 中, 已 提 示 p450 酶 涉 及 生 物 碱 的 生 物 合 成。 降 烟 碱 是 在 烟 草 (Nicotiana tabaceum) 中发现的少量生物碱。 推测它是这样产生的 : p450 介导的尼古丁脱 甲基化, 然后在 N 位酰化和亚硝基化, 从而产生一系列 N- 酰基降烟碱 (N-acylnonicotine) 和 N- 亚硝基降烟碱。推测的 p450 脱甲基酶催化的 N- 脱甲基化被认为是烟草中降烟碱生 物合成的主要来源。尽管认为该酶是微粒体酶, 但是迄今为止未能成功地纯化尼古丁脱甲 基化酶, 也未能分离到有关基因。
此外, 有假说认为 ( 但未证实 )p450 酶的活性受遗传控制并且也强烈地受环境因 素的影响。例如, 当植物达到成熟阶段后, 认为烟草中尼古丁的脱甲基化作用大大增加。另 外, 有假说认为 ( 还未证实 ) 脱甲基化基因含有当存在时能抑制 RNA 翻译的转座元件。
在本发明之前, p450 酶形式的多样性、 其结构和功能的不同使得对烟草 p450 酶的 研究十分困难。此外, 对 p450 酶的克隆至少部分由于这些膜定位的蛋白通常存在量低且经 常在纯化中不稳定而受阻。因此, 需要在植物中鉴定 p450 酶和与那些 p450 酶相关的核酸 序列。特别是, 在烟草中仅有少许细胞色素 p450 蛋白已见报道。本文所述的发明发现了许 多细胞色素 p450 片段, 这些片段基于它们的序列同一性而对应于几组 p450 种类。 发明内容
本发明针对植物 p450 酶。本发明还涉及来自烟草的植物 p450 酶。本发明也涉及 其表达由乙烯和 / 和植物老化诱导的植物中的 p450 酶。本发明还涉及植物中具有酶活性 的核酸序列, 例如可分类为氧化酶、 脱甲基酶等和其它酶, 以及使用那些序列来使这些酶的 表达降低和沉默和过度表达。 本发明也涉及在含有较高降烟碱水平的植物而非显示较低降 烟碱水平的植物中发现的 p450 酶。 本发明一方面涉及以下所示的核酸序列 : SEQ.ID.NO.1、 3、 5、 7、 9、 11、 13、 15、 17、 19、 21、 23、 25、 27、 29、 31、 33、 35、 37、 39、 41、 43、 45、 47、 49、 51、 53、 55、 57、 59、 61、 63、 65、 67、 69、 71、 73、 75、 77、 79、 81、 83、 85、 87、 89、 91、 95、 97、 99、 101、 103、 105、 107、 109、 111、 113、 115、 117、 119、 121、 123、 125、 127、 129、 131、 133、 135、 137、 139、 143、 145、 147、 149、 151、 153、 155、 157、 159、 161、 163、 165、 167、 169、 171、 173、 175、 177、 179、 181、 183、 185、 187、 189、 191、 193、 195、 197、 199、 201、 203、 205、 207、 209、 211、 213、 215、 217、 219、 221、 223、 225、 227、 229、 231、 233、 235、 237、 239、 241、 243、 245、 247、 249、 251、 253、 255、 257、 259、 261、 263、 265、 267、 269、 271、 273、 275、 277、 279、 281、 283、 285、 287、 289、 291、 293、 295、 297、 299、 301、 303、 305、 307、 309、 311、 313 和 315。
在第 2 个相关的方面, 根据它们在细胞色素 p450 基序 GXRXCX(G/A) 后的第一核酸 到终止密码子的对应区域的同一性, 对那些含有大于 75%的核酸序列同一性的片段进行分 组。代表性的核酸组和各自的种类示于表 I。
在第 3 方面, 本发明涉及如以下所示的氨基酸序列 : SEQ.ID.NO.2、 4、 6、 8、 10、 12、 14、 16、 18、 20、 22、 24、 26、 28、 30、 32、 34、 36、 38、 40、 42、 44、 46、 48、 50、 52、 54、 56、 58、 60、 62、 64、 66、 68、 70、 72、 74、 76、 78、 80、 82、 84、 86、 88、 90、 92、 96、 98、 100、 102、 104、 106、 108、 110、 112、 114、 116、 118、 120、 122、 124、 126、 128、 130、 132、 134、 136、 138、 140、 144、 146、 148、 150、 152、 154、 156、 158、 160、 162、 164、 166、 168、 170、 172、 174、 176、 178、 180、 182、 184、 186、 188、 190、 192、 194、 196、 198、 200、 202、 204、 206、 208、 210、 212、 214、 216、 218、 220、 222、 224、 226、 228、 230、 232、 234、 236、 238、 240、 242、 244、 246、 248、 250、 252、 254、 256、 258、 260、 262、 264、 266、 268、 270、 272、 274、 276、 278、 280、 282、 284、 286、 288、 290、 292、 294、 296、 298、 300、 302、 304、 306、 308、 310、 312、 314 和 316。
在第 4 个相关的方面, 根据它们在细胞色素 p450 基序 GXRXCX(G/A) 后的第一核酸 到终止密码子的对应区域的同一性, 对那些含有大于 71%的核酸序列同一性的片段进行分 组。代表性的氨基酸组和各自的种类示于表 II。
在第 5 个方面, 本发明涉及如以下所示全长基因的氨基酸序列 : SEQ.ID.NO.150、 152、 154、 156、 158、 160、 162、 164、 166、 168、 170、 172、 174、 176、 178、 180、 182、 184、 186、 188、 190、 192、 194、 196、 198、 200、 202、 204、 206、 208、 210、 212、 214、 216、 218、 220、 222、 224、 226、 228、 230、 232、 234、 236、 238、 240、 242、 244、 246、 248、 250、 252、 254、 256、 258、 260、 262、 264、 266、 268、 270、 272、 274、 276、 278、 280、 282、 284、 286、 288、 290、 292、 294、 296、 298、 300、 302、 304、 306、 308、 310、 312、 314 和 316。
在第 6 个相关的方面, 根据彼此的同一性对那些含有大于 85%和更高的氨基酸序 列同一性的全长基因进行分组。代表性的氨基酸组和各自的种类示于表 III。
在第 7 个方面, 本发明涉及如 SEQ.ID.NO.299-357 所示片段的氨基酸序列。
在第 8 个相关的方面, 根据它们在第一细胞色素 p450 结构域 UXXRXXZ 到第 3 细胞 色素结构域 GXRXO 的对应区域的互相同一性, 对那些含有大于 90%和更高的氨基酸序列同 一性的片段进行分组, 其中 U 是 E 或 K, X 是任何氨基酸, Z 是 R、 T、 S 或 M。代表性的氨基酸 组和各自的种类示于表 IV。
在第 9 个相关的方面, p450 酶在烟草植物中的减少或消除或过度表达可使用 RNA 病毒系统瞬时实现。
评价得到的转化或感染的植物的表型改变, 包括 ( 但不限于 ) 使用本领域普通技 术人员常规可用的技术来分析内源性 p450RNA 转录物、 p450 表达肽和植物代谢物的浓度。
在第 10 个方面, 本发明也涉及产生具有改变的 p450 酶活性水平的转基因烟草谱 系。根据本发明, 这些转基因谱系含有有效地特定酶表达减少、 沉默或增加, 从而在烟草中 导致表型效应的核酸序列。 这种核酸序列包括 SEQ.ID.NO.1、 3、 5、 7、 9、 11、 13、 15、 17、 19、 21、 23、 25、 27、 29、 31、 33、 35、 37、 39、 41、 43、 45、 47、 49、 51、 53、 55、 57、 59、 61、 63、 65、 67、 69、 71、 73、 75、 77、 79、 81、 83、 85、 87、 89、 91、 95、 97、 99、 101、 103、 105、 107、 109、 111、 113、 115、 117、 119、 121、 123、 125、 127、 129、 131、 133、 135、 137、 139、 143、 145、 147、 149、 151、 153、 155、 157、 159、 161、 163、 165、 167、 169、 171、 173、 175、 177、 179、 181、 183、 185、 187、 189、 191、 193、 195、 197、 199、 201、 203、 205、 207、 209、 211、 213、 215、 217、 219、 221、 223、 225、 227、 229、 231、 233、 235、 237、 239、 241、 243、 245、 247、 249、 251、 253、 255、 257、 259、 261、 263、 265、 267、 269、 271、 273、 275、 277、 279、 281、 283、 285、 287、 289、 291、 293、 295、 297、 299、 301、 303、 305、 307、 309、 311、 313 和 315。
在本发明非常重要的第 11 方面, 与对照植物相比, 含有本发明核酸的植物栽培品 系在使用全长基因或其片段的下调能力或使用全长基因或其片段的过度表达能力上具有 改变的代谢物特性。
在本发明的第 12 方面, 含有本发明核酸的植物栽培品系具有对特定外源性化学 物质或植物害虫耐受的用途, 所述植物使用全长基因或其片段以更改来源于植物或植物以 外的代谢物的生物合成或降解。这种核酸序列包括 SEQ.ID.NO.1、 3、 5、 7、 9、 11、 13、 15、 17、 19、 21、 23、 25、 27、 29、 31、 33、 35、 37、 39、 41、 43、 45、 47、 49、 51、 53、 55、 57、 59、 61、 63、 65、 67、 69、 71、 73、 75、 77、 79、 81、 83、 85、 87、 89、 91、 95、 97、 99、 101、 103、 105、 107、 109、 111、 113、 115、 117、 119、 121、 123、 125、 127、 129、 131、 133、 135、 137、 139、 143、 145、 147、 149、 151、 153、 155、 157、 159、 161、 163、 165、 167、 169、 171、 173、 175、 177、 179、 181、 183、 185、 187、 189、 191、 193、 195、 197、 199、 201、 203、 205、 207、 209、 211、 213、 215、 217、 219、 221、 223、 225、 227、 229、 231、233、 235、 237、 239、 241、 243、 245、 247、 249、 251、 253、 255、 257、 259、 261、 263、 265、 267、 269、 271、 273、 275、 277、 279、 281、 283、 285、 287、 289、 291、 293、 295、 297、 299、 301、 303、 305、 307、 309、 311、 313 和 315。
在第 13 个方面, 本发明涉及筛选含有与所述核酸序列具有实质性核酸同一性的 基因的植物, 优选烟草。使用本发明有利于鉴定和选择含有精确的或实质性同一性的核酸 序列的植物, 其中这种植物是传统或转基因品种的育种程序、 诱变程序或天然存在的不同 植物种群的一部分。 可使用核酸探针结合核酸检测方法, 包括 ( 但不限于 ) 核酸杂交和 PCR 分析, 通过评价植物的核酸物质来筛选实质性核酸同一性的植物。核酸探针可由对应于以 下 SEQ ID 的所述核酸序列或其片段构成 : SEQ ID 1、 3、 5、 7、 9、 11、 13、 15、 17、 19、 21、 23、 25、 27、 29、 31、 33、 35、 37、 39、 41、 43、 45、 47、 49、 51、 53、 55、 57、 59、 61、 63、 65、 67、 69、 71、 73、 75、 77、 79、 81、 83、 85、 87、 89、 91、 95、 97、 99、 101、 103、 105、 107、 109、 111、 113、 115、 117、 119、 121、 123、 125、 127、 129、 131、 133、 135、 137、 139、 143、 145、 147、 149、 151、 153、 155、 157、 159、 161、 163、 165、 167、 169、 171、 173、 175、 177、 179、 181、 183、 185、 187、 189、 191、 193、 195、 197、 199、 201、 203、 205、 207、 209、 211、 213、 215、 217、 219、 221、 223、 225、 227、 229、 231、 233、 235、 237、 239、 241、 243、 245、 247、 249、 251、 253、 255、 257、 259、 261、 263、 265、 267、 269、 271、 273、 275、 277、 279、 281、 283、 285、 287、 289、 291、 293、 295、 297、 299、 301、 303、 305、 307、 309、 311、 313 和 315。 在第 14 个方面, 本发明涉及鉴定与所述核酸序列具有实质性氨基酸同一性的植 物基因, 优选烟草。可使用核酸探针结合核酸检测方法, 包括 ( 但不限于 ) 核酸杂交和 PCR 分析, 通过筛选植物 cDNA 文库来鉴定植物基因, 包括 cDNA 和基因组克隆, 优选烟草的 cDNA 和基因组克隆。核酸探针可由对应于以下 SEQ ID 的核酸序列或其片段构成 : 1、 3、 5、 7、 9、 11、 13、 15、 17、 19、 21、 23、 25、 27、 29、 31、 33、 35、 37、 39、 41、 43、 45、 47、 49、 51、 53、 55、 57、 59、 61、 63、 65、 67、 69、 71、 73、 75、 77、 79、 81、 83、 85、 87、 89、 91、 95、 97、 99、 101、 103、 105、 107、 109、 111、 113、 115、 117、 119、 121、 123、 125、 127、 129、 131、 133、 135、 137、 139、 143、 145 和 147。
在其它第 15 个方面, 可使用针对部分或全部所述氨基酸序列的抗体来筛选表达 肽的 cDNA 表达文库。这种氨基酸序列包括 SEQ ID 2、 4、 8、 9、 10、 12、 14、 16、 18、 20、 22、 24、 26、 28、 30、 32、 34、 36、 38、 40、 42、 44、 46、 48、 50、 52、 54、 56、 58、 60、 62、 64、 66、 68、 70、 72、 74、 76、 78、 80、 82、 84、 86、 88、 90、 92、 96、 98、 100、 102、 104、 106、 108、 110、 112、 114、 116、 118、 120、 122、 124、 126、 128、 130、 132、 134、 136、 138、 140、 144、 146、 148。
在第 16 个重要的方面, 本发明也涉及产生过度表达 p450 酶活性水平的转基因烟 草谱系。 根据本发明, 这些转基因谱系包括编码全长基因的氨基酸序列的所有核酸序列, 所 述基因有效地增加特定酶的表达从而导致烟草中的表型效应。这种氨基酸序列包括 SEQ. ID.150、 152、 154、 156、 158、 160、 162、 164、 166、 168、 170、 172、 174、 176、 178、 180、 182、 184、 186、 188、 190、 192、 194、 196、 198、 200、 202、 204、 206、 208、 210、 212、 214、 216、 218、 220、 222、 224、 226、 228、 230、 232、 234、 236、 238、 240、 242、 244、 246、 248、 250、 252、 254、 256、 258、 260、 262、 264、 266、 268、 270、 272、 274、 276、 278、 280、 282、 284、 286、 288、 290、 292、 294、 296、 298、 300、 302、 304、 306、 308、 310、 312、 314 和 316。
也提供了含有降烟碱含量降低的烟叶 ( 叶片和 / 或茎 ) 的烟草产品。该烟草产品 包括烟草 ( 含有叶片和 / 或茎的烟叶 ), 该烟草来自含有本文所述序列或消除或抑制了编码
烟草特异性亚硝基胺的基因的植物。 与用未消除或抑制编码烟草特异性亚硝基胺的基因的 烟草植物制备的烟草产品相比, 消除或抑制编码烟草特异性亚硝基胺的基因有效地降低了 烟草产品中约 5-10%、 或者约 10-20%、 或者约 20-30%、 或者 30%以上的烟草特异性亚硝 基胺。 本文使用的烟草产品可包括香烟、 雪茄、 烟丝、 鼻烟、 口嚼烟 (chewing tobacco)、 混合 了烟草产品的产品和它们的混合物。
本发明涉及如下各项 :
1. 一种分离的烟草核酸分子, 该核酸分子含有选自 SEQ.ID.No. : 299-357 的核酸 序列。
2. 一种转基因植物, 该转基因植物含有如项 1 所述的核酸分子。
3. 如项 2 所述的转基因植物, 其特征在于, 所述植物是烟草植物。
4. 一种产生转基因植物的方法, 该方法包括以下步骤 :
(i) 将如项 1 所述的核酸分子与在所述植物中具有功能的启动子操作性相连以产 生植物转化载体 ;
(ii) 用步骤的所述植物转化载体转化所述植物 ;
(iii) 选择用所述转化载体转化的植物细胞 ; 和 (iv) 从所述转化的植物细胞再生转化植物。
5. 如项 4 所述的方法, 其特征在于, 所述核酸分子处于反义方向。
6. 如项 4 所述的方法, 其特征在于, 所述核酸分子处于有义方向。
7. 如项 4 所述的方法, 其特征在于, 所述核酸分子处于 RNA 干扰方向。
8. 如项 4 所述的方法, 其特征在于, 所述核酸分子表达为双链 RNA 分子。
9. 如项 4 所述的方法, 其特征在于, 所述双链 RNA 分子长度为约 15-25 个核苷酸。
10. 如项 4 所述的方法, 其特征在于, 所述转基因植物是烟草植物。
11. 一种选择含有核酸分子的植物的方法, 其中分析所述植物中是否存在选自 299-357 的核酸序列。
12. 如项 11 所述选择植物的方法, 其特征在于, 通过 DNA 杂交分析所述植物。
13. 如项 11 所述选择植物的方法, 其特征在于, 所述 DNA 杂交是 Southern 印迹分 析。
14. 如项 11 所述选择植物的方法, 其特征在于, 所述 DNA 杂交是 Northern 印迹分 析。
15. 如项 11 所述选择植物的方法, 其特征在于, 通过 PCR 检测分析所述植物。
16. 如项 11 所述选择植物的方法, 其特征在于, 所述植物是烟草植物。
17. 一种增加或降低植物中降烟碱水平的方法, 所述方法包括以下步骤 :
(i) 将如项 1 所述的核酸分子与在所述植物中具有功能的启动子操作性相连以产 生植物转化载体 ;
(ii) 用步骤 (i) 所述植物转化载体转化所述植物 ;
(iii) 选择用所述转化载体转化的植物细胞 ; 和
(iv) 从所述转化的植物细胞再生转化植物。
18. 如项 17 所述的方法, 其特征在于, 所述核酸分子处于反义方向。
19. 如项 17 所述的方法, 其特征在于, 所述核酸分子处于有义方向。
20. 如项 17 所述的方法, 其特征在于, 所述核酸分子处于 RNA 干扰方向。 21. 如项 17 所述的方法, 其特征在于, 所述核酸分子表达为双链 RNA 分子。 22. 如项 17 所述的方法, 其特征在于, 所述转基因植物是烟草植物。 附图简述 图 1 显示核酸 SEQ.ID.No. : 1 和氨基酸 SEQ.ID.No. : 2。 图 2 显示核酸 SEQ.ID.No. : 3 和氨基酸 SEQ.ID.No. : 4。 图 3 显示核酸 SEQ.ID.No. : 5 和氨基酸 SEQ.ID.No. : 6。 图 4 显示核酸 SEQ.ID.No. : 7 和氨基酸 SEQ.ID.No. : 8。 图 5 显示核酸 SEQ.ID.No. : 9 和氨基酸 SEQ.ID.No. : 10。 图 6 显示核酸 SEQ.ID.No. : 11 和氨基酸 SEQ.ID.No. : 12。 图 7 显示核酸 SEQ.ID.No. : 13 和氨基酸 SEQ.ID.No. : 14。 图 8 显示核酸 SEQ.ID.No. : 15 和氨基酸 SEQ.ID.No. : 16。 图 9 显示核酸 SEQ.ID.No. : 17 和氨基酸 SEQ.ID.No. : 18。 图 10 显示核酸 SEQ.ID.No. : 19 和氨基酸 SEQ.ID.No. : 20。 图 11 显示核酸 SEQ.ID.No. : 21 和氨基酸 SEQ.ID.No. : 22。 图 12 显示核酸 SEQ.ID.No. : 23 和氨基酸 SEQ.ID.No. : 24。 图 13 显示核酸 SEQ.ID.No. : 25 和氨基酸 SEQ.ID.No. : 26。 图 14 显示核酸 SEQ.ID.No. : 27 和氨基酸 SEQ.ID.No. : 28。 图 15 显示核酸 SEQ.ID.No. : 29 和氨基酸 SEQ.ID.No.30。 图 16 显示核酸 SEQ.ID.No. : 31 和氨基酸 SEQ.ID.No. : 32。 图 17 显示核酸 SEQ.ID.No. : 33 和氨基酸 SEQ.ID.No. : 34。 图 18 显示核酸 SEQ.ID.No. : 35 和氨基酸 SEQ.ID.No. : 36。 图 19 显示核酸 SEQ.ID.No. : 37 和氨基酸 SEQ.ID.No. : 38。 图 20 显示核酸 SEQ.ID.No. : 39 和氨基酸 SEQ.ID.No. : 40。 图 21 显示核酸 SEQ.ID.No. : 41 和氨基酸 SEQ.ID.No. : 42。 图 22 显示核酸 SEQ.ID.No. : 43 和氨基酸 SEQ.ID.No. : 44。 图 23 显示核酸 SEQ.ID.No. : 45 和氨基酸 SEQ.ID.No. : 46。 图 24 显示核酸 SEQ.ID.No. : 47 和氨基酸 SEQ.ID.No. : 48。 图 25 显示核酸 SEQ.ID.No. : 49 和氨基酸 SEQ.ID.No. : 50。 图 26 显示核酸 SEQ.ID.No. : 51 和氨基酸 SEQ.ID.No. : 52。 图 27 显示核酸 SEQ.ID.No. : 53 和氨基酸 SEQ.ID.No. : 54。 图 28 显示核酸 SEQ.ID.No. : 55 和氨基酸 SEQ.ID.No. : 56。 图 29 显示核酸 SEQ.ID.No. : 57 和氨基酸 SEQ.ID.No. : 58。 图 30 显示核酸 SEQ.ID.No. : 59 和氨基酸 SEQ.ID.No. : 60。 图 31 显示核酸 SEQ.ID.No. : 61 和氨基酸 SEQ.ID.No. : 62。 图 32 显示核酸 SEQ.ID.No. : 63 和氨基酸 SEQ.ID.No. : 64。 图 33 显示核酸 SEQ.ID.No. : 65 和氨基酸 SEQ.ID.No. : 66。 图 34 显示核酸 SEQ.ID.No. : 67 和氨基酸 SEQ.ID.No. : 68。 图 35 显示核酸 SEQ.ID.No. : 69 和氨基酸 SEQ.ID.No. : 70。图 36 显示核酸 SEQ.ID.No. : 71 和氨基酸 SEQ.ID.No. : 72。 图 37 显示核酸 SEQ.ID.No. : 73 和氨基酸 SEQ.ID.No. : 74。 图 38 显示核酸 SEQ.ID.No. : 75 和氨基酸 SEQ.ID.No. : 76。 图 39 显示核酸 SEQ.ID.No. : 77 和氨基酸 SEQ.ID.No. : 78。 图 40 显示核酸 SEQ.ID.No. : 79 和氨基酸 SEQ.ID.No. : 80。 图 41 显示核酸 SEQ.ID.No. : 81 和氨基酸 SEQ.ID.No. : 82。 图 42 显示核酸 SEQ.ID.No. : 83 和氨基酸 SEQ.ID.No. : 84。 图 43 显示核酸 SEQ.ID.No. : 85 和氨基酸 SEQ.ID.No. : 86。 图 44 显示核酸 SEQ.ID.No. : 87 和氨基酸 SEQ.ID.No. : 88。 图 45 显示核酸 SEQ.ID.No. : 89 和氨基酸 SEQ.ID.No. : 90。 图 46 显示核酸 SEQ.ID.No. : 91 和氨基酸 SEQ.ID.No. : 92。 图 47 显示核酸 SEQ.ID.No. : 93 和氨基酸 SEQ.ID.No. : 94。 图 48 显示核酸 SEQ.ID.No. : 95 和氨基酸 SEQ.ID.No. : 96。 图 49 显示核酸 SEQ.ID.No. : 97 和氨基酸 SEQ.ID.No. : 98。 图 50 显示核酸 SEQ.ID.No. : 99 和氨基酸 SEQ.ID.No. : 100。 图 51 显示核酸 SEQ.ID.No. : 101 和氨基酸 SEQ.ID.No. : 102。 图 52 显示核酸 SEQ.ID.No. : 103 和氨基酸 SEQ.ID.No. : 104。 图 53 显示核酸 SEQ.ID.No. : 105 和氨基酸 SEQ.ID.No. : 106。 图 54 显示核酸 SEQ.ID.No. : 107 和氨基酸 SEQ.ID.No. : 108。 图 55 显示核酸 SEQ.ID.No. : 109 和氨基酸 SEQ.ID.No. : 110。 图 56 显示核酸 SEQ.ID.No. : 111 和氨基酸 SEQ.ID.No. : 112。 图 57 显示核酸 SEQ.ID.No. : 113 和氨基酸 SEQ.ID.No. : 114。 图 58 显示核酸 SEQ.ID.No. : 115 和氨基酸 SEQ.ID.No. : 116。 图 59 显示核酸 SEQ.ID.No. : 117 和氨基酸 SEQ.ID.No. : 118。 图 60 显示核酸 SEQ.ID.No. : 119 和氨基酸 SEQ.ID.No. : 120。 图 61 显示核酸 SEQ.ID.No. : 121 和氨基酸 SEQ.ID.No. : 122。 图 62 显示核酸 SEQ.ID.No. : 123 和氨基酸 SEQ.ID.No. : 124。 图 63 显示核酸 SEQ.ID.No. : 125 和氨基酸 SEQ.ID.No. : 126。 图 64 显示核酸 SEQ.ID.No. : 127 和氨基酸 SEQ.ID.No. : 128。 图 65 显示核酸 SEQ.ID.No. : 129 和氨基酸 SEQ.ID.No. : 130。 图 66 显示核酸 SEQ.ID.No. : 131 和氨基酸 SEQ.ID.No. : 132。 图 67 显示核酸 SEQ.ID.No. : 133 和氨基酸 SEQ.ID.No. : 134。 图 68 显示核酸 SEQ.ID.No. : 135 和氨基酸 SEQ.ID.No. : 136。 图 69 显示核酸 SEQ.ID.No. : 137 和氨基酸 SEQ.ID.No. : 138。 图 70 显示核酸 SEQ.ID.No. : 139 和氨基酸 SEQ.ID.No. : 140。 图 71 显示核酸 SEQ.ID.No. : 141 和氨基酸 SEQ.ID.No. : 142。 图 72 显示核酸 SEQ.ID.No. : 143 和氨基酸 SEQ.ID.No. : 144。 图 73 显示核酸 SEQ.ID.No. : 145 和氨基酸 SEQ.ID.No. : 146。 图 74 显示核酸 SEQ.ID.No. : 147 和氨基酸 SEQ.ID.No. : 148。图 75 显示核酸 SEQ.ID.No. : 149 和氨基酸 SEQ.ID.No. : 150。 图 76 显示核酸 SEQ.ID.No. : 151 和氨基酸 SEQ.ID.No. : 152。 图 77 显示核酸 SEQ.ID.No. : 153 和氨基酸 SEQ.ID.No. : 154。 图 78 显示核酸 SEQ.ID.No. : 155 和氨基酸 SEQ.ID.No. : 156。 图 79 显示核酸 SEQ.ID.No. : 157 和氨基酸 SEQ.ID.No. : 158。 图 80 显示核酸 SEQ.ID.No. : 159 和氨基酸 SEQ.ID.No. : 160。 图 81 显示核酸 SEQ.ID.No. : 161 和氨基酸 SEQ.ID.No. : 162。 图 82 显示核酸 SEQ.ID.No. : 163 和氨基酸 SEQ.ID.No. : 164。 图 83 显示核酸 SEQ.ID.No. : 165 和氨基酸 SEQ.ID.No. : 166。 图 84 显示核酸 SEQ.ID.No. : 167 和氨基酸 SEQ.ID.No. : 168。 图 85 显示核酸 SEQ.ID.No. : 169 和氨基酸 SEQ.ID.No. : 170。 图 86 显示核酸 SEQ.ID.No. : 171 和氨基酸 SEQ.ID.No. : 172。 图 87 显示核酸 SEQ.ID.No. : 173 和氨基酸 SEQ.ID.No. : 174。 图 88 显示核酸 SEQ.ID.No. : 175 和氨基酸 SEQ.ID.No. : 176。 图 89 显示核酸 SEQ.ID.No. : 177 和氨基酸 SEQ.ID.No. : 178。 图 90 显示核酸 SEQ.ID.No. : 179 和氨基酸 SEQ.ID.No. : 180。 图 91 显示核酸 SEQ.ID.No. : 181 和氨基酸 SEQ.ID.No. : 182。 图 92 显示核酸 SEQ.ID.No. : 183 和氨基酸 SEQ.ID.No. : 184。 图 93 显示核酸 SEQ.ID.No. : 185 和氨基酸 SEQ.ID.No. : 186。 图 94 显示核酸 SEQ.ID.No. : 187 和氨基酸 SEQ.ID.No. : 188。 图 95 显示核酸 SEQ.ID.No. : 189 和氨基酸 SEQ.ID.No. : 190。 图 96 显示核酸 SEQ.ID.No. : 191 和氨基酸 SEQ.ID.No. : 192。 图 97 显示核酸 SEQ.ID.No. : 193 和氨基酸 SEQ.ID.No. : 194。 图 98 显示核酸 SEQ.ID.No. : 195 和氨基酸 SEQ.ID.No. : 196。 图 99 显示核酸 SEQ.ID.No. : 197 和氨基酸 SEQ.ID.No. : 198。 图 100 显示核酸 SEQ.ID.No. : 199 和氨基酸 SEQ.ID.No. : 200。 图 101 显示核酸 SEQ.ID.No. : 201 和氨基酸 SEQ.ID.No. : 202。 图 102 显示核酸 SEQ.ID.No. : 203 和氨基酸 SEQ.ID.No. : 204。 图 103 显示核酸 SEQ.ID.No. : 205 和氨基酸 SEQ.ID.No. : 206。 图 104 显示核酸 SEQ.ID.No. : 207 和氨基酸 SEQ.ID.No. : 208。 图 105 显示核酸 SEQ.ID.No. : 209 和氨基酸 SEQ.ID.No. : 210。 图 106 显示核酸 SEQ.ID.No. : 211 和氨基酸 SEQ.ID.No. : 212。 图 107 显示核酸 SEQ.ID.No. : 213 和氨基酸 SEQ.ID.No. : 214。 图 108 显示核酸 SEQ.ID.No. : 215 和氨基酸 SEQ.ID.No. : 216。 图 109 显示核酸 SEQ.ID.No. : 217 和氨基酸 SEQ.ID.No. : 218。 图 110 显示核酸 SEQ.ID.No. : 219 和氨基酸 SEQ.ID.No. : 220。 图 111 显示核酸 SEQ.ID.No. : 221 和氨基酸 SEQ.ID.No. : 222。 图 112 显示核酸 SEQ.ID.No. : 223 和氨基酸 SEQ.ID.No. : 224。 图 113 显示核酸 SEQ.ID.No. : 225 和氨基酸 SEQ.ID.No. : 226。图 114 显示核酸 SEQ.ID.No. : 227 和氨基酸 SEQ.ID.No. : 228。 图 115 显示核酸 SEQ.ID.No. : 229 和氨基酸 SEQ.ID.No. : 230。 图 116 显示核酸 SEQ.ID.No. : 231 和氨基酸 SEQ.ID.No. : 232。 图 117 显示核酸 SEQ.ID.No. : 233 和氨基酸 SEQ.ID.No. : 234。 图 118 显示核酸 SEQ.ID.No. : 235 和氨基酸 SEQ.ID.No. : 236。 图 119 显示核酸 SEQ.ID.No. : 237 和氨基酸 SEQ.ID.No. : 238。 图 120 显示核酸 SEQ.ID.No. : 239 和氨基酸 SEQ.ID.No. : 240。 图 121 显示核酸 SEQ.ID.No. : 241 和氨基酸 SEQ.ID.No. : 242。 图 122 显示核酸 SEQ.ID.No. : 243 和氨基酸 SEQ.ID.No. : 244。 图 123 显示核酸 SEQ.ID.No. : 245 和氨基酸 SEQ.ID.No. : 246。 图 124 显示核酸 SEQ.ID.No. : 247 和氨基酸 SEQ.ID.No. : 248。 图 125 显示核酸 SEQ.ID.No. : 249 和氨基酸 SEQ.ID.No. : 250。 图 126 显示核酸 SEQ.ID.No. : 251 和氨基酸 SEQ.ID.No. : 252。 图 127 显示核酸 SEQ.ID.No. : 253 和氨基酸 SEQ.ID.No. : 254。 图 128 显示核酸 SEQ.ID.No. : 255 和氨基酸 SEQ.ID.No. : 256。 图 129 显示核酸 SEQ.ID.No. : 257 和氨基酸 SEQ.ID.No. : 258。 图 130 显示核酸 SEQ.ID.No. : 259 和氨基酸 SEQ.ID.No. : 260。 图 131 显示核酸 SEQ.ID.No. : 261 和氨基酸 SEQ.ID.No. : 262。 图 132 显示核酸 SEQ.ID.No. : 263 和氨基酸 SEQ.ID.No. : 264。 图 133 显示核酸 SEQ.ID.No. : 265 和氨基酸 SEQ.ID.No. : 266。 图 134 显示核酸 SEQ.ID.No. : 267 和氨基酸 SEQ.ID.No. : 268。 图 135 显示核酸 SEQ.ID.No. : 269 和氨基酸 SEQ.ID.No. : 270。 图 136 显示核酸 SEQ.ID.No. : 271 和氨基酸 SEQ.ID.No. : 272。 图 137 显示核酸 SEQ.ID.No. : 273 和氨基酸 SEQ.ID.No. : 274。 图 138 显示核酸 SEQ.ID.No. : 275 和氨基酸 SEQ.ID.No. : 276。 图 139 显示核酸 SEQ.ID.No. : 277 和氨基酸 SEQ.ID.No. : 278。 图 140 显示核酸 SEQ.ID.No. : 279 和氨基酸 SEQ.ID.No. : 280。 图 141 显示核酸 SEQ.ID.No. : 281 和氨基酸 SEQ.ID.No. : 282。 图 142 显示核酸 SEQ.ID.No. : 283 和氨基酸 SEQ.ID.No. : 284。 图 143 显示核酸 SEQ.ID.No. : 285 和氨基酸 SEQ.ID.No. : 286。 图 144 显示核酸 SEQ.ID.No. : 287 和氨基酸 SEQ.ID.No. : 288。 图 145 显示核酸 SEQ.ID.No. : 289 和氨基酸 SEQ.ID.No. : 290。 图 146 显示核酸 SEQ.ID.No. : 291 和氨基酸 SEQ.ID.No. : 292。 图 147 显示核酸 SEQ.ID.No. : 293 和氨基酸 SEQ.ID.No. : 294。 图 148 显示核酸 SEQ.ID.No. : 295 和氨基酸 SEQ.ID.No. : 296。 图 149 显示组群成员的氨基酸同一性。 图 150 显示序列组的比较。 图 151A-E 显示了全长克隆的对比。 图 152 显示通过 PCR 克隆细胞色素 p450cDNA 片段的方法。图 153 显示核酸 SEQ.ID No. : 356 和氨基酸 SEQ.ID.No. : 357。
图 154 显示核酸 SEQ.ID No. : 358 和氨基酸 SEQ.ID.No. : 359。
图 155 显示核酸 SEQ.IDNo. : 360 和氨基酸 SEQ.ID.No. : 361。
图 156 显示核酸 SEQ.ID No. : 362 和氨基酸 SEQ.ID.No. : 363。
图 157 显示核酸 SEQ.ID No. : 364 和氨基酸 SEQ.ID.No. : 365。
图 158 显示核酸 SEQ.ID No. : 366 和氨基酸 SEQ.ID.No. : 367。
图 159 显示核酸 SEQ.ID No. : 368 和氨基酸 SEQ.ID.No. : 369。
图 160 显示核酸 SEQ.ID No. : 370 和氨基酸 SEQ.ID.No. : 371。
图 161 显示核酸 SEQ.ID No. : 372 和氨基酸 SEQ.ID.No. : 373。
图 162 显示基因芯片上所有克隆的探针组序列。
图 163 显示了 SEQ.ID No. : 434-536。
发明详述
定义
除非另有定义, 本文使用的所有技术和科技术语均与本发明所属领域的普通 技术人员通常理解的具有相同的意义。Singleton 等, (1994)《微生物和分子生物学字 典》 (Dictionary of Microbiology and Molecular Biology), 第二版, John Wiley and Sons( 纽约 ) 为技术人员提供了许多关于本发明所用术语的通用字典。本文所提及的所有 专利和出版物均纳入本文作为参考。出于本发明的目的, 下列术语如下定义。 “酶活性” 包括脱甲基化、 羟基化、 环氧化、 N- 氧化、 磺基氧化、 N-、 S- 和 O- 脱烷基 化、 脱硫作用、 脱氨基作用和偶氮基、 硝基和 N- 氧化物基团的还原。术语 “核酸” 指单链或 双链形式的, 或有义或反义的脱氧核糖核酸或核糖核酸聚合物, 并且除非另有限制, 该术语 包括能以类似于天然存在核苷酸的方式与核酸杂交的天然核苷酸的已知类似物。 除非另有 指出, 特定的核酸序列包括其互补序列。
术语 “可操作性连接” 、 “可操作性结合” 和 “以可操作性顺序” 指核酸表达控制序 列 ( 例如启动子、 信号序列或转录因子结合位点的阵列 ) 和第二核酸序列之间的功能性连 接, 其中表达控制序列影响对应于第二序列的核酸的转录和 / 或翻译。
当术语 “重组体” 用于指细胞时, 它指该细胞复制异源核酸, 表达所述核酸或表达 异源核酸编码的肽、 异源肽或蛋白质。重组细胞可以有义或反义形式表达在细胞的天然形 式 ( 非重组 ) 中未发现的基因或基因片段。重组细胞也可表达在细胞的天然形式中发现的 基因, 但其中该基因通过人工方式被改变并重新引入细胞。
“结构基因” 是含有编码蛋白质、 多肽或其部分的 DNA 片段的基因的一部分, 并且 不包括启动转录的 5’ 序列。或者结构基因可编码不可翻译的产物。结构基因可是在细胞 中正常发现的基因, 或者它是引入的而非在细胞或细胞位置中正常发现的基因, 在这种情 况下称为 “异源基因” 。异源基因可全部或部分来源于本领域已知的任何来源, 包括细菌 基因组或附加体、 真核生物的、 核的或质粒 DNA、 cDNA、 病毒 DNA 或化学合成的 DNA。结构基 因可含有一种或多种修饰, 这些修饰可影响生物活性或其特性、 表达产物的生物活性或化 学结构、 表达速率或表达控制的方式。这种修饰包括 ( 但不限于 ) 一个或多个核苷酸的突 变、 插入、 删除和取代。结构基因可构成不间断的编码序列或可包括一个或多个与合适的 剪接接头结合的内含子。结构基因可以是可翻译或不可翻译的, 包括反义方向 (antisense
orientation)。结构基因可以是来源于多种来源和多种基因序列的复合物 ( 天然存在的或 合成的, 其中合成的指化学合成的 DNA)。
“来源于” 用来指从某种来源 ( 化学和 / 或生物的 ) 取得、 获得、 接受得、 追溯、 复 制或传下的。可通过对原始来源的化学或生物学操作 ( 包括, 但不限于取代、 添加、 插入、 删 除、 提取、 分离、 突变和复制 ) 产生衍生物。
涉及 DNA 序列的术语 “化学合成的” 指部分核苷酸组分在体外装配。可使用已 良好建立的方法 (Caruthers, 《DNA 和 RNA 测序的方法》 (Methodology of DNA and RNA Secquencing), (1983), Weissman 编, Praeger Publishers, New York, 第 1 章 ) 实现 DNA 的 手工化学合成 ; 可使用许多市售可得的机器的一种进行自动化学合成。
可通过以下方法进行序列的最佳对比 : Smith 和 Waterman(Adv.Appl.Math.2 : 482(1981)) 的局部同源性算法、 Needleman 和 Wunsch(J.Mol.Biol.48 : 443(1970)) 的同源 性算法、 Pearson 和 Lipman(Proc.Natl.Acad.Sci.(U.S.A.)85 : 2444(1988)) 的相似性检索 方法、 这些算法的计算机化的工具 (Wisconsin Genetics 软件包中的 GAP、 BESTFIT、 FASTA 和 TFASTA, Genetics Computer Group, 575 Science Dr., Madison, Wis.) 或通过检验。
可从几种来源 ( 包括生物信息国家中心 (NCBI, Bethesda, Md.) 和因特网 ) 获 得 NCBI 基础局部序列比对检索工具 (BLAST)(Altschul 等, 1990) 与序列分析程序 blast、 blastn、 blastx、 tblastn 和 tblastx 联合使用。 该工具可在 htp://www.ncbi.nlm.nih.gov/ BLAST/ 获得。如何使用该程序检测序列同一性描述于 http://www.ncbi.nlm.nih.gov/ BLAST/blast help.html。
本文使用并应用于氨基酸序列的术语 “实质性氨基酸同一性”或 “实质性氨基 酸序列同一性”表示多肽的一种特性, 其中与参考组在所翻译肽的细胞色素 p450 基序 GXRXCX(G/A) 后的第一氨基酸到终止密码子的对应区域相比, 所述肽含有至少 70 %的 序列同一性、 优选 80 %氨基酸序列同一性、 更优选 90 %氨基酸序列同一性、 最优选至少 99-100%序列同一性的序列。
本文使用并应用于核酸序列的术语 “实质性核酸同一性”或 “实质性核酸序列 同一性” 表示多核苷酸序列的一种特性, 其中与参考组在所翻译肽的细胞色素 p450 基序 GXRXCX(G/A) 后的第一核酸到终止密码子的对应区域相比, 所述多核苷酸含有至少 75%的 序列同一性、 优选 81%序列同一性、 更优选 91%序列同一性、 最优选至少 99-100%序列同 一性的序列。
核苷酸序列实质相同的另一个指标是两个分子在严格条件下是否可杂交。 严格条 件视序列而定, 在不同情况下是不同的。严格条件一般选择比给定离子强度和 pH 时特定序 列的热解链温度 (Tm) 低约 5-20℃, 通常是约 10-15℃。Tm 是在给定离子强度和 pH 时 50% 靶序列与匹配的探针杂交的温度。严格条件通常是盐浓度为约 0.02 摩尔, pH 是 7, 温度是 至少约 60℃。例如, 在标准的 Southern 杂交方法中, 严格条件包括于 42℃在 6×SSC 中初 次洗涤, 然后于至少约 55℃ ( 通常是约 60℃, 更常见是约 65℃ ) 在 0.2×SSC 进行一次或多 次额外洗涤。
出于本发明的目的, 当核苷酸序列编码的多肽和 / 或蛋白质实质性相同时, 核苷 酸序列也实质性相同。因此, 当一条核酸序列与第二条核酸序列编码的多肽实质性相同 时, 这两条核酸序列是实质性相同的, 即使由于遗传密码所允许的简并性造成它们在严格条件下不会杂交 ( 对密码子简并性和遗传密码的解释参见 Darnell 等, (1990)《分子生物 学》 (Molecular Cell Biology), 第二版, Scientific American Books W.H.Freeman and Company, New York)。 可通过许多本领域熟知的方式, 例如蛋白质样品的聚丙烯酰胺凝胶电 泳, 然后基于染色通过目测来表征蛋白质纯度或均一性。 出于特定的目的, 可能需要高分辨 率并可利用 HPLC 或类似的装置。
本文使用的术语 “载体” 指将 DNA 片段转移入细胞的核酸分子。载体可由于复制 DNA 并可在宿主细胞中独立地复制。术语 “运载体” 有时可与 “载体” 互换使用。本文使用 的术语 “表达载体” 指重组 DNA 分子, 该分子含有所需的编码序列和用于在特定宿主生物体 中表达操作性相连的编码序列所需合适的核酸序列。通常, 原核生物中表达所需的核酸序 列通常含有启动子、 操纵子 ( 任选 ) 与核糖体结合位点, 以及其它序列。已知真核细胞可利 用启动子、 增强子以及终止和聚腺苷酸化信号。
为再生完全经遗传工程改造的具有根的植物, 可在植物细胞中插入核酸, 例如通 过诸如体内接种的任何技术或通过任何已知的体外组织培养技术来产生可再生为完整植 物的转化植物细胞。因此, 例如可通过病原性或非病原性根瘤土壤杆菌 (A.tumefacien) 的 体外接种来插入植物细胞。也可使用其它这样的组织培养技术。
“植物组织” 包括分化或未分化的植物组织, 包括, 但不限于根、 芽、 叶、 花粉、 种子、 肿瘤组织以及培养物中细胞的各种形式, 例如单细胞、 原生质体、 胚和愈伤组织。植物组织 可在植物中 (in planta) 或器官中, 组织或细胞培养物中。
本文使用的 “植物细胞” 包括植物中的植物细胞和培养物中的植物细胞和原生质 体。
“cDNA” 或 “互补 DNA” 一般指核苷酸序列与 RNA 分子互补的单链 DNA 分子。cDNA 是通过逆转录酶在 RNA 模板作用形成的。
获得核酸序列的方案
根据本发明, 从转化体和非转化体烟草谱系的烟草组织中提取 RNA。 提取的 RNA 然 后用于产生 cDNA。然后使用两种方案产生本发明的核酸序列。
在第一方案中, 从植物组织中提取富含 polyA 的 RNA 并通过逆转录 PCR 制备 cDNA。 然后使用简并引物加上寡聚 d(T) 反向引物, 用单链 cDNA 产生 p450 特异性 PCR 群。以高度 保守的 p450 基序为基础设计引物。特定的简并引物的例子示于图 1。进一步分析含有合适 大小插入物的质粒的序列片段。这些插入物的大小一般是约 300-800 个核苷酸, 视采用何 种引物而定。
在第二方案中, 首先构建 cDNA 文库。使用简并引物加上在质粒上作为反向引物的 T7 引物, 使用质粒中的 cDNA 产生 p450 特异的 PCR 群。如第一方案中一样, 进一步分析含有 合适大小插入物的质粒的序列片段。
已知产生高水平降烟碱的烟草植物谱系 ( 转化体 ) 和降烟碱水平检测不到的植物 谱系可用作起始材料。
然后可从植物上取下叶子并用乙烯处理以激活本文所定义的 p450 酶活性。示于 本领域已知的技术提取总 RNA。然后使用如图 153 所述的寡聚 d(T) 引物经 PCR(RT-PCR) 产 生 cDNA 片段。然后可完全地构建本文实施例所述的 cDNA 文库。
p450 型酶的保守区域可用作简并引物 ( 图 75) 的模板。可通过 PCR 使用简并引物扩增 p450 特异性条带。表示 p450 样酶的区带可通过 DNA 测序鉴定。可使用鉴定合适的候 选对象的 BLAST 检索、 算法或其它工具来表征 PCR 片段的特性。
已鉴定片段的序列信息可用于开发 PCR 引物。这些引物与 cDNA 文库中的质粒引 物联合用于克隆全长 p450 基因。进行大规模 Sourthern 反向分析来检测所有获得的片段 克隆以及在一些情况中全长克隆的差别表达。在本发明的这个方面, 为筛选所有克隆的插 入物, 可用不同组织的标记的总 cDNA 作为探针来与克隆的 DNA 片段杂交, 进行大规模反向 Sourthern 测定。
也用非放射性和放射性 (P32)Northern 印迹测定来鉴定克隆 p450 片段和全长克 隆。
通过衍生它们的氨基酸序列与选择抗原性和对其它克隆独特的肽区域来制造针 对几种全长克隆的肽特异性抗体。制造了针对偶联于运载体蛋白的合成肽的家兔抗体。使 用这些抗体对植物组织进行 Western 印迹分析或其它免疫学方法。
可使用病毒诱导的基因沉默技术 (VIGS, Baulcombe, Current Opinions in Plant Biology, 1999, 2: 109-113) 检测以上鉴定的核酸序列。
通过衍生它们的氨基酸序列与选择可能的抗原性和对其它克隆独特的肽区域来 制造针对几种全长克隆的肽特异性抗体。 制造了针对偶联于运载体蛋白的合成肽的家兔抗 体。使用这些抗体进行 Western 印迹分析。 在本发明的另一方面, 使用干扰 RNA(RNAi) 技术在本发明的烟草植物中进一步 鉴定细胞色素 p450 酶活性。描述该技术的以下参考文献纳入本文作为参考, Smith 等, Nature, 2000, 407 : 319-320 ; Fire 等, Nature, 1998, 391 : 306-311 ; Waterhouse 等, PNAS, 1998, 95 : 13959-13964 ; Stalberg 等, Plant Molecular Biology, 1993, 23 : 671-683 ; Baulcombe, Current Opinions in Plant Biology, 1999, 2: 109-113 和 Brigneti 等, EMBO Journal, 1998, 17(22) : 6739-6746。可使用 RNAi 技术、 反义技术或所述的各种其它方法来 转化植物。
有几种技术将外来遗传物质引入植物细胞并获得稳定地维持和表达所引入基因 的植物。这种技术包括加速包裹在微粒上的遗传物质进入细胞 ( 授予 Cornell 的美国专利 4,945,050 和授予 DowElanco 的美国专利 5,141,131)。可使用土壤杆菌技术来转化植物, 参见授予 University of Toledo 的美国专利 5,177,010 ; 授予 Texas A & M 的 5,104,310 ; Schilperoot 的欧洲专利申请 0131624B1、 欧洲专利申请 120516、 159418B1、 欧洲专利申 请 120516、 159418B1 和 176,112 ; 授 予 Schilperoot 美 国 专 利 5,149,645 ; 5,469,976 ; 5,464,763 ; 4,940,838 和 4,693,976 ; MaxPlanck 的欧洲专利申请 116718、 290799、 320500 ; Japan Nicotiana 的欧洲专利申请 604662 和 627752 ; Ciba Geigy 的欧洲专利申请 0267159、 0292435 和美国专利 5,231,019 ; 授予 Calgene 的美国专利 5,463,174 和 4,762,785 ; 授予 Agracetus 的美国专利 5,004,863 和 5,159,135。其它转化技术包括 whiskers 技术, 参见, 例如授予 Zeneca 的美国专利 5,302,523 和 5,464,765。 电穿孔技术也用于转化植物, 参见, Boyce Thompson Institute 的 WO 87/06614、 Dekalb 的 5,472,869 和 5,384,253 ; PGS 的 WO9209696 和 WO9321335。所有这些转化专利和出版物引作参考。除了许多转化植物的技 术以外, 与外来基因接触的组织的类型也可变。这种组织包括, 但不限于胚胎发生组织、 I 和 II 型愈伤组织、 下胚轴、 分生组织等。使用技术人员已知的合适的技术几乎可转化所有
分化过程中的植物组织。
引入植物的外来遗传物质可包含选择标记。具体的标记可由技术人员判断, 但 以下选择标记可与任何其它可用作选择标记的本文未列出的基因一起使用。这种选择 标记包括, 但不限于 : 编码抗生素卡那霉素、 新霉素和 G418 抗性的转座子 Tn5(Aph II) 的氨基糖苷磷酸转移酶基因, 以及编码对 N- 膦酰甲基甘氨酸、 潮霉素、 氨甲喋呤、 草铵膦 (phosphinothricin)(bar)、 咪唑啉酮、 磺酰脲和三唑并嘧啶除草剂, 例如 chlorosulfuron、 溴苯腈、 茅草枯等具抗性或耐受性的那些基因。
除了选择标记以外, 可能需要使用报道基因。 在一些例子中, 可使用报道基因而无 需选择标记。报道基因是通常不存在于或不表达于受者生物体或组织中的基因。报道基因 通常编码提供一些表型改变或酶性能的蛋白质。这种基因的例子见纳入本文作为参考的 K.Weising 等, Ann.Rev.Genetics, 22, 421(1988)。优选的报道基因包括, 但不限于葡糖醛 酸酶 (GUS) 基因和 GFP 基因。
一旦引入植物组织后, 可通过任何本领域已知的方法来评价结构基因的表达, 可 以 mRNA 转录、 蛋白质合成或发生沉默基因的量来检测表达 ( 参见纳入本文作为参考的美国 专利号 5,583,021)。用于体外培养植物细胞和在许多情况中, 用于再生完整植物的技术是 已知的 ( 欧洲申请号 88810309.0)。本领域的技术人员已知将引入的表达复合物变为商业 有用品种的方法。 一旦获得表达所需水平的 p450 酶的植物细胞, 可使用本领域熟知的方法和技术 再生植物组织和完整的植物。再生的植物可通过常规方法繁殖, 引入的基因可通过常规植 物育种技术转入其它品系或品种。
以下实施例描述了实施本发明的方法并且应理解为是说明性的, 而非基于此来限 制本发明在权利要求中所定义的范围。
实施例 实施例 1 植物组织的发育和乙烯处理
植物生长
将植物种在盆中, 在温室中生长 4 周。将 4 周龄的幼苗移到单独的盆中, 温室中生 长 2 个月。生长过程中, 每天给植物浇水 2 次, 水中含有 150ppm 的 NPK 肥料。将展开的绿 叶与植物分离, 以进行下面所述的乙烯处理。
细胞系 78379
由 肯 塔 基 大 学 发 放 的 烟 草 品 系 78379 用 作 植 物 材 料 的 来 源, 它是一种白肋 (burley) 烟草品系。 用本领域种植烟草的标准方法培养 100 株植物, 移植, 并且用不同的数 字 (1-100) 给它们贴注标签。用推荐的方法施肥和进行田间管理。
100 株植物中的 3/4 将 20-100%的烟碱转化为降烟碱。 100 株中的 1/4 将小于 5% 的烟碱转化为降烟碱。植株 87 转化率最低 (2% ), 而植株 21 的转化率为 100%。将转化率 小于 3%的植株分类为非转化株。对植株 87 和 21 自花授粉的种子以及杂交 (21 x 87 和 87 x 21) 的种子进行遗传差异和表型差异的研究。来自植株 21 自花授粉种子的植物是转 化株, 99%的来自植株 87 自花授粉种子的植物是非转化株。 剩余 1%的来自植株 87 自花授 粉种子的植物有较低的转化率 (5-15% )。杂交种均为转化株。
细胞系 4407
烟草品系 4407 用作植物材料来源, 它是一种白肋品系。选择均一的并且具代表性 的植物 (100) 并贴上标签。在这 100 株植物中, 97 株是非转化株, 3 株是转化株。植株 56 的转化率最低 (1.2% ), 植株 58 的转化水平最高 (96% )。将这两株植物进行自花授粉和 杂交。
来自植株 58 自花授粉种子的植株产生 3 ∶ 1 的分离比 ( 转化株∶非转化株= 3 ∶ 1)。植株 58-33 和 58-25 分别被鉴定为纯合转化株和非转化株植物品系。植株 58-33 下一代后裔中的分析确证了该植株的稳定转化率。
细胞系 PBLB01
PBLB01 是由 ProfiGen, Inc. 研究开发的一种白肋品系, 用作植物材料的来源。从 PBLB01 的第一代 (foundation) 种子中选择转化株植株。
乙烯处理方法
将绿色叶片从温室生长 2-3 个月的植物分离, 喷施 0.3 %的乙烯溶液 ( 商品名 Ethephon(Rhone-Poulenc))。将每片经喷施的叶子悬挂在配有加湿器的养护架 (curing rack) 上, 覆盖塑料膜。在处理期间, 用乙烯溶液定期喷施样品叶片。乙烯处理后约 24-48 小时, 收集叶子提取 RNA。取同一组样品的另外一份 (sup-sample) 用于代谢成分分析以测 定叶片代谢物的浓度以及感兴趣的更具体的成分如多种生物碱的分析。
例如, 可如下进行生物碱分析。样品 (0.1 克 ) 和 0.5 毫升 2N NaOH 以及含有喹啉 ( 作为内标 ) 和甲基叔丁基乙醚的 5 毫升提取液在 150rpm 振荡。在配有 FID 检测器的 HP 6890GC 上分析样品。250℃的温度用于检测器和上样器 (injector)。使用含有与 5%苯酚 和 95%甲基硅酮 (methyl silicon) 交联的熔融硅石的 HP 柱 (30m-0.32nm-1m), 温度梯度 为每分钟 10℃, 110-185℃。 该柱在 100℃工作, 用氦气作为运载气体, 流速为 1.7cm3min-l, 分流比为 40 ∶ 1, 上样体积为 2·1。
实施例 2 : 分离 RNA
对于 RNA 的提取, 如上所述用乙烯处理 2 月龄温室植物的中等大小的叶片。0 和 24-48 小时的样品用于 RNA 提取。在有些情况下, 从打顶 (flower-head removal) 后 10 天 的植物取处于衰老过程的叶片样品。这些样品也用于提取。用 Rneasy Plant Mini (Qiagen, Inc., Valencia, California) 按照生产商的方法分离总 RNA。
用 DEPC 处理过的研钵和杵在液氮中将组织样品研磨为细粉。将约 100 毫克磨碎 的组织转移到灭菌的 1.5 毫升 eppendorf 管中。将样品管置于液氮中, 直到收集完所有样 品。然后, 将试剂盒中提供的 450μl RLT 缓冲液加入各管中。剧烈振荡样品, 然后在 56℃ 温育 3 分钟。 将裂解物加在放于 2 毫升收集管中的 QIAshredderTM 旋转柱上, 最大速度离心 2 分钟。收集流出液, 加 0.5 体积的乙醇到澄清的裂解液中。充分混合样品, 转移到放在 2 毫升收集管中的小旋转柱中。10,000rpm 离心样品 1 分钟。然后, 吸取 700μl RW1 缓冲液 到 柱上, 10,000rpm 离心 1 分钟。吸取 RPE 缓冲液到置于新收集管中的 旋转柱上, 以最大速度离心 柱上, 10,000rpm 离心 1 分钟。再将 RPE 缓冲液加到 钟。将2 分钟以使膜干燥。为了除掉残留的乙醇, 将膜置于一空收集管上, 再以最大速度离心 1 分 柱转移到一个新的 1.5 毫升收集管中, 将 40μl 不含 RNA 酶的水直接吸到 膜上。该最终洗脱物在 10,000rpm 离心 1 分钟。用变性甲醛凝胶和分光光度计分析总 RNA 的质量和数量。
按照生产商的方法用 OligotexTM poly A+RNA 纯化试剂盒 (Qiagen Inc.) 分离 Poly(A)RNA。使用溶于最大为 250μl 体积的约 200μg 总 RNA。将 250μl OBB 缓冲液和 15μl OligotexTM 悬浮液加到 250μl 总 RNA 中。 通过吸打使这些物质彻底混合, 在加热器 (heating block) 上 70℃保温 3 分钟。然后, 将样品置于室温约 20 分钟。最大速度离心 2 分钟得到 oligotex : mRNA 复合物团块。从微离心管中除去全部上清液, 仅剩约 50μl。再 用 OBB 缓冲液处理样品。通过涡旋将 oligotex : mRNA 团块重新悬浮在 400μl OW2 缓冲液 中。将该混合物转移到置于新管中的小旋转柱上, 以最大速度离心 1 分钟。将旋转柱移到 新管中, 再往该柱中加入 400μl OW2 缓冲液。然后, 以最大速度离心该管。将旋转柱转移 到最终的 1.5 毫升微量离心管中。用 60μl 热的 (70℃ )OEB 缓冲液洗脱样品。用变性甲醛 凝胶和分光光度计分析 Poly A 产物。
实施例 3 : 反转录 -PCR
按 照 生 产 商 的 方 法 用 SuperScript 反 转 录 酶 (Invitrogen, Carlsbad, California) 制备第一链 cDNA。 富集了 poly A+RNA 的寡聚 dT 引物混合物由少于 5μg 的总 RNA、 1μl 10mM dNTP 混合物、 1μl Oligo d(T)12-18(0.5μg/μl) 和至多 10μl 的经 DEPC 处理的水组成。各样品在 65℃温育 5 分钟, 然后置于冰上至少 1 分钟。按顺序加入下列各 组分, 以制备反应混合物 : 2μl 10X RT 缓冲液、 4μl 25mM MgC12、 2μl 0.1M DTT 和 1μl 去除 RNA 酶的重组 RNA 酶抑制剂 (Rnase OUT Recombinant RNase Inhibitor)。吸取 9μl 反应混合物到各 RNA/ 引物混合物, 轻柔混合。42℃温育 2 分钟, 在各管中加入 1μl Super Script IITM RT, 42℃温育 50 分钟。在 70℃终止反应 15 分钟, 冰上冷却。离心收集样品, 在各管中加入 1μl RNase H, 37℃温育 20 分钟。用 200pmoles 正向引物 ( 如图 75 所示的 变性引物, SEQ ID NO.149-156) 和 100pmoles 反向引物 (18 碱基的寡聚 d(T), 接一个随机 碱基 ) 进行第二次 PCR。
反应条件是 94℃ 2 分钟 ; 然后进行 40 个循环的 PCR : 94℃ 1 分钟, 45-60℃ 2 分钟, 72℃ 3 分钟 ; 最后 72℃再延伸额外的 10 分钟。
用 1%的琼脂糖凝胶电泳分析 10 微升的扩增样品。 将大小正确的条带从琼脂糖凝 胶上纯化出来。
实施例 4 : PCR 片段群体的产生
按 照 生 产 商 的 方 法 将 实 施 例 3 得 到 的 PCR 片 段 连 接 到 pGEM-T Easy Vector(Promega, Madison, Wisconsin) 中。用连接产物转化 JM109 感受态细胞, 涂在 LB 培 养基平板上, 进行蓝 / 白选择。选择克隆, 置于 96 孔板上在 1.2 毫升 LB 培养基中 37℃生长 过夜。对于所有选出的集落保留冻存管。用 Beckman′ s Biomeck 2000 小制备机器人技 术 (miniprep robotics) 以 Wizard SVMiniprep 试剂盒 (Promega) 从平板上纯化质粒。用 100μl 水洗脱质粒 DNA, 存贮于 96 孔板中。用 EcoRl 消化质粒, 并用 1%琼脂糖凝胶分析以 确证 DNA 的量和插入片段的大小。用 CEQ 2000 测序仪 (Beckman, Fullerton, California) 测序含有 400-600bp 插入片段的质粒。用 BLAST 搜索将测得的序列与 Genbank 数据库进行 比对。鉴定与 p450 相关的片段并进一步分析。或者, 将 p450 片段从差减文库中分离出来。 如上所述分析这些片段。
实施例 5 : CDNA 文库的构建如下所述从乙烯处理的叶片中制备总 RNA 以构建 cDNA 文库。首先, 用改良的酸酚 和氯仿提取方法从乙烯处理的烟草品系 58-33 叶片中提取总 RNA。改良的方法是用 1 克组 织进行研磨, 随后在 5 毫升加入了 5 毫升苯酚 (pH5.5) 和 5 毫升氯仿的提取缓冲液 (100mM Tris-HCl, pH 8.5 ; 200mM NaCl ; 10mM EDTA ; 0.5% SDS) 中涡旋。 将提取的样品离心, 保留上 清。该提取步骤再重复 2-3 次直到上清变得澄清。加入约 5 毫升氯仿以除去痕量的苯酚。 加入 3 倍体积的 ETOH 和 1/10 体积的 3M NaOAc(pH5.2) 以从混合的上清组分中沉淀 RNA, 在 -20℃存贮 1 小时。转移到 Corex 玻璃容器中以后, 在 4℃ 9,000RPM 离心 RNA 组分 45 分 钟。离心下来的团块用 70%乙醇洗涤, 4℃ 9,000RPM 离心 5 分钟。团块干燥以后, 将 RNA 团 块溶解在 0.5 毫升不含 Rnase 的水中。RNA 团块溶解在 0.5 毫升不含 Rnase 的水中。分别 用变性甲醛和分光光度计分析总 RNA 的质量和数量。
以 下 述 步 骤 用 Oligo(dT) 纤 维 素 方 法 (Invitrogen) 和 微 离 心 旋 转 柱 (Invitrogen) 从得到的总 RNA 中分离 poly A+RNA。约 20mg 总 RNA 进行两次纯化以获得高 质量的 poly A+RNA。 用变性甲醛和随后的已知全长基因的 RT-PCR( 确保高质量的 mRNA) 来 分析 PolyA+RNA 产物。
接 着, 以 poly A+RNA 作 模 板 用 cDNA 合 成 试 剂 盒、 合成试剂盒 和 III 金 克 隆 试 剂 盒 (gold cloning kit)(Stratagene, La Jolla, California) 来产生 cDNA 文库。其中的方法按照生产商规定的步骤来进行。用约 8μg polyA+RNA 来构建 cDNA 文库。初级文库的分析显示约有 2.5×106-1×107pfu。用 IPTG 和 X-gal 进行了互补分析, 以检测文库的质量背景, 其中重组噬菌斑的表达高出背景 反应 100 倍以上。
用随机 PCR 对文库进行的更为定量的分析表明, 插入的 cDNA 的平均大小约为 1.2kb。该方法采用了如下所述的两步法 PCR。对于第一步, 反向引物的设计是基于从 p450 片段获得的初级序列信息。设计的反向引物和 T3( 正向 ) 引物用于从 cDNA 文库中扩增相 应的基因。PCR 反应物进行琼脂糖凝胶电泳, 切割高分子量的相应条带, 纯化、 克隆并测序。 在第二步中, 用根据 p450 的 5′ UTR 或翻译起始区域设计的新引物作为正向引物, 和反向引 物一起 ( 根据 p450 的 3′ UTR 设计 ) 用于下一步的 PCR 以获得全长 p450 克隆。
如实施例 3 所述 ( 反向引物除外 ) 从构建的 cDNA 文库中用 PCR 扩增获得 p450 片 段。用位于质粒上 cDNA 插入片段下游 ( 见图 75) 的 T7 引物作为反向引物。如实施例 4 所 述分离、 克隆和测序 PCR 片段。 从构建的 cDNA 文库中用 PCR 方法分离全长 p450 基因。用基因特异性反向引物 ( 根据 p450 片段的下游序列设计 ) 和正向引物 ( 位于文库质粒上的 T3) 来克隆全长基因。 分离、 克隆并测序 PCR 片段。如果需要, 可进行第二步 PCR。在第二步 PCR 中, 用根据克隆 的 p450 的 5′ UTR 设计的新正向引物和根据 p450 的 3′ UTR 设计的反向引物来进行下一 步的 PCR 反应, 以获得全长 p450 克隆。然后对克隆测序。
实施例 6 : 克隆片段的鉴定 - 反向 SOUTHERN 印迹分析
在以上实施例中鉴定的所有 p450 克隆上进行非放射性大规模反向 southern 印迹 试验以检测差异性表达。观察到不同 p450 基因簇之间的表达水平非常不同。在高水平表 达的克隆上又进行了实时检测。
非放射性 southern 印迹方法按如下所述进行。
1) 如实施例 2 所述用 Qiagen Rnaeasy 试剂盒从乙烯处理和未处理的转化株 (58-33) 和非转化株 (58-25) 叶片提取总 RNA。
2) 用生物 素 加尾标记从 上 述步 骤产生 的富含 poly A+ 的 RNA 中衍 生 的单 链 cDNA 来 制 备 探 针。 该 标 记 的 单 链 cDNA 是 如 实 施 例 3 所 述 用 转 化 株 和 非 转 化 株 的 总 RNA(Invitrogen) 进行 RT-PCR 产生的, 但用了生物素化的寡聚 dT 作为引物 (Promega)。这 些用作探针与克隆的 DNA 杂交。
3) 用限制性内切酶 EcoRl 消化质粒 DNA, 进行琼脂糖凝胶电泳。将这些凝胶同 时干燥并转到两个尼龙膜上 一个膜与转化株探针杂交, 另一个膜与非转 化株探针杂交。在杂交之前将膜进行紫外线交联 ( 自动交联设备, 254nm, Stratagene, Stratalinker)。
或者, 用位于 p-GEM 两臂上的序列, T3 和 SP6 作为引物从各质粒中 PCR 扩增插入 片段。PCR 产物在 96 孔的即时 (Ready-to-run) 琼脂糖凝胶上电泳以进行分析。经确证的 插入片段点到两个尼龙膜上。一个膜与转化株探针杂交, 另一个膜与非转化株探针杂交。
4) 按生产商的说明书将这些膜杂交并洗涤, 其中对洗涤的严格性进行了改变 (Enzo MaxSenceTM 试剂盒, Enzo Diagnostics, Inc, Farmingdale, NY)。膜与杂交缓冲液 (2x SSC 缓冲的甲酰胺, 含有去垢剂和杂交增强剂 ) 在 42℃预杂交 30 分钟, 与 10μl 变性 68℃洗涤 的探针 42℃杂交过夜。然后室温用 1X 杂交洗涤缓冲液洗涤杂交膜一次, 10 分钟 ; 15 分钟, 4 次。然后可以对杂交膜进行检测。
5) 按生产商提供的检测方法 (Enzo Diagnostics, Inc.), 经洗涤的膜用碱性磷酸 酶标记, 然后用 NBT/BCIP 颜色检测方法进行检测。用 1X 封闭液室温封闭杂交膜 1 小时, 用 1X 检测试剂洗涤 10 分钟 (3 次 ), 用 1X 预显影反应缓冲液洗涤 5 分钟 (2 次 ), 然后在显影液 中显影直到出现点状印迹。所有的试剂都由生产商提供 (Enzo Diagnostics, Inc)。此外, TM 还用 KPL southern 杂交和检测试剂盒 按生产商的方法 (KPL, Gaithersburg, Maryland) 进行了大规模反向 Southern 试验。
实施例 7 : 克隆的鉴定 -NORTHERN 印迹分析
除 Southern 印迹分析之外, 如 Northern 印迹分析的实施例所述, 一些膜进行了 Northern 杂交和检测。如下所述, 采用 Northern 杂交检测烟草中差异表达的 mRNA。
采 用 随 机 引 发 方 法 从 克 隆 的 p450 制 备 探 针 (MegaprimeTM DNA 标 记 系 统, Amersham BiosCiences)。 混合下述组分 : 25ng 变性的 DNA 模板 ; 未标记的 dTTP、 dGTP 和 dCTP 各 4μl ; 5μl 反应缓冲液 ; P32 标记的 dATP 和 2ul Klenow I ; 以及水, 使反应体系达到 50μl。该混合物 在 37℃温育 1-4 小时, 然后以 2μ10.5M 的 EDTA 终止。使用前, 95℃温育 5 分钟使探针变 性。
从几对烟草品系经乙烯处理和未经处理的新鲜叶片中制备 RNA 样品。在有些情况 下, 使用了富含 poly A+ 的 RNA。 用 DEPC 水 (5-10μ1) 使约 15μg 总 RNA 或 1.8μg mRNA(RNA 或 mRNA 提取方法如实施例 5 所述 ) 的体积相同。加入等体积的上样缓冲液 (1 x MOPS ; 18.5%甲醛 ; 50%甲酰胺 ; 4% FiColl 400 ; 溴酚蓝 ) 和 0.55μl EtBr(0.5μg/μl)。将样 品变性, 准备用电泳分离 RNA。
将样品用 1XMOP 缓冲液 (0.4M 吗啉苯磺酸 ; 0.1M 乙酸钠 -3x H2O ; 10mM EDTA ; 用
NaOH 调 pH 至 7.2) 在甲醛凝胶 (1%琼脂糖, 1x MOPS, 0.6M 甲醛 ) 上电泳。 用毛细方法在 10X SSC 缓冲液 (1.5M NaCl ; 0.15M 柠檬酸钠 ) 中将 RNA 转移到 Hybond-N+ 上 (Nylon, Amersham PharmaciaBiotech)24 小时。 在杂交前, 将有 RNA 样品的膜紫外交联 ( 自动交联设备, 254nm, Stratagene, Stratalinker)。
膜和 5-10 毫升预杂交缓冲液 (5x SSC ; 50%甲酰胺 ; 5x Denhar dt′ s- 溶液 ; 1% SDS ; 100g/ml 热变性的平端非同源 DNA) 在 42℃预杂交 1-4 小时。将旧的预杂交缓冲液弃 去, 加入新的预杂交缓冲液和探针。杂交在 42℃过夜进行。用 2x SSC 室温洗涤膜 15 分钟, 然后用 2x SSC 洗涤一次。
本发明的一个主要焦点是发现了可被乙烯处理诱导的新基因或者在烟草叶片的 质量和成分中起主要作用的新基因。 如下表所示, Northern 印迹和反向 Southern 印迹可用 于测定哪些基因受乙烯处理的诱导 ( 相对于不受诱导的植株 )。 令人感兴趣的是, 在转化株 和非转化株植株中并非所有的片段都受到相似的影响。对感兴趣的细胞色素 p450 片段部 分测序以确定它们的结构相关性。该信息被用于后续分离和鉴定感兴趣的全长基因克隆。
用全长克隆在从乙烯处理诱导的转化株和非转化株白肋品系获得的烟草组织上 进行 Northern 分析。目的是鉴定在乙烯诱导的转化株植株中 ( 相对于乙烯诱导的转化株 品系相对于乙烯诱导的非转化株白肋品系 ) 表达有所提高的那些全长基因克隆。用这种 Northern 分析方法, 可以通过比较转化株和非转化株品系之间叶片组成的生化差异来确定 全长克隆的功能关系。如下表所示, 6 个克隆在乙烯处理的转化株植物组织中 ( 标记为 ++ 和 +++) 显示出比在乙烯处理的非转化株植物组织中 ( 标记为 +) 表达显著升高。在未经乙 烯处理的转化株和非转化株品系中所有这些克隆显示出很少的表达或不表达。
21102321641 A CN 102321648 全长克隆 D101-BA2 D207-AA5 D208-AC8 D237-AD1 D89-AB1 D90A-BB3
说明书非转化株 + + + + + +20/32 页转化株 ++ ++ +++ ++ ++ ++实施例 8 : 由克隆的基因编码的 p450S 的免疫检测
选择来自 3 个 p450 克隆的长度相应于 20-22 个氨基酸的肽区域, 这些肽区域 : 1) 与其它克隆具有很低的同源性或没有同源性, 和 2) 具有很好的亲水性和抗原性。下面列出 了选自各个 p450 克隆的肽区域的氨基酸序列。 将合成的肽与 KHL 偶联, 然后注射到家兔中。
第 4 次注射后 2 周和 4 周收集抗血清 (Alpha Diagnostic Intl.Inc.San Antonio, TX)。
D234-A D1DIDGSKSKLVKAHRKIDEILG
D90a-BB3 RDAFREKETFDENDVEELNY
D89-AB1 FKNNGDEDRHF SQKLGDLADKY
用 Western 印迹分析来检测抗血清对烟草植物组织靶蛋白的交叉活性。
从乙烯处理的 (0-40 小时 ) 转化株和非转化株品系的中等大小的叶片获得蛋白粗 提物。按生产商的方法用 RC DC 蛋白检测试剂盒 (BIO-RAD) 测定该提取物的蛋白浓度。
将 2 微克蛋白加到各泳道中, 用 Laemmli SDS-PAGE 体系在 10% -20%梯度凝胶 上分离蛋白。用 半干槽 (Semi-Dry cell)(BIO-RAD) 将蛋白从凝胶转移到 硝化纤维转移膜 (Schleicher & Schuell) 上。用 ECLAdvanceTM Western 印 迹检测试剂盒 (Amersham Biosciences) 检测和显影 p450 蛋白。在家兔中制备针对合成的 KLH 耦合物的一抗。针对兔 IgG 的二抗 ( 与过氧化物酶偶联 ) 购自 Sigma。一抗和二抗都 以 1 ∶ 1000 稀释液使用。抗体对 Western 印迹上的一条单一条带显示出很强的反应性, 说 明该抗血清对感兴趣的靶肽是单一特异性的。抗血清对与 KLH 耦合的合成肽也具有交叉反 应性。 实施例 9 : 分离的核酸片段的核酸同一性和结构相关性
超过 100 个克隆的 p450 片段结合 Northern 印迹分析来测序, 以确定它们的结构 相关性。所用方法中使用的正向引物基于两个共有的 p450 基序, 这两个基序邻近 p450 基 因的羧基末端。该正向引物对应于如图 1 所示的细胞色素 p450 基序 FXPERF 或 GRRXCP(A/ G)。反向引物使用来自质粒的标准引物 ( 位于 pGEMTM 质粒的两臂 )SP6 或 T7, 或使用多聚 A 尾巴。所用方法如下所述。
按生产商 (Beckman Coulter) 的方法用分光光度法评价起始双链 DNA 的浓度。将 模板用水稀释到合适的浓度, 95℃ 2 分钟加热变性, 然后置于冰上。测序反应液在冰上制
备, 其包括 0.5-10μl 变性 DNA 模板, 2μl 1.6pmole 正向引物, 8μl DTCS Quick Start Master Mix, 用水调节总体积到 20μl。温度循环程序包括以下 30 个循环 : 96 ℃ 20 秒, 50℃ 20 秒, 60℃ 4 分钟, 然后 4℃保温。
加入 5μl 终止缓冲液 ( 等体积的 3M NaOAc、 100mM EDTA 和 1μl20mg/ml 肝糖 ) 使 测序终止。 用 60μl 95%的冷乙醇沉淀样品, 6000g 离心 6 分钟。 弃去乙醇。 团块用 200μl 冷的 70%乙醇洗涤 2 次。团块干燥以后, 加入 40μl SLS 溶液, 使团块重悬。在表面上加入 一层矿物油。然后, 将样品置于 CEQ 8000 自动测序仪中进行进一步分析。
为了验证核酸序列, 用基于 p450 基因的 FXPERF 或 GRRXCP(A/G) 区域的正向引物 或基于质粒或多聚 A 尾巴的反向引物对核酸序列在两个方向进行重新测序。在两个方向上 所有的测序至少进行两次。
将细胞色素 p450 片段的核酸序列彼此比较, 从编码区 ( 与编码 GRRXCP(A/G) 的区 域之后的第一个核酸相对应 ) 一直到终止子。选择该区域作为 p450 蛋白遗传多态性的一 个指示参数。观察到大量的 ( 超过 70 种 ) 遗传上不同的 p450 基因, 类似于其它植物物种 中所观察到的。在比较核酸序列时发现, 这些基因根据其序列同一性可置于不同的序列组 群中。发现 p450 成员的最好的唯一的 (unique) 分组确定为那些具有 75%或更大核酸同 一性的序列 ( 见表 1)。降低同一性百分数导致组群明显变大。观察到优选的分组是那些 具有 81%或更大核酸同一性的序列, 更优选的分组是具有 91%或更大核酸同一性的序列, 最优选的分组是具有 99%或更大核酸同一性的序列。大多数组群包括至少 2 个成员, 经常 为 3 个或更多个成员。没有重复观察到其它情况, 说明所采用的方法既能够在所用组织中 分离低表达的 mRNA 又能够分离高表达的 mRNA。
基于 75 %或更大核酸同一性, 发现两个细胞色素 p450 组群与之前 ( 发现 ) 的 遗传上与这两个组群不同的烟草细胞色素基因具有核酸序列同一性。第 23 组在表 I 所 用的指数范围内, 显示出与之前分别由 Czernic 等和 Ralston 等提交的 GenBank 序列 GI : 1171579(CAA64635) 和 GI : 14423327( 或 AAK62346) 具有核酸同一性。GI : 1171579 与第 23 组成员的核酸同一性为 96.9% -99.5%, 而 GI : 14423327 与第 23 组成员的核酸同一性为 95.4% -96.9%。 第 31 组的成员与 Ralston 等提交的 GenBank 序列 GI : 14423319(AAK62342) 有 76.7% -97.8%的核酸同一性。表 1 中没有其它 p450 同一性组群在表 1 所用的参数范 围内与 Ralston 等、 Czernic 等、 Wang 等或 LaRosa 和 Smigocki 报道的烟草 p450 基因具有 同一性。
如图 76 所示, 对于各组, 可衍生合适的核酸变性探针的共有序列, 以优先从烟草 植物中鉴定和分离各组的其它成员。
表I: 烟草 p450 核酸序列同一性组群
组群 片段
1 D58-BG7(SEQ ID No. : 1), D58-AB1(SEQ ID No. : 3) ; D58-BE4(SEQ ID No. : 7)
2 D56-AH7(SEQ ID No. : 9) ; D13a-5(SEQID No. : 11)
3 D56-AG10(SEQ ID No. : 13) ; D35-33(SEQ ID No. : 15) ; D34-62(SEQ ID No. : 17)
4 D56-AA7(SEQ ID No. : 19) ; D56-AE1(SEQ ID No. : 21) ; 185-BD3(SEQID No. : 143)5 D35-BB7(SEQ ID No. : 23) ; D177-BA7(SEQ ID No. : 25) ; D56A-AB6(SEQ ID No. : 27) ; D144-AE2(SEQ ID No. : 29)
6 D56-AG11(SEQ ID No. : 31) ; D179-AA1(SEQ ID No. : 33)
7 D56-AC7(SEQ ID No. : 35) ; D144-AD1(SEQ ID No. : 37)
8 D144-AB5(SEQ ID No. : 39)
9 D181-AB5(SEQ ID No. : 41) ; D73-Ac9(SEQ ID No. : 43)
10 D56-AC12(SEQ ID No. : 45)
11 D58-AB9(SEQID No. : 47) ; D56-AG9(SEQ ID No. : 49) ; D56-AG6(SEQ ID No. : 51) ; D35-BGll(SEQ ID No. : 53) ; D35-42(SEQ ID No. : 55) ;
D35-BA3(SEQ ID No. : 57) ; D34-57(SEQ ID No. : 59) ; D34-52(SEQ ID No. : 61) ; D34-25(SEQID No. : 63)
12 D56-AD10(SEQID No. : 65)
13 56-AA11(SEQ ID No. : 67)
14 D177-BD5(SEQ ID No. : 69) ; D177-BD7(SEQ ID No. : 83)
15 D56A-AG10(SEQ ID No. : 71) ; D58-BC5(SEQ ID No. : 73) ; D58-AD12(SEQ ID No. : 75)
16 D56-AC11(SEQ ID No. : 77) ; D35-39(SEQ ID No. : 79) ; D58-BH4(SEQ ID No. : 81) ; D56-AD6(SEQ ID No. : 87)
17 D73A-AD6(SEQ ID No. : 89) ; D70A-BA11(SEQ ID No. : 91)
18 D70A-AB5(SEQ ID No. : 95) ; D70A-AA8(SEQ ID No. : 97)
19 D70A-AB8(SEQ ID No. : 99) ; D70A-BH2(SEQ ID No. : 101) ; D70A-AA4(SEQ ID No. : 103)
20 D70A-BA1(SEQ ID No. : 105) ; D70A-BA9(SEQ ID No. : 107)
21 D70A-BD4(SEQ ID No. : 109)
22 D181-AC5(SEQ ID No. : 111) ; D144-AH1(SEQ ID No. : 113) ; D34-65(SEQ ID No. : 115)
23 D35-BG2(SEQ ID No. : 117)
24 D73A-AH7(SEQ ID No. : 119)
25 D58-AA1(SEQ ID No. : 121) ; D185-BC1(SEQID No. : 133) ; D185-BG2(SEQ ID No. : 135)
26 D73-AE10(SEQ ID No. : 123)
27 D56-AC12(SEQ ID No. : 125)
28 D177-BF7(SEQ ID No. : 127) ; D185-BE1(SEQ ID No. : 137) ; D185-BD2(SEQ ID No. : 139)
29 D73A-AG3(SEQ ID No. : 129)
30 D70A-AA12(SEQ ID No. : 131) ; D176-BF2(SEQ ID No. : 85)
31 D176-BC3(SEQ ID No. : 145)
32 D176-BB3(SEQ ID No. : 147)
33 D186-AH4(SEQ ID No. : 5)实施例 10 : 分离的核酸片段的相关氨基酸序列同一性
推测实施例 8 中获得的细胞色素 p450 片段的核酸序列的氨基酸序列。被推测的 区域对应于紧跟在 GXRXCP(A/G) 序列基序之后的氨基酸到羧基末端, 或终止子。在比较片 段的序列同一性时, 氨基酸同一性为 70 %或更大的那些序列观察到唯一的分组 (unique grouping)。氨基酸同一性为 80%或更大的那些序列观察到优选的分组, 更优选为 90%氨 基酸同一性或更大, 最优选的分组是氨基酸同一性为 99%或更大的那些序列。组群和组群 成员的相应氨基酸序列示于图 2。 发现这些唯一的 (unique) 氨基酸序列中的几个与其它序 列具有完全的序列同一性, 因此只报道了具有相同氨基酸的一个成员。
根据它们的核苷酸序列, 表 II 第 19 组的氨基酸同一性对应于 3 个不同的组群。 各 组成员的氨基酸序列和它们的同一性示于图 77。相应标示了氨基酸差异。
选择了各氨基酸同一性组群中的至少一个成员用植物进行基因克隆和功能性研 究。此外, 经 Northern 和 Southern 分析评定为受乙烯处理的影响不同或具有其它生物学 差异的组群成员也被选择作基因克隆和功能研究。为有助于基因克隆, 将基于序列同一性 和差异序列进行表达研究和完整植物评价以及肽特异性抗体的制备。
表 II : 烟草 p450 氨基酸序列同一性分组
组群 片段
1 D58-BG7(SEQ ID No. : 2), D58-AB1(SEQ ID No. : 4)
2 D58-BE4(SEQ ID No. : 8)
3 D56-AH7(SEQ ID No. : 10) ; D13a-5(SEQ ID No. : 12)
4 D56-AG10(SEQ ID No. : 14) ; D34-62(SEQ ID No. : 18)
5 D56-AA7(SEQ ID No. : 20) ; D56-AE1(SEQ ID No. : 22) ; 185-BD3(SEQ ID No. : 144)
6 D35-BB7(SEQ ID No. : 24) ; D177-BA7(SEQ ID No. : 26) ; D56A-AB6(SEQ ID No. : 28) ; D144-AE2(SEQID No. : 30)
7 D56-AG11(SEQID No. : 32) ; D179-AA1(SEQ ID No. : 34)
8 D56-AC7(SEQ ID No. : 36) ; D144-AD1(SEQ ID No. : 38)
9 D144-AB5(SEQID No. : 40)
10 D181-AB5(SEQID No. : 42) ; D73-Ac9(SEQ ID No. : 44)
11 D56-AC12(SEQ ID No. : 46)
12 D58-AB9(SEQ ID No. : 48) ; D56-AG9(SEQ ID No. : 50) ; D56-AG6(SEQ ID No. : 52) ; D35-BG11(SEQ ID No. : 54) ; D35-42(SEQ ID No. : 56) ;
D35-BA3(SEQ ID No. : 58) ; D34-57(SEQ ID No. : 60) ; D34-52(SEQ ID No. : 62)
13 D56AD10(SEQ ID No. : 66)
14 56-AA11(SEQ ID No. : 68)
15 D177-BD5(SEQ ID No. : 70) ; D177-BD7(SEQ ID No. : 84)
16 D56A-AG10(SEQ ID No. : 72) ; D58-BC5(SEQID No. : 74) ; D58-AD12(SEQ ID No. : 76)
17 D56-AC11(SEQ ID No. : 78) ; D56-AD6(SEQ ID No. : 88)
18 D73A-AD6(SEQ ID No.90 : )19 D70A-AB5(SEQ ID No. : 96) ; D70A-AB8(SEQ ID No. : 100) ; D70A-BH2(SEQ ID No. : 102) ; D70A-AA4(SEQ ID No. : 104) ; D70A-BA1(SEQ ID No. : 106) ; D70A-BA9(SEQID No. : 108)
20 D70A-BD4(SEQ ID No. : 110)
21 D181-AC5(SEQID No. : 112) ; D144-AH1(SEQID No. : 114) ; D34-65(SEQ ID No. : 116)
22 D35-BG2(SEQ ID No. : 118)
23 D73A-AH7(SEQID No. : 120)
24 D58-AA1(SEQID No. : 122) ; D185-BC1(SEQ IDNo. : 134) ; D185-BG2(SEQ ID No. : 136)
25 D73-AE10(SEQ ID No. : 124)
26 D56-AC12(SEQ ID No. : 126)
27 D177-BF7(SEQ ID No. : 128) ; 185-BD2(SEQ ID No. : 140)
28 D73A-AG3(SEQ ID No. : 130)
29 D70A-AA12(SEQ ID No. : 132) ; D176-BF2(SEQ ID No. : 86)
30 D176-BC3(SEQ ID No. : 146)
31 D176-BB3(SEQ ID No. : 148)
32 D186-AH4(SEQ ID No. : 6)
实施例 11 : 全长克隆的相关氨基酸序列同一性
推测实施例 5 中克隆的烟草全长基因核酸序列的完整氨基酸序列。通过 3 个保守 p450 结构域基序的存在来鉴定细胞色素 p450 基因, 所述 3 个保守 p450 结构域基序对应于 羧基末端的 UXXRXXZ、 PXRFXF 或 GXRXC, 其中 U 是 E 或 K, X 是任何氨基酸, Z 是 P、 T、 S 或 M。 还注意到这些克隆中的两个, D130-AA1 和 D101-BA2 几乎是完整的但缺少合适的终止子, 然 而它们都含有上述的 3 个 p450 细胞色素结构域。用 BLAST 程序鉴定所有 p450 具有的氨 基酸同一性, 把它们的全长序列彼此比较并且和已知的烟草基因比较。该程序使用了 NCBI 特定的 BLAST 工具 ( 两序列比对 (Align two sequences, bl2seq), http://www.ncbi.nlm. nih.oov/blast/bl2sea7bl2.html)。在没有过滤器的情况下用 BLASTN 比对两个核酸序列, 用 BLASTP 比对氨基酸序列。基于它们的氨基酸同一性百分比, 将各序列分到同一性组群 中, 其中各组群中包括的成员与另一个成员至少具有 85%同一性。氨基酸同一性为 90%或 更大的那些序列观察到优选的分组, 更优选的分组具有 95%氨基酸同一性或更大, 最优选 的分组具有氨基酸同一性为 99%或更大的那些序列。 采用这些标准, 鉴定出 25 个不同的组 群, 示于表 III。
在表 III 用于氨基酸同一性的参数范围内, 发现 3 个组群与已知烟草基因具有 大于 85 %或更大的同一性。第 5 组的成员与先前 Ralston 等提交的 GenBank 序列 GI : 14423327( 或 AAK62346) 具有高达 96%的全长序列氨基酸同一性。第 23 组与 Ralston 等 提交的 GI : 14423328( 或 AAK62347) 有高达 93%的氨基酸同一性。第 24 组与 Ralston 等 提交的 GI : 14423318( 或 AAK62343) 有 92%的氨基酸同一性。
表 III : 烟草全长 p450 基因的氨基酸序列同一性组群
1 D208-AD9(SEQ.ID.No.224) ; D120-AH4(SEQ.ID.No.180) ; D121-AA8(SEQ.ID.No.182), D122-AF10(SEQ.ID.No.184) ; D103-AH3(SEQ.ID.No.222) ; D208-AC8(SEQ. ID.No.218) ; D-235-ABI(SEQ.ID.No.246)
2 D244-AD4(SEQ.ID.No.250) ; D244-AB6(SEQ.ID.No.274) ; D285-AA8 ; D285-AB9 ; D268-AE2(SEQ.ID.No.270)
3 D100A-AC3(SEQ.ID.No.168) ; D100A-BE2
4 D205-BE9(SEQ.ID.No.276) ; D205-BG9(SEQ.ID.No.202) ; D205-AH4(SEQ. ID.No.294)
5 D259-AB9(SEQ.ID.No.260) ; D257-AE4(SEQ.ID.No.268) ; D147-AD3(SEQ. ID.No.194)
6 D249-AE8(SEQ.ID.No.256) ; D-248-AA6(SEQ.ID.No.254)
7 D233-AG7(SEQ.ID.No.266 ; D224-BD11(SEQ.ID.No.240) ; DAF10
8 D105-AD6(SEQ.ID.No 172) ; D215-AB5(SEQ.ID.No 220) ; D135-AE1(SEQ. ID.No.190)
9 D87A-AF3(SEQ.ID.No.216), D210-BD4(SEQ.ID.No.262)
10 D89-AB1(SEQ.ID.No.150) ; D89-AD2(SEQ.ID.No.152) ; 163-AG11(SEQ. ID.No.198) ; 163-AF12(SEQ.ID.No.196) 11 D267-AF10(SEQ.ID.No.296) ; D96-AC2(SEQ.ID.No.160) ; D96-AB6(SEQ. ID.No.158) ; D207-AA5(SEQ.ID.No.204) ; D207-AB4(SEQ.ID.No.206) ; D207-AC4(SEQ. ID.No.208)
12 D98-AG1(SEQ.ID.No.164) ; D98-AA1(SEQ.ID.No.162)
13 D209-AA12(SEQ.ID.No.212) ; D209-AA11 ; D209-AH10(SEQ.ID.No.214) ; D209-AH12(SEQ.ID.No.232) ; D90a-BB3(SEQ.ID.No.154)
14 D129-AD10(SEQ.ID.No.188) ; D104A-AE8(SEQ.ID.No.170)
15 D228-AH8(SEQ.ID.No.244) ; D228-AD7(SEQ.ID.No.241), D250-AC11(SEQ. ID.No.258) ; D247-AH1(SEQ.ID.No.252)
16 D128-AB7(SEQ.ID.No.186) ; D243-AA2(SEQ.ID.No.248) ; D125-AF11(SEQ. ID.No.228)
17 D284-AH5(SEQ.ID.No.298) ; D110-AF12(SEQ.ID.No.176)
18 D221-BB8(SEQ.ID.No.234)
19 D222-BH4(SEQ.ID.No.236)
20 D134-AE11(SEQ.ID.No.230)
21 D109-AH8(SEQ.ID.No.174)
22 D136-AF4(SEQ.ID.No.278)
23 D237-AD1(SEQ.ID.No.226)
24 D112-AA5(SEQ.ID.No.178)
25 D283-AC1(SEQ.ID.No.272)
根据靠近羧基末端的 UXXRXXZ p450 结构域和 GXRXC p450 结构域之间高度保守的 氨基酸同源性进一步将这些全长基因分组。如图 3 所示, 比对各克隆保守结构域彼此之间 的序列同源性, 并将这些克隆分到不同的同源性组群中。 在几种情况下, 虽然某克隆的核酸
序列是不同的, 但该区域的氨基酸序列是相同的。氨基酸同一性为 90%或更大的那些序列 观察到优选的分组, 更优选的分组具有 95%氨基酸同一性或更大, 最优选的分组具有氨基 酸同一性为 99%或更大的那些序列。 最终的分组类似于根据这些克隆的完整氨基酸序列的 同一性百分比而做的分组, 第 17 组除外 ( 表 III), 它被分为 2 个不同的组。
在表 IV 用于氨基酸同一性的参数范围内, 发现 3 个组群与已知烟草基因具有 90% 或更大的同一性。第 5 组的成员与先前 Ralston 等提交的 GenBank 序列 GI : 14423326( 或 AAK62346) 具有高达 93.4%的全长序列氨基酸同一性。第 23 组与 Ralston 等提交的 GI : 14423328( 或 AAK62347) 有高达 91.8%的氨基酸同一性。第 24 组与 Ralston 等提交的 GI : 14423318( 或 AAK62342) 有 98.8%的同一性。
表 IV : 烟草 p450 基因保守结构域之间区域的氨基酸序列同一性组群
1 1 D208-AD9(SEQ.ID.No.224) ; D120-AH4(SEQ.ID.No.180) ; D121-AA8(SEQ. ID.No.182), D122-AF10(SEQ.ID.No.184) ; D103-AH3(SEQ.ID.No.222) ; D208-AC8(SEQ. ID.No.218) ; D-235-ABI(SEQ.ID.No.246)
2 D244-AD4(SEQ.ID.No.250) ; D244-AB6(SEQ.ID.No.274) ; D285-AA8 ; D285-AB9 ; D268-AE2(SEQ.ID.No.270)
3 D100A-AC3(SEQ.ID.No.168) ; D100A-BE2
4 D205-BE9(SEQ.ID.No.276) ; D205-BG9(SEQ.ID.No.202) ; D205-AH4(SEQ. ID.No.294)
5 D259-AB9(SEQ.ID.No.260) ; D257-AE4(SEQ.ID.No.268) ; D147-AD3(SEQ. ID.No.194)
6 D249-AE8(SEQ.ID.No.256) ; D-248-AA6(SEQ.ID.No.254)
7 D233-AG7(SEQ.ID.No.266 ; D224-BD11(SEQ.ID.No.240) ; DAF10
8 D105-AD6(SEQ.ID.No.172) ; D215-AB5(SEQ.ID.No.220) ; D135-AE1(SEQ. ID.No.190)
9 D87A-AF3(SEQ.ID.No.216), D210-BD4(SEQ.ID.No.262)
10 D89-AB1(SEQ.ID.No.150) ; D89-AD2(SEQ.ID.No.152) ; 163-AG11(SEQ. ID.No.198) ; 163-AF12(SEQ.ID.No.196)
11 D267-AF10(SEQ.ID.No.296) ; D96-AC2(SEQ.ID.No.160) ; D96-AB6(SEQ. ID.No.158) ; D207-AA5(SEQ.ID.No.204) ; D207-AB4(SEQ.ID.No.206) ; D207-AC4(SEQ. ID.No.208)
12 D98-AG1(SEQ.ID.No.164) ; D98-AA1(SEQ.ID.No.162)
13 D209-AA12(SEQ.ID.No.212) ; D209-AA11 ; D209-AH10(SEQ.ID.No.214) ; D209-AH12(SEQ.ID.No.232) ; D90a-BB3(SEQ.ID.No.154)
14 D129-AD10(SEQ.ID.No.188) ; D104A-AE8(SEQ.ID.No.170)
15 D228-AH8(SEQ.ID.No.244) ; D228-AD7(SEQ.ID.No.241), D250-AC11(SEQ. ID.No.258) ; D247-AH1(SEQ.ID.No.252)
16 D128-AB7(SEQ.ID.No.186) ; D243-AA2(SEQ.ID.No.248) ; D125-AF11(SEQ. ID.No.228)
17 D284-AH5(SEQ.ID.No.298) ; D110-AF12(SEQ.ID.No.176)18 D221-BB8(SEQ.ID.No.234)
19 D222-BH4(SEQ.ID.No.236)
20 D134-AE11(SEQ.ID.No.230)
21 D109-AH8(SEQ.ID.No.174)
22 D136-AF4(SEQ.ID.No.278)
23 D237-AD1(SEQ.ID.No.226)
24 D112-AA5(SEQ.ID.No.178)
25 D283-AC1(SEQ.ID.No.272)
26 D110-AF12(SEQ.ID.No.176)
实施例 12 : 缺少一个或多个烟草细胞色素 p450 特异性结构域的烟草细胞色素 p450 克隆
4 个克隆与表 III 报道的其它烟草细胞色素基因具有高度的核酸同源性, 核酸同 源性介于 90%至 99%之间。 这 4 个克隆包括 D136-AD5、 D138-AD12、 D243-AB3 和 D250-AC11。 然而, 因为核苷酸移码框的原因, 这些基因不含有细胞色素 p450C- 末端的 3 个结构域中的 一个或多个, 因此排除在表 III 和 IV 所示的同一性组群之外。
有一个克隆, D95-AG1 的氨基酸同一性不含有第 3 个结构域 GXRXC, 该结构域用来 对表 III 或表 IV 中的 p450 烟草基因分组。该克隆的核酸同源性与其它烟草细胞色素基因 的同源性低。该克隆代表了烟草中细胞色素 p450 基因的一个新的、 不同的组群。
实施例 13 : 烟草细胞色素 p450 片段和克隆在改变烟草性质调控方面的应用
烟草 p450 核酸片段或整个基因可用于鉴定和选择烟草表型或组成有所改变的植 株, 更重要的是, 可用于鉴定和选择代谢物发生了变化的植株。用例如以反义方向 ( 用于下 调 ) 或有义方向 ( 用于上调 ) 将掺入选自本文所述的核酸片段或全长基因的多种转化系统 来产生转基因烟草植物。对于全长基因的过量表达, 编码本文所述全长基因的完整或功能 性部分或氨基酸序列的任何核酸序列都是理想的, 它们可有效增加某个酶的表达并因此在 烟草中产生表型效果。 通过一系列的回交获得纯合烟草品系, 并评价其表型变化, 包括但不 限于, 用本领域一般技术人员可获得的常用技术来分析内源性 p450RNA、 转录物、 p450 表达 的肽和植物代谢物的浓度。
烟草植物中表现出来的变化提供了感兴趣的所选基因的功能性作用的信息, 或者 可用作优选的烟草植物品种。
实施例 14 : 鉴定乙烯处理的转化株品系中诱导的基因
采 用 高 密 度 寡 核 苷 酸 阵 列 技 术, Affymetrix 基 因 芯 片(Affymetrix Inc., Santa Clara, CA) 阵列来进行基因表达的定量和高度平行性检测。在 使用该技术时, 通过在固体表面上直接合成寡核苷酸来制作核酸阵列。这种固相化学能够 产生含有数十万个寡核苷酸探针的阵列, 这些寡核苷酸探针以极高的密度压缩在芯片上, 这种芯片称为 可由一个杂交同时筛选几千个基因。每个基因通常由一组的 11-25 对探针来代表, 这取决于基因的大小。设计探针以使其具有最大的敏感性、 特异性和 可重复性, 从而使其总是可以分辨出特异性和背景信号以及密切相关的靶序列。
Affymetrix 基因芯片杂交试验包括下列步骤 : 设计和制备阵列, 从分离自生物样 品的 RNA 中制备荧光标记的靶, 标记的靶与基因芯片杂交, 筛选芯片, 分析扫描的图像, 产生基因表达谱。
A.Affymetrix 基因芯片的设计和定制
定 制 A f f y m e t r i x I n c . ( S a n t a C l a r a ,C A ) 生 产 的 G e n e C h i p CustomExpressAdvantage Array。芯片的大小是 18 微米, 芯片的格式是 100-2187, 可容纳 528 组探针 (11,628 个探针 )。除了来自 GenBank 的核酸序列之外, 所有序列都选自我们之 前鉴定出的烟草克隆, 所有探针都是定制设计的。共选择了 400 个烟草基因或片段包括在 基因芯片中。所选择的寡核苷酸的序列是基于基因 3’ 末端的独特区域。所选择的核酸序 列由如 ( 本专利申请 ) 所述从烟草中克隆的 56 个全长 p450 基因和 71 个 p450 片段组成。 其它烟草序列包括 270 个烟草 EST, 用 Clontech SSH 试剂盒 (BD Biosciences, Palo Alto, CA) 从抑制差减文库产生了这些 EST。在这些基因中, 一些寡核苷酸序列选自 GenBank 所列 的细胞色素 p450 基因。多达 25 个探针用于每个全长基因, 11 个探针用于每个片段。因为 缺乏独特的、 高质量的探针, 有些克隆所用的探针数目要少。 中也包括了合适 的对照序列。
探针阵列是 25 聚寡核苷酸, 用基于半导体的光刻蚀法结合固相化学合成技术将 这些寡核苷酸直接合成到玻璃片上。各阵列含有多达 100,000 个不同的寡核苷酸探针。因 为寡核苷酸探针合成在阵列中已知的位置上, 所以可用 Affymetrix Microarray 软 件将杂交模式和信号强度解释为基因同一性和相对表达水平。 各探针对由一个完全配对的 寡核苷酸和一个错配的寡核苷酸组成。完全配对的探针具有与特定基因准确互补的序列, 因此可检测该基因的表达。错配探针在其碱基的中心位置有一个碱基置换, 因此区别于完 全配对的探针, 所述的一个碱基置换干扰了靶基因转录物的结合。错配产生非特异性的杂 交信号或背景信号, 将该信号与完全配对的寡核苷酸检测到的信号比较。
B. 样品制备
杂交试验由 Genome Explorations, Inc.(Memphis, TN) 进行, 杂交中所用的 RNA 样 品由 6 对受乙烯诱导的非转化株 / 转化株等基因系组成。
这些样品包括 1 对 4407-25/4407-33 未处理的白肋烟草样品, 3 对乙烯处理的 4407-25/4407-33 样品, 1 对乙烯处理的深色烟草 NL Madole/181 和 1 对乙烯处理的白肋变 种 PBLB01/178。乙烯处理如实施例 1 所述。
用改良的酸酚和氯仿方法从上述乙烯处理和未处理的叶片中提取总 RNA。改良的 方法是用 1 克组织进行研磨, 随后在 5 毫升加入了 5 毫升苯酚 (pH5.5) 和 5 毫升氯仿的提 取缓冲液 (100mM Tris-HCl, pH 8.5 ; 200mMNaCl ; 10mM EDTA ; 0.5% SDS) 中涡旋。 将提取的 样品离心, 保留上清。该提取步骤再重复 2-3 次直到上清变得澄清。加入约 5 毫升氯仿以 除去痕量的苯酚。加入 3 倍体积的 ETOH 和 1/10 体积的 3M NaOAc(pH5.2) 以从混合的上清 组分中沉淀 RNA, 在 -20℃存贮 1 小时。转移到 Corex 玻璃容器中以后, 在 4℃ 9,000RPM 离 心 RNA 组分 45 分钟。离心下来的团块用 70%乙醇洗涤, 4℃ 9,000RPM 离心 5 分钟。团块 干燥以后, 将 RNA 团块溶解在 0.5 毫升不含 Rnase 的水中。RNA 团块溶解在 0.5 毫升不含 Rnase 的水中。分别用变性甲醛凝胶和分光光度计分析总 RNA 的质量和数量。3-5μg/μl 的总 RNA 样品送至 Genomeexplorations, inc. 进行杂交试验。
C. 杂交、 检测和数据输出
如下所述制备标记的 RNA 材料。 按生产商的方法用 SuperScript 双链 cDNA 合成试剂盒 (Gibco Life Technologies) 和寡 -dT24-T7(5′ -GGC CAGTGA ATT GTA ATA CGA CTC ACT ATA GGG AGGCGG-3′ ) 引物从 5-15μg 总 RNA 中合成第一链和第二链 cDNA。
T7 启 动 子 连 接 的 双 链 cDNA 作 为 模 板, 用 T7RNA 转 录 物 标 记 试 剂 盒 (ENZO Diagnostics Inc.) 通过体外转录同时合成并用生物素化的 UTP 和 CTP 来标记 cRNA。简 言之, 用 70 %乙醇洗涤前述步骤中合成的双链 cDNA, 重新悬浮在 22μl 不含 RNA 酶的水 中。cDNA 与下列物质一起 37℃温育 5 小时 : 10X 的反应缓冲液、 生物素标记的核糖核苷酸、 DTT、 RNA 酶抑制剂混合物各 4μl, 以及 2μl 20X T7RNA 多聚酶。经过 CHROMA SPIN-100 柱 (Clontech) 并在 -20℃沉淀 1 小时至过夜, 将标记上的 RNA 与未掺入的核糖核苷酸分离。
如下所述进行寡核苷酸阵列杂交和分析。将 RNA 团块重新悬浮在 10μl 不含 RNA 酶的水中, 10.0μg 在 200mM Tris- 乙酸, pH 8.1, 500mM KOAc, 150mM MgOAc 中 95 ℃ 下 用 热 和 离 子 介 导 的 水 解 片 段 化 35 分 钟。 片 段 化 的 cRNA 与 HG_U95Av2 寡 核 苷 酸 阵 列 (Affymetrix)45 ℃杂交 16 小时, 该寡核苷酸阵列上含有约 12,500 个经注释的全长 基因以及设计用于代表 EST 序列的其它探针组。用 6X SSPE(0.9M NaCl, 60mM NaH2PO4, 6mM EDTA+0.01 % Tween20)25 ℃ 下 洗 涤 阵 列, 然 后 50 ℃ 下 用 100mM MES、 0.1M[Na+]、 0.01% Tween20 进行严格条件下的洗涤。以藻红素 (phycoerythrein) 偶联的链霉亲和素 (Molecular Probes) 对阵列染色, 用激光共聚焦扫描仪 (Hewlett-Packard) 来测定荧光强 度。用 Microarray 软件 (Affymetrix) 分析扫描的图像。对于所用的所有阵列, 通过将某 阵列上所有基因的平均荧光强度校正 (scaling) 到恒定的目标强度 (250) 来使上样和染色 中的差异标准化。按用户指南用 Microarray Suite5.0(Affymetrix) 进行数据分析。各基 因的信号强度计算为平均强度差异, 以 [ ∑ (PM-MM)/( 探针对的数目 )] 代表, 其中 PM 和 MM 标示完全配对和错配的探针。
D. 数据分析和结果
Genome Explorations 的检测仪器产生的表达报告证实, 12 组杂交是成功的。该 报告上主要的参数包括噪音、 校正因子、 背景、 总探针组、 存在和不存在的探针组的数目和 百分比、 管家基因对照的信号强度。然后, 用 GCOS 结合其它 Microsoft 的软件来分析和表 示数据。分析了处理的各对之间的信号对比。经过不同处理的基因和片段所对应的各探针 的总体数据被编译, 分析编译的表达数据, 如变化呼叫 (call of the changes) 和信号 LOG 2 比例变化。
基因芯片技术的一个常规用途是发现在不同组织中有差异性表达的基因。在 本发明中, 通过成对的转化株和非转化株烟草品系, 包括 4407-25/4407-33 白肋变种、 PBLB01/178 白肋变种和 NL Madole/181 深色烟草变种, 测定了乙烯处理引起的遗传表达变 化。这些分析只检测由于生物学变化而使其表达发生了显著改变的那些基因。这些分析采 用了倍数 (Fold) 变化 ( 信号比率 ) 作为鉴定受诱导基因的重要标准。还考虑了其它参数, 如信号密度、 存在 / 不存在呼叫。
在分析了转化株和非转化株样品对中约 400 个基因表达差异的数据之后, 基于信 号强度的结果说明, 与非转化株品系相比, 只有两个基因 D121-AA8 和 D120-AH4 在转化株品 系中可重复地被乙烯处理所诱导。 如下所述表示这些数据, 以说明这些基因的差异性表达。 如表 V 所示, 在转化株品系, 例如白肋烟草变种 4407-33 中, 某基因的信号测定为与相关的 非转化株等基因品系 4407-25 的比率。在没有乙烯诱导时, 对于所有基因, 转化株与非转化株信号的比率都接近于 1.00。用 3 种独立的分析方法对等基因白肋品系的分析证明, 受乙 烯诱导时, 相对于非转化株品系, 两个基因 D121-AA8 和 D120-AH4 在转化株品系中受到诱 导。这些基因是彼此高度同源的, 约有 99.8%或更大的核酸序列同源性。如表 V 所示, 它们 在转化株品系中的相对杂交信号约比相应的非转化株品系中高 2-12 倍。相比较的, 根据两 个肌动蛋白样对照克隆 ( 内部对照 ) 标准化的比例, 没有发现它们在转化株品系中受诱导。 此外, 片段 D35-BG11( 其编码区的序列完全包含在 D121-AA8 和 D120-AH4 基因中 ) 在成对 的等基因转化株和非转化株品系的相同样品中被高水平诱导。 白肋烟草变种的另一个等基 因对, PBLB01 和 178 被显示具有相同的基因 D121-AA8 和 D120-AH4, 乙烯处理时在转化株中 受诱导。此外, D121-AA8 和 D120-AH4 基因优先在等基因深色烟草对 NL Madole 和 181 的 转化株品系中受诱导, 证明这些基因在转化株品系中的乙烯诱导不限于白肋烟草变种。在 所有情况下, 相对于相应的非转化株品系, D35-BG11 片段在转化株品系中都是受诱导最高 的一个。
表V: 乙烯处理的转化株和非转化株品系中克隆诱导的比较
实施例 15 : 克隆相关的 D35-BG11 全长基因
基因芯片杂交基于 3′反转录 (cRNA)。选自基因 3′端 ( 在下游 1000 个核苷酸的 区域中 ) 的探针在基因芯片上合成。因此, 为了获得 D121-AA8 和 D120-AH4 克隆的所有可 能的变化形式, 用 5′序列从烟草 cDNA 文库中进行了另外的克隆。
全长基因克隆自如实施例 5 所述从乙烯处理的 4407-33 组织中构建的 cDNA 文库。 采用如下所述的聚合酶链式反应法。基于 D121-AA8 基因的 3′序列 ( 包括非翻译区部分 ) 设计反向引物。D121-P2 引物 5′ -AGC AAG ATG ATCTTA GGT TTTAA-3′和 D 121-R-2 引 物 5′ -CAA GCA AGA TGA TCT TAG GTT TTA ATA AAG CTC AGGT-3′。T3 引物 (5′ CAA TTA ACC CTC ACTAAA GGG 3′ ) 位于质粒上插入片段的上游, 用作正向引物。 产生的 PCR 产 物进行琼脂糖电泳, 切下高分子量的相应条带, 纯化、 克隆并测序。用于克隆和测序的方法 如实施例 4 所述。测序和鉴定了 9 个新的克隆, 它们是 D425-AB10、 D425-AB11、 D425-AC9、 D425-AC10、 D425-AC11、 D425-AG11、 D425-AH7、 D425-AH11 和 D427-AA5。观察到这些克隆中 的每一个都与克隆 D121-AA8 和 D120-AH4 具有 99%或更大的核酸序列同一性。
实施例 16 : 烟草转化株品系中微粒体烟碱去甲基酶的乙烯诱导
如下所述, 对乙烯处理和非处理的成对的转化株和非转化株中富含微粒体的组分 中去甲基酶的酶活进行生化分析。
A. 微粒体的制备
在 4℃分离微粒体。 在由 50mM N-(2- 羟基乙基 ) 哌嗪 -N′ -(2- 乙磺酸 )(HEPES), pH 7.5, 3mM DL- 二硫苏糖醇 (DTT) 和蛋白酶抑制剂 Cocktail(Roche)(1 片 /50 毫升 ) 组 成的缓冲液中提取烟草叶片。粗提物通过 4 层粗棉布 (cheesecloth) 过滤以除去未打碎的 组织, 滤出液 20,000x g 离心 20 分钟以除去细胞碎片。将上清以 100,000x g 超离心 60 分 钟, 得到的上清即含有微粒体。将微粒体组分悬浮在提取缓冲液中, 进行超离心步骤, 其中 提取缓冲液中采用 0.5M 的不连续蔗糖梯度。将纯化的微粒体重新悬浮在添加了 10% (w/ v) 甘油作为低温保护剂的提取缓冲液中。将此微粒体制品存贮在液氮冷藏罐中直到使用。
B. 蛋白浓度测定
用溶解在丙酮中的 10%三氯乙酸 (TCA)(w/v) 沉淀微粒体蛋白, 用 RC DC 蛋白检测 试剂盒 (BIO-RAD) 按生产商的方法测定微粒体的蛋白浓度。
3. 烟碱去甲基酶活性试验 DL- 烟碱 ( 吡咯烷 -2-14C) 获得自 Moravek Biochemicals, 比活为 54mCi/mmol。 氯 丙嗪 (CPZ) 和氧化的细胞色素 (Cyt.C)( 二者均为 P450 抑制剂 ) 购自 Sigma。还原型烟酰 胺腺嘌呤二核苷酸磷酸盐 (NADPH) 是细胞色素 P450 的典型电子供体, 它通过 NADPH : 细胞 色素 P450 还原酶供应电子。在对照组的温育中去掉了 NADPH。常规的酶活试验由微粒体 蛋白 ( 约 2mg/ml)、 6mMNADPH、 55μM 14C 标记的烟碱组成。CPZ 和 Cyt.C 的使用浓度分别是 1mM 和 100μM。反应在 25℃进行 1 小时, 加入 300μl 甲醇到各 25μl 反应混合物中终止反 应。离心后, 用 Inertsil ODS-33p(150x 4.6mm) 柱 (Varian) 以反相高效液相色谱 (HPLC) 系统 (Agilent) 分离 20μl 的甲醇提取物。等梯度 (isocratic) 流动相是甲醇、 50mM 磷 酸钾缓冲液 (pH6.25) 的混合物, 其中二者的比例为 60 ∶ 40(v/v), 流速为 1 毫升 / 分钟。 通过与真正的未标记的降烟碱的峰进行比较, 收集降烟碱的峰, 用 2900 tri-carb Liquid Scintillation Counter(LSC)(Perkin Elmer) 进行定量。基于 1 小时温育中产生的 14C 标 记的降烟碱来计算烟碱去甲基酶的活性。
从乙烯处理和未处理的成对的白肋转化株 (4407-33 品系 ) 和非转化株 (4407-25 品系 ) 烟草品系获得样品。所有未处理的样品都没有任何可检测到的微粒体烟碱去甲基酶 活性。相反, 发现从乙烯处理的转化株品系获得的微粒体样品中含有大量的烟碱去甲基酶 活性。已显示, 烟碱去甲基酶受 P450 特异性抑制剂的抑制, 证明该去甲基酶活性与 P450 微 粒体来源的酶一致。
表 VI 显示了从白肋转化株烟草品系中获得的一组典型的酶活结果。相反的是, 从 乙烯处理的非转化株烟草中获得的样品不含有任何烟碱去甲基酶活性。这些结果证明, 在 转化株品系中烟碱去甲基酶受乙烯处理的诱导, 但在相应的等基因非转化株品系中不受诱 导。对于成对的等基因深色烟草品系获得了类似的结果, 其中在转化株品系中微粒体烟碱 去甲基酶活性被诱导, 但在相应的非转化株品系中未检测到该酶被诱导。这些结果都证明 了, 微粒体烟碱去甲基酶在转化株品系中受乙烯处理的诱导, 但在相应的等基因非转化株 品系中不受诱导。那些衍生自 P450 基因并且优先在转化株品系 ( 相对于相应的非转化株
品系 ) 中被诱导的基因是编码烟碱去甲基酶的候选基因。
表 VI : 乙烯诱导的白肋转化株和非转化株品系中的去甲基酶活性
考虑到本发明前面的详细描述, 预期在本发明的实施中本领域技术人员可进行很 多改进和变化。因此, 这些改进和变化都包括在下面权利要求的范围内。
技术领域 本 发 明 涉 及 从 烟 草 克 隆 细 胞 色 素 P450 基 因。 具 体 而 言, 本发明涉及在烟草 (Nicotiana) 植物中编码细胞色素 P450 酶 ( 下文称为 P450 和 P450 酶 ) 的核酸序列和使用 那些核酸序列来改变植物表型的方法。
背景技术 细胞色素 P450 催化各种化学上不同的底物的酶反应, 包括内源性和异源底物的 氧化、 过氧化和还原性代谢。在植物中, p450 参与包括植物产物合成在内的生化途径, 所 述产物例如是苯丙素 (phenylpropanoids)、 生物碱、 萜类、 脂质、 生氰糖苷 (cyanogenic glycoside) 和 葡 糖 异 硫 氰 酸 盐 (glucosinolates)(Chappel, Annu.Rev.Plant Physiol. Plant Mol.Biol.198, 49 : 311-343)。 细 胞 色 素 p450 也 称 为 血 红 素 - 硫 醇 盐 蛋 白 (heme-thiolate protein), 通常用作多组分电子转移链 ( 称为含 p450 的单加氧酶系统 ) 中的末端氧化酶。所催化的特定反应包括脱甲基化、 羟基化、 环氧化、 N- 氧化、 磺基氧化 (sulfooxidation)、 N-、 S- 和 O- 脱烷基化、 脱硫作用、 脱氨基作用和偶氮基、 硝基和 N- 氧化 物基团的还原。
烟草植物 p450 酶的各种作用涉及产生各种植物代谢物, 例如苯丙素、 生物碱、 萜 类、 脂质、 生氰糖苷、 葡糖异硫氰酸盐和其它化学物质的宿主。近年来, 人们开始了解一些 p450 酶影响植物中植物代谢物的组成。例如, 长期以来人们希望通过育种改变植物的所选 脂肪酸的特性来改善特定植物的风味和香味 ; 然而涉及控制这些叶子组成的水平的机理知 之甚少。下调与改变脂肪酸有关的 p450 酶可有助于积累提供更适宜的叶子表型质量的所 需脂肪酸。p450 酶的功能及其在植物组成中广泛的作用仍有待发现。例如, 特定类型的 p450 酶发现可催化脂肪酸分解为挥发性 C6- 和 C9- 醛和醇, 而主要是这些物质导致水果和 蔬菜具有 “新鲜翠绿” 的气味。可改变其它作为新目标的 p450 酶的水平, 通过改变烟草叶 子中的脂质组成和相关的降解代谢物来提高叶子组成的质量。 叶子中的几种这些成分受老 化的影响, 而老化刺激叶子质量特性的成熟。其它人也报道 p450 酶在改变涉及植物病原体 相互作用和疾病抗性的脂肪酸中起作用。
在 其 它 例 子 中, 已 提 示 p450 酶 涉 及 生 物 碱 的 生 物 合 成。 降 烟 碱 是 在 烟 草 (Nicotiana tabaceum) 中发现的少量生物碱。 推测它是这样产生的 : p450 介导的尼古丁脱 甲基化, 然后在 N 位酰化和亚硝基化, 从而产生一系列 N- 酰基降烟碱 (N-acylnonicotine) 和 N- 亚硝基降烟碱。推测的 p450 脱甲基酶催化的 N- 脱甲基化被认为是烟草中降烟碱生 物合成的主要来源。尽管认为该酶是微粒体酶, 但是迄今为止未能成功地纯化尼古丁脱甲 基化酶, 也未能分离到有关基因。
烟草植物 p450 酶的各种作用涉及产生各种植物代谢物, 例如苯丙素、 生物碱、 萜 类、 脂质、 生氰糖苷、 葡糖异硫氰酸盐和其它化学物质的宿主。近年来, 人们开始了解一些 p450 酶影响植物中植物代谢物的组成。例如, 长期以来人们希望通过育种改变植物的所选 脂肪酸的特性来改善特定植物的风味和香味 ; 然而涉及控制这些叶子组成的水平的机理知 之甚少。下调与改变脂肪酸有关的 p450 酶可有助于积累提供更适宜的叶子表型质量的所 需脂肪酸。p450 酶的功能及其在植物组成中广泛的作用仍有待发现。例如, 特定类型的 p450 酶发现可催化脂肪酸分解为挥发性 C6- 和 C9- 醛和醇, 而主要是这些物质导致水果和 蔬菜具有 “新鲜翠绿” 的气味。可改变其它作为新目标的 p450 酶的水平, 通过改变烟草叶 子中的脂质组成和相关的降解代谢物来提高叶子组成的质量。 叶子中的几种这些成分受老 化的影响, 而老化刺激叶子质量特性的成熟。其它人也报道 p450 酶在改变涉及植物病原体 相互作用和疾病抗性的脂肪酸中起作用。
在 其 它 例 子 中, 已 提 示 p450 酶 涉 及 生 物 碱 的 生 物 合 成。 降 烟 碱 是 在 烟 草 (Nicotiana tabaceum) 中发现的少量生物碱。 推测它是这样产生的 : p450 介导的尼古丁脱 甲基化, 然后在 N 位酰化和亚硝基化, 从而产生一系列 N- 酰基降烟碱 (N-acylnonicotine) 和 N- 亚硝基降烟碱。推测的 p450 脱甲基酶催化的 N- 脱甲基化被认为是烟草中降烟碱生 物合成的主要来源。尽管认为该酶是微粒体酶, 但是迄今为止未能成功地纯化尼古丁脱甲 基化酶, 也未能分离到有关基因。
此外, 有假说认为 ( 但未证实 )p450 酶的活性受遗传控制并且也强烈地受环境因 素的影响。例如, 当植物达到成熟阶段后, 认为烟草中尼古丁的脱甲基化作用大大增加。另 外, 有假说认为 ( 还未证实 ) 脱甲基化基因含有当存在时能抑制 RNA 翻译的转座元件。
在本发明之前, p450 酶形式的多样性、 其结构和功能的不同使得对烟草 p450 酶的 研究十分困难。此外, 对 p450 酶的克隆至少部分由于这些膜定位的蛋白通常存在量低且经 常在纯化中不稳定而受阻。因此, 需要在植物中鉴定 p450 酶和与那些 p450 酶相关的核酸 序列。特别是, 在烟草中仅有少许细胞色素 p450 蛋白已见报道。本文所述的发明发现了许 多细胞色素 p450 片段, 这些片段基于它们的序列同一性而对应于几组 p450 种类。 发明内容
本发明针对植物 p450 酶。本发明还涉及来自烟草的植物 p450 酶。本发明也涉及 其表达由乙烯和 / 和植物老化诱导的植物中的 p450 酶。本发明还涉及植物中具有酶活性 的核酸序列, 例如可分类为氧化酶、 脱甲基酶等和其它酶, 以及使用那些序列来使这些酶的 表达降低和沉默和过度表达。 本发明也涉及在含有较高降烟碱水平的植物而非显示较低降 烟碱水平的植物中发现的 p450 酶。 本发明一方面涉及以下所示的核酸序列 : SEQ.ID.NO.1、 3、 5、 7、 9、 11、 13、 15、 17、 19、 21、 23、 25、 27、 29、 31、 33、 35、 37、 39、 41、 43、 45、 47、 49、 51、 53、 55、 57、 59、 61、 63、 65、 67、 69、 71、 73、 75、 77、 79、 81、 83、 85、 87、 89、 91、 95、 97、 99、 101、 103、 105、 107、 109、 111、 113、 115、 117、 119、 121、 123、 125、 127、 129、 131、 133、 135、 137、 139、 143、 145、 147、 149、 151、 153、 155、 157、 159、 161、 163、 165、 167、 169、 171、 173、 175、 177、 179、 181、 183、 185、 187、 189、 191、 193、 195、 197、 199、 201、 203、 205、 207、 209、 211、 213、 215、 217、 219、 221、 223、 225、 227、 229、 231、 233、 235、 237、 239、 241、 243、 245、 247、 249、 251、 253、 255、 257、 259、 261、 263、 265、 267、 269、 271、 273、 275、 277、 279、 281、 283、 285、 287、 289、 291、 293、 295、 297、 299、 301、 303、 305、 307、 309、 311、 313 和 315。
在第 2 个相关的方面, 根据它们在细胞色素 p450 基序 GXRXCX(G/A) 后的第一核酸 到终止密码子的对应区域的同一性, 对那些含有大于 75%的核酸序列同一性的片段进行分 组。代表性的核酸组和各自的种类示于表 I。
在第 3 方面, 本发明涉及如以下所示的氨基酸序列 : SEQ.ID.NO.2、 4、 6、 8、 10、 12、 14、 16、 18、 20、 22、 24、 26、 28、 30、 32、 34、 36、 38、 40、 42、 44、 46、 48、 50、 52、 54、 56、 58、 60、 62、 64、 66、 68、 70、 72、 74、 76、 78、 80、 82、 84、 86、 88、 90、 92、 96、 98、 100、 102、 104、 106、 108、 110、 112、 114、 116、 118、 120、 122、 124、 126、 128、 130、 132、 134、 136、 138、 140、 144、 146、 148、 150、 152、 154、 156、 158、 160、 162、 164、 166、 168、 170、 172、 174、 176、 178、 180、 182、 184、 186、 188、 190、 192、 194、 196、 198、 200、 202、 204、 206、 208、 210、 212、 214、 216、 218、 220、 222、 224、 226、 228、 230、 232、 234、 236、 238、 240、 242、 244、 246、 248、 250、 252、 254、 256、 258、 260、 262、 264、 266、 268、 270、 272、 274、 276、 278、 280、 282、 284、 286、 288、 290、 292、 294、 296、 298、 300、 302、 304、 306、 308、 310、 312、 314 和 316。
在第 4 个相关的方面, 根据它们在细胞色素 p450 基序 GXRXCX(G/A) 后的第一核酸 到终止密码子的对应区域的同一性, 对那些含有大于 71%的核酸序列同一性的片段进行分 组。代表性的氨基酸组和各自的种类示于表 II。
在第 5 个方面, 本发明涉及如以下所示全长基因的氨基酸序列 : SEQ.ID.NO.150、 152、 154、 156、 158、 160、 162、 164、 166、 168、 170、 172、 174、 176、 178、 180、 182、 184、 186、 188、 190、 192、 194、 196、 198、 200、 202、 204、 206、 208、 210、 212、 214、 216、 218、 220、 222、 224、 226、 228、 230、 232、 234、 236、 238、 240、 242、 244、 246、 248、 250、 252、 254、 256、 258、 260、 262、 264、 266、 268、 270、 272、 274、 276、 278、 280、 282、 284、 286、 288、 290、 292、 294、 296、 298、 300、 302、 304、 306、 308、 310、 312、 314 和 316。
在第 6 个相关的方面, 根据彼此的同一性对那些含有大于 85%和更高的氨基酸序 列同一性的全长基因进行分组。代表性的氨基酸组和各自的种类示于表 III。
在第 7 个方面, 本发明涉及如 SEQ.ID.NO.299-357 所示片段的氨基酸序列。
在第 8 个相关的方面, 根据它们在第一细胞色素 p450 结构域 UXXRXXZ 到第 3 细胞 色素结构域 GXRXO 的对应区域的互相同一性, 对那些含有大于 90%和更高的氨基酸序列同 一性的片段进行分组, 其中 U 是 E 或 K, X 是任何氨基酸, Z 是 R、 T、 S 或 M。代表性的氨基酸 组和各自的种类示于表 IV。
在第 9 个相关的方面, p450 酶在烟草植物中的减少或消除或过度表达可使用 RNA 病毒系统瞬时实现。
评价得到的转化或感染的植物的表型改变, 包括 ( 但不限于 ) 使用本领域普通技 术人员常规可用的技术来分析内源性 p450RNA 转录物、 p450 表达肽和植物代谢物的浓度。
在第 10 个方面, 本发明也涉及产生具有改变的 p450 酶活性水平的转基因烟草谱 系。根据本发明, 这些转基因谱系含有有效地特定酶表达减少、 沉默或增加, 从而在烟草中 导致表型效应的核酸序列。 这种核酸序列包括 SEQ.ID.NO.1、 3、 5、 7、 9、 11、 13、 15、 17、 19、 21、 23、 25、 27、 29、 31、 33、 35、 37、 39、 41、 43、 45、 47、 49、 51、 53、 55、 57、 59、 61、 63、 65、 67、 69、 71、 73、 75、 77、 79、 81、 83、 85、 87、 89、 91、 95、 97、 99、 101、 103、 105、 107、 109、 111、 113、 115、 117、 119、 121、 123、 125、 127、 129、 131、 133、 135、 137、 139、 143、 145、 147、 149、 151、 153、 155、 157、 159、 161、 163、 165、 167、 169、 171、 173、 175、 177、 179、 181、 183、 185、 187、 189、 191、 193、 195、 197、 199、 201、 203、 205、 207、 209、 211、 213、 215、 217、 219、 221、 223、 225、 227、 229、 231、 233、 235、 237、 239、 241、 243、 245、 247、 249、 251、 253、 255、 257、 259、 261、 263、 265、 267、 269、 271、 273、 275、 277、 279、 281、 283、 285、 287、 289、 291、 293、 295、 297、 299、 301、 303、 305、 307、 309、 311、 313 和 315。
在本发明非常重要的第 11 方面, 与对照植物相比, 含有本发明核酸的植物栽培品 系在使用全长基因或其片段的下调能力或使用全长基因或其片段的过度表达能力上具有 改变的代谢物特性。
在本发明的第 12 方面, 含有本发明核酸的植物栽培品系具有对特定外源性化学 物质或植物害虫耐受的用途, 所述植物使用全长基因或其片段以更改来源于植物或植物以 外的代谢物的生物合成或降解。这种核酸序列包括 SEQ.ID.NO.1、 3、 5、 7、 9、 11、 13、 15、 17、 19、 21、 23、 25、 27、 29、 31、 33、 35、 37、 39、 41、 43、 45、 47、 49、 51、 53、 55、 57、 59、 61、 63、 65、 67、 69、 71、 73、 75、 77、 79、 81、 83、 85、 87、 89、 91、 95、 97、 99、 101、 103、 105、 107、 109、 111、 113、 115、 117、 119、 121、 123、 125、 127、 129、 131、 133、 135、 137、 139、 143、 145、 147、 149、 151、 153、 155、 157、 159、 161、 163、 165、 167、 169、 171、 173、 175、 177、 179、 181、 183、 185、 187、 189、 191、 193、 195、 197、 199、 201、 203、 205、 207、 209、 211、 213、 215、 217、 219、 221、 223、 225、 227、 229、 231、233、 235、 237、 239、 241、 243、 245、 247、 249、 251、 253、 255、 257、 259、 261、 263、 265、 267、 269、 271、 273、 275、 277、 279、 281、 283、 285、 287、 289、 291、 293、 295、 297、 299、 301、 303、 305、 307、 309、 311、 313 和 315。
在第 13 个方面, 本发明涉及筛选含有与所述核酸序列具有实质性核酸同一性的 基因的植物, 优选烟草。使用本发明有利于鉴定和选择含有精确的或实质性同一性的核酸 序列的植物, 其中这种植物是传统或转基因品种的育种程序、 诱变程序或天然存在的不同 植物种群的一部分。 可使用核酸探针结合核酸检测方法, 包括 ( 但不限于 ) 核酸杂交和 PCR 分析, 通过评价植物的核酸物质来筛选实质性核酸同一性的植物。核酸探针可由对应于以 下 SEQ ID 的所述核酸序列或其片段构成 : SEQ ID 1、 3、 5、 7、 9、 11、 13、 15、 17、 19、 21、 23、 25、 27、 29、 31、 33、 35、 37、 39、 41、 43、 45、 47、 49、 51、 53、 55、 57、 59、 61、 63、 65、 67、 69、 71、 73、 75、 77、 79、 81、 83、 85、 87、 89、 91、 95、 97、 99、 101、 103、 105、 107、 109、 111、 113、 115、 117、 119、 121、 123、 125、 127、 129、 131、 133、 135、 137、 139、 143、 145、 147、 149、 151、 153、 155、 157、 159、 161、 163、 165、 167、 169、 171、 173、 175、 177、 179、 181、 183、 185、 187、 189、 191、 193、 195、 197、 199、 201、 203、 205、 207、 209、 211、 213、 215、 217、 219、 221、 223、 225、 227、 229、 231、 233、 235、 237、 239、 241、 243、 245、 247、 249、 251、 253、 255、 257、 259、 261、 263、 265、 267、 269、 271、 273、 275、 277、 279、 281、 283、 285、 287、 289、 291、 293、 295、 297、 299、 301、 303、 305、 307、 309、 311、 313 和 315。 在第 14 个方面, 本发明涉及鉴定与所述核酸序列具有实质性氨基酸同一性的植 物基因, 优选烟草。可使用核酸探针结合核酸检测方法, 包括 ( 但不限于 ) 核酸杂交和 PCR 分析, 通过筛选植物 cDNA 文库来鉴定植物基因, 包括 cDNA 和基因组克隆, 优选烟草的 cDNA 和基因组克隆。核酸探针可由对应于以下 SEQ ID 的核酸序列或其片段构成 : 1、 3、 5、 7、 9、 11、 13、 15、 17、 19、 21、 23、 25、 27、 29、 31、 33、 35、 37、 39、 41、 43、 45、 47、 49、 51、 53、 55、 57、 59、 61、 63、 65、 67、 69、 71、 73、 75、 77、 79、 81、 83、 85、 87、 89、 91、 95、 97、 99、 101、 103、 105、 107、 109、 111、 113、 115、 117、 119、 121、 123、 125、 127、 129、 131、 133、 135、 137、 139、 143、 145 和 147。
在其它第 15 个方面, 可使用针对部分或全部所述氨基酸序列的抗体来筛选表达 肽的 cDNA 表达文库。这种氨基酸序列包括 SEQ ID 2、 4、 8、 9、 10、 12、 14、 16、 18、 20、 22、 24、 26、 28、 30、 32、 34、 36、 38、 40、 42、 44、 46、 48、 50、 52、 54、 56、 58、 60、 62、 64、 66、 68、 70、 72、 74、 76、 78、 80、 82、 84、 86、 88、 90、 92、 96、 98、 100、 102、 104、 106、 108、 110、 112、 114、 116、 118、 120、 122、 124、 126、 128、 130、 132、 134、 136、 138、 140、 144、 146、 148。
在第 16 个重要的方面, 本发明也涉及产生过度表达 p450 酶活性水平的转基因烟 草谱系。 根据本发明, 这些转基因谱系包括编码全长基因的氨基酸序列的所有核酸序列, 所 述基因有效地增加特定酶的表达从而导致烟草中的表型效应。这种氨基酸序列包括 SEQ. ID.150、 152、 154、 156、 158、 160、 162、 164、 166、 168、 170、 172、 174、 176、 178、 180、 182、 184、 186、 188、 190、 192、 194、 196、 198、 200、 202、 204、 206、 208、 210、 212、 214、 216、 218、 220、 222、 224、 226、 228、 230、 232、 234、 236、 238、 240、 242、 244、 246、 248、 250、 252、 254、 256、 258、 260、 262、 264、 266、 268、 270、 272、 274、 276、 278、 280、 282、 284、 286、 288、 290、 292、 294、 296、 298、 300、 302、 304、 306、 308、 310、 312、 314 和 316。
也提供了含有降烟碱含量降低的烟叶 ( 叶片和 / 或茎 ) 的烟草产品。该烟草产品 包括烟草 ( 含有叶片和 / 或茎的烟叶 ), 该烟草来自含有本文所述序列或消除或抑制了编码
烟草特异性亚硝基胺的基因的植物。 与用未消除或抑制编码烟草特异性亚硝基胺的基因的 烟草植物制备的烟草产品相比, 消除或抑制编码烟草特异性亚硝基胺的基因有效地降低了 烟草产品中约 5-10%、 或者约 10-20%、 或者约 20-30%、 或者 30%以上的烟草特异性亚硝 基胺。 本文使用的烟草产品可包括香烟、 雪茄、 烟丝、 鼻烟、 口嚼烟 (chewing tobacco)、 混合 了烟草产品的产品和它们的混合物。
本发明涉及如下各项 :
1. 一种分离的烟草核酸分子, 该核酸分子含有选自 SEQ.ID.No. : 299-357 的核酸 序列。
2. 一种转基因植物, 该转基因植物含有如项 1 所述的核酸分子。
3. 如项 2 所述的转基因植物, 其特征在于, 所述植物是烟草植物。
4. 一种产生转基因植物的方法, 该方法包括以下步骤 :
(i) 将如项 1 所述的核酸分子与在所述植物中具有功能的启动子操作性相连以产 生植物转化载体 ;
(ii) 用步骤的所述植物转化载体转化所述植物 ;
(iii) 选择用所述转化载体转化的植物细胞 ; 和 (iv) 从所述转化的植物细胞再生转化植物。
5. 如项 4 所述的方法, 其特征在于, 所述核酸分子处于反义方向。
6. 如项 4 所述的方法, 其特征在于, 所述核酸分子处于有义方向。
7. 如项 4 所述的方法, 其特征在于, 所述核酸分子处于 RNA 干扰方向。
8. 如项 4 所述的方法, 其特征在于, 所述核酸分子表达为双链 RNA 分子。
9. 如项 4 所述的方法, 其特征在于, 所述双链 RNA 分子长度为约 15-25 个核苷酸。
10. 如项 4 所述的方法, 其特征在于, 所述转基因植物是烟草植物。
11. 一种选择含有核酸分子的植物的方法, 其中分析所述植物中是否存在选自 299-357 的核酸序列。
12. 如项 11 所述选择植物的方法, 其特征在于, 通过 DNA 杂交分析所述植物。
13. 如项 11 所述选择植物的方法, 其特征在于, 所述 DNA 杂交是 Southern 印迹分 析。
14. 如项 11 所述选择植物的方法, 其特征在于, 所述 DNA 杂交是 Northern 印迹分 析。
15. 如项 11 所述选择植物的方法, 其特征在于, 通过 PCR 检测分析所述植物。
16. 如项 11 所述选择植物的方法, 其特征在于, 所述植物是烟草植物。
17. 一种增加或降低植物中降烟碱水平的方法, 所述方法包括以下步骤 :
(i) 将如项 1 所述的核酸分子与在所述植物中具有功能的启动子操作性相连以产 生植物转化载体 ;
(ii) 用步骤 (i) 所述植物转化载体转化所述植物 ;
(iii) 选择用所述转化载体转化的植物细胞 ; 和
(iv) 从所述转化的植物细胞再生转化植物。
18. 如项 17 所述的方法, 其特征在于, 所述核酸分子处于反义方向。
19. 如项 17 所述的方法, 其特征在于, 所述核酸分子处于有义方向。
20. 如项 17 所述的方法, 其特征在于, 所述核酸分子处于 RNA 干扰方向。 21. 如项 17 所述的方法, 其特征在于, 所述核酸分子表达为双链 RNA 分子。 22. 如项 17 所述的方法, 其特征在于, 所述转基因植物是烟草植物。 附图简述 图 1 显示核酸 SEQ.ID.No. : 1 和氨基酸 SEQ.ID.No. : 2。 图 2 显示核酸 SEQ.ID.No. : 3 和氨基酸 SEQ.ID.No. : 4。 图 3 显示核酸 SEQ.ID.No. : 5 和氨基酸 SEQ.ID.No. : 6。 图 4 显示核酸 SEQ.ID.No. : 7 和氨基酸 SEQ.ID.No. : 8。 图 5 显示核酸 SEQ.ID.No. : 9 和氨基酸 SEQ.ID.No. : 10。 图 6 显示核酸 SEQ.ID.No. : 11 和氨基酸 SEQ.ID.No. : 12。 图 7 显示核酸 SEQ.ID.No. : 13 和氨基酸 SEQ.ID.No. : 14。 图 8 显示核酸 SEQ.ID.No. : 15 和氨基酸 SEQ.ID.No. : 16。 图 9 显示核酸 SEQ.ID.No. : 17 和氨基酸 SEQ.ID.No. : 18。 图 10 显示核酸 SEQ.ID.No. : 19 和氨基酸 SEQ.ID.No. : 20。 图 11 显示核酸 SEQ.ID.No. : 21 和氨基酸 SEQ.ID.No. : 22。 图 12 显示核酸 SEQ.ID.No. : 23 和氨基酸 SEQ.ID.No. : 24。 图 13 显示核酸 SEQ.ID.No. : 25 和氨基酸 SEQ.ID.No. : 26。 图 14 显示核酸 SEQ.ID.No. : 27 和氨基酸 SEQ.ID.No. : 28。 图 15 显示核酸 SEQ.ID.No. : 29 和氨基酸 SEQ.ID.No.30。 图 16 显示核酸 SEQ.ID.No. : 31 和氨基酸 SEQ.ID.No. : 32。 图 17 显示核酸 SEQ.ID.No. : 33 和氨基酸 SEQ.ID.No. : 34。 图 18 显示核酸 SEQ.ID.No. : 35 和氨基酸 SEQ.ID.No. : 36。 图 19 显示核酸 SEQ.ID.No. : 37 和氨基酸 SEQ.ID.No. : 38。 图 20 显示核酸 SEQ.ID.No. : 39 和氨基酸 SEQ.ID.No. : 40。 图 21 显示核酸 SEQ.ID.No. : 41 和氨基酸 SEQ.ID.No. : 42。 图 22 显示核酸 SEQ.ID.No. : 43 和氨基酸 SEQ.ID.No. : 44。 图 23 显示核酸 SEQ.ID.No. : 45 和氨基酸 SEQ.ID.No. : 46。 图 24 显示核酸 SEQ.ID.No. : 47 和氨基酸 SEQ.ID.No. : 48。 图 25 显示核酸 SEQ.ID.No. : 49 和氨基酸 SEQ.ID.No. : 50。 图 26 显示核酸 SEQ.ID.No. : 51 和氨基酸 SEQ.ID.No. : 52。 图 27 显示核酸 SEQ.ID.No. : 53 和氨基酸 SEQ.ID.No. : 54。 图 28 显示核酸 SEQ.ID.No. : 55 和氨基酸 SEQ.ID.No. : 56。 图 29 显示核酸 SEQ.ID.No. : 57 和氨基酸 SEQ.ID.No. : 58。 图 30 显示核酸 SEQ.ID.No. : 59 和氨基酸 SEQ.ID.No. : 60。 图 31 显示核酸 SEQ.ID.No. : 61 和氨基酸 SEQ.ID.No. : 62。 图 32 显示核酸 SEQ.ID.No. : 63 和氨基酸 SEQ.ID.No. : 64。 图 33 显示核酸 SEQ.ID.No. : 65 和氨基酸 SEQ.ID.No. : 66。 图 34 显示核酸 SEQ.ID.No. : 67 和氨基酸 SEQ.ID.No. : 68。 图 35 显示核酸 SEQ.ID.No. : 69 和氨基酸 SEQ.ID.No. : 70。图 36 显示核酸 SEQ.ID.No. : 71 和氨基酸 SEQ.ID.No. : 72。 图 37 显示核酸 SEQ.ID.No. : 73 和氨基酸 SEQ.ID.No. : 74。 图 38 显示核酸 SEQ.ID.No. : 75 和氨基酸 SEQ.ID.No. : 76。 图 39 显示核酸 SEQ.ID.No. : 77 和氨基酸 SEQ.ID.No. : 78。 图 40 显示核酸 SEQ.ID.No. : 79 和氨基酸 SEQ.ID.No. : 80。 图 41 显示核酸 SEQ.ID.No. : 81 和氨基酸 SEQ.ID.No. : 82。 图 42 显示核酸 SEQ.ID.No. : 83 和氨基酸 SEQ.ID.No. : 84。 图 43 显示核酸 SEQ.ID.No. : 85 和氨基酸 SEQ.ID.No. : 86。 图 44 显示核酸 SEQ.ID.No. : 87 和氨基酸 SEQ.ID.No. : 88。 图 45 显示核酸 SEQ.ID.No. : 89 和氨基酸 SEQ.ID.No. : 90。 图 46 显示核酸 SEQ.ID.No. : 91 和氨基酸 SEQ.ID.No. : 92。 图 47 显示核酸 SEQ.ID.No. : 93 和氨基酸 SEQ.ID.No. : 94。 图 48 显示核酸 SEQ.ID.No. : 95 和氨基酸 SEQ.ID.No. : 96。 图 49 显示核酸 SEQ.ID.No. : 97 和氨基酸 SEQ.ID.No. : 98。 图 50 显示核酸 SEQ.ID.No. : 99 和氨基酸 SEQ.ID.No. : 100。 图 51 显示核酸 SEQ.ID.No. : 101 和氨基酸 SEQ.ID.No. : 102。 图 52 显示核酸 SEQ.ID.No. : 103 和氨基酸 SEQ.ID.No. : 104。 图 53 显示核酸 SEQ.ID.No. : 105 和氨基酸 SEQ.ID.No. : 106。 图 54 显示核酸 SEQ.ID.No. : 107 和氨基酸 SEQ.ID.No. : 108。 图 55 显示核酸 SEQ.ID.No. : 109 和氨基酸 SEQ.ID.No. : 110。 图 56 显示核酸 SEQ.ID.No. : 111 和氨基酸 SEQ.ID.No. : 112。 图 57 显示核酸 SEQ.ID.No. : 113 和氨基酸 SEQ.ID.No. : 114。 图 58 显示核酸 SEQ.ID.No. : 115 和氨基酸 SEQ.ID.No. : 116。 图 59 显示核酸 SEQ.ID.No. : 117 和氨基酸 SEQ.ID.No. : 118。 图 60 显示核酸 SEQ.ID.No. : 119 和氨基酸 SEQ.ID.No. : 120。 图 61 显示核酸 SEQ.ID.No. : 121 和氨基酸 SEQ.ID.No. : 122。 图 62 显示核酸 SEQ.ID.No. : 123 和氨基酸 SEQ.ID.No. : 124。 图 63 显示核酸 SEQ.ID.No. : 125 和氨基酸 SEQ.ID.No. : 126。 图 64 显示核酸 SEQ.ID.No. : 127 和氨基酸 SEQ.ID.No. : 128。 图 65 显示核酸 SEQ.ID.No. : 129 和氨基酸 SEQ.ID.No. : 130。 图 66 显示核酸 SEQ.ID.No. : 131 和氨基酸 SEQ.ID.No. : 132。 图 67 显示核酸 SEQ.ID.No. : 133 和氨基酸 SEQ.ID.No. : 134。 图 68 显示核酸 SEQ.ID.No. : 135 和氨基酸 SEQ.ID.No. : 136。 图 69 显示核酸 SEQ.ID.No. : 137 和氨基酸 SEQ.ID.No. : 138。 图 70 显示核酸 SEQ.ID.No. : 139 和氨基酸 SEQ.ID.No. : 140。 图 71 显示核酸 SEQ.ID.No. : 141 和氨基酸 SEQ.ID.No. : 142。 图 72 显示核酸 SEQ.ID.No. : 143 和氨基酸 SEQ.ID.No. : 144。 图 73 显示核酸 SEQ.ID.No. : 145 和氨基酸 SEQ.ID.No. : 146。 图 74 显示核酸 SEQ.ID.No. : 147 和氨基酸 SEQ.ID.No. : 148。图 75 显示核酸 SEQ.ID.No. : 149 和氨基酸 SEQ.ID.No. : 150。 图 76 显示核酸 SEQ.ID.No. : 151 和氨基酸 SEQ.ID.No. : 152。 图 77 显示核酸 SEQ.ID.No. : 153 和氨基酸 SEQ.ID.No. : 154。 图 78 显示核酸 SEQ.ID.No. : 155 和氨基酸 SEQ.ID.No. : 156。 图 79 显示核酸 SEQ.ID.No. : 157 和氨基酸 SEQ.ID.No. : 158。 图 80 显示核酸 SEQ.ID.No. : 159 和氨基酸 SEQ.ID.No. : 160。 图 81 显示核酸 SEQ.ID.No. : 161 和氨基酸 SEQ.ID.No. : 162。 图 82 显示核酸 SEQ.ID.No. : 163 和氨基酸 SEQ.ID.No. : 164。 图 83 显示核酸 SEQ.ID.No. : 165 和氨基酸 SEQ.ID.No. : 166。 图 84 显示核酸 SEQ.ID.No. : 167 和氨基酸 SEQ.ID.No. : 168。 图 85 显示核酸 SEQ.ID.No. : 169 和氨基酸 SEQ.ID.No. : 170。 图 86 显示核酸 SEQ.ID.No. : 171 和氨基酸 SEQ.ID.No. : 172。 图 87 显示核酸 SEQ.ID.No. : 173 和氨基酸 SEQ.ID.No. : 174。 图 88 显示核酸 SEQ.ID.No. : 175 和氨基酸 SEQ.ID.No. : 176。 图 89 显示核酸 SEQ.ID.No. : 177 和氨基酸 SEQ.ID.No. : 178。 图 90 显示核酸 SEQ.ID.No. : 179 和氨基酸 SEQ.ID.No. : 180。 图 91 显示核酸 SEQ.ID.No. : 181 和氨基酸 SEQ.ID.No. : 182。 图 92 显示核酸 SEQ.ID.No. : 183 和氨基酸 SEQ.ID.No. : 184。 图 93 显示核酸 SEQ.ID.No. : 185 和氨基酸 SEQ.ID.No. : 186。 图 94 显示核酸 SEQ.ID.No. : 187 和氨基酸 SEQ.ID.No. : 188。 图 95 显示核酸 SEQ.ID.No. : 189 和氨基酸 SEQ.ID.No. : 190。 图 96 显示核酸 SEQ.ID.No. : 191 和氨基酸 SEQ.ID.No. : 192。 图 97 显示核酸 SEQ.ID.No. : 193 和氨基酸 SEQ.ID.No. : 194。 图 98 显示核酸 SEQ.ID.No. : 195 和氨基酸 SEQ.ID.No. : 196。 图 99 显示核酸 SEQ.ID.No. : 197 和氨基酸 SEQ.ID.No. : 198。 图 100 显示核酸 SEQ.ID.No. : 199 和氨基酸 SEQ.ID.No. : 200。 图 101 显示核酸 SEQ.ID.No. : 201 和氨基酸 SEQ.ID.No. : 202。 图 102 显示核酸 SEQ.ID.No. : 203 和氨基酸 SEQ.ID.No. : 204。 图 103 显示核酸 SEQ.ID.No. : 205 和氨基酸 SEQ.ID.No. : 206。 图 104 显示核酸 SEQ.ID.No. : 207 和氨基酸 SEQ.ID.No. : 208。 图 105 显示核酸 SEQ.ID.No. : 209 和氨基酸 SEQ.ID.No. : 210。 图 106 显示核酸 SEQ.ID.No. : 211 和氨基酸 SEQ.ID.No. : 212。 图 107 显示核酸 SEQ.ID.No. : 213 和氨基酸 SEQ.ID.No. : 214。 图 108 显示核酸 SEQ.ID.No. : 215 和氨基酸 SEQ.ID.No. : 216。 图 109 显示核酸 SEQ.ID.No. : 217 和氨基酸 SEQ.ID.No. : 218。 图 110 显示核酸 SEQ.ID.No. : 219 和氨基酸 SEQ.ID.No. : 220。 图 111 显示核酸 SEQ.ID.No. : 221 和氨基酸 SEQ.ID.No. : 222。 图 112 显示核酸 SEQ.ID.No. : 223 和氨基酸 SEQ.ID.No. : 224。 图 113 显示核酸 SEQ.ID.No. : 225 和氨基酸 SEQ.ID.No. : 226。图 114 显示核酸 SEQ.ID.No. : 227 和氨基酸 SEQ.ID.No. : 228。 图 115 显示核酸 SEQ.ID.No. : 229 和氨基酸 SEQ.ID.No. : 230。 图 116 显示核酸 SEQ.ID.No. : 231 和氨基酸 SEQ.ID.No. : 232。 图 117 显示核酸 SEQ.ID.No. : 233 和氨基酸 SEQ.ID.No. : 234。 图 118 显示核酸 SEQ.ID.No. : 235 和氨基酸 SEQ.ID.No. : 236。 图 119 显示核酸 SEQ.ID.No. : 237 和氨基酸 SEQ.ID.No. : 238。 图 120 显示核酸 SEQ.ID.No. : 239 和氨基酸 SEQ.ID.No. : 240。 图 121 显示核酸 SEQ.ID.No. : 241 和氨基酸 SEQ.ID.No. : 242。 图 122 显示核酸 SEQ.ID.No. : 243 和氨基酸 SEQ.ID.No. : 244。 图 123 显示核酸 SEQ.ID.No. : 245 和氨基酸 SEQ.ID.No. : 246。 图 124 显示核酸 SEQ.ID.No. : 247 和氨基酸 SEQ.ID.No. : 248。 图 125 显示核酸 SEQ.ID.No. : 249 和氨基酸 SEQ.ID.No. : 250。 图 126 显示核酸 SEQ.ID.No. : 251 和氨基酸 SEQ.ID.No. : 252。 图 127 显示核酸 SEQ.ID.No. : 253 和氨基酸 SEQ.ID.No. : 254。 图 128 显示核酸 SEQ.ID.No. : 255 和氨基酸 SEQ.ID.No. : 256。 图 129 显示核酸 SEQ.ID.No. : 257 和氨基酸 SEQ.ID.No. : 258。 图 130 显示核酸 SEQ.ID.No. : 259 和氨基酸 SEQ.ID.No. : 260。 图 131 显示核酸 SEQ.ID.No. : 261 和氨基酸 SEQ.ID.No. : 262。 图 132 显示核酸 SEQ.ID.No. : 263 和氨基酸 SEQ.ID.No. : 264。 图 133 显示核酸 SEQ.ID.No. : 265 和氨基酸 SEQ.ID.No. : 266。 图 134 显示核酸 SEQ.ID.No. : 267 和氨基酸 SEQ.ID.No. : 268。 图 135 显示核酸 SEQ.ID.No. : 269 和氨基酸 SEQ.ID.No. : 270。 图 136 显示核酸 SEQ.ID.No. : 271 和氨基酸 SEQ.ID.No. : 272。 图 137 显示核酸 SEQ.ID.No. : 273 和氨基酸 SEQ.ID.No. : 274。 图 138 显示核酸 SEQ.ID.No. : 275 和氨基酸 SEQ.ID.No. : 276。 图 139 显示核酸 SEQ.ID.No. : 277 和氨基酸 SEQ.ID.No. : 278。 图 140 显示核酸 SEQ.ID.No. : 279 和氨基酸 SEQ.ID.No. : 280。 图 141 显示核酸 SEQ.ID.No. : 281 和氨基酸 SEQ.ID.No. : 282。 图 142 显示核酸 SEQ.ID.No. : 283 和氨基酸 SEQ.ID.No. : 284。 图 143 显示核酸 SEQ.ID.No. : 285 和氨基酸 SEQ.ID.No. : 286。 图 144 显示核酸 SEQ.ID.No. : 287 和氨基酸 SEQ.ID.No. : 288。 图 145 显示核酸 SEQ.ID.No. : 289 和氨基酸 SEQ.ID.No. : 290。 图 146 显示核酸 SEQ.ID.No. : 291 和氨基酸 SEQ.ID.No. : 292。 图 147 显示核酸 SEQ.ID.No. : 293 和氨基酸 SEQ.ID.No. : 294。 图 148 显示核酸 SEQ.ID.No. : 295 和氨基酸 SEQ.ID.No. : 296。 图 149 显示组群成员的氨基酸同一性。 图 150 显示序列组的比较。 图 151A-E 显示了全长克隆的对比。 图 152 显示通过 PCR 克隆细胞色素 p450cDNA 片段的方法。图 153 显示核酸 SEQ.ID No. : 356 和氨基酸 SEQ.ID.No. : 357。
图 154 显示核酸 SEQ.ID No. : 358 和氨基酸 SEQ.ID.No. : 359。
图 155 显示核酸 SEQ.IDNo. : 360 和氨基酸 SEQ.ID.No. : 361。
图 156 显示核酸 SEQ.ID No. : 362 和氨基酸 SEQ.ID.No. : 363。
图 157 显示核酸 SEQ.ID No. : 364 和氨基酸 SEQ.ID.No. : 365。
图 158 显示核酸 SEQ.ID No. : 366 和氨基酸 SEQ.ID.No. : 367。
图 159 显示核酸 SEQ.ID No. : 368 和氨基酸 SEQ.ID.No. : 369。
图 160 显示核酸 SEQ.ID No. : 370 和氨基酸 SEQ.ID.No. : 371。
图 161 显示核酸 SEQ.ID No. : 372 和氨基酸 SEQ.ID.No. : 373。
图 162 显示基因芯片上所有克隆的探针组序列。
图 163 显示了 SEQ.ID No. : 434-536。
发明详述
定义
除非另有定义, 本文使用的所有技术和科技术语均与本发明所属领域的普通 技术人员通常理解的具有相同的意义。Singleton 等, (1994)《微生物和分子生物学字 典》 (Dictionary of Microbiology and Molecular Biology), 第二版, John Wiley and Sons( 纽约 ) 为技术人员提供了许多关于本发明所用术语的通用字典。本文所提及的所有 专利和出版物均纳入本文作为参考。出于本发明的目的, 下列术语如下定义。 “酶活性” 包括脱甲基化、 羟基化、 环氧化、 N- 氧化、 磺基氧化、 N-、 S- 和 O- 脱烷基 化、 脱硫作用、 脱氨基作用和偶氮基、 硝基和 N- 氧化物基团的还原。术语 “核酸” 指单链或 双链形式的, 或有义或反义的脱氧核糖核酸或核糖核酸聚合物, 并且除非另有限制, 该术语 包括能以类似于天然存在核苷酸的方式与核酸杂交的天然核苷酸的已知类似物。 除非另有 指出, 特定的核酸序列包括其互补序列。
术语 “可操作性连接” 、 “可操作性结合” 和 “以可操作性顺序” 指核酸表达控制序 列 ( 例如启动子、 信号序列或转录因子结合位点的阵列 ) 和第二核酸序列之间的功能性连 接, 其中表达控制序列影响对应于第二序列的核酸的转录和 / 或翻译。
当术语 “重组体” 用于指细胞时, 它指该细胞复制异源核酸, 表达所述核酸或表达 异源核酸编码的肽、 异源肽或蛋白质。重组细胞可以有义或反义形式表达在细胞的天然形 式 ( 非重组 ) 中未发现的基因或基因片段。重组细胞也可表达在细胞的天然形式中发现的 基因, 但其中该基因通过人工方式被改变并重新引入细胞。
“结构基因” 是含有编码蛋白质、 多肽或其部分的 DNA 片段的基因的一部分, 并且 不包括启动转录的 5’ 序列。或者结构基因可编码不可翻译的产物。结构基因可是在细胞 中正常发现的基因, 或者它是引入的而非在细胞或细胞位置中正常发现的基因, 在这种情 况下称为 “异源基因” 。异源基因可全部或部分来源于本领域已知的任何来源, 包括细菌 基因组或附加体、 真核生物的、 核的或质粒 DNA、 cDNA、 病毒 DNA 或化学合成的 DNA。结构基 因可含有一种或多种修饰, 这些修饰可影响生物活性或其特性、 表达产物的生物活性或化 学结构、 表达速率或表达控制的方式。这种修饰包括 ( 但不限于 ) 一个或多个核苷酸的突 变、 插入、 删除和取代。结构基因可构成不间断的编码序列或可包括一个或多个与合适的 剪接接头结合的内含子。结构基因可以是可翻译或不可翻译的, 包括反义方向 (antisense
orientation)。结构基因可以是来源于多种来源和多种基因序列的复合物 ( 天然存在的或 合成的, 其中合成的指化学合成的 DNA)。
“来源于” 用来指从某种来源 ( 化学和 / 或生物的 ) 取得、 获得、 接受得、 追溯、 复 制或传下的。可通过对原始来源的化学或生物学操作 ( 包括, 但不限于取代、 添加、 插入、 删 除、 提取、 分离、 突变和复制 ) 产生衍生物。
涉及 DNA 序列的术语 “化学合成的” 指部分核苷酸组分在体外装配。可使用已 良好建立的方法 (Caruthers, 《DNA 和 RNA 测序的方法》 (Methodology of DNA and RNA Secquencing), (1983), Weissman 编, Praeger Publishers, New York, 第 1 章 ) 实现 DNA 的 手工化学合成 ; 可使用许多市售可得的机器的一种进行自动化学合成。
可通过以下方法进行序列的最佳对比 : Smith 和 Waterman(Adv.Appl.Math.2 : 482(1981)) 的局部同源性算法、 Needleman 和 Wunsch(J.Mol.Biol.48 : 443(1970)) 的同源 性算法、 Pearson 和 Lipman(Proc.Natl.Acad.Sci.(U.S.A.)85 : 2444(1988)) 的相似性检索 方法、 这些算法的计算机化的工具 (Wisconsin Genetics 软件包中的 GAP、 BESTFIT、 FASTA 和 TFASTA, Genetics Computer Group, 575 Science Dr., Madison, Wis.) 或通过检验。
可从几种来源 ( 包括生物信息国家中心 (NCBI, Bethesda, Md.) 和因特网 ) 获 得 NCBI 基础局部序列比对检索工具 (BLAST)(Altschul 等, 1990) 与序列分析程序 blast、 blastn、 blastx、 tblastn 和 tblastx 联合使用。 该工具可在 htp://www.ncbi.nlm.nih.gov/ BLAST/ 获得。如何使用该程序检测序列同一性描述于 http://www.ncbi.nlm.nih.gov/ BLAST/blast help.html。
本文使用并应用于氨基酸序列的术语 “实质性氨基酸同一性”或 “实质性氨基 酸序列同一性”表示多肽的一种特性, 其中与参考组在所翻译肽的细胞色素 p450 基序 GXRXCX(G/A) 后的第一氨基酸到终止密码子的对应区域相比, 所述肽含有至少 70 %的 序列同一性、 优选 80 %氨基酸序列同一性、 更优选 90 %氨基酸序列同一性、 最优选至少 99-100%序列同一性的序列。
本文使用并应用于核酸序列的术语 “实质性核酸同一性”或 “实质性核酸序列 同一性” 表示多核苷酸序列的一种特性, 其中与参考组在所翻译肽的细胞色素 p450 基序 GXRXCX(G/A) 后的第一核酸到终止密码子的对应区域相比, 所述多核苷酸含有至少 75%的 序列同一性、 优选 81%序列同一性、 更优选 91%序列同一性、 最优选至少 99-100%序列同 一性的序列。
核苷酸序列实质相同的另一个指标是两个分子在严格条件下是否可杂交。 严格条 件视序列而定, 在不同情况下是不同的。严格条件一般选择比给定离子强度和 pH 时特定序 列的热解链温度 (Tm) 低约 5-20℃, 通常是约 10-15℃。Tm 是在给定离子强度和 pH 时 50% 靶序列与匹配的探针杂交的温度。严格条件通常是盐浓度为约 0.02 摩尔, pH 是 7, 温度是 至少约 60℃。例如, 在标准的 Southern 杂交方法中, 严格条件包括于 42℃在 6×SSC 中初 次洗涤, 然后于至少约 55℃ ( 通常是约 60℃, 更常见是约 65℃ ) 在 0.2×SSC 进行一次或多 次额外洗涤。
出于本发明的目的, 当核苷酸序列编码的多肽和 / 或蛋白质实质性相同时, 核苷 酸序列也实质性相同。因此, 当一条核酸序列与第二条核酸序列编码的多肽实质性相同 时, 这两条核酸序列是实质性相同的, 即使由于遗传密码所允许的简并性造成它们在严格条件下不会杂交 ( 对密码子简并性和遗传密码的解释参见 Darnell 等, (1990)《分子生物 学》 (Molecular Cell Biology), 第二版, Scientific American Books W.H.Freeman and Company, New York)。 可通过许多本领域熟知的方式, 例如蛋白质样品的聚丙烯酰胺凝胶电 泳, 然后基于染色通过目测来表征蛋白质纯度或均一性。 出于特定的目的, 可能需要高分辨 率并可利用 HPLC 或类似的装置。
本文使用的术语 “载体” 指将 DNA 片段转移入细胞的核酸分子。载体可由于复制 DNA 并可在宿主细胞中独立地复制。术语 “运载体” 有时可与 “载体” 互换使用。本文使用 的术语 “表达载体” 指重组 DNA 分子, 该分子含有所需的编码序列和用于在特定宿主生物体 中表达操作性相连的编码序列所需合适的核酸序列。通常, 原核生物中表达所需的核酸序 列通常含有启动子、 操纵子 ( 任选 ) 与核糖体结合位点, 以及其它序列。已知真核细胞可利 用启动子、 增强子以及终止和聚腺苷酸化信号。
为再生完全经遗传工程改造的具有根的植物, 可在植物细胞中插入核酸, 例如通 过诸如体内接种的任何技术或通过任何已知的体外组织培养技术来产生可再生为完整植 物的转化植物细胞。因此, 例如可通过病原性或非病原性根瘤土壤杆菌 (A.tumefacien) 的 体外接种来插入植物细胞。也可使用其它这样的组织培养技术。
“植物组织” 包括分化或未分化的植物组织, 包括, 但不限于根、 芽、 叶、 花粉、 种子、 肿瘤组织以及培养物中细胞的各种形式, 例如单细胞、 原生质体、 胚和愈伤组织。植物组织 可在植物中 (in planta) 或器官中, 组织或细胞培养物中。
本文使用的 “植物细胞” 包括植物中的植物细胞和培养物中的植物细胞和原生质 体。
“cDNA” 或 “互补 DNA” 一般指核苷酸序列与 RNA 分子互补的单链 DNA 分子。cDNA 是通过逆转录酶在 RNA 模板作用形成的。
获得核酸序列的方案
根据本发明, 从转化体和非转化体烟草谱系的烟草组织中提取 RNA。 提取的 RNA 然 后用于产生 cDNA。然后使用两种方案产生本发明的核酸序列。
在第一方案中, 从植物组织中提取富含 polyA 的 RNA 并通过逆转录 PCR 制备 cDNA。 然后使用简并引物加上寡聚 d(T) 反向引物, 用单链 cDNA 产生 p450 特异性 PCR 群。以高度 保守的 p450 基序为基础设计引物。特定的简并引物的例子示于图 1。进一步分析含有合适 大小插入物的质粒的序列片段。这些插入物的大小一般是约 300-800 个核苷酸, 视采用何 种引物而定。
在第二方案中, 首先构建 cDNA 文库。使用简并引物加上在质粒上作为反向引物的 T7 引物, 使用质粒中的 cDNA 产生 p450 特异的 PCR 群。如第一方案中一样, 进一步分析含有 合适大小插入物的质粒的序列片段。
已知产生高水平降烟碱的烟草植物谱系 ( 转化体 ) 和降烟碱水平检测不到的植物 谱系可用作起始材料。
然后可从植物上取下叶子并用乙烯处理以激活本文所定义的 p450 酶活性。示于 本领域已知的技术提取总 RNA。然后使用如图 153 所述的寡聚 d(T) 引物经 PCR(RT-PCR) 产 生 cDNA 片段。然后可完全地构建本文实施例所述的 cDNA 文库。
p450 型酶的保守区域可用作简并引物 ( 图 75) 的模板。可通过 PCR 使用简并引物扩增 p450 特异性条带。表示 p450 样酶的区带可通过 DNA 测序鉴定。可使用鉴定合适的候 选对象的 BLAST 检索、 算法或其它工具来表征 PCR 片段的特性。
已鉴定片段的序列信息可用于开发 PCR 引物。这些引物与 cDNA 文库中的质粒引 物联合用于克隆全长 p450 基因。进行大规模 Sourthern 反向分析来检测所有获得的片段 克隆以及在一些情况中全长克隆的差别表达。在本发明的这个方面, 为筛选所有克隆的插 入物, 可用不同组织的标记的总 cDNA 作为探针来与克隆的 DNA 片段杂交, 进行大规模反向 Sourthern 测定。
也用非放射性和放射性 (P32)Northern 印迹测定来鉴定克隆 p450 片段和全长克 隆。
通过衍生它们的氨基酸序列与选择抗原性和对其它克隆独特的肽区域来制造针 对几种全长克隆的肽特异性抗体。制造了针对偶联于运载体蛋白的合成肽的家兔抗体。使 用这些抗体对植物组织进行 Western 印迹分析或其它免疫学方法。
可使用病毒诱导的基因沉默技术 (VIGS, Baulcombe, Current Opinions in Plant Biology, 1999, 2: 109-113) 检测以上鉴定的核酸序列。
通过衍生它们的氨基酸序列与选择可能的抗原性和对其它克隆独特的肽区域来 制造针对几种全长克隆的肽特异性抗体。 制造了针对偶联于运载体蛋白的合成肽的家兔抗 体。使用这些抗体进行 Western 印迹分析。 在本发明的另一方面, 使用干扰 RNA(RNAi) 技术在本发明的烟草植物中进一步 鉴定细胞色素 p450 酶活性。描述该技术的以下参考文献纳入本文作为参考, Smith 等, Nature, 2000, 407 : 319-320 ; Fire 等, Nature, 1998, 391 : 306-311 ; Waterhouse 等, PNAS, 1998, 95 : 13959-13964 ; Stalberg 等, Plant Molecular Biology, 1993, 23 : 671-683 ; Baulcombe, Current Opinions in Plant Biology, 1999, 2: 109-113 和 Brigneti 等, EMBO Journal, 1998, 17(22) : 6739-6746。可使用 RNAi 技术、 反义技术或所述的各种其它方法来 转化植物。
有几种技术将外来遗传物质引入植物细胞并获得稳定地维持和表达所引入基因 的植物。这种技术包括加速包裹在微粒上的遗传物质进入细胞 ( 授予 Cornell 的美国专利 4,945,050 和授予 DowElanco 的美国专利 5,141,131)。可使用土壤杆菌技术来转化植物, 参见授予 University of Toledo 的美国专利 5,177,010 ; 授予 Texas A & M 的 5,104,310 ; Schilperoot 的欧洲专利申请 0131624B1、 欧洲专利申请 120516、 159418B1、 欧洲专利申 请 120516、 159418B1 和 176,112 ; 授 予 Schilperoot 美 国 专 利 5,149,645 ; 5,469,976 ; 5,464,763 ; 4,940,838 和 4,693,976 ; MaxPlanck 的欧洲专利申请 116718、 290799、 320500 ; Japan Nicotiana 的欧洲专利申请 604662 和 627752 ; Ciba Geigy 的欧洲专利申请 0267159、 0292435 和美国专利 5,231,019 ; 授予 Calgene 的美国专利 5,463,174 和 4,762,785 ; 授予 Agracetus 的美国专利 5,004,863 和 5,159,135。其它转化技术包括 whiskers 技术, 参见, 例如授予 Zeneca 的美国专利 5,302,523 和 5,464,765。 电穿孔技术也用于转化植物, 参见, Boyce Thompson Institute 的 WO 87/06614、 Dekalb 的 5,472,869 和 5,384,253 ; PGS 的 WO9209696 和 WO9321335。所有这些转化专利和出版物引作参考。除了许多转化植物的技 术以外, 与外来基因接触的组织的类型也可变。这种组织包括, 但不限于胚胎发生组织、 I 和 II 型愈伤组织、 下胚轴、 分生组织等。使用技术人员已知的合适的技术几乎可转化所有
分化过程中的植物组织。
引入植物的外来遗传物质可包含选择标记。具体的标记可由技术人员判断, 但 以下选择标记可与任何其它可用作选择标记的本文未列出的基因一起使用。这种选择 标记包括, 但不限于 : 编码抗生素卡那霉素、 新霉素和 G418 抗性的转座子 Tn5(Aph II) 的氨基糖苷磷酸转移酶基因, 以及编码对 N- 膦酰甲基甘氨酸、 潮霉素、 氨甲喋呤、 草铵膦 (phosphinothricin)(bar)、 咪唑啉酮、 磺酰脲和三唑并嘧啶除草剂, 例如 chlorosulfuron、 溴苯腈、 茅草枯等具抗性或耐受性的那些基因。
除了选择标记以外, 可能需要使用报道基因。 在一些例子中, 可使用报道基因而无 需选择标记。报道基因是通常不存在于或不表达于受者生物体或组织中的基因。报道基因 通常编码提供一些表型改变或酶性能的蛋白质。这种基因的例子见纳入本文作为参考的 K.Weising 等, Ann.Rev.Genetics, 22, 421(1988)。优选的报道基因包括, 但不限于葡糖醛 酸酶 (GUS) 基因和 GFP 基因。
一旦引入植物组织后, 可通过任何本领域已知的方法来评价结构基因的表达, 可 以 mRNA 转录、 蛋白质合成或发生沉默基因的量来检测表达 ( 参见纳入本文作为参考的美国 专利号 5,583,021)。用于体外培养植物细胞和在许多情况中, 用于再生完整植物的技术是 已知的 ( 欧洲申请号 88810309.0)。本领域的技术人员已知将引入的表达复合物变为商业 有用品种的方法。 一旦获得表达所需水平的 p450 酶的植物细胞, 可使用本领域熟知的方法和技术 再生植物组织和完整的植物。再生的植物可通过常规方法繁殖, 引入的基因可通过常规植 物育种技术转入其它品系或品种。
以下实施例描述了实施本发明的方法并且应理解为是说明性的, 而非基于此来限 制本发明在权利要求中所定义的范围。
实施例 实施例 1 植物组织的发育和乙烯处理
植物生长
将植物种在盆中, 在温室中生长 4 周。将 4 周龄的幼苗移到单独的盆中, 温室中生 长 2 个月。生长过程中, 每天给植物浇水 2 次, 水中含有 150ppm 的 NPK 肥料。将展开的绿 叶与植物分离, 以进行下面所述的乙烯处理。
细胞系 78379
由 肯 塔 基 大 学 发 放 的 烟 草 品 系 78379 用 作 植 物 材 料 的 来 源, 它是一种白肋 (burley) 烟草品系。 用本领域种植烟草的标准方法培养 100 株植物, 移植, 并且用不同的数 字 (1-100) 给它们贴注标签。用推荐的方法施肥和进行田间管理。
100 株植物中的 3/4 将 20-100%的烟碱转化为降烟碱。 100 株中的 1/4 将小于 5% 的烟碱转化为降烟碱。植株 87 转化率最低 (2% ), 而植株 21 的转化率为 100%。将转化率 小于 3%的植株分类为非转化株。对植株 87 和 21 自花授粉的种子以及杂交 (21 x 87 和 87 x 21) 的种子进行遗传差异和表型差异的研究。来自植株 21 自花授粉种子的植物是转 化株, 99%的来自植株 87 自花授粉种子的植物是非转化株。 剩余 1%的来自植株 87 自花授 粉种子的植物有较低的转化率 (5-15% )。杂交种均为转化株。
细胞系 4407
烟草品系 4407 用作植物材料来源, 它是一种白肋品系。选择均一的并且具代表性 的植物 (100) 并贴上标签。在这 100 株植物中, 97 株是非转化株, 3 株是转化株。植株 56 的转化率最低 (1.2% ), 植株 58 的转化水平最高 (96% )。将这两株植物进行自花授粉和 杂交。
来自植株 58 自花授粉种子的植株产生 3 ∶ 1 的分离比 ( 转化株∶非转化株= 3 ∶ 1)。植株 58-33 和 58-25 分别被鉴定为纯合转化株和非转化株植物品系。植株 58-33 下一代后裔中的分析确证了该植株的稳定转化率。
细胞系 PBLB01
PBLB01 是由 ProfiGen, Inc. 研究开发的一种白肋品系, 用作植物材料的来源。从 PBLB01 的第一代 (foundation) 种子中选择转化株植株。
乙烯处理方法
将绿色叶片从温室生长 2-3 个月的植物分离, 喷施 0.3 %的乙烯溶液 ( 商品名 Ethephon(Rhone-Poulenc))。将每片经喷施的叶子悬挂在配有加湿器的养护架 (curing rack) 上, 覆盖塑料膜。在处理期间, 用乙烯溶液定期喷施样品叶片。乙烯处理后约 24-48 小时, 收集叶子提取 RNA。取同一组样品的另外一份 (sup-sample) 用于代谢成分分析以测 定叶片代谢物的浓度以及感兴趣的更具体的成分如多种生物碱的分析。
例如, 可如下进行生物碱分析。样品 (0.1 克 ) 和 0.5 毫升 2N NaOH 以及含有喹啉 ( 作为内标 ) 和甲基叔丁基乙醚的 5 毫升提取液在 150rpm 振荡。在配有 FID 检测器的 HP 6890GC 上分析样品。250℃的温度用于检测器和上样器 (injector)。使用含有与 5%苯酚 和 95%甲基硅酮 (methyl silicon) 交联的熔融硅石的 HP 柱 (30m-0.32nm-1m), 温度梯度 为每分钟 10℃, 110-185℃。 该柱在 100℃工作, 用氦气作为运载气体, 流速为 1.7cm3min-l, 分流比为 40 ∶ 1, 上样体积为 2·1。
实施例 2 : 分离 RNA
对于 RNA 的提取, 如上所述用乙烯处理 2 月龄温室植物的中等大小的叶片。0 和 24-48 小时的样品用于 RNA 提取。在有些情况下, 从打顶 (flower-head removal) 后 10 天 的植物取处于衰老过程的叶片样品。这些样品也用于提取。用 Rneasy Plant Mini (Qiagen, Inc., Valencia, California) 按照生产商的方法分离总 RNA。
用 DEPC 处理过的研钵和杵在液氮中将组织样品研磨为细粉。将约 100 毫克磨碎 的组织转移到灭菌的 1.5 毫升 eppendorf 管中。将样品管置于液氮中, 直到收集完所有样 品。然后, 将试剂盒中提供的 450μl RLT 缓冲液加入各管中。剧烈振荡样品, 然后在 56℃ 温育 3 分钟。 将裂解物加在放于 2 毫升收集管中的 QIAshredderTM 旋转柱上, 最大速度离心 2 分钟。收集流出液, 加 0.5 体积的乙醇到澄清的裂解液中。充分混合样品, 转移到放在 2 毫升收集管中的小旋转柱中。10,000rpm 离心样品 1 分钟。然后, 吸取 700μl RW1 缓冲液 到 柱上, 10,000rpm 离心 1 分钟。吸取 RPE 缓冲液到置于新收集管中的 旋转柱上, 以最大速度离心 柱上, 10,000rpm 离心 1 分钟。再将 RPE 缓冲液加到 钟。将2 分钟以使膜干燥。为了除掉残留的乙醇, 将膜置于一空收集管上, 再以最大速度离心 1 分 柱转移到一个新的 1.5 毫升收集管中, 将 40μl 不含 RNA 酶的水直接吸到 膜上。该最终洗脱物在 10,000rpm 离心 1 分钟。用变性甲醛凝胶和分光光度计分析总 RNA 的质量和数量。
按照生产商的方法用 OligotexTM poly A+RNA 纯化试剂盒 (Qiagen Inc.) 分离 Poly(A)RNA。使用溶于最大为 250μl 体积的约 200μg 总 RNA。将 250μl OBB 缓冲液和 15μl OligotexTM 悬浮液加到 250μl 总 RNA 中。 通过吸打使这些物质彻底混合, 在加热器 (heating block) 上 70℃保温 3 分钟。然后, 将样品置于室温约 20 分钟。最大速度离心 2 分钟得到 oligotex : mRNA 复合物团块。从微离心管中除去全部上清液, 仅剩约 50μl。再 用 OBB 缓冲液处理样品。通过涡旋将 oligotex : mRNA 团块重新悬浮在 400μl OW2 缓冲液 中。将该混合物转移到置于新管中的小旋转柱上, 以最大速度离心 1 分钟。将旋转柱移到 新管中, 再往该柱中加入 400μl OW2 缓冲液。然后, 以最大速度离心该管。将旋转柱转移 到最终的 1.5 毫升微量离心管中。用 60μl 热的 (70℃ )OEB 缓冲液洗脱样品。用变性甲醛 凝胶和分光光度计分析 Poly A 产物。
实施例 3 : 反转录 -PCR
按 照 生 产 商 的 方 法 用 SuperScript 反 转 录 酶 (Invitrogen, Carlsbad, California) 制备第一链 cDNA。 富集了 poly A+RNA 的寡聚 dT 引物混合物由少于 5μg 的总 RNA、 1μl 10mM dNTP 混合物、 1μl Oligo d(T)12-18(0.5μg/μl) 和至多 10μl 的经 DEPC 处理的水组成。各样品在 65℃温育 5 分钟, 然后置于冰上至少 1 分钟。按顺序加入下列各 组分, 以制备反应混合物 : 2μl 10X RT 缓冲液、 4μl 25mM MgC12、 2μl 0.1M DTT 和 1μl 去除 RNA 酶的重组 RNA 酶抑制剂 (Rnase OUT Recombinant RNase Inhibitor)。吸取 9μl 反应混合物到各 RNA/ 引物混合物, 轻柔混合。42℃温育 2 分钟, 在各管中加入 1μl Super Script IITM RT, 42℃温育 50 分钟。在 70℃终止反应 15 分钟, 冰上冷却。离心收集样品, 在各管中加入 1μl RNase H, 37℃温育 20 分钟。用 200pmoles 正向引物 ( 如图 75 所示的 变性引物, SEQ ID NO.149-156) 和 100pmoles 反向引物 (18 碱基的寡聚 d(T), 接一个随机 碱基 ) 进行第二次 PCR。
反应条件是 94℃ 2 分钟 ; 然后进行 40 个循环的 PCR : 94℃ 1 分钟, 45-60℃ 2 分钟, 72℃ 3 分钟 ; 最后 72℃再延伸额外的 10 分钟。
用 1%的琼脂糖凝胶电泳分析 10 微升的扩增样品。 将大小正确的条带从琼脂糖凝 胶上纯化出来。
实施例 4 : PCR 片段群体的产生
按 照 生 产 商 的 方 法 将 实 施 例 3 得 到 的 PCR 片 段 连 接 到 pGEM-T Easy Vector(Promega, Madison, Wisconsin) 中。用连接产物转化 JM109 感受态细胞, 涂在 LB 培 养基平板上, 进行蓝 / 白选择。选择克隆, 置于 96 孔板上在 1.2 毫升 LB 培养基中 37℃生长 过夜。对于所有选出的集落保留冻存管。用 Beckman′ s Biomeck 2000 小制备机器人技 术 (miniprep robotics) 以 Wizard SVMiniprep 试剂盒 (Promega) 从平板上纯化质粒。用 100μl 水洗脱质粒 DNA, 存贮于 96 孔板中。用 EcoRl 消化质粒, 并用 1%琼脂糖凝胶分析以 确证 DNA 的量和插入片段的大小。用 CEQ 2000 测序仪 (Beckman, Fullerton, California) 测序含有 400-600bp 插入片段的质粒。用 BLAST 搜索将测得的序列与 Genbank 数据库进行 比对。鉴定与 p450 相关的片段并进一步分析。或者, 将 p450 片段从差减文库中分离出来。 如上所述分析这些片段。
实施例 5 : CDNA 文库的构建如下所述从乙烯处理的叶片中制备总 RNA 以构建 cDNA 文库。首先, 用改良的酸酚 和氯仿提取方法从乙烯处理的烟草品系 58-33 叶片中提取总 RNA。改良的方法是用 1 克组 织进行研磨, 随后在 5 毫升加入了 5 毫升苯酚 (pH5.5) 和 5 毫升氯仿的提取缓冲液 (100mM Tris-HCl, pH 8.5 ; 200mM NaCl ; 10mM EDTA ; 0.5% SDS) 中涡旋。 将提取的样品离心, 保留上 清。该提取步骤再重复 2-3 次直到上清变得澄清。加入约 5 毫升氯仿以除去痕量的苯酚。 加入 3 倍体积的 ETOH 和 1/10 体积的 3M NaOAc(pH5.2) 以从混合的上清组分中沉淀 RNA, 在 -20℃存贮 1 小时。转移到 Corex 玻璃容器中以后, 在 4℃ 9,000RPM 离心 RNA 组分 45 分 钟。离心下来的团块用 70%乙醇洗涤, 4℃ 9,000RPM 离心 5 分钟。团块干燥以后, 将 RNA 团 块溶解在 0.5 毫升不含 Rnase 的水中。RNA 团块溶解在 0.5 毫升不含 Rnase 的水中。分别 用变性甲醛和分光光度计分析总 RNA 的质量和数量。
以 下 述 步 骤 用 Oligo(dT) 纤 维 素 方 法 (Invitrogen) 和 微 离 心 旋 转 柱 (Invitrogen) 从得到的总 RNA 中分离 poly A+RNA。约 20mg 总 RNA 进行两次纯化以获得高 质量的 poly A+RNA。 用变性甲醛和随后的已知全长基因的 RT-PCR( 确保高质量的 mRNA) 来 分析 PolyA+RNA 产物。
接 着, 以 poly A+RNA 作 模 板 用 cDNA 合 成 试 剂 盒、 合成试剂盒 和 III 金 克 隆 试 剂 盒 (gold cloning kit)(Stratagene, La Jolla, California) 来产生 cDNA 文库。其中的方法按照生产商规定的步骤来进行。用约 8μg polyA+RNA 来构建 cDNA 文库。初级文库的分析显示约有 2.5×106-1×107pfu。用 IPTG 和 X-gal 进行了互补分析, 以检测文库的质量背景, 其中重组噬菌斑的表达高出背景 反应 100 倍以上。
用随机 PCR 对文库进行的更为定量的分析表明, 插入的 cDNA 的平均大小约为 1.2kb。该方法采用了如下所述的两步法 PCR。对于第一步, 反向引物的设计是基于从 p450 片段获得的初级序列信息。设计的反向引物和 T3( 正向 ) 引物用于从 cDNA 文库中扩增相 应的基因。PCR 反应物进行琼脂糖凝胶电泳, 切割高分子量的相应条带, 纯化、 克隆并测序。 在第二步中, 用根据 p450 的 5′ UTR 或翻译起始区域设计的新引物作为正向引物, 和反向引 物一起 ( 根据 p450 的 3′ UTR 设计 ) 用于下一步的 PCR 以获得全长 p450 克隆。
如实施例 3 所述 ( 反向引物除外 ) 从构建的 cDNA 文库中用 PCR 扩增获得 p450 片 段。用位于质粒上 cDNA 插入片段下游 ( 见图 75) 的 T7 引物作为反向引物。如实施例 4 所 述分离、 克隆和测序 PCR 片段。 从构建的 cDNA 文库中用 PCR 方法分离全长 p450 基因。用基因特异性反向引物 ( 根据 p450 片段的下游序列设计 ) 和正向引物 ( 位于文库质粒上的 T3) 来克隆全长基因。 分离、 克隆并测序 PCR 片段。如果需要, 可进行第二步 PCR。在第二步 PCR 中, 用根据克隆 的 p450 的 5′ UTR 设计的新正向引物和根据 p450 的 3′ UTR 设计的反向引物来进行下一 步的 PCR 反应, 以获得全长 p450 克隆。然后对克隆测序。
实施例 6 : 克隆片段的鉴定 - 反向 SOUTHERN 印迹分析
在以上实施例中鉴定的所有 p450 克隆上进行非放射性大规模反向 southern 印迹 试验以检测差异性表达。观察到不同 p450 基因簇之间的表达水平非常不同。在高水平表 达的克隆上又进行了实时检测。
非放射性 southern 印迹方法按如下所述进行。
1) 如实施例 2 所述用 Qiagen Rnaeasy 试剂盒从乙烯处理和未处理的转化株 (58-33) 和非转化株 (58-25) 叶片提取总 RNA。
2) 用生物 素 加尾标记从 上 述步 骤产生 的富含 poly A+ 的 RNA 中衍 生 的单 链 cDNA 来 制 备 探 针。 该 标 记 的 单 链 cDNA 是 如 实 施 例 3 所 述 用 转 化 株 和 非 转 化 株 的 总 RNA(Invitrogen) 进行 RT-PCR 产生的, 但用了生物素化的寡聚 dT 作为引物 (Promega)。这 些用作探针与克隆的 DNA 杂交。
3) 用限制性内切酶 EcoRl 消化质粒 DNA, 进行琼脂糖凝胶电泳。将这些凝胶同 时干燥并转到两个尼龙膜上 一个膜与转化株探针杂交, 另一个膜与非转 化株探针杂交。在杂交之前将膜进行紫外线交联 ( 自动交联设备, 254nm, Stratagene, Stratalinker)。
或者, 用位于 p-GEM 两臂上的序列, T3 和 SP6 作为引物从各质粒中 PCR 扩增插入 片段。PCR 产物在 96 孔的即时 (Ready-to-run) 琼脂糖凝胶上电泳以进行分析。经确证的 插入片段点到两个尼龙膜上。一个膜与转化株探针杂交, 另一个膜与非转化株探针杂交。
4) 按生产商的说明书将这些膜杂交并洗涤, 其中对洗涤的严格性进行了改变 (Enzo MaxSenceTM 试剂盒, Enzo Diagnostics, Inc, Farmingdale, NY)。膜与杂交缓冲液 (2x SSC 缓冲的甲酰胺, 含有去垢剂和杂交增强剂 ) 在 42℃预杂交 30 分钟, 与 10μl 变性 68℃洗涤 的探针 42℃杂交过夜。然后室温用 1X 杂交洗涤缓冲液洗涤杂交膜一次, 10 分钟 ; 15 分钟, 4 次。然后可以对杂交膜进行检测。
5) 按生产商提供的检测方法 (Enzo Diagnostics, Inc.), 经洗涤的膜用碱性磷酸 酶标记, 然后用 NBT/BCIP 颜色检测方法进行检测。用 1X 封闭液室温封闭杂交膜 1 小时, 用 1X 检测试剂洗涤 10 分钟 (3 次 ), 用 1X 预显影反应缓冲液洗涤 5 分钟 (2 次 ), 然后在显影液 中显影直到出现点状印迹。所有的试剂都由生产商提供 (Enzo Diagnostics, Inc)。此外, TM 还用 KPL southern 杂交和检测试剂盒 按生产商的方法 (KPL, Gaithersburg, Maryland) 进行了大规模反向 Southern 试验。
实施例 7 : 克隆的鉴定 -NORTHERN 印迹分析
除 Southern 印迹分析之外, 如 Northern 印迹分析的实施例所述, 一些膜进行了 Northern 杂交和检测。如下所述, 采用 Northern 杂交检测烟草中差异表达的 mRNA。
采 用 随 机 引 发 方 法 从 克 隆 的 p450 制 备 探 针 (MegaprimeTM DNA 标 记 系 统, Amersham BiosCiences)。 混合下述组分 : 25ng 变性的 DNA 模板 ; 未标记的 dTTP、 dGTP 和 dCTP 各 4μl ; 5μl 反应缓冲液 ; P32 标记的 dATP 和 2ul Klenow I ; 以及水, 使反应体系达到 50μl。该混合物 在 37℃温育 1-4 小时, 然后以 2μ10.5M 的 EDTA 终止。使用前, 95℃温育 5 分钟使探针变 性。
从几对烟草品系经乙烯处理和未经处理的新鲜叶片中制备 RNA 样品。在有些情况 下, 使用了富含 poly A+ 的 RNA。 用 DEPC 水 (5-10μ1) 使约 15μg 总 RNA 或 1.8μg mRNA(RNA 或 mRNA 提取方法如实施例 5 所述 ) 的体积相同。加入等体积的上样缓冲液 (1 x MOPS ; 18.5%甲醛 ; 50%甲酰胺 ; 4% FiColl 400 ; 溴酚蓝 ) 和 0.55μl EtBr(0.5μg/μl)。将样 品变性, 准备用电泳分离 RNA。
将样品用 1XMOP 缓冲液 (0.4M 吗啉苯磺酸 ; 0.1M 乙酸钠 -3x H2O ; 10mM EDTA ; 用
NaOH 调 pH 至 7.2) 在甲醛凝胶 (1%琼脂糖, 1x MOPS, 0.6M 甲醛 ) 上电泳。 用毛细方法在 10X SSC 缓冲液 (1.5M NaCl ; 0.15M 柠檬酸钠 ) 中将 RNA 转移到 Hybond-N+ 上 (Nylon, Amersham PharmaciaBiotech)24 小时。 在杂交前, 将有 RNA 样品的膜紫外交联 ( 自动交联设备, 254nm, Stratagene, Stratalinker)。
膜和 5-10 毫升预杂交缓冲液 (5x SSC ; 50%甲酰胺 ; 5x Denhar dt′ s- 溶液 ; 1% SDS ; 100g/ml 热变性的平端非同源 DNA) 在 42℃预杂交 1-4 小时。将旧的预杂交缓冲液弃 去, 加入新的预杂交缓冲液和探针。杂交在 42℃过夜进行。用 2x SSC 室温洗涤膜 15 分钟, 然后用 2x SSC 洗涤一次。
本发明的一个主要焦点是发现了可被乙烯处理诱导的新基因或者在烟草叶片的 质量和成分中起主要作用的新基因。 如下表所示, Northern 印迹和反向 Southern 印迹可用 于测定哪些基因受乙烯处理的诱导 ( 相对于不受诱导的植株 )。 令人感兴趣的是, 在转化株 和非转化株植株中并非所有的片段都受到相似的影响。对感兴趣的细胞色素 p450 片段部 分测序以确定它们的结构相关性。该信息被用于后续分离和鉴定感兴趣的全长基因克隆。
用全长克隆在从乙烯处理诱导的转化株和非转化株白肋品系获得的烟草组织上 进行 Northern 分析。目的是鉴定在乙烯诱导的转化株植株中 ( 相对于乙烯诱导的转化株 品系相对于乙烯诱导的非转化株白肋品系 ) 表达有所提高的那些全长基因克隆。用这种 Northern 分析方法, 可以通过比较转化株和非转化株品系之间叶片组成的生化差异来确定 全长克隆的功能关系。如下表所示, 6 个克隆在乙烯处理的转化株植物组织中 ( 标记为 ++ 和 +++) 显示出比在乙烯处理的非转化株植物组织中 ( 标记为 +) 表达显著升高。在未经乙 烯处理的转化株和非转化株品系中所有这些克隆显示出很少的表达或不表达。
21102321641 A CN 102321648 全长克隆 D101-BA2 D207-AA5 D208-AC8 D237-AD1 D89-AB1 D90A-BB3
说明书非转化株 + + + + + +20/32 页转化株 ++ ++ +++ ++ ++ ++实施例 8 : 由克隆的基因编码的 p450S 的免疫检测
选择来自 3 个 p450 克隆的长度相应于 20-22 个氨基酸的肽区域, 这些肽区域 : 1) 与其它克隆具有很低的同源性或没有同源性, 和 2) 具有很好的亲水性和抗原性。下面列出 了选自各个 p450 克隆的肽区域的氨基酸序列。 将合成的肽与 KHL 偶联, 然后注射到家兔中。
第 4 次注射后 2 周和 4 周收集抗血清 (Alpha Diagnostic Intl.Inc.San Antonio, TX)。
D234-A D1DIDGSKSKLVKAHRKIDEILG
D90a-BB3 RDAFREKETFDENDVEELNY
D89-AB1 FKNNGDEDRHF SQKLGDLADKY
用 Western 印迹分析来检测抗血清对烟草植物组织靶蛋白的交叉活性。
从乙烯处理的 (0-40 小时 ) 转化株和非转化株品系的中等大小的叶片获得蛋白粗 提物。按生产商的方法用 RC DC 蛋白检测试剂盒 (BIO-RAD) 测定该提取物的蛋白浓度。
将 2 微克蛋白加到各泳道中, 用 Laemmli SDS-PAGE 体系在 10% -20%梯度凝胶 上分离蛋白。用 半干槽 (Semi-Dry cell)(BIO-RAD) 将蛋白从凝胶转移到 硝化纤维转移膜 (Schleicher & Schuell) 上。用 ECLAdvanceTM Western 印 迹检测试剂盒 (Amersham Biosciences) 检测和显影 p450 蛋白。在家兔中制备针对合成的 KLH 耦合物的一抗。针对兔 IgG 的二抗 ( 与过氧化物酶偶联 ) 购自 Sigma。一抗和二抗都 以 1 ∶ 1000 稀释液使用。抗体对 Western 印迹上的一条单一条带显示出很强的反应性, 说 明该抗血清对感兴趣的靶肽是单一特异性的。抗血清对与 KLH 耦合的合成肽也具有交叉反 应性。 实施例 9 : 分离的核酸片段的核酸同一性和结构相关性
超过 100 个克隆的 p450 片段结合 Northern 印迹分析来测序, 以确定它们的结构 相关性。所用方法中使用的正向引物基于两个共有的 p450 基序, 这两个基序邻近 p450 基 因的羧基末端。该正向引物对应于如图 1 所示的细胞色素 p450 基序 FXPERF 或 GRRXCP(A/ G)。反向引物使用来自质粒的标准引物 ( 位于 pGEMTM 质粒的两臂 )SP6 或 T7, 或使用多聚 A 尾巴。所用方法如下所述。
按生产商 (Beckman Coulter) 的方法用分光光度法评价起始双链 DNA 的浓度。将 模板用水稀释到合适的浓度, 95℃ 2 分钟加热变性, 然后置于冰上。测序反应液在冰上制
备, 其包括 0.5-10μl 变性 DNA 模板, 2μl 1.6pmole 正向引物, 8μl DTCS Quick Start Master Mix, 用水调节总体积到 20μl。温度循环程序包括以下 30 个循环 : 96 ℃ 20 秒, 50℃ 20 秒, 60℃ 4 分钟, 然后 4℃保温。
加入 5μl 终止缓冲液 ( 等体积的 3M NaOAc、 100mM EDTA 和 1μl20mg/ml 肝糖 ) 使 测序终止。 用 60μl 95%的冷乙醇沉淀样品, 6000g 离心 6 分钟。 弃去乙醇。 团块用 200μl 冷的 70%乙醇洗涤 2 次。团块干燥以后, 加入 40μl SLS 溶液, 使团块重悬。在表面上加入 一层矿物油。然后, 将样品置于 CEQ 8000 自动测序仪中进行进一步分析。
为了验证核酸序列, 用基于 p450 基因的 FXPERF 或 GRRXCP(A/G) 区域的正向引物 或基于质粒或多聚 A 尾巴的反向引物对核酸序列在两个方向进行重新测序。在两个方向上 所有的测序至少进行两次。
将细胞色素 p450 片段的核酸序列彼此比较, 从编码区 ( 与编码 GRRXCP(A/G) 的区 域之后的第一个核酸相对应 ) 一直到终止子。选择该区域作为 p450 蛋白遗传多态性的一 个指示参数。观察到大量的 ( 超过 70 种 ) 遗传上不同的 p450 基因, 类似于其它植物物种 中所观察到的。在比较核酸序列时发现, 这些基因根据其序列同一性可置于不同的序列组 群中。发现 p450 成员的最好的唯一的 (unique) 分组确定为那些具有 75%或更大核酸同 一性的序列 ( 见表 1)。降低同一性百分数导致组群明显变大。观察到优选的分组是那些 具有 81%或更大核酸同一性的序列, 更优选的分组是具有 91%或更大核酸同一性的序列, 最优选的分组是具有 99%或更大核酸同一性的序列。大多数组群包括至少 2 个成员, 经常 为 3 个或更多个成员。没有重复观察到其它情况, 说明所采用的方法既能够在所用组织中 分离低表达的 mRNA 又能够分离高表达的 mRNA。
基于 75 %或更大核酸同一性, 发现两个细胞色素 p450 组群与之前 ( 发现 ) 的 遗传上与这两个组群不同的烟草细胞色素基因具有核酸序列同一性。第 23 组在表 I 所 用的指数范围内, 显示出与之前分别由 Czernic 等和 Ralston 等提交的 GenBank 序列 GI : 1171579(CAA64635) 和 GI : 14423327( 或 AAK62346) 具有核酸同一性。GI : 1171579 与第 23 组成员的核酸同一性为 96.9% -99.5%, 而 GI : 14423327 与第 23 组成员的核酸同一性为 95.4% -96.9%。 第 31 组的成员与 Ralston 等提交的 GenBank 序列 GI : 14423319(AAK62342) 有 76.7% -97.8%的核酸同一性。表 1 中没有其它 p450 同一性组群在表 1 所用的参数范 围内与 Ralston 等、 Czernic 等、 Wang 等或 LaRosa 和 Smigocki 报道的烟草 p450 基因具有 同一性。
如图 76 所示, 对于各组, 可衍生合适的核酸变性探针的共有序列, 以优先从烟草 植物中鉴定和分离各组的其它成员。
表I: 烟草 p450 核酸序列同一性组群
组群 片段
1 D58-BG7(SEQ ID No. : 1), D58-AB1(SEQ ID No. : 3) ; D58-BE4(SEQ ID No. : 7)
2 D56-AH7(SEQ ID No. : 9) ; D13a-5(SEQID No. : 11)
3 D56-AG10(SEQ ID No. : 13) ; D35-33(SEQ ID No. : 15) ; D34-62(SEQ ID No. : 17)
4 D56-AA7(SEQ ID No. : 19) ; D56-AE1(SEQ ID No. : 21) ; 185-BD3(SEQID No. : 143)5 D35-BB7(SEQ ID No. : 23) ; D177-BA7(SEQ ID No. : 25) ; D56A-AB6(SEQ ID No. : 27) ; D144-AE2(SEQ ID No. : 29)
6 D56-AG11(SEQ ID No. : 31) ; D179-AA1(SEQ ID No. : 33)
7 D56-AC7(SEQ ID No. : 35) ; D144-AD1(SEQ ID No. : 37)
8 D144-AB5(SEQ ID No. : 39)
9 D181-AB5(SEQ ID No. : 41) ; D73-Ac9(SEQ ID No. : 43)
10 D56-AC12(SEQ ID No. : 45)
11 D58-AB9(SEQID No. : 47) ; D56-AG9(SEQ ID No. : 49) ; D56-AG6(SEQ ID No. : 51) ; D35-BGll(SEQ ID No. : 53) ; D35-42(SEQ ID No. : 55) ;
D35-BA3(SEQ ID No. : 57) ; D34-57(SEQ ID No. : 59) ; D34-52(SEQ ID No. : 61) ; D34-25(SEQID No. : 63)
12 D56-AD10(SEQID No. : 65)
13 56-AA11(SEQ ID No. : 67)
14 D177-BD5(SEQ ID No. : 69) ; D177-BD7(SEQ ID No. : 83)
15 D56A-AG10(SEQ ID No. : 71) ; D58-BC5(SEQ ID No. : 73) ; D58-AD12(SEQ ID No. : 75)
16 D56-AC11(SEQ ID No. : 77) ; D35-39(SEQ ID No. : 79) ; D58-BH4(SEQ ID No. : 81) ; D56-AD6(SEQ ID No. : 87)
17 D73A-AD6(SEQ ID No. : 89) ; D70A-BA11(SEQ ID No. : 91)
18 D70A-AB5(SEQ ID No. : 95) ; D70A-AA8(SEQ ID No. : 97)
19 D70A-AB8(SEQ ID No. : 99) ; D70A-BH2(SEQ ID No. : 101) ; D70A-AA4(SEQ ID No. : 103)
20 D70A-BA1(SEQ ID No. : 105) ; D70A-BA9(SEQ ID No. : 107)
21 D70A-BD4(SEQ ID No. : 109)
22 D181-AC5(SEQ ID No. : 111) ; D144-AH1(SEQ ID No. : 113) ; D34-65(SEQ ID No. : 115)
23 D35-BG2(SEQ ID No. : 117)
24 D73A-AH7(SEQ ID No. : 119)
25 D58-AA1(SEQ ID No. : 121) ; D185-BC1(SEQID No. : 133) ; D185-BG2(SEQ ID No. : 135)
26 D73-AE10(SEQ ID No. : 123)
27 D56-AC12(SEQ ID No. : 125)
28 D177-BF7(SEQ ID No. : 127) ; D185-BE1(SEQ ID No. : 137) ; D185-BD2(SEQ ID No. : 139)
29 D73A-AG3(SEQ ID No. : 129)
30 D70A-AA12(SEQ ID No. : 131) ; D176-BF2(SEQ ID No. : 85)
31 D176-BC3(SEQ ID No. : 145)
32 D176-BB3(SEQ ID No. : 147)
33 D186-AH4(SEQ ID No. : 5)实施例 10 : 分离的核酸片段的相关氨基酸序列同一性
推测实施例 8 中获得的细胞色素 p450 片段的核酸序列的氨基酸序列。被推测的 区域对应于紧跟在 GXRXCP(A/G) 序列基序之后的氨基酸到羧基末端, 或终止子。在比较片 段的序列同一性时, 氨基酸同一性为 70 %或更大的那些序列观察到唯一的分组 (unique grouping)。氨基酸同一性为 80%或更大的那些序列观察到优选的分组, 更优选为 90%氨 基酸同一性或更大, 最优选的分组是氨基酸同一性为 99%或更大的那些序列。组群和组群 成员的相应氨基酸序列示于图 2。 发现这些唯一的 (unique) 氨基酸序列中的几个与其它序 列具有完全的序列同一性, 因此只报道了具有相同氨基酸的一个成员。
根据它们的核苷酸序列, 表 II 第 19 组的氨基酸同一性对应于 3 个不同的组群。 各 组成员的氨基酸序列和它们的同一性示于图 77。相应标示了氨基酸差异。
选择了各氨基酸同一性组群中的至少一个成员用植物进行基因克隆和功能性研 究。此外, 经 Northern 和 Southern 分析评定为受乙烯处理的影响不同或具有其它生物学 差异的组群成员也被选择作基因克隆和功能研究。为有助于基因克隆, 将基于序列同一性 和差异序列进行表达研究和完整植物评价以及肽特异性抗体的制备。
表 II : 烟草 p450 氨基酸序列同一性分组
组群 片段
1 D58-BG7(SEQ ID No. : 2), D58-AB1(SEQ ID No. : 4)
2 D58-BE4(SEQ ID No. : 8)
3 D56-AH7(SEQ ID No. : 10) ; D13a-5(SEQ ID No. : 12)
4 D56-AG10(SEQ ID No. : 14) ; D34-62(SEQ ID No. : 18)
5 D56-AA7(SEQ ID No. : 20) ; D56-AE1(SEQ ID No. : 22) ; 185-BD3(SEQ ID No. : 144)
6 D35-BB7(SEQ ID No. : 24) ; D177-BA7(SEQ ID No. : 26) ; D56A-AB6(SEQ ID No. : 28) ; D144-AE2(SEQID No. : 30)
7 D56-AG11(SEQID No. : 32) ; D179-AA1(SEQ ID No. : 34)
8 D56-AC7(SEQ ID No. : 36) ; D144-AD1(SEQ ID No. : 38)
9 D144-AB5(SEQID No. : 40)
10 D181-AB5(SEQID No. : 42) ; D73-Ac9(SEQ ID No. : 44)
11 D56-AC12(SEQ ID No. : 46)
12 D58-AB9(SEQ ID No. : 48) ; D56-AG9(SEQ ID No. : 50) ; D56-AG6(SEQ ID No. : 52) ; D35-BG11(SEQ ID No. : 54) ; D35-42(SEQ ID No. : 56) ;
D35-BA3(SEQ ID No. : 58) ; D34-57(SEQ ID No. : 60) ; D34-52(SEQ ID No. : 62)
13 D56AD10(SEQ ID No. : 66)
14 56-AA11(SEQ ID No. : 68)
15 D177-BD5(SEQ ID No. : 70) ; D177-BD7(SEQ ID No. : 84)
16 D56A-AG10(SEQ ID No. : 72) ; D58-BC5(SEQID No. : 74) ; D58-AD12(SEQ ID No. : 76)
17 D56-AC11(SEQ ID No. : 78) ; D56-AD6(SEQ ID No. : 88)
18 D73A-AD6(SEQ ID No.90 : )19 D70A-AB5(SEQ ID No. : 96) ; D70A-AB8(SEQ ID No. : 100) ; D70A-BH2(SEQ ID No. : 102) ; D70A-AA4(SEQ ID No. : 104) ; D70A-BA1(SEQ ID No. : 106) ; D70A-BA9(SEQID No. : 108)
20 D70A-BD4(SEQ ID No. : 110)
21 D181-AC5(SEQID No. : 112) ; D144-AH1(SEQID No. : 114) ; D34-65(SEQ ID No. : 116)
22 D35-BG2(SEQ ID No. : 118)
23 D73A-AH7(SEQID No. : 120)
24 D58-AA1(SEQID No. : 122) ; D185-BC1(SEQ IDNo. : 134) ; D185-BG2(SEQ ID No. : 136)
25 D73-AE10(SEQ ID No. : 124)
26 D56-AC12(SEQ ID No. : 126)
27 D177-BF7(SEQ ID No. : 128) ; 185-BD2(SEQ ID No. : 140)
28 D73A-AG3(SEQ ID No. : 130)
29 D70A-AA12(SEQ ID No. : 132) ; D176-BF2(SEQ ID No. : 86)
30 D176-BC3(SEQ ID No. : 146)
31 D176-BB3(SEQ ID No. : 148)
32 D186-AH4(SEQ ID No. : 6)
实施例 11 : 全长克隆的相关氨基酸序列同一性
推测实施例 5 中克隆的烟草全长基因核酸序列的完整氨基酸序列。通过 3 个保守 p450 结构域基序的存在来鉴定细胞色素 p450 基因, 所述 3 个保守 p450 结构域基序对应于 羧基末端的 UXXRXXZ、 PXRFXF 或 GXRXC, 其中 U 是 E 或 K, X 是任何氨基酸, Z 是 P、 T、 S 或 M。 还注意到这些克隆中的两个, D130-AA1 和 D101-BA2 几乎是完整的但缺少合适的终止子, 然 而它们都含有上述的 3 个 p450 细胞色素结构域。用 BLAST 程序鉴定所有 p450 具有的氨 基酸同一性, 把它们的全长序列彼此比较并且和已知的烟草基因比较。该程序使用了 NCBI 特定的 BLAST 工具 ( 两序列比对 (Align two sequences, bl2seq), http://www.ncbi.nlm. nih.oov/blast/bl2sea7bl2.html)。在没有过滤器的情况下用 BLASTN 比对两个核酸序列, 用 BLASTP 比对氨基酸序列。基于它们的氨基酸同一性百分比, 将各序列分到同一性组群 中, 其中各组群中包括的成员与另一个成员至少具有 85%同一性。氨基酸同一性为 90%或 更大的那些序列观察到优选的分组, 更优选的分组具有 95%氨基酸同一性或更大, 最优选 的分组具有氨基酸同一性为 99%或更大的那些序列。 采用这些标准, 鉴定出 25 个不同的组 群, 示于表 III。
在表 III 用于氨基酸同一性的参数范围内, 发现 3 个组群与已知烟草基因具有 大于 85 %或更大的同一性。第 5 组的成员与先前 Ralston 等提交的 GenBank 序列 GI : 14423327( 或 AAK62346) 具有高达 96%的全长序列氨基酸同一性。第 23 组与 Ralston 等 提交的 GI : 14423328( 或 AAK62347) 有高达 93%的氨基酸同一性。第 24 组与 Ralston 等 提交的 GI : 14423318( 或 AAK62343) 有 92%的氨基酸同一性。
表 III : 烟草全长 p450 基因的氨基酸序列同一性组群
1 D208-AD9(SEQ.ID.No.224) ; D120-AH4(SEQ.ID.No.180) ; D121-AA8(SEQ.ID.No.182), D122-AF10(SEQ.ID.No.184) ; D103-AH3(SEQ.ID.No.222) ; D208-AC8(SEQ. ID.No.218) ; D-235-ABI(SEQ.ID.No.246)
2 D244-AD4(SEQ.ID.No.250) ; D244-AB6(SEQ.ID.No.274) ; D285-AA8 ; D285-AB9 ; D268-AE2(SEQ.ID.No.270)
3 D100A-AC3(SEQ.ID.No.168) ; D100A-BE2
4 D205-BE9(SEQ.ID.No.276) ; D205-BG9(SEQ.ID.No.202) ; D205-AH4(SEQ. ID.No.294)
5 D259-AB9(SEQ.ID.No.260) ; D257-AE4(SEQ.ID.No.268) ; D147-AD3(SEQ. ID.No.194)
6 D249-AE8(SEQ.ID.No.256) ; D-248-AA6(SEQ.ID.No.254)
7 D233-AG7(SEQ.ID.No.266 ; D224-BD11(SEQ.ID.No.240) ; DAF10
8 D105-AD6(SEQ.ID.No 172) ; D215-AB5(SEQ.ID.No 220) ; D135-AE1(SEQ. ID.No.190)
9 D87A-AF3(SEQ.ID.No.216), D210-BD4(SEQ.ID.No.262)
10 D89-AB1(SEQ.ID.No.150) ; D89-AD2(SEQ.ID.No.152) ; 163-AG11(SEQ. ID.No.198) ; 163-AF12(SEQ.ID.No.196) 11 D267-AF10(SEQ.ID.No.296) ; D96-AC2(SEQ.ID.No.160) ; D96-AB6(SEQ. ID.No.158) ; D207-AA5(SEQ.ID.No.204) ; D207-AB4(SEQ.ID.No.206) ; D207-AC4(SEQ. ID.No.208)
12 D98-AG1(SEQ.ID.No.164) ; D98-AA1(SEQ.ID.No.162)
13 D209-AA12(SEQ.ID.No.212) ; D209-AA11 ; D209-AH10(SEQ.ID.No.214) ; D209-AH12(SEQ.ID.No.232) ; D90a-BB3(SEQ.ID.No.154)
14 D129-AD10(SEQ.ID.No.188) ; D104A-AE8(SEQ.ID.No.170)
15 D228-AH8(SEQ.ID.No.244) ; D228-AD7(SEQ.ID.No.241), D250-AC11(SEQ. ID.No.258) ; D247-AH1(SEQ.ID.No.252)
16 D128-AB7(SEQ.ID.No.186) ; D243-AA2(SEQ.ID.No.248) ; D125-AF11(SEQ. ID.No.228)
17 D284-AH5(SEQ.ID.No.298) ; D110-AF12(SEQ.ID.No.176)
18 D221-BB8(SEQ.ID.No.234)
19 D222-BH4(SEQ.ID.No.236)
20 D134-AE11(SEQ.ID.No.230)
21 D109-AH8(SEQ.ID.No.174)
22 D136-AF4(SEQ.ID.No.278)
23 D237-AD1(SEQ.ID.No.226)
24 D112-AA5(SEQ.ID.No.178)
25 D283-AC1(SEQ.ID.No.272)
根据靠近羧基末端的 UXXRXXZ p450 结构域和 GXRXC p450 结构域之间高度保守的 氨基酸同源性进一步将这些全长基因分组。如图 3 所示, 比对各克隆保守结构域彼此之间 的序列同源性, 并将这些克隆分到不同的同源性组群中。 在几种情况下, 虽然某克隆的核酸
序列是不同的, 但该区域的氨基酸序列是相同的。氨基酸同一性为 90%或更大的那些序列 观察到优选的分组, 更优选的分组具有 95%氨基酸同一性或更大, 最优选的分组具有氨基 酸同一性为 99%或更大的那些序列。 最终的分组类似于根据这些克隆的完整氨基酸序列的 同一性百分比而做的分组, 第 17 组除外 ( 表 III), 它被分为 2 个不同的组。
在表 IV 用于氨基酸同一性的参数范围内, 发现 3 个组群与已知烟草基因具有 90% 或更大的同一性。第 5 组的成员与先前 Ralston 等提交的 GenBank 序列 GI : 14423326( 或 AAK62346) 具有高达 93.4%的全长序列氨基酸同一性。第 23 组与 Ralston 等提交的 GI : 14423328( 或 AAK62347) 有高达 91.8%的氨基酸同一性。第 24 组与 Ralston 等提交的 GI : 14423318( 或 AAK62342) 有 98.8%的同一性。
表 IV : 烟草 p450 基因保守结构域之间区域的氨基酸序列同一性组群
1 1 D208-AD9(SEQ.ID.No.224) ; D120-AH4(SEQ.ID.No.180) ; D121-AA8(SEQ. ID.No.182), D122-AF10(SEQ.ID.No.184) ; D103-AH3(SEQ.ID.No.222) ; D208-AC8(SEQ. ID.No.218) ; D-235-ABI(SEQ.ID.No.246)
2 D244-AD4(SEQ.ID.No.250) ; D244-AB6(SEQ.ID.No.274) ; D285-AA8 ; D285-AB9 ; D268-AE2(SEQ.ID.No.270)
3 D100A-AC3(SEQ.ID.No.168) ; D100A-BE2
4 D205-BE9(SEQ.ID.No.276) ; D205-BG9(SEQ.ID.No.202) ; D205-AH4(SEQ. ID.No.294)
5 D259-AB9(SEQ.ID.No.260) ; D257-AE4(SEQ.ID.No.268) ; D147-AD3(SEQ. ID.No.194)
6 D249-AE8(SEQ.ID.No.256) ; D-248-AA6(SEQ.ID.No.254)
7 D233-AG7(SEQ.ID.No.266 ; D224-BD11(SEQ.ID.No.240) ; DAF10
8 D105-AD6(SEQ.ID.No.172) ; D215-AB5(SEQ.ID.No.220) ; D135-AE1(SEQ. ID.No.190)
9 D87A-AF3(SEQ.ID.No.216), D210-BD4(SEQ.ID.No.262)
10 D89-AB1(SEQ.ID.No.150) ; D89-AD2(SEQ.ID.No.152) ; 163-AG11(SEQ. ID.No.198) ; 163-AF12(SEQ.ID.No.196)
11 D267-AF10(SEQ.ID.No.296) ; D96-AC2(SEQ.ID.No.160) ; D96-AB6(SEQ. ID.No.158) ; D207-AA5(SEQ.ID.No.204) ; D207-AB4(SEQ.ID.No.206) ; D207-AC4(SEQ. ID.No.208)
12 D98-AG1(SEQ.ID.No.164) ; D98-AA1(SEQ.ID.No.162)
13 D209-AA12(SEQ.ID.No.212) ; D209-AA11 ; D209-AH10(SEQ.ID.No.214) ; D209-AH12(SEQ.ID.No.232) ; D90a-BB3(SEQ.ID.No.154)
14 D129-AD10(SEQ.ID.No.188) ; D104A-AE8(SEQ.ID.No.170)
15 D228-AH8(SEQ.ID.No.244) ; D228-AD7(SEQ.ID.No.241), D250-AC11(SEQ. ID.No.258) ; D247-AH1(SEQ.ID.No.252)
16 D128-AB7(SEQ.ID.No.186) ; D243-AA2(SEQ.ID.No.248) ; D125-AF11(SEQ. ID.No.228)
17 D284-AH5(SEQ.ID.No.298) ; D110-AF12(SEQ.ID.No.176)18 D221-BB8(SEQ.ID.No.234)
19 D222-BH4(SEQ.ID.No.236)
20 D134-AE11(SEQ.ID.No.230)
21 D109-AH8(SEQ.ID.No.174)
22 D136-AF4(SEQ.ID.No.278)
23 D237-AD1(SEQ.ID.No.226)
24 D112-AA5(SEQ.ID.No.178)
25 D283-AC1(SEQ.ID.No.272)
26 D110-AF12(SEQ.ID.No.176)
实施例 12 : 缺少一个或多个烟草细胞色素 p450 特异性结构域的烟草细胞色素 p450 克隆
4 个克隆与表 III 报道的其它烟草细胞色素基因具有高度的核酸同源性, 核酸同 源性介于 90%至 99%之间。 这 4 个克隆包括 D136-AD5、 D138-AD12、 D243-AB3 和 D250-AC11。 然而, 因为核苷酸移码框的原因, 这些基因不含有细胞色素 p450C- 末端的 3 个结构域中的 一个或多个, 因此排除在表 III 和 IV 所示的同一性组群之外。
有一个克隆, D95-AG1 的氨基酸同一性不含有第 3 个结构域 GXRXC, 该结构域用来 对表 III 或表 IV 中的 p450 烟草基因分组。该克隆的核酸同源性与其它烟草细胞色素基因 的同源性低。该克隆代表了烟草中细胞色素 p450 基因的一个新的、 不同的组群。
实施例 13 : 烟草细胞色素 p450 片段和克隆在改变烟草性质调控方面的应用
烟草 p450 核酸片段或整个基因可用于鉴定和选择烟草表型或组成有所改变的植 株, 更重要的是, 可用于鉴定和选择代谢物发生了变化的植株。用例如以反义方向 ( 用于下 调 ) 或有义方向 ( 用于上调 ) 将掺入选自本文所述的核酸片段或全长基因的多种转化系统 来产生转基因烟草植物。对于全长基因的过量表达, 编码本文所述全长基因的完整或功能 性部分或氨基酸序列的任何核酸序列都是理想的, 它们可有效增加某个酶的表达并因此在 烟草中产生表型效果。 通过一系列的回交获得纯合烟草品系, 并评价其表型变化, 包括但不 限于, 用本领域一般技术人员可获得的常用技术来分析内源性 p450RNA、 转录物、 p450 表达 的肽和植物代谢物的浓度。
烟草植物中表现出来的变化提供了感兴趣的所选基因的功能性作用的信息, 或者 可用作优选的烟草植物品种。
实施例 14 : 鉴定乙烯处理的转化株品系中诱导的基因
采 用 高 密 度 寡 核 苷 酸 阵 列 技 术, Affymetrix 基 因 芯 片(Affymetrix Inc., Santa Clara, CA) 阵列来进行基因表达的定量和高度平行性检测。在 使用该技术时, 通过在固体表面上直接合成寡核苷酸来制作核酸阵列。这种固相化学能够 产生含有数十万个寡核苷酸探针的阵列, 这些寡核苷酸探针以极高的密度压缩在芯片上, 这种芯片称为 可由一个杂交同时筛选几千个基因。每个基因通常由一组的 11-25 对探针来代表, 这取决于基因的大小。设计探针以使其具有最大的敏感性、 特异性和 可重复性, 从而使其总是可以分辨出特异性和背景信号以及密切相关的靶序列。
Affymetrix 基因芯片杂交试验包括下列步骤 : 设计和制备阵列, 从分离自生物样 品的 RNA 中制备荧光标记的靶, 标记的靶与基因芯片杂交, 筛选芯片, 分析扫描的图像, 产生基因表达谱。
A.Affymetrix 基因芯片的设计和定制
定 制 A f f y m e t r i x I n c . ( S a n t a C l a r a ,C A ) 生 产 的 G e n e C h i p CustomExpressAdvantage Array。芯片的大小是 18 微米, 芯片的格式是 100-2187, 可容纳 528 组探针 (11,628 个探针 )。除了来自 GenBank 的核酸序列之外, 所有序列都选自我们之 前鉴定出的烟草克隆, 所有探针都是定制设计的。共选择了 400 个烟草基因或片段包括在 基因芯片中。所选择的寡核苷酸的序列是基于基因 3’ 末端的独特区域。所选择的核酸序 列由如 ( 本专利申请 ) 所述从烟草中克隆的 56 个全长 p450 基因和 71 个 p450 片段组成。 其它烟草序列包括 270 个烟草 EST, 用 Clontech SSH 试剂盒 (BD Biosciences, Palo Alto, CA) 从抑制差减文库产生了这些 EST。在这些基因中, 一些寡核苷酸序列选自 GenBank 所列 的细胞色素 p450 基因。多达 25 个探针用于每个全长基因, 11 个探针用于每个片段。因为 缺乏独特的、 高质量的探针, 有些克隆所用的探针数目要少。 中也包括了合适 的对照序列。
探针阵列是 25 聚寡核苷酸, 用基于半导体的光刻蚀法结合固相化学合成技术将 这些寡核苷酸直接合成到玻璃片上。各阵列含有多达 100,000 个不同的寡核苷酸探针。因 为寡核苷酸探针合成在阵列中已知的位置上, 所以可用 Affymetrix Microarray 软 件将杂交模式和信号强度解释为基因同一性和相对表达水平。 各探针对由一个完全配对的 寡核苷酸和一个错配的寡核苷酸组成。完全配对的探针具有与特定基因准确互补的序列, 因此可检测该基因的表达。错配探针在其碱基的中心位置有一个碱基置换, 因此区别于完 全配对的探针, 所述的一个碱基置换干扰了靶基因转录物的结合。错配产生非特异性的杂 交信号或背景信号, 将该信号与完全配对的寡核苷酸检测到的信号比较。
B. 样品制备
杂交试验由 Genome Explorations, Inc.(Memphis, TN) 进行, 杂交中所用的 RNA 样 品由 6 对受乙烯诱导的非转化株 / 转化株等基因系组成。
这些样品包括 1 对 4407-25/4407-33 未处理的白肋烟草样品, 3 对乙烯处理的 4407-25/4407-33 样品, 1 对乙烯处理的深色烟草 NL Madole/181 和 1 对乙烯处理的白肋变 种 PBLB01/178。乙烯处理如实施例 1 所述。
用改良的酸酚和氯仿方法从上述乙烯处理和未处理的叶片中提取总 RNA。改良的 方法是用 1 克组织进行研磨, 随后在 5 毫升加入了 5 毫升苯酚 (pH5.5) 和 5 毫升氯仿的提 取缓冲液 (100mM Tris-HCl, pH 8.5 ; 200mMNaCl ; 10mM EDTA ; 0.5% SDS) 中涡旋。 将提取的 样品离心, 保留上清。该提取步骤再重复 2-3 次直到上清变得澄清。加入约 5 毫升氯仿以 除去痕量的苯酚。加入 3 倍体积的 ETOH 和 1/10 体积的 3M NaOAc(pH5.2) 以从混合的上清 组分中沉淀 RNA, 在 -20℃存贮 1 小时。转移到 Corex 玻璃容器中以后, 在 4℃ 9,000RPM 离 心 RNA 组分 45 分钟。离心下来的团块用 70%乙醇洗涤, 4℃ 9,000RPM 离心 5 分钟。团块 干燥以后, 将 RNA 团块溶解在 0.5 毫升不含 Rnase 的水中。RNA 团块溶解在 0.5 毫升不含 Rnase 的水中。分别用变性甲醛凝胶和分光光度计分析总 RNA 的质量和数量。3-5μg/μl 的总 RNA 样品送至 Genomeexplorations, inc. 进行杂交试验。
C. 杂交、 检测和数据输出
如下所述制备标记的 RNA 材料。 按生产商的方法用 SuperScript 双链 cDNA 合成试剂盒 (Gibco Life Technologies) 和寡 -dT24-T7(5′ -GGC CAGTGA ATT GTA ATA CGA CTC ACT ATA GGG AGGCGG-3′ ) 引物从 5-15μg 总 RNA 中合成第一链和第二链 cDNA。
T7 启 动 子 连 接 的 双 链 cDNA 作 为 模 板, 用 T7RNA 转 录 物 标 记 试 剂 盒 (ENZO Diagnostics Inc.) 通过体外转录同时合成并用生物素化的 UTP 和 CTP 来标记 cRNA。简 言之, 用 70 %乙醇洗涤前述步骤中合成的双链 cDNA, 重新悬浮在 22μl 不含 RNA 酶的水 中。cDNA 与下列物质一起 37℃温育 5 小时 : 10X 的反应缓冲液、 生物素标记的核糖核苷酸、 DTT、 RNA 酶抑制剂混合物各 4μl, 以及 2μl 20X T7RNA 多聚酶。经过 CHROMA SPIN-100 柱 (Clontech) 并在 -20℃沉淀 1 小时至过夜, 将标记上的 RNA 与未掺入的核糖核苷酸分离。
如下所述进行寡核苷酸阵列杂交和分析。将 RNA 团块重新悬浮在 10μl 不含 RNA 酶的水中, 10.0μg 在 200mM Tris- 乙酸, pH 8.1, 500mM KOAc, 150mM MgOAc 中 95 ℃ 下 用 热 和 离 子 介 导 的 水 解 片 段 化 35 分 钟。 片 段 化 的 cRNA 与 HG_U95Av2 寡 核 苷 酸 阵 列 (Affymetrix)45 ℃杂交 16 小时, 该寡核苷酸阵列上含有约 12,500 个经注释的全长 基因以及设计用于代表 EST 序列的其它探针组。用 6X SSPE(0.9M NaCl, 60mM NaH2PO4, 6mM EDTA+0.01 % Tween20)25 ℃ 下 洗 涤 阵 列, 然 后 50 ℃ 下 用 100mM MES、 0.1M[Na+]、 0.01% Tween20 进行严格条件下的洗涤。以藻红素 (phycoerythrein) 偶联的链霉亲和素 (Molecular Probes) 对阵列染色, 用激光共聚焦扫描仪 (Hewlett-Packard) 来测定荧光强 度。用 Microarray 软件 (Affymetrix) 分析扫描的图像。对于所用的所有阵列, 通过将某 阵列上所有基因的平均荧光强度校正 (scaling) 到恒定的目标强度 (250) 来使上样和染色 中的差异标准化。按用户指南用 Microarray Suite5.0(Affymetrix) 进行数据分析。各基 因的信号强度计算为平均强度差异, 以 [ ∑ (PM-MM)/( 探针对的数目 )] 代表, 其中 PM 和 MM 标示完全配对和错配的探针。
D. 数据分析和结果
Genome Explorations 的检测仪器产生的表达报告证实, 12 组杂交是成功的。该 报告上主要的参数包括噪音、 校正因子、 背景、 总探针组、 存在和不存在的探针组的数目和 百分比、 管家基因对照的信号强度。然后, 用 GCOS 结合其它 Microsoft 的软件来分析和表 示数据。分析了处理的各对之间的信号对比。经过不同处理的基因和片段所对应的各探针 的总体数据被编译, 分析编译的表达数据, 如变化呼叫 (call of the changes) 和信号 LOG 2 比例变化。
基因芯片技术的一个常规用途是发现在不同组织中有差异性表达的基因。在 本发明中, 通过成对的转化株和非转化株烟草品系, 包括 4407-25/4407-33 白肋变种、 PBLB01/178 白肋变种和 NL Madole/181 深色烟草变种, 测定了乙烯处理引起的遗传表达变 化。这些分析只检测由于生物学变化而使其表达发生了显著改变的那些基因。这些分析采 用了倍数 (Fold) 变化 ( 信号比率 ) 作为鉴定受诱导基因的重要标准。还考虑了其它参数, 如信号密度、 存在 / 不存在呼叫。
在分析了转化株和非转化株样品对中约 400 个基因表达差异的数据之后, 基于信 号强度的结果说明, 与非转化株品系相比, 只有两个基因 D121-AA8 和 D120-AH4 在转化株品 系中可重复地被乙烯处理所诱导。 如下所述表示这些数据, 以说明这些基因的差异性表达。 如表 V 所示, 在转化株品系, 例如白肋烟草变种 4407-33 中, 某基因的信号测定为与相关的 非转化株等基因品系 4407-25 的比率。在没有乙烯诱导时, 对于所有基因, 转化株与非转化株信号的比率都接近于 1.00。用 3 种独立的分析方法对等基因白肋品系的分析证明, 受乙 烯诱导时, 相对于非转化株品系, 两个基因 D121-AA8 和 D120-AH4 在转化株品系中受到诱 导。这些基因是彼此高度同源的, 约有 99.8%或更大的核酸序列同源性。如表 V 所示, 它们 在转化株品系中的相对杂交信号约比相应的非转化株品系中高 2-12 倍。相比较的, 根据两 个肌动蛋白样对照克隆 ( 内部对照 ) 标准化的比例, 没有发现它们在转化株品系中受诱导。 此外, 片段 D35-BG11( 其编码区的序列完全包含在 D121-AA8 和 D120-AH4 基因中 ) 在成对 的等基因转化株和非转化株品系的相同样品中被高水平诱导。 白肋烟草变种的另一个等基 因对, PBLB01 和 178 被显示具有相同的基因 D121-AA8 和 D120-AH4, 乙烯处理时在转化株中 受诱导。此外, D121-AA8 和 D120-AH4 基因优先在等基因深色烟草对 NL Madole 和 181 的 转化株品系中受诱导, 证明这些基因在转化株品系中的乙烯诱导不限于白肋烟草变种。在 所有情况下, 相对于相应的非转化株品系, D35-BG11 片段在转化株品系中都是受诱导最高 的一个。
表V: 乙烯处理的转化株和非转化株品系中克隆诱导的比较
实施例 15 : 克隆相关的 D35-BG11 全长基因
基因芯片杂交基于 3′反转录 (cRNA)。选自基因 3′端 ( 在下游 1000 个核苷酸的 区域中 ) 的探针在基因芯片上合成。因此, 为了获得 D121-AA8 和 D120-AH4 克隆的所有可 能的变化形式, 用 5′序列从烟草 cDNA 文库中进行了另外的克隆。
全长基因克隆自如实施例 5 所述从乙烯处理的 4407-33 组织中构建的 cDNA 文库。 采用如下所述的聚合酶链式反应法。基于 D121-AA8 基因的 3′序列 ( 包括非翻译区部分 ) 设计反向引物。D121-P2 引物 5′ -AGC AAG ATG ATCTTA GGT TTTAA-3′和 D 121-R-2 引 物 5′ -CAA GCA AGA TGA TCT TAG GTT TTA ATA AAG CTC AGGT-3′。T3 引物 (5′ CAA TTA ACC CTC ACTAAA GGG 3′ ) 位于质粒上插入片段的上游, 用作正向引物。 产生的 PCR 产 物进行琼脂糖电泳, 切下高分子量的相应条带, 纯化、 克隆并测序。用于克隆和测序的方法 如实施例 4 所述。测序和鉴定了 9 个新的克隆, 它们是 D425-AB10、 D425-AB11、 D425-AC9、 D425-AC10、 D425-AC11、 D425-AG11、 D425-AH7、 D425-AH11 和 D427-AA5。观察到这些克隆中 的每一个都与克隆 D121-AA8 和 D120-AH4 具有 99%或更大的核酸序列同一性。
实施例 16 : 烟草转化株品系中微粒体烟碱去甲基酶的乙烯诱导
如下所述, 对乙烯处理和非处理的成对的转化株和非转化株中富含微粒体的组分 中去甲基酶的酶活进行生化分析。
A. 微粒体的制备
在 4℃分离微粒体。 在由 50mM N-(2- 羟基乙基 ) 哌嗪 -N′ -(2- 乙磺酸 )(HEPES), pH 7.5, 3mM DL- 二硫苏糖醇 (DTT) 和蛋白酶抑制剂 Cocktail(Roche)(1 片 /50 毫升 ) 组 成的缓冲液中提取烟草叶片。粗提物通过 4 层粗棉布 (cheesecloth) 过滤以除去未打碎的 组织, 滤出液 20,000x g 离心 20 分钟以除去细胞碎片。将上清以 100,000x g 超离心 60 分 钟, 得到的上清即含有微粒体。将微粒体组分悬浮在提取缓冲液中, 进行超离心步骤, 其中 提取缓冲液中采用 0.5M 的不连续蔗糖梯度。将纯化的微粒体重新悬浮在添加了 10% (w/ v) 甘油作为低温保护剂的提取缓冲液中。将此微粒体制品存贮在液氮冷藏罐中直到使用。
B. 蛋白浓度测定
用溶解在丙酮中的 10%三氯乙酸 (TCA)(w/v) 沉淀微粒体蛋白, 用 RC DC 蛋白检测 试剂盒 (BIO-RAD) 按生产商的方法测定微粒体的蛋白浓度。
3. 烟碱去甲基酶活性试验 DL- 烟碱 ( 吡咯烷 -2-14C) 获得自 Moravek Biochemicals, 比活为 54mCi/mmol。 氯 丙嗪 (CPZ) 和氧化的细胞色素 (Cyt.C)( 二者均为 P450 抑制剂 ) 购自 Sigma。还原型烟酰 胺腺嘌呤二核苷酸磷酸盐 (NADPH) 是细胞色素 P450 的典型电子供体, 它通过 NADPH : 细胞 色素 P450 还原酶供应电子。在对照组的温育中去掉了 NADPH。常规的酶活试验由微粒体 蛋白 ( 约 2mg/ml)、 6mMNADPH、 55μM 14C 标记的烟碱组成。CPZ 和 Cyt.C 的使用浓度分别是 1mM 和 100μM。反应在 25℃进行 1 小时, 加入 300μl 甲醇到各 25μl 反应混合物中终止反 应。离心后, 用 Inertsil ODS-33p(150x 4.6mm) 柱 (Varian) 以反相高效液相色谱 (HPLC) 系统 (Agilent) 分离 20μl 的甲醇提取物。等梯度 (isocratic) 流动相是甲醇、 50mM 磷 酸钾缓冲液 (pH6.25) 的混合物, 其中二者的比例为 60 ∶ 40(v/v), 流速为 1 毫升 / 分钟。 通过与真正的未标记的降烟碱的峰进行比较, 收集降烟碱的峰, 用 2900 tri-carb Liquid Scintillation Counter(LSC)(Perkin Elmer) 进行定量。基于 1 小时温育中产生的 14C 标 记的降烟碱来计算烟碱去甲基酶的活性。
从乙烯处理和未处理的成对的白肋转化株 (4407-33 品系 ) 和非转化株 (4407-25 品系 ) 烟草品系获得样品。所有未处理的样品都没有任何可检测到的微粒体烟碱去甲基酶 活性。相反, 发现从乙烯处理的转化株品系获得的微粒体样品中含有大量的烟碱去甲基酶 活性。已显示, 烟碱去甲基酶受 P450 特异性抑制剂的抑制, 证明该去甲基酶活性与 P450 微 粒体来源的酶一致。
表 VI 显示了从白肋转化株烟草品系中获得的一组典型的酶活结果。相反的是, 从 乙烯处理的非转化株烟草中获得的样品不含有任何烟碱去甲基酶活性。这些结果证明, 在 转化株品系中烟碱去甲基酶受乙烯处理的诱导, 但在相应的等基因非转化株品系中不受诱 导。对于成对的等基因深色烟草品系获得了类似的结果, 其中在转化株品系中微粒体烟碱 去甲基酶活性被诱导, 但在相应的非转化株品系中未检测到该酶被诱导。这些结果都证明 了, 微粒体烟碱去甲基酶在转化株品系中受乙烯处理的诱导, 但在相应的等基因非转化株 品系中不受诱导。那些衍生自 P450 基因并且优先在转化株品系 ( 相对于相应的非转化株
品系 ) 中被诱导的基因是编码烟碱去甲基酶的候选基因。
表 VI : 乙烯诱导的白肋转化株和非转化株品系中的去甲基酶活性
考虑到本发明前面的详细描述, 预期在本发明的实施中本领域技术人员可进行很 多改进和变化。因此, 这些改进和变化都包括在下面权利要求的范围内。
34102321641 A CN 102321648
序列表1/206 页
35102321641 A CN 102321648序列表2/206 页
36102321641 A CN 102321648序列表3/206 页
37102321641 A CN 102321648序列表4/206 页
38102321641 A CN 102321648序列表5/206 页
在本发明之前, p450 酶形式的多样性、 其结构和功能的不同使得对烟草 p450 酶的 研究十分困难。此外, 对 p450 酶的克隆至少部分由于这些膜定位的蛋白通常存在量低且经 常在纯化中不稳定而受阻。因此, 需要在植物中鉴定 p450 酶和与那些 p450 酶相关的核酸 序列。特别是, 在烟草中仅有少许细胞色素 p450 蛋白已见报道。本文所述的发明发现了许 多细胞色素 p450 片段, 这些片段基于它们的序列同一性而对应于几组 p450 种类。 发明内容
本发明针对植物 p450 酶。本发明还涉及来自烟草的植物 p450 酶。本发明也涉及 其表达由乙烯和 / 和植物老化诱导的植物中的 p450 酶。本发明还涉及植物中具有酶活性 的核酸序列, 例如可分类为氧化酶、 脱甲基酶等和其它酶, 以及使用那些序列来使这些酶的 表达降低和沉默和过度表达。 本发明也涉及在含有较高降烟碱水平的植物而非显示较低降 烟碱水平的植物中发现的 p450 酶。 本发明一方面涉及以下所示的核酸序列 : SEQ.ID.NO.1、 3、 5、 7、 9、 11、 13、 15、 17、 19、 21、 23、 25、 27、 29、 31、 33、 35、 37、 39、 41、 43、 45、 47、 49、 51、 53、 55、 57、 59、 61、 63、 65、 67、 69、 71、 73、 75、 77、 79、 81、 83、 85、 87、 89、 91、 95、 97、 99、 101、 103、 105、 107、 109、 111、 113、 115、 117、 119、 121、 123、 125、 127、 129、 131、 133、 135、 137、 139、 143、 145、 147、 149、 151、 153、 155、 157、 159、 161、 163、 165、 167、 169、 171、 173、 175、 177、 179、 181、 183、 185、 187、 189、 191、 193、 195、 197、 199、 201、 203、 205、 207、 209、 211、 213、 215、 217、 219、 221、 223、 225、 227、 229、 231、 233、 235、 237、 239、 241、 243、 245、 247、 249、 251、 253、 255、 257、 259、 261、 263、 265、 267、 269、 271、 273、 275、 277、 279、 281、 283、 285、 287、 289、 291、 293、 295、 297、 299、 301、 303、 305、 307、 309、 311、 313 和 315。
在第 2 个相关的方面, 根据它们在细胞色素 p450 基序 GXRXCX(G/A) 后的第一核酸 到终止密码子的对应区域的同一性, 对那些含有大于 75%的核酸序列同一性的片段进行分 组。代表性的核酸组和各自的种类示于表 I。
在第 3 方面, 本发明涉及如以下所示的氨基酸序列 : SEQ.ID.NO.2、 4、 6、 8、 10、 12、 14、 16、 18、 20、 22、 24、 26、 28、 30、 32、 34、 36、 38、 40、 42、 44、 46、 48、 50、 52、 54、 56、 58、 60、 62、 64、 66、 68、 70、 72、 74、 76、 78、 80、 82、 84、 86、 88、 90、 92、 96、 98、 100、 102、 104、 106、 108、 110、 112、 114、 116、 118、 120、 122、 124、 126、 128、 130、 132、 134、 136、 138、 140、 144、 146、 148、 150、 152、 154、 156、 158、 160、 162、 164、 166、 168、 170、 172、 174、 176、 178、 180、 182、 184、 186、 188、 190、 192、 194、 196、 198、 200、 202、 204、 206、 208、 210、 212、 214、 216、 218、 220、 222、 224、 226、 228、 230、 232、 234、 236、 238、 240、 242、 244、 246、 248、 250、 252、 254、 256、 258、 260、 262、 264、 266、 268、 270、 272、 274、 276、 278、 280、 282、 284、 286、 288、 290、 292、 294、 296、 298、 300、 302、 304、 306、 308、 310、 312、 314 和 316。
在第 4 个相关的方面, 根据它们在细胞色素 p450 基序 GXRXCX(G/A) 后的第一核酸 到终止密码子的对应区域的同一性, 对那些含有大于 71%的核酸序列同一性的片段进行分 组。代表性的氨基酸组和各自的种类示于表 II。
在第 2 个相关的方面, 根据它们在细胞色素 p450 基序 GXRXCX(G/A) 后的第一核酸 到终止密码子的对应区域的同一性, 对那些含有大于 75%的核酸序列同一性的片段进行分 组。代表性的核酸组和各自的种类示于表 I。
在第 3 方面, 本发明涉及如以下所示的氨基酸序列 : SEQ.ID.NO.2、 4、 6、 8、 10、 12、 14、 16、 18、 20、 22、 24、 26、 28、 30、 32、 34、 36、 38、 40、 42、 44、 46、 48、 50、 52、 54、 56、 58、 60、 62、 64、 66、 68、 70、 72、 74、 76、 78、 80、 82、 84、 86、 88、 90、 92、 96、 98、 100、 102、 104、 106、 108、 110、 112、 114、 116、 118、 120、 122、 124、 126、 128、 130、 132、 134、 136、 138、 140、 144、 146、 148、 150、 152、 154、 156、 158、 160、 162、 164、 166、 168、 170、 172、 174、 176、 178、 180、 182、 184、 186、 188、 190、 192、 194、 196、 198、 200、 202、 204、 206、 208、 210、 212、 214、 216、 218、 220、 222、 224、 226、 228、 230、 232、 234、 236、 238、 240、 242、 244、 246、 248、 250、 252、 254、 256、 258、 260、 262、 264、 266、 268、 270、 272、 274、 276、 278、 280、 282、 284、 286、 288、 290、 292、 294、 296、 298、 300、 302、 304、 306、 308、 310、 312、 314 和 316。
在第 4 个相关的方面, 根据它们在细胞色素 p450 基序 GXRXCX(G/A) 后的第一核酸 到终止密码子的对应区域的同一性, 对那些含有大于 71%的核酸序列同一性的片段进行分 组。代表性的氨基酸组和各自的种类示于表 II。
在第 5 个方面, 本发明涉及如以下所示全长基因的氨基酸序列 : SEQ.ID.NO.150、 152、 154、 156、 158、 160、 162、 164、 166、 168、 170、 172、 174、 176、 178、 180、 182、 184、 186、 188、 190、 192、 194、 196、 198、 200、 202、 204、 206、 208、 210、 212、 214、 216、 218、 220、 222、 224、 226、 228、 230、 232、 234、 236、 238、 240、 242、 244、 246、 248、 250、 252、 254、 256、 258、 260、 262、 264、 266、 268、 270、 272、 274、 276、 278、 280、 282、 284、 286、 288、 290、 292、 294、 296、 298、 300、 302、 304、 306、 308、 310、 312、 314 和 316。
在第 6 个相关的方面, 根据彼此的同一性对那些含有大于 85%和更高的氨基酸序 列同一性的全长基因进行分组。代表性的氨基酸组和各自的种类示于表 III。
在第 7 个方面, 本发明涉及如 SEQ.ID.NO.299-357 所示片段的氨基酸序列。
在第 8 个相关的方面, 根据它们在第一细胞色素 p450 结构域 UXXRXXZ 到第 3 细胞 色素结构域 GXRXO 的对应区域的互相同一性, 对那些含有大于 90%和更高的氨基酸序列同 一性的片段进行分组, 其中 U 是 E 或 K, X 是任何氨基酸, Z 是 R、 T、 S 或 M。代表性的氨基酸 组和各自的种类示于表 IV。
在第 9 个相关的方面, p450 酶在烟草植物中的减少或消除或过度表达可使用 RNA 病毒系统瞬时实现。
评价得到的转化或感染的植物的表型改变, 包括 ( 但不限于 ) 使用本领域普通技 术人员常规可用的技术来分析内源性 p450RNA 转录物、 p450 表达肽和植物代谢物的浓度。
在第 10 个方面, 本发明也涉及产生具有改变的 p450 酶活性水平的转基因烟草谱 系。根据本发明, 这些转基因谱系含有有效地特定酶表达减少、 沉默或增加, 从而在烟草中 导致表型效应的核酸序列。 这种核酸序列包括 SEQ.ID.NO.1、 3、 5、 7、 9、 11、 13、 15、 17、 19、 21、 23、 25、 27、 29、 31、 33、 35、 37、 39、 41、 43、 45、 47、 49、 51、 53、 55、 57、 59、 61、 63、 65、 67、 69、 71、 73、 75、 77、 79、 81、 83、 85、 87、 89、 91、 95、 97、 99、 101、 103、 105、 107、 109、 111、 113、 115、 117、 119、 121、 123、 125、 127、 129、 131、 133、 135、 137、 139、 143、 145、 147、 149、 151、 153、 155、 157、 159、 161、 163、 165、 167、 169、 171、 173、 175、 177、 179、 181、 183、 185、 187、 189、 191、 193、 195、 197、 199、 201、 203、 205、 207、 209、 211、 213、 215、 217、 219、 221、 223、 225、 227、 229、 231、 233、 235、 237、 239、 241、 243、 245、 247、 249、 251、 253、 255、 257、 259、 261、 263、 265、 267、 269、 271、 273、 275、 277、 279、 281、 283、 285、 287、 289、 291、 293、 295、 297、 299、 301、 303、 305、 307、 309、 311、 313 和 315。
在本发明非常重要的第 11 方面, 与对照植物相比, 含有本发明核酸的植物栽培品 系在使用全长基因或其片段的下调能力或使用全长基因或其片段的过度表达能力上具有 改变的代谢物特性。
在本发明的第 12 方面, 含有本发明核酸的植物栽培品系具有对特定外源性化学 物质或植物害虫耐受的用途, 所述植物使用全长基因或其片段以更改来源于植物或植物以 外的代谢物的生物合成或降解。这种核酸序列包括 SEQ.ID.NO.1、 3、 5、 7、 9、 11、 13、 15、 17、 19、 21、 23、 25、 27、 29、 31、 33、 35、 37、 39、 41、 43、 45、 47、 49、 51、 53、 55、 57、 59、 61、 63、 65、 67、 69、 71、 73、 75、 77、 79、 81、 83、 85、 87、 89、 91、 95、 97、 99、 101、 103、 105、 107、 109、 111、 113、 115、 117、 119、 121、 123、 125、 127、 129、 131、 133、 135、 137、 139、 143、 145、 147、 149、 151、 153、 155、 157、 159、 161、 163、 165、 167、 169、 171、 173、 175、 177、 179、 181、 183、 185、 187、 189、 191、 193、 195、 197、 199、 201、 203、 205、 207、 209、 211、 213、 215、 217、 219、 221、 223、 225、 227、 229、 231、233、 235、 237、 239、 241、 243、 245、 247、 249、 251、 253、 255、 257、 259、 261、 263、 265、 267、 269、 271、 273、 275、 277、 279、 281、 283、 285、 287、 289、 291、 293、 295、 297、 299、 301、 303、 305、 307、 309、 311、 313 和 315。
在第 13 个方面, 本发明涉及筛选含有与所述核酸序列具有实质性核酸同一性的 基因的植物, 优选烟草。使用本发明有利于鉴定和选择含有精确的或实质性同一性的核酸 序列的植物, 其中这种植物是传统或转基因品种的育种程序、 诱变程序或天然存在的不同 植物种群的一部分。 可使用核酸探针结合核酸检测方法, 包括 ( 但不限于 ) 核酸杂交和 PCR 分析, 通过评价植物的核酸物质来筛选实质性核酸同一性的植物。核酸探针可由对应于以 下 SEQ ID 的所述核酸序列或其片段构成 : SEQ ID 1、 3、 5、 7、 9、 11、 13、 15、 17、 19、 21、 23、 25、 27、 29、 31、 33、 35、 37、 39、 41、 43、 45、 47、 49、 51、 53、 55、 57、 59、 61、 63、 65、 67、 69、 71、 73、 75、 77、 79、 81、 83、 85、 87、 89、 91、 95、 97、 99、 101、 103、 105、 107、 109、 111、 113、 115、 117、 119、 121、 123、 125、 127、 129、 131、 133、 135、 137、 139、 143、 145、 147、 149、 151、 153、 155、 157、 159、 161、 163、 165、 167、 169、 171、 173、 175、 177、 179、 181、 183、 185、 187、 189、 191、 193、 195、 197、 199、 201、 203、 205、 207、 209、 211、 213、 215、 217、 219、 221、 223、 225、 227、 229、 231、 233、 235、 237、 239、 241、 243、 245、 247、 249、 251、 253、 255、 257、 259、 261、 263、 265、 267、 269、 271、 273、 275、 277、 279、 281、 283、 285、 287、 289、 291、 293、 295、 297、 299、 301、 303、 305、 307、 309、 311、 313 和 315。 在第 14 个方面, 本发明涉及鉴定与所述核酸序列具有实质性氨基酸同一性的植 物基因, 优选烟草。可使用核酸探针结合核酸检测方法, 包括 ( 但不限于 ) 核酸杂交和 PCR 分析, 通过筛选植物 cDNA 文库来鉴定植物基因, 包括 cDNA 和基因组克隆, 优选烟草的 cDNA 和基因组克隆。核酸探针可由对应于以下 SEQ ID 的核酸序列或其片段构成 : 1、 3、 5、 7、 9、 11、 13、 15、 17、 19、 21、 23、 25、 27、 29、 31、 33、 35、 37、 39、 41、 43、 45、 47、 49、 51、 53、 55、 57、 59、 61、 63、 65、 67、 69、 71、 73、 75、 77、 79、 81、 83、 85、 87、 89、 91、 95、 97、 99、 101、 103、 105、 107、 109、 111、 113、 115、 117、 119、 121、 123、 125、 127、 129、 131、 133、 135、 137、 139、 143、 145 和 147。
在其它第 15 个方面, 可使用针对部分或全部所述氨基酸序列的抗体来筛选表达 肽的 cDNA 表达文库。这种氨基酸序列包括 SEQ ID 2、 4、 8、 9、 10、 12、 14、 16、 18、 20、 22、 24、 26、 28、 30、 32、 34、 36、 38、 40、 42、 44、 46、 48、 50、 52、 54、 56、 58、 60、 62、 64、 66、 68、 70、 72、 74、 76、 78、 80、 82、 84、 86、 88、 90、 92、 96、 98、 100、 102、 104、 106、 108、 110、 112、 114、 116、 118、 120、 122、 124、 126、 128、 130、 132、 134、 136、 138、 140、 144、 146、 148。
在第 16 个重要的方面, 本发明也涉及产生过度表达 p450 酶活性水平的转基因烟 草谱系。 根据本发明, 这些转基因谱系包括编码全长基因的氨基酸序列的所有核酸序列, 所 述基因有效地增加特定酶的表达从而导致烟草中的表型效应。这种氨基酸序列包括 SEQ. ID.150、 152、 154、 156、 158、 160、 162、 164、 166、 168、 170、 172、 174、 176、 178、 180、 182、 184、 186、 188、 190、 192、 194、 196、 198、 200、 202、 204、 206、 208、 210、 212、 214、 216、 218、 220、 222、 224、 226、 228、 230、 232、 234、 236、 238、 240、 242、 244、 246、 248、 250、 252、 254、 256、 258、 260、 262、 264、 266、 268、 270、 272、 274、 276、 278、 280、 282、 284、 286、 288、 290、 292、 294、 296、 298、 300、 302、 304、 306、 308、 310、 312、 314 和 316。
也提供了含有降烟碱含量降低的烟叶 ( 叶片和 / 或茎 ) 的烟草产品。该烟草产品 包括烟草 ( 含有叶片和 / 或茎的烟叶 ), 该烟草来自含有本文所述序列或消除或抑制了编码
烟草特异性亚硝基胺的基因的植物。 与用未消除或抑制编码烟草特异性亚硝基胺的基因的 烟草植物制备的烟草产品相比, 消除或抑制编码烟草特异性亚硝基胺的基因有效地降低了 烟草产品中约 5-10%、 或者约 10-20%、 或者约 20-30%、 或者 30%以上的烟草特异性亚硝 基胺。 本文使用的烟草产品可包括香烟、 雪茄、 烟丝、 鼻烟、 口嚼烟 (chewing tobacco)、 混合 了烟草产品的产品和它们的混合物。
本发明涉及如下各项 :
1. 一种分离的烟草核酸分子, 该核酸分子含有选自 SEQ.ID.No. : 299-357 的核酸 序列。
2. 一种转基因植物, 该转基因植物含有如项 1 所述的核酸分子。
3. 如项 2 所述的转基因植物, 其特征在于, 所述植物是烟草植物。
4. 一种产生转基因植物的方法, 该方法包括以下步骤 :
(i) 将如项 1 所述的核酸分子与在所述植物中具有功能的启动子操作性相连以产 生植物转化载体 ;
(ii) 用步骤的所述植物转化载体转化所述植物 ;
(iii) 选择用所述转化载体转化的植物细胞 ; 和 (iv) 从所述转化的植物细胞再生转化植物。
5. 如项 4 所述的方法, 其特征在于, 所述核酸分子处于反义方向。
6. 如项 4 所述的方法, 其特征在于, 所述核酸分子处于有义方向。
7. 如项 4 所述的方法, 其特征在于, 所述核酸分子处于 RNA 干扰方向。
8. 如项 4 所述的方法, 其特征在于, 所述核酸分子表达为双链 RNA 分子。
9. 如项 4 所述的方法, 其特征在于, 所述双链 RNA 分子长度为约 15-25 个核苷酸。
10. 如项 4 所述的方法, 其特征在于, 所述转基因植物是烟草植物。
11. 一种选择含有核酸分子的植物的方法, 其中分析所述植物中是否存在选自 299-357 的核酸序列。
12. 如项 11 所述选择植物的方法, 其特征在于, 通过 DNA 杂交分析所述植物。
13. 如项 11 所述选择植物的方法, 其特征在于, 所述 DNA 杂交是 Southern 印迹分 析。
14. 如项 11 所述选择植物的方法, 其特征在于, 所述 DNA 杂交是 Northern 印迹分 析。
15. 如项 11 所述选择植物的方法, 其特征在于, 通过 PCR 检测分析所述植物。
16. 如项 11 所述选择植物的方法, 其特征在于, 所述植物是烟草植物。
17. 一种增加或降低植物中降烟碱水平的方法, 所述方法包括以下步骤 :
(i) 将如项 1 所述的核酸分子与在所述植物中具有功能的启动子操作性相连以产 生植物转化载体 ;
(ii) 用步骤 (i) 所述植物转化载体转化所述植物 ;
(iii) 选择用所述转化载体转化的植物细胞 ; 和
(iv) 从所述转化的植物细胞再生转化植物。
18. 如项 17 所述的方法, 其特征在于, 所述核酸分子处于反义方向。
19. 如项 17 所述的方法, 其特征在于, 所述核酸分子处于有义方向。
20. 如项 17 所述的方法, 其特征在于, 所述核酸分子处于 RNA 干扰方向。 21. 如项 17 所述的方法, 其特征在于, 所述核酸分子表达为双链 RNA 分子。 22. 如项 17 所述的方法, 其特征在于, 所述转基因植物是烟草植物。 附图简述 图 1 显示核酸 SEQ.ID.No. : 1 和氨基酸 SEQ.ID.No. : 2。 图 2 显示核酸 SEQ.ID.No. : 3 和氨基酸 SEQ.ID.No. : 4。 图 3 显示核酸 SEQ.ID.No. : 5 和氨基酸 SEQ.ID.No. : 6。 图 4 显示核酸 SEQ.ID.No. : 7 和氨基酸 SEQ.ID.No. : 8。 图 5 显示核酸 SEQ.ID.No. : 9 和氨基酸 SEQ.ID.No. : 10。 图 6 显示核酸 SEQ.ID.No. : 11 和氨基酸 SEQ.ID.No. : 12。 图 7 显示核酸 SEQ.ID.No. : 13 和氨基酸 SEQ.ID.No. : 14。 图 8 显示核酸 SEQ.ID.No. : 15 和氨基酸 SEQ.ID.No. : 16。 图 9 显示核酸 SEQ.ID.No. : 17 和氨基酸 SEQ.ID.No. : 18。 图 10 显示核酸 SEQ.ID.No. : 19 和氨基酸 SEQ.ID.No. : 20。 图 11 显示核酸 SEQ.ID.No. : 21 和氨基酸 SEQ.ID.No. : 22。 图 12 显示核酸 SEQ.ID.No. : 23 和氨基酸 SEQ.ID.No. : 24。 图 13 显示核酸 SEQ.ID.No. : 25 和氨基酸 SEQ.ID.No. : 26。 图 14 显示核酸 SEQ.ID.No. : 27 和氨基酸 SEQ.ID.No. : 28。 图 15 显示核酸 SEQ.ID.No. : 29 和氨基酸 SEQ.ID.No.30。 图 16 显示核酸 SEQ.ID.No. : 31 和氨基酸 SEQ.ID.No. : 32。 图 17 显示核酸 SEQ.ID.No. : 33 和氨基酸 SEQ.ID.No. : 34。 图 18 显示核酸 SEQ.ID.No. : 35 和氨基酸 SEQ.ID.No. : 36。 图 19 显示核酸 SEQ.ID.No. : 37 和氨基酸 SEQ.ID.No. : 38。 图 20 显示核酸 SEQ.ID.No. : 39 和氨基酸 SEQ.ID.No. : 40。 图 21 显示核酸 SEQ.ID.No. : 41 和氨基酸 SEQ.ID.No. : 42。 图 22 显示核酸 SEQ.ID.No. : 43 和氨基酸 SEQ.ID.No. : 44。 图 23 显示核酸 SEQ.ID.No. : 45 和氨基酸 SEQ.ID.No. : 46。 图 24 显示核酸 SEQ.ID.No. : 47 和氨基酸 SEQ.ID.No. : 48。 图 25 显示核酸 SEQ.ID.No. : 49 和氨基酸 SEQ.ID.No. : 50。 图 26 显示核酸 SEQ.ID.No. : 51 和氨基酸 SEQ.ID.No. : 52。 图 27 显示核酸 SEQ.ID.No. : 53 和氨基酸 SEQ.ID.No. : 54。 图 28 显示核酸 SEQ.ID.No. : 55 和氨基酸 SEQ.ID.No. : 56。 图 29 显示核酸 SEQ.ID.No. : 57 和氨基酸 SEQ.ID.No. : 58。 图 30 显示核酸 SEQ.ID.No. : 59 和氨基酸 SEQ.ID.No. : 60。 图 31 显示核酸 SEQ.ID.No. : 61 和氨基酸 SEQ.ID.No. : 62。 图 32 显示核酸 SEQ.ID.No. : 63 和氨基酸 SEQ.ID.No. : 64。 图 33 显示核酸 SEQ.ID.No. : 65 和氨基酸 SEQ.ID.No. : 66。 图 34 显示核酸 SEQ.ID.No. : 67 和氨基酸 SEQ.ID.No. : 68。 图 35 显示核酸 SEQ.ID.No. : 69 和氨基酸 SEQ.ID.No. : 70。图 36 显示核酸 SEQ.ID.No. : 71 和氨基酸 SEQ.ID.No. : 72。 图 37 显示核酸 SEQ.ID.No. : 73 和氨基酸 SEQ.ID.No. : 74。 图 38 显示核酸 SEQ.ID.No. : 75 和氨基酸 SEQ.ID.No. : 76。 图 39 显示核酸 SEQ.ID.No. : 77 和氨基酸 SEQ.ID.No. : 78。 图 40 显示核酸 SEQ.ID.No. : 79 和氨基酸 SEQ.ID.No. : 80。 图 41 显示核酸 SEQ.ID.No. : 81 和氨基酸 SEQ.ID.No. : 82。 图 42 显示核酸 SEQ.ID.No. : 83 和氨基酸 SEQ.ID.No. : 84。 图 43 显示核酸 SEQ.ID.No. : 85 和氨基酸 SEQ.ID.No. : 86。 图 44 显示核酸 SEQ.ID.No. : 87 和氨基酸 SEQ.ID.No. : 88。 图 45 显示核酸 SEQ.ID.No. : 89 和氨基酸 SEQ.ID.No. : 90。 图 46 显示核酸 SEQ.ID.No. : 91 和氨基酸 SEQ.ID.No. : 92。 图 47 显示核酸 SEQ.ID.No. : 93 和氨基酸 SEQ.ID.No. : 94。 图 48 显示核酸 SEQ.ID.No. : 95 和氨基酸 SEQ.ID.No. : 96。 图 49 显示核酸 SEQ.ID.No. : 97 和氨基酸 SEQ.ID.No. : 98。 图 50 显示核酸 SEQ.ID.No. : 99 和氨基酸 SEQ.ID.No. : 100。 图 51 显示核酸 SEQ.ID.No. : 101 和氨基酸 SEQ.ID.No. : 102。 图 52 显示核酸 SEQ.ID.No. : 103 和氨基酸 SEQ.ID.No. : 104。 图 53 显示核酸 SEQ.ID.No. : 105 和氨基酸 SEQ.ID.No. : 106。 图 54 显示核酸 SEQ.ID.No. : 107 和氨基酸 SEQ.ID.No. : 108。 图 55 显示核酸 SEQ.ID.No. : 109 和氨基酸 SEQ.ID.No. : 110。 图 56 显示核酸 SEQ.ID.No. : 111 和氨基酸 SEQ.ID.No. : 112。 图 57 显示核酸 SEQ.ID.No. : 113 和氨基酸 SEQ.ID.No. : 114。 图 58 显示核酸 SEQ.ID.No. : 115 和氨基酸 SEQ.ID.No. : 116。 图 59 显示核酸 SEQ.ID.No. : 117 和氨基酸 SEQ.ID.No. : 118。 图 60 显示核酸 SEQ.ID.No. : 119 和氨基酸 SEQ.ID.No. : 120。 图 61 显示核酸 SEQ.ID.No. : 121 和氨基酸 SEQ.ID.No. : 122。 图 62 显示核酸 SEQ.ID.No. : 123 和氨基酸 SEQ.ID.No. : 124。 图 63 显示核酸 SEQ.ID.No. : 125 和氨基酸 SEQ.ID.No. : 126。 图 64 显示核酸 SEQ.ID.No. : 127 和氨基酸 SEQ.ID.No. : 128。 图 65 显示核酸 SEQ.ID.No. : 129 和氨基酸 SEQ.ID.No. : 130。 图 66 显示核酸 SEQ.ID.No. : 131 和氨基酸 SEQ.ID.No. : 132。 图 67 显示核酸 SEQ.ID.No. : 133 和氨基酸 SEQ.ID.No. : 134。 图 68 显示核酸 SEQ.ID.No. : 135 和氨基酸 SEQ.ID.No. : 136。 图 69 显示核酸 SEQ.ID.No. : 137 和氨基酸 SEQ.ID.No. : 138。 图 70 显示核酸 SEQ.ID.No. : 139 和氨基酸 SEQ.ID.No. : 140。 图 71 显示核酸 SEQ.ID.No. : 141 和氨基酸 SEQ.ID.No. : 142。 图 72 显示核酸 SEQ.ID.No. : 143 和氨基酸 SEQ.ID.No. : 144。 图 73 显示核酸 SEQ.ID.No. : 145 和氨基酸 SEQ.ID.No. : 146。 图 74 显示核酸 SEQ.ID.No. : 147 和氨基酸 SEQ.ID.No. : 148。图 75 显示核酸 SEQ.ID.No. : 149 和氨基酸 SEQ.ID.No. : 150。 图 76 显示核酸 SEQ.ID.No. : 151 和氨基酸 SEQ.ID.No. : 152。 图 77 显示核酸 SEQ.ID.No. : 153 和氨基酸 SEQ.ID.No. : 154。 图 78 显示核酸 SEQ.ID.No. : 155 和氨基酸 SEQ.ID.No. : 156。 图 79 显示核酸 SEQ.ID.No. : 157 和氨基酸 SEQ.ID.No. : 158。 图 80 显示核酸 SEQ.ID.No. : 159 和氨基酸 SEQ.ID.No. : 160。 图 81 显示核酸 SEQ.ID.No. : 161 和氨基酸 SEQ.ID.No. : 162。 图 82 显示核酸 SEQ.ID.No. : 163 和氨基酸 SEQ.ID.No. : 164。 图 83 显示核酸 SEQ.ID.No. : 165 和氨基酸 SEQ.ID.No. : 166。 图 84 显示核酸 SEQ.ID.No. : 167 和氨基酸 SEQ.ID.No. : 168。 图 85 显示核酸 SEQ.ID.No. : 169 和氨基酸 SEQ.ID.No. : 170。 图 86 显示核酸 SEQ.ID.No. : 171 和氨基酸 SEQ.ID.No. : 172。 图 87 显示核酸 SEQ.ID.No. : 173 和氨基酸 SEQ.ID.No. : 174。 图 88 显示核酸 SEQ.ID.No. : 175 和氨基酸 SEQ.ID.No. : 176。 图 89 显示核酸 SEQ.ID.No. : 177 和氨基酸 SEQ.ID.No. : 178。 图 90 显示核酸 SEQ.ID.No. : 179 和氨基酸 SEQ.ID.No. : 180。 图 91 显示核酸 SEQ.ID.No. : 181 和氨基酸 SEQ.ID.No. : 182。 图 92 显示核酸 SEQ.ID.No. : 183 和氨基酸 SEQ.ID.No. : 184。 图 93 显示核酸 SEQ.ID.No. : 185 和氨基酸 SEQ.ID.No. : 186。 图 94 显示核酸 SEQ.ID.No. : 187 和氨基酸 SEQ.ID.No. : 188。 图 95 显示核酸 SEQ.ID.No. : 189 和氨基酸 SEQ.ID.No. : 190。 图 96 显示核酸 SEQ.ID.No. : 191 和氨基酸 SEQ.ID.No. : 192。 图 97 显示核酸 SEQ.ID.No. : 193 和氨基酸 SEQ.ID.No. : 194。 图 98 显示核酸 SEQ.ID.No. : 195 和氨基酸 SEQ.ID.No. : 196。 图 99 显示核酸 SEQ.ID.No. : 197 和氨基酸 SEQ.ID.No. : 198。 图 100 显示核酸 SEQ.ID.No. : 199 和氨基酸 SEQ.ID.No. : 200。 图 101 显示核酸 SEQ.ID.No. : 201 和氨基酸 SEQ.ID.No. : 202。 图 102 显示核酸 SEQ.ID.No. : 203 和氨基酸 SEQ.ID.No. : 204。 图 103 显示核酸 SEQ.ID.No. : 205 和氨基酸 SEQ.ID.No. : 206。 图 104 显示核酸 SEQ.ID.No. : 207 和氨基酸 SEQ.ID.No. : 208。 图 105 显示核酸 SEQ.ID.No. : 209 和氨基酸 SEQ.ID.No. : 210。 图 106 显示核酸 SEQ.ID.No. : 211 和氨基酸 SEQ.ID.No. : 212。 图 107 显示核酸 SEQ.ID.No. : 213 和氨基酸 SEQ.ID.No. : 214。 图 108 显示核酸 SEQ.ID.No. : 215 和氨基酸 SEQ.ID.No. : 216。 图 109 显示核酸 SEQ.ID.No. : 217 和氨基酸 SEQ.ID.No. : 218。 图 110 显示核酸 SEQ.ID.No. : 219 和氨基酸 SEQ.ID.No. : 220。 图 111 显示核酸 SEQ.ID.No. : 221 和氨基酸 SEQ.ID.No. : 222。 图 112 显示核酸 SEQ.ID.No. : 223 和氨基酸 SEQ.ID.No. : 224。 图 113 显示核酸 SEQ.ID.No. : 225 和氨基酸 SEQ.ID.No. : 226。图 114 显示核酸 SEQ.ID.No. : 227 和氨基酸 SEQ.ID.No. : 228。 图 115 显示核酸 SEQ.ID.No. : 229 和氨基酸 SEQ.ID.No. : 230。 图 116 显示核酸 SEQ.ID.No. : 231 和氨基酸 SEQ.ID.No. : 232。 图 117 显示核酸 SEQ.ID.No. : 233 和氨基酸 SEQ.ID.No. : 234。 图 118 显示核酸 SEQ.ID.No. : 235 和氨基酸 SEQ.ID.No. : 236。 图 119 显示核酸 SEQ.ID.No. : 237 和氨基酸 SEQ.ID.No. : 238。 图 120 显示核酸 SEQ.ID.No. : 239 和氨基酸 SEQ.ID.No. : 240。 图 121 显示核酸 SEQ.ID.No. : 241 和氨基酸 SEQ.ID.No. : 242。 图 122 显示核酸 SEQ.ID.No. : 243 和氨基酸 SEQ.ID.No. : 244。 图 123 显示核酸 SEQ.ID.No. : 245 和氨基酸 SEQ.ID.No. : 246。 图 124 显示核酸 SEQ.ID.No. : 247 和氨基酸 SEQ.ID.No. : 248。 图 125 显示核酸 SEQ.ID.No. : 249 和氨基酸 SEQ.ID.No. : 250。 图 126 显示核酸 SEQ.ID.No. : 251 和氨基酸 SEQ.ID.No. : 252。 图 127 显示核酸 SEQ.ID.No. : 253 和氨基酸 SEQ.ID.No. : 254。 图 128 显示核酸 SEQ.ID.No. : 255 和氨基酸 SEQ.ID.No. : 256。 图 129 显示核酸 SEQ.ID.No. : 257 和氨基酸 SEQ.ID.No. : 258。 图 130 显示核酸 SEQ.ID.No. : 259 和氨基酸 SEQ.ID.No. : 260。 图 131 显示核酸 SEQ.ID.No. : 261 和氨基酸 SEQ.ID.No. : 262。 图 132 显示核酸 SEQ.ID.No. : 263 和氨基酸 SEQ.ID.No. : 264。 图 133 显示核酸 SEQ.ID.No. : 265 和氨基酸 SEQ.ID.No. : 266。 图 134 显示核酸 SEQ.ID.No. : 267 和氨基酸 SEQ.ID.No. : 268。 图 135 显示核酸 SEQ.ID.No. : 269 和氨基酸 SEQ.ID.No. : 270。 图 136 显示核酸 SEQ.ID.No. : 271 和氨基酸 SEQ.ID.No. : 272。 图 137 显示核酸 SEQ.ID.No. : 273 和氨基酸 SEQ.ID.No. : 274。 图 138 显示核酸 SEQ.ID.No. : 275 和氨基酸 SEQ.ID.No. : 276。 图 139 显示核酸 SEQ.ID.No. : 277 和氨基酸 SEQ.ID.No. : 278。 图 140 显示核酸 SEQ.ID.No. : 279 和氨基酸 SEQ.ID.No. : 280。 图 141 显示核酸 SEQ.ID.No. : 281 和氨基酸 SEQ.ID.No. : 282。 图 142 显示核酸 SEQ.ID.No. : 283 和氨基酸 SEQ.ID.No. : 284。 图 143 显示核酸 SEQ.ID.No. : 285 和氨基酸 SEQ.ID.No. : 286。 图 144 显示核酸 SEQ.ID.No. : 287 和氨基酸 SEQ.ID.No. : 288。 图 145 显示核酸 SEQ.ID.No. : 289 和氨基酸 SEQ.ID.No. : 290。 图 146 显示核酸 SEQ.ID.No. : 291 和氨基酸 SEQ.ID.No. : 292。 图 147 显示核酸 SEQ.ID.No. : 293 和氨基酸 SEQ.ID.No. : 294。 图 148 显示核酸 SEQ.ID.No. : 295 和氨基酸 SEQ.ID.No. : 296。 图 149 显示组群成员的氨基酸同一性。 图 150 显示序列组的比较。 图 151A-E 显示了全长克隆的对比。 图 152 显示通过 PCR 克隆细胞色素 p450cDNA 片段的方法。图 153 显示核酸 SEQ.ID No. : 356 和氨基酸 SEQ.ID.No. : 357。
图 154 显示核酸 SEQ.ID No. : 358 和氨基酸 SEQ.ID.No. : 359。
图 155 显示核酸 SEQ.IDNo. : 360 和氨基酸 SEQ.ID.No. : 361。
图 156 显示核酸 SEQ.ID No. : 362 和氨基酸 SEQ.ID.No. : 363。
图 157 显示核酸 SEQ.ID No. : 364 和氨基酸 SEQ.ID.No. : 365。
图 158 显示核酸 SEQ.ID No. : 366 和氨基酸 SEQ.ID.No. : 367。
图 159 显示核酸 SEQ.ID No. : 368 和氨基酸 SEQ.ID.No. : 369。
图 160 显示核酸 SEQ.ID No. : 370 和氨基酸 SEQ.ID.No. : 371。
图 161 显示核酸 SEQ.ID No. : 372 和氨基酸 SEQ.ID.No. : 373。
图 162 显示基因芯片上所有克隆的探针组序列。
图 163 显示了 SEQ.ID No. : 434-536。
发明详述
定义
除非另有定义, 本文使用的所有技术和科技术语均与本发明所属领域的普通 技术人员通常理解的具有相同的意义。Singleton 等, (1994)《微生物和分子生物学字 典》 (Dictionary of Microbiology and Molecular Biology), 第二版, John Wiley and Sons( 纽约 ) 为技术人员提供了许多关于本发明所用术语的通用字典。本文所提及的所有 专利和出版物均纳入本文作为参考。出于本发明的目的, 下列术语如下定义。 “酶活性” 包括脱甲基化、 羟基化、 环氧化、 N- 氧化、 磺基氧化、 N-、 S- 和 O- 脱烷基 化、 脱硫作用、 脱氨基作用和偶氮基、 硝基和 N- 氧化物基团的还原。术语 “核酸” 指单链或 双链形式的, 或有义或反义的脱氧核糖核酸或核糖核酸聚合物, 并且除非另有限制, 该术语 包括能以类似于天然存在核苷酸的方式与核酸杂交的天然核苷酸的已知类似物。 除非另有 指出, 特定的核酸序列包括其互补序列。
术语 “可操作性连接” 、 “可操作性结合” 和 “以可操作性顺序” 指核酸表达控制序 列 ( 例如启动子、 信号序列或转录因子结合位点的阵列 ) 和第二核酸序列之间的功能性连 接, 其中表达控制序列影响对应于第二序列的核酸的转录和 / 或翻译。
当术语 “重组体” 用于指细胞时, 它指该细胞复制异源核酸, 表达所述核酸或表达 异源核酸编码的肽、 异源肽或蛋白质。重组细胞可以有义或反义形式表达在细胞的天然形 式 ( 非重组 ) 中未发现的基因或基因片段。重组细胞也可表达在细胞的天然形式中发现的 基因, 但其中该基因通过人工方式被改变并重新引入细胞。
“结构基因” 是含有编码蛋白质、 多肽或其部分的 DNA 片段的基因的一部分, 并且 不包括启动转录的 5’ 序列。或者结构基因可编码不可翻译的产物。结构基因可是在细胞 中正常发现的基因, 或者它是引入的而非在细胞或细胞位置中正常发现的基因, 在这种情 况下称为 “异源基因” 。异源基因可全部或部分来源于本领域已知的任何来源, 包括细菌 基因组或附加体、 真核生物的、 核的或质粒 DNA、 cDNA、 病毒 DNA 或化学合成的 DNA。结构基 因可含有一种或多种修饰, 这些修饰可影响生物活性或其特性、 表达产物的生物活性或化 学结构、 表达速率或表达控制的方式。这种修饰包括 ( 但不限于 ) 一个或多个核苷酸的突 变、 插入、 删除和取代。结构基因可构成不间断的编码序列或可包括一个或多个与合适的 剪接接头结合的内含子。结构基因可以是可翻译或不可翻译的, 包括反义方向 (antisense
orientation)。结构基因可以是来源于多种来源和多种基因序列的复合物 ( 天然存在的或 合成的, 其中合成的指化学合成的 DNA)。
“来源于” 用来指从某种来源 ( 化学和 / 或生物的 ) 取得、 获得、 接受得、 追溯、 复 制或传下的。可通过对原始来源的化学或生物学操作 ( 包括, 但不限于取代、 添加、 插入、 删 除、 提取、 分离、 突变和复制 ) 产生衍生物。
涉及 DNA 序列的术语 “化学合成的” 指部分核苷酸组分在体外装配。可使用已 良好建立的方法 (Caruthers, 《DNA 和 RNA 测序的方法》 (Methodology of DNA and RNA Secquencing), (1983), Weissman 编, Praeger Publishers, New York, 第 1 章 ) 实现 DNA 的 手工化学合成 ; 可使用许多市售可得的机器的一种进行自动化学合成。
可通过以下方法进行序列的最佳对比 : Smith 和 Waterman(Adv.Appl.Math.2 : 482(1981)) 的局部同源性算法、 Needleman 和 Wunsch(J.Mol.Biol.48 : 443(1970)) 的同源 性算法、 Pearson 和 Lipman(Proc.Natl.Acad.Sci.(U.S.A.)85 : 2444(1988)) 的相似性检索 方法、 这些算法的计算机化的工具 (Wisconsin Genetics 软件包中的 GAP、 BESTFIT、 FASTA 和 TFASTA, Genetics Computer Group, 575 Science Dr., Madison, Wis.) 或通过检验。
可从几种来源 ( 包括生物信息国家中心 (NCBI, Bethesda, Md.) 和因特网 ) 获 得 NCBI 基础局部序列比对检索工具 (BLAST)(Altschul 等, 1990) 与序列分析程序 blast、 blastn、 blastx、 tblastn 和 tblastx 联合使用。 该工具可在 htp://www.ncbi.nlm.nih.gov/ BLAST/ 获得。如何使用该程序检测序列同一性描述于 http://www.ncbi.nlm.nih.gov/ BLAST/blast help.html。
本文使用并应用于氨基酸序列的术语 “实质性氨基酸同一性”或 “实质性氨基 酸序列同一性”表示多肽的一种特性, 其中与参考组在所翻译肽的细胞色素 p450 基序 GXRXCX(G/A) 后的第一氨基酸到终止密码子的对应区域相比, 所述肽含有至少 70 %的 序列同一性、 优选 80 %氨基酸序列同一性、 更优选 90 %氨基酸序列同一性、 最优选至少 99-100%序列同一性的序列。
本文使用并应用于核酸序列的术语 “实质性核酸同一性”或 “实质性核酸序列 同一性” 表示多核苷酸序列的一种特性, 其中与参考组在所翻译肽的细胞色素 p450 基序 GXRXCX(G/A) 后的第一核酸到终止密码子的对应区域相比, 所述多核苷酸含有至少 75%的 序列同一性、 优选 81%序列同一性、 更优选 91%序列同一性、 最优选至少 99-100%序列同 一性的序列。
核苷酸序列实质相同的另一个指标是两个分子在严格条件下是否可杂交。 严格条 件视序列而定, 在不同情况下是不同的。严格条件一般选择比给定离子强度和 pH 时特定序 列的热解链温度 (Tm) 低约 5-20℃, 通常是约 10-15℃。Tm 是在给定离子强度和 pH 时 50% 靶序列与匹配的探针杂交的温度。严格条件通常是盐浓度为约 0.02 摩尔, pH 是 7, 温度是 至少约 60℃。例如, 在标准的 Southern 杂交方法中, 严格条件包括于 42℃在 6×SSC 中初 次洗涤, 然后于至少约 55℃ ( 通常是约 60℃, 更常见是约 65℃ ) 在 0.2×SSC 进行一次或多 次额外洗涤。
出于本发明的目的, 当核苷酸序列编码的多肽和 / 或蛋白质实质性相同时, 核苷 酸序列也实质性相同。因此, 当一条核酸序列与第二条核酸序列编码的多肽实质性相同 时, 这两条核酸序列是实质性相同的, 即使由于遗传密码所允许的简并性造成它们在严格条件下不会杂交 ( 对密码子简并性和遗传密码的解释参见 Darnell 等, (1990)《分子生物 学》 (Molecular Cell Biology), 第二版, Scientific American Books W.H.Freeman and Company, New York)。 可通过许多本领域熟知的方式, 例如蛋白质样品的聚丙烯酰胺凝胶电 泳, 然后基于染色通过目测来表征蛋白质纯度或均一性。 出于特定的目的, 可能需要高分辨 率并可利用 HPLC 或类似的装置。
本文使用的术语 “载体” 指将 DNA 片段转移入细胞的核酸分子。载体可由于复制 DNA 并可在宿主细胞中独立地复制。术语 “运载体” 有时可与 “载体” 互换使用。本文使用 的术语 “表达载体” 指重组 DNA 分子, 该分子含有所需的编码序列和用于在特定宿主生物体 中表达操作性相连的编码序列所需合适的核酸序列。通常, 原核生物中表达所需的核酸序 列通常含有启动子、 操纵子 ( 任选 ) 与核糖体结合位点, 以及其它序列。已知真核细胞可利 用启动子、 增强子以及终止和聚腺苷酸化信号。
为再生完全经遗传工程改造的具有根的植物, 可在植物细胞中插入核酸, 例如通 过诸如体内接种的任何技术或通过任何已知的体外组织培养技术来产生可再生为完整植 物的转化植物细胞。因此, 例如可通过病原性或非病原性根瘤土壤杆菌 (A.tumefacien) 的 体外接种来插入植物细胞。也可使用其它这样的组织培养技术。
“植物组织” 包括分化或未分化的植物组织, 包括, 但不限于根、 芽、 叶、 花粉、 种子、 肿瘤组织以及培养物中细胞的各种形式, 例如单细胞、 原生质体、 胚和愈伤组织。植物组织 可在植物中 (in planta) 或器官中, 组织或细胞培养物中。
本文使用的 “植物细胞” 包括植物中的植物细胞和培养物中的植物细胞和原生质 体。
“cDNA” 或 “互补 DNA” 一般指核苷酸序列与 RNA 分子互补的单链 DNA 分子。cDNA 是通过逆转录酶在 RNA 模板作用形成的。
获得核酸序列的方案
根据本发明, 从转化体和非转化体烟草谱系的烟草组织中提取 RNA。 提取的 RNA 然 后用于产生 cDNA。然后使用两种方案产生本发明的核酸序列。
在第一方案中, 从植物组织中提取富含 polyA 的 RNA 并通过逆转录 PCR 制备 cDNA。 然后使用简并引物加上寡聚 d(T) 反向引物, 用单链 cDNA 产生 p450 特异性 PCR 群。以高度 保守的 p450 基序为基础设计引物。特定的简并引物的例子示于图 1。进一步分析含有合适 大小插入物的质粒的序列片段。这些插入物的大小一般是约 300-800 个核苷酸, 视采用何 种引物而定。
在第二方案中, 首先构建 cDNA 文库。使用简并引物加上在质粒上作为反向引物的 T7 引物, 使用质粒中的 cDNA 产生 p450 特异的 PCR 群。如第一方案中一样, 进一步分析含有 合适大小插入物的质粒的序列片段。
已知产生高水平降烟碱的烟草植物谱系 ( 转化体 ) 和降烟碱水平检测不到的植物 谱系可用作起始材料。
然后可从植物上取下叶子并用乙烯处理以激活本文所定义的 p450 酶活性。示于 本领域已知的技术提取总 RNA。然后使用如图 153 所述的寡聚 d(T) 引物经 PCR(RT-PCR) 产 生 cDNA 片段。然后可完全地构建本文实施例所述的 cDNA 文库。
p450 型酶的保守区域可用作简并引物 ( 图 75) 的模板。可通过 PCR 使用简并引物扩增 p450 特异性条带。表示 p450 样酶的区带可通过 DNA 测序鉴定。可使用鉴定合适的候 选对象的 BLAST 检索、 算法或其它工具来表征 PCR 片段的特性。
已鉴定片段的序列信息可用于开发 PCR 引物。这些引物与 cDNA 文库中的质粒引 物联合用于克隆全长 p450 基因。进行大规模 Sourthern 反向分析来检测所有获得的片段 克隆以及在一些情况中全长克隆的差别表达。在本发明的这个方面, 为筛选所有克隆的插 入物, 可用不同组织的标记的总 cDNA 作为探针来与克隆的 DNA 片段杂交, 进行大规模反向 Sourthern 测定。
也用非放射性和放射性 (P32)Northern 印迹测定来鉴定克隆 p450 片段和全长克 隆。
通过衍生它们的氨基酸序列与选择抗原性和对其它克隆独特的肽区域来制造针 对几种全长克隆的肽特异性抗体。制造了针对偶联于运载体蛋白的合成肽的家兔抗体。使 用这些抗体对植物组织进行 Western 印迹分析或其它免疫学方法。
可使用病毒诱导的基因沉默技术 (VIGS, Baulcombe, Current Opinions in Plant Biology, 1999, 2: 109-113) 检测以上鉴定的核酸序列。
通过衍生它们的氨基酸序列与选择可能的抗原性和对其它克隆独特的肽区域来 制造针对几种全长克隆的肽特异性抗体。 制造了针对偶联于运载体蛋白的合成肽的家兔抗 体。使用这些抗体进行 Western 印迹分析。 在本发明的另一方面, 使用干扰 RNA(RNAi) 技术在本发明的烟草植物中进一步 鉴定细胞色素 p450 酶活性。描述该技术的以下参考文献纳入本文作为参考, Smith 等, Nature, 2000, 407 : 319-320 ; Fire 等, Nature, 1998, 391 : 306-311 ; Waterhouse 等, PNAS, 1998, 95 : 13959-13964 ; Stalberg 等, Plant Molecular Biology, 1993, 23 : 671-683 ; Baulcombe, Current Opinions in Plant Biology, 1999, 2: 109-113 和 Brigneti 等, EMBO Journal, 1998, 17(22) : 6739-6746。可使用 RNAi 技术、 反义技术或所述的各种其它方法来 转化植物。
有几种技术将外来遗传物质引入植物细胞并获得稳定地维持和表达所引入基因 的植物。这种技术包括加速包裹在微粒上的遗传物质进入细胞 ( 授予 Cornell 的美国专利 4,945,050 和授予 DowElanco 的美国专利 5,141,131)。可使用土壤杆菌技术来转化植物, 参见授予 University of Toledo 的美国专利 5,177,010 ; 授予 Texas A & M 的 5,104,310 ; Schilperoot 的欧洲专利申请 0131624B1、 欧洲专利申请 120516、 159418B1、 欧洲专利申 请 120516、 159418B1 和 176,112 ; 授 予 Schilperoot 美 国 专 利 5,149,645 ; 5,469,976 ; 5,464,763 ; 4,940,838 和 4,693,976 ; MaxPlanck 的欧洲专利申请 116718、 290799、 320500 ; Japan Nicotiana 的欧洲专利申请 604662 和 627752 ; Ciba Geigy 的欧洲专利申请 0267159、 0292435 和美国专利 5,231,019 ; 授予 Calgene 的美国专利 5,463,174 和 4,762,785 ; 授予 Agracetus 的美国专利 5,004,863 和 5,159,135。其它转化技术包括 whiskers 技术, 参见, 例如授予 Zeneca 的美国专利 5,302,523 和 5,464,765。 电穿孔技术也用于转化植物, 参见, Boyce Thompson Institute 的 WO 87/06614、 Dekalb 的 5,472,869 和 5,384,253 ; PGS 的 WO9209696 和 WO9321335。所有这些转化专利和出版物引作参考。除了许多转化植物的技 术以外, 与外来基因接触的组织的类型也可变。这种组织包括, 但不限于胚胎发生组织、 I 和 II 型愈伤组织、 下胚轴、 分生组织等。使用技术人员已知的合适的技术几乎可转化所有
分化过程中的植物组织。
引入植物的外来遗传物质可包含选择标记。具体的标记可由技术人员判断, 但 以下选择标记可与任何其它可用作选择标记的本文未列出的基因一起使用。这种选择 标记包括, 但不限于 : 编码抗生素卡那霉素、 新霉素和 G418 抗性的转座子 Tn5(Aph II) 的氨基糖苷磷酸转移酶基因, 以及编码对 N- 膦酰甲基甘氨酸、 潮霉素、 氨甲喋呤、 草铵膦 (phosphinothricin)(bar)、 咪唑啉酮、 磺酰脲和三唑并嘧啶除草剂, 例如 chlorosulfuron、 溴苯腈、 茅草枯等具抗性或耐受性的那些基因。
除了选择标记以外, 可能需要使用报道基因。 在一些例子中, 可使用报道基因而无 需选择标记。报道基因是通常不存在于或不表达于受者生物体或组织中的基因。报道基因 通常编码提供一些表型改变或酶性能的蛋白质。这种基因的例子见纳入本文作为参考的 K.Weising 等, Ann.Rev.Genetics, 22, 421(1988)。优选的报道基因包括, 但不限于葡糖醛 酸酶 (GUS) 基因和 GFP 基因。
一旦引入植物组织后, 可通过任何本领域已知的方法来评价结构基因的表达, 可 以 mRNA 转录、 蛋白质合成或发生沉默基因的量来检测表达 ( 参见纳入本文作为参考的美国 专利号 5,583,021)。用于体外培养植物细胞和在许多情况中, 用于再生完整植物的技术是 已知的 ( 欧洲申请号 88810309.0)。本领域的技术人员已知将引入的表达复合物变为商业 有用品种的方法。 一旦获得表达所需水平的 p450 酶的植物细胞, 可使用本领域熟知的方法和技术 再生植物组织和完整的植物。再生的植物可通过常规方法繁殖, 引入的基因可通过常规植 物育种技术转入其它品系或品种。
以下实施例描述了实施本发明的方法并且应理解为是说明性的, 而非基于此来限 制本发明在权利要求中所定义的范围。
实施例 实施例 1 植物组织的发育和乙烯处理
植物生长
将植物种在盆中, 在温室中生长 4 周。将 4 周龄的幼苗移到单独的盆中, 温室中生 长 2 个月。生长过程中, 每天给植物浇水 2 次, 水中含有 150ppm 的 NPK 肥料。将展开的绿 叶与植物分离, 以进行下面所述的乙烯处理。
细胞系 78379
由 肯 塔 基 大 学 发 放 的 烟 草 品 系 78379 用 作 植 物 材 料 的 来 源, 它是一种白肋 (burley) 烟草品系。 用本领域种植烟草的标准方法培养 100 株植物, 移植, 并且用不同的数 字 (1-100) 给它们贴注标签。用推荐的方法施肥和进行田间管理。
100 株植物中的 3/4 将 20-100%的烟碱转化为降烟碱。 100 株中的 1/4 将小于 5% 的烟碱转化为降烟碱。植株 87 转化率最低 (2% ), 而植株 21 的转化率为 100%。将转化率 小于 3%的植株分类为非转化株。对植株 87 和 21 自花授粉的种子以及杂交 (21 x 87 和 87 x 21) 的种子进行遗传差异和表型差异的研究。来自植株 21 自花授粉种子的植物是转 化株, 99%的来自植株 87 自花授粉种子的植物是非转化株。 剩余 1%的来自植株 87 自花授 粉种子的植物有较低的转化率 (5-15% )。杂交种均为转化株。
细胞系 4407
烟草品系 4407 用作植物材料来源, 它是一种白肋品系。选择均一的并且具代表性 的植物 (100) 并贴上标签。在这 100 株植物中, 97 株是非转化株, 3 株是转化株。植株 56 的转化率最低 (1.2% ), 植株 58 的转化水平最高 (96% )。将这两株植物进行自花授粉和 杂交。
来自植株 58 自花授粉种子的植株产生 3 ∶ 1 的分离比 ( 转化株∶非转化株= 3 ∶ 1)。植株 58-33 和 58-25 分别被鉴定为纯合转化株和非转化株植物品系。植株 58-33 下一代后裔中的分析确证了该植株的稳定转化率。
细胞系 PBLB01
PBLB01 是由 ProfiGen, Inc. 研究开发的一种白肋品系, 用作植物材料的来源。从 PBLB01 的第一代 (foundation) 种子中选择转化株植株。
乙烯处理方法
将绿色叶片从温室生长 2-3 个月的植物分离, 喷施 0.3 %的乙烯溶液 ( 商品名 Ethephon(Rhone-Poulenc))。将每片经喷施的叶子悬挂在配有加湿器的养护架 (curing rack) 上, 覆盖塑料膜。在处理期间, 用乙烯溶液定期喷施样品叶片。乙烯处理后约 24-48 小时, 收集叶子提取 RNA。取同一组样品的另外一份 (sup-sample) 用于代谢成分分析以测 定叶片代谢物的浓度以及感兴趣的更具体的成分如多种生物碱的分析。
例如, 可如下进行生物碱分析。样品 (0.1 克 ) 和 0.5 毫升 2N NaOH 以及含有喹啉 ( 作为内标 ) 和甲基叔丁基乙醚的 5 毫升提取液在 150rpm 振荡。在配有 FID 检测器的 HP 6890GC 上分析样品。250℃的温度用于检测器和上样器 (injector)。使用含有与 5%苯酚 和 95%甲基硅酮 (methyl silicon) 交联的熔融硅石的 HP 柱 (30m-0.32nm-1m), 温度梯度 为每分钟 10℃, 110-185℃。 该柱在 100℃工作, 用氦气作为运载气体, 流速为 1.7cm3min-l, 分流比为 40 ∶ 1, 上样体积为 2·1。
实施例 2 : 分离 RNA
对于 RNA 的提取, 如上所述用乙烯处理 2 月龄温室植物的中等大小的叶片。0 和 24-48 小时的样品用于 RNA 提取。在有些情况下, 从打顶 (flower-head removal) 后 10 天 的植物取处于衰老过程的叶片样品。这些样品也用于提取。用 Rneasy Plant Mini (Qiagen, Inc., Valencia, California) 按照生产商的方法分离总 RNA。
用 DEPC 处理过的研钵和杵在液氮中将组织样品研磨为细粉。将约 100 毫克磨碎 的组织转移到灭菌的 1.5 毫升 eppendorf 管中。将样品管置于液氮中, 直到收集完所有样 品。然后, 将试剂盒中提供的 450μl RLT 缓冲液加入各管中。剧烈振荡样品, 然后在 56℃ 温育 3 分钟。 将裂解物加在放于 2 毫升收集管中的 QIAshredderTM 旋转柱上, 最大速度离心 2 分钟。收集流出液, 加 0.5 体积的乙醇到澄清的裂解液中。充分混合样品, 转移到放在 2 毫升收集管中的小旋转柱中。10,000rpm 离心样品 1 分钟。然后, 吸取 700μl RW1 缓冲液 到 柱上, 10,000rpm 离心 1 分钟。吸取 RPE 缓冲液到置于新收集管中的 旋转柱上, 以最大速度离心 柱上, 10,000rpm 离心 1 分钟。再将 RPE 缓冲液加到 钟。将2 分钟以使膜干燥。为了除掉残留的乙醇, 将膜置于一空收集管上, 再以最大速度离心 1 分 柱转移到一个新的 1.5 毫升收集管中, 将 40μl 不含 RNA 酶的水直接吸到 膜上。该最终洗脱物在 10,000rpm 离心 1 分钟。用变性甲醛凝胶和分光光度计分析总 RNA 的质量和数量。
按照生产商的方法用 OligotexTM poly A+RNA 纯化试剂盒 (Qiagen Inc.) 分离 Poly(A)RNA。使用溶于最大为 250μl 体积的约 200μg 总 RNA。将 250μl OBB 缓冲液和 15μl OligotexTM 悬浮液加到 250μl 总 RNA 中。 通过吸打使这些物质彻底混合, 在加热器 (heating block) 上 70℃保温 3 分钟。然后, 将样品置于室温约 20 分钟。最大速度离心 2 分钟得到 oligotex : mRNA 复合物团块。从微离心管中除去全部上清液, 仅剩约 50μl。再 用 OBB 缓冲液处理样品。通过涡旋将 oligotex : mRNA 团块重新悬浮在 400μl OW2 缓冲液 中。将该混合物转移到置于新管中的小旋转柱上, 以最大速度离心 1 分钟。将旋转柱移到 新管中, 再往该柱中加入 400μl OW2 缓冲液。然后, 以最大速度离心该管。将旋转柱转移 到最终的 1.5 毫升微量离心管中。用 60μl 热的 (70℃ )OEB 缓冲液洗脱样品。用变性甲醛 凝胶和分光光度计分析 Poly A 产物。
实施例 3 : 反转录 -PCR
按 照 生 产 商 的 方 法 用 SuperScript 反 转 录 酶 (Invitrogen, Carlsbad, California) 制备第一链 cDNA。 富集了 poly A+RNA 的寡聚 dT 引物混合物由少于 5μg 的总 RNA、 1μl 10mM dNTP 混合物、 1μl Oligo d(T)12-18(0.5μg/μl) 和至多 10μl 的经 DEPC 处理的水组成。各样品在 65℃温育 5 分钟, 然后置于冰上至少 1 分钟。按顺序加入下列各 组分, 以制备反应混合物 : 2μl 10X RT 缓冲液、 4μl 25mM MgC12、 2μl 0.1M DTT 和 1μl 去除 RNA 酶的重组 RNA 酶抑制剂 (Rnase OUT Recombinant RNase Inhibitor)。吸取 9μl 反应混合物到各 RNA/ 引物混合物, 轻柔混合。42℃温育 2 分钟, 在各管中加入 1μl Super Script IITM RT, 42℃温育 50 分钟。在 70℃终止反应 15 分钟, 冰上冷却。离心收集样品, 在各管中加入 1μl RNase H, 37℃温育 20 分钟。用 200pmoles 正向引物 ( 如图 75 所示的 变性引物, SEQ ID NO.149-156) 和 100pmoles 反向引物 (18 碱基的寡聚 d(T), 接一个随机 碱基 ) 进行第二次 PCR。
反应条件是 94℃ 2 分钟 ; 然后进行 40 个循环的 PCR : 94℃ 1 分钟, 45-60℃ 2 分钟, 72℃ 3 分钟 ; 最后 72℃再延伸额外的 10 分钟。
用 1%的琼脂糖凝胶电泳分析 10 微升的扩增样品。 将大小正确的条带从琼脂糖凝 胶上纯化出来。
实施例 4 : PCR 片段群体的产生
按 照 生 产 商 的 方 法 将 实 施 例 3 得 到 的 PCR 片 段 连 接 到 pGEM-T Easy Vector(Promega, Madison, Wisconsin) 中。用连接产物转化 JM109 感受态细胞, 涂在 LB 培 养基平板上, 进行蓝 / 白选择。选择克隆, 置于 96 孔板上在 1.2 毫升 LB 培养基中 37℃生长 过夜。对于所有选出的集落保留冻存管。用 Beckman′ s Biomeck 2000 小制备机器人技 术 (miniprep robotics) 以 Wizard SVMiniprep 试剂盒 (Promega) 从平板上纯化质粒。用 100μl 水洗脱质粒 DNA, 存贮于 96 孔板中。用 EcoRl 消化质粒, 并用 1%琼脂糖凝胶分析以 确证 DNA 的量和插入片段的大小。用 CEQ 2000 测序仪 (Beckman, Fullerton, California) 测序含有 400-600bp 插入片段的质粒。用 BLAST 搜索将测得的序列与 Genbank 数据库进行 比对。鉴定与 p450 相关的片段并进一步分析。或者, 将 p450 片段从差减文库中分离出来。 如上所述分析这些片段。
实施例 5 : CDNA 文库的构建如下所述从乙烯处理的叶片中制备总 RNA 以构建 cDNA 文库。首先, 用改良的酸酚 和氯仿提取方法从乙烯处理的烟草品系 58-33 叶片中提取总 RNA。改良的方法是用 1 克组 织进行研磨, 随后在 5 毫升加入了 5 毫升苯酚 (pH5.5) 和 5 毫升氯仿的提取缓冲液 (100mM Tris-HCl, pH 8.5 ; 200mM NaCl ; 10mM EDTA ; 0.5% SDS) 中涡旋。 将提取的样品离心, 保留上 清。该提取步骤再重复 2-3 次直到上清变得澄清。加入约 5 毫升氯仿以除去痕量的苯酚。 加入 3 倍体积的 ETOH 和 1/10 体积的 3M NaOAc(pH5.2) 以从混合的上清组分中沉淀 RNA, 在 -20℃存贮 1 小时。转移到 Corex 玻璃容器中以后, 在 4℃ 9,000RPM 离心 RNA 组分 45 分 钟。离心下来的团块用 70%乙醇洗涤, 4℃ 9,000RPM 离心 5 分钟。团块干燥以后, 将 RNA 团 块溶解在 0.5 毫升不含 Rnase 的水中。RNA 团块溶解在 0.5 毫升不含 Rnase 的水中。分别 用变性甲醛和分光光度计分析总 RNA 的质量和数量。
以 下 述 步 骤 用 Oligo(dT) 纤 维 素 方 法 (Invitrogen) 和 微 离 心 旋 转 柱 (Invitrogen) 从得到的总 RNA 中分离 poly A+RNA。约 20mg 总 RNA 进行两次纯化以获得高 质量的 poly A+RNA。 用变性甲醛和随后的已知全长基因的 RT-PCR( 确保高质量的 mRNA) 来 分析 PolyA+RNA 产物。
接 着, 以 poly A+RNA 作 模 板 用 cDNA 合 成 试 剂 盒、 合成试剂盒 和 III 金 克 隆 试 剂 盒 (gold cloning kit)(Stratagene, La Jolla, California) 来产生 cDNA 文库。其中的方法按照生产商规定的步骤来进行。用约 8μg polyA+RNA 来构建 cDNA 文库。初级文库的分析显示约有 2.5×106-1×107pfu。用 IPTG 和 X-gal 进行了互补分析, 以检测文库的质量背景, 其中重组噬菌斑的表达高出背景 反应 100 倍以上。
用随机 PCR 对文库进行的更为定量的分析表明, 插入的 cDNA 的平均大小约为 1.2kb。该方法采用了如下所述的两步法 PCR。对于第一步, 反向引物的设计是基于从 p450 片段获得的初级序列信息。设计的反向引物和 T3( 正向 ) 引物用于从 cDNA 文库中扩增相 应的基因。PCR 反应物进行琼脂糖凝胶电泳, 切割高分子量的相应条带, 纯化、 克隆并测序。 在第二步中, 用根据 p450 的 5′ UTR 或翻译起始区域设计的新引物作为正向引物, 和反向引 物一起 ( 根据 p450 的 3′ UTR 设计 ) 用于下一步的 PCR 以获得全长 p450 克隆。
如实施例 3 所述 ( 反向引物除外 ) 从构建的 cDNA 文库中用 PCR 扩增获得 p450 片 段。用位于质粒上 cDNA 插入片段下游 ( 见图 75) 的 T7 引物作为反向引物。如实施例 4 所 述分离、 克隆和测序 PCR 片段。 从构建的 cDNA 文库中用 PCR 方法分离全长 p450 基因。用基因特异性反向引物 ( 根据 p450 片段的下游序列设计 ) 和正向引物 ( 位于文库质粒上的 T3) 来克隆全长基因。 分离、 克隆并测序 PCR 片段。如果需要, 可进行第二步 PCR。在第二步 PCR 中, 用根据克隆 的 p450 的 5′ UTR 设计的新正向引物和根据 p450 的 3′ UTR 设计的反向引物来进行下一 步的 PCR 反应, 以获得全长 p450 克隆。然后对克隆测序。
实施例 6 : 克隆片段的鉴定 - 反向 SOUTHERN 印迹分析
在以上实施例中鉴定的所有 p450 克隆上进行非放射性大规模反向 southern 印迹 试验以检测差异性表达。观察到不同 p450 基因簇之间的表达水平非常不同。在高水平表 达的克隆上又进行了实时检测。
非放射性 southern 印迹方法按如下所述进行。
1) 如实施例 2 所述用 Qiagen Rnaeasy 试剂盒从乙烯处理和未处理的转化株 (58-33) 和非转化株 (58-25) 叶片提取总 RNA。
2) 用生物 素 加尾标记从 上 述步 骤产生 的富含 poly A+ 的 RNA 中衍 生 的单 链 cDNA 来 制 备 探 针。 该 标 记 的 单 链 cDNA 是 如 实 施 例 3 所 述 用 转 化 株 和 非 转 化 株 的 总 RNA(Invitrogen) 进行 RT-PCR 产生的, 但用了生物素化的寡聚 dT 作为引物 (Promega)。这 些用作探针与克隆的 DNA 杂交。
3) 用限制性内切酶 EcoRl 消化质粒 DNA, 进行琼脂糖凝胶电泳。将这些凝胶同 时干燥并转到两个尼龙膜上 一个膜与转化株探针杂交, 另一个膜与非转 化株探针杂交。在杂交之前将膜进行紫外线交联 ( 自动交联设备, 254nm, Stratagene, Stratalinker)。
或者, 用位于 p-GEM 两臂上的序列, T3 和 SP6 作为引物从各质粒中 PCR 扩增插入 片段。PCR 产物在 96 孔的即时 (Ready-to-run) 琼脂糖凝胶上电泳以进行分析。经确证的 插入片段点到两个尼龙膜上。一个膜与转化株探针杂交, 另一个膜与非转化株探针杂交。
4) 按生产商的说明书将这些膜杂交并洗涤, 其中对洗涤的严格性进行了改变 (Enzo MaxSenceTM 试剂盒, Enzo Diagnostics, Inc, Farmingdale, NY)。膜与杂交缓冲液 (2x SSC 缓冲的甲酰胺, 含有去垢剂和杂交增强剂 ) 在 42℃预杂交 30 分钟, 与 10μl 变性 68℃洗涤 的探针 42℃杂交过夜。然后室温用 1X 杂交洗涤缓冲液洗涤杂交膜一次, 10 分钟 ; 15 分钟, 4 次。然后可以对杂交膜进行检测。
5) 按生产商提供的检测方法 (Enzo Diagnostics, Inc.), 经洗涤的膜用碱性磷酸 酶标记, 然后用 NBT/BCIP 颜色检测方法进行检测。用 1X 封闭液室温封闭杂交膜 1 小时, 用 1X 检测试剂洗涤 10 分钟 (3 次 ), 用 1X 预显影反应缓冲液洗涤 5 分钟 (2 次 ), 然后在显影液 中显影直到出现点状印迹。所有的试剂都由生产商提供 (Enzo Diagnostics, Inc)。此外, TM 还用 KPL southern 杂交和检测试剂盒 按生产商的方法 (KPL, Gaithersburg, Maryland) 进行了大规模反向 Southern 试验。
实施例 7 : 克隆的鉴定 -NORTHERN 印迹分析
除 Southern 印迹分析之外, 如 Northern 印迹分析的实施例所述, 一些膜进行了 Northern 杂交和检测。如下所述, 采用 Northern 杂交检测烟草中差异表达的 mRNA。
采 用 随 机 引 发 方 法 从 克 隆 的 p450 制 备 探 针 (MegaprimeTM DNA 标 记 系 统, Amersham BiosCiences)。 混合下述组分 : 25ng 变性的 DNA 模板 ; 未标记的 dTTP、 dGTP 和 dCTP 各 4μl ; 5μl 反应缓冲液 ; P32 标记的 dATP 和 2ul Klenow I ; 以及水, 使反应体系达到 50μl。该混合物 在 37℃温育 1-4 小时, 然后以 2μ10.5M 的 EDTA 终止。使用前, 95℃温育 5 分钟使探针变 性。
从几对烟草品系经乙烯处理和未经处理的新鲜叶片中制备 RNA 样品。在有些情况 下, 使用了富含 poly A+ 的 RNA。 用 DEPC 水 (5-10μ1) 使约 15μg 总 RNA 或 1.8μg mRNA(RNA 或 mRNA 提取方法如实施例 5 所述 ) 的体积相同。加入等体积的上样缓冲液 (1 x MOPS ; 18.5%甲醛 ; 50%甲酰胺 ; 4% FiColl 400 ; 溴酚蓝 ) 和 0.55μl EtBr(0.5μg/μl)。将样 品变性, 准备用电泳分离 RNA。
将样品用 1XMOP 缓冲液 (0.4M 吗啉苯磺酸 ; 0.1M 乙酸钠 -3x H2O ; 10mM EDTA ; 用
NaOH 调 pH 至 7.2) 在甲醛凝胶 (1%琼脂糖, 1x MOPS, 0.6M 甲醛 ) 上电泳。 用毛细方法在 10X SSC 缓冲液 (1.5M NaCl ; 0.15M 柠檬酸钠 ) 中将 RNA 转移到 Hybond-N+ 上 (Nylon, Amersham PharmaciaBiotech)24 小时。 在杂交前, 将有 RNA 样品的膜紫外交联 ( 自动交联设备, 254nm, Stratagene, Stratalinker)。
膜和 5-10 毫升预杂交缓冲液 (5x SSC ; 50%甲酰胺 ; 5x Denhar dt′ s- 溶液 ; 1% SDS ; 100g/ml 热变性的平端非同源 DNA) 在 42℃预杂交 1-4 小时。将旧的预杂交缓冲液弃 去, 加入新的预杂交缓冲液和探针。杂交在 42℃过夜进行。用 2x SSC 室温洗涤膜 15 分钟, 然后用 2x SSC 洗涤一次。
本发明的一个主要焦点是发现了可被乙烯处理诱导的新基因或者在烟草叶片的 质量和成分中起主要作用的新基因。 如下表所示, Northern 印迹和反向 Southern 印迹可用 于测定哪些基因受乙烯处理的诱导 ( 相对于不受诱导的植株 )。 令人感兴趣的是, 在转化株 和非转化株植株中并非所有的片段都受到相似的影响。对感兴趣的细胞色素 p450 片段部 分测序以确定它们的结构相关性。该信息被用于后续分离和鉴定感兴趣的全长基因克隆。
用全长克隆在从乙烯处理诱导的转化株和非转化株白肋品系获得的烟草组织上 进行 Northern 分析。目的是鉴定在乙烯诱导的转化株植株中 ( 相对于乙烯诱导的转化株 品系相对于乙烯诱导的非转化株白肋品系 ) 表达有所提高的那些全长基因克隆。用这种 Northern 分析方法, 可以通过比较转化株和非转化株品系之间叶片组成的生化差异来确定 全长克隆的功能关系。如下表所示, 6 个克隆在乙烯处理的转化株植物组织中 ( 标记为 ++ 和 +++) 显示出比在乙烯处理的非转化株植物组织中 ( 标记为 +) 表达显著升高。在未经乙 烯处理的转化株和非转化株品系中所有这些克隆显示出很少的表达或不表达。
21102321641 A CN 102321648 全长克隆 D101-BA2 D207-AA5 D208-AC8 D237-AD1 D89-AB1 D90A-BB3
说明书非转化株 + + + + + +20/32 页转化株 ++ ++ +++ ++ ++ ++实施例 8 : 由克隆的基因编码的 p450S 的免疫检测
选择来自 3 个 p450 克隆的长度相应于 20-22 个氨基酸的肽区域, 这些肽区域 : 1) 与其它克隆具有很低的同源性或没有同源性, 和 2) 具有很好的亲水性和抗原性。下面列出 了选自各个 p450 克隆的肽区域的氨基酸序列。 将合成的肽与 KHL 偶联, 然后注射到家兔中。
第 4 次注射后 2 周和 4 周收集抗血清 (Alpha Diagnostic Intl.Inc.San Antonio, TX)。
D234-A D1DIDGSKSKLVKAHRKIDEILG
D90a-BB3 RDAFREKETFDENDVEELNY
D89-AB1 FKNNGDEDRHF SQKLGDLADKY
用 Western 印迹分析来检测抗血清对烟草植物组织靶蛋白的交叉活性。
从乙烯处理的 (0-40 小时 ) 转化株和非转化株品系的中等大小的叶片获得蛋白粗 提物。按生产商的方法用 RC DC 蛋白检测试剂盒 (BIO-RAD) 测定该提取物的蛋白浓度。
将 2 微克蛋白加到各泳道中, 用 Laemmli SDS-PAGE 体系在 10% -20%梯度凝胶 上分离蛋白。用 半干槽 (Semi-Dry cell)(BIO-RAD) 将蛋白从凝胶转移到 硝化纤维转移膜 (Schleicher & Schuell) 上。用 ECLAdvanceTM Western 印 迹检测试剂盒 (Amersham Biosciences) 检测和显影 p450 蛋白。在家兔中制备针对合成的 KLH 耦合物的一抗。针对兔 IgG 的二抗 ( 与过氧化物酶偶联 ) 购自 Sigma。一抗和二抗都 以 1 ∶ 1000 稀释液使用。抗体对 Western 印迹上的一条单一条带显示出很强的反应性, 说 明该抗血清对感兴趣的靶肽是单一特异性的。抗血清对与 KLH 耦合的合成肽也具有交叉反 应性。 实施例 9 : 分离的核酸片段的核酸同一性和结构相关性
超过 100 个克隆的 p450 片段结合 Northern 印迹分析来测序, 以确定它们的结构 相关性。所用方法中使用的正向引物基于两个共有的 p450 基序, 这两个基序邻近 p450 基 因的羧基末端。该正向引物对应于如图 1 所示的细胞色素 p450 基序 FXPERF 或 GRRXCP(A/ G)。反向引物使用来自质粒的标准引物 ( 位于 pGEMTM 质粒的两臂 )SP6 或 T7, 或使用多聚 A 尾巴。所用方法如下所述。
按生产商 (Beckman Coulter) 的方法用分光光度法评价起始双链 DNA 的浓度。将 模板用水稀释到合适的浓度, 95℃ 2 分钟加热变性, 然后置于冰上。测序反应液在冰上制
备, 其包括 0.5-10μl 变性 DNA 模板, 2μl 1.6pmole 正向引物, 8μl DTCS Quick Start Master Mix, 用水调节总体积到 20μl。温度循环程序包括以下 30 个循环 : 96 ℃ 20 秒, 50℃ 20 秒, 60℃ 4 分钟, 然后 4℃保温。
加入 5μl 终止缓冲液 ( 等体积的 3M NaOAc、 100mM EDTA 和 1μl20mg/ml 肝糖 ) 使 测序终止。 用 60μl 95%的冷乙醇沉淀样品, 6000g 离心 6 分钟。 弃去乙醇。 团块用 200μl 冷的 70%乙醇洗涤 2 次。团块干燥以后, 加入 40μl SLS 溶液, 使团块重悬。在表面上加入 一层矿物油。然后, 将样品置于 CEQ 8000 自动测序仪中进行进一步分析。
为了验证核酸序列, 用基于 p450 基因的 FXPERF 或 GRRXCP(A/G) 区域的正向引物 或基于质粒或多聚 A 尾巴的反向引物对核酸序列在两个方向进行重新测序。在两个方向上 所有的测序至少进行两次。
将细胞色素 p450 片段的核酸序列彼此比较, 从编码区 ( 与编码 GRRXCP(A/G) 的区 域之后的第一个核酸相对应 ) 一直到终止子。选择该区域作为 p450 蛋白遗传多态性的一 个指示参数。观察到大量的 ( 超过 70 种 ) 遗传上不同的 p450 基因, 类似于其它植物物种 中所观察到的。在比较核酸序列时发现, 这些基因根据其序列同一性可置于不同的序列组 群中。发现 p450 成员的最好的唯一的 (unique) 分组确定为那些具有 75%或更大核酸同 一性的序列 ( 见表 1)。降低同一性百分数导致组群明显变大。观察到优选的分组是那些 具有 81%或更大核酸同一性的序列, 更优选的分组是具有 91%或更大核酸同一性的序列, 最优选的分组是具有 99%或更大核酸同一性的序列。大多数组群包括至少 2 个成员, 经常 为 3 个或更多个成员。没有重复观察到其它情况, 说明所采用的方法既能够在所用组织中 分离低表达的 mRNA 又能够分离高表达的 mRNA。
基于 75 %或更大核酸同一性, 发现两个细胞色素 p450 组群与之前 ( 发现 ) 的 遗传上与这两个组群不同的烟草细胞色素基因具有核酸序列同一性。第 23 组在表 I 所 用的指数范围内, 显示出与之前分别由 Czernic 等和 Ralston 等提交的 GenBank 序列 GI : 1171579(CAA64635) 和 GI : 14423327( 或 AAK62346) 具有核酸同一性。GI : 1171579 与第 23 组成员的核酸同一性为 96.9% -99.5%, 而 GI : 14423327 与第 23 组成员的核酸同一性为 95.4% -96.9%。 第 31 组的成员与 Ralston 等提交的 GenBank 序列 GI : 14423319(AAK62342) 有 76.7% -97.8%的核酸同一性。表 1 中没有其它 p450 同一性组群在表 1 所用的参数范 围内与 Ralston 等、 Czernic 等、 Wang 等或 LaRosa 和 Smigocki 报道的烟草 p450 基因具有 同一性。
如图 76 所示, 对于各组, 可衍生合适的核酸变性探针的共有序列, 以优先从烟草 植物中鉴定和分离各组的其它成员。
表I: 烟草 p450 核酸序列同一性组群
组群 片段
1 D58-BG7(SEQ ID No. : 1), D58-AB1(SEQ ID No. : 3) ; D58-BE4(SEQ ID No. : 7)
2 D56-AH7(SEQ ID No. : 9) ; D13a-5(SEQID No. : 11)
3 D56-AG10(SEQ ID No. : 13) ; D35-33(SEQ ID No. : 15) ; D34-62(SEQ ID No. : 17)
4 D56-AA7(SEQ ID No. : 19) ; D56-AE1(SEQ ID No. : 21) ; 185-BD3(SEQID No. : 143)5 D35-BB7(SEQ ID No. : 23) ; D177-BA7(SEQ ID No. : 25) ; D56A-AB6(SEQ ID No. : 27) ; D144-AE2(SEQ ID No. : 29)
6 D56-AG11(SEQ ID No. : 31) ; D179-AA1(SEQ ID No. : 33)
7 D56-AC7(SEQ ID No. : 35) ; D144-AD1(SEQ ID No. : 37)
8 D144-AB5(SEQ ID No. : 39)
9 D181-AB5(SEQ ID No. : 41) ; D73-Ac9(SEQ ID No. : 43)
10 D56-AC12(SEQ ID No. : 45)
11 D58-AB9(SEQID No. : 47) ; D56-AG9(SEQ ID No. : 49) ; D56-AG6(SEQ ID No. : 51) ; D35-BGll(SEQ ID No. : 53) ; D35-42(SEQ ID No. : 55) ;
D35-BA3(SEQ ID No. : 57) ; D34-57(SEQ ID No. : 59) ; D34-52(SEQ ID No. : 61) ; D34-25(SEQID No. : 63)
12 D56-AD10(SEQID No. : 65)
13 56-AA11(SEQ ID No. : 67)
14 D177-BD5(SEQ ID No. : 69) ; D177-BD7(SEQ ID No. : 83)
15 D56A-AG10(SEQ ID No. : 71) ; D58-BC5(SEQ ID No. : 73) ; D58-AD12(SEQ ID No. : 75)
16 D56-AC11(SEQ ID No. : 77) ; D35-39(SEQ ID No. : 79) ; D58-BH4(SEQ ID No. : 81) ; D56-AD6(SEQ ID No. : 87)
17 D73A-AD6(SEQ ID No. : 89) ; D70A-BA11(SEQ ID No. : 91)
18 D70A-AB5(SEQ ID No. : 95) ; D70A-AA8(SEQ ID No. : 97)
19 D70A-AB8(SEQ ID No. : 99) ; D70A-BH2(SEQ ID No. : 101) ; D70A-AA4(SEQ ID No. : 103)
20 D70A-BA1(SEQ ID No. : 105) ; D70A-BA9(SEQ ID No. : 107)
21 D70A-BD4(SEQ ID No. : 109)
22 D181-AC5(SEQ ID No. : 111) ; D144-AH1(SEQ ID No. : 113) ; D34-65(SEQ ID No. : 115)
23 D35-BG2(SEQ ID No. : 117)
24 D73A-AH7(SEQ ID No. : 119)
25 D58-AA1(SEQ ID No. : 121) ; D185-BC1(SEQID No. : 133) ; D185-BG2(SEQ ID No. : 135)
26 D73-AE10(SEQ ID No. : 123)
27 D56-AC12(SEQ ID No. : 125)
28 D177-BF7(SEQ ID No. : 127) ; D185-BE1(SEQ ID No. : 137) ; D185-BD2(SEQ ID No. : 139)
29 D73A-AG3(SEQ ID No. : 129)
30 D70A-AA12(SEQ ID No. : 131) ; D176-BF2(SEQ ID No. : 85)
31 D176-BC3(SEQ ID No. : 145)
32 D176-BB3(SEQ ID No. : 147)
33 D186-AH4(SEQ ID No. : 5)实施例 10 : 分离的核酸片段的相关氨基酸序列同一性
推测实施例 8 中获得的细胞色素 p450 片段的核酸序列的氨基酸序列。被推测的 区域对应于紧跟在 GXRXCP(A/G) 序列基序之后的氨基酸到羧基末端, 或终止子。在比较片 段的序列同一性时, 氨基酸同一性为 70 %或更大的那些序列观察到唯一的分组 (unique grouping)。氨基酸同一性为 80%或更大的那些序列观察到优选的分组, 更优选为 90%氨 基酸同一性或更大, 最优选的分组是氨基酸同一性为 99%或更大的那些序列。组群和组群 成员的相应氨基酸序列示于图 2。 发现这些唯一的 (unique) 氨基酸序列中的几个与其它序 列具有完全的序列同一性, 因此只报道了具有相同氨基酸的一个成员。
根据它们的核苷酸序列, 表 II 第 19 组的氨基酸同一性对应于 3 个不同的组群。 各 组成员的氨基酸序列和它们的同一性示于图 77。相应标示了氨基酸差异。
选择了各氨基酸同一性组群中的至少一个成员用植物进行基因克隆和功能性研 究。此外, 经 Northern 和 Southern 分析评定为受乙烯处理的影响不同或具有其它生物学 差异的组群成员也被选择作基因克隆和功能研究。为有助于基因克隆, 将基于序列同一性 和差异序列进行表达研究和完整植物评价以及肽特异性抗体的制备。
表 II : 烟草 p450 氨基酸序列同一性分组
组群 片段
1 D58-BG7(SEQ ID No. : 2), D58-AB1(SEQ ID No. : 4)
2 D58-BE4(SEQ ID No. : 8)
3 D56-AH7(SEQ ID No. : 10) ; D13a-5(SEQ ID No. : 12)
4 D56-AG10(SEQ ID No. : 14) ; D34-62(SEQ ID No. : 18)
5 D56-AA7(SEQ ID No. : 20) ; D56-AE1(SEQ ID No. : 22) ; 185-BD3(SEQ ID No. : 144)
6 D35-BB7(SEQ ID No. : 24) ; D177-BA7(SEQ ID No. : 26) ; D56A-AB6(SEQ ID No. : 28) ; D144-AE2(SEQID No. : 30)
7 D56-AG11(SEQID No. : 32) ; D179-AA1(SEQ ID No. : 34)
8 D56-AC7(SEQ ID No. : 36) ; D144-AD1(SEQ ID No. : 38)
9 D144-AB5(SEQID No. : 40)
10 D181-AB5(SEQID No. : 42) ; D73-Ac9(SEQ ID No. : 44)
11 D56-AC12(SEQ ID No. : 46)
12 D58-AB9(SEQ ID No. : 48) ; D56-AG9(SEQ ID No. : 50) ; D56-AG6(SEQ ID No. : 52) ; D35-BG11(SEQ ID No. : 54) ; D35-42(SEQ ID No. : 56) ;
D35-BA3(SEQ ID No. : 58) ; D34-57(SEQ ID No. : 60) ; D34-52(SEQ ID No. : 62)
13 D56AD10(SEQ ID No. : 66)
14 56-AA11(SEQ ID No. : 68)
15 D177-BD5(SEQ ID No. : 70) ; D177-BD7(SEQ ID No. : 84)
16 D56A-AG10(SEQ ID No. : 72) ; D58-BC5(SEQID No. : 74) ; D58-AD12(SEQ ID No. : 76)
17 D56-AC11(SEQ ID No. : 78) ; D56-AD6(SEQ ID No. : 88)
18 D73A-AD6(SEQ ID No.90 : )19 D70A-AB5(SEQ ID No. : 96) ; D70A-AB8(SEQ ID No. : 100) ; D70A-BH2(SEQ ID No. : 102) ; D70A-AA4(SEQ ID No. : 104) ; D70A-BA1(SEQ ID No. : 106) ; D70A-BA9(SEQID No. : 108)
20 D70A-BD4(SEQ ID No. : 110)
21 D181-AC5(SEQID No. : 112) ; D144-AH1(SEQID No. : 114) ; D34-65(SEQ ID No. : 116)
22 D35-BG2(SEQ ID No. : 118)
23 D73A-AH7(SEQID No. : 120)
24 D58-AA1(SEQID No. : 122) ; D185-BC1(SEQ IDNo. : 134) ; D185-BG2(SEQ ID No. : 136)
25 D73-AE10(SEQ ID No. : 124)
26 D56-AC12(SEQ ID No. : 126)
27 D177-BF7(SEQ ID No. : 128) ; 185-BD2(SEQ ID No. : 140)
28 D73A-AG3(SEQ ID No. : 130)
29 D70A-AA12(SEQ ID No. : 132) ; D176-BF2(SEQ ID No. : 86)
30 D176-BC3(SEQ ID No. : 146)
31 D176-BB3(SEQ ID No. : 148)
32 D186-AH4(SEQ ID No. : 6)
实施例 11 : 全长克隆的相关氨基酸序列同一性
推测实施例 5 中克隆的烟草全长基因核酸序列的完整氨基酸序列。通过 3 个保守 p450 结构域基序的存在来鉴定细胞色素 p450 基因, 所述 3 个保守 p450 结构域基序对应于 羧基末端的 UXXRXXZ、 PXRFXF 或 GXRXC, 其中 U 是 E 或 K, X 是任何氨基酸, Z 是 P、 T、 S 或 M。 还注意到这些克隆中的两个, D130-AA1 和 D101-BA2 几乎是完整的但缺少合适的终止子, 然 而它们都含有上述的 3 个 p450 细胞色素结构域。用 BLAST 程序鉴定所有 p450 具有的氨 基酸同一性, 把它们的全长序列彼此比较并且和已知的烟草基因比较。该程序使用了 NCBI 特定的 BLAST 工具 ( 两序列比对 (Align two sequences, bl2seq), http://www.ncbi.nlm. nih.oov/blast/bl2sea7bl2.html)。在没有过滤器的情况下用 BLASTN 比对两个核酸序列, 用 BLASTP 比对氨基酸序列。基于它们的氨基酸同一性百分比, 将各序列分到同一性组群 中, 其中各组群中包括的成员与另一个成员至少具有 85%同一性。氨基酸同一性为 90%或 更大的那些序列观察到优选的分组, 更优选的分组具有 95%氨基酸同一性或更大, 最优选 的分组具有氨基酸同一性为 99%或更大的那些序列。 采用这些标准, 鉴定出 25 个不同的组 群, 示于表 III。
在表 III 用于氨基酸同一性的参数范围内, 发现 3 个组群与已知烟草基因具有 大于 85 %或更大的同一性。第 5 组的成员与先前 Ralston 等提交的 GenBank 序列 GI : 14423327( 或 AAK62346) 具有高达 96%的全长序列氨基酸同一性。第 23 组与 Ralston 等 提交的 GI : 14423328( 或 AAK62347) 有高达 93%的氨基酸同一性。第 24 组与 Ralston 等 提交的 GI : 14423318( 或 AAK62343) 有 92%的氨基酸同一性。
表 III : 烟草全长 p450 基因的氨基酸序列同一性组群
1 D208-AD9(SEQ.ID.No.224) ; D120-AH4(SEQ.ID.No.180) ; D121-AA8(SEQ.ID.No.182), D122-AF10(SEQ.ID.No.184) ; D103-AH3(SEQ.ID.No.222) ; D208-AC8(SEQ. ID.No.218) ; D-235-ABI(SEQ.ID.No.246)
2 D244-AD4(SEQ.ID.No.250) ; D244-AB6(SEQ.ID.No.274) ; D285-AA8 ; D285-AB9 ; D268-AE2(SEQ.ID.No.270)
3 D100A-AC3(SEQ.ID.No.168) ; D100A-BE2
4 D205-BE9(SEQ.ID.No.276) ; D205-BG9(SEQ.ID.No.202) ; D205-AH4(SEQ. ID.No.294)
5 D259-AB9(SEQ.ID.No.260) ; D257-AE4(SEQ.ID.No.268) ; D147-AD3(SEQ. ID.No.194)
6 D249-AE8(SEQ.ID.No.256) ; D-248-AA6(SEQ.ID.No.254)
7 D233-AG7(SEQ.ID.No.266 ; D224-BD11(SEQ.ID.No.240) ; DAF10
8 D105-AD6(SEQ.ID.No 172) ; D215-AB5(SEQ.ID.No 220) ; D135-AE1(SEQ. ID.No.190)
9 D87A-AF3(SEQ.ID.No.216), D210-BD4(SEQ.ID.No.262)
10 D89-AB1(SEQ.ID.No.150) ; D89-AD2(SEQ.ID.No.152) ; 163-AG11(SEQ. ID.No.198) ; 163-AF12(SEQ.ID.No.196) 11 D267-AF10(SEQ.ID.No.296) ; D96-AC2(SEQ.ID.No.160) ; D96-AB6(SEQ. ID.No.158) ; D207-AA5(SEQ.ID.No.204) ; D207-AB4(SEQ.ID.No.206) ; D207-AC4(SEQ. ID.No.208)
12 D98-AG1(SEQ.ID.No.164) ; D98-AA1(SEQ.ID.No.162)
13 D209-AA12(SEQ.ID.No.212) ; D209-AA11 ; D209-AH10(SEQ.ID.No.214) ; D209-AH12(SEQ.ID.No.232) ; D90a-BB3(SEQ.ID.No.154)
14 D129-AD10(SEQ.ID.No.188) ; D104A-AE8(SEQ.ID.No.170)
15 D228-AH8(SEQ.ID.No.244) ; D228-AD7(SEQ.ID.No.241), D250-AC11(SEQ. ID.No.258) ; D247-AH1(SEQ.ID.No.252)
16 D128-AB7(SEQ.ID.No.186) ; D243-AA2(SEQ.ID.No.248) ; D125-AF11(SEQ. ID.No.228)
17 D284-AH5(SEQ.ID.No.298) ; D110-AF12(SEQ.ID.No.176)
18 D221-BB8(SEQ.ID.No.234)
19 D222-BH4(SEQ.ID.No.236)
20 D134-AE11(SEQ.ID.No.230)
21 D109-AH8(SEQ.ID.No.174)
22 D136-AF4(SEQ.ID.No.278)
23 D237-AD1(SEQ.ID.No.226)
24 D112-AA5(SEQ.ID.No.178)
25 D283-AC1(SEQ.ID.No.272)
根据靠近羧基末端的 UXXRXXZ p450 结构域和 GXRXC p450 结构域之间高度保守的 氨基酸同源性进一步将这些全长基因分组。如图 3 所示, 比对各克隆保守结构域彼此之间 的序列同源性, 并将这些克隆分到不同的同源性组群中。 在几种情况下, 虽然某克隆的核酸
序列是不同的, 但该区域的氨基酸序列是相同的。氨基酸同一性为 90%或更大的那些序列 观察到优选的分组, 更优选的分组具有 95%氨基酸同一性或更大, 最优选的分组具有氨基 酸同一性为 99%或更大的那些序列。 最终的分组类似于根据这些克隆的完整氨基酸序列的 同一性百分比而做的分组, 第 17 组除外 ( 表 III), 它被分为 2 个不同的组。
在表 IV 用于氨基酸同一性的参数范围内, 发现 3 个组群与已知烟草基因具有 90% 或更大的同一性。第 5 组的成员与先前 Ralston 等提交的 GenBank 序列 GI : 14423326( 或 AAK62346) 具有高达 93.4%的全长序列氨基酸同一性。第 23 组与 Ralston 等提交的 GI : 14423328( 或 AAK62347) 有高达 91.8%的氨基酸同一性。第 24 组与 Ralston 等提交的 GI : 14423318( 或 AAK62342) 有 98.8%的同一性。
表 IV : 烟草 p450 基因保守结构域之间区域的氨基酸序列同一性组群
1 1 D208-AD9(SEQ.ID.No.224) ; D120-AH4(SEQ.ID.No.180) ; D121-AA8(SEQ. ID.No.182), D122-AF10(SEQ.ID.No.184) ; D103-AH3(SEQ.ID.No.222) ; D208-AC8(SEQ. ID.No.218) ; D-235-ABI(SEQ.ID.No.246)
2 D244-AD4(SEQ.ID.No.250) ; D244-AB6(SEQ.ID.No.274) ; D285-AA8 ; D285-AB9 ; D268-AE2(SEQ.ID.No.270)
3 D100A-AC3(SEQ.ID.No.168) ; D100A-BE2
4 D205-BE9(SEQ.ID.No.276) ; D205-BG9(SEQ.ID.No.202) ; D205-AH4(SEQ. ID.No.294)
5 D259-AB9(SEQ.ID.No.260) ; D257-AE4(SEQ.ID.No.268) ; D147-AD3(SEQ. ID.No.194)
6 D249-AE8(SEQ.ID.No.256) ; D-248-AA6(SEQ.ID.No.254)
7 D233-AG7(SEQ.ID.No.266 ; D224-BD11(SEQ.ID.No.240) ; DAF10
8 D105-AD6(SEQ.ID.No.172) ; D215-AB5(SEQ.ID.No.220) ; D135-AE1(SEQ. ID.No.190)
9 D87A-AF3(SEQ.ID.No.216), D210-BD4(SEQ.ID.No.262)
10 D89-AB1(SEQ.ID.No.150) ; D89-AD2(SEQ.ID.No.152) ; 163-AG11(SEQ. ID.No.198) ; 163-AF12(SEQ.ID.No.196)
11 D267-AF10(SEQ.ID.No.296) ; D96-AC2(SEQ.ID.No.160) ; D96-AB6(SEQ. ID.No.158) ; D207-AA5(SEQ.ID.No.204) ; D207-AB4(SEQ.ID.No.206) ; D207-AC4(SEQ. ID.No.208)
12 D98-AG1(SEQ.ID.No.164) ; D98-AA1(SEQ.ID.No.162)
13 D209-AA12(SEQ.ID.No.212) ; D209-AA11 ; D209-AH10(SEQ.ID.No.214) ; D209-AH12(SEQ.ID.No.232) ; D90a-BB3(SEQ.ID.No.154)
14 D129-AD10(SEQ.ID.No.188) ; D104A-AE8(SEQ.ID.No.170)
15 D228-AH8(SEQ.ID.No.244) ; D228-AD7(SEQ.ID.No.241), D250-AC11(SEQ. ID.No.258) ; D247-AH1(SEQ.ID.No.252)
16 D128-AB7(SEQ.ID.No.186) ; D243-AA2(SEQ.ID.No.248) ; D125-AF11(SEQ. ID.No.228)
17 D284-AH5(SEQ.ID.No.298) ; D110-AF12(SEQ.ID.No.176)18 D221-BB8(SEQ.ID.No.234)
19 D222-BH4(SEQ.ID.No.236)
20 D134-AE11(SEQ.ID.No.230)
21 D109-AH8(SEQ.ID.No.174)
22 D136-AF4(SEQ.ID.No.278)
23 D237-AD1(SEQ.ID.No.226)
24 D112-AA5(SEQ.ID.No.178)
25 D283-AC1(SEQ.ID.No.272)
26 D110-AF12(SEQ.ID.No.176)
实施例 12 : 缺少一个或多个烟草细胞色素 p450 特异性结构域的烟草细胞色素 p450 克隆
4 个克隆与表 III 报道的其它烟草细胞色素基因具有高度的核酸同源性, 核酸同 源性介于 90%至 99%之间。 这 4 个克隆包括 D136-AD5、 D138-AD12、 D243-AB3 和 D250-AC11。 然而, 因为核苷酸移码框的原因, 这些基因不含有细胞色素 p450C- 末端的 3 个结构域中的 一个或多个, 因此排除在表 III 和 IV 所示的同一性组群之外。
有一个克隆, D95-AG1 的氨基酸同一性不含有第 3 个结构域 GXRXC, 该结构域用来 对表 III 或表 IV 中的 p450 烟草基因分组。该克隆的核酸同源性与其它烟草细胞色素基因 的同源性低。该克隆代表了烟草中细胞色素 p450 基因的一个新的、 不同的组群。
实施例 13 : 烟草细胞色素 p450 片段和克隆在改变烟草性质调控方面的应用
烟草 p450 核酸片段或整个基因可用于鉴定和选择烟草表型或组成有所改变的植 株, 更重要的是, 可用于鉴定和选择代谢物发生了变化的植株。用例如以反义方向 ( 用于下 调 ) 或有义方向 ( 用于上调 ) 将掺入选自本文所述的核酸片段或全长基因的多种转化系统 来产生转基因烟草植物。对于全长基因的过量表达, 编码本文所述全长基因的完整或功能 性部分或氨基酸序列的任何核酸序列都是理想的, 它们可有效增加某个酶的表达并因此在 烟草中产生表型效果。 通过一系列的回交获得纯合烟草品系, 并评价其表型变化, 包括但不 限于, 用本领域一般技术人员可获得的常用技术来分析内源性 p450RNA、 转录物、 p450 表达 的肽和植物代谢物的浓度。
烟草植物中表现出来的变化提供了感兴趣的所选基因的功能性作用的信息, 或者 可用作优选的烟草植物品种。
实施例 14 : 鉴定乙烯处理的转化株品系中诱导的基因
采 用 高 密 度 寡 核 苷 酸 阵 列 技 术, Affymetrix 基 因 芯 片(Affymetrix Inc., Santa Clara, CA) 阵列来进行基因表达的定量和高度平行性检测。在 使用该技术时, 通过在固体表面上直接合成寡核苷酸来制作核酸阵列。这种固相化学能够 产生含有数十万个寡核苷酸探针的阵列, 这些寡核苷酸探针以极高的密度压缩在芯片上, 这种芯片称为 可由一个杂交同时筛选几千个基因。每个基因通常由一组的 11-25 对探针来代表, 这取决于基因的大小。设计探针以使其具有最大的敏感性、 特异性和 可重复性, 从而使其总是可以分辨出特异性和背景信号以及密切相关的靶序列。
Affymetrix 基因芯片杂交试验包括下列步骤 : 设计和制备阵列, 从分离自生物样 品的 RNA 中制备荧光标记的靶, 标记的靶与基因芯片杂交, 筛选芯片, 分析扫描的图像, 产生基因表达谱。
A.Affymetrix 基因芯片的设计和定制
定 制 A f f y m e t r i x I n c . ( S a n t a C l a r a ,C A ) 生 产 的 G e n e C h i p CustomExpressAdvantage Array。芯片的大小是 18 微米, 芯片的格式是 100-2187, 可容纳 528 组探针 (11,628 个探针 )。除了来自 GenBank 的核酸序列之外, 所有序列都选自我们之 前鉴定出的烟草克隆, 所有探针都是定制设计的。共选择了 400 个烟草基因或片段包括在 基因芯片中。所选择的寡核苷酸的序列是基于基因 3’ 末端的独特区域。所选择的核酸序 列由如 ( 本专利申请 ) 所述从烟草中克隆的 56 个全长 p450 基因和 71 个 p450 片段组成。 其它烟草序列包括 270 个烟草 EST, 用 Clontech SSH 试剂盒 (BD Biosciences, Palo Alto, CA) 从抑制差减文库产生了这些 EST。在这些基因中, 一些寡核苷酸序列选自 GenBank 所列 的细胞色素 p450 基因。多达 25 个探针用于每个全长基因, 11 个探针用于每个片段。因为 缺乏独特的、 高质量的探针, 有些克隆所用的探针数目要少。 中也包括了合适 的对照序列。
探针阵列是 25 聚寡核苷酸, 用基于半导体的光刻蚀法结合固相化学合成技术将 这些寡核苷酸直接合成到玻璃片上。各阵列含有多达 100,000 个不同的寡核苷酸探针。因 为寡核苷酸探针合成在阵列中已知的位置上, 所以可用 Affymetrix Microarray 软 件将杂交模式和信号强度解释为基因同一性和相对表达水平。 各探针对由一个完全配对的 寡核苷酸和一个错配的寡核苷酸组成。完全配对的探针具有与特定基因准确互补的序列, 因此可检测该基因的表达。错配探针在其碱基的中心位置有一个碱基置换, 因此区别于完 全配对的探针, 所述的一个碱基置换干扰了靶基因转录物的结合。错配产生非特异性的杂 交信号或背景信号, 将该信号与完全配对的寡核苷酸检测到的信号比较。
B. 样品制备
杂交试验由 Genome Explorations, Inc.(Memphis, TN) 进行, 杂交中所用的 RNA 样 品由 6 对受乙烯诱导的非转化株 / 转化株等基因系组成。
这些样品包括 1 对 4407-25/4407-33 未处理的白肋烟草样品, 3 对乙烯处理的 4407-25/4407-33 样品, 1 对乙烯处理的深色烟草 NL Madole/181 和 1 对乙烯处理的白肋变 种 PBLB01/178。乙烯处理如实施例 1 所述。
用改良的酸酚和氯仿方法从上述乙烯处理和未处理的叶片中提取总 RNA。改良的 方法是用 1 克组织进行研磨, 随后在 5 毫升加入了 5 毫升苯酚 (pH5.5) 和 5 毫升氯仿的提 取缓冲液 (100mM Tris-HCl, pH 8.5 ; 200mMNaCl ; 10mM EDTA ; 0.5% SDS) 中涡旋。 将提取的 样品离心, 保留上清。该提取步骤再重复 2-3 次直到上清变得澄清。加入约 5 毫升氯仿以 除去痕量的苯酚。加入 3 倍体积的 ETOH 和 1/10 体积的 3M NaOAc(pH5.2) 以从混合的上清 组分中沉淀 RNA, 在 -20℃存贮 1 小时。转移到 Corex 玻璃容器中以后, 在 4℃ 9,000RPM 离 心 RNA 组分 45 分钟。离心下来的团块用 70%乙醇洗涤, 4℃ 9,000RPM 离心 5 分钟。团块 干燥以后, 将 RNA 团块溶解在 0.5 毫升不含 Rnase 的水中。RNA 团块溶解在 0.5 毫升不含 Rnase 的水中。分别用变性甲醛凝胶和分光光度计分析总 RNA 的质量和数量。3-5μg/μl 的总 RNA 样品送至 Genomeexplorations, inc. 进行杂交试验。
C. 杂交、 检测和数据输出
如下所述制备标记的 RNA 材料。 按生产商的方法用 SuperScript 双链 cDNA 合成试剂盒 (Gibco Life Technologies) 和寡 -dT24-T7(5′ -GGC CAGTGA ATT GTA ATA CGA CTC ACT ATA GGG AGGCGG-3′ ) 引物从 5-15μg 总 RNA 中合成第一链和第二链 cDNA。
T7 启 动 子 连 接 的 双 链 cDNA 作 为 模 板, 用 T7RNA 转 录 物 标 记 试 剂 盒 (ENZO Diagnostics Inc.) 通过体外转录同时合成并用生物素化的 UTP 和 CTP 来标记 cRNA。简 言之, 用 70 %乙醇洗涤前述步骤中合成的双链 cDNA, 重新悬浮在 22μl 不含 RNA 酶的水 中。cDNA 与下列物质一起 37℃温育 5 小时 : 10X 的反应缓冲液、 生物素标记的核糖核苷酸、 DTT、 RNA 酶抑制剂混合物各 4μl, 以及 2μl 20X T7RNA 多聚酶。经过 CHROMA SPIN-100 柱 (Clontech) 并在 -20℃沉淀 1 小时至过夜, 将标记上的 RNA 与未掺入的核糖核苷酸分离。
如下所述进行寡核苷酸阵列杂交和分析。将 RNA 团块重新悬浮在 10μl 不含 RNA 酶的水中, 10.0μg 在 200mM Tris- 乙酸, pH 8.1, 500mM KOAc, 150mM MgOAc 中 95 ℃ 下 用 热 和 离 子 介 导 的 水 解 片 段 化 35 分 钟。 片 段 化 的 cRNA 与 HG_U95Av2 寡 核 苷 酸 阵 列 (Affymetrix)45 ℃杂交 16 小时, 该寡核苷酸阵列上含有约 12,500 个经注释的全长 基因以及设计用于代表 EST 序列的其它探针组。用 6X SSPE(0.9M NaCl, 60mM NaH2PO4, 6mM EDTA+0.01 % Tween20)25 ℃ 下 洗 涤 阵 列, 然 后 50 ℃ 下 用 100mM MES、 0.1M[Na+]、 0.01% Tween20 进行严格条件下的洗涤。以藻红素 (phycoerythrein) 偶联的链霉亲和素 (Molecular Probes) 对阵列染色, 用激光共聚焦扫描仪 (Hewlett-Packard) 来测定荧光强 度。用 Microarray 软件 (Affymetrix) 分析扫描的图像。对于所用的所有阵列, 通过将某 阵列上所有基因的平均荧光强度校正 (scaling) 到恒定的目标强度 (250) 来使上样和染色 中的差异标准化。按用户指南用 Microarray Suite5.0(Affymetrix) 进行数据分析。各基 因的信号强度计算为平均强度差异, 以 [ ∑ (PM-MM)/( 探针对的数目 )] 代表, 其中 PM 和 MM 标示完全配对和错配的探针。
D. 数据分析和结果
Genome Explorations 的检测仪器产生的表达报告证实, 12 组杂交是成功的。该 报告上主要的参数包括噪音、 校正因子、 背景、 总探针组、 存在和不存在的探针组的数目和 百分比、 管家基因对照的信号强度。然后, 用 GCOS 结合其它 Microsoft 的软件来分析和表 示数据。分析了处理的各对之间的信号对比。经过不同处理的基因和片段所对应的各探针 的总体数据被编译, 分析编译的表达数据, 如变化呼叫 (call of the changes) 和信号 LOG 2 比例变化。
基因芯片技术的一个常规用途是发现在不同组织中有差异性表达的基因。在 本发明中, 通过成对的转化株和非转化株烟草品系, 包括 4407-25/4407-33 白肋变种、 PBLB01/178 白肋变种和 NL Madole/181 深色烟草变种, 测定了乙烯处理引起的遗传表达变 化。这些分析只检测由于生物学变化而使其表达发生了显著改变的那些基因。这些分析采 用了倍数 (Fold) 变化 ( 信号比率 ) 作为鉴定受诱导基因的重要标准。还考虑了其它参数, 如信号密度、 存在 / 不存在呼叫。
在分析了转化株和非转化株样品对中约 400 个基因表达差异的数据之后, 基于信 号强度的结果说明, 与非转化株品系相比, 只有两个基因 D121-AA8 和 D120-AH4 在转化株品 系中可重复地被乙烯处理所诱导。 如下所述表示这些数据, 以说明这些基因的差异性表达。 如表 V 所示, 在转化株品系, 例如白肋烟草变种 4407-33 中, 某基因的信号测定为与相关的 非转化株等基因品系 4407-25 的比率。在没有乙烯诱导时, 对于所有基因, 转化株与非转化株信号的比率都接近于 1.00。用 3 种独立的分析方法对等基因白肋品系的分析证明, 受乙 烯诱导时, 相对于非转化株品系, 两个基因 D121-AA8 和 D120-AH4 在转化株品系中受到诱 导。这些基因是彼此高度同源的, 约有 99.8%或更大的核酸序列同源性。如表 V 所示, 它们 在转化株品系中的相对杂交信号约比相应的非转化株品系中高 2-12 倍。相比较的, 根据两 个肌动蛋白样对照克隆 ( 内部对照 ) 标准化的比例, 没有发现它们在转化株品系中受诱导。 此外, 片段 D35-BG11( 其编码区的序列完全包含在 D121-AA8 和 D120-AH4 基因中 ) 在成对 的等基因转化株和非转化株品系的相同样品中被高水平诱导。 白肋烟草变种的另一个等基 因对, PBLB01 和 178 被显示具有相同的基因 D121-AA8 和 D120-AH4, 乙烯处理时在转化株中 受诱导。此外, D121-AA8 和 D120-AH4 基因优先在等基因深色烟草对 NL Madole 和 181 的 转化株品系中受诱导, 证明这些基因在转化株品系中的乙烯诱导不限于白肋烟草变种。在 所有情况下, 相对于相应的非转化株品系, D35-BG11 片段在转化株品系中都是受诱导最高 的一个。
表V: 乙烯处理的转化株和非转化株品系中克隆诱导的比较
实施例 15 : 克隆相关的 D35-BG11 全长基因
基因芯片杂交基于 3′反转录 (cRNA)。选自基因 3′端 ( 在下游 1000 个核苷酸的 区域中 ) 的探针在基因芯片上合成。因此, 为了获得 D121-AA8 和 D120-AH4 克隆的所有可 能的变化形式, 用 5′序列从烟草 cDNA 文库中进行了另外的克隆。
全长基因克隆自如实施例 5 所述从乙烯处理的 4407-33 组织中构建的 cDNA 文库。 采用如下所述的聚合酶链式反应法。基于 D121-AA8 基因的 3′序列 ( 包括非翻译区部分 ) 设计反向引物。D121-P2 引物 5′ -AGC AAG ATG ATCTTA GGT TTTAA-3′和 D 121-R-2 引 物 5′ -CAA GCA AGA TGA TCT TAG GTT TTA ATA AAG CTC AGGT-3′。T3 引物 (5′ CAA TTA ACC CTC ACTAAA GGG 3′ ) 位于质粒上插入片段的上游, 用作正向引物。 产生的 PCR 产 物进行琼脂糖电泳, 切下高分子量的相应条带, 纯化、 克隆并测序。用于克隆和测序的方法 如实施例 4 所述。测序和鉴定了 9 个新的克隆, 它们是 D425-AB10、 D425-AB11、 D425-AC9、 D425-AC10、 D425-AC11、 D425-AG11、 D425-AH7、 D425-AH11 和 D427-AA5。观察到这些克隆中 的每一个都与克隆 D121-AA8 和 D120-AH4 具有 99%或更大的核酸序列同一性。
实施例 16 : 烟草转化株品系中微粒体烟碱去甲基酶的乙烯诱导
如下所述, 对乙烯处理和非处理的成对的转化株和非转化株中富含微粒体的组分 中去甲基酶的酶活进行生化分析。
A. 微粒体的制备
在 4℃分离微粒体。 在由 50mM N-(2- 羟基乙基 ) 哌嗪 -N′ -(2- 乙磺酸 )(HEPES), pH 7.5, 3mM DL- 二硫苏糖醇 (DTT) 和蛋白酶抑制剂 Cocktail(Roche)(1 片 /50 毫升 ) 组 成的缓冲液中提取烟草叶片。粗提物通过 4 层粗棉布 (cheesecloth) 过滤以除去未打碎的 组织, 滤出液 20,000x g 离心 20 分钟以除去细胞碎片。将上清以 100,000x g 超离心 60 分 钟, 得到的上清即含有微粒体。将微粒体组分悬浮在提取缓冲液中, 进行超离心步骤, 其中 提取缓冲液中采用 0.5M 的不连续蔗糖梯度。将纯化的微粒体重新悬浮在添加了 10% (w/ v) 甘油作为低温保护剂的提取缓冲液中。将此微粒体制品存贮在液氮冷藏罐中直到使用。
B. 蛋白浓度测定
用溶解在丙酮中的 10%三氯乙酸 (TCA)(w/v) 沉淀微粒体蛋白, 用 RC DC 蛋白检测 试剂盒 (BIO-RAD) 按生产商的方法测定微粒体的蛋白浓度。
3. 烟碱去甲基酶活性试验 DL- 烟碱 ( 吡咯烷 -2-14C) 获得自 Moravek Biochemicals, 比活为 54mCi/mmol。 氯 丙嗪 (CPZ) 和氧化的细胞色素 (Cyt.C)( 二者均为 P450 抑制剂 ) 购自 Sigma。还原型烟酰 胺腺嘌呤二核苷酸磷酸盐 (NADPH) 是细胞色素 P450 的典型电子供体, 它通过 NADPH : 细胞 色素 P450 还原酶供应电子。在对照组的温育中去掉了 NADPH。常规的酶活试验由微粒体 蛋白 ( 约 2mg/ml)、 6mMNADPH、 55μM 14C 标记的烟碱组成。CPZ 和 Cyt.C 的使用浓度分别是 1mM 和 100μM。反应在 25℃进行 1 小时, 加入 300μl 甲醇到各 25μl 反应混合物中终止反 应。离心后, 用 Inertsil ODS-33p(150x 4.6mm) 柱 (Varian) 以反相高效液相色谱 (HPLC) 系统 (Agilent) 分离 20μl 的甲醇提取物。等梯度 (isocratic) 流动相是甲醇、 50mM 磷 酸钾缓冲液 (pH6.25) 的混合物, 其中二者的比例为 60 ∶ 40(v/v), 流速为 1 毫升 / 分钟。 通过与真正的未标记的降烟碱的峰进行比较, 收集降烟碱的峰, 用 2900 tri-carb Liquid Scintillation Counter(LSC)(Perkin Elmer) 进行定量。基于 1 小时温育中产生的 14C 标 记的降烟碱来计算烟碱去甲基酶的活性。
从乙烯处理和未处理的成对的白肋转化株 (4407-33 品系 ) 和非转化株 (4407-25 品系 ) 烟草品系获得样品。所有未处理的样品都没有任何可检测到的微粒体烟碱去甲基酶 活性。相反, 发现从乙烯处理的转化株品系获得的微粒体样品中含有大量的烟碱去甲基酶 活性。已显示, 烟碱去甲基酶受 P450 特异性抑制剂的抑制, 证明该去甲基酶活性与 P450 微 粒体来源的酶一致。
表 VI 显示了从白肋转化株烟草品系中获得的一组典型的酶活结果。相反的是, 从 乙烯处理的非转化株烟草中获得的样品不含有任何烟碱去甲基酶活性。这些结果证明, 在 转化株品系中烟碱去甲基酶受乙烯处理的诱导, 但在相应的等基因非转化株品系中不受诱 导。对于成对的等基因深色烟草品系获得了类似的结果, 其中在转化株品系中微粒体烟碱 去甲基酶活性被诱导, 但在相应的非转化株品系中未检测到该酶被诱导。这些结果都证明 了, 微粒体烟碱去甲基酶在转化株品系中受乙烯处理的诱导, 但在相应的等基因非转化株 品系中不受诱导。那些衍生自 P450 基因并且优先在转化株品系 ( 相对于相应的非转化株
品系 ) 中被诱导的基因是编码烟碱去甲基酶的候选基因。
表 VI : 乙烯诱导的白肋转化株和非转化株品系中的去甲基酶活性
考虑到本发明前面的详细描述, 预期在本发明的实施中本领域技术人员可进行很 多改进和变化。因此, 这些改进和变化都包括在下面权利要求的范围内。
34102321641 A CN 102321648
序列表1/206 页
35102321641 A CN 102321648序列表2/206 页
36102321641 A CN 102321648序列表3/206 页
37102321641 A CN 102321648序列表4/206 页
38102321641 A CN 102321648序列表5/206 页
39102321641 A CN 102321648序列表6/206 页
40102321641 A CN 102321648序列表7/206 页
41102321641 A CN 102321648序列表8/206 页
42102321641 A CN 102321648序列表9/206 页
43102321641 A CN 102321648序列表10/206 页
44102321641 A CN 102321648序列表11/206 页
45102321641 A CN 102321648序列表12/206 页
在第 6 个相关的方面, 根据彼此的同一性对那些含有大于 85%和更高的氨基酸序 列同一性的全长基因进行分组。代表性的氨基酸组和各自的种类示于表 III。
在第 7 个方面, 本发明涉及如 SEQ.ID.NO.299-357 所示片段的氨基酸序列。
在第 8 个相关的方面, 根据它们在第一细胞色素 p450 结构域 UXXRXXZ 到第 3 细胞 色素结构域 GXRXO 的对应区域的互相同一性, 对那些含有大于 90%和更高的氨基酸序列同 一性的片段进行分组, 其中 U 是 E 或 K, X 是任何氨基酸, Z 是 R、 T、 S 或 M。代表性的氨基酸 组和各自的种类示于表 IV。
在第 9 个相关的方面, p450 酶在烟草植物中的减少或消除或过度表达可使用 RNA 病毒系统瞬时实现。
评价得到的转化或感染的植物的表型改变, 包括 ( 但不限于 ) 使用本领域普通技 术人员常规可用的技术来分析内源性 p450RNA 转录物、 p450 表达肽和植物代谢物的浓度。
在第 10 个方面, 本发明也涉及产生具有改变的 p450 酶活性水平的转基因烟草谱 系。根据本发明, 这些转基因谱系含有有效地特定酶表达减少、 沉默或增加, 从而在烟草中 导致表型效应的核酸序列。 这种核酸序列包括 SEQ.ID.NO.1、 3、 5、 7、 9、 11、 13、 15、 17、 19、 21、 23、 25、 27、 29、 31、 33、 35、 37、 39、 41、 43、 45、 47、 49、 51、 53、 55、 57、 59、 61、 63、 65、 67、 69、 71、 73、 75、 77、 79、 81、 83、 85、 87、 89、 91、 95、 97、 99、 101、 103、 105、 107、 109、 111、 113、 115、 117、 119、 121、 123、 125、 127、 129、 131、 133、 135、 137、 139、 143、 145、 147、 149、 151、 153、 155、 157、 159、 161、 163、 165、 167、 169、 171、 173、 175、 177、 179、 181、 183、 185、 187、 189、 191、 193、 195、 197、 199、 201、 203、 205、 207、 209、 211、 213、 215、 217、 219、 221、 223、 225、 227、 229、 231、 233、 235、 237、 239、 241、 243、 245、 247、 249、 251、 253、 255、 257、 259、 261、 263、 265、 267、 269、 271、 273、 275、 277、 279、 281、 283、 285、 287、 289、 291、 293、 295、 297、 299、 301、 303、 305、 307、 309、 311、 313 和 315。
在本发明非常重要的第 11 方面, 与对照植物相比, 含有本发明核酸的植物栽培品 系在使用全长基因或其片段的下调能力或使用全长基因或其片段的过度表达能力上具有 改变的代谢物特性。
在本发明的第 12 方面, 含有本发明核酸的植物栽培品系具有对特定外源性化学 物质或植物害虫耐受的用途, 所述植物使用全长基因或其片段以更改来源于植物或植物以 外的代谢物的生物合成或降解。这种核酸序列包括 SEQ.ID.NO.1、 3、 5、 7、 9、 11、 13、 15、 17、 19、 21、 23、 25、 27、 29、 31、 33、 35、 37、 39、 41、 43、 45、 47、 49、 51、 53、 55、 57、 59、 61、 63、 65、 67、 69、 71、 73、 75、 77、 79、 81、 83、 85、 87、 89、 91、 95、 97、 99、 101、 103、 105、 107、 109、 111、 113、 115、 117、 119、 121、 123、 125、 127、 129、 131、 133、 135、 137、 139、 143、 145、 147、 149、 151、 153、 155、 157、 159、 161、 163、 165、 167、 169、 171、 173、 175、 177、 179、 181、 183、 185、 187、 189、 191、 193、 195、 197、 199、 201、 203、 205、 207、 209、 211、 213、 215、 217、 219、 221、 223、 225、 227、 229、 231、233、 235、 237、 239、 241、 243、 245、 247、 249、 251、 253、 255、 257、 259、 261、 263、 265、 267、 269、 271、 273、 275、 277、 279、 281、 283、 285、 287、 289、 291、 293、 295、 297、 299、 301、 303、 305、 307、 309、 311、 313 和 315。
在第 13 个方面, 本发明涉及筛选含有与所述核酸序列具有实质性核酸同一性的 基因的植物, 优选烟草。使用本发明有利于鉴定和选择含有精确的或实质性同一性的核酸 序列的植物, 其中这种植物是传统或转基因品种的育种程序、 诱变程序或天然存在的不同 植物种群的一部分。 可使用核酸探针结合核酸检测方法, 包括 ( 但不限于 ) 核酸杂交和 PCR 分析, 通过评价植物的核酸物质来筛选实质性核酸同一性的植物。核酸探针可由对应于以 下 SEQ ID 的所述核酸序列或其片段构成 : SEQ ID 1、 3、 5、 7、 9、 11、 13、 15、 17、 19、 21、 23、 25、 27、 29、 31、 33、 35、 37、 39、 41、 43、 45、 47、 49、 51、 53、 55、 57、 59、 61、 63、 65、 67、 69、 71、 73、 75、 77、 79、 81、 83、 85、 87、 89、 91、 95、 97、 99、 101、 103、 105、 107、 109、 111、 113、 115、 117、 119、 121、 123、 125、 127、 129、 131、 133、 135、 137、 139、 143、 145、 147、 149、 151、 153、 155、 157、 159、 161、 163、 165、 167、 169、 171、 173、 175、 177、 179、 181、 183、 185、 187、 189、 191、 193、 195、 197、 199、 201、 203、 205、 207、 209、 211、 213、 215、 217、 219、 221、 223、 225、 227、 229、 231、 233、 235、 237、 239、 241、 243、 245、 247、 249、 251、 253、 255、 257、 259、 261、 263、 265、 267、 269、 271、 273、 275、 277、 279、 281、 283、 285、 287、 289、 291、 293、 295、 297、 299、 301、 303、 305、 307、 309、 311、 313 和 315。 在第 14 个方面, 本发明涉及鉴定与所述核酸序列具有实质性氨基酸同一性的植 物基因, 优选烟草。可使用核酸探针结合核酸检测方法, 包括 ( 但不限于 ) 核酸杂交和 PCR 分析, 通过筛选植物 cDNA 文库来鉴定植物基因, 包括 cDNA 和基因组克隆, 优选烟草的 cDNA 和基因组克隆。核酸探针可由对应于以下 SEQ ID 的核酸序列或其片段构成 : 1、 3、 5、 7、 9、 11、 13、 15、 17、 19、 21、 23、 25、 27、 29、 31、 33、 35、 37、 39、 41、 43、 45、 47、 49、 51、 53、 55、 57、 59、 61、 63、 65、 67、 69、 71、 73、 75、 77、 79、 81、 83、 85、 87、 89、 91、 95、 97、 99、 101、 103、 105、 107、 109、 111、 113、 115、 117、 119、 121、 123、 125、 127、 129、 131、 133、 135、 137、 139、 143、 145 和 147。
在其它第 15 个方面, 可使用针对部分或全部所述氨基酸序列的抗体来筛选表达 肽的 cDNA 表达文库。这种氨基酸序列包括 SEQ ID 2、 4、 8、 9、 10、 12、 14、 16、 18、 20、 22、 24、 26、 28、 30、 32、 34、 36、 38、 40、 42、 44、 46、 48、 50、 52、 54、 56、 58、 60、 62、 64、 66、 68、 70、 72、 74、 76、 78、 80、 82、 84、 86、 88、 90、 92、 96、 98、 100、 102、 104、 106、 108、 110、 112、 114、 116、 118、 120、 122、 124、 126、 128、 130、 132、 134、 136、 138、 140、 144、 146、 148。
在第 16 个重要的方面, 本发明也涉及产生过度表达 p450 酶活性水平的转基因烟 草谱系。 根据本发明, 这些转基因谱系包括编码全长基因的氨基酸序列的所有核酸序列, 所 述基因有效地增加特定酶的表达从而导致烟草中的表型效应。这种氨基酸序列包括 SEQ. ID.150、 152、 154、 156、 158、 160、 162、 164、 166、 168、 170、 172、 174、 176、 178、 180、 182、 184、 186、 188、 190、 192、 194、 196、 198、 200、 202、 204、 206、 208、 210、 212、 214、 216、 218、 220、 222、 224、 226、 228、 230、 232、 234、 236、 238、 240、 242、 244、 246、 248、 250、 252、 254、 256、 258、 260、 262、 264、 266、 268、 270、 272、 274、 276、 278、 280、 282、 284、 286、 288、 290、 292、 294、 296、 298、 300、 302、 304、 306、 308、 310、 312、 314 和 316。
也提供了含有降烟碱含量降低的烟叶 ( 叶片和 / 或茎 ) 的烟草产品。该烟草产品 包括烟草 ( 含有叶片和 / 或茎的烟叶 ), 该烟草来自含有本文所述序列或消除或抑制了编码
在其它第 15 个方面, 可使用针对部分或全部所述氨基酸序列的抗体来筛选表达 肽的 cDNA 表达文库。这种氨基酸序列包括 SEQ ID 2、 4、 8、 9、 10、 12、 14、 16、 18、 20、 22、 24、 26、 28、 30、 32、 34、 36、 38、 40、 42、 44、 46、 48、 50、 52、 54、 56、 58、 60、 62、 64、 66、 68、 70、 72、 74、 76、 78、 80、 82、 84、 86、 88、 90、 92、 96、 98、 100、 102、 104、 106、 108、 110、 112、 114、 116、 118、 120、 122、 124、 126、 128、 130、 132、 134、 136、 138、 140、 144、 146、 148。
在第 16 个重要的方面, 本发明也涉及产生过度表达 p450 酶活性水平的转基因烟 草谱系。 根据本发明, 这些转基因谱系包括编码全长基因的氨基酸序列的所有核酸序列, 所 述基因有效地增加特定酶的表达从而导致烟草中的表型效应。这种氨基酸序列包括 SEQ. ID.150、 152、 154、 156、 158、 160、 162、 164、 166、 168、 170、 172、 174、 176、 178、 180、 182、 184、 186、 188、 190、 192、 194、 196、 198、 200、 202、 204、 206、 208、 210、 212、 214、 216、 218、 220、 222、 224、 226、 228、 230、 232、 234、 236、 238、 240、 242、 244、 246、 248、 250、 252、 254、 256、 258、 260、 262、 264、 266、 268、 270、 272、 274、 276、 278、 280、 282、 284、 286、 288、 290、 292、 294、 296、 298、 300、 302、 304、 306、 308、 310、 312、 314 和 316。
也提供了含有降烟碱含量降低的烟叶 ( 叶片和 / 或茎 ) 的烟草产品。该烟草产品 包括烟草 ( 含有叶片和 / 或茎的烟叶 ), 该烟草来自含有本文所述序列或消除或抑制了编码
烟草特异性亚硝基胺的基因的植物。 与用未消除或抑制编码烟草特异性亚硝基胺的基因的 烟草植物制备的烟草产品相比, 消除或抑制编码烟草特异性亚硝基胺的基因有效地降低了 烟草产品中约 5-10%、 或者约 10-20%、 或者约 20-30%、 或者 30%以上的烟草特异性亚硝 基胺。 本文使用的烟草产品可包括香烟、 雪茄、 烟丝、 鼻烟、 口嚼烟 (chewing tobacco)、 混合 了烟草产品的产品和它们的混合物。
本发明涉及如下各项 :
1. 一种分离的烟草核酸分子, 该核酸分子含有选自 SEQ.ID.No. : 299-357 的核酸 序列。
2. 一种转基因植物, 该转基因植物含有如项 1 所述的核酸分子。
3. 如项 2 所述的转基因植物, 其特征在于, 所述植物是烟草植物。
4. 一种产生转基因植物的方法, 该方法包括以下步骤 :
(i) 将如项 1 所述的核酸分子与在所述植物中具有功能的启动子操作性相连以产 生植物转化载体 ;
(ii) 用步骤的所述植物转化载体转化所述植物 ;
(iii) 选择用所述转化载体转化的植物细胞 ; 和 (iv) 从所述转化的植物细胞再生转化植物。
5. 如项 4 所述的方法, 其特征在于, 所述核酸分子处于反义方向。
6. 如项 4 所述的方法, 其特征在于, 所述核酸分子处于有义方向。
7. 如项 4 所述的方法, 其特征在于, 所述核酸分子处于 RNA 干扰方向。
8. 如项 4 所述的方法, 其特征在于, 所述核酸分子表达为双链 RNA 分子。
9. 如项 4 所述的方法, 其特征在于, 所述双链 RNA 分子长度为约 15-25 个核苷酸。
10. 如项 4 所述的方法, 其特征在于, 所述转基因植物是烟草植物。
11. 一种选择含有核酸分子的植物的方法, 其中分析所述植物中是否存在选自 299-357 的核酸序列。
12. 如项 11 所述选择植物的方法, 其特征在于, 通过 DNA 杂交分析所述植物。
13. 如项 11 所述选择植物的方法, 其特征在于, 所述 DNA 杂交是 Southern 印迹分 析。
14. 如项 11 所述选择植物的方法, 其特征在于, 所述 DNA 杂交是 Northern 印迹分 析。
15. 如项 11 所述选择植物的方法, 其特征在于, 通过 PCR 检测分析所述植物。
16. 如项 11 所述选择植物的方法, 其特征在于, 所述植物是烟草植物。
17. 一种增加或降低植物中降烟碱水平的方法, 所述方法包括以下步骤 :
(i) 将如项 1 所述的核酸分子与在所述植物中具有功能的启动子操作性相连以产 生植物转化载体 ;
(ii) 用步骤 (i) 所述植物转化载体转化所述植物 ;
(iii) 选择用所述转化载体转化的植物细胞 ; 和
(iv) 从所述转化的植物细胞再生转化植物。
18. 如项 17 所述的方法, 其特征在于, 所述核酸分子处于反义方向。
19. 如项 17 所述的方法, 其特征在于, 所述核酸分子处于有义方向。
5. 如项 4 所述的方法, 其特征在于, 所述核酸分子处于反义方向。
6. 如项 4 所述的方法, 其特征在于, 所述核酸分子处于有义方向。
7. 如项 4 所述的方法, 其特征在于, 所述核酸分子处于 RNA 干扰方向。
8. 如项 4 所述的方法, 其特征在于, 所述核酸分子表达为双链 RNA 分子。
9. 如项 4 所述的方法, 其特征在于, 所述双链 RNA 分子长度为约 15-25 个核苷酸。
10. 如项 4 所述的方法, 其特征在于, 所述转基因植物是烟草植物。
11. 一种选择含有核酸分子的植物的方法, 其中分析所述植物中是否存在选自 299-357 的核酸序列。
12. 如项 11 所述选择植物的方法, 其特征在于, 通过 DNA 杂交分析所述植物。
13. 如项 11 所述选择植物的方法, 其特征在于, 所述 DNA 杂交是 Southern 印迹分 析。
14. 如项 11 所述选择植物的方法, 其特征在于, 所述 DNA 杂交是 Northern 印迹分 析。
15. 如项 11 所述选择植物的方法, 其特征在于, 通过 PCR 检测分析所述植物。
16. 如项 11 所述选择植物的方法, 其特征在于, 所述植物是烟草植物。
17. 一种增加或降低植物中降烟碱水平的方法, 所述方法包括以下步骤 :
(i) 将如项 1 所述的核酸分子与在所述植物中具有功能的启动子操作性相连以产 生植物转化载体 ;
(ii) 用步骤 (i) 所述植物转化载体转化所述植物 ;
(iii) 选择用所述转化载体转化的植物细胞 ; 和
(iv) 从所述转化的植物细胞再生转化植物。
18. 如项 17 所述的方法, 其特征在于, 所述核酸分子处于反义方向。
19. 如项 17 所述的方法, 其特征在于, 所述核酸分子处于有义方向。
20. 如项 17 所述的方法, 其特征在于, 所述核酸分子处于 RNA 干扰方向。 21. 如项 17 所述的方法, 其特征在于, 所述核酸分子表达为双链 RNA 分子。 22. 如项 17 所述的方法, 其特征在于, 所述转基因植物是烟草植物。 附图简述 图 1 显示核酸 SEQ.ID.No. : 1 和氨基酸 SEQ.ID.No. : 2。 图 2 显示核酸 SEQ.ID.No. : 3 和氨基酸 SEQ.ID.No. : 4。 图 3 显示核酸 SEQ.ID.No. : 5 和氨基酸 SEQ.ID.No. : 6。 图 4 显示核酸 SEQ.ID.No. : 7 和氨基酸 SEQ.ID.No. : 8。 图 5 显示核酸 SEQ.ID.No. : 9 和氨基酸 SEQ.ID.No. : 10。 图 6 显示核酸 SEQ.ID.No. : 11 和氨基酸 SEQ.ID.No. : 12。 图 7 显示核酸 SEQ.ID.No. : 13 和氨基酸 SEQ.ID.No. : 14。 图 8 显示核酸 SEQ.ID.No. : 15 和氨基酸 SEQ.ID.No. : 16。 图 9 显示核酸 SEQ.ID.No. : 17 和氨基酸 SEQ.ID.No. : 18。 图 10 显示核酸 SEQ.ID.No. : 19 和氨基酸 SEQ.ID.No. : 20。 图 11 显示核酸 SEQ.ID.No. : 21 和氨基酸 SEQ.ID.No. : 22。 图 12 显示核酸 SEQ.ID.No. : 23 和氨基酸 SEQ.ID.No. : 24。 图 13 显示核酸 SEQ.ID.No. : 25 和氨基酸 SEQ.ID.No. : 26。 图 14 显示核酸 SEQ.ID.No. : 27 和氨基酸 SEQ.ID.No. : 28。 图 15 显示核酸 SEQ.ID.No. : 29 和氨基酸 SEQ.ID.No.30。 图 16 显示核酸 SEQ.ID.No. : 31 和氨基酸 SEQ.ID.No. : 32。 图 17 显示核酸 SEQ.ID.No. : 33 和氨基酸 SEQ.ID.No. : 34。 图 18 显示核酸 SEQ.ID.No. : 35 和氨基酸 SEQ.ID.No. : 36。 图 19 显示核酸 SEQ.ID.No. : 37 和氨基酸 SEQ.ID.No. : 38。 图 20 显示核酸 SEQ.ID.No. : 39 和氨基酸 SEQ.ID.No. : 40。 图 21 显示核酸 SEQ.ID.No. : 41 和氨基酸 SEQ.ID.No. : 42。 图 22 显示核酸 SEQ.ID.No. : 43 和氨基酸 SEQ.ID.No. : 44。 图 23 显示核酸 SEQ.ID.No. : 45 和氨基酸 SEQ.ID.No. : 46。 图 24 显示核酸 SEQ.ID.No. : 47 和氨基酸 SEQ.ID.No. : 48。 图 25 显示核酸 SEQ.ID.No. : 49 和氨基酸 SEQ.ID.No. : 50。 图 26 显示核酸 SEQ.ID.No. : 51 和氨基酸 SEQ.ID.No. : 52。 图 27 显示核酸 SEQ.ID.No. : 53 和氨基酸 SEQ.ID.No. : 54。 图 28 显示核酸 SEQ.ID.No. : 55 和氨基酸 SEQ.ID.No. : 56。 图 29 显示核酸 SEQ.ID.No. : 57 和氨基酸 SEQ.ID.No. : 58。 图 30 显示核酸 SEQ.ID.No. : 59 和氨基酸 SEQ.ID.No. : 60。 图 31 显示核酸 SEQ.ID.No. : 61 和氨基酸 SEQ.ID.No. : 62。 图 32 显示核酸 SEQ.ID.No. : 63 和氨基酸 SEQ.ID.No. : 64。 图 33 显示核酸 SEQ.ID.No. : 65 和氨基酸 SEQ.ID.No. : 66。 图 34 显示核酸 SEQ.ID.No. : 67 和氨基酸 SEQ.ID.No. : 68。 图 35 显示核酸 SEQ.ID.No. : 69 和氨基酸 SEQ.ID.No. : 70。图 36 显示核酸 SEQ.ID.No. : 71 和氨基酸 SEQ.ID.No. : 72。 图 37 显示核酸 SEQ.ID.No. : 73 和氨基酸 SEQ.ID.No. : 74。 图 38 显示核酸 SEQ.ID.No. : 75 和氨基酸 SEQ.ID.No. : 76。 图 39 显示核酸 SEQ.ID.No. : 77 和氨基酸 SEQ.ID.No. : 78。 图 40 显示核酸 SEQ.ID.No. : 79 和氨基酸 SEQ.ID.No. : 80。 图 41 显示核酸 SEQ.ID.No. : 81 和氨基酸 SEQ.ID.No. : 82。 图 42 显示核酸 SEQ.ID.No. : 83 和氨基酸 SEQ.ID.No. : 84。 图 43 显示核酸 SEQ.ID.No. : 85 和氨基酸 SEQ.ID.No. : 86。 图 44 显示核酸 SEQ.ID.No. : 87 和氨基酸 SEQ.ID.No. : 88。 图 45 显示核酸 SEQ.ID.No. : 89 和氨基酸 SEQ.ID.No. : 90。 图 46 显示核酸 SEQ.ID.No. : 91 和氨基酸 SEQ.ID.No. : 92。 图 47 显示核酸 SEQ.ID.No. : 93 和氨基酸 SEQ.ID.No. : 94。 图 48 显示核酸 SEQ.ID.No. : 95 和氨基酸 SEQ.ID.No. : 96。 图 49 显示核酸 SEQ.ID.No. : 97 和氨基酸 SEQ.ID.No. : 98。 图 50 显示核酸 SEQ.ID.No. : 99 和氨基酸 SEQ.ID.No. : 100。 图 51 显示核酸 SEQ.ID.No. : 101 和氨基酸 SEQ.ID.No. : 102。 图 52 显示核酸 SEQ.ID.No. : 103 和氨基酸 SEQ.ID.No. : 104。 图 53 显示核酸 SEQ.ID.No. : 105 和氨基酸 SEQ.ID.No. : 106。 图 54 显示核酸 SEQ.ID.No. : 107 和氨基酸 SEQ.ID.No. : 108。 图 55 显示核酸 SEQ.ID.No. : 109 和氨基酸 SEQ.ID.No. : 110。 图 56 显示核酸 SEQ.ID.No. : 111 和氨基酸 SEQ.ID.No. : 112。 图 57 显示核酸 SEQ.ID.No. : 113 和氨基酸 SEQ.ID.No. : 114。 图 58 显示核酸 SEQ.ID.No. : 115 和氨基酸 SEQ.ID.No. : 116。 图 59 显示核酸 SEQ.ID.No. : 117 和氨基酸 SEQ.ID.No. : 118。 图 60 显示核酸 SEQ.ID.No. : 119 和氨基酸 SEQ.ID.No. : 120。 图 61 显示核酸 SEQ.ID.No. : 121 和氨基酸 SEQ.ID.No. : 122。 图 62 显示核酸 SEQ.ID.No. : 123 和氨基酸 SEQ.ID.No. : 124。 图 63 显示核酸 SEQ.ID.No. : 125 和氨基酸 SEQ.ID.No. : 126。 图 64 显示核酸 SEQ.ID.No. : 127 和氨基酸 SEQ.ID.No. : 128。 图 65 显示核酸 SEQ.ID.No. : 129 和氨基酸 SEQ.ID.No. : 130。 图 66 显示核酸 SEQ.ID.No. : 131 和氨基酸 SEQ.ID.No. : 132。 图 67 显示核酸 SEQ.ID.No. : 133 和氨基酸 SEQ.ID.No. : 134。 图 68 显示核酸 SEQ.ID.No. : 135 和氨基酸 SEQ.ID.No. : 136。 图 69 显示核酸 SEQ.ID.No. : 137 和氨基酸 SEQ.ID.No. : 138。 图 70 显示核酸 SEQ.ID.No. : 139 和氨基酸 SEQ.ID.No. : 140。 图 71 显示核酸 SEQ.ID.No. : 141 和氨基酸 SEQ.ID.No. : 142。 图 72 显示核酸 SEQ.ID.No. : 143 和氨基酸 SEQ.ID.No. : 144。 图 73 显示核酸 SEQ.ID.No. : 145 和氨基酸 SEQ.ID.No. : 146。 图 74 显示核酸 SEQ.ID.No. : 147 和氨基酸 SEQ.ID.No. : 148。图 75 显示核酸 SEQ.ID.No. : 149 和氨基酸 SEQ.ID.No. : 150。 图 76 显示核酸 SEQ.ID.No. : 151 和氨基酸 SEQ.ID.No. : 152。 图 77 显示核酸 SEQ.ID.No. : 153 和氨基酸 SEQ.ID.No. : 154。 图 78 显示核酸 SEQ.ID.No. : 155 和氨基酸 SEQ.ID.No. : 156。 图 79 显示核酸 SEQ.ID.No. : 157 和氨基酸 SEQ.ID.No. : 158。 图 80 显示核酸 SEQ.ID.No. : 159 和氨基酸 SEQ.ID.No. : 160。 图 81 显示核酸 SEQ.ID.No. : 161 和氨基酸 SEQ.ID.No. : 162。 图 82 显示核酸 SEQ.ID.No. : 163 和氨基酸 SEQ.ID.No. : 164。 图 83 显示核酸 SEQ.ID.No. : 165 和氨基酸 SEQ.ID.No. : 166。 图 84 显示核酸 SEQ.ID.No. : 167 和氨基酸 SEQ.ID.No. : 168。 图 85 显示核酸 SEQ.ID.No. : 169 和氨基酸 SEQ.ID.No. : 170。 图 86 显示核酸 SEQ.ID.No. : 171 和氨基酸 SEQ.ID.No. : 172。 图 87 显示核酸 SEQ.ID.No. : 173 和氨基酸 SEQ.ID.No. : 174。 图 88 显示核酸 SEQ.ID.No. : 175 和氨基酸 SEQ.ID.No. : 176。 图 89 显示核酸 SEQ.ID.No. : 177 和氨基酸 SEQ.ID.No. : 178。 图 90 显示核酸 SEQ.ID.No. : 179 和氨基酸 SEQ.ID.No. : 180。 图 91 显示核酸 SEQ.ID.No. : 181 和氨基酸 SEQ.ID.No. : 182。 图 92 显示核酸 SEQ.ID.No. : 183 和氨基酸 SEQ.ID.No. : 184。 图 93 显示核酸 SEQ.ID.No. : 185 和氨基酸 SEQ.ID.No. : 186。 图 94 显示核酸 SEQ.ID.No. : 187 和氨基酸 SEQ.ID.No. : 188。 图 95 显示核酸 SEQ.ID.No. : 189 和氨基酸 SEQ.ID.No. : 190。 图 96 显示核酸 SEQ.ID.No. : 191 和氨基酸 SEQ.ID.No. : 192。 图 97 显示核酸 SEQ.ID.No. : 193 和氨基酸 SEQ.ID.No. : 194。 图 98 显示核酸 SEQ.ID.No. : 195 和氨基酸 SEQ.ID.No. : 196。 图 99 显示核酸 SEQ.ID.No. : 197 和氨基酸 SEQ.ID.No. : 198。 图 100 显示核酸 SEQ.ID.No. : 199 和氨基酸 SEQ.ID.No. : 200。 图 101 显示核酸 SEQ.ID.No. : 201 和氨基酸 SEQ.ID.No. : 202。 图 102 显示核酸 SEQ.ID.No. : 203 和氨基酸 SEQ.ID.No. : 204。 图 103 显示核酸 SEQ.ID.No. : 205 和氨基酸 SEQ.ID.No. : 206。 图 104 显示核酸 SEQ.ID.No. : 207 和氨基酸 SEQ.ID.No. : 208。 图 105 显示核酸 SEQ.ID.No. : 209 和氨基酸 SEQ.ID.No. : 210。 图 106 显示核酸 SEQ.ID.No. : 211 和氨基酸 SEQ.ID.No. : 212。 图 107 显示核酸 SEQ.ID.No. : 213 和氨基酸 SEQ.ID.No. : 214。 图 108 显示核酸 SEQ.ID.No. : 215 和氨基酸 SEQ.ID.No. : 216。 图 109 显示核酸 SEQ.ID.No. : 217 和氨基酸 SEQ.ID.No. : 218。 图 110 显示核酸 SEQ.ID.No. : 219 和氨基酸 SEQ.ID.No. : 220。 图 111 显示核酸 SEQ.ID.No. : 221 和氨基酸 SEQ.ID.No. : 222。 图 112 显示核酸 SEQ.ID.No. : 223 和氨基酸 SEQ.ID.No. : 224。 图 113 显示核酸 SEQ.ID.No. : 225 和氨基酸 SEQ.ID.No. : 226。图 114 显示核酸 SEQ.ID.No. : 227 和氨基酸 SEQ.ID.No. : 228。 图 115 显示核酸 SEQ.ID.No. : 229 和氨基酸 SEQ.ID.No. : 230。 图 116 显示核酸 SEQ.ID.No. : 231 和氨基酸 SEQ.ID.No. : 232。 图 117 显示核酸 SEQ.ID.No. : 233 和氨基酸 SEQ.ID.No. : 234。 图 118 显示核酸 SEQ.ID.No. : 235 和氨基酸 SEQ.ID.No. : 236。 图 119 显示核酸 SEQ.ID.No. : 237 和氨基酸 SEQ.ID.No. : 238。 图 120 显示核酸 SEQ.ID.No. : 239 和氨基酸 SEQ.ID.No. : 240。 图 121 显示核酸 SEQ.ID.No. : 241 和氨基酸 SEQ.ID.No. : 242。 图 122 显示核酸 SEQ.ID.No. : 243 和氨基酸 SEQ.ID.No. : 244。 图 123 显示核酸 SEQ.ID.No. : 245 和氨基酸 SEQ.ID.No. : 246。 图 124 显示核酸 SEQ.ID.No. : 247 和氨基酸 SEQ.ID.No. : 248。 图 125 显示核酸 SEQ.ID.No. : 249 和氨基酸 SEQ.ID.No. : 250。 图 126 显示核酸 SEQ.ID.No. : 251 和氨基酸 SEQ.ID.No. : 252。 图 127 显示核酸 SEQ.ID.No. : 253 和氨基酸 SEQ.ID.No. : 254。 图 128 显示核酸 SEQ.ID.No. : 255 和氨基酸 SEQ.ID.No. : 256。 图 129 显示核酸 SEQ.ID.No. : 257 和氨基酸 SEQ.ID.No. : 258。 图 130 显示核酸 SEQ.ID.No. : 259 和氨基酸 SEQ.ID.No. : 260。 图 131 显示核酸 SEQ.ID.No. : 261 和氨基酸 SEQ.ID.No. : 262。 图 132 显示核酸 SEQ.ID.No. : 263 和氨基酸 SEQ.ID.No. : 264。 图 133 显示核酸 SEQ.ID.No. : 265 和氨基酸 SEQ.ID.No. : 266。 图 134 显示核酸 SEQ.ID.No. : 267 和氨基酸 SEQ.ID.No. : 268。 图 135 显示核酸 SEQ.ID.No. : 269 和氨基酸 SEQ.ID.No. : 270。 图 136 显示核酸 SEQ.ID.No. : 271 和氨基酸 SEQ.ID.No. : 272。 图 137 显示核酸 SEQ.ID.No. : 273 和氨基酸 SEQ.ID.No. : 274。 图 138 显示核酸 SEQ.ID.No. : 275 和氨基酸 SEQ.ID.No. : 276。 图 139 显示核酸 SEQ.ID.No. : 277 和氨基酸 SEQ.ID.No. : 278。 图 140 显示核酸 SEQ.ID.No. : 279 和氨基酸 SEQ.ID.No. : 280。 图 141 显示核酸 SEQ.ID.No. : 281 和氨基酸 SEQ.ID.No. : 282。 图 142 显示核酸 SEQ.ID.No. : 283 和氨基酸 SEQ.ID.No. : 284。 图 143 显示核酸 SEQ.ID.No. : 285 和氨基酸 SEQ.ID.No. : 286。 图 144 显示核酸 SEQ.ID.No. : 287 和氨基酸 SEQ.ID.No. : 288。 图 145 显示核酸 SEQ.ID.No. : 289 和氨基酸 SEQ.ID.No. : 290。 图 146 显示核酸 SEQ.ID.No. : 291 和氨基酸 SEQ.ID.No. : 292。 图 147 显示核酸 SEQ.ID.No. : 293 和氨基酸 SEQ.ID.No. : 294。 图 148 显示核酸 SEQ.ID.No. : 295 和氨基酸 SEQ.ID.No. : 296。 图 149 显示组群成员的氨基酸同一性。 图 150 显示序列组的比较。 图 151A-E 显示了全长克隆的对比。 图 152 显示通过 PCR 克隆细胞色素 p450cDNA 片段的方法。图 153 显示核酸 SEQ.ID No. : 356 和氨基酸 SEQ.ID.No. : 357。
图 154 显示核酸 SEQ.ID No. : 358 和氨基酸 SEQ.ID.No. : 359。
图 155 显示核酸 SEQ.IDNo. : 360 和氨基酸 SEQ.ID.No. : 361。
图 156 显示核酸 SEQ.ID No. : 362 和氨基酸 SEQ.ID.No. : 363。
图 157 显示核酸 SEQ.ID No. : 364 和氨基酸 SEQ.ID.No. : 365。
图 158 显示核酸 SEQ.ID No. : 366 和氨基酸 SEQ.ID.No. : 367。
图 159 显示核酸 SEQ.ID No. : 368 和氨基酸 SEQ.ID.No. : 369。
图 160 显示核酸 SEQ.ID No. : 370 和氨基酸 SEQ.ID.No. : 371。
图 161 显示核酸 SEQ.ID No. : 372 和氨基酸 SEQ.ID.No. : 373。
图 162 显示基因芯片上所有克隆的探针组序列。
图 163 显示了 SEQ.ID No. : 434-536。
发明详述
定义
除非另有定义, 本文使用的所有技术和科技术语均与本发明所属领域的普通 技术人员通常理解的具有相同的意义。Singleton 等, (1994)《微生物和分子生物学字 典》 (Dictionary of Microbiology and Molecular Biology), 第二版, John Wiley and Sons( 纽约 ) 为技术人员提供了许多关于本发明所用术语的通用字典。本文所提及的所有 专利和出版物均纳入本文作为参考。出于本发明的目的, 下列术语如下定义。 “酶活性” 包括脱甲基化、 羟基化、 环氧化、 N- 氧化、 磺基氧化、 N-、 S- 和 O- 脱烷基 化、 脱硫作用、 脱氨基作用和偶氮基、 硝基和 N- 氧化物基团的还原。术语 “核酸” 指单链或 双链形式的, 或有义或反义的脱氧核糖核酸或核糖核酸聚合物, 并且除非另有限制, 该术语 包括能以类似于天然存在核苷酸的方式与核酸杂交的天然核苷酸的已知类似物。 除非另有 指出, 特定的核酸序列包括其互补序列。
术语 “可操作性连接” 、 “可操作性结合” 和 “以可操作性顺序” 指核酸表达控制序 列 ( 例如启动子、 信号序列或转录因子结合位点的阵列 ) 和第二核酸序列之间的功能性连 接, 其中表达控制序列影响对应于第二序列的核酸的转录和 / 或翻译。
当术语 “重组体” 用于指细胞时, 它指该细胞复制异源核酸, 表达所述核酸或表达 异源核酸编码的肽、 异源肽或蛋白质。重组细胞可以有义或反义形式表达在细胞的天然形 式 ( 非重组 ) 中未发现的基因或基因片段。重组细胞也可表达在细胞的天然形式中发现的 基因, 但其中该基因通过人工方式被改变并重新引入细胞。
“结构基因” 是含有编码蛋白质、 多肽或其部分的 DNA 片段的基因的一部分, 并且 不包括启动转录的 5’ 序列。或者结构基因可编码不可翻译的产物。结构基因可是在细胞 中正常发现的基因, 或者它是引入的而非在细胞或细胞位置中正常发现的基因, 在这种情 况下称为 “异源基因” 。异源基因可全部或部分来源于本领域已知的任何来源, 包括细菌 基因组或附加体、 真核生物的、 核的或质粒 DNA、 cDNA、 病毒 DNA 或化学合成的 DNA。结构基 因可含有一种或多种修饰, 这些修饰可影响生物活性或其特性、 表达产物的生物活性或化 学结构、 表达速率或表达控制的方式。这种修饰包括 ( 但不限于 ) 一个或多个核苷酸的突 变、 插入、 删除和取代。结构基因可构成不间断的编码序列或可包括一个或多个与合适的 剪接接头结合的内含子。结构基因可以是可翻译或不可翻译的, 包括反义方向 (antisense
orientation)。结构基因可以是来源于多种来源和多种基因序列的复合物 ( 天然存在的或 合成的, 其中合成的指化学合成的 DNA)。
“来源于” 用来指从某种来源 ( 化学和 / 或生物的 ) 取得、 获得、 接受得、 追溯、 复 制或传下的。可通过对原始来源的化学或生物学操作 ( 包括, 但不限于取代、 添加、 插入、 删 除、 提取、 分离、 突变和复制 ) 产生衍生物。
涉及 DNA 序列的术语 “化学合成的” 指部分核苷酸组分在体外装配。可使用已 良好建立的方法 (Caruthers, 《DNA 和 RNA 测序的方法》 (Methodology of DNA and RNA Secquencing), (1983), Weissman 编, Praeger Publishers, New York, 第 1 章 ) 实现 DNA 的 手工化学合成 ; 可使用许多市售可得的机器的一种进行自动化学合成。
可通过以下方法进行序列的最佳对比 : Smith 和 Waterman(Adv.Appl.Math.2 : 482(1981)) 的局部同源性算法、 Needleman 和 Wunsch(J.Mol.Biol.48 : 443(1970)) 的同源 性算法、 Pearson 和 Lipman(Proc.Natl.Acad.Sci.(U.S.A.)85 : 2444(1988)) 的相似性检索 方法、 这些算法的计算机化的工具 (Wisconsin Genetics 软件包中的 GAP、 BESTFIT、 FASTA 和 TFASTA, Genetics Computer Group, 575 Science Dr., Madison, Wis.) 或通过检验。
可从几种来源 ( 包括生物信息国家中心 (NCBI, Bethesda, Md.) 和因特网 ) 获 得 NCBI 基础局部序列比对检索工具 (BLAST)(Altschul 等, 1990) 与序列分析程序 blast、 blastn、 blastx、 tblastn 和 tblastx 联合使用。 该工具可在 htp://www.ncbi.nlm.nih.gov/ BLAST/ 获得。如何使用该程序检测序列同一性描述于 http://www.ncbi.nlm.nih.gov/ BLAST/blast help.html。
本文使用并应用于氨基酸序列的术语 “实质性氨基酸同一性”或 “实质性氨基 酸序列同一性”表示多肽的一种特性, 其中与参考组在所翻译肽的细胞色素 p450 基序 GXRXCX(G/A) 后的第一氨基酸到终止密码子的对应区域相比, 所述肽含有至少 70 %的 序列同一性、 优选 80 %氨基酸序列同一性、 更优选 90 %氨基酸序列同一性、 最优选至少 99-100%序列同一性的序列。
本文使用并应用于核酸序列的术语 “实质性核酸同一性”或 “实质性核酸序列 同一性” 表示多核苷酸序列的一种特性, 其中与参考组在所翻译肽的细胞色素 p450 基序 GXRXCX(G/A) 后的第一核酸到终止密码子的对应区域相比, 所述多核苷酸含有至少 75%的 序列同一性、 优选 81%序列同一性、 更优选 91%序列同一性、 最优选至少 99-100%序列同 一性的序列。
核苷酸序列实质相同的另一个指标是两个分子在严格条件下是否可杂交。 严格条 件视序列而定, 在不同情况下是不同的。严格条件一般选择比给定离子强度和 pH 时特定序 列的热解链温度 (Tm) 低约 5-20℃, 通常是约 10-15℃。Tm 是在给定离子强度和 pH 时 50% 靶序列与匹配的探针杂交的温度。严格条件通常是盐浓度为约 0.02 摩尔, pH 是 7, 温度是 至少约 60℃。例如, 在标准的 Southern 杂交方法中, 严格条件包括于 42℃在 6×SSC 中初 次洗涤, 然后于至少约 55℃ ( 通常是约 60℃, 更常见是约 65℃ ) 在 0.2×SSC 进行一次或多 次额外洗涤。
出于本发明的目的, 当核苷酸序列编码的多肽和 / 或蛋白质实质性相同时, 核苷 酸序列也实质性相同。因此, 当一条核酸序列与第二条核酸序列编码的多肽实质性相同 时, 这两条核酸序列是实质性相同的, 即使由于遗传密码所允许的简并性造成它们在严格条件下不会杂交 ( 对密码子简并性和遗传密码的解释参见 Darnell 等, (1990)《分子生物 学》 (Molecular Cell Biology), 第二版, Scientific American Books W.H.Freeman and Company, New York)。 可通过许多本领域熟知的方式, 例如蛋白质样品的聚丙烯酰胺凝胶电 泳, 然后基于染色通过目测来表征蛋白质纯度或均一性。 出于特定的目的, 可能需要高分辨 率并可利用 HPLC 或类似的装置。
本文使用的术语 “载体” 指将 DNA 片段转移入细胞的核酸分子。载体可由于复制 DNA 并可在宿主细胞中独立地复制。术语 “运载体” 有时可与 “载体” 互换使用。本文使用 的术语 “表达载体” 指重组 DNA 分子, 该分子含有所需的编码序列和用于在特定宿主生物体 中表达操作性相连的编码序列所需合适的核酸序列。通常, 原核生物中表达所需的核酸序 列通常含有启动子、 操纵子 ( 任选 ) 与核糖体结合位点, 以及其它序列。已知真核细胞可利 用启动子、 增强子以及终止和聚腺苷酸化信号。
为再生完全经遗传工程改造的具有根的植物, 可在植物细胞中插入核酸, 例如通 过诸如体内接种的任何技术或通过任何已知的体外组织培养技术来产生可再生为完整植 物的转化植物细胞。因此, 例如可通过病原性或非病原性根瘤土壤杆菌 (A.tumefacien) 的 体外接种来插入植物细胞。也可使用其它这样的组织培养技术。
“植物组织” 包括分化或未分化的植物组织, 包括, 但不限于根、 芽、 叶、 花粉、 种子、 肿瘤组织以及培养物中细胞的各种形式, 例如单细胞、 原生质体、 胚和愈伤组织。植物组织 可在植物中 (in planta) 或器官中, 组织或细胞培养物中。
本文使用的 “植物细胞” 包括植物中的植物细胞和培养物中的植物细胞和原生质 体。
“cDNA” 或 “互补 DNA” 一般指核苷酸序列与 RNA 分子互补的单链 DNA 分子。cDNA 是通过逆转录酶在 RNA 模板作用形成的。
获得核酸序列的方案
根据本发明, 从转化体和非转化体烟草谱系的烟草组织中提取 RNA。 提取的 RNA 然 后用于产生 cDNA。然后使用两种方案产生本发明的核酸序列。
在第一方案中, 从植物组织中提取富含 polyA 的 RNA 并通过逆转录 PCR 制备 cDNA。 然后使用简并引物加上寡聚 d(T) 反向引物, 用单链 cDNA 产生 p450 特异性 PCR 群。以高度 保守的 p450 基序为基础设计引物。特定的简并引物的例子示于图 1。进一步分析含有合适 大小插入物的质粒的序列片段。这些插入物的大小一般是约 300-800 个核苷酸, 视采用何 种引物而定。
在第二方案中, 首先构建 cDNA 文库。使用简并引物加上在质粒上作为反向引物的 T7 引物, 使用质粒中的 cDNA 产生 p450 特异的 PCR 群。如第一方案中一样, 进一步分析含有 合适大小插入物的质粒的序列片段。
已知产生高水平降烟碱的烟草植物谱系 ( 转化体 ) 和降烟碱水平检测不到的植物 谱系可用作起始材料。
然后可从植物上取下叶子并用乙烯处理以激活本文所定义的 p450 酶活性。示于 本领域已知的技术提取总 RNA。然后使用如图 153 所述的寡聚 d(T) 引物经 PCR(RT-PCR) 产 生 cDNA 片段。然后可完全地构建本文实施例所述的 cDNA 文库。
p450 型酶的保守区域可用作简并引物 ( 图 75) 的模板。可通过 PCR 使用简并引物扩增 p450 特异性条带。表示 p450 样酶的区带可通过 DNA 测序鉴定。可使用鉴定合适的候 选对象的 BLAST 检索、 算法或其它工具来表征 PCR 片段的特性。
已鉴定片段的序列信息可用于开发 PCR 引物。这些引物与 cDNA 文库中的质粒引 物联合用于克隆全长 p450 基因。进行大规模 Sourthern 反向分析来检测所有获得的片段 克隆以及在一些情况中全长克隆的差别表达。在本发明的这个方面, 为筛选所有克隆的插 入物, 可用不同组织的标记的总 cDNA 作为探针来与克隆的 DNA 片段杂交, 进行大规模反向 Sourthern 测定。
也用非放射性和放射性 (P32)Northern 印迹测定来鉴定克隆 p450 片段和全长克 隆。
通过衍生它们的氨基酸序列与选择抗原性和对其它克隆独特的肽区域来制造针 对几种全长克隆的肽特异性抗体。制造了针对偶联于运载体蛋白的合成肽的家兔抗体。使 用这些抗体对植物组织进行 Western 印迹分析或其它免疫学方法。
可使用病毒诱导的基因沉默技术 (VIGS, Baulcombe, Current Opinions in Plant Biology, 1999, 2: 109-113) 检测以上鉴定的核酸序列。
通过衍生它们的氨基酸序列与选择可能的抗原性和对其它克隆独特的肽区域来 制造针对几种全长克隆的肽特异性抗体。 制造了针对偶联于运载体蛋白的合成肽的家兔抗 体。使用这些抗体进行 Western 印迹分析。 在本发明的另一方面, 使用干扰 RNA(RNAi) 技术在本发明的烟草植物中进一步 鉴定细胞色素 p450 酶活性。描述该技术的以下参考文献纳入本文作为参考, Smith 等, Nature, 2000, 407 : 319-320 ; Fire 等, Nature, 1998, 391 : 306-311 ; Waterhouse 等, PNAS, 1998, 95 : 13959-13964 ; Stalberg 等, Plant Molecular Biology, 1993, 23 : 671-683 ; Baulcombe, Current Opinions in Plant Biology, 1999, 2: 109-113 和 Brigneti 等, EMBO Journal, 1998, 17(22) : 6739-6746。可使用 RNAi 技术、 反义技术或所述的各种其它方法来 转化植物。
有几种技术将外来遗传物质引入植物细胞并获得稳定地维持和表达所引入基因 的植物。这种技术包括加速包裹在微粒上的遗传物质进入细胞 ( 授予 Cornell 的美国专利 4,945,050 和授予 DowElanco 的美国专利 5,141,131)。可使用土壤杆菌技术来转化植物, 参见授予 University of Toledo 的美国专利 5,177,010 ; 授予 Texas A & M 的 5,104,310 ; Schilperoot 的欧洲专利申请 0131624B1、 欧洲专利申请 120516、 159418B1、 欧洲专利申 请 120516、 159418B1 和 176,112 ; 授 予 Schilperoot 美 国 专 利 5,149,645 ; 5,469,976 ; 5,464,763 ; 4,940,838 和 4,693,976 ; MaxPlanck 的欧洲专利申请 116718、 290799、 320500 ; Japan Nicotiana 的欧洲专利申请 604662 和 627752 ; Ciba Geigy 的欧洲专利申请 0267159、 0292435 和美国专利 5,231,019 ; 授予 Calgene 的美国专利 5,463,174 和 4,762,785 ; 授予 Agracetus 的美国专利 5,004,863 和 5,159,135。其它转化技术包括 whiskers 技术, 参见, 例如授予 Zeneca 的美国专利 5,302,523 和 5,464,765。 电穿孔技术也用于转化植物, 参见, Boyce Thompson Institute 的 WO 87/06614、 Dekalb 的 5,472,869 和 5,384,253 ; PGS 的 WO9209696 和 WO9321335。所有这些转化专利和出版物引作参考。除了许多转化植物的技 术以外, 与外来基因接触的组织的类型也可变。这种组织包括, 但不限于胚胎发生组织、 I 和 II 型愈伤组织、 下胚轴、 分生组织等。使用技术人员已知的合适的技术几乎可转化所有
分化过程中的植物组织。
引入植物的外来遗传物质可包含选择标记。具体的标记可由技术人员判断, 但 以下选择标记可与任何其它可用作选择标记的本文未列出的基因一起使用。这种选择 标记包括, 但不限于 : 编码抗生素卡那霉素、 新霉素和 G418 抗性的转座子 Tn5(Aph II) 的氨基糖苷磷酸转移酶基因, 以及编码对 N- 膦酰甲基甘氨酸、 潮霉素、 氨甲喋呤、 草铵膦 (phosphinothricin)(bar)、 咪唑啉酮、 磺酰脲和三唑并嘧啶除草剂, 例如 chlorosulfuron、 溴苯腈、 茅草枯等具抗性或耐受性的那些基因。
除了选择标记以外, 可能需要使用报道基因。 在一些例子中, 可使用报道基因而无 需选择标记。报道基因是通常不存在于或不表达于受者生物体或组织中的基因。报道基因 通常编码提供一些表型改变或酶性能的蛋白质。这种基因的例子见纳入本文作为参考的 K.Weising 等, Ann.Rev.Genetics, 22, 421(1988)。优选的报道基因包括, 但不限于葡糖醛 酸酶 (GUS) 基因和 GFP 基因。
一旦引入植物组织后, 可通过任何本领域已知的方法来评价结构基因的表达, 可 以 mRNA 转录、 蛋白质合成或发生沉默基因的量来检测表达 ( 参见纳入本文作为参考的美国 专利号 5,583,021)。用于体外培养植物细胞和在许多情况中, 用于再生完整植物的技术是 已知的 ( 欧洲申请号 88810309.0)。本领域的技术人员已知将引入的表达复合物变为商业 有用品种的方法。 一旦获得表达所需水平的 p450 酶的植物细胞, 可使用本领域熟知的方法和技术 再生植物组织和完整的植物。再生的植物可通过常规方法繁殖, 引入的基因可通过常规植 物育种技术转入其它品系或品种。
以下实施例描述了实施本发明的方法并且应理解为是说明性的, 而非基于此来限 制本发明在权利要求中所定义的范围。
实施例 实施例 1 植物组织的发育和乙烯处理
植物生长
将植物种在盆中, 在温室中生长 4 周。将 4 周龄的幼苗移到单独的盆中, 温室中生 长 2 个月。生长过程中, 每天给植物浇水 2 次, 水中含有 150ppm 的 NPK 肥料。将展开的绿 叶与植物分离, 以进行下面所述的乙烯处理。
细胞系 78379
由 肯 塔 基 大 学 发 放 的 烟 草 品 系 78379 用 作 植 物 材 料 的 来 源, 它是一种白肋 (burley) 烟草品系。 用本领域种植烟草的标准方法培养 100 株植物, 移植, 并且用不同的数 字 (1-100) 给它们贴注标签。用推荐的方法施肥和进行田间管理。
100 株植物中的 3/4 将 20-100%的烟碱转化为降烟碱。 100 株中的 1/4 将小于 5% 的烟碱转化为降烟碱。植株 87 转化率最低 (2% ), 而植株 21 的转化率为 100%。将转化率 小于 3%的植株分类为非转化株。对植株 87 和 21 自花授粉的种子以及杂交 (21 x 87 和 87 x 21) 的种子进行遗传差异和表型差异的研究。来自植株 21 自花授粉种子的植物是转 化株, 99%的来自植株 87 自花授粉种子的植物是非转化株。 剩余 1%的来自植株 87 自花授 粉种子的植物有较低的转化率 (5-15% )。杂交种均为转化株。
细胞系 4407
烟草品系 4407 用作植物材料来源, 它是一种白肋品系。选择均一的并且具代表性 的植物 (100) 并贴上标签。在这 100 株植物中, 97 株是非转化株, 3 株是转化株。植株 56 的转化率最低 (1.2% ), 植株 58 的转化水平最高 (96% )。将这两株植物进行自花授粉和 杂交。
来自植株 58 自花授粉种子的植株产生 3 ∶ 1 的分离比 ( 转化株∶非转化株= 3 ∶ 1)。植株 58-33 和 58-25 分别被鉴定为纯合转化株和非转化株植物品系。植株 58-33 下一代后裔中的分析确证了该植株的稳定转化率。
细胞系 PBLB01
PBLB01 是由 ProfiGen, Inc. 研究开发的一种白肋品系, 用作植物材料的来源。从 PBLB01 的第一代 (foundation) 种子中选择转化株植株。
乙烯处理方法
将绿色叶片从温室生长 2-3 个月的植物分离, 喷施 0.3 %的乙烯溶液 ( 商品名 Ethephon(Rhone-Poulenc))。将每片经喷施的叶子悬挂在配有加湿器的养护架 (curing rack) 上, 覆盖塑料膜。在处理期间, 用乙烯溶液定期喷施样品叶片。乙烯处理后约 24-48 小时, 收集叶子提取 RNA。取同一组样品的另外一份 (sup-sample) 用于代谢成分分析以测 定叶片代谢物的浓度以及感兴趣的更具体的成分如多种生物碱的分析。
例如, 可如下进行生物碱分析。样品 (0.1 克 ) 和 0.5 毫升 2N NaOH 以及含有喹啉 ( 作为内标 ) 和甲基叔丁基乙醚的 5 毫升提取液在 150rpm 振荡。在配有 FID 检测器的 HP 6890GC 上分析样品。250℃的温度用于检测器和上样器 (injector)。使用含有与 5%苯酚 和 95%甲基硅酮 (methyl silicon) 交联的熔融硅石的 HP 柱 (30m-0.32nm-1m), 温度梯度 为每分钟 10℃, 110-185℃。 该柱在 100℃工作, 用氦气作为运载气体, 流速为 1.7cm3min-l, 分流比为 40 ∶ 1, 上样体积为 2·1。
实施例 2 : 分离 RNA
对于 RNA 的提取, 如上所述用乙烯处理 2 月龄温室植物的中等大小的叶片。0 和 24-48 小时的样品用于 RNA 提取。在有些情况下, 从打顶 (flower-head removal) 后 10 天 的植物取处于衰老过程的叶片样品。这些样品也用于提取。用 Rneasy Plant Mini (Qiagen, Inc., Valencia, California) 按照生产商的方法分离总 RNA。
用 DEPC 处理过的研钵和杵在液氮中将组织样品研磨为细粉。将约 100 毫克磨碎 的组织转移到灭菌的 1.5 毫升 eppendorf 管中。将样品管置于液氮中, 直到收集完所有样 品。然后, 将试剂盒中提供的 450μl RLT 缓冲液加入各管中。剧烈振荡样品, 然后在 56℃ 温育 3 分钟。 将裂解物加在放于 2 毫升收集管中的 QIAshredderTM 旋转柱上, 最大速度离心 2 分钟。收集流出液, 加 0.5 体积的乙醇到澄清的裂解液中。充分混合样品, 转移到放在 2 毫升收集管中的小旋转柱中。10,000rpm 离心样品 1 分钟。然后, 吸取 700μl RW1 缓冲液 到 柱上, 10,000rpm 离心 1 分钟。吸取 RPE 缓冲液到置于新收集管中的 旋转柱上, 以最大速度离心 柱上, 10,000rpm 离心 1 分钟。再将 RPE 缓冲液加到 钟。将2 分钟以使膜干燥。为了除掉残留的乙醇, 将膜置于一空收集管上, 再以最大速度离心 1 分 柱转移到一个新的 1.5 毫升收集管中, 将 40μl 不含 RNA 酶的水直接吸到 膜上。该最终洗脱物在 10,000rpm 离心 1 分钟。用变性甲醛凝胶和分光光度计分析总 RNA 的质量和数量。
按照生产商的方法用 OligotexTM poly A+RNA 纯化试剂盒 (Qiagen Inc.) 分离 Poly(A)RNA。使用溶于最大为 250μl 体积的约 200μg 总 RNA。将 250μl OBB 缓冲液和 15μl OligotexTM 悬浮液加到 250μl 总 RNA 中。 通过吸打使这些物质彻底混合, 在加热器 (heating block) 上 70℃保温 3 分钟。然后, 将样品置于室温约 20 分钟。最大速度离心 2 分钟得到 oligotex : mRNA 复合物团块。从微离心管中除去全部上清液, 仅剩约 50μl。再 用 OBB 缓冲液处理样品。通过涡旋将 oligotex : mRNA 团块重新悬浮在 400μl OW2 缓冲液 中。将该混合物转移到置于新管中的小旋转柱上, 以最大速度离心 1 分钟。将旋转柱移到 新管中, 再往该柱中加入 400μl OW2 缓冲液。然后, 以最大速度离心该管。将旋转柱转移 到最终的 1.5 毫升微量离心管中。用 60μl 热的 (70℃ )OEB 缓冲液洗脱样品。用变性甲醛 凝胶和分光光度计分析 Poly A 产物。
实施例 3 : 反转录 -PCR
按 照 生 产 商 的 方 法 用 SuperScript 反 转 录 酶 (Invitrogen, Carlsbad, California) 制备第一链 cDNA。 富集了 poly A+RNA 的寡聚 dT 引物混合物由少于 5μg 的总 RNA、 1μl 10mM dNTP 混合物、 1μl Oligo d(T)12-18(0.5μg/μl) 和至多 10μl 的经 DEPC 处理的水组成。各样品在 65℃温育 5 分钟, 然后置于冰上至少 1 分钟。按顺序加入下列各 组分, 以制备反应混合物 : 2μl 10X RT 缓冲液、 4μl 25mM MgC12、 2μl 0.1M DTT 和 1μl 去除 RNA 酶的重组 RNA 酶抑制剂 (Rnase OUT Recombinant RNase Inhibitor)。吸取 9μl 反应混合物到各 RNA/ 引物混合物, 轻柔混合。42℃温育 2 分钟, 在各管中加入 1μl Super Script IITM RT, 42℃温育 50 分钟。在 70℃终止反应 15 分钟, 冰上冷却。离心收集样品, 在各管中加入 1μl RNase H, 37℃温育 20 分钟。用 200pmoles 正向引物 ( 如图 75 所示的 变性引物, SEQ ID NO.149-156) 和 100pmoles 反向引物 (18 碱基的寡聚 d(T), 接一个随机 碱基 ) 进行第二次 PCR。
反应条件是 94℃ 2 分钟 ; 然后进行 40 个循环的 PCR : 94℃ 1 分钟, 45-60℃ 2 分钟, 72℃ 3 分钟 ; 最后 72℃再延伸额外的 10 分钟。
用 1%的琼脂糖凝胶电泳分析 10 微升的扩增样品。 将大小正确的条带从琼脂糖凝 胶上纯化出来。
实施例 4 : PCR 片段群体的产生
按 照 生 产 商 的 方 法 将 实 施 例 3 得 到 的 PCR 片 段 连 接 到 pGEM-T Easy Vector(Promega, Madison, Wisconsin) 中。用连接产物转化 JM109 感受态细胞, 涂在 LB 培 养基平板上, 进行蓝 / 白选择。选择克隆, 置于 96 孔板上在 1.2 毫升 LB 培养基中 37℃生长 过夜。对于所有选出的集落保留冻存管。用 Beckman′ s Biomeck 2000 小制备机器人技 术 (miniprep robotics) 以 Wizard SVMiniprep 试剂盒 (Promega) 从平板上纯化质粒。用 100μl 水洗脱质粒 DNA, 存贮于 96 孔板中。用 EcoRl 消化质粒, 并用 1%琼脂糖凝胶分析以 确证 DNA 的量和插入片段的大小。用 CEQ 2000 测序仪 (Beckman, Fullerton, California) 测序含有 400-600bp 插入片段的质粒。用 BLAST 搜索将测得的序列与 Genbank 数据库进行 比对。鉴定与 p450 相关的片段并进一步分析。或者, 将 p450 片段从差减文库中分离出来。 如上所述分析这些片段。
实施例 5 : CDNA 文库的构建如下所述从乙烯处理的叶片中制备总 RNA 以构建 cDNA 文库。首先, 用改良的酸酚 和氯仿提取方法从乙烯处理的烟草品系 58-33 叶片中提取总 RNA。改良的方法是用 1 克组 织进行研磨, 随后在 5 毫升加入了 5 毫升苯酚 (pH5.5) 和 5 毫升氯仿的提取缓冲液 (100mM Tris-HCl, pH 8.5 ; 200mM NaCl ; 10mM EDTA ; 0.5% SDS) 中涡旋。 将提取的样品离心, 保留上 清。该提取步骤再重复 2-3 次直到上清变得澄清。加入约 5 毫升氯仿以除去痕量的苯酚。 加入 3 倍体积的 ETOH 和 1/10 体积的 3M NaOAc(pH5.2) 以从混合的上清组分中沉淀 RNA, 在 -20℃存贮 1 小时。转移到 Corex 玻璃容器中以后, 在 4℃ 9,000RPM 离心 RNA 组分 45 分 钟。离心下来的团块用 70%乙醇洗涤, 4℃ 9,000RPM 离心 5 分钟。团块干燥以后, 将 RNA 团 块溶解在 0.5 毫升不含 Rnase 的水中。RNA 团块溶解在 0.5 毫升不含 Rnase 的水中。分别 用变性甲醛和分光光度计分析总 RNA 的质量和数量。
以 下 述 步 骤 用 Oligo(dT) 纤 维 素 方 法 (Invitrogen) 和 微 离 心 旋 转 柱 (Invitrogen) 从得到的总 RNA 中分离 poly A+RNA。约 20mg 总 RNA 进行两次纯化以获得高 质量的 poly A+RNA。 用变性甲醛和随后的已知全长基因的 RT-PCR( 确保高质量的 mRNA) 来 分析 PolyA+RNA 产物。
接 着, 以 poly A+RNA 作 模 板 用 cDNA 合 成 试 剂 盒、 合成试剂盒 和 III 金 克 隆 试 剂 盒 (gold cloning kit)(Stratagene, La Jolla, California) 来产生 cDNA 文库。其中的方法按照生产商规定的步骤来进行。用约 8μg polyA+RNA 来构建 cDNA 文库。初级文库的分析显示约有 2.5×106-1×107pfu。用 IPTG 和 X-gal 进行了互补分析, 以检测文库的质量背景, 其中重组噬菌斑的表达高出背景 反应 100 倍以上。
用随机 PCR 对文库进行的更为定量的分析表明, 插入的 cDNA 的平均大小约为 1.2kb。该方法采用了如下所述的两步法 PCR。对于第一步, 反向引物的设计是基于从 p450 片段获得的初级序列信息。设计的反向引物和 T3( 正向 ) 引物用于从 cDNA 文库中扩增相 应的基因。PCR 反应物进行琼脂糖凝胶电泳, 切割高分子量的相应条带, 纯化、 克隆并测序。 在第二步中, 用根据 p450 的 5′ UTR 或翻译起始区域设计的新引物作为正向引物, 和反向引 物一起 ( 根据 p450 的 3′ UTR 设计 ) 用于下一步的 PCR 以获得全长 p450 克隆。
如实施例 3 所述 ( 反向引物除外 ) 从构建的 cDNA 文库中用 PCR 扩增获得 p450 片 段。用位于质粒上 cDNA 插入片段下游 ( 见图 75) 的 T7 引物作为反向引物。如实施例 4 所 述分离、 克隆和测序 PCR 片段。 从构建的 cDNA 文库中用 PCR 方法分离全长 p450 基因。用基因特异性反向引物 ( 根据 p450 片段的下游序列设计 ) 和正向引物 ( 位于文库质粒上的 T3) 来克隆全长基因。 分离、 克隆并测序 PCR 片段。如果需要, 可进行第二步 PCR。在第二步 PCR 中, 用根据克隆 的 p450 的 5′ UTR 设计的新正向引物和根据 p450 的 3′ UTR 设计的反向引物来进行下一 步的 PCR 反应, 以获得全长 p450 克隆。然后对克隆测序。
实施例 6 : 克隆片段的鉴定 - 反向 SOUTHERN 印迹分析
在以上实施例中鉴定的所有 p450 克隆上进行非放射性大规模反向 southern 印迹 试验以检测差异性表达。观察到不同 p450 基因簇之间的表达水平非常不同。在高水平表 达的克隆上又进行了实时检测。
非放射性 southern 印迹方法按如下所述进行。
1) 如实施例 2 所述用 Qiagen Rnaeasy 试剂盒从乙烯处理和未处理的转化株 (58-33) 和非转化株 (58-25) 叶片提取总 RNA。
2) 用生物 素 加尾标记从 上 述步 骤产生 的富含 poly A+ 的 RNA 中衍 生 的单 链 cDNA 来 制 备 探 针。 该 标 记 的 单 链 cDNA 是 如 实 施 例 3 所 述 用 转 化 株 和 非 转 化 株 的 总 RNA(Invitrogen) 进行 RT-PCR 产生的, 但用了生物素化的寡聚 dT 作为引物 (Promega)。这 些用作探针与克隆的 DNA 杂交。
3) 用限制性内切酶 EcoRl 消化质粒 DNA, 进行琼脂糖凝胶电泳。将这些凝胶同 时干燥并转到两个尼龙膜上 一个膜与转化株探针杂交, 另一个膜与非转 化株探针杂交。在杂交之前将膜进行紫外线交联 ( 自动交联设备, 254nm, Stratagene, Stratalinker)。
或者, 用位于 p-GEM 两臂上的序列, T3 和 SP6 作为引物从各质粒中 PCR 扩增插入 片段。PCR 产物在 96 孔的即时 (Ready-to-run) 琼脂糖凝胶上电泳以进行分析。经确证的 插入片段点到两个尼龙膜上。一个膜与转化株探针杂交, 另一个膜与非转化株探针杂交。
4) 按生产商的说明书将这些膜杂交并洗涤, 其中对洗涤的严格性进行了改变 (Enzo MaxSenceTM 试剂盒, Enzo Diagnostics, Inc, Farmingdale, NY)。膜与杂交缓冲液 (2x SSC 缓冲的甲酰胺, 含有去垢剂和杂交增强剂 ) 在 42℃预杂交 30 分钟, 与 10μl 变性 68℃洗涤 的探针 42℃杂交过夜。然后室温用 1X 杂交洗涤缓冲液洗涤杂交膜一次, 10 分钟 ; 15 分钟, 4 次。然后可以对杂交膜进行检测。
5) 按生产商提供的检测方法 (Enzo Diagnostics, Inc.), 经洗涤的膜用碱性磷酸 酶标记, 然后用 NBT/BCIP 颜色检测方法进行检测。用 1X 封闭液室温封闭杂交膜 1 小时, 用 1X 检测试剂洗涤 10 分钟 (3 次 ), 用 1X 预显影反应缓冲液洗涤 5 分钟 (2 次 ), 然后在显影液 中显影直到出现点状印迹。所有的试剂都由生产商提供 (Enzo Diagnostics, Inc)。此外, TM 还用 KPL southern 杂交和检测试剂盒 按生产商的方法 (KPL, Gaithersburg, Maryland) 进行了大规模反向 Southern 试验。
实施例 7 : 克隆的鉴定 -NORTHERN 印迹分析
除 Southern 印迹分析之外, 如 Northern 印迹分析的实施例所述, 一些膜进行了 Northern 杂交和检测。如下所述, 采用 Northern 杂交检测烟草中差异表达的 mRNA。
采 用 随 机 引 发 方 法 从 克 隆 的 p450 制 备 探 针 (MegaprimeTM DNA 标 记 系 统, Amersham BiosCiences)。 混合下述组分 : 25ng 变性的 DNA 模板 ; 未标记的 dTTP、 dGTP 和 dCTP 各 4μl ; 5μl 反应缓冲液 ; P32 标记的 dATP 和 2ul Klenow I ; 以及水, 使反应体系达到 50μl。该混合物 在 37℃温育 1-4 小时, 然后以 2μ10.5M 的 EDTA 终止。使用前, 95℃温育 5 分钟使探针变 性。
从几对烟草品系经乙烯处理和未经处理的新鲜叶片中制备 RNA 样品。在有些情况 下, 使用了富含 poly A+ 的 RNA。 用 DEPC 水 (5-10μ1) 使约 15μg 总 RNA 或 1.8μg mRNA(RNA 或 mRNA 提取方法如实施例 5 所述 ) 的体积相同。加入等体积的上样缓冲液 (1 x MOPS ; 18.5%甲醛 ; 50%甲酰胺 ; 4% FiColl 400 ; 溴酚蓝 ) 和 0.55μl EtBr(0.5μg/μl)。将样 品变性, 准备用电泳分离 RNA。
将样品用 1XMOP 缓冲液 (0.4M 吗啉苯磺酸 ; 0.1M 乙酸钠 -3x H2O ; 10mM EDTA ; 用
NaOH 调 pH 至 7.2) 在甲醛凝胶 (1%琼脂糖, 1x MOPS, 0.6M 甲醛 ) 上电泳。 用毛细方法在 10X SSC 缓冲液 (1.5M NaCl ; 0.15M 柠檬酸钠 ) 中将 RNA 转移到 Hybond-N+ 上 (Nylon, Amersham PharmaciaBiotech)24 小时。 在杂交前, 将有 RNA 样品的膜紫外交联 ( 自动交联设备, 254nm, Stratagene, Stratalinker)。
膜和 5-10 毫升预杂交缓冲液 (5x SSC ; 50%甲酰胺 ; 5x Denhar dt′ s- 溶液 ; 1% SDS ; 100g/ml 热变性的平端非同源 DNA) 在 42℃预杂交 1-4 小时。将旧的预杂交缓冲液弃 去, 加入新的预杂交缓冲液和探针。杂交在 42℃过夜进行。用 2x SSC 室温洗涤膜 15 分钟, 然后用 2x SSC 洗涤一次。
本发明的一个主要焦点是发现了可被乙烯处理诱导的新基因或者在烟草叶片的 质量和成分中起主要作用的新基因。 如下表所示, Northern 印迹和反向 Southern 印迹可用 于测定哪些基因受乙烯处理的诱导 ( 相对于不受诱导的植株 )。 令人感兴趣的是, 在转化株 和非转化株植株中并非所有的片段都受到相似的影响。对感兴趣的细胞色素 p450 片段部 分测序以确定它们的结构相关性。该信息被用于后续分离和鉴定感兴趣的全长基因克隆。
用全长克隆在从乙烯处理诱导的转化株和非转化株白肋品系获得的烟草组织上 进行 Northern 分析。目的是鉴定在乙烯诱导的转化株植株中 ( 相对于乙烯诱导的转化株 品系相对于乙烯诱导的非转化株白肋品系 ) 表达有所提高的那些全长基因克隆。用这种 Northern 分析方法, 可以通过比较转化株和非转化株品系之间叶片组成的生化差异来确定 全长克隆的功能关系。如下表所示, 6 个克隆在乙烯处理的转化株植物组织中 ( 标记为 ++ 和 +++) 显示出比在乙烯处理的非转化株植物组织中 ( 标记为 +) 表达显著升高。在未经乙 烯处理的转化株和非转化株品系中所有这些克隆显示出很少的表达或不表达。
21102321641 A CN 102321648 全长克隆 D101-BA2 D207-AA5 D208-AC8 D237-AD1 D89-AB1 D90A-BB3
说明书非转化株 + + + + + +20/32 页转化株 ++ ++ +++ ++ ++ ++实施例 8 : 由克隆的基因编码的 p450S 的免疫检测
选择来自 3 个 p450 克隆的长度相应于 20-22 个氨基酸的肽区域, 这些肽区域 : 1) 与其它克隆具有很低的同源性或没有同源性, 和 2) 具有很好的亲水性和抗原性。下面列出 了选自各个 p450 克隆的肽区域的氨基酸序列。 将合成的肽与 KHL 偶联, 然后注射到家兔中。
第 4 次注射后 2 周和 4 周收集抗血清 (Alpha Diagnostic Intl.Inc.San Antonio, TX)。
D234-A D1DIDGSKSKLVKAHRKIDEILG
D90a-BB3 RDAFREKETFDENDVEELNY
D89-AB1 FKNNGDEDRHF SQKLGDLADKY
用 Western 印迹分析来检测抗血清对烟草植物组织靶蛋白的交叉活性。
从乙烯处理的 (0-40 小时 ) 转化株和非转化株品系的中等大小的叶片获得蛋白粗 提物。按生产商的方法用 RC DC 蛋白检测试剂盒 (BIO-RAD) 测定该提取物的蛋白浓度。
将 2 微克蛋白加到各泳道中, 用 Laemmli SDS-PAGE 体系在 10% -20%梯度凝胶 上分离蛋白。用 半干槽 (Semi-Dry cell)(BIO-RAD) 将蛋白从凝胶转移到 硝化纤维转移膜 (Schleicher & Schuell) 上。用 ECLAdvanceTM Western 印 迹检测试剂盒 (Amersham Biosciences) 检测和显影 p450 蛋白。在家兔中制备针对合成的 KLH 耦合物的一抗。针对兔 IgG 的二抗 ( 与过氧化物酶偶联 ) 购自 Sigma。一抗和二抗都 以 1 ∶ 1000 稀释液使用。抗体对 Western 印迹上的一条单一条带显示出很强的反应性, 说 明该抗血清对感兴趣的靶肽是单一特异性的。抗血清对与 KLH 耦合的合成肽也具有交叉反 应性。 实施例 9 : 分离的核酸片段的核酸同一性和结构相关性
超过 100 个克隆的 p450 片段结合 Northern 印迹分析来测序, 以确定它们的结构 相关性。所用方法中使用的正向引物基于两个共有的 p450 基序, 这两个基序邻近 p450 基 因的羧基末端。该正向引物对应于如图 1 所示的细胞色素 p450 基序 FXPERF 或 GRRXCP(A/ G)。反向引物使用来自质粒的标准引物 ( 位于 pGEMTM 质粒的两臂 )SP6 或 T7, 或使用多聚 A 尾巴。所用方法如下所述。
按生产商 (Beckman Coulter) 的方法用分光光度法评价起始双链 DNA 的浓度。将 模板用水稀释到合适的浓度, 95℃ 2 分钟加热变性, 然后置于冰上。测序反应液在冰上制
备, 其包括 0.5-10μl 变性 DNA 模板, 2μl 1.6pmole 正向引物, 8μl DTCS Quick Start Master Mix, 用水调节总体积到 20μl。温度循环程序包括以下 30 个循环 : 96 ℃ 20 秒, 50℃ 20 秒, 60℃ 4 分钟, 然后 4℃保温。
加入 5μl 终止缓冲液 ( 等体积的 3M NaOAc、 100mM EDTA 和 1μl20mg/ml 肝糖 ) 使 测序终止。 用 60μl 95%的冷乙醇沉淀样品, 6000g 离心 6 分钟。 弃去乙醇。 团块用 200μl 冷的 70%乙醇洗涤 2 次。团块干燥以后, 加入 40μl SLS 溶液, 使团块重悬。在表面上加入 一层矿物油。然后, 将样品置于 CEQ 8000 自动测序仪中进行进一步分析。
为了验证核酸序列, 用基于 p450 基因的 FXPERF 或 GRRXCP(A/G) 区域的正向引物 或基于质粒或多聚 A 尾巴的反向引物对核酸序列在两个方向进行重新测序。在两个方向上 所有的测序至少进行两次。
将细胞色素 p450 片段的核酸序列彼此比较, 从编码区 ( 与编码 GRRXCP(A/G) 的区 域之后的第一个核酸相对应 ) 一直到终止子。选择该区域作为 p450 蛋白遗传多态性的一 个指示参数。观察到大量的 ( 超过 70 种 ) 遗传上不同的 p450 基因, 类似于其它植物物种 中所观察到的。在比较核酸序列时发现, 这些基因根据其序列同一性可置于不同的序列组 群中。发现 p450 成员的最好的唯一的 (unique) 分组确定为那些具有 75%或更大核酸同 一性的序列 ( 见表 1)。降低同一性百分数导致组群明显变大。观察到优选的分组是那些 具有 81%或更大核酸同一性的序列, 更优选的分组是具有 91%或更大核酸同一性的序列, 最优选的分组是具有 99%或更大核酸同一性的序列。大多数组群包括至少 2 个成员, 经常 为 3 个或更多个成员。没有重复观察到其它情况, 说明所采用的方法既能够在所用组织中 分离低表达的 mRNA 又能够分离高表达的 mRNA。
基于 75 %或更大核酸同一性, 发现两个细胞色素 p450 组群与之前 ( 发现 ) 的 遗传上与这两个组群不同的烟草细胞色素基因具有核酸序列同一性。第 23 组在表 I 所 用的指数范围内, 显示出与之前分别由 Czernic 等和 Ralston 等提交的 GenBank 序列 GI : 1171579(CAA64635) 和 GI : 14423327( 或 AAK62346) 具有核酸同一性。GI : 1171579 与第 23 组成员的核酸同一性为 96.9% -99.5%, 而 GI : 14423327 与第 23 组成员的核酸同一性为 95.4% -96.9%。 第 31 组的成员与 Ralston 等提交的 GenBank 序列 GI : 14423319(AAK62342) 有 76.7% -97.8%的核酸同一性。表 1 中没有其它 p450 同一性组群在表 1 所用的参数范 围内与 Ralston 等、 Czernic 等、 Wang 等或 LaRosa 和 Smigocki 报道的烟草 p450 基因具有 同一性。
如图 76 所示, 对于各组, 可衍生合适的核酸变性探针的共有序列, 以优先从烟草 植物中鉴定和分离各组的其它成员。
表I: 烟草 p450 核酸序列同一性组群
组群 片段
1 D58-BG7(SEQ ID No. : 1), D58-AB1(SEQ ID No. : 3) ; D58-BE4(SEQ ID No. : 7)
2 D56-AH7(SEQ ID No. : 9) ; D13a-5(SEQID No. : 11)
3 D56-AG10(SEQ ID No. : 13) ; D35-33(SEQ ID No. : 15) ; D34-62(SEQ ID No. : 17)
4 D56-AA7(SEQ ID No. : 19) ; D56-AE1(SEQ ID No. : 21) ; 185-BD3(SEQID No. : 143)5 D35-BB7(SEQ ID No. : 23) ; D177-BA7(SEQ ID No. : 25) ; D56A-AB6(SEQ ID No. : 27) ; D144-AE2(SEQ ID No. : 29)
6 D56-AG11(SEQ ID No. : 31) ; D179-AA1(SEQ ID No. : 33)
7 D56-AC7(SEQ ID No. : 35) ; D144-AD1(SEQ ID No. : 37)
8 D144-AB5(SEQ ID No. : 39)
9 D181-AB5(SEQ ID No. : 41) ; D73-Ac9(SEQ ID No. : 43)
10 D56-AC12(SEQ ID No. : 45)
11 D58-AB9(SEQID No. : 47) ; D56-AG9(SEQ ID No. : 49) ; D56-AG6(SEQ ID No. : 51) ; D35-BGll(SEQ ID No. : 53) ; D35-42(SEQ ID No. : 55) ;
D35-BA3(SEQ ID No. : 57) ; D34-57(SEQ ID No. : 59) ; D34-52(SEQ ID No. : 61) ; D34-25(SEQID No. : 63)
12 D56-AD10(SEQID No. : 65)
13 56-AA11(SEQ ID No. : 67)
14 D177-BD5(SEQ ID No. : 69) ; D177-BD7(SEQ ID No. : 83)
15 D56A-AG10(SEQ ID No. : 71) ; D58-BC5(SEQ ID No. : 73) ; D58-AD12(SEQ ID No. : 75)
16 D56-AC11(SEQ ID No. : 77) ; D35-39(SEQ ID No. : 79) ; D58-BH4(SEQ ID No. : 81) ; D56-AD6(SEQ ID No. : 87)
17 D73A-AD6(SEQ ID No. : 89) ; D70A-BA11(SEQ ID No. : 91)
18 D70A-AB5(SEQ ID No. : 95) ; D70A-AA8(SEQ ID No. : 97)
19 D70A-AB8(SEQ ID No. : 99) ; D70A-BH2(SEQ ID No. : 101) ; D70A-AA4(SEQ ID No. : 103)
20 D70A-BA1(SEQ ID No. : 105) ; D70A-BA9(SEQ ID No. : 107)
21 D70A-BD4(SEQ ID No. : 109)
22 D181-AC5(SEQ ID No. : 111) ; D144-AH1(SEQ ID No. : 113) ; D34-65(SEQ ID No. : 115)
23 D35-BG2(SEQ ID No. : 117)
24 D73A-AH7(SEQ ID No. : 119)
25 D58-AA1(SEQ ID No. : 121) ; D185-BC1(SEQID No. : 133) ; D185-BG2(SEQ ID No. : 135)
26 D73-AE10(SEQ ID No. : 123)
27 D56-AC12(SEQ ID No. : 125)
28 D177-BF7(SEQ ID No. : 127) ; D185-BE1(SEQ ID No. : 137) ; D185-BD2(SEQ ID No. : 139)
29 D73A-AG3(SEQ ID No. : 129)
30 D70A-AA12(SEQ ID No. : 131) ; D176-BF2(SEQ ID No. : 85)
31 D176-BC3(SEQ ID No. : 145)
32 D176-BB3(SEQ ID No. : 147)
33 D186-AH4(SEQ ID No. : 5)实施例 10 : 分离的核酸片段的相关氨基酸序列同一性
推测实施例 8 中获得的细胞色素 p450 片段的核酸序列的氨基酸序列。被推测的 区域对应于紧跟在 GXRXCP(A/G) 序列基序之后的氨基酸到羧基末端, 或终止子。在比较片 段的序列同一性时, 氨基酸同一性为 70 %或更大的那些序列观察到唯一的分组 (unique grouping)。氨基酸同一性为 80%或更大的那些序列观察到优选的分组, 更优选为 90%氨 基酸同一性或更大, 最优选的分组是氨基酸同一性为 99%或更大的那些序列。组群和组群 成员的相应氨基酸序列示于图 2。 发现这些唯一的 (unique) 氨基酸序列中的几个与其它序 列具有完全的序列同一性, 因此只报道了具有相同氨基酸的一个成员。
根据它们的核苷酸序列, 表 II 第 19 组的氨基酸同一性对应于 3 个不同的组群。 各 组成员的氨基酸序列和它们的同一性示于图 77。相应标示了氨基酸差异。
选择了各氨基酸同一性组群中的至少一个成员用植物进行基因克隆和功能性研 究。此外, 经 Northern 和 Southern 分析评定为受乙烯处理的影响不同或具有其它生物学 差异的组群成员也被选择作基因克隆和功能研究。为有助于基因克隆, 将基于序列同一性 和差异序列进行表达研究和完整植物评价以及肽特异性抗体的制备。
表 II : 烟草 p450 氨基酸序列同一性分组
组群 片段
1 D58-BG7(SEQ ID No. : 2), D58-AB1(SEQ ID No. : 4)
2 D58-BE4(SEQ ID No. : 8)
3 D56-AH7(SEQ ID No. : 10) ; D13a-5(SEQ ID No. : 12)
4 D56-AG10(SEQ ID No. : 14) ; D34-62(SEQ ID No. : 18)
5 D56-AA7(SEQ ID No. : 20) ; D56-AE1(SEQ ID No. : 22) ; 185-BD3(SEQ ID No. : 144)
6 D35-BB7(SEQ ID No. : 24) ; D177-BA7(SEQ ID No. : 26) ; D56A-AB6(SEQ ID No. : 28) ; D144-AE2(SEQID No. : 30)
7 D56-AG11(SEQID No. : 32) ; D179-AA1(SEQ ID No. : 34)
8 D56-AC7(SEQ ID No. : 36) ; D144-AD1(SEQ ID No. : 38)
9 D144-AB5(SEQID No. : 40)
10 D181-AB5(SEQID No. : 42) ; D73-Ac9(SEQ ID No. : 44)
11 D56-AC12(SEQ ID No. : 46)
12 D58-AB9(SEQ ID No. : 48) ; D56-AG9(SEQ ID No. : 50) ; D56-AG6(SEQ ID No. : 52) ; D35-BG11(SEQ ID No. : 54) ; D35-42(SEQ ID No. : 56) ;
D35-BA3(SEQ ID No. : 58) ; D34-57(SEQ ID No. : 60) ; D34-52(SEQ ID No. : 62)
13 D56AD10(SEQ ID No. : 66)
14 56-AA11(SEQ ID No. : 68)
15 D177-BD5(SEQ ID No. : 70) ; D177-BD7(SEQ ID No. : 84)
16 D56A-AG10(SEQ ID No. : 72) ; D58-BC5(SEQID No. : 74) ; D58-AD12(SEQ ID No. : 76)
17 D56-AC11(SEQ ID No. : 78) ; D56-AD6(SEQ ID No. : 88)
18 D73A-AD6(SEQ ID No.90 : )19 D70A-AB5(SEQ ID No. : 96) ; D70A-AB8(SEQ ID No. : 100) ; D70A-BH2(SEQ ID No. : 102) ; D70A-AA4(SEQ ID No. : 104) ; D70A-BA1(SEQ ID No. : 106) ; D70A-BA9(SEQID No. : 108)
20 D70A-BD4(SEQ ID No. : 110)
21 D181-AC5(SEQID No. : 112) ; D144-AH1(SEQID No. : 114) ; D34-65(SEQ ID No. : 116)
22 D35-BG2(SEQ ID No. : 118)
23 D73A-AH7(SEQID No. : 120)
24 D58-AA1(SEQID No. : 122) ; D185-BC1(SEQ IDNo. : 134) ; D185-BG2(SEQ ID No. : 136)
25 D73-AE10(SEQ ID No. : 124)
26 D56-AC12(SEQ ID No. : 126)
27 D177-BF7(SEQ ID No. : 128) ; 185-BD2(SEQ ID No. : 140)
28 D73A-AG3(SEQ ID No. : 130)
29 D70A-AA12(SEQ ID No. : 132) ; D176-BF2(SEQ ID No. : 86)
30 D176-BC3(SEQ ID No. : 146)
31 D176-BB3(SEQ ID No. : 148)
32 D186-AH4(SEQ ID No. : 6)
实施例 11 : 全长克隆的相关氨基酸序列同一性
推测实施例 5 中克隆的烟草全长基因核酸序列的完整氨基酸序列。通过 3 个保守 p450 结构域基序的存在来鉴定细胞色素 p450 基因, 所述 3 个保守 p450 结构域基序对应于 羧基末端的 UXXRXXZ、 PXRFXF 或 GXRXC, 其中 U 是 E 或 K, X 是任何氨基酸, Z 是 P、 T、 S 或 M。 还注意到这些克隆中的两个, D130-AA1 和 D101-BA2 几乎是完整的但缺少合适的终止子, 然 而它们都含有上述的 3 个 p450 细胞色素结构域。用 BLAST 程序鉴定所有 p450 具有的氨 基酸同一性, 把它们的全长序列彼此比较并且和已知的烟草基因比较。该程序使用了 NCBI 特定的 BLAST 工具 ( 两序列比对 (Align two sequences, bl2seq), http://www.ncbi.nlm. nih.oov/blast/bl2sea7bl2.html)。在没有过滤器的情况下用 BLASTN 比对两个核酸序列, 用 BLASTP 比对氨基酸序列。基于它们的氨基酸同一性百分比, 将各序列分到同一性组群 中, 其中各组群中包括的成员与另一个成员至少具有 85%同一性。氨基酸同一性为 90%或 更大的那些序列观察到优选的分组, 更优选的分组具有 95%氨基酸同一性或更大, 最优选 的分组具有氨基酸同一性为 99%或更大的那些序列。 采用这些标准, 鉴定出 25 个不同的组 群, 示于表 III。
在表 III 用于氨基酸同一性的参数范围内, 发现 3 个组群与已知烟草基因具有 大于 85 %或更大的同一性。第 5 组的成员与先前 Ralston 等提交的 GenBank 序列 GI : 14423327( 或 AAK62346) 具有高达 96%的全长序列氨基酸同一性。第 23 组与 Ralston 等 提交的 GI : 14423328( 或 AAK62347) 有高达 93%的氨基酸同一性。第 24 组与 Ralston 等 提交的 GI : 14423318( 或 AAK62343) 有 92%的氨基酸同一性。
表 III : 烟草全长 p450 基因的氨基酸序列同一性组群
1 D208-AD9(SEQ.ID.No.224) ; D120-AH4(SEQ.ID.No.180) ; D121-AA8(SEQ.ID.No.182), D122-AF10(SEQ.ID.No.184) ; D103-AH3(SEQ.ID.No.222) ; D208-AC8(SEQ. ID.No.218) ; D-235-ABI(SEQ.ID.No.246)
2 D244-AD4(SEQ.ID.No.250) ; D244-AB6(SEQ.ID.No.274) ; D285-AA8 ; D285-AB9 ; D268-AE2(SEQ.ID.No.270)
3 D100A-AC3(SEQ.ID.No.168) ; D100A-BE2
4 D205-BE9(SEQ.ID.No.276) ; D205-BG9(SEQ.ID.No.202) ; D205-AH4(SEQ. ID.No.294)
5 D259-AB9(SEQ.ID.No.260) ; D257-AE4(SEQ.ID.No.268) ; D147-AD3(SEQ. ID.No.194)
6 D249-AE8(SEQ.ID.No.256) ; D-248-AA6(SEQ.ID.No.254)
7 D233-AG7(SEQ.ID.No.266 ; D224-BD11(SEQ.ID.No.240) ; DAF10
8 D105-AD6(SEQ.ID.No 172) ; D215-AB5(SEQ.ID.No 220) ; D135-AE1(SEQ. ID.No.190)
9 D87A-AF3(SEQ.ID.No.216), D210-BD4(SEQ.ID.No.262)
10 D89-AB1(SEQ.ID.No.150) ; D89-AD2(SEQ.ID.No.152) ; 163-AG11(SEQ. ID.No.198) ; 163-AF12(SEQ.ID.No.196) 11 D267-AF10(SEQ.ID.No.296) ; D96-AC2(SEQ.ID.No.160) ; D96-AB6(SEQ. ID.No.158) ; D207-AA5(SEQ.ID.No.204) ; D207-AB4(SEQ.ID.No.206) ; D207-AC4(SEQ. ID.No.208)
12 D98-AG1(SEQ.ID.No.164) ; D98-AA1(SEQ.ID.No.162)
13 D209-AA12(SEQ.ID.No.212) ; D209-AA11 ; D209-AH10(SEQ.ID.No.214) ; D209-AH12(SEQ.ID.No.232) ; D90a-BB3(SEQ.ID.No.154)
14 D129-AD10(SEQ.ID.No.188) ; D104A-AE8(SEQ.ID.No.170)
15 D228-AH8(SEQ.ID.No.244) ; D228-AD7(SEQ.ID.No.241), D250-AC11(SEQ. ID.No.258) ; D247-AH1(SEQ.ID.No.252)
16 D128-AB7(SEQ.ID.No.186) ; D243-AA2(SEQ.ID.No.248) ; D125-AF11(SEQ. ID.No.228)
17 D284-AH5(SEQ.ID.No.298) ; D110-AF12(SEQ.ID.No.176)
18 D221-BB8(SEQ.ID.No.234)
19 D222-BH4(SEQ.ID.No.236)
20 D134-AE11(SEQ.ID.No.230)
21 D109-AH8(SEQ.ID.No.174)
22 D136-AF4(SEQ.ID.No.278)
23 D237-AD1(SEQ.ID.No.226)
24 D112-AA5(SEQ.ID.No.178)
25 D283-AC1(SEQ.ID.No.272)
根据靠近羧基末端的 UXXRXXZ p450 结构域和 GXRXC p450 结构域之间高度保守的 氨基酸同源性进一步将这些全长基因分组。如图 3 所示, 比对各克隆保守结构域彼此之间 的序列同源性, 并将这些克隆分到不同的同源性组群中。 在几种情况下, 虽然某克隆的核酸
序列是不同的, 但该区域的氨基酸序列是相同的。氨基酸同一性为 90%或更大的那些序列 观察到优选的分组, 更优选的分组具有 95%氨基酸同一性或更大, 最优选的分组具有氨基 酸同一性为 99%或更大的那些序列。 最终的分组类似于根据这些克隆的完整氨基酸序列的 同一性百分比而做的分组, 第 17 组除外 ( 表 III), 它被分为 2 个不同的组。
在表 IV 用于氨基酸同一性的参数范围内, 发现 3 个组群与已知烟草基因具有 90% 或更大的同一性。第 5 组的成员与先前 Ralston 等提交的 GenBank 序列 GI : 14423326( 或 AAK62346) 具有高达 93.4%的全长序列氨基酸同一性。第 23 组与 Ralston 等提交的 GI : 14423328( 或 AAK62347) 有高达 91.8%的氨基酸同一性。第 24 组与 Ralston 等提交的 GI : 14423318( 或 AAK62342) 有 98.8%的同一性。
表 IV : 烟草 p450 基因保守结构域之间区域的氨基酸序列同一性组群
1 1 D208-AD9(SEQ.ID.No.224) ; D120-AH4(SEQ.ID.No.180) ; D121-AA8(SEQ. ID.No.182), D122-AF10(SEQ.ID.No.184) ; D103-AH3(SEQ.ID.No.222) ; D208-AC8(SEQ. ID.No.218) ; D-235-ABI(SEQ.ID.No.246)
2 D244-AD4(SEQ.ID.No.250) ; D244-AB6(SEQ.ID.No.274) ; D285-AA8 ; D285-AB9 ; D268-AE2(SEQ.ID.No.270)
3 D100A-AC3(SEQ.ID.No.168) ; D100A-BE2
4 D205-BE9(SEQ.ID.No.276) ; D205-BG9(SEQ.ID.No.202) ; D205-AH4(SEQ. ID.No.294)
5 D259-AB9(SEQ.ID.No.260) ; D257-AE4(SEQ.ID.No.268) ; D147-AD3(SEQ. ID.No.194)
6 D249-AE8(SEQ.ID.No.256) ; D-248-AA6(SEQ.ID.No.254)
7 D233-AG7(SEQ.ID.No.266 ; D224-BD11(SEQ.ID.No.240) ; DAF10
8 D105-AD6(SEQ.ID.No.172) ; D215-AB5(SEQ.ID.No.220) ; D135-AE1(SEQ. ID.No.190)
9 D87A-AF3(SEQ.ID.No.216), D210-BD4(SEQ.ID.No.262)
10 D89-AB1(SEQ.ID.No.150) ; D89-AD2(SEQ.ID.No.152) ; 163-AG11(SEQ. ID.No.198) ; 163-AF12(SEQ.ID.No.196)
11 D267-AF10(SEQ.ID.No.296) ; D96-AC2(SEQ.ID.No.160) ; D96-AB6(SEQ. ID.No.158) ; D207-AA5(SEQ.ID.No.204) ; D207-AB4(SEQ.ID.No.206) ; D207-AC4(SEQ. ID.No.208)
12 D98-AG1(SEQ.ID.No.164) ; D98-AA1(SEQ.ID.No.162)
13 D209-AA12(SEQ.ID.No.212) ; D209-AA11 ; D209-AH10(SEQ.ID.No.214) ; D209-AH12(SEQ.ID.No.232) ; D90a-BB3(SEQ.ID.No.154)
14 D129-AD10(SEQ.ID.No.188) ; D104A-AE8(SEQ.ID.No.170)
15 D228-AH8(SEQ.ID.No.244) ; D228-AD7(SEQ.ID.No.241), D250-AC11(SEQ. ID.No.258) ; D247-AH1(SEQ.ID.No.252)
16 D128-AB7(SEQ.ID.No.186) ; D243-AA2(SEQ.ID.No.248) ; D125-AF11(SEQ. ID.No.228)
17 D284-AH5(SEQ.ID.No.298) ; D110-AF12(SEQ.ID.No.176)18 D221-BB8(SEQ.ID.No.234)
19 D222-BH4(SEQ.ID.No.236)
20 D134-AE11(SEQ.ID.No.230)
21 D109-AH8(SEQ.ID.No.174)
22 D136-AF4(SEQ.ID.No.278)
23 D237-AD1(SEQ.ID.No.226)
24 D112-AA5(SEQ.ID.No.178)
25 D283-AC1(SEQ.ID.No.272)
26 D110-AF12(SEQ.ID.No.176)
实施例 12 : 缺少一个或多个烟草细胞色素 p450 特异性结构域的烟草细胞色素 p450 克隆
4 个克隆与表 III 报道的其它烟草细胞色素基因具有高度的核酸同源性, 核酸同 源性介于 90%至 99%之间。 这 4 个克隆包括 D136-AD5、 D138-AD12、 D243-AB3 和 D250-AC11。 然而, 因为核苷酸移码框的原因, 这些基因不含有细胞色素 p450C- 末端的 3 个结构域中的 一个或多个, 因此排除在表 III 和 IV 所示的同一性组群之外。
有一个克隆, D95-AG1 的氨基酸同一性不含有第 3 个结构域 GXRXC, 该结构域用来 对表 III 或表 IV 中的 p450 烟草基因分组。该克隆的核酸同源性与其它烟草细胞色素基因 的同源性低。该克隆代表了烟草中细胞色素 p450 基因的一个新的、 不同的组群。
实施例 13 : 烟草细胞色素 p450 片段和克隆在改变烟草性质调控方面的应用
烟草 p450 核酸片段或整个基因可用于鉴定和选择烟草表型或组成有所改变的植 株, 更重要的是, 可用于鉴定和选择代谢物发生了变化的植株。用例如以反义方向 ( 用于下 调 ) 或有义方向 ( 用于上调 ) 将掺入选自本文所述的核酸片段或全长基因的多种转化系统 来产生转基因烟草植物。对于全长基因的过量表达, 编码本文所述全长基因的完整或功能 性部分或氨基酸序列的任何核酸序列都是理想的, 它们可有效增加某个酶的表达并因此在 烟草中产生表型效果。 通过一系列的回交获得纯合烟草品系, 并评价其表型变化, 包括但不 限于, 用本领域一般技术人员可获得的常用技术来分析内源性 p450RNA、 转录物、 p450 表达 的肽和植物代谢物的浓度。
烟草植物中表现出来的变化提供了感兴趣的所选基因的功能性作用的信息, 或者 可用作优选的烟草植物品种。
实施例 14 : 鉴定乙烯处理的转化株品系中诱导的基因
采 用 高 密 度 寡 核 苷 酸 阵 列 技 术, Affymetrix 基 因 芯 片(Affymetrix Inc., Santa Clara, CA) 阵列来进行基因表达的定量和高度平行性检测。在 使用该技术时, 通过在固体表面上直接合成寡核苷酸来制作核酸阵列。这种固相化学能够 产生含有数十万个寡核苷酸探针的阵列, 这些寡核苷酸探针以极高的密度压缩在芯片上, 这种芯片称为 可由一个杂交同时筛选几千个基因。每个基因通常由一组的 11-25 对探针来代表, 这取决于基因的大小。设计探针以使其具有最大的敏感性、 特异性和 可重复性, 从而使其总是可以分辨出特异性和背景信号以及密切相关的靶序列。
Affymetrix 基因芯片杂交试验包括下列步骤 : 设计和制备阵列, 从分离自生物样 品的 RNA 中制备荧光标记的靶, 标记的靶与基因芯片杂交, 筛选芯片, 分析扫描的图像, 产生基因表达谱。
A.Affymetrix 基因芯片的设计和定制
定 制 A f f y m e t r i x I n c . ( S a n t a C l a r a ,C A ) 生 产 的 G e n e C h i p CustomExpressAdvantage Array。芯片的大小是 18 微米, 芯片的格式是 100-2187, 可容纳 528 组探针 (11,628 个探针 )。除了来自 GenBank 的核酸序列之外, 所有序列都选自我们之 前鉴定出的烟草克隆, 所有探针都是定制设计的。共选择了 400 个烟草基因或片段包括在 基因芯片中。所选择的寡核苷酸的序列是基于基因 3’ 末端的独特区域。所选择的核酸序 列由如 ( 本专利申请 ) 所述从烟草中克隆的 56 个全长 p450 基因和 71 个 p450 片段组成。 其它烟草序列包括 270 个烟草 EST, 用 Clontech SSH 试剂盒 (BD Biosciences, Palo Alto, CA) 从抑制差减文库产生了这些 EST。在这些基因中, 一些寡核苷酸序列选自 GenBank 所列 的细胞色素 p450 基因。多达 25 个探针用于每个全长基因, 11 个探针用于每个片段。因为 缺乏独特的、 高质量的探针, 有些克隆所用的探针数目要少。 中也包括了合适 的对照序列。
探针阵列是 25 聚寡核苷酸, 用基于半导体的光刻蚀法结合固相化学合成技术将 这些寡核苷酸直接合成到玻璃片上。各阵列含有多达 100,000 个不同的寡核苷酸探针。因 为寡核苷酸探针合成在阵列中已知的位置上, 所以可用 Affymetrix Microarray 软 件将杂交模式和信号强度解释为基因同一性和相对表达水平。 各探针对由一个完全配对的 寡核苷酸和一个错配的寡核苷酸组成。完全配对的探针具有与特定基因准确互补的序列, 因此可检测该基因的表达。错配探针在其碱基的中心位置有一个碱基置换, 因此区别于完 全配对的探针, 所述的一个碱基置换干扰了靶基因转录物的结合。错配产生非特异性的杂 交信号或背景信号, 将该信号与完全配对的寡核苷酸检测到的信号比较。
B. 样品制备
杂交试验由 Genome Explorations, Inc.(Memphis, TN) 进行, 杂交中所用的 RNA 样 品由 6 对受乙烯诱导的非转化株 / 转化株等基因系组成。
这些样品包括 1 对 4407-25/4407-33 未处理的白肋烟草样品, 3 对乙烯处理的 4407-25/4407-33 样品, 1 对乙烯处理的深色烟草 NL Madole/181 和 1 对乙烯处理的白肋变 种 PBLB01/178。乙烯处理如实施例 1 所述。
用改良的酸酚和氯仿方法从上述乙烯处理和未处理的叶片中提取总 RNA。改良的 方法是用 1 克组织进行研磨, 随后在 5 毫升加入了 5 毫升苯酚 (pH5.5) 和 5 毫升氯仿的提 取缓冲液 (100mM Tris-HCl, pH 8.5 ; 200mMNaCl ; 10mM EDTA ; 0.5% SDS) 中涡旋。 将提取的 样品离心, 保留上清。该提取步骤再重复 2-3 次直到上清变得澄清。加入约 5 毫升氯仿以 除去痕量的苯酚。加入 3 倍体积的 ETOH 和 1/10 体积的 3M NaOAc(pH5.2) 以从混合的上清 组分中沉淀 RNA, 在 -20℃存贮 1 小时。转移到 Corex 玻璃容器中以后, 在 4℃ 9,000RPM 离 心 RNA 组分 45 分钟。离心下来的团块用 70%乙醇洗涤, 4℃ 9,000RPM 离心 5 分钟。团块 干燥以后, 将 RNA 团块溶解在 0.5 毫升不含 Rnase 的水中。RNA 团块溶解在 0.5 毫升不含 Rnase 的水中。分别用变性甲醛凝胶和分光光度计分析总 RNA 的质量和数量。3-5μg/μl 的总 RNA 样品送至 Genomeexplorations, inc. 进行杂交试验。
C. 杂交、 检测和数据输出
如下所述制备标记的 RNA 材料。 按生产商的方法用 SuperScript 双链 cDNA 合成试剂盒 (Gibco Life Technologies) 和寡 -dT24-T7(5′ -GGC CAGTGA ATT GTA ATA CGA CTC ACT ATA GGG AGGCGG-3′ ) 引物从 5-15μg 总 RNA 中合成第一链和第二链 cDNA。
T7 启 动 子 连 接 的 双 链 cDNA 作 为 模 板, 用 T7RNA 转 录 物 标 记 试 剂 盒 (ENZO Diagnostics Inc.) 通过体外转录同时合成并用生物素化的 UTP 和 CTP 来标记 cRNA。简 言之, 用 70 %乙醇洗涤前述步骤中合成的双链 cDNA, 重新悬浮在 22μl 不含 RNA 酶的水 中。cDNA 与下列物质一起 37℃温育 5 小时 : 10X 的反应缓冲液、 生物素标记的核糖核苷酸、 DTT、 RNA 酶抑制剂混合物各 4μl, 以及 2μl 20X T7RNA 多聚酶。经过 CHROMA SPIN-100 柱 (Clontech) 并在 -20℃沉淀 1 小时至过夜, 将标记上的 RNA 与未掺入的核糖核苷酸分离。
如下所述进行寡核苷酸阵列杂交和分析。将 RNA 团块重新悬浮在 10μl 不含 RNA 酶的水中, 10.0μg 在 200mM Tris- 乙酸, pH 8.1, 500mM KOAc, 150mM MgOAc 中 95 ℃ 下 用 热 和 离 子 介 导 的 水 解 片 段 化 35 分 钟。 片 段 化 的 cRNA 与 HG_U95Av2 寡 核 苷 酸 阵 列 (Affymetrix)45 ℃杂交 16 小时, 该寡核苷酸阵列上含有约 12,500 个经注释的全长 基因以及设计用于代表 EST 序列的其它探针组。用 6X SSPE(0.9M NaCl, 60mM NaH2PO4, 6mM EDTA+0.01 % Tween20)25 ℃ 下 洗 涤 阵 列, 然 后 50 ℃ 下 用 100mM MES、 0.1M[Na+]、 0.01% Tween20 进行严格条件下的洗涤。以藻红素 (phycoerythrein) 偶联的链霉亲和素 (Molecular Probes) 对阵列染色, 用激光共聚焦扫描仪 (Hewlett-Packard) 来测定荧光强 度。用 Microarray 软件 (Affymetrix) 分析扫描的图像。对于所用的所有阵列, 通过将某 阵列上所有基因的平均荧光强度校正 (scaling) 到恒定的目标强度 (250) 来使上样和染色 中的差异标准化。按用户指南用 Microarray Suite5.0(Affymetrix) 进行数据分析。各基 因的信号强度计算为平均强度差异, 以 [ ∑ (PM-MM)/( 探针对的数目 )] 代表, 其中 PM 和 MM 标示完全配对和错配的探针。
D. 数据分析和结果
Genome Explorations 的检测仪器产生的表达报告证实, 12 组杂交是成功的。该 报告上主要的参数包括噪音、 校正因子、 背景、 总探针组、 存在和不存在的探针组的数目和 百分比、 管家基因对照的信号强度。然后, 用 GCOS 结合其它 Microsoft 的软件来分析和表 示数据。分析了处理的各对之间的信号对比。经过不同处理的基因和片段所对应的各探针 的总体数据被编译, 分析编译的表达数据, 如变化呼叫 (call of the changes) 和信号 LOG 2 比例变化。
基因芯片技术的一个常规用途是发现在不同组织中有差异性表达的基因。在 本发明中, 通过成对的转化株和非转化株烟草品系, 包括 4407-25/4407-33 白肋变种、 PBLB01/178 白肋变种和 NL Madole/181 深色烟草变种, 测定了乙烯处理引起的遗传表达变 化。这些分析只检测由于生物学变化而使其表达发生了显著改变的那些基因。这些分析采 用了倍数 (Fold) 变化 ( 信号比率 ) 作为鉴定受诱导基因的重要标准。还考虑了其它参数, 如信号密度、 存在 / 不存在呼叫。
在分析了转化株和非转化株样品对中约 400 个基因表达差异的数据之后, 基于信 号强度的结果说明, 与非转化株品系相比, 只有两个基因 D121-AA8 和 D120-AH4 在转化株品 系中可重复地被乙烯处理所诱导。 如下所述表示这些数据, 以说明这些基因的差异性表达。 如表 V 所示, 在转化株品系, 例如白肋烟草变种 4407-33 中, 某基因的信号测定为与相关的 非转化株等基因品系 4407-25 的比率。在没有乙烯诱导时, 对于所有基因, 转化株与非转化株信号的比率都接近于 1.00。用 3 种独立的分析方法对等基因白肋品系的分析证明, 受乙 烯诱导时, 相对于非转化株品系, 两个基因 D121-AA8 和 D120-AH4 在转化株品系中受到诱 导。这些基因是彼此高度同源的, 约有 99.8%或更大的核酸序列同源性。如表 V 所示, 它们 在转化株品系中的相对杂交信号约比相应的非转化株品系中高 2-12 倍。相比较的, 根据两 个肌动蛋白样对照克隆 ( 内部对照 ) 标准化的比例, 没有发现它们在转化株品系中受诱导。 此外, 片段 D35-BG11( 其编码区的序列完全包含在 D121-AA8 和 D120-AH4 基因中 ) 在成对 的等基因转化株和非转化株品系的相同样品中被高水平诱导。 白肋烟草变种的另一个等基 因对, PBLB01 和 178 被显示具有相同的基因 D121-AA8 和 D120-AH4, 乙烯处理时在转化株中 受诱导。此外, D121-AA8 和 D120-AH4 基因优先在等基因深色烟草对 NL Madole 和 181 的 转化株品系中受诱导, 证明这些基因在转化株品系中的乙烯诱导不限于白肋烟草变种。在 所有情况下, 相对于相应的非转化株品系, D35-BG11 片段在转化株品系中都是受诱导最高 的一个。
表V: 乙烯处理的转化株和非转化株品系中克隆诱导的比较
实施例 15 : 克隆相关的 D35-BG11 全长基因
基因芯片杂交基于 3′反转录 (cRNA)。选自基因 3′端 ( 在下游 1000 个核苷酸的 区域中 ) 的探针在基因芯片上合成。因此, 为了获得 D121-AA8 和 D120-AH4 克隆的所有可 能的变化形式, 用 5′序列从烟草 cDNA 文库中进行了另外的克隆。
全长基因克隆自如实施例 5 所述从乙烯处理的 4407-33 组织中构建的 cDNA 文库。 采用如下所述的聚合酶链式反应法。基于 D121-AA8 基因的 3′序列 ( 包括非翻译区部分 ) 设计反向引物。D121-P2 引物 5′ -AGC AAG ATG ATCTTA GGT TTTAA-3′和 D 121-R-2 引 物 5′ -CAA GCA AGA TGA TCT TAG GTT TTA ATA AAG CTC AGGT-3′。T3 引物 (5′ CAA TTA ACC CTC ACTAAA GGG 3′ ) 位于质粒上插入片段的上游, 用作正向引物。 产生的 PCR 产 物进行琼脂糖电泳, 切下高分子量的相应条带, 纯化、 克隆并测序。用于克隆和测序的方法 如实施例 4 所述。测序和鉴定了 9 个新的克隆, 它们是 D425-AB10、 D425-AB11、 D425-AC9、 D425-AC10、 D425-AC11、 D425-AG11、 D425-AH7、 D425-AH11 和 D427-AA5。观察到这些克隆中 的每一个都与克隆 D121-AA8 和 D120-AH4 具有 99%或更大的核酸序列同一性。
实施例 16 : 烟草转化株品系中微粒体烟碱去甲基酶的乙烯诱导
如下所述, 对乙烯处理和非处理的成对的转化株和非转化株中富含微粒体的组分 中去甲基酶的酶活进行生化分析。
A. 微粒体的制备
在 4℃分离微粒体。 在由 50mM N-(2- 羟基乙基 ) 哌嗪 -N′ -(2- 乙磺酸 )(HEPES), pH 7.5, 3mM DL- 二硫苏糖醇 (DTT) 和蛋白酶抑制剂 Cocktail(Roche)(1 片 /50 毫升 ) 组 成的缓冲液中提取烟草叶片。粗提物通过 4 层粗棉布 (cheesecloth) 过滤以除去未打碎的 组织, 滤出液 20,000x g 离心 20 分钟以除去细胞碎片。将上清以 100,000x g 超离心 60 分 钟, 得到的上清即含有微粒体。将微粒体组分悬浮在提取缓冲液中, 进行超离心步骤, 其中 提取缓冲液中采用 0.5M 的不连续蔗糖梯度。将纯化的微粒体重新悬浮在添加了 10% (w/ v) 甘油作为低温保护剂的提取缓冲液中。将此微粒体制品存贮在液氮冷藏罐中直到使用。
B. 蛋白浓度测定
用溶解在丙酮中的 10%三氯乙酸 (TCA)(w/v) 沉淀微粒体蛋白, 用 RC DC 蛋白检测 试剂盒 (BIO-RAD) 按生产商的方法测定微粒体的蛋白浓度。
3. 烟碱去甲基酶活性试验 DL- 烟碱 ( 吡咯烷 -2-14C) 获得自 Moravek Biochemicals, 比活为 54mCi/mmol。 氯 丙嗪 (CPZ) 和氧化的细胞色素 (Cyt.C)( 二者均为 P450 抑制剂 ) 购自 Sigma。还原型烟酰 胺腺嘌呤二核苷酸磷酸盐 (NADPH) 是细胞色素 P450 的典型电子供体, 它通过 NADPH : 细胞 色素 P450 还原酶供应电子。在对照组的温育中去掉了 NADPH。常规的酶活试验由微粒体 蛋白 ( 约 2mg/ml)、 6mMNADPH、 55μM 14C 标记的烟碱组成。CPZ 和 Cyt.C 的使用浓度分别是 1mM 和 100μM。反应在 25℃进行 1 小时, 加入 300μl 甲醇到各 25μl 反应混合物中终止反 应。离心后, 用 Inertsil ODS-33p(150x 4.6mm) 柱 (Varian) 以反相高效液相色谱 (HPLC) 系统 (Agilent) 分离 20μl 的甲醇提取物。等梯度 (isocratic) 流动相是甲醇、 50mM 磷 酸钾缓冲液 (pH6.25) 的混合物, 其中二者的比例为 60 ∶ 40(v/v), 流速为 1 毫升 / 分钟。 通过与真正的未标记的降烟碱的峰进行比较, 收集降烟碱的峰, 用 2900 tri-carb Liquid Scintillation Counter(LSC)(Perkin Elmer) 进行定量。基于 1 小时温育中产生的 14C 标 记的降烟碱来计算烟碱去甲基酶的活性。
从乙烯处理和未处理的成对的白肋转化株 (4407-33 品系 ) 和非转化株 (4407-25 品系 ) 烟草品系获得样品。所有未处理的样品都没有任何可检测到的微粒体烟碱去甲基酶 活性。相反, 发现从乙烯处理的转化株品系获得的微粒体样品中含有大量的烟碱去甲基酶 活性。已显示, 烟碱去甲基酶受 P450 特异性抑制剂的抑制, 证明该去甲基酶活性与 P450 微 粒体来源的酶一致。
表 VI 显示了从白肋转化株烟草品系中获得的一组典型的酶活结果。相反的是, 从 乙烯处理的非转化株烟草中获得的样品不含有任何烟碱去甲基酶活性。这些结果证明, 在 转化株品系中烟碱去甲基酶受乙烯处理的诱导, 但在相应的等基因非转化株品系中不受诱 导。对于成对的等基因深色烟草品系获得了类似的结果, 其中在转化株品系中微粒体烟碱 去甲基酶活性被诱导, 但在相应的非转化株品系中未检测到该酶被诱导。这些结果都证明 了, 微粒体烟碱去甲基酶在转化株品系中受乙烯处理的诱导, 但在相应的等基因非转化株 品系中不受诱导。那些衍生自 P450 基因并且优先在转化株品系 ( 相对于相应的非转化株
品系 ) 中被诱导的基因是编码烟碱去甲基酶的候选基因。
表 VI : 乙烯诱导的白肋转化株和非转化株品系中的去甲基酶活性
考虑到本发明前面的详细描述, 预期在本发明的实施中本领域技术人员可进行很 多改进和变化。因此, 这些改进和变化都包括在下面权利要求的范围内。
34102321641 A CN 102321648
序列表1/206 页
35102321641 A CN 102321648序列表2/206 页
36102321641 A CN 102321648序列表3/206 页
37102321641 A CN 102321648序列表4/206 页
38102321641 A CN 102321648序列表5/206 页
39102321641 A CN 102321648序列表6/206 页
40102321641 A CN 102321648序列表7/206 页
41102321641 A CN 102321648序列表8/206 页
42102321641 A CN 102321648序列表9/206 页
43102321641 A CN 102321648序列表10/206 页
44102321641 A CN 102321648序列表11/206 页
45102321641 A CN 102321648序列表12/206 页
46102321641 A CN 102321648序列表13/206 页
47102321641 A CN 102321648序列表14/206 页
48102321641 A CN 102321648序列表15/206 页
49102321641 A CN 102321648序列表16/206 页
50102321641 A CN 102321648序列表17/206 页
51102321641 A CN 102321648序列表18/206 页
52102321641 A CN 102321648序列表19/206 页
53102321641 A CN 102321648序列表20/206 页
54102321641 A CN 102321648序列表21/206 页
55102321641 A CN 102321648序列表22/206 页
56102321641 A CN 102321648序列表23/206 页
57102321641 A CN 102321648序列表24/206 页
58102321641 A CN 102321648序列表25/206 页
59102321641 A CN 102321648序列表26/206 页
60102321641 A CN 102321648序列表27/206 页
61102321641 A CN 102321648序列表28/206 页
62102321641 A CN 102321648序列表29/206 页
63102321641 A CN 102321648序列表30/206 页
64102321641 A CN 102321648序列表31/206 页
65102321641 A CN 102321648序列表32/206 页
66102321641 A CN 102321648序列表33/206 页
67102321641 A CN 102321648序列表34/206 页
68102321641 A CN 102321648序列表35/206 页
69102321641 A CN 102321648序列表36/206 页
70102321641 A CN 102321648序列表37/206 页
71102321641 A CN 102321648序列表38/206 页
72102321641 A CN 102321648序列表39/206 页
73102321641 A CN 102321648序列表40/206 页
74102321641 A CN 102321648序列表41/206 页
75102321641 A CN 102321648序列表42/206 页
76102321641 A CN 102321648序列表43/206 页
77102321641 A CN 102321648序列表44/206 页
78102321641 A CN 102321648序列表45/206 页
79102321641 A CN 102321648序列表46/206 页
80102321641 A CN 102321648序列表47/206 页
81102321641 A CN 102321648序列表48/206 页
82102321641 A CN 102321648序列表49/206 页
83102321641 A CN 102321648序列表50/206 页
84102321641 A CN 102321648序列表51/206 页
85102321641 A CN 102321648序列表52/206 页
86102321641 A CN 102321648序列表53/206 页
87102321641 A CN 102321648序列表54/206 页
88102321641 A CN 102321648序列表55/206 页
89102321641 A CN 102321648序列表56/206 页
90102321641 A CN 102321648序列表57/206 页
91102321641 A CN 102321648序列表58/206 页
92102321641 A CN 102321648序列表59/206 页
93102321641 A CN 102321648序列表60/206 页
94102321641 A CN 102321648序列表61/206 页
95102321641 A CN 102321648序列表62/206 页
96102321641 A CN 102321648序列表63/206 页
97102321641 A CN 102321648序列表64/206 页
98102321641 A CN 102321648序列表65/206 页
99102321641 A CN 102321648序列表66/206 页
100102321641 A CN 102321648序列表67/206 页
101102321641 A CN 102321648序列表68/206 页
102102321641 A CN 102321648序列表69/206 页
103102321641 A CN 102321648序列表70/206 页
104102321641 A CN 102321648序列表71/206 页
105102321641 A CN 102321648序列表72/206 页
106102321641 A CN 102321648序列表73/206 页
107102321641 A CN 102321648序列表74/206 页
108102321641 A CN 102321648序列表75/206 页
109102321641 A CN 102321648序列表76/206 页
110102321641 A CN 102321648序列表77/206 页
111102321641 A CN 102321648序列表78/206 页
112102321641 A CN 102321648序列表79/206 页
113102321641 A CN 102321648序列表80/206 页
114102321641 A CN 102321648序列表81/206 页
115102321641 A CN 102321648序列表82/206 页
116102321641 A CN 102321648序列表83/206 页
117102321641 A CN 102321648序列表84/206 页
118102321641 A CN 102321648序列表85/206 页
119102321641 A CN 102321648序列表86/206 页
120102321641 A CN 102321648序列表87/206 页
121102321641 A CN 102321648序列表88/206 页
122102321641 A CN 102321648序列表89/206 页
123102321641 A CN 102321648序列表90/206 页
124102321641 A CN 102321648序列表91/206 页
125102321641 A CN 102321648序列表92/206 页
126102321641 A CN 102321648序列表93/206 页
127102321641 A CN 102321648序列表94/206 页
128102321641 A CN 102321648序列表95/206 页
129102321641 A CN 102321648序列表96/206 页
130102321641 A CN 102321648序列表97/206 页
131102321641 A CN 102321648序列表98/206 页
132102321641 A CN 102321648序列表99/206 页
133102321641 A CN 102321648序列表100/206 页
134102321641 A CN 102321648序列表101/206 页
135102321641 A CN 102321648序列表102/206 页
136102321641 A CN 102321648序列表103/206 页
137102321641 A CN 102321648序列表104/206 页
138102321641 A CN 102321648序列表105/206 页
139102321641 A CN 102321648序列表106/206 页
140102321641 A CN 102321648序列表107/206 页
141102321641 A CN 102321648序列表108/206 页
142102321641 A CN 102321648序列表109/206 页
143102321641 A CN 102321648序列表110/206 页
144102321641 A CN 102321648序列表111/206 页
145102321641 A CN 102321648序列表112/206 页
146102321641 A CN 102321648序列表113/206 页
147102321641 A CN 102321648序列表114/206 页
148102321641 A CN 102321648序列表115/206 页
149102321641 A CN 102321648序列表116/206 页
150102321641 A CN 102321648序列表117/206 页
151102321641 A CN 102321648序列表118/206 页
152102321641 A CN 102321648序列表119/206 页
153102321641 A CN 102321648序列表120/206 页
154102321641 A CN 102321648序列表121/206 页
155102321641 A CN 102321648序列表122/206 页
156102321641 A CN 102321648序列表123/206 页
157102321641 A CN 102321648序列表124/206 页
158102321641 A CN 102321648序列表125/206 页
159102321641 A CN 102321648序列表126/206 页
160102321641 A CN 102321648序列表127/206 页
161102321641 A CN 102321648序列表128/206 页
162102321641 A CN 102321648序列表129/206 页
163102321641 A CN 102321648序列表130/206 页
164102321641 A CN 102321648序列表131/206 页
165102321641 A CN 102321648序列表132/206 页
166102321641 A CN 102321648序列表133/206 页
167102321641 A CN 102321648序列表134/206 页
168102321641 A CN 102321648序列表135/206 页
169102321641 A CN 102321648序列表136/206 页
170102321641 A CN 102321648序列表137/206 页
171102321641 A CN 102321648序列表138/206 页
172102321641 A CN 102321648序列表139/206 页
173102321641 A CN 102321648序列表140/206 页
174102321641 A CN 102321648序列表141/206 页
175102321641 A CN 102321648序列表142/206 页
176102321641 A CN 102321648序列表143/206 页
177102321641 A CN 102321648序列表144/206 页
178102321641 A CN 102321648序列表145/206 页
179102321641 A CN 102321648序列表146/206 页
180102321641 A CN 102321648序列表147/206 页
181102321641 A CN 102321648序列表148/206 页
182102321641 A CN 102321648序列表149/206 页
183102321641 A CN 102321648序列表150/206 页
184102321641 A CN 102321648序列表151/206 页
185102321641 A CN 102321648序列表152/206 页
186102321641 A CN 102321648序列表153/206 页
187102321641 A CN 102321648序列表154/206 页
188102321641 A CN 102321648序列表155/206 页
189102321641 A CN 102321648序列表156/206 页
190102321641 A CN 102321648序列表157/206 页
191102321641 A CN 102321648序列表158/206 页
192102321641 A CN 102321648序列表159/206 页
193102321641 A CN 102321648序列表160/206 页
194102321641 A CN 102321648序列表161/206 页
195102321641 A CN 102321648序列表162/206 页
196102321641 A CN 102321648序列表163/206 页
197102321641 A CN 102321648序列表164/206 页
198102321641 A CN 102321648序列表165/206 页
199102321641 A CN 102321648序列表166/206 页
200102321641 A CN 102321648序列表167/206 页
201102321641 A CN 102321648序列表168/206 页
202102321641 A CN 102321648序列表169/206 页
203102321641 A CN 102321648序列表170/206 页
204102321641 A CN 102321648序列表171/206 页
205102321641 A CN 102321648序列表172/206 页
206102321641 A CN 102321648序列表173/206 页
207102321641 A CN 102321648序列表174/206 页
208102321641 A CN 102321648序列表175/206 页
209102321641 A CN 102321648序列表176/206 页
210102321641 A CN 102321648序列表177/206 页
211102321641 A CN 102321648序列表178/206 页
212102321641 A CN 102321648序列表179/206 页
213102321641 A CN 102321648序列表180/206 页
214102321641 A CN 102321648序列表181/206 页
215102321641 A CN 102321648序列表182/206 页
216102321641 A CN 102321648序列表183/206 页
217102321641 A CN 102321648序列表184/206 页
218102321641 A CN 102321648序列表185/206 页
219102321641 A CN 102321648序列表186/206 页
220102321641 A CN 102321648序列表187/206 页
221102321641 A CN 102321648序列表188/206 页
222102321641 A CN 102321648序列表189/206 页
223102321641 A CN 102321648序列表190/206 页
224102321641 A CN 102321648序列表191/206 页
225102321641 A CN 102321648序列表192/206 页
226102321641 A CN 102321648序列表193/206 页
227102321641 A CN 102321648序列表194/206 页
228102321641 A CN 102321648序列表195/206 页
229102321641 A CN 102321648序列表196/206 页
230102321641 A CN 102321648序列表197/206 页
231102321641 A CN 102321648序列表198/206 页
232102321641 A CN 102321648序列表199/206 页
233102321641 A CN 102321648序列表200/206 页
234102321641 A CN 102321648序列表201/206 页
235102321641 A CN 102321648序列表202/206 页
236102321641 A CN 102321648序列表203/206 页
237102321641 A CN 102321648序列表204/206 页
238102321641 A CN 102321648序列表205/206 页
239102321641 A CN 102321648序列表206/206 页