说明书涉及编码PAE以及PAE样多肽的基因并具有改变的贮藏化合物水平的植物种子、相关的构建体和的方法
技术领域
本发明涉及植物分子生物学领域。更具体地,本发明涉及在植物和种子中编码果胶乙酰酯酶(PAE)和果胶乙酰酯酶样(PAE样)蛋白质的分离的核酸片段以及此类片段用于调节编码PAE或PAE样活性的基因的表达的用途。
背景技术
在成熟期,大豆种子干重的约40%是蛋白质,并且20%是可提取的油。这些组成了大豆作物的有经济价值的产物。例如,植物油是可得自植物的最富含能量的生物质;它们具有碳水化合物两倍的能含量。另外,只需要很少的能量来提取植物油并将其转化成燃料。在种子重量的剩余40%中,约10%是可溶性碳水化合物。可溶性碳水化合物部分对大豆种子的经济价值没有多少贡献,并且可溶性碳水化合物级分的主要组分棉籽糖对加工过程和对大豆粉在单腹动物中的食物价值都是有害的(Coon等人(1988)Proceedings Soybean Utilization Alternatives,Univ.of Minnesota,第203‑211页)。
因为更好的理解了种子中贮藏化合物生物合成途径,很显然,有可能通过改变油、淀粉和可溶性碳水化合物生物合成途径中的特定酶的催化活性来调节植物细胞中贮藏化合物库的大小(Taiz L.等人,PlantPhysiology;The Benjamin/Cummings Publishing Company:New York,1991)。例如,调查LPAT和DAGAT的过表达的研究显示出,使甘油主链酰化的最终步骤在种子中对于向着脂质的流量发挥了重要的控制作用。通过过表达酵母甘油3‑磷酸脱氢酶也可在油籽油菜中提高种子油含量,而在质粒中的脂肪酸从头合成所涉及的各个基因(例如乙酰‑CoA羧化酶和脂肪酸合酶)的过表达基本上没有改变所积累的脂质的量(Vigeolas H.等人,Plant BiotechnologyJ.5,431‑441(2007))。在拟南芥中已鉴定了低种子油突变体wrinkled1。该突变明显产生了碳水化合物代谢的种子特异性调控中的缺陷(Focks,Nicole等人,Plant Physiol.(1998),118(1),91‑101)。持续关注鉴定编码可在植物中调节贮藏化合物诸如油、蛋白质、淀粉和可溶性碳水化合物的合成的蛋白质的基因。
丝氨酸水解酶类是自然界中富含的,并且在例如蛋白酶、脂肪酶、酯酶和转移酶的酶中发挥不同的生物化学作用。全部这些相异的酶类在活性位点均有丝氨酸残基,其在亲核攻击中作为底物从而形成共价中间体。已从植物和微生物中纯化了果胶乙酰酯酶(PAE)(EC3.1.1.6)。PAE特异性地使乙酰化碳水化合物聚合物如木聚糖和果胶去乙酰化。PAE已显示例如在半乳糖醛酸残基的C2和/或C3位置从甜菜果胶除去乙酰酯基团(Nielsen,John E.;Christensen,Tove M.I.E.Distribution of pectin methyl esterase and acetylesterase in thegenus Citrus visualized by tissue prints and chromatography.Plant Science(Shannon,Ireland)(2002),162(5),799‑807)。编码来自植物的PAE的基因已被克隆和测序(Christensen等人,Protein and cDNA sequences of orange fruit pectin acetylesterase,and uses thereof。PCT国际申请(2000),第88页CODEN:PIXXD2WO2000017368A120000330)。在接受了深度基因组或EST(表达序列标记)测序的每种植物中,已鉴定了编码与PAE具有相似性的蛋白质的大基因家族。就PAE基因家族而言,不同的序列性质和所观察到的表达模式表明,基因家族成员有多糖的去乙酰化之外的生物化学功能。对于这些与具有PAE相似性的蛋白质的可能的作用,进行的研究很少。根据编码PAE样蛋白质的基因在植物中普遍存在的性质,对它们在植物生长和发育中,特别是在贮藏化合物在种子中含量的调控中的作用的深入研究是极为受关注的。
发明内容
在第一实施例中,本发明涉及包含重组DNA构建体的转基因植物,所述重组DNA构建体包含可操作地连接到至少一种调控元件的多核苷酸,其中所述多核苷酸编码多肽,所述多肽基于Clustal V比对方法在与SEQ ID NO:36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68或85进行比较时具有至少70%序列同一性的氨基酸序列,并且其中来自所述转基因植物的种子在与来自不包含所述重组DNA构建体的对照植物的种子进行比较时具有改变的油、蛋白质、淀粉和/或可溶性碳水化合物含量。
在第二实施例中,本发明涉及包含重组DNA构建体的转基因种子,所述重组DNA构建体包含可操作地连接到至少一种调控元件的多核苷酸,其中所述多核苷酸编码多肽,所述多肽基于Clustal V比对方法在与SEQ ID NO:36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68或85进行比较时具有至少70%序列同一性的氨基酸序列,并且其中所述转基因种子在与不包含所述重组DNA构建体的对照种子进行比较时具有改变的油、蛋白质、淀粉和/或可溶性碳水化合物含量。
在第三实施例中,本发明涉及转基因种子,所述转基因种子包含:
重组DNA构建体,所述重组DNA构建体包含:(a)可操作地连接到至少一种调控元件的多核苷酸,其中所述多核苷酸编码多肽,所述多肽基于Clustal V比对方法在与SEQ ID NO:36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68或85进行比较时具有至少70%序列同一性的氨基酸序列,或(b)包含至少一种调控元件的抑制DNA构建体,所述调控元件可操作地连接到:(i)以下序列的全部或部分:(A)编码多肽的核酸序列,所述多肽基于Clustal V比对方法在与SEQ ID NO:36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68或85进行比较时具有至少70%序列同一性的氨基酸序列,或(B)(b)(i)(A)的核酸序列的全长互补序列;或(ii)来源于受关注的靶基因的有义链或反义链的全部或部分的区域,所述区域基于Clustal V比对方法在与所述区域所源自的有义链或反义链的所述全部或部分进行比较时具有至少70%序列同一性的核酸序列,并且其中所述受关注的靶基因编码PAE样蛋白质,并且其中所述植物在与不包含所述重组DNA构建体的对照植物进行比较时具有改变的油、蛋白质、淀粉和/或可溶性碳水化合物含量。
在第四实施例中,本发明涉及转基因种子,所述转基因种子在与非转基因的种子的油含量进行比较时,基于干重计具有提高了至少4%的油含量,其中所述转基因种子包含重组DNA构建体,所述重组DNA构建体包含:(a)如SEQ ID NO:35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67或84所示的核苷酸序列的全部或部分;或(b)(a)的全长互补序列:其中(a)或(b)具有足以抑制内源性活性在转基因植物中的表达的长度,并且进一步地其中所述种子与从非转基因的植物获得的种子相比,基于干重计具有至少4%的油含量的提高。
在第五实施例中,本发明涉及转基因种子,所述转基因种子包含重组DNA构建体,所述重组DNA构建体包含:(a)SEQ ID NO:35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67或84所示的核苷酸序列的全部或部分;或(b)(a)的全长互补序列:其中(a)或(b)具有足以抑制内源性PAE或PAE样蛋白质活性在转基因植物中的表达的长度,并且进一步地其中所述种子与从非转基因的植物获得的种子相比,基于干重计具有至少4%的油含量的提高。
在第六实施例中,本发明涉及用于产生转基因种子的方法,所述方法包括:(a)用重组DNA构建体转化植物细胞,所述重组DNA构建体包含可操作地连接到至少一种调控序列的多核苷酸,其中所述多核苷酸编码多肽,所述多肽基于Clustal V比对方法在与SEQ ID NO:35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67或84进行比较时具有至少70%序列同一性的氨基酸序列;和(b)由(a)的转化的植物细胞再生转基因植物;以及(c)选择产生转基因种子的转基因植物,所述转基因种子与从非转基因的植物获得的转基因种子相比具有改变的油、蛋白质、淀粉和/或可溶性碳水化合物含量。
在第七实施例中,本发明涉及用于产生转基因种子的方法,所述方法包括:(a)用重组DNA构建体转化植物细胞,所述重组DNA构建体包含:(i)如SEQ ID NO:35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67或84所示的核苷酸序列的全部或部分;或(ii)(i)的全长互补序列;其中(i)或(ii)具有足以抑制内源性PAE或PAE样蛋白质活性在转基因植物中的表达的长度;
(b)由(a)的转化的植物细胞再生转基因植物;以及
(c)选择产生转基因种子的转基因植物,所述转基因种子与从非转基因的植物获得的转基因种子相比具有改变的油、蛋白质、淀粉和/或可溶性碳水化合物含量。
在第八实施例中,本发明涉及用于产生转基因种子的方法,所述方法包括:(a)用重组DNA构建体转化植物细胞,所述重组DNA构建体包含:(i)如SEQ ID NO:35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67或84所示的核苷酸序列的全部或部分;或(ii)(i)的全长互补序列;其中(i)或(ii)具有足以抑制内源性PAE或PAE样蛋白质活性在转基因植物中的表达的长度;(b)由(a)的转化的植物细胞再生转基因植物;以及(c)选择产生转基因种子的转基因植物,所述转基因种子与从非转基因的植物获得的转基因种子相比,基于干重计具有至少4%的油含量的提高。
在第九实施例中,本发明涉及转基因种子,所述转基因种子包含:
重组DNA构建体,所述重组DNA构建体包含:(a)可操作地连接到至少一种调控元件的多核苷酸,其中所述多核苷酸编码多肽,所述多肽基于Clustal V比对方法在与SEQ ID NO:36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68或85进行比较时具有至少70%序列同一性的氨基酸序列;或(b)包含至少一种调控元件的抑制DNA构建体,所述调控元件可操作地连接到:(i)以下序列的全部或部分:(A)编码多肽的核酸序列,所述多肽基于Clustal V比对方法在与SEQ ID NO:36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68或85进行比较时具有至少70%序列同一性的氨基酸序列,或(B)(b)(i)(A)的核酸序列的全长互补序列;或(ii)来源于受关注的靶基因的有义链或反义链的全部或部分的区域,所述区域基于Clustal V比对方法在与所述区域所源自的有义链或反义链的所述全部或部分进行比较时具有至少70%序列同一性的核酸序列,并且其中所述受关注的靶基因编码PAE样蛋白质,并且其中所述植物在与不包含所述重组DNA构建体的对照植物进行比较时具有改变的、提高的或降低的油、蛋白质、淀粉和/或可溶性碳水化合物含量。
在第十实施例中,本发明包括分离的多核苷酸,所述分离的多核苷酸包含:(a)编码改变即提高或降低油、蛋白质、淀粉和/或可溶性碳水化合物含量所需的多肽的核苷酸序列,其中所述多肽在与SEQ ID NO:36或48进行比较时具有至少95%序列同一性的氨基酸序列,或(b)所述核苷酸序列的全长互补序列,其中所述全长互补序列和所述核苷酸序列由相同数目的核苷酸组成并且是100%互补的。所述多肽可包含SEQ ID NO:36或48的氨基酸序列。所述核苷酸序列可包含SEQ ID NO:35或47的核苷酸序列。
在另一个实施例中,本发明涉及包含本发明任何分离的多核苷酸的重组DNA构建体,所述分离的多核苷酸可操作地连接到至少一种调控序列,并且本发明涉及包含所述重组DNA构建体的细胞、植物和种子。所述细胞可为真核细胞,例如酵母、昆虫或植物细胞,或者为原核细胞,例如细菌细胞。
从单子叶植物和双子叶植物(例如,分别如玉米和大豆)获得的包含本发明的重组构建体的种子在本发明的范围之内。驱动表达本发明核酸序列的种子特异性或种子优选的启动子也被包括在内。驱动表达本发明核酸序列的胚或胚乳特异性的启动子也被包括在内。
此外,本发明的方法对于从单子叶植物(例如玉米和稻)和双子叶植物(例如大豆和卡诺拉)获得转基因种子是有用的。
也在本发明范围之内的是从转基因种子获得的产物和/或副产物,所述转基因种子从单子叶植物或双子叶植物(分别例如玉米和大豆)获得。
在另一个实施例中,本发明涉及用于在植物中抑制编码具有PAE样蛋白质活性的多肽的基因的表达水平的方法,其中所述方法包括用本发明的任何核酸片段转化单子叶植物或双子叶植物。
附图说明和序列表
根据以下的形成本专利申请的一部分的具体实施方式和附图以及序列表,可更全面地理解本发明。
图1A‑1D显示了由来源于以下的核苷酸序列编码的PAE和PAE样蛋白质的氨基酸序列的比对:芜菁(Brassica rapa)(SEQ ID NO:36);向日葵(Helianthus annuus)(SEQ ID NO:38);蓖麻(Ricinus communis)(SEQ ID NO:40);大豆(Glycine max)(SEQ ID NO:42、44、46和48);玉米(Zea mays)(SEQ ID NO:50、52和54);水稻(Oryzasativa)(SEQ ID NO:56、58和60);高粱(Sorghumbicolor)(SEQ ID NO:62、64和66);小麦(Triticum aestivum)(SEQ ID NO:68);拟南芥(Arabidopsisthaliana)(SEQ ID NO:85,At2g46930);SEQ ID NO:86,对应于来自美国专利申请US20100083407的SEQ ID NO:53381(大豆);和SEQ ID NO:87,对应于美国专利申请US20090094717的SEQ ID NO:13822(拟南芥)。就比对而言,将在全部序列之间在给定位置处保守的氨基酸划框表示。该程序用短划线来使序列间最大程度的对齐。
图2显示了图1A‑1D中显示的每对氨基酸序列的百分比序列同一性的图表。
序列描述以及所附序列表遵循如37C.F.R.§1.821‑1.825所示的关于专利申请中核苷酸和/或氨基酸序列公开的规定。
SEQ ID NO:1对应于载体PHSbarENDS2的核苷酸序列。
SEQ ID NO:2对应于多接头的核苷酸序列。
SEQ ID NO:3对应于载体pKR85的核苷酸序列。
SEQ ID NO:4对应于载体pKR278的核苷酸序列。
SEQ ID NO:5对应于载体pKR407的核苷酸序列。
SEQ ID NO:6对应于载体pKR1468的核苷酸序列。
SEQ ID NO:7对应于载体pKR1475的核苷酸序列。
SEQ ID NO:8对应于载体pKR92的核苷酸序列。
SEQ ID NO:9对应于载体pKR1478的核苷酸序列。
SEQ ID NO:10对应于SAIFF和lo22730的基因组DNA。
SEQ ID NO:11对应于正向引物PAE ORF FWD。
SEQ ID NO:12对应于反向引物PAE ORF REV。
SEQ ID NO:13对应于包含PAE的载体pENTR的核苷酸序列。
SEQ ID NO:14对应于载体pKR1478‑PAE的核苷酸序列。
SEQ ID NO:15对应于PKR1481的核苷酸序列。
SEQ ID NO:16对应于AthLcc In正向引物。
SEQ ID NO:17对应于AthLcc In反向引物。
SEQ ID NO:18对应于含有漆酶内含子的PCR(聚合酶链反应)产物。
SEQ ID NO:19对应于PSM1318的核苷酸序列。
SEQ ID NO:20对应于pMBL18ATTR12INT的核苷酸序列。
SEQ ID NO:21对应于PSM1789的核苷酸序列。
SEQ ID NO:22对应于pMBL18ATTR12INT ATTR21的核苷酸序列。
SEQ ID NO:23对应于SuSy‑5'引物。
SEQ ID NO:24对应于SuSy‑3'引物。
SEQ ID NO:25对应于pLF122的核苷酸序列。
SEQ ID NO:26对应于pKR1142的核苷酸序列。
SEQ ID NO:27对应于pKR1155的核苷酸序列。
SEQ ID NO:28对应于KS294的核苷酸序列。
SEQ ID NO:29对应于pKR627的核苷酸序列。
SEQ ID NO:30对应于pKR132的核苷酸序列。
SEQ ID NO:31对应于pKR278的核苷酸序列。
SEQ ID NO:32对应于pKR1157的核苷酸序列。
SEQ ID NO:33对应于pKR1479的核苷酸序列。
SEQ ID NO:34对应于pKR1481‑PAE的核苷酸序列。
表1列出了本文所述的多肽、包含编码这些多肽全部或其主要部分的核酸片段的克隆的命名、以及在所附序列表中使用的对应标识符(SEQ ID NO:)。表1还标示了作为单独的EST(“EST”)的cDNA克隆、包含标明的cDNA克隆的整个cDNA插入物的序列(“FIS”)、由两个或更多个EST组装而成的重叠群(“Contig”)、由FIS和一个或多个EST组装而成的重叠群(“Contig*”)或编码源自FIS、重叠群、EST和PCR或FIS和PCR的完整或功能性蛋白质的序列(“CGS”)。
表1
PAE样蛋白质
SEQ ID NO:69是实例18中所述的接头的核酸序列。
SEQ ID NO:70是实例19中所述的载体pKS133的核酸序列。
SEQ ID NO:71对应于单拷贝的ELVISLIVES。
SEQ ID NO:72对应于两拷贝的ELVISLIVES。
SEQ ID NO:73对应于实例19中所述的引物。
SEQ ID NO:74对应于实例19中所述的引物。
SEQ ID NO:75对应于合成的PCR引物(SA156)。
SEQ ID NO:76对应于合成的PCR引物(SA157)。
SEQ ID NO:77对应于合成的PCR引物(SA158)。
SEQ ID NO:78对应于合成的PCR引物(SA159)。
SEQ ID NO:79对应于合成的PCR引物(SA160)。
SEQ ID NO:80对应于pGemT‑Easy D的核苷酸序列。
SEQ ID NO:81对应于pGemT‑Easy F的核苷酸序列。
SEQ ID NO:82对应于pKS426的核苷酸序列。
SEQ ID NO:83对应于pKS120的核苷酸序列。
SEQ ID NO:84对应于At2g46930的核苷酸序列。
SEQ ID NO:85对应于由SEQ ID NO:84编码的氨基酸序列。
SEQ ID NO:86对应于来自美国专利申请US20100083407的SEQ ID NO:53381。
SEQ ID NO:87对应于来自美国专利申请US20090094717的SEQ ID NO:13822。
SEQ ID NO:88表示对应于amiRNA的DNA,amiRNA被用于使酯酶沉默。
SEQ ID NO:89表示对应于人工星序列的DNA序列,人工星序列用于使所期望的靶标沉默。
SEQ ID NO:90表示实例23中所述的miRNA396b前体。
SEQ ID NO:91表示实例23中所述的准备好的miRNA396b前体。
SEQ ID NO:92表示准备好的miRNA396b‑KS126质粒。
SEQ ID NO:93对应于引物396b PAE样primA。
SEQ ID NO:94对应于引物396b PAE样primB。
SEQ ID NO:95对应于396b‑PAE样in fusion的准备好的miRNA序列。
SEQ ID NO:96对应于质粒396b‑PAE样的核苷酸序列。
SEQ ID NO:97对应于引物SA335的核苷酸序列。
SEQ ID NO:98对应于引物SA336的核苷酸序列。
SEQ ID NO:99对应于引物SA320的核苷酸序列。
SEQ ID NO:100对应于引物SA319的核苷酸序列。
SEQ ID NO:101对应于pGEM T easy A的核苷酸序列。
SEQ ID NO:102对应于pGEM T easy B的核苷酸序列。
SEQ ID NO:103对应于pBluescript‑A的核苷酸序列。
SEQ ID NO:104对应于pBluescript‑AB的核苷酸序列。
SEQ ID NO:105对应于KS442的核苷酸序列。
SEQ ID NO:106对应于KS442‑AB的核苷酸序列。
SEQ ID NO:107对应于lo125的核苷酸序列。
此序列表中以单个字母表示核苷酸,以三个字母表示氨基酸,如NucleicAcidsRes.13:3021‑3030(1985)和BiochemicalJ.219(No.2):345‑373(1984)所述的IUPAC‑IUBMB标准中所规定,其以引用方式并入本文。核苷酸的符号和格式以及氨基酸序列数据符合如37C.F.R.§1.822所示的规则。
具体实施方式
本专利申请通篇引用的所有专利、专利申请、以及公布全文以引用方式并入本文。
如本文所用的并在所附的权利要求书中的单数形式“一个”和“所述”包括复数涵义,除非上下文中清楚地另外指明。因此,例如,关于“一株植物”包括多株此类植物,关于“一个细胞”包括一个或多个细胞及本领域的技术人员已知的等同物等等。
在本公开的上下文中使用了许多术语和缩写。提供了如下定义。
“开放阅读框”缩写为ORF。
“聚合酶链反应”缩写为PCR。
“三酰基甘油”缩写为TAG。
“辅酶A”缩写为CoA。
“pae”是指拟南芥基因座,At2g46930(SEQ ID NO:84)。
“PAE”是指由At2g46930(SEQ ID NO:84)编码的蛋白质(SEQ ID NO:85)。
“pae样”是指拟南芥“pae”基因座At2g46930(SEQ ID NO:84)的来自不同物种如玉米和大豆的核苷酸同源物,并且不受限制地包括SEQ ID NO:35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65和67的核苷酸序列中的任一种。
“PAE样”是指拟南芥“PAE”(SEQ ID NO:85)的来自不同物种如玉米和大豆的蛋白质同源物,并且不受限制地包括SEQ ID NO:36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66和68的氨基酸序列中的任一种。
术语“脂肪酸”是指不同链长的长链脂族酸(链烷酸),链长为约C12‑C22(尽管更长和更短链长的酸两者均是已知的)。主要的链长介于C16和C22之间。脂肪酸的结构可用简单的记号系统“X:Y”来表示,其中X表示具体脂肪酸中碳(C)原子的总数,而Y表示双键的数目。
一般来讲,脂肪酸被归类为饱和或不饱和的。术语“饱和脂肪酸”是指其碳主链之间不含“双键”的那些脂肪酸。相反,“不饱和脂肪酸”沿其碳主链(通常为顺式构型)具有“双键”。“单不饱和脂肪酸”沿碳主链仅具有一个“双键”(例如,就棕榈油酸(16:1)和油酸(18:1)而言通常位于第9号和第10号碳原子之间),而“多不饱和脂肪酸”(或“PUFA”)沿碳主链具有至少两个双键(例如,就亚油酸(18:2)而言位于第9号和第10号以及第12号和第13号碳原子之间;就α‑亚麻酸(18:3)而言位于第9号和第10号、第12号和第13号、以及第15号和第16号之间)。
术语“三酰基甘油”、“油”和“TAG”是指由与甘油分子酯化的三个脂肪酰残基组成的中性脂质(并且这些术语在整个本公开内容中将互换使用)。这些油可包含长链PUFA以及较短的饱和的和不饱和的脂肪酸以及较长链的饱和脂肪酸。因此,“油的生物合成”一般是指细胞中TAG的合成。
术语“调节”或“改变”在本发明的上下文中是指PAE或PAE样蛋白质表达、蛋白质水平或酶活性的提高或降低,以及指贮藏化合物如油、蛋白质、淀粉或可溶性碳水化合物的水平的提高或降低。
术语“植物”包括整株植物、植物的部分或器官(例如,叶、茎、根等)、植物细胞、种子和它们的子代。如本文所用,植物细胞不受限制地包括从以下中获得的或存在于以下中的细胞:种子、悬浮培养物、胚、分生区域、愈伤组织、叶、根、芽、配子体、孢子体、花粉和小孢子。植物细胞还可被理解为包括经修饰的细胞,例如从前述组织获得的原生质体。可在本发明的方法中使用的植物的种类一般与可应用转化技术的高等植物的种类一样广泛,包括单子叶植物和双子叶植物。
单子叶植物的例子包括但不限于玉米(玉蜀黍)、小麦、稻、高粱、粟、大麦、棕榈、百合、六出花属(Alstroemeria)、黑麦和燕麦。
双子叶植物的例子包括但不限于大豆、油菜、向日葵、卡诺拉、葡萄、银胶菊、耧斗菜、棉花、烟草、豌豆、豆类、亚麻、红花和苜蓿。
植物组织包括分化的和未分化的组织或植物,包括但不限于根、茎、嫩枝、叶、花粉、种子、肿瘤组织、以及多种形式的细胞和培养物,例如单细胞、原生质、胚和愈伤组织。
术语“植物器官”是指构成植物的形态和功能不同部分的植物组织或组织群。
术语“基因组”是指:1.存在于生物体的每个细胞或者病毒或细胞器中的遗传物质的整个互补序列(基因和非编码序列);2.作为(单倍体)单位从一个亲本遗传的一整套染色体。术语“稳定一体化”是指将核酸片段转入宿主生物体或细胞的基因组中,导致基因稳定遗传。
术语“多核苷酸”、“多核苷酸序列”、“核酸”、“核酸序列”和“核酸片段”在本文中是互换使用的。这些术语涵盖核苷酸序列等的范围。多核苷酸可为RNA或DNA的聚合物,它们可为单链或双链,任选地包含合成的、非天然的或改变的核苷酸碱基。DNA聚合物形式的多核苷酸可包含cDNA、基因组DNA、合成DNA或它们的混合物的一个或多个片段。
术语“分离的”是指物质,例如“分离的核酸片段”和/或“分离的多肽”,该物质基本上不含在天然存在的环境中通常伴随该物质或与其相互作用的组分,或者说是该物质从所述组分被移出。分离的多核苷酸可由它们天然存在于其中的宿主细胞纯化。技术人员已知的常规核酸纯化方法可用于获得分离的多核苷酸。该术语也涵盖重组多核苷酸和化学合成的多核苷酸。
术语“分离的核酸片段”与“分离的多核苷酸”互换使用,并且是任选地包含合成的、非天然的或改变的核苷酸碱基的单链或双链的RNA或DNA聚合物。DNA聚合物形式的分离的核酸片段可包含cDNA、基因组DNA或合成DNA的一个或多个片段。核苷酸(通常以它们的5'‑单磷酸形式存在)通过它们的单字母名称指代如下:“A”指腺苷酸或脱氧腺苷酸(分别用于RNA或DNA),“C”指胞苷酸或脱氧胞苷酸,“G”指鸟苷酸或脱氧鸟苷酸,“U”指尿苷酸,“T”指脱氧胸苷酸,“R”指嘌呤(A或G),“Y”指嘧啶(C或T),“K”指G或T,“H”指A或C或T,“I”指肌苷,并且“N”指任何核苷酸。
术语“功能上等同的亚片段”和“功能上相当的亚片段”在本文中是互换使用的。这些术语是指分离的核酸片段的一个部分或亚序列,其中无论所述片段或亚片段是否编码有活性的酶,其都保留着改变基因表达或导致某种表型的能力。例如,所述片段或亚片段可被用于设计重组DNA构建体,以在转化的植物中产生所期望的表型。通过以相对于植物启动子序列的适当的方向连接核酸片段或其亚片段(无论它是否编码活性酶),重组DNA构建体可经设计用于共抑制或反义抑制。
“共抑制”是指产生能够抑制相同的或基本上相似的原生基因表达的有义RNA转录本(美国专利5,231,020)。共抑制技术构成了1999年7月27日授予Jorgensen等人的美国专利5,231,020的主题。这种由Napoli等人在矮牵牛花中观察到的现象称为“共抑制”,因为内源性基因和引入的转基因的表达均被抑制(综述参见Vaucheret等人,Plant J.16:651‑659(1998);以及Gura,Nature404:804‑808(2000))。
此前,已通过着眼于以有义方向过表达与内源性mRNA具有同源性的核酸序列(其导致与过表达的序列具有同源性的所有RNA减少)设计出了植物中的共抑制构建体(参见Vaucheret等人(1998),Plant J,16:651‑659;和Gura(2000)Nature404:804‑808)。该现象的总效率较低,并且RNA减少的程度变化较大。最近的工作已描述了“发夹”结构的使用,该结构以互补方向整合mRNA编码序列的全部或部分,导致已表达的RNA形成潜在的“茎环”结构(于1999年10月21日公布的PCT公开WO99/53050)。这在获得的转基因植物中提高了共抑制的频率。另一种变型描述了将植物病毒序列用于引导对近端mRNA编码序列的抑制或“沉默”(于1998年8月20日公布的PCT公开WO98/36083)。这些共抑制现象均未从机制上得到阐明,但最近的遗传学证据已经开始揭示这种复杂的情况(Elmayan等人(1998)Plant Cell10:1747‑1757)。
除共抑制之外,反义技术也已被用于阻止特异性基因在细胞中的功能。反义RNA是与正常表达的RNA互补的,并且可能通过与正常RNA链的相互作用抑制基因的表达。特异性基因的表达被反义或有义RNA抑制的机制正在逐渐被了解。然而,在转基因植物中获得所期望的表型的频率可随着构建体的设计、基因、其启动子的强度和特异性、转化方法和转基因插入事件的复杂性而变化(Baulcombe,Curr.Biol.12(3):R82‑84(2002);Tang等人,Genes Dev.17(1):49‑63(2003);Yu等人,Plant Cell.Rep.22(3):167‑174(2003))。共抑制和反义抑制也被称为“基因沉默”、“转录后基因沉默”(PTGS)、RNA干扰或RNAi。参见例如美国专利6,506,559。
微RNA(miRNA)是控制基因表达的小调控性RNA。miRNA与靶RNA的区域结合并抑制它们的翻译,并且因此干扰由该靶RNA编码的多肽的产生。miRNA可被设计为与靶序列RNA的任何区域互补,包括3'非翻译区、编码区等。miRNA是从通过被称为DICER的核酸酶III的作用而被加工的高度结构化的RNA前体被加工的。虽然miRNA作用的确切机制是未知的,但是似乎它们的功能是调控靶基因的表达。参见例如公布于2004年12月30日的美国专利公开2004/0268441Al。
如本文所用,术语“表达”是指功能性终产物如mRNA或由mRNA翻译成的多肽的生产。“反义抑制”是指产生能够抑制靶蛋白质表达的反义RNA转录物。“共抑制”是指产生能够抑制相同的或基本上相似的外来或内源性基因表达的有义RNA转录本(美国专利5,231,020)。
“过表达”是指在与正常的、野生型的或非转化的生物的功能性终产物的表达进行比较时,转基因生物的功能性终产物的生产水平超过前者的生产水平。
“稳定转化”是指核酸片段转入宿主生物的基因组(包括核基因组和细胞器基因组)中,导致基因稳定遗传。相反,“瞬时转化”是指将核酸片段转入宿主生物的核中或包含DNA的细胞器中,在无整合或无稳定的遗传特性的情况下引起基因表达。包含转化的核酸片段的宿主生物被称为“转基因”生物。稻、玉米和其他单子叶植物的细胞转化的优选方法是使用微粒加速的或“基因枪”的转化技术(Klein等人(1987)Nature(London)327:70‑73;美国专利4,945,050),或农杆菌属(Agrobacterium)介导的方法(Ishida Y.等人(1996)Nature Biotech.14:745‑750)。如本文所用,术语“转化”是指稳定转化和瞬时转化两者。
“反义抑制”是指产生能够抑制靶蛋白质表达的反义RNA转录物。
如本文所述,“抑制”是指与具有天然的酶或蛋白质的植物中可检测的酶活性或蛋白质功能性的水平相比,在转基因植物中可检测的酶活性或蛋白质功能性的水平的降低。在具有天然酶的植物中的酶活性水平在本文中被称为“野生型”活性。在具有天然的蛋白质的植物中的蛋白质功能性水平在本文中被称为“野生型”功能性。术语“抑制”包括降低、减少、下调、减弱、抑制、消除和阻止。这种降低可为由于天然的mRNA向活性酶或功能性蛋白质的翻译上的减少。也可能是由于天然DNA转录成mRNA的量降低和/或天然mRNA的降解加快。术语“天然酶”是指所需细胞中天然产生的酶。
如本文所用,“基因沉默”是概括性术语,是指mRNA水平与野生型植株相比降低,并不规定降低的机制,包括且不限于反义、共抑制、病毒抑制、发夹抑制和茎‑环抑制。
术语“同源性”、“同源的”、“基本上类似的”和“基本上对应的”在本文中是互换使用的。它们是指这样的核酸片段,即其中一个或多个核苷酸碱基改变并不会影响该核酸片段介导基因表达或产生某种表型的能力。这些术语也指本发明的核酸片段的修饰(例如缺失或插入一个或多个核苷酸),相对于初始的未经修饰的核酸片段,该修饰基本上不会改变所得核酸片段的功能特性。例如,导致在给定位点处产生化学上等价的氨基酸但不影响所编码多肽的功能特性的核酸片段中的改变是本领域熟知的。因此,氨基酸丙氨酸(疏水性氨基酸)的密码子可被编码另一种较弱疏水性残基(例如甘氨酸)或更加疏水性残基(例如缬氨酸、亮氨酸或异亮氨酸)的密码子取代。类似地,导致一个带负电荷的残基替代为另一个带负电荷的残基(例如,天冬氨酸替代谷氨酸)或者一个带正电荷的残基替代为另一个带正电荷的残基(例如,赖氨酸替代精氨酸)的改变也可预期产生功能上等价的产物。导致多肽分子的N末端和C末端部分改变的核苷酸变化也将预计不会改变多肽的活性。所提出的修饰中的每一种均完全在本领域常规技术内,如测定编码产物生物活性的保留情况。因此理解了,如本领域的技术人员将会知道,本发明涵盖的不仅仅是具体的示例性序列。
此外,技术人员认识到,本发明所涵盖的基本上类似的核苷酸序列,也通过它们在中等严格条件(例如1×SSC,0.1%SDS,60℃)下与本文所示例的序列或与本文所报道的核苷酸序列的任何部分杂交的能力而被限定,并且它们功能上等同于本发明的基因或启动子。可调节严格性条件以筛选中度相似的片段例如来自远缘生物的同源序列,到筛选高度相似的片段例如从近缘生物复制功能性酶的基因。杂交后的洗涤确定严格性条件。一组优选的条件涉及一系列洗涤步骤,开始是6×SSC、0.5%SDS在室温下洗涤15分钟,然后用2×SSC、0.5%SDS在45℃下重复30分钟,再用0.2×SSC、0.5SDS在50℃下重复洗涤两次,每次30分钟。一组更优选的严格条件涉及较高的温度的使用,其中除了在最终两次在0.2X SSC,0.5%SDS中的30分钟洗涤的温度被提高至60℃之外,洗涤是与上文的那些相同的。另一组优选的高度严格条件涉及使用在0.1X SSC,0.1%SDS中于65℃下的两次最终的洗涤。
就靶(内源性)mRNA和与所述靶mRNA具有同源性的构建体中的RNA区域之间基本的相似性的程度而言,此类序列长度应当为至少25个核苷酸,优选长度为至少50个核苷酸,更优选长度为至少100个核苷酸,更优选长度为至少200个核苷酸,并且最优选长度为至少300个核苷酸;并且应当为至少80%相同的、优选至少85%相同的、更优选至少90%相同的、并且最优选至少95%相同的。
本发明的基本上类似的核酸片段还可以它们所编码的氨基酸序列与本文所公开的氨基酸序列之间的百分比同一性为特征,如通过本领域的技术人员普遍采用的算法所确定的。合适的核酸片段(本发明的分离的多核苷酸)编码与本文所报道的氨基酸序列至少70%相同、优选至少80%相同的多肽。优选的核酸片段编码与本文所报道的氨基酸序列至少85%相同的氨基酸序列。更优选的核酸片段编码与本文所报道的氨基酸序列至少90%相同的氨基酸序列。最优选的是编码与本文所报道的氨基酸序列至少95%相同的氨基酸序列的核酸片段。
本领域的技术人员充分理解,多种水平的序列同一性在鉴定相关的多肽序列中是有用的。百分比同一性的有用的例子是50%、55%、60%、65%、70%、75%、80%、85%、90%或95%,或从55%至100%的任何整数百分比。
序列比对和相似性百分比的计算可使用经设计用于检测同源序列的多种比较方法来确定,这些方法包括但不限于LASARGENE生物信息计算包(DNASTAR Inc.,Madison,WI)的Megalign程序。除非另外说明,本文提供的序列的多重比对使用Clustal比对方法(Higgins和Sharp(1989),CABIOS.5:151‑153),使用默认参数(GAP PENALTY=10,GAP LENGTHPENALTY=10)来进行。使用Clustal方法进行成对比对和蛋白质序列的百分比同一性计算的默认参数为KTUPLE=1、GAP PENALTY=3、WINDOW=5以及DIAGONALS SAVED=5。对于核酸,这些参数为KTUPLE=2,GAP PENALTY=5,WINDOW=4以及DIAGONALSSAVED=4。使用Clustal V程序比对序列后,可通过查看同一程序中的“序列距离”表来获得“百分比同一性”。
除非另外说明,本文提供的“BLAST”序列同一性/相似性值是指使用BLAST2.0程序包,使用默认参数(Altschul等人,Nucleic Acids Res.25:3389‑3402(1997))获得的值。用于进行BLAST分析的软件是可公开获得的,例如通过美国国立生物技术信息中心(National Center for Biotechnology Information)。该算法涉及首先通过在查询序列中鉴定长度为W的、在与数据库序列中相同长度的字节比对时匹配或者满足某些取正值的阈值分数T的短字节,鉴定高评分序列对(HSP)。T被称为相邻字节分值阈值(Altschul等人,上文)。这些初始的相邻字节命中作为用于初始对包含它们的更长HSP的搜索的“种子”起作用。然后在两个方向上沿每一序列延伸所述字节命中,只要累积的比对分数可被提高就进行延伸。累积的分数就核苷酸序列而言使用参数M(对一对匹配残基的奖励分数;总是>0)和N(对不匹配残基的罚分;总是<0)来计算。就氨基酸序列而言,计分矩阵用于计算累积的分数。字节命中在每一方向上的延伸当出现以下时停止:累积的比对分数从其所达到的最大值下降数值X;由于一个或多个负分值的残基比对的累积,累积的分数变成零或更低;或达到任何一个序列的末端。BLAST算法的参数W、T和X决定了比对的灵敏度和速度。BLASTN程序(用于核苷酸序列)默认使用11的KTUPLE(W)、10的期望值(E)、100的阈值、M=5、N=‑4、以及对全部两条链的比对。就氨基酸序列而言,BLASTP程序默认使用3的KTUPLE(W)、10的期望值(E)和BLOSUM62计分矩阵(参见Henikoff&Henikoff,Proc.Natl.Acad.Sci.USA89:10915(1989))。
“序列同一性”或“同一性”在核酸序列或多肽序列中的上下文中是指在特定比较窗口上进行比对以寻求最大对应时两个序列中相同的核酸碱基或氨基酸残基。
因此,“序列同一性百分比”是指通过在比较窗口上比较两个最佳对齐的序列而测得的值,其中在与参考序列(其不包括添加或缺失)进行比较时,比较窗口中的多核苷酸序列的部分可包括添加或缺失(即缺口)以实现两个序列的最佳比对。所述百分比的计算方法是,统计相同的核酸碱基或氨基酸残基在两个序列中同时出现的位置的数量以得到匹配位点数,将此匹配位点数除以比对窗口中的总位点数,再将结果乘以100,从而得到序列同一性百分比。序列同一性百分比的有用的例子包括但不限于50%、55%、60%、65%、70%、75%、80%、85%、90%或95%,或从55%至100%的任何整数百分比。这些同一性可使用本文所述的任何程序来确定。
序列比对和百分比同一性或相似度可使用经设计用于检测同源序列的多种比较方法来确定,这些方法包括但不限于LASARGENE生物信息计算包(DNASTAR Inc.,Madison,WI)的Megalign程序。序列的多重比对使用Clustal V比对方法来进行(Higgins,D.G.和Sharp,P.M.(1989)Comput.Appl.Biosci.5:151‑153;Higgins,D.G.等人(1992)Comput.Appl.Biosci.8:189‑191),使用默认参数(GAP PENALTY=10,GAP LENGTHPENALTY=10)。使用Clustal方法进行成对比对和蛋白质序列的百分比同一性计算的默认参数为KTUPLE=1、GAP PENALTY=3、WINDOW=5以及DIAGONALS SAVED=5。对于核酸,这些参数为KTUPLE=2,GAPPENALTY=5,WINDOW=4以及DIAGONALSSAVED=4。
本领域的技术人员充分理解,多种程度的序列同一性对于从其他植物物种中鉴定多肽是有用的,其中这类多肽具有相同或相似的功能或活性。百分比同一性的有用的例子包括但不限于50%、55%、60%、65%、70%、75%、80%、85%、90%或95%,或从55%至100%的任何整数百分比。实际上,从50%‑100%的任何整数氨基酸同一性均可用于描述本发明。另外,受关注的是这种分离的核苷酸片段的任何全长或部分互补序列。
术语“重组”是指,例如,核酸序列是通过两种另外的分离的片段或序列的人工组合制得的,例如,是通过化学合成或者通过采用基因工程技术的对分离的核酸的操纵制得的。
如本文所用,“重叠群”是指从两种或更多种组成的核苷酸序列组装的核苷酸序列,所述组成的核苷酸序列具有序列同源性的共有的或重叠的区域。例如,两个或更多个核酸片段的核苷酸序列可被比较和对齐,以鉴定共有的或重叠的序列。在两个或更多个核酸片段之间存在共有的或重叠的序列时,该序列(以及因此它们的对应的核酸片段)可被组装成单一的连续核苷酸序列。
“密码子简并性”是指允许核苷酸序列在不影响所编码的多肽的氨基酸序列的情况下发生变化的遗传密码的趋异度。因此,本发明涉及包含编码本文所示出的氨基酸序列的全部或主要部分的核苷酸序列的任何核酸片段。技术人员非常了解具体宿主细胞在使用核苷酸密码子来确定给定氨基酸时所表现出的“密码子偏倚”。因此,当合成核酸片段用于改善宿主细胞中的表达时,希望设计该核酸片段使得其密码子使用频率接近宿主细胞使用的优选密码子的频率。
术语“合成核酸”或“合成基因”是指全部或部分地由寡核苷酸基础模块组装的核酸分子,所述寡核苷酸基础模块是使用本领域的技术人员已知的方法化学合成的。将这些构件连接并进行退火以形成更大的核酸片段,然后可将其以酶促方法进行组装以构建完整的所需核酸片段。与核酸片段有关的“化学合成的”是指在体外对组分核苷酸进行组装。可采用已完善建立的方法来完成核酸片段的人工化学合成,或者可使用许多种可商业获得的机器的其中一种来完成自动化学合成。因此,基于对核苷酸序列的优化以反映宿主细胞的密码子偏好,可定制核酸片段以最优化基因的表达。如果密码子使用偏向于宿主偏好的那些密码子,则技术人员认识到成功的基因表达的可能性。优选密码子的确定可基于对来源于宿主细胞的基因(其中可获得序列信息)的检测。
“基因”是指能够指导特异性蛋白质或功能性RNA的表达的核酸片段。
“原生基因”是指天然存在的具有其自身调控序列的基因。
“嵌合基因”或“重组DNA构建体”在本文中是互换使用的,并且是指任何非原生基因的基因,包含在自然中不一起存在的调控和编码序列,或任选地经过修饰并重新引入宿主细胞中的分离的原生基因。
嵌合基因可包括源于不同来源的调控序列和编码序列,或者包括源于同一来源但以不同于天然存在的方式排列的调控序列和编码序列。在一个实施例中,调控区和编码序列区由两种不同来源组装。在另一个实施例中,调控区和编码序列区来源于相同的来源,但以不同于天然存在的方式排列。在另一个实施例中,编码序列区由至少两种不同来源组装,在另一个实施例中,编码区由相同的来源但以非天然存在的方式组装。
术语“内源性基因”是指位于生物的基因组中其天然位置的原生基因。
术语“外来基因”是指正常情况下不存在于宿主生物中的基因,它通过基因转移被引入宿主生物中。
术语“转基因”是指已通过转化过程被引入宿主细胞中的基因。转基因可被物理地插入该宿主细胞的基因组中(例如,通过重组),或者可被维持在该宿主细胞的基因组外(例如,在染色体外阵列上)。
“等位基因”是染色体上占据给定基因座的基因的几种供选择替代形式的其中一种。当二倍体植物中一对同源染色体上给定基因座上存在的等位基因相同时,该植物在该基因座处是纯合的。如果二倍体植物中一对同源染色体上给定基因座上存在的等位基因不同,则该植物在该基因座处是杂合的。如果转基因存在于二倍体植物中一对同源染色体中的其中之一上,则该植物在该基因座处是半合子的。
术语“编码序列”是指编码具有特定氨基酸序列的多肽或结构性RNA的DNA片段。蛋白质编码序列的界限通常由位于mRNA5'端的核糖体结合位点(原核生物)或ATG起始密码子(真核生物)和位于mRNA3'端开放阅读框下游紧接的转录终止序列确定。编码序列可包括但不限于DNA、cDNA和重组核酸序列。
“成熟”蛋白质是指经翻译后加工的多肽;即已经去除了存在于初级翻译产物中的任何前肽或原肽的多肽。“前体”蛋白质是指mRNA的翻译初级产物;即具有仍然存在的前肽和原肽。前肽和原肽可以是并且不限于细胞内定位信号。
“RNA转录物”是指由RNA聚合酶催化的DNA序列的转录所产生的产物。当RNA转录物是DNA序列的完全互补的拷贝时,它被称为初级转录物,或者它可为来源于初级转录物的转录后加工的RNA序列并被称为成熟RNA。“信使RNA(mRNA)”是指无内含子并且可由细胞翻译成蛋白质的RNA。“cDNA”是指与mRNA模板互补并且利用逆转录酶从mRNA模板合成的DNA。cDNA可为单链的或者可用DNA聚合成酶I的Klenow片段转化成双链形式。“有义”RNA是指包含mRNA并且可在细胞内或体外翻译成蛋白质的RNA转录物。“反义RNA”是指与靶初级转录物或mRNA的全部或部分互补,并阻断分离的靶核酸片段表达的RNA转录物(美国专利:5,107,065)。反义RNA可与特定基因转录物的任何部分,即5'非编码序列、3'非编码序列、内含子或编码序列互补。“功能性RNA”是指反义RNA、核酶RNA或其它不能翻译但是对细胞过程有影响的RNA。术语“互补的”和“反向互补的”对mRNA转录来说是互换使用的,并且用以定义信使反义RNA。
术语“内源性RNA”是指在用本发明的重组构建体转化之前由存在于宿主基因组中的任何核酸序列编码的任何RNA,它可为天然存在的或非天然存在的,即,通过重组方法、诱变等引入的。
术语“非天然存在的”是指人工的,与通常天然存在的不一致。
“信使RNA(mRNA)”是指无内含子并且可由细胞翻译成蛋白质的RNA。
“cDNA”是指与mRNA模板互补并且利用逆转录酶从mRNA模板合成的DNA。cDNA可为单链的或者可用DNA聚合成酶I的Klenow片段转化成双链形式。
“有义”RNA是指包含mRNA并且可在细胞内或体外翻译成蛋白质的RNA转录物。
“反义RNA”是指与全部或部分靶初级转录物或mRNA互补并阻止靶基因表达的RNA(美国专利5,107,065)。反义RNA可与特定基因转录物的任何部分,即5'非编码序列、3'非编码序列、内含子或编码序列互补。
“功能性RNA”是指反义RNA、核酶RNA或其他不能被翻译但是对细胞过程有影响的RNA。术语“互补的”和“反向互补的”相对于mRNA转录来说是互换使用的,并且用以定义信使反义RNA。
术语“重组DNA构建体”是指从获自不同来源的核酸片段组装而成的DNA构建体。所述核酸片段的类型和来源可大为不同。
“重组表达构建体”包含可操作地连接到至少一种调控元件的核酸片段,其能够影响所述核酸片段的表达。重组表达构建体还可影响同源序列在宿主细胞中的表达。
在一个实施例中,重组表达构建体的选择取决于将被用于转化宿主细胞的方法。技术人员熟知为了成功地转化、筛选和繁殖宿主细胞,必须存在于重组表达构建体上的遗传元件。技术人员还将认识到,不同的独立转化事件可被筛选,以获得表现出所期望的表达水平和模式的品系。这样的筛选可通过但不限于DNA的Southern印迹分析、mRNA表达的Northern印迹分析、蛋白质表达的Western分析或表型分析来完成。
术语“可操作地连接”是指单个核酸片段上的核酸片段的关联,使得其中一个核酸片段的功能受到另一个的调控。例如,当启动子能够调控编码序列的表达(即,该编码序列受到该启动子的转录控制)时,则该启动子与该编码序列可操作地连接。编码序列可在有义或反义方向上可操作地连接到调控序列。在另一个例子中,本发明的互补RNA区域,无论直接或间接连接、5'端与目标mRNA或3'端与目标mRNA连接或者位于目标mRNA内或者第一互补区域以5'端而其互补序列以3'端与目标mRNA连接,均能够可操作地连接。
“调控序列”是指位于编码序列的上游(5'非编码序列)、中间或下游(3'非编码序列),并且可影响相关编码序列的转录、RNA加工、稳定性或者翻译的核苷酸。调控序列可包括并且不限于启动子、翻译前导序列、内含子和多腺苷酸化识别序列。
“启动子”是指能够控制编码序列或功能性RNA表达的DNA序列。启动子序列由近端和更远端上游元件组成,后者经常被称为增强子。因此,“增强子”是可刺激启动子活性的DNA序列,它可为启动子的先天元件,或是插入以增强启动子水平或组织特异性的异源元件。启动子序列还可位于基因的转录部分内部和/或被转录的序列的下游。启动子可整个源于原生基因,或者由源于天然存在的不同启动子的不同元件构成,或者甚至包含合成的DNA片段。本领域内的技术人员应当理解,不同的启动子可在不同的组织或细胞类型中,或者在不同的发育阶段,或者响应不同的环境条件来指导分离的核酸片段的表达。在多数情况下,引起分离的核酸片段在大多数细胞型中表达的启动子通常称为“组成型启动子”。目前不断在发现可用于植物细胞中的不同类型的新启动子;在Okamuro和Goldberg(1989),Biochemistry of Plants15:1‑82的汇编中可找到许多例子。还应认识到,因为在大多数情况下还不能完全确定调控序列的确切范围,因此一些变型的DNA片段可能具有相同的启动子活性。
可被用于表达本发明核酸片段的启动子的具体例子包括但不限于油质蛋白启动子(PCT公开WO99/65479,公布于1999年12月12日)、玉米27kD玉米蛋白启动子(Ueda等人(1994)Mol.Cell.Biol.14:4350‑4359)、泛素启动子(Christensen等人(1992)Plant Mol.Biol.18:675‑680)、SAM合成酶启动子(PCT公开WO00/37662,公布于2000年6月29日)、CaMV35S(Odell等人(1985)Nature313:810‑812)和2002年12月12日公布的PTC公开WO02/099063中描述的启动子。
“翻译前导序列”是指位于基因启动子和编码序列之间的多核苷酸片段。翻译前导序列存在于翻译起始序列的经充分加工后的mRNA上游。翻译前导序列可影响mRNA的初级转录物、mRNA稳定性或翻译效率。翻译前导序列的例子已有所描述(Turner,R.和Foster,G.(1995)Mol.Biotechnol.,3:225‑236)。
“内含子”是基因中不编码蛋白序列部分的居间序列。因此,此类序列转录成RNA后被切除,不被翻译。该术语也用于切除的RNA序列。
“3′非编码序列”是指位于编码序列下游并且包括能够影响mRNA加工或基因表达的多腺苷酸化识别序列和其他编码调控信号的序列。多腺苷酸化信号通常表征为影响多腺苷酸片添加到mRNA前体的3'末端。Ingelbrecht,I.L.,等人(1989)Plant Cell1:671‑680例示了不同的3′非编码序列的使用。
本文使用的标准重组DNA和分子克隆技术是本领域熟知的并且在如下文献中有更全面的描述:Sambrook,J.,Fritsch,E.F.和Maniatis,T.Molecular Cloning:ALaboratory Manual;Cold Spring Harbor Laboratory Press:Cold Spring Harbor,1989。转化方法为本领域的技术人员熟知的并描述于下文中。
“PCR”或“聚合酶链反应”是用于合成大量的特定DNA片段的技术,其包括一系列重复的循环(Perkin Elmer Cetus Instruments,Norwalk,CT)。通常,使双链DNA热变性,两种与目标片段的3'端边界区互补的引物在较低温度下与之退火,然后在中间温度下延伸。一组上述三个连续步骤被称为一个循环。
“稳定转化”是指将核酸片段转入宿主生物的基因组包括核基因组和细胞器基因组中,从而获得基因稳定遗传。
相反“瞬时转化”是指将核酸片段转入宿主生物的核中或包含DNA的细胞器中,在无整合或无稳定的遗传性的情况下引起基因表达。
包含转化的核酸片段的宿主生物被称为“转基因”生物。
术语“扩增”是指用至少一种核酸序列作为模板,构建核酸序列的多个拷贝或与所述核酸序列互补的多个拷贝。扩增体系包括聚合酶链反应(PCR)体系、连接酶链反应(LCR)体系、基于核酸序列的扩增(NASBA,Cangene,Mississauga,Ontario)、Q‑β复制酶体系、基于转录的扩增体系(TAS)和链置换扩增反应(SDA)。参见,例如,Diagnostic Molecular Microbiology:Principles and Applications,D.H.Persing等人,编辑,American Society for Microbiology,Washington,D.C.(1993)。扩增的产物被称为扩增子。
术语“染色体位置”包括以染色体的长度为基准,其可通过参考组成它的DNA的直线段而被测量。染色体位置可通过参考两段独特的DNA序列即标记而被限定。
术语“标记”包括以染色体上的基因座为基准,其起到鉴定染色体上的独特位置的作用。“多态性标记”包括以多种形式(等位基因)出现,使得该标记的不同形式(当它们存在于同源对中时)允许这个对中的每一染色体的传播被跟踪的标记。基因型可以一种或多种标记的使用而被限定。
本发明包括,特别是,用于改变或调节(即,提高或降低)本文所述的PAE或PAE样多肽在植物中的水平的组合物和方法。大豆种子中的油、蛋白质、淀粉和可溶性碳水化合物库的大小可通过改变编码PAE或PAE样蛋白质的特异性基因的表达而被调节或改变(即,提高或降低)。
在一个实施例中,本发明涉及包含重组DNA构建体的转基因植物,所述重组DNA构建体包含可操作地连接到至少一种调控元件的多核苷酸,其中所述多核苷酸编码多肽,所述多肽基于Clustal V比对方法在与SEQ IDNO:36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68或85进行比较时具有至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列,并且其中从所述转基因植物获得的种子在与从不包含所述重组DNA构建体的对照植物获得的种子进行比较时具有改变的油、蛋白质、淀粉和/或可溶性碳水化合物含量。
在第二实施例中,本发明涉及从所述转基因植物获得的转基因种子,所述转基因种子包含重组DNA构建体,所述重组DNA构建体包含可操作地连接到至少一种调控元件的多核苷酸,其中所述多核苷酸编码多肽,所述多肽基于Clustal V比对方法在与SEQ ID NO:36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68或85进行比较时具有至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列,并且其中所述转基因种子在与不包含所述重组DNA构建体的对照植物进行比较时具有改变的油、蛋白质、淀粉和/或可溶性碳水化合物含量。
在第三实施例中,本发明涉及从所述转基因植物获得的转基因种子,所述转基因种子包含重组DNA构建体,所述重组DNA构建体包含可操作地连接到至少一种调控元件的多核苷酸,其中所述多核苷酸编码多肽,所述多肽基于Clustal V比对方法在与SEQ ID NO:36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68或85进行比较时具有至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列,并且其中所述转基因种子在与不包含所述重组DNA构建体的对照种子进行比较时,基于干重计具有至少0.5%、1%、1.5%、2%、2.5%、3.0%、3.5%、4.0%、4.5%、5.0%、5.5%、6.0%、6.5%、7.0%、7.5%、8.0%、8.5%、9.0%、9.5%、10.0%、10.5%、11%、11.5%、12.0%12.5%、13.0、13.5%、14.0%、14.5%、15.0%、15.5%、15.0%、16.5%、17.0%、17.5%18.0%、18.5%、19.0%、19.5%、20.0%、20.5%、21.0%、21.5%、22.0%、22.5%、23.0%、23.5%、24.0%、24.5%、25.0%、25.5%、26.0%、26.5%、27.0%、27.5%、28.0%、28.5%、29%、29.5%、30.0%、30.5%、31.0%、31.5%、32.0%、32.5%、33.0%、33.5%、34.0%、35.0%、35.5%、36.0%、36.5%、37.0%、37.5%、38.0%、38.5%、39.0%、39.5%、40.0%、40.5%、41.0%、41.5%、42.0%、42.5%、43.0%、43.5%、44.0%、44.5%、45.0%、45.5%、46.0%、46.5%、47.0%、47.5%、48.0%、48.5%、49.0%、49.5%或50.0%的提高的淀粉含量。
在另一个实施例中,本发明涉及重组DNA构建体,所述DNA构建体包含与至少一种调控序列可操作地连接的任何本发明的分离多核苷酸。
在本发明的另一个实施例中,本发明的重组构建体还包含增强子。
在另一个实施例中,本发明涉及包含任何本发明的多核苷酸的载体。
在另一个实施例中,本发明涉及分离的多核苷酸片段,所述分离的多核苷酸片段包含由任何本发明的多核苷酸组成的核苷酸序列,其中所述核苷酸序列包含至少30、40、60、100、200、300、400、500或600个核苷酸。
在另一个实施例中,本发明涉及用于转化细胞的方法和通过该方法转化的细胞,所述方法包括用本发明的任何分离的多核苷酸转化细胞。有利的是,所述细胞是真核的,例如酵母或植物细胞,或者是原核的,例如细菌。
在另一个实施例中,本发明涉及用于转化细胞的方法,所述方法包括用本发明的多核苷酸转化细胞。
在另一个实施例中,本发明涉及用于产生转基因植物的方法,所述方法包括用本发明的分离的多核苷酸中的任一种转化植物细胞并且由转化的植物细胞再生转基因植物。
在另一个实施例中,细胞、植物或种子包含本发明的重组DNA构建体。
在另一个实施例中,分离的多核苷酸包含:(i)编码多肽的核酸序列,所述多肽基于Clustal V比对方法,在与SEQ ID NO:36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68或85进行比较时具有至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列;或(ii)(i)的核酸序列的全长互补序列,其中所述全长互补序列和(i)的核酸序列由相同数目的核苷酸组成,并且是100%互补的。前述分离的多核苷酸中的任一种可用于本发明的任何重组DNA构建体(包括抑制DNA构建体)。优选地,所述多肽是PAE或PAE样蛋白质。
在另一个实施例中,分离的多核苷酸包含:(i)基于Clustal V比对方法在与SEQ ID NO:36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68或85进行比较时具有至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的核酸序列;或(ii)(i)的核酸序列的全长互补序列;前述分离的多核苷酸中的任一种可用于本发明的任何重组DNA构建体(包括抑制DNA构建体)。优选地,所述多肽是PAE或PAE样蛋白质。
在一个方面,本发明包括重组DNA构建体(包括抑制DNA构建体)。
在另一个实施例中,本发明涉及选择分离的多核苷酸的方法,所述多核苷酸改变(即,提高或降低)PAE或PAE样蛋白质基因、蛋白质或酶活性在优选为植物细胞的宿主细胞中的表达水平,所述方法包括以下步骤:(a)构建本发明的分离的多核苷酸或本发明的分离的重组DNA构建体;(b)将所述分离的多核苷酸或所述分离的重组DNA构建体引入宿主细胞中;(c)测量PAE或PAE样蛋白质RNA、蛋白质或酶活性在包含所述分离的多核苷酸或重组DNA构建体的宿主细胞中的水平;(d)将所述PAE或PAE样RNA、蛋白质或酶活性在包含所述分离的多核苷酸或重组DNA构建体的宿主细胞中的水平,与所述PAE或PAE样RNA、蛋白质或酶活性在不包含所述分离的多核苷酸或重组DNA构建体的宿主细胞中的水平进行比较,并选择改变(即提高或降低)了所述PAE或PAE样蛋白质的基因、蛋白质或酶活性在所述植物细胞中的表达水平的分离的多核苷酸或重组DNA构建体。
在另一个实施例中,本发明涉及用于抑制编码具有PAE或PAE样蛋白质活性的PAE或PAE样蛋白质的基因在转基因植物中的表达水平的方法,其中所述方法包括:(a)用本发明的分离的多核苷酸的片段转化植物细胞;(b)由9a)的转化的植物细胞再生转基因植物;以及(c)选择编码具有PAE或PAE样蛋白质活性的多肽的基因在其中的表达水平已被抑制的转基因植物。
优选地,所述基因编码具有PAE或PAE样蛋白质活性的多肽,并且所述植物是大豆植物。
在另一个实施例中,本发明涉及用于产生转基因种子的方法,所述方法包括:a)用(i)如SEQ ID NO:35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67或84所示的核苷酸序列的全部或部分或(ii)(i)的互补序列的重组DNA构建体转化植物细胞;其中(i)或(ii)在内源性PAE或PAE样蛋白质活性在转基因植物中的共抑制或反义抑制中是有用的;(b)由(a)的转化的植物细胞再生转基因植物;以及(c)选择产生转基因种子的转基因植物,所述转基因种子与从非转基因的植物获得的种子相比具有至少1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%或30%的油含量的提高。优选地,所述种子是大豆植物。
在另一个实施例中,在基因组中包含重组DNA构建体的植物,该重组DNA构建体包含:(a)可操作地连接到至少一种调控元件的多核苷酸,其中所述多核苷酸编码多肽,所述多肽基于Clustal V比对方法在与SEQ ID NO:36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68或85进行比较时具有至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列,或(b)包含至少一种调控元件的抑制DNA构建体,所述调控元件可操作地连接到:(i)以下序列的全部或部分:(A)编码多肽的核酸序列,所述多肽基于Clustal V比对方法在与SEQ ID NO:36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68或85进行比较时具有至少70%序列同一性的氨基酸序列,或(B)(b)(i)(A)的核酸序列的全长互补序列;或(ii)来源于受关注的靶基因的有义链或反义链的全部或部分的区域,所述区域基于Clustal V比对方法在与所述区域所源自的有义链或反义链的所述全部或部分进行比较时具有至少70%序列同一性的核酸序列,并且其中所述受关注的靶基因编码PAE或PAE样蛋白质,并且其中所述植物在与不包含重组DNA构建体的对照植物进行比较时具有改变的油、蛋白质、淀粉和/或可溶性碳水化合物含量。
转基因种子在与非转基因的种子的油含量进行比较时具有至少1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%或30%的提高的油含量,其中所述转基因种子包含重组DNA构建体,所述重组DNA构建体包含:(a)如SEQ ID NO:35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67或84所示的核苷酸序列的全部或部分;或(b)(a)的全长互补序列,其中(a)或(b)具有足够抑制内源性PAE或PAE样蛋白质活性在转基因植物中的表达的长度,并且进一步地其中所述种子与从非转基因的植物获得的种子相比,基于干重计具有至少1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%或30%的油含量的提高。
本发明的另一个实施例涉及包含重组DNA构建体的转基因种子,所述重组DNA构建体包含:
(a)如SEQ ID NO:35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67或84所示的核苷酸序列的全部或部分;或(b)(a)的全长互补序列:
其中(a)或(b)具有足够抑制内源性PAE或PAE样蛋白质活性在转基因植物中的表达的长度,并且进一步地其中所述种子与从非转基因的植物获得的种子相比,基于干重计具有至少1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%或30%的油含量的提高。
在另一个实施例中,本发明涉及用于产生转基因植物的方法,所述方法包括:(a)用重组DNA构建体转化植物细胞,所述重组DNA构建体包含可操作地连接到至少一种调控序列的多核苷酸,其中所述多核苷酸编码多肽,所述多肽基于Clustal V比对方法在与SEQ ID NO:36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68或85进行比较时具有至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列;以及(b)由所述转化的植物细胞再生植物。
本发明的另一个实施例涉及用于产生转基因种子的方法,所述方法包括:(a)用重组DNA构建体转化植物细胞,所述重组DNA构建体包含可操作地连接到至少一种调控序列的多核苷酸,其中所述多核苷酸编码多肽,所述多肽基于Clustal V比对方法在与SEQ ID NO:36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68或85进行比较时具有至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列;以及(b)由(a)的转化的植物细胞再生转基因植物;以及(c)选择产生转基因种子的转基因植物,所述转基因种子与从非转基因的植物获得的转基因种子相比具有改变的油、蛋白质、淀粉和/或可溶性碳水化合物含量。
本发明的另一个实施例涉及用于产生转基因种子的方法,所述方法包括:(a)用重组DNA构建体转化植物细胞,所述重组DNA构建体包含可操作地连接到至少一种调控序列的多核苷酸,其中所述多核苷酸编码多肽,所述多肽基于Clustal V比对方法在与SEQ ID NO:36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68或85进行比较时具有至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列;以及(b)由(a)的转化的植物细胞再生转基因植物;以及(c)选择产生转基因种子的转基因植物,所述转基因种子与从非转基因的植物获得的转基因种子相比,基于干重计具有至少0.5%、1%、1.5%、2%、2.5%、3.0%、3.5%、4.0%、4.5%、5.0%、5.5%、6.0%、6.5%、7.0%、7.5%、8.0%、8.5%、9.0%、9.5%、10.0%、10.5%、11%、11.5%、12.0%12.5%、13.0、13.5%、14.0%、14.5%、15.0%、15.5%、15.0%、16.5%、17.0%、17.5%18.0%、18.5%、19.0%、19.5%、20.0%、20.5%、21.0%、21.5%、22.0%、22.5%、23.0%、23.5%、24.0%、24.5%、25.0%、25.5%、26.0%、26.5%、27.0%、27.5%、28.0%、28.5%、29%、29.5%、30.0%、30.5%、31.0%、31.5%、32.0%、32.5%、33.0%、33.5%、34.0%、35.0%、35.5%、36.0%、36.5%、37.0%、37.5%、38.0%、38.5%、39.0%、39.5%、40.0%、40.5%、41.0%、41.5%、42.0%、42.5%、43.0%、43.5%、44.0%、44.5%、45.0%、45.5%、46.0%、46.5%、47.0%、47.5%、48.0%、48.5%、49.0%、49.5%或50.0%的提高的淀粉含量。
在另一个实施例中,本发明涉及用于产生转基因种子的方法,所述方法包括:(a)用重组DNA构建体转化植物细胞,所述重组DNA构建体包含:(i)SEQ ID NO:35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67或84所示的核苷酸序列的全部或部分;或(ii)(i)的全长互补序列;其中(i)或(ii)具有足够抑制内源性PAE或PAE样蛋白质活性在转基因植物中的表达的长度;(b)由(a)的转化的植物细胞再生转基因植物;以及(c)选择产生转基因种子的转基因植物,所述转基因种子与从非转基因的植物获得的转基因种子相比具有改变的油、蛋白质、淀粉和/或可溶性碳水化合物含量。
用于产生转基因种子的方法,所述方法包括:(a)用重组DNA构建体转化植物细胞,所述重组DNA构建体包含:(i)如SEQ ID NO:35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67或84所示的核苷酸序列的全部或部分;或(ii)(i)的全长互补序列;其中(i)或(ii)具有足够抑制内源性PAE或PAE样蛋白质活性在转基因植物中的表达的长度;(b)由(a)的转化的植物细胞再生转基因植物;以及(c)选择产生转基因种子的转基因植物,所述转基因种子与从非转基因的植物获得的转基因种子相比,基于干重计具有至少1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%或30%的油含量的提高。
大豆可被加工成多种产品。例如,“大豆蛋白产品”可包括但不限于表2中列出的那些产品。“大豆蛋白产品”。
表2
来源于大豆种子的大豆蛋白产品a
a参见Soy Protein Products:Characteristics、Nutritional Aspects and Utilization(1987)。
大豆蛋白委员会。
“加工”是指用以获得表A中所列产品的任何物理和化学方法,所述方法包括但不限于对完整种子或种子局部进行的热处理、去皮与碾磨、挤压、溶剂提取或水浸提取。此外,“加工”还包括用以从完整种子或种子局部浓缩和提取大豆蛋白质的方法,以及东方国家制作大豆发酵食物产品的各种传统方法。关于建立起多种所述产品的贸易标准和规格(参见National Oilseed Processors Association Yearbook and Trading Rules1991‑1992)。
“低变性”豆粕是指在控制湿热以使PDI(AOCS:Ba10‑65)为约85至90的条件下经过处理并脱脂的、脱壳去皮的大豆子叶。该术语也可指被碾磨至能通过100号美国标准筛尺寸的、具有相似PDI的大豆粉。
“粗磨粉”是指具有在10号和80号之间的美国标准筛尺寸的脱脂去壳的子叶。
“大豆蛋白浓缩物”是指脱脂去壳的大豆经以下三个基本步骤所获得的产品:酸浸(约pH4.5),用酒精(约55‑80%)提取,以及在用水提取之前用湿热处理使蛋白质变性。用于制备大豆蛋白浓缩物的典型条件已被Pass描述((1975)美国专利3,897,574;Campbell等人(1985)在New Protein Foods,由Altschul和Wilcke编辑,Academic Press,第5卷,第10章,SeedStorage Proteins,第302‑338页中)。
“挤出”是指其中材料(粗磨粉、豆粉或浓缩物)在高压高温条件下通过带夹套的螺旋输送机并由此改变材料质地的方法。“质构化”和“构造化”是指用以改变所述原料物理特性的挤压过程。这些方法包括热塑性挤出的特性此前已被描述(Atkinson(1970)美国专利3,488,770,Horan(1985)在New Protein Foods,由Altschul和Wilcke编辑,Academic Press,第1A卷,第8章,第367‑414页中)。此外,包含大豆蛋白产品的复合食品混合物的挤压过程所使用的条件此前也已有描述(Rokey(1983)Feed Manufacturing TechnologyIII,第222‑237页;McCulloch,美国专利4,454,804)。
表3
大豆油和副产品生产的一般步骤
更具体地,大豆种子被清洁、回火、脱壳并去皮,从而提高了油提取的效率。油的提取通常通过溶剂(例如己烷)提取来完成,但也可通过联合使用物理压榨和/或溶剂提取而实现。所得油被称为原油。可通过使磷脂以及其他极性和中性的脂类复合物发生水合反应从而促进它们与非水合的甘油三酯部分(大豆油)分离,而使所述原油脱胶。所得卵磷脂胶可被进一步加工以制备商业上重要的卵磷脂产品,所述产品作为乳化剂和脱模(即抗粘结)剂用于多种食品和工业品中。脱胶油可进一步精炼以除去杂质(主要是游离脂肪酸、颜料和残留胶)。通过添加与游离脂肪酸反应形成皂并使所述原油中的磷脂和蛋白质发生水合反应的腐蚀剂而实现精炼。用水洗去精炼过程中所形成的皂类痕迹。所述皂脚副产品可直接用于动物饲料或将其酸化以回收游离脂肪酸。利用漂白土的吸附作用除去大部分的叶绿素和类胡萝卜素化合物而实现脱色。精炼的油可被氢化,从而得到具有不同熔解性质和质地的脂肪。可通过在精细控制的冷却条件下结晶,从而利用冷凝(分馏)从氢化油中除去硬脂。脱臭(主要通过真空蒸汽蒸馏)是最后一个步骤,并且被设计用于除去那些令油具有臭味或气味的复合物。脱臭过程中还可除去其他有价值的副产品,如生育酚和甾醇类。包含这些副产品的脱臭馏出液可被出售,以用于生产天然维生素E和其他高价值药用产品。经精炼、漂白、(氢化、分馏)以及脱臭的油和脂肪可直接包装出售,或进一步加工为更加专门化的产品。关于大豆种子加工、大豆油生产以及副产品利用的更加详尽的参考文献可见于Erickson,Practical Handbook of Soybean Processing and Utilization,The American Oil Chemists’ Society and United Soybean Board(1995)。大豆油在与如椰子、棕榈、棕榈仁以及可可等的油进行比较时,因其饱和脂肪酸含量相对较低,因此在室温下为液态。
例如,包含已经精炼过的和/或纯化过的多不饱和脂肪酸(PUFA)的植物油和微生物油可被氢化,从而产生具有多种熔炼性质和质地的脂肪。多种经加工的脂肪(包括涂抹油、糖果脂肪、硬质脂肪、人造黄油、烤酥油等)要求在室温下具有的硬度各不相同,而它们只能通过改变原料油的物理性质而产生。通常通过催化氢化实现这点。
氢化作用是其中在催化剂,如镍的帮助下,将氢加到不饱和脂肪酸双键上的化学反应。例如,高油酸大豆油包含不饱和的油酸、亚油酸和亚麻酸脂肪酸,而上述每种脂肪酸都可被氢化。氢化作具有两个主要效应。第一,由于不饱和脂肪酸含量的减少,油的氧化稳定性得到提高。第二,由于脂肪酸的修饰提高了熔点,改变了油的物理性质,从而得到在室温下为半液态或固态的脂肪。
影响氢化反应的参数有很多,它们继而影响着终产品的组成。包括压力、温度、催化剂类型和浓度、搅拌以及反应器设计在内的操作条件属于可控的重要参数范畴。可利用选择性氢化反应条件来实现对不饱和程度较高的脂肪酸相对于不饱和程度较低的脂肪酸的优先氢化。轻微或涂刷氢化(brush hydrogenation)常被用于提高液态油的稳定性。进一步氢化则使得液态油转化成物理上固态脂肪。氢化的程度取决于针对特定的终产物所期望的性能和熔解性质。通过氢化可获得无数种可能的油和脂肪产品,包括液态酥油(用于制作焙烤产品,用于商业化的油炸和烘烤操作的固态脂肪和酥油)以及用于加工人造黄油的基础油。对氢化作用和氢化产物的更详细的描述可见于Patterson,H.B.W.,Hydrogenation of Fats and Oils:Theory and Practice,The American Oil Chemists’Society(1994)中。
氢化油因氢化过程中产生的反式脂肪酸同分异构体的存在已存在一些争议。摄食大量的反式同分异构体被认为与一些有害健康的效应存在联系,包括血浆中低密度脂蛋白对高密度脂蛋白的比率的升高,以及罹患冠心病的风险升高。
在另一个实施例中,本发明涉及通过任何上述方法产生的转基因种子。优选地,所述种子是大豆种子。
本发明涉及在与非转基因的、无效基因分离子大豆种子的总脂肪酸含量进行比较时具有至少1%、2%、3%、4%、5%、6%、7%、8%、9%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%或30%的提高的总脂肪酸含量的转基因大豆种子。应当理解,转基因相对于非转基因的、无转基因分离子在总脂肪酸含量方面的任何可测量的提高都是有用的。所述总脂肪酸含量方面的提高包括但不限于至少1%、2%、3%、4%、5%、6%、7%、8%、9%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%或30%。
调控序列可包括并且不限于启动子、翻译前导序列、内含子和多腺苷酸化识别序列。
“组织特异性”启动子在特定类型的细胞或组织中优选地指导RNA生产。在多数情况下引起基因在大多数细胞型中表达的启动子通常称为“组成型启动子”。目前不断在发现可用于植物细胞中的不同类型的新启动子;在Okamuro和Goldberg的汇编(Biochemistry of Plants15:1‑82(1989))中可找到大量实例。还应认识到因为在大多数情况下还不能完全确定调控序列的确切范围,一些变型的DNA片段可具有相同的启动子活性。
许多启动子可被用于实施本发明。可基于所需结果选择启动子。核酸可与组成型的、组织特异性的(优选的)、可诱导的或其他的启动子相结合以在宿主生物中表达。适用于植物宿主细胞的组成型启动子包括,例如,Rsyn7启动子的核心启动子和在WO99/43838和美国专利6,072,050中公开的其他组成型启动子;核心CaMV35S启动子(Odell等人,Nature313:810‑812(1985));稻肌动蛋白启动子(McElroy等人,Plant Cell2:163‑171(1990));泛素启动子(Christensen等人,Plant Mol.Biol.12:619‑632(1989),以及Christensen等人,Plant Mol.Biol.18:675‑689(1992));pEMU(Last等人,Theor.Appl.genet.81:581‑588(1991));MAS(Velten等人,EMBO J.3:2723‑2730(1984));ALS启动子(美国专利5,659,026)等。其他组成型启动子包括,例如,美国专利:5,608,149;5,608,144;5,604,121;5,569,597;5,466,785;5,399,680;5,268,463;5,608,142;和6,177,611中所讨论的那些。
在选择用于本发明方法中的启动子时,可能期望使用组织特异性启动子或发育调控的启动子。组织特异性的或发育调控的启动子是调控DNA序列在植物的特定细胞/组织中选择性的表达的DNA序列。任何引起所需时空表达的可鉴定启动子都可用于本发明的方法中。
可用于本发明的种子或胚特异性的启动子包括马铃薯块茎特异蛋白(patatin)启动子(马铃薯块茎)(Rocha‑Sosa,M.等人(1989),EMBOJ.8:23‑29)、convicilin启动子、豌豆球蛋白启动子和豆球蛋白启动子(豌豆子叶)(Rerie,W.G.等人(1991)Mol.Gen.Genet.259:149‑157;Newbigin,E.J.等人(1990)Planta180:461‑470;Higgins,T.J.V.等人(1988)Plant.Mol.Biol.11:683‑695)、玉米蛋白启动子(玉米胚乳)(Schemthaner,J.P.等人(1988),EMBO J.7:1249‑1255)、菜豆蛋白启动子(菜豆子叶)(Segupta‑Gopalan,C.等人(1985)Proc.Natl.Acad.Sci.U.S.A.82:3320‑3324)、植物血球凝集素启动子(菜豆子叶)(Voelker,T.等人(1987),EMBO J.6:3571‑3577)、B‑伴大豆球蛋白启动子和大豆球蛋白启动子(大豆子叶)(Chen,Z‑L等人(1988)EMBO J.7:297‑302)、谷蛋白启动子(稻胚乳)、大麦醇溶蛋白启动子(大麦胚乳)(Marris,C.等人(1988)Plant Mol.Biol.10:359‑366)、麦谷蛋白启动子和麦醇溶蛋白启动子(小麦胚乳)(Colot,V.等人(1987)EMBO J.6:3559‑3564)和甘薯贮藏蛋白启动子(甘薯块根)(Hattori,T.等人(1990)Plant Mol.Biol.14:595‑604)。可操作地连接到嵌合基因构建体中的异源编码区的种子特异性基因的启动子在转基因植物中保持它们的时空表达模式。这样的例子包括在拟南芥属(Arabidopsis)和甘蓝型油菜(Brassica napus)种子中表达脑啡肽的拟南芥2S种子储藏蛋白基因启动子(Vanderkerckhove等人,Bio/Technology7:L929‑932(1989))、表达荧光素酶的菜豆凝集素和菜豆β‑菜豆蛋白启动子(Riggs等人,Plant Sci.63:47‑57(1989)),以及表达氯霉素乙酰转移酶的小麦谷蛋白启动子(Colot等人,EMBO J6:3559‑3564(1987))。
更多的启动子描述于2000年4月6日公布的WO00/18963中,其公开内容以引用方式并入本文。种子特异性启动子的例子包括但不限于,大豆Kunitz型胰蛋白酶抑制剂的启动子(Kti3,Jofuku和Goldberg,PlantCell1:1079‑1093(1989))、β‑伴大豆球蛋白启动子(Chen等人,Dev.genet.10:112‑122(1989))、油菜籽蛋白(napin)启动子和菜豆蛋白启动子。
在一些实施例中,用作启动子或增强子元件的分离的核酸,可被引入非异源性形式的本发明的多核苷酸的适当位置(一般是上游),以便上调或下调本发明的多核苷酸的表达。例如,内源性启动子可在体内通过突变、缺失、和/或取代而被改变(参见,Kmiec,美国专利5,565,350;Zarling等人,PCT/US93/03868),或者分离的启动子可以适当的取向和与本发明的多核苷酸的同源基因的距离被引入植物细胞中,以便控制所述基因的表达。基因表达可在适合植物生长的条件下被调节,以便改变本发明的多肽在植物细胞中的总浓度和/或组成。因此,本发明包括用于制备可操作地连接到本发明的多核苷酸的原生的、内源性的(即,非异源性的)形式的异源性启动子和/或增强子的组合物和方法。
内含子序列可加至部分编码序列的5'非翻译区或编码序列以增加积聚在胞质溶胶中的成熟信息的量。已经显示,在植物和动物两者的表达构建体的转录单位中包含可剪接内含子可使基因表达在mRNA和蛋白质水平上均增强高达1000倍(Buchman和Berg,Mol.Cell Biol.8:4395‑4405(1988);Callis等人,Genes Dev.1:1183‑1200(1987))。这种内含子对基因表达的增强通常在将其设置接近转录单位的5'端时为最大。玉米内含子Adh1‑S内含子1、2和6、Bronze‑1内含子的使用是本领域已知的。通常参见The Maize Handbook,第116章,Freeling和Walbot(编辑),Springer,New York(1994)。包含来自本发明的多核苷酸的序列的载体将通常包含赋予植物细胞选择性表型的标记基因。对于在高等植物中表达基因有用的典型的载体是本领域中为人们所熟知的,并且包括来源于Rogers等人,Meth.in Enzymol.153:253‑277(1987)中描述的根癌农杆菌(Agrobacterium tumefaciens)的肿瘤诱导(Ti)质粒的载体。
如果期望进行多肽表达,则通常希望在多核苷酸编码区的3'‑端处包含多腺苷酸化区。该多腺苷酸化区可源自天然基因,源自多种其他植物基因或源自T‑DNA。要加入的3'端序列可源自(例如)胭脂碱合酶或章鱼碱合酶基因,或作为另外一种选择源自另外的植物基因,或较不优选的是源自任何其他真核基因。
优选的重组DNA构建体包括以下组合:a)核酸片段,其对应于可操作地连接到至少一种编码选择性标记的核酸片段的启动子,然后是对应于终止子的核酸片段,b)核酸片段,其对应于可操作地连接到可产生茎‑环结构的核酸片段,然后是对应于终止子的核酸片段,和c)上述a)和b)的任何组合。优选地,在茎‑环结构中,至少一种能够抑制原生基因表达的核酸片段包含“环”,并且被能够产生茎的核酸片段围绕。
用于转化双子叶植物和获得转基因植物的优选的方法已被公布:棉花(美国专利5,004,863、美国专利5,159,135);大豆(美国专利5,569,834、美国专利5,416,011);芸苔属植物(美国专利5,463,174);花生(Cheng等人(1996)Plant Cell Rep.15:653‑657,McKently等人(1995)Plant Cell Rep.14:699‑703);木瓜(Ling,K.等人(1991)Bio/technology9:752‑758);以及豌豆(Grant等人(1995)Plant Cell Rep.15:254‑258)等等。对其他常用植物转化方法的综述参见Newell,C.A.(2000)Mol.Biotechnol.,16:53‑65。这些转化方法之一利用了发根农杆菌(Agrobacterium rhizogenes)(Tepfler,M.和Casse‑Delbart,F.(1987)Microbiol.Sci.,4:24‑28)。已公布的利用直接输送DNA进行的大豆转化,采用了PEG融合(PCT公开WO92/17598)、电穿孔(Chowrira,G.M.等人(1995)Mol.Biotechnol.,3:17‑23;Christou,P.等人(1987)Proc.Natl.Acad.Sci.U.S.A.84:3962‑3966)、显微注射或粒子轰击(McCabe,D.E.等人(1988)BiolTechnology6:923;Christou等人(1988)Plant.Physiol87:671‑674)。
存在多种用于从植物组织再生植物的方法。再生的具体方法将取决于起始植物组织以及待再生的具体植物物种。从单植物原生质体转化体或从多种经转化的外植体再生、发育和培育植物是本领域熟知的(Weissbach和Weissbach(编辑),(1988)载于:Methods for Plant Molecular Biology,Academic Press,Inc.,San Diego,CA)中。该再生和生长方法通常包括以下步骤:选择转化的细胞、培养那些单独化的细胞通过胚胎发育的通常阶段以及通过生根小植株阶段。转基因胚和种子相似地再生。随后将所得的转基因的生根小苗种植在诸如土壤之类的合适植物生长培养基中。所再生的植物可自授粉。或者,将得自再生植物的花粉与农学上重要的品系的产生种子的植株进行杂交。相反,将来自这些重要品系的植物用于给再生植物授粉。利用本领域技术人员熟知的方法培育包含所需多肽的本发明的转基因植物。
除以上所讨论的程序以外,专业人员也熟悉描述了用于大分子的构建、操作和分离(例如DNA分子、质粒等等)、重组DNA片段和重组表达构建体的生成以及克隆的筛选和分离的特定条件和程序的标准源资料(例如参见Sambrook等人(1989)Molecular Cloning:A Laboratory Manual,Cold Spring Harbor Press;Maliga等人(1995)Methods in Plant Molecular Biology,Cold Spring Harbor Press;Birren等人(1998)Genome Analysis:Detectinggenes,1,Cold Spring Harbor,New York;Birren等人(1998)Genome Analysis:Analyzing DNA,2,Cold Spring Harbor,New York;Plant Molecular Biology:A Laboratory Manual,编辑,Clark,Springer,New York(1997))。
用于检测蛋白质的测定可通过SDS‑聚丙烯酰胺凝胶电泳或免疫学测定进行。用于检测酶的底物或产物水平的测定可使用气相色谱法或液相色谱法用于分离,使用UV或可见光谱法或质谱法用于检测等进行。测定受关注的酶的mRNA水平可使用Northern印迹或RT‑PCR技术进行。一旦已再生了植物,并且已获得了所述转基因纯合的子代植物,植物将具有稳定的表型,所述表型将在后续世代的类似种子中被观察到。
在另一方面,本发明包括在对编码具有细胞质焦磷酸酶活性的蛋白质的核酸序列的表达的反义抑制或共抑制中,最优选在内源性PAE或PAE样蛋白质基因的反义抑制或共抑制中有用的本发明的多核苷酸或其功能上等同的亚片段。
用于反义抑制或共抑制的规程是本领域的技术人员熟知的。
用于抑制的多核苷酸片段序列与需被抑制的基因中存在的多核苷酸片段序列不一定100%相同。例如,对大豆种子贮藏蛋白β‑伴大豆球蛋白的全部亚基的抑制已使用来源于编码α亚基的基因的部分的多核苷酸实现(美国专利6,362,399)。β‑伴大豆球蛋白是由三种高度带负电的亚基的变化的组合组成的异质糖蛋白,所述三种亚基被鉴定为α、α'和β。编码α和α'亚基的多核苷酸序列是彼此85%相同的,而编码β亚基的多核苷酸序列是分别与α和α′亚基75至80%相同的。因此,与需抑制的靶多核苷酸区域至少75%相同的多核苷酸已显示对抑制所需靶有效。所述多核苷酸可与所期望的靶序列至少约80%相同、至少90%相同、至少95%相同或约100%相同。
本发明的分离的核酸和蛋白质以及任何实施例可被用于大范围的植物类型,尤其是双子叶植物,例如大豆属(Glycine)的物种。
据信本发明的核酸和蛋白质以及任何实施例同样可被用于单子叶植物,包括但不限于禾本科(graminiae)包括高粱和玉米。
本发明的分离的核酸和蛋白质也可被用于来自以下双子叶植物属的物种:南瓜属(Cucurbita)、蔷薇属(Rosa)、葡萄属(Vitis)、核桃属(Juglans)、草霉属(Fragaria)、百脉根属(Lotus)、苜蓿属(Medicago)、驴豆属(Onobrychis)、三叶草属(Trifolium)、胡卢巴属(Trigonella)、豇豆属(Vigna)、柑桔属(Citrus)、亚麻属(Linum)、老鹳草属(Geranium)、木薯属(Manihot)、胡萝卜属(Daucus)、拟南芥属(Arabidopsis)、芸苔属(Brassica)、萝卜属(Raphanus)、白芥属(Sinapis)、颠茄属(Atropa)、辣椒属(Capsicum)、曼佗罗属(Datura)、天仙子属(Hyoscyamus)、番茄属(Lycopersicon)、烟草属(Nicotiana)、茄属(Solanum)、矮牵牛属(Petunia)、毛地黄属(Digitalis)、马郁兰属(Majorana)、菊苣属(Cichorium)、向日葵属(Helianthus)、莴苣属(Lactuca)、金鱼草属(Antirrhinum)、天竺葵属(Pelargonium)、毛茛属(Ranunculus)、千里光属(Senecio)、喇叭舌属(Salpiglossis)、黄瓜属(Cucumis)、紫水晶属(Browallia)、大豆属(Glycine)、豌豆属(Pisum)、菜豆属(Phaseolus),和来自以下单子叶植物属的物种:雀麦属(Bromus)、天门冬属(Asparagus)、萱草属(Hemerocallis)、稷属(Panicum)、狼尾草属(Pennisetum)、黑麦草属(Lolium)、稻属(Oryza)、燕麦属(Avena)、大麦属(Hordeum)、黑麦属(Secale)、小麦属(Triticum)、刺竹属(Bambusa)、牡竹属(Dendrocalamus)和梨竹属(Melocanna)。
实例
本发明将在以下实例中进一步限定,其中份数和百分比是按重量计的并且度数是摄氏度,除非另外说明。应当理解,这些实例尽管说明了本发明的优选实施例,但是仅以例证的方式给出。根据上面的论述和这些实例,本领域的技术人员可确定本发明的基本特征,并且在不脱离本发明的实质和范围的情况下,可对本发明做出各种变化和修改以使其适用于各种用法和条件。因此,除了本文所示和所述的那些之外,根据前文所述,本发明的各种修改形式对本领域的技术人员来说将是显而易见的。这些修改形式也旨在涵盖于所附权利要求书的范围内。
本文中所示的每篇参考文献的公开内容全文均以引用方式并入本文。
实例1
产生具有激活标记基因的拟南芥种群
产生了基于18.49kb T‑DNA的二元构建体,pHSbarENDs2(SEQ ID NO:1),其包含四个来源于花椰菜花叶病毒35S启动子的四个多聚增强子元件(对应于序列‑341至‑64,如Odell等人Nature313:810‑812所限定的(1985))。该构建体也包含允许质粒救援的载体序列(pUC9)和多接头(SEQ ID NO:2)、再动员T‑DNA的转座子序列(Ds)、以及允许草胺磷选择转基因植物的bar基因。原则上,仅将从右边界(RB)至左边界(LB)包括端值在内的10.8kb片段转移到寄主植物基因组中。因为增强子元件位于RB附近处,它们可诱导T‑DNA整合后的基因座的顺式激活。
通过整个植株的农杆菌转化来产生拟南芥属激活标记种群。将pHSbarENDs2(SEQ ID NO:1)构建体转化到根癌农杆菌菌株C58中,在25℃下于溶菌肉汤培养基中生长至OD600~1.0。然后通过离心沉淀细胞,并将其重悬于等体积的5%蔗糖/0.05%Silwet L‑77(OSI Specialties,Inc)中。在早期抽苔时,使拟南芥生态型Col‑0生长的土壤使用农杆菌悬浮液进行顶部灌溉。一周后,相同植株再次用在蔗糖/Silwet中的相同农杆菌菌株进行顶部灌溉。然后将该植株的种子设定为标准。所得T1种子在土壤中播种,通过喷洒草胺磷(AgrEvo;Bayer Environmental Science)来选择转基因幼苗。选择了总计100,000个草胺磷抗性的T1幼苗。来自每个品系的T2种子保持分离。合并了来自独立产生的带激活标记的品系的小等分T2种子。将合并的种子种植在土壤中,并且使植株生长至成熟,从而产生T3种子库,每个库包含来源于96个带激活标记的品系的种子。
实例2
突变体品系lo22730的鉴定和表征
基于Focks和Benning(1998),开发了用于筛选拟南芥种子密度的显著改进的方法。拟南芥种子可根据它们的密度进行分离。通过不同比例的1,6二溴己烷(d=1.6)、1‑溴己烷(d=1.17)和矿物油(d=0.84)的混合物,来制备密度层。从管的底部至顶部,按顺序加入6层有机溶剂,每层包含2mL。对于每一层,1,6二溴己烷:1‑溴己烷:矿物油的比例是1:1:0、1:2:0、0:1:0、0:5:1、0:3:1、0:0:1。将96种激活标记品系的给定库(相当于约30,000种子)的约600mgT3种子加载至包含所述不连续梯度的15ml玻璃管的表面层。在以2000×g离心5分钟后,根据种子密度将种子分离。收集在所述不连续梯度的最下面两层中的和来自管底部的种子。通过用100%乙醇和80%乙醇按顺序洗涤来去除有机溶剂,并使用5%次氯酸盐(NaOCl)水溶液对种子进行杀菌。用无菌水清洗种子,并铺板在包含0.5×MS盐、1%(W/V)蔗糖、0.05MES/KOH(pH5.8)、200μg/mL、10g/L琼脂和15mgL‑1草胺磷(Basta;Sigma Aldrich,USA)的MS‑1培养基上。以这种方式筛选了总共520个T3库,每一个池来源于96种T2激活标记品系。种子库475当经历如上所述的密度梯度离心时,产生了约25个具有提高的密度的种子。对这些种子进行了杀菌,并将其铺板在包含Basta的选择培养基上。将Basta抗性幼苗转移到土壤中,并且使植株在受控的环境中生长(22℃,16小时光照/8小时黑暗,100‑200μEm‑2s‑1)。与四株未转化的野生型哥伦比亚生态型(Columbia ecotype)拟南芥植株一起经过约8‑10周成熟。通过NMR(核磁共振)测量T4种子和对照种子的油含量如下。
基于NMR的种子油含量分析:
使用Maran UltranmR分析仪(Resonance Instruments Ltd,Whitney,Oxfordshire,UK)测定种子油含量。将样品(例如,每批重量为5和200mg之间的拟南芥种子)置于此前用独特的条形码标识符标记过的预称重的2mL聚丙烯管(Corning Inc,Corning NY,USA;Part no.430917)中。然后将样品置于96孔载样皿中并通过ADEPT COBRA600TM SCARA机器人系统按以下步骤进行处理:
1.拾起管(机器人臂配有一个真空捡拾装置);
2.读取条形码;
3.将管暴露于防静电装置(确保拟南芥种子不会粘附到管壁);
4.将管称量(包含样品),精确至0.0001g;
5.取NMR读数;测量为将22.95MHz信号照射样品1msec后的质子自旋回波强度(收集对每份样品进行的32次NMR扫描数据);
6.将管放回架上;以及
7.对下一管重复以上过程。
条形码、管重量和NMR读数用一台与上述系统相连的计算机进行记录。通过用包含样品的聚丙烯管重量减去聚丙烯管自身重量来确定样品重量。
大豆种子或大豆体细胞胚的种子油含量如下计算:
通过精确称量Corning管(见上)中大豆油样品重量(范围为0.0050至0.0700g,间隔为大约0.0050g,称量精确至0.0001g)并使其经历NMR分析,来确定校正参数。建立油含量(基于%种子重量;假设一粒标准种子重量为0.1500g)对NMR值的校准曲线。
通过NMR测量的种子油含量和通过传统分析化学方法测量的绝对油含量之间的相关性如下确定。将五十粒经选择以涵盖一定范围油含量的大豆种子在鼓风烘箱中于40℃下干燥48小时。如上所述,将单粒种子分别经历NMR分析,然后在GenoGrinder SPEX Centriprep(Metuchen,N.J.,U.S.A.);1500次振动/分钟,持续1分钟)中研磨成细粉。称取70和100mg之间的等分试样(精确至0.0001g),置于配有内衬的旋盖的13×100mm玻璃管中;。将剩余的来自每一菜豆的粉末用于通过在鼓风烘箱中于105℃下18小时后的重量差值来确定含水量。将庚烷(3ml)加入管中的粉末中,并在涡旋混合后,在直立圆筒搅拌器上于室温下对样品进行提取,持续1h。将提取物1500×g离心10min,将上层清液倾析到干净的管中,并用1mL庚烷再将沉淀提取两次(每次1h)。合并三次提取的上层清液并加入50μL内标物(三十七烷酸;10mg/mL甲苯),然后在氮气流下室温蒸发至干燥状态;在5mL庚烷中包含0、0.0050、0.0100、0.0150、0.0200和0.0300g大豆油的标准物以相同方式制备。通过加入1mL5%硫酸(v:v,在无水甲醇中)至干燥的沉淀,并将它们在80℃下加热30分钟并不时涡旋混合,来将脂肪转化成脂肪酸甲酯(FAME)。使该样品冷却至室温,并加入1mL25%氯化钠水溶液,接着加入0.8mL庚烷。涡旋混合后,使相分离,并将上层有机相转移到样品小瓶中并使其经历GC分析。
将NMR测定的油含量对GC测定的油含量进行作图,得到油介于9.66和26.27%之间(GC值;基于%种子重量)、斜率为1.0225并且R2为0.9744的线性关系;基于平均2.6+/‑0.8%的种子含水量计。
拟南芥种子的种子油含量(基于%种子重量计)如下计算:
mg油=(NMR信号‑2.1112)/37.514;
%油=[(mg油)/1000]/[g种子样品重量]×100。
在建立该式之前,如下提取拟南芥种子油。使用研钵和研杵将大约5g成熟的拟南芥种子(哥伦比亚生态型)研磨成细粉。将粉末置于33×94mm纸壳筒(Ahlstrom#7100‑3394;Ahlstrom,Mount Holly Springs,PA,USA)中,并在Soxhlet设备中用石油醚(BP39.9‑51.7℃)经大约40个提取循环提取油。使提取物冷却,然后通过在旋转式蒸发器中真空去除溶剂来回收原油。通过精确称取11份部分纯化的拟南芥油标准样品(样品包含3.6、6.3、7.9、9.6、12.8、16.3、20.3、28.2、32.1、39.9和60mg部分纯化的拟南芥油;称量精确至0.0001g)至2mL聚丙烯管(Corning Inc,CorningNY,USA;Part no.430917)中并使其经历NMR分析,来确定校准系数。建立油含量(基于%种子重量计)对NMR值的校准曲线。
表4显示出带有条形码ID K22730的T4激活标记品系的种子油含量仅为在相同地面生长的四株野生型对照植物的种子油含量平均值的87%。
表4
来源于T3库500的T4激活标记品系的油含量
条形码%油T3库ID#野生型的油含量%
K2271226.847593.2
K2271330.2475105.0
K2271428.247597.9
K2271528.9475100.5
K2271626.547592.1
K2271728.247598.1
K2271827.547595.7
K2272034.9475121.5
K2272129.7475103.3
K2272230.7475106.7
K2272329.8475103.6
K2272433.3475115.8
K2272529.4475102.1
K2272634.1475118.5
K2272830.4475105.8
K2272928.047597.3
K2273025.047586.9
K2273130.7475106.6
K2273229.6475102.8
K2273328.447598.8
K2273430.6475106.4
K2273529.0475100.7
K2273629.9475103.9
K2273730.5475106.1
K2273829.0475100.8
K2273929.3野生型
K2274027.9野生型
K2274128.4野生型
K2274229.5野生型
K22730被重新命名为lo22730。T4种子被铺板在选择培养基上,并且三株草胺磷抗性的幼苗被种植在与四株非转化的野生型植株相同的地面上。
表5
T5激活标记品系lo22730的油含量
表5显示出T5激活标记品系lo22730的种子油含量介于在相同地面上生长的野生型对照植物的种子油含量的78%和105%之间。全部lo22730T5品系的平均油含量是野生型对照植物的88.1%。二十四株Basta抗性的lo22730T5幼苗与12株未转化的野生型哥伦比亚生态型拟南芥对照植物一起被种植在相同的地面上。使植株生长至成熟,并从全部24株lo22730和12株野生型植株批量收获种子。通过NMR测量lo22730和野生型种子的油含量(表6)。
表6
T6激活标记品系lo22730的油含量
使在相同条件下产生的lo22730的T6种子和野生型种子经历组成分析,如下文所述。通过测定100粒种子的重量,来测量种子重量。分三次进行该分析。
组织制备:
在中将拟南芥种子(大约0.5g,在1/2×2"聚碳酸酯小瓶中)研磨成均质糊剂(以1400冲程/分钟进行3×30秒,每一轮搅拌之间间隔15秒)。在第二轮搅拌后,移出小瓶,并用刮刀从壁上刮下拟南芥糊剂,然后再进行最后一次搅拌。
蛋白质含量的测定:
在按照生产商的说明以NCS模式(省略了五氧化钒)运行的Thermo FINNIGANTM Flash1112EA燃烧分析仪上,通过燃烧分析来估算蛋白质含量。在MX5微量天平上以0.001mg精确度称量了一式三份的研磨糊剂样品4‑8mg以用于分析。将通过分析器测定的%N乘以6.25,来计算出蛋白质含量。最终的蛋白质含量基于%组织重量计来表示。
非结构性碳水化合物含量的测定:
将所述研磨的糊剂的子样品(精确至0.1mg)称量至13×100mm玻璃管中;所述管具有内衬的密封旋盖。所测试的每中样品制备三个复制品。
通过向每一管中加入2ml等分试样的庚烷进行脂质的提取。将所述玻璃管进行涡旋混合,并置入充满60℃热水的超声波浴槽(VWR ScientificModel750D)中。以全功率(~360W)将样品超声处理15分钟,然后离心(5分钟×1700g)。将上层清液转移到干净的13×100mm玻璃管中,并用庚烷(第二次提取2ml;第三次提取1ml)对沉淀再进行2次提取,合并每次提取的上层清液。脂质提取后,向沉淀中加入1ml丙酮,之后涡旋混合以完全分散材料,在Speedvac中进行干燥。
非结构性碳水化合物的提取和分析:
向干燥的沉淀中加入2ml80%酒精。将样品彻底地涡旋混合,直至植物材料完全分散于溶剂中,然后在60℃下超声处理15分钟。5分钟×1700g离心后,将上层清液倾析到干净的13×100mm玻璃管中。用80%酒精再进行两次提取,合并每次提取的上层清液。将提取后的沉淀悬浮于丙酮中并干燥(如上所述)。向每种提取物中加入内标物β‑苯基吡喃葡萄糖苷(100μL0.5000+/‑0.0010g/100ml原液),然后在Speedvac中进行干燥。将提取物保存在干燥器中直至进一步分析。
将丙酮干燥的粉末悬浮于包含100U热稳定的α‑淀粉酶(来自地衣芽孢杆菌(Bacillus licheniformis);Sigma A‑4551)的0.9ml MOPS(3‑N[吗啉代]丙烷‑磺酸;50mM,5mM CaCl2,pH7.0)缓冲液中。将样品置于加热块(90℃)中75分钟,并且每15分钟进行一次涡旋混合。使样品冷却至室温,向每种样品中加入包含5U淀粉葡萄糖苷酶(Roche110202367001)的0.6ml醋酸盐(285mM,pH4.5)缓冲液。将样品在配有往复式振荡器的水浴中于55℃下温育15–18小时;包含可溶性马铃薯淀粉(Sigma S‑2630)的标准物,以确保淀粉消化完全。
消化后提取释放出的碳水化合物,然后进行分析。向每一管中加入绝对乙醇(6ml),并在涡旋混合后,将样品于60℃下超声处理15分钟。离心样品(5min×1700g),并将上层清液倾析到干净的13×100mm玻璃管中。用3ml80%乙醇将沉淀再提取2次,合并所得上层清液。向每种样品中中加入内标物(100μLβ‑苯基吡喃葡萄糖苷,如上所述),然后在Speedvac中进行干燥。
样品的制备和分析:
使来自所述可溶性和淀粉提取的干燥样品溶解于包含30mg/ml盐酸羟胺(Sigma‑Aldrich159417)的无水吡啶(Sigma‑Aldrich P57506)中。将样品置于轨道式震荡器上(300rpm)过夜,然后加热1小时(75℃),每15分钟进行一次剧烈涡旋混合。在冷却至室温后,加入1ml六甲基二硅氮烷(Sigma‑Aldrich H‑4875)和100μl三氟乙酸(Sigma‑Aldrich T‑6508)。将样品涡旋混合,并使沉淀物沉降,然后将上层清液清转移到GC样品小瓶中。
在配有DB‑17MS毛细管柱(15m×0.32mm×0.25μm膜)的Agilent6890气相色谱仪上对样品进行分析。入口温度和检测器温度均为275℃。注射(2μl,20:1分流)后,初始柱温(150℃)以3℃/分钟的速率升高至180℃,然后以25℃/分钟升高至320℃的最终温度。最终温度维持10分钟。载气为51cm/s线速度的H2。通过火焰电离进行检测。利用Agilent ChemStation软件进行数据分析。每种糖相对于内标物进行定量,并对于每种单独的碳水化合物施用检测器响应(从与每组样品一起受测的标准物计算)。最终碳水化合物浓度基于组织重量计表示。
通过使保留时间与在相同色谱设置中运行的每种糖的可信样品相匹配,以及通过使光谱与2002年7月1日建立的NIST质谱库版本2a相匹配的GC‑MS,来鉴定碳水化合物。
表7
lo22730和野生型对照种子的组成分析
表7显示出lo22730的种子油含量的降低与种子重量的提高相关联。lo22730的可溶性碳水化合物特征不同于野生型种子特征。前者显示包括果糖、葡萄糖、蔗糖和棉子糖的可溶性碳水化合物的降低。
概括地说,lo22730包含赋予草胺磷除草剂抗性的遗传基因座。该转基因的存在与伴随着提高的种子大小、未变化的蛋白质含量和成熟干燥种子中降低的可溶性碳水化合物水平的低油性状(与野生型相比油含量降低5%)相关联。
实例3
激活标记基因的鉴定
使用以下两个标准程序中的一个或两个鉴定lo22730品系中侧接T‑DNA插入序列的基因:(1)热不对称交错(TAIL)PCR(Liu等人,Plant J.8:457‑63(1995));和(2)SAIFF PCR(Siebert等人,Nucleic Acids Res.23:1087‑1088(1995))。符合复杂的多聚T‑DNA插入序列,TAIL PCR和SAIFF PCR可能均不足以鉴定候选基因。在这些情况下,可采用包括反向PCR、质粒拯救和/或基因组文库构建在内的其他程序。
成功的结果是其中单个TAIL或SAIFF PCR片段包含T‑DNA边界序列和拟南芥属基因组序列。一旦获取侧接T‑DNA插入序列的基因组序列标记,通过与公开可用的拟南芥属基因组的序列比对来鉴定候选基因。具体地,最靠近35S增强子元件/T‑DNA RB的注释基因是被激活的基因的候选基因。
为了验证鉴定的基因真的靠近T‑DNA并排除TAIL/SAIFF片段是嵌合伪克隆的可能性,用一个T‑DNA中的寡核苷酸和一个候选基因特异性的寡核苷酸进行对基因组DNA的诊断PCR。将提供PCR产品的基因组DNA样品理解为表示T‑DNA插入序列。此分析也验证了其中多于一种的插入事件发生在相同品系中的情况,例如,在TAIL和/或SAIFF PCR分析中鉴定是否有多个不同基因组片段。
实例4
lo22730中的激活标记基因的鉴定
用于基因在拟南芥中的种子特异性过表达的pKR1478的构建
用HindIII消化质粒pKR85(SEQ ID NO:3;描述于2007年5月24日公布的美国专利申请公布US2007/0118929中),并且包含潮霉素选择性标记的片段被重新连接在一起,以产生pKR278(SEQ ID NO:4)。
用BamHI/HindIII消化质粒pKR407(SEQ ID NO:5;描述于2008年10月16日公布的PCT国际专利申请WO2008/124048中),并且包含Gy1启动子/NotI/LegA2终止子盒的片段被有效地克隆进pKR278(SEQ ID NO:4)的BamHI/HindIII片段中,以产生pKR1468(SEQ ID NO:6)。
用NotI消化质粒pKR1468(SEQ ID NO:6),并且所得DNA末端使用Klenow填充。在填充形成钝末端后,DNA片段用牛小肠碱性磷酸酶进行处理并使用琼脂糖凝胶电泳进行分离。使用Vector Conversion System(目录号11823‑029,Invitrogen Corporation),按照制造商规程,将纯化的片段与包含氯霉素抗性和侧接attR1和attR2位点的ccdB基因的盒frmA连接,以产生pKR1475(SEQ ID NO:7)。
用AscI消化质粒pKR1475(SEQ ID NO:7),并且包含Gy1启动子/NotI/LegA2终止子克隆盒的片段被克隆进二元载体pKR92(SEQ ID NO:8;描述于2007年5月24日公布的美国专利申请公布US2007/0118929中)的AscI片段中,以产生pKR1478(SEQ ID NO:9)。
以这种方式,侧接attL1和attL2位点的基因可使用技术(Invitrogen Corporation)被克隆进pKR1478(SEQ ID NO:9)中,并且所述基因可在拟南芥中由大豆中的强的种子特异性大豆Gy1启动子表达。
对表现出降低的油含量的激活标记品系(lo22730)进行进一步分析。提取来自该品系的DNA,并且在突变品系中侧接T‑DNA插入序列的基因使用连接介导的PCR(Siebert等人,NucleicAcids Res.23:1087‑1088(1995))进行鉴定。鉴定单独扩增的片段,其包含T‑DNA边界序列和拟南芥基因组序列。包含部分插入序列的T‑DNA的左边界的该PCR产物的序列如SEQ IDNO:10所示。一旦获得了侧接T‑DNA插入序列的基因组序列的标记,就通过将SEQ ID NO:10与完整的拟南芥基因组(NCBI)的序列比对来鉴定候选基因。具体地,将用对应于存在于pHSbarENDs2中的T‑DNA的左边界序列的PCR引物产生的SAIFF PCR产物,与推测的At2g46930的起始密码子上游的1406bp拟南芥基因组序列进行比对。
通过转化进拟南芥中验证候选的拟南芥基因(At2g46930)
基因At2g46930,具体地其推测的起始密码子在SAIFF序列的1.4kb上游,所述SAIFF序列对应于与lo22730中的左侧T‑DNA边界相邻的序列。该基因被注释为编码与果胶乙酰酯酶(PAE)具有相似性的蛋白质家族成员。
引物PAE ORF FWD(SEQ ID NO:11)和PAE ORF REV(SEQ ID NO:12)被用于从哥伦比亚生态型拟南芥植物的基因组DNA扩增At2g46930ORF。PCR产物被克隆进pENTR(Invitrogen,USA)中,以获得pENTR‑PAE(SEQ ID NO:13)。使用Gateway LR重组酶(Invitrogen,USA),采用制造商的说明,将所述At2g46930ORF以有义方向插入了二元植物转化载体pKR1478中的GY1启动子下游。所得质粒pKR1478‑PAE的序列如SEQ ID NO:14所示。
通过电穿孔将pKR1478‑PAE(SEQ ID NO:14)引入根癌农杆菌NTL4(Luo等人,Molecular Plant‑Microbe Interactions(2001)14(1):98‑103)中。简而言之,将1μg质粒DNA在冰上与100μl电感受态细胞混合。将细胞悬浮液转移到100μl电穿孔杯(1mm间隙宽度)中,并使用设定为1kV,400Ω和25μF的BIO‑RAD电穿孔仪进行电穿孔。将细胞转移到1ml LB培养基中,并在30℃下温育2小时。细胞被铺板在包含50μg/mL卡那霉素的LB培养基上。将平板在30℃下温育60小时。从转化的农杆菌细胞的单克隆接种重组的农杆菌培养物(500ml LB,50μg/mL卡那霉素),并在30℃下生长60小时。通过离心(5000×g,10分钟)收获细胞,并将其重悬于包含0.05%(V/V)Silwet的1L5%(W/V)蔗糖中。在土壤混合物中,使拟南芥植株以30株植株/100cm2的密度在土壤中生长4周(22℃,16小时光照/8小时黑暗,100μEm‑2s‑1)。将植株反复浸入携带二元载体pKR1478‑PAE的农杆菌悬液中,并于黑暗、高湿度环境中保持24小时。浸渍之后,将植株在如前所述的标准植物生长条件下生长三至四周,然后收获植物材料并使其于纸袋中在环境温度下干燥一周。使用0.425mm筛孔黄铜筛收获种子。
将干净的拟南芥种子(2克,相当于约100,000粒种子)依次用以下溶液清洗杀菌:45ml80%乙醇,0.01%接着用45mL30%(V/V)溶于水的家用漂白剂,0.01%最后用无菌水反复冲洗。将含20,000粒种子的等分试样转移到包含150mL无菌的植物生长培养基的平板(20×20cm)中,所述培养基包含固化在10g/L琼脂中的0.5×MS盐、0.53%(W/V)山梨醇、0.05MES/KOH(pH5.8)、200μg/mL和50μg/mL卡那霉素。通过将含水种子悬浮液与等体积熔化的植物生长培养基混合,来将种子均匀分散在培养基中。将平板在标准生长条件下温育十天。将卡那霉素抗性的幼苗转移到不含选择剂的植物生长培养基中并生长一周,然后转移到土壤中。使T1植物与野生型对照植物一起生长至成熟,收获T2种子。使总计六株野生型植株与T1植物一起生长,通过混合来自三株野生型植株的种子产生了两份主体样品。通过NMR测量油含量并示于表8中。
表8
由用于种子特异性过表达At2g46930的二元载体pKR1478‑PAE产生的T1植物的种子油含量
构建体条形码%油野生型的油含量%野生型的平均油含量%
pKR1478‑PAEK1822342.1101.7
pKR1478‑PAEK1823141.4100.0
pKR1478‑PAEK1823040.798.4
pKR1478‑PAEK1822640.698.3
pKR1478‑PAEK1822440.698.2
pKR1478‑PAEK1822240.698.1
pKR1478‑PAEK1822540.597.9
pKR1478‑PAEK1822940.597.9
pKR1478‑PAEK1788940.397.5
pKR1478‑PAEK1789039.896.3
pKR1478‑PAEK1823339.695.8
pKR1478‑PAEK1823439.595.6
pKR1478‑PAEK1823538.292.4
pKR1478‑PAEK1822737.189.8
pKR1478‑PAEK1823235.385.4
pKR1478‑PAEK1822831.576.295.0
野生型K1789141.2
野生型K1789241.6
事件K18232和K18228的T2种子被铺板在选择培养基上,并与非转化的野生型对照植物一起被种植。使植物生长至成熟。收获种子并通过NMR测量油含量(表9)。
表9
由用于种子特异性过表达At2g46930的二元载体pKR1478‑PAE产生的T2植物的种子油含量
来源于事件K18232的品系K45642和K45649以及来源于事件K18228的品系K45672和K45673的T3种子被铺板在选择培养基上,并与非转化的野生型对照植物一起被种植。使植物生长至成熟。收获种子并通过NMR测量油含量(表10)。
表10
由用于种子特异性过表达At2g46930的二元载体pKR1478‑PAE产生的T3植物的种子油含量
表8‑10展示出At2g46930的种子特异表达导致了10‑20%的油含量降低。与所述转基因相关联的油含量的降低是可遗传的。该发现表明,lo22730中的低种子油表型与pHSbarENDs2来源的T‑DNA中存在的四倍35S增强子序列在附近的插入所导致的At2g46930表达的提高相关联。
实例5
At2g46930的种子特异性RNAi。转基因品系的产生和表型表征
构建了用于产生发夹结构的二元植物转化载体pKR1481(SEQ IDNO:15),所述发夹结构有利于在来源于拟南芥基因At5g49190的SUS2启动子控制下的种子特异性RNAi。可被用于克隆给定DNA片段的RNAi相关的表达盒以反义和有义方向在种子特异性启动子下游侧接ATTL位点。所述两个基因片段被来源于拟南芥基因At2g38080的可变剪切内含子序列打断。
使用引物AthLcc IN FWD(SEQ ID NO:16)和AthLcc IN REV(SEQ ID NO:17),从生态型哥伦比亚的拟南芥基因组DNA扩增了拟南芥漆酶基因(At2g38080)的内含子。按照制造商的说明,将PCR产物克隆进pGEM TEASY(Promega,USA)中并测序。包含漆酶内含子的PCR产物的DNA序列如SEQ ID NO:18所示。PCR引物在所述内含子的5'端引入HpaI限制性位点,在所述内含子的3'端引入针对NruI和SpeI的限制性位点。如下进行DNA片段的三方连接。将用XbaI消化的、去磷酸化的pMB L18(Nakano,Yoshio;Yoshida,Yasuo;Yamashita,Yoshihisa;Koga,Toshihiko.Construction of a series of pACYC‑derived plasmid vectors.gene(1995),162(1),157‑8)的DNA连接到包含ATTR12位点、DNA旋转酶抑制剂基因(ccdB)、氯霉素乙酰转移酶基因、从包含At2g38080的内含子1的pGEM T EASY Lacc INT(SEQ ID NO:18)切下的HpaI/SpeI限制性片段的PSM1318(SEQ ID NO:19)的XbaI、EcoRV DNA片段。将连接产物转化到大肠杆菌(E.coli)DB3.1菌株(Invitrogen,USA)中。通过限制性酶切和测序表征了重组体克隆。所得质粒pMBL18ATTR12INT的DNA序列如SEQ ID NO:20所示。pMBL18ATTR12INT的DNA被NruI线性化、去磷酸化和连接到包含ATTR12位点和DNA旋转酶抑制剂基因(ccdB)的PSM1789(SEQ ID NO:21)的XbaI、EcoRV DNA片段。连接之前,用T4DNA聚合酶(Promega,USA)填充PSM1789限制性片段的末端。将连接产物转化到大肠杆菌(E.coli)的DB3.1菌株(Invitrogen,USA)中。通过限制性酶切和测序表征了重组体克隆。所得质粒pMBL18ATTR12INT ATTR21的DNA序列如SEQ ID NO:22所示。
使用Plant Mini Kit(Qiagen,Valencia,CA),按照制造商规程,从三周龄野生型拟南芥col‑0幼苗分离基因组DNA。使用寡核苷酸SuSy‑5(SEQ ID NO:23)和SuSy‑3(SEQ ID NO:24),用PHUSIONTM High‑Fidelity DNA Polymerase(目录号F553S,Finnzymes Oy,Finland),按照制造商规程,从拟南芥基因组DNA PCR扩增来源于基因At5g49190的拟南芥蔗糖合酶(“AtSuSy”;“AtSUS2”)启动子。使用ZEROPCRCloning Kit(Invitrogen Corporation),按照制造商规程,将所得DNA片段克隆进克隆载体中,以产生pLF122(SEQ ID NO:25)。
将包含AtSuSy启动子的pLF122(SEQ ID NO:25)的BamHI/NotI片段克隆进包含菜豆蛋白终止子的pKR1142(SEQ ID NO:26)的BamHI/NotI片段中,以产生pKR1155(SEQ ID NO:27)。
在这之前,如下构建pKR1142:质粒KS294(SEQ ID NO:28)包含侧接SCP1启动子和菜豆蛋白转录终止子的NotI位点(SCP1Pro::NotI::PhasTerm)。SCP1启动子是合成组成型启动子,其包含CaMV35S启动子(Odell等人(1985)Nature313:810‑812)的部分和合成Rsyn7‑Syn II核心共有启动子(美国专利6,072,050和6,555,673,其内容以引用方式并入本文)。还可参见,例如,US20030226166,表13(其内容以引用方式并入本文)。该元件的下游是烟草花叶病毒(TMV)ω5'‑UTR转录增强子元件(Gallie等人(1992)Nucleic Acid Research20:4631‑4638),接着是NotI位点和菜豆蛋白基因的3'转录终止区域(Doyle等人(1986)J. Biol.Chem.261:9228‑9238)。将包含SCP1Pro::NotI::PhasTerm盒的KS294(SEQ ID NO:18)的XbaI片段克隆进pKR627(SEQ ID NO:29)的XbaI片段中,以产生pKR1142(SEQ ID NO:26)。预先构建了质粒pKR627,如以下所公开的:用BamHI/SalI消化描述于PCT公开WO2004/071467(其内容以引人方式并入本文)中的质粒pKR132(SEQ ID NO:30),并将包含大豆白蛋白启动子的片段克隆进克隆载体(Invitrogen Corporation)的BamHI/XhoI片段中,以产生起始载体pKR627(SEQ ID NO:29)。
将包含AtSuSy启动子的pKR1155的Asp718/BsiWI片段克隆进pKR278(SEQ ID NO:4;描述于美国专利申请公布2008295204中,其内容以引用方式并入本文)的BsiWI位点中,以产生pKR1157(SEQ ID NO:32)。
用XbaI消化质粒pMBL18ATTR12INT ATTR21(SEQ ID NO:22),在填充所产生的XbaI位点之后,用Ecl136II消化所得DNA,并将包含attR盒的片段克隆进包含SUS2启动子的pKR1155(SEQ ID NO:27)的NotI/BsiWI(在其中NotI位点被完全填充)片段中,以产生pKR1479(SEQ ID NO:33)。
用AscI消化pKR1479(SEQ ID NO:33),并将包含SUS2启动子/attR盒的片段克隆进二元载体pKR92中,以产生pKR1481(SEQ ID NO:34)。
用EcoRV/HpaI消化5μg质粒pENTR‑PAE(SEQ ID NO:13)的DNA。从琼脂糖凝胶上切下1300bp(来源于pENTR‑PAE)的限制性片段。使用LR clonase(Invitrogen),按照制造商的说明,将纯化的DNA片段插入载体pKR1481中,以获得pKR1481‑PAE(SEQ ID NO:34)。
通过电穿孔将pKR1481‑PAE(SEQ ID NO:34)引入到根癌农杆菌NTL4(Luo等人,Molecular Plant‑Microbe Interactions(2001)14(1):98‑103)中。简而言之,将1μg质粒DNA在冰上与100μl电感受态细胞混合。将细胞悬浮液转移到100μl电穿孔杯(1mm间隙宽度)中,并用设定为1kV、400Ω和25μF的BIO‑RAD电穿孔仪进行电穿孔。将细胞转移到1mlLB培养基中,并在30℃下温育2小时。细胞被铺板在包含50μg/mL卡那霉素的LB培养基上。将平板在30℃下温育60小时。从转化农杆菌细胞的单克隆接种重组的农杆菌培养物(500ml LB,50μg/mL卡那霉素),并在30℃下生长60小时。通过离心(5000×g,10分钟)收获细胞,并将其重悬于包含0.05%(V/V)Silwet的1L5%(W/V)蔗糖中。在360土壤混合物中,使拟南芥植株以30株植株/100cm2的密度在土壤中生长4周(22℃,16小时光照/8小时黑暗,100μEm‑2s‑1)。将植株反复浸入携带二元载体pKR1481‑PAE(SEQ ID NO:34)的农杆菌悬液中,并于黑暗、高湿度环境中保持24小时。将植株在如前所述的标准植物生长条件下生长三至四周,然后收获植物材料并将其于纸袋中在环境温度下干燥一周。使用0.425mm筛孔黄铜筛收获种子。
将干净的拟南芥种子(2克,相当于约100,000粒种子)依次用以下溶液清洗杀菌:45ml80%乙醇,0.01%接着用45mL30%(V/V)溶于水的家用漂白剂,0.01%最后用无菌水反复冲洗。将含20,000粒种子的等分试样转入包含150mL无菌的植物生长培养基的方板(20×20cm)中,所述培养基包含固化在10g/L琼脂中的0.5×MS盐、0.53%(W/V)山梨醇、0.05MES/KOH(pH5.8)、200μg/mL和50μg/mL卡那霉素。通过将含水种子悬液与等体积熔化的植物生长培养基混合,来将种子均匀分散在培养基中。将平板在标准生长条件下温育十天。将卡那霉素抗性的幼苗转移到不含选择剂的植物生长培养基中并生长一周,然后转移到土壤中。使植株生长至成熟,并收获T2种子。用pKR1481‑PAE(SEQ ID NO:34)产生总计21个事件。在相同地面上种植十二株野生型(WT)对照植物。批量收获野生型种子,收获各个转基因品系的T2种子,并通过NMR测量油含量,如上所述。
表11
由用于At2g46930的种子特异性基因抑制的二元载体pKR1481‑PAE产生的T1植物的种子油含量
构建体条形码%油野生型的油含量%野生型的平均油含量%
pKR1481‑PAEK4666143.0106.9
pKR1481‑PAEK4666342.9106.8
pKR1481‑PAEK4666642.6106.0
pKR1481‑PAEK4665742.0104.4
pKR1481‑PAEK4665441.8104.1
pKR1481‑PAEK4666741.5103.3
pKR1481‑PAEK4667141.3102.8
pKR1481‑PAEK4665841.2102.4
pKR1481‑PAEK4667041.1102.3
pKR1481‑PAEK4666241.0101.9
pKR1481‑PAEK4666940.9101.9
pKR1481‑PAEK4667540.9101.8
pKR1481‑PAEK4665640.8101.6
pKR1481‑PAEK4665540.7101.3
pKR1481‑PAEK4667440.6101.0
pKR1481‑PAEK4667340.5100.7
pKR1481‑PAEK4667240.2100.0
pKR1481‑PAEK4666840.199.7
pKR1481‑PAEK4666439.698.5
pKR1481‑PAEK4665939.297.5
pKR1481‑PAEK4667638.194.8101.9
野生型K4668541.6
野生型K4667941.1
野生型K4667740.9
野生型K4668640.4
野生型K4668440.4
野生型K4668840.2
野生型K4668040.2
野生型K4668140.1
野生型K4668739.9
野生型K4668239.5
野生型K4667839.4
野生型K4668338.4
表11显示出At2g46930的种子特异性下调导致了拟南芥种子中油含量提高。
将均携带有转基因pKR1481‑PAE的事件K46661和K46663的T2种子铺板在包含卡那霉素的植物生长培养基上。使植株与哥伦比亚生态型野生型植株在相同地面上一起生长至成熟。T3种子的油含量描述于表12中。
表12展示出在多个事件中观察到与At2g46930的种子特异性下调相关联的约4%的油的提高,并且这种油的提高是可遗传的。
表12
由用于At2g46930的种子特异性基因抑制的二元载体pKR1481‑PAE产生的T2植物的种子油含量
实例6
与At2g46930紧密相关的芜菁(Brassica rapa)基因的鉴定
使用预测的At2g46930的氨基酸序列和tBLASTn,检索了从公开的NCBI(美国国家生物技术信息中心)芜菁(Brassica rapa)EST构建的专有的数据库Brassica rapa UniGene Dataset(2009年7月)。存在一个基因PBR010399,其与At2g46930具有86%的氨基酸序列同一性。这个基因、其与At2g46930的%同一性和SEQ ID NO列于表13中。
表13
与At2g46930紧密相关的芜菁基因
基因名称与At2g46930的%AA序列同一性SEQ ID NO:NTSEQ ID NO:AA
PBR01039986.23536
实例7
与At2g46930紧密相关的向日葵基因的基因鉴定
向日葵EST组装版本4.0(2006年6月17日)来自Dana‑Farber Cancer Institute的基因索引项目(Gene Index Project)。该组装从93,807个公开的EST和表达的转录本开始,具有总计36,743个序列(12,285个组装和24,458个单一序列)。使用预测的At4g10750的氨基酸序列和tBLASTn,来检索位于Dana‑Farber Cancer institute的基因索引网站。存在一个基因TC19105,其与At2g46930具有66.5%的氨基酸序列同一性。这个基因、其与At2g46930的%同一性和SEQ ID NO列于表14中。
表14
与At2g46930紧密相关的向日葵基因
基因名称与At2g46930的%AA序列同一性SEQ ID NO:NTSEQ ID NO:AA
TC1910563.93738
实例8
与At2g46930紧密相关的蓖麻基因的基因鉴定
使用预测的At4g10750的氨基酸序列和tBLASTn,来检索包括非冗余的GenBank CDS翻译+PDB+SwissProt+PIR+PRF蛋白质序列的来自NCBI的非冗余的蛋白质数据集。存在一个基因XM_002515114,其与At2g46930具有66.5%的氨基酸序列同一性。这个基因、其与At2g46930的%同一性和SEQ ID NO列于表15中。
表15
与At2g46930紧密相关的蓖麻基因
实例9
与At2g46930紧密相关的大豆基因的鉴定
使用预测的At2g46930的氨基酸序列和tBLASTn,来检索公开的DNA序列(来自大豆JGIglyma1.01基因组序列的大豆cDNAglyma1.01(JGI)(N)预测的cDNA、FGENESH预测和EST PASA分析)。存在四个编码与预测的At2g46930蛋白质有介于61.8%和67.6%之间的氨基酸序列同一性的蛋白质的基因。这些基因、它们的性质和SEQ ID NO列于表16中。
表16
与At2g46930紧密相关的大豆基因
实例10
与At2g46930紧密相关的玉米(玉蜀黍(Zea mays))基因的鉴定
使用预测的At2g46930的氨基酸序列和tBLASTn,来检索MaizeSequence Release4a.53‑2009年10月的玉米基因组序列的经过滤的基因集合cDNA。来源于三个cDNA的预测的氨基酸序列与At2g46930有介于49.8%和57.8%之间的序列同一性。这些基因、它们的性质和SEQ IDNO列于表17中。
表17
与At2g46930紧密相关的玉米基因
实例11
与At2g46930紧密相关的稻(水稻(Oryza sativa))基因的鉴定
使用预测的At2g46930的氨基酸序列和tBLASTn,来检索来自稻基因模型(Oryza sativa(j aponica cultivar‑group)MSU Ricegenome Annotation Project Osa1释放6(2009年1月))的公共转录数据库,其包括非翻译区(UTR)但不含内含子。存在三个编码与预测的At2g46930蛋白质有介于51.9%和58.0%之间的氨基酸序列同一性的蛋白质的基因。这些基因、它们的性质和SEQ ID NO列于表18中。
表18
与At2g46930紧密相关的稻基因
实例12
与At2g46930紧密相关的高粱(Sorghum bicolor)基因的鉴定
使用预测的At2g46930的氨基酸序列和tBLASTn,来检索来自高粱JGI基因组序列版本1.4的预测的编码序列(mRNA)。存在三个编码与预测的At2g46930蛋白质有介于51.9%和58.0%之间的氨基酸序列同一性的蛋白质的基因。这些基因、它们的性质和SEQ ID NO列于表19中。
表19
与At2g46930紧密相关的高粱基因
实例13
与At2g46930紧密相关的小麦(Triticum avestinum)基因的鉴定
使用预测的At2g46930的氨基酸序列和tBLASTn,来检索来自小麦(Triticum aestivum)释放2;(2007年7月)的TIGR植物转录物组装。存在一个基因TA80364,其编码与预测的At2g46930蛋白质具有56.6%的氨基酸序列同一性的蛋白质。这个基因、它的性质和SEQ ID NO列于表20中。
表20
与At2g46930紧密相关的小麦基因
基因名称与At2g46930的%AA序列同一性SEQ ID NO:NTSEQ ID NO:AA
TA8036456.66768
实例14
嵌合基因在单子叶植物细胞中的表达
可构建包含cDNA的嵌合基因,所述cDNA相对于位于所述cDNA片段的5'端的玉米27kD玉米蛋白启动子和位于所述cDNA片段的3'端的10kD玉米蛋白3'末端在有义方向上编码本发明多肽。使用适当的寡核苷酸引物,通过cDNA克隆的聚合酶链反应(PCR)可产生该基因的cDNA片段。克隆位点(NcoI或SmaI)可被整合进寡核苷酸中,以在DNA片段被插入并将其重悬经消化的载体pML103中时提供正确的方向,如下所述。然后以标准PCR进行扩增。然后用限制性酶NcoI和SmaI消化扩增的DNA,并在琼脂糖凝胶上分级。可从凝胶上分离适当的带,并与质粒pML103的4.9kb NcoI‑SmaI片段混合。质粒pML103已以Budapest Treaty的名称储存于ATCC(美国典型培养物保藏中心(American Type Culture Collection),10801University Blvd.,Manassas,VA20110‑2209)中,并具有登录号ATCC97366。来自pML103的DNA片段包含玉米27kD玉米蛋白基因的1.05kb SalI‑NcoI启动子片段和来自载体pGem9Zf(+)(Promega)中的玉米10kD玉米蛋白基因3'末端的0.96kb SmaI‑SalI片段。载体和插入DNA可在15℃下连接过夜,基本上如(Maniatis)所述。然后,连接的DNA可被用于转化大肠杆菌(E.coli)XL1‑Blue(Epicurian Coli XL‑1BlueTM;Stratagene)。通过质粒DNA的限制性酶消化和使用双脱氧链终止法(SequenaseTMDNASequencing Kit;U.S.Biochemical)进行的有限的核苷酸序列分析,可筛选细菌转化体。所得质粒构建体将包含嵌合基因,所述嵌合基因在5'至3'方向上编码玉米27kD玉米蛋白启动子、编码本发明的多肽的cDNA片段、以及10kD玉米蛋白3′区域。
然后可通过以下工序将所述嵌合基因引入玉米细胞中。可从源于自交玉米系H99和LH132杂交的发育中的颖果切取未成熟的玉米胚。在授粉后10至11天分离胚,这时它们长为1.0至1.5mm。然后将胚以轴线侧面向下放置并与琼脂糖硬化的N6培养基(Chu等人(1975)Sci.Sin.Peking18:659‑668)接触。将胚在27℃下保持在黑暗中。从这些未成熟胚的盾片增生出脆弱的胚发生愈伤组织,该愈伤组织由未分化的细胞块组成,在胚柄结构上长有体细胞原胚状体和胚状体。可将从该原外植体分离的胚发生愈伤组织在N6培养基上培养,并每2至3周在这种培养基上进行继代培养。
质粒p35S/Ac(获自Peter Eckes博士,Hoechst Ag,Frankfurt,Germany)可被用于转化实验以便提供选择性标记。该质粒包含Pat基因(参见欧洲专利公布0242236),其编码草胺膦乙酰转移酶(PAT)。酶PAT赋予除草剂谷氨酰胺合成酶的抑制剂(膦丝菌素)的抗性。p35S/Ac的pat基因处于来自花椰菜花叶病毒的35S启动子(Odell等人,Nature313:810‑812(1985))和胭脂碱合成酶基因的3′区域的控制下,该胭脂碱合成酶基因来自根癌农杆菌Ti质粒的T‑DNA。
粒子轰击方法(Klein等人(1987),Nature327:70‑73)可被用于将基因转移到愈伤组织培养细胞中。根据该方法,利用以下技术用DNA涂覆金颗粒(直径1μm)。将10μg质粒DNA加入50μL金颗粒悬浮液(60mg/mL)中。将氯化钙(50μL的2.5M溶液)和亚精胺游离碱(20μL的1.0M溶液)加入颗粒中。在加入这些溶液期间涡旋该悬浮液。10分钟后,将试管短暂地离心(以15,000rpm进行5秒钟)并除去上层清液。将颗粒重悬浮于200μL的绝对乙醇中,再次离心并除去上层清液。再次进行乙醇冲洗并将颗粒重悬浮于最终体积为30μL的乙醇中。可将DNA涂覆的金颗粒等分试样(5μL)置于KaptonTM飞行圆盘(Bio‑Rad Labs)的中心。然后用BiolisticTMPDS‑1000/He(Bio‑‑Rad Instruments,Hercules CA),采用1000psi的氦气压、0.5cm的间隙距离以及1.0cm的飞行距离,将颗粒加速进入玉米组织中。
对于轰击,将胚发生组织置于琼脂糖硬化的N6培养基之上的滤纸上。组织被布置成薄薄一层,并覆盖直径为约5cm的圆形区域。然后可将包含组织的培养皿置于离阻挡网大约8cm的PDS‑1000/He的室内。然后将该室中的空气抽出至28英寸汞柱的真空。利用在击波管中氦气压力达到1000psi时破裂的可破裂膜,宏载体被氦气冲击波加速。
轰击后七天,可将组织转移到N6培养基中,该培养基包含草丁膦(2mg每升)并不含酪蛋白或脯氨酸。组织继续在这种培养基上缓慢生长。附加的2周后,可将所述组织转移到包含草丁膦的新鲜N6培养基上。6周后,在某些装有补充了草丁膦的培养基的平板上,可鉴定直径约1cm的区域上有活性生长的愈伤组织。当在选择培养基上继代培养时,这些愈伤组织可继续生长。
通过首先将组织簇转移到补充有0.2mg每升的2,4‑D的N6培养基,可由所述转基因愈伤组织再生植物。两周后,可将组织转移到再生培养基中(Fromm等人(1990)Bio/Technology8:833‑839——。
实例15
嵌合基因在双子叶植物细胞中的表达
包含来自编码菜豆(Phaseolus vulgaris)的种子贮藏蛋白质菜豆蛋白β亚基的基因(Doyle等人(1986)J. Biol.Chem.261:9228‑9238)的启动子和转录终止子的种子特异性构建体,可被用于在转化的大豆中表达本发明的多肽。所述菜豆蛋白构建体包括菜豆蛋白的翻译起始密码子上游(5')的约500个核苷酸和翻译终止密码子下游(3')的约1650个核苷酸。在5'和3'区域之间是独特的限制性内切核酸酶位点Nco I(其包括ATG翻译起始密码子)、Sma I、Kpn I和Xba I。整个构建体侧接Hind III位点。
使用适当的寡核苷酸引物,通过cDNA克隆的聚合酶链反应(PCR)可产生该基因的cDNA片段。克隆位点可被整合进所述寡核苷酸中,以在所述DNA片段被插入所述表达载体时提供正确的取向,如下文所述。然后如上所述进行扩增,分离的片段被插入携带所述种子构建体的pUC18载体中。
然后可用包含编码本发明多肽的序列的表达载体转化大豆胚。为了诱导体细胞胚,可将子叶(长度为3‑5mm,从大豆品种A2872的表面灭菌的未成熟种子解剖出来)于26℃在光照或黑暗下在适当的琼脂培养基上培养6‑10周。然后切下体细胞胚(其产生次生胚)并将其置于合适的液体培养基中。在重复选择增殖为早期球形阶段胚的体细胞胚簇后,按下面的描述维持该悬浮液。
可将大豆胚发生悬浮培养物在26℃下在旋转振荡器(150rpm)上的35mL液体培养基中维持,荧光光照采用16:8小时(白天/黑夜)的时间表。通过将大约35mg组织接种到35ml液体培养基中,每两周将培养物进行继代培养。
然后可通过基因枪轰击方法(Klein等人(1987),Nature(London)327:70‑73;美国专利4,945,050)转化大豆胚发生悬浮培养物。DuPontBiolistic MPDS1000/HE仪器(氦气改进型)可被用于这些转化。
可被用于帮助大豆转化的选择性标记基因是由来自花椰菜花叶病毒的35S启动子(Odell等人(1985)Nature313:810‑812)、来自质粒pJR225(来自大肠杆菌;gritz等人(1983)Gene25:179‑188)的潮霉素磷酸转移酶基因以及来自根癌农杆菌Ti质粒的T‑DNA的胭脂碱合酶基因的3′区域构成的嵌合基因。包含所述菜豆蛋白5′区域、编码本发明多肽的片段和所述菜豆蛋白3'区域的种子构建体可作为限制性片段被分离。然后该片段可被插入携带所述标记基因的载体的特定限制性位点。
将5μL DNA(1μg/μl)、20μL亚精胺(0.1M)和50μl CaCl2(2.5M)(依次)加入50μL60mg/mL的1μm金颗粒悬浮液中。然后搅拌该颗粒制备物三分钟,在微量离心机(microfuge)中离心10秒并去除上层清液。然后将DNA涂覆的颗粒在400μL70%乙醇中洗涤一次并重悬浮于40μL无水乙醇中。可将DNA/颗粒悬浮液用超声波处理三次,每次一秒钟。然后将5μL所述DNA涂覆的金颗粒加载至每个巨大载体盘上。将大约300‑400mg两周大的悬浮培养物置于60×15mm的空培养皿中并用吸管将残留的液体从组织移除。对于每次转化实验,大约5‑10板的组织受到正常轰击。将膜破裂压力设定为1100psi并将室抽真空至28英寸的汞柱。将组织置于离阻挡网大约3.5英寸的地方并轰击三次。轰击后,可将组织分成两份并放回液体培养基中,并如上所述进行培养。
轰击后五至七天,用新鲜培养基更换该液体培养基,并在轰击后七至十二天,用包含50mg/mL潮霉素的新鲜培养基更换。可每周更换这种选择培养基。轰击后七至八周,可观察到绿色的转化组织从未转化的坏死的胚发生簇长出来。移出分离的绿色组织并将其移植进单独的烧瓶中以产生新的、无性繁殖的、转化的胚发生悬浮培养物。可将每一新品系当成是独立的转化事件。然后可将这些悬浮培养物作为未成熟胚簇进行继代培养和维持,或者通过使单独体细胞胚成熟并萌发而再生成整株植物。
实例16
微生物细胞中嵌合基因的表达
编码本发明多肽的cDNA可被插入T7大肠杆菌(E.coli)表达载体pBT430中。该载体来源于采用噬菌体T7RNA聚合酶/T7启动子体系的pET‑3a(Rosenberg等人(1987)Gene56:125‑135)。质粒pBT430通过首先在pET‑3a中在其初始位置处破坏EcoR I和Hind III位点来构建。包含EcoR I和Hind III位点的寡核苷酸衔接子在pET‑3a的BamH I位点处被插入。这产生了pET‑3aM,其具有用于将基因插入表达载体中的附加的独特克隆位点。然后,使用寡核苷酸定向诱变将翻译起始位置处的Nde I位点转化成Nco I位点。该区域中的pET‑3aM DNA序列5'‑CATATGG,在pBT430中被转化成5'‑CCCATGG。
包含cDNA的质粒DNA可被适当地消化,以释放编码所述蛋白质的核酸片段。然后,可在1%NuSievegTGTM低熔点琼脂糖凝胶(FMC)上纯化该片段。缓冲液和琼脂糖包含10μg/mL溴化乙锭,以用于使DNA片段的可视化。然后,可通过按照制造商的说明,用GELaseTM(Epicentre Technologies)消化、乙醇沉淀、干燥和重悬于20μL水中,从琼脂糖凝胶上纯化所述片段。适当的寡核苷酸衔接子可使用T4DNA连接酶(New England Biolabs,Beverly,MA)连接到所述片段。包含连接的衔接子的片段可使用如上所述的低熔点琼脂糖由过量的衔接子纯化。载体pBT430如上所述被消化、用碱性磷酸酶(NEB)去磷酸化并且用苯酚/氯仿脱蛋白质。然后,制备的载体pBT430和所述片段可在16℃下连接15小时,随后转化成DH5电感受态细胞(GIBCO BRL)。可在包含LB培养基和100μg/mL氨苄青霉素的琼脂平板上选择转化体。然后,通过限制性酶分析,就相对于T7启动子的正确取向而言,对包含编码本发明多肽的基因的转化体进行筛选。
为了高水平表达,具有以相对于T7启动子的正确取向插入的cDNA的质粒克隆可被转入大肠杆菌(E.coli)菌株BL21(DE3)(Studier等人(1986)J.Mol.Biol.189:113‑130)中。培养物于25℃下在包含氨苄青霉素(100mg/L)的LB培养基上生长。在600nm光密度为约1时,可加入IPTG(异丙基硫代‑β‑半乳糖苷,诱导剂)至最终浓度为0.4mm,并且可在25℃下继续温育3小时。然后通过离心收获细胞,并将其重悬于50μl包含0.1mm DTT和0.2mm苯甲基磺酰氟的pH8.0的50mm Tris‑HCl中。可加入少量的1mm玻璃珠,并用微探头超声波破碎仪对混合物超声处理3次,每次约5秒。离心所述混合物,并测定上层清液的蛋白质浓度。来自所述培养物的可溶性级份的1μg蛋白质可通过SDS‑聚丙烯酰胺凝胶电泳进行分离。可观察用于以预期的分子量迁移的蛋白质带的凝胶。
实例17
体细胞大豆胚芽培养物的转化
通用的稳定大豆转化规程:
将大豆胚发生悬浮培养物在28℃下在旋转振荡器(150rpm)上的35mL液体培养基(SB55或SBP6)中维持,采用16:8小时(白天/黑夜)的时间表,用荧光和白炽光混合进行光照。通过将大约35mg组织接种进35ml液体培养基中,每四周将培养物进行继代培养。
通过粒子枪轰击方法(Klein等人(1987)Nature327:70)用质粒DNA转化大豆胚发生悬浮液培养物。DuPont Biolistic PDS1000/HE仪器(氦气改进型)被用于这些转化。
将5μL DNA(1μg/μl)、20μl亚精胺(0.1M)和50μl CaCl2(2.5M)(依次)加入50ml的60mg/ml的1μm金颗粒悬浮液中。搅拌该颗粒制备物3分钟,在微量离心机中离心10秒并去除上层清液。然后将DNA包覆的颗粒在400μL70%乙醇中洗涤一次并重悬浮于40μL的无水乙醇中。超声处理所述DNA/颗粒悬浮液三次,每次1秒。然后将5μL该DNA涂覆的金颗粒加载至每个巨大载体盘上。赋予潮霉素磷酸转移酶(HPT)抗性的质粒可与受关注的沉默构建体共轰击,以用于选择。
将大约300‑400mg四周龄的悬浮培养物置于60×15mm的空培养皿中并用移液管将残留的液体从组织中移除。对于每次转化实验,大约5‑10板的组织受到正常轰击。将膜破裂压力设定为1000psi并将室抽真空至28英寸的汞柱。将组织置于离阻挡网大约3.5英寸的地方并轰击三次。轰击后,将所述组织放回液体培养基中,并如上所述进行培养。
轰击后十一天,用包含50mg/ml潮霉素的新鲜的SB55替代所述液体培养基。选择培养基每周更新一次。轰击后七周,观察到绿色的转化组织从未转化的坏死的胚发生簇长出来。移出分离的绿色组织并将其移植进单独的烧瓶中以产生新的、无性繁殖的、转化的胚发生悬浮培养物。因此,每一新品系被看作是独立的转化事件。然后,这些悬浮液可作为被维持在未成熟发育阶段的胚的悬浮液被维持,或者通过各个体细胞胚的成熟和萌发,再生为整株的植物。
从液体培养物中移出转化的胚发生簇的独立品系,并置于不包含激素或抗生素的固体琼脂培养基(SB103)上。在16:8小时(白天/黑夜)时间表的荧光和白炽光混合光照下,于26℃下培养四周。在此期间,将单个的胚从该簇中移出,并就基因表达的改变进行筛选。
应当指出的是,由靶基因的表达的改变导致的任何可检测的表型可在这一阶段被筛选。这将包括但不限于油含量、蛋白质含量、碳水化合物含量、生长速率、生存能力或正常发育成大豆植物的能力的改变。
实例18
用于“互补区域”共抑制的质粒DNA
以下实验中的质粒使用本领域的技术人员熟知的标准克隆方法(Sambrook等人(1989)Molecular Cloning,CSHL Press,New York)来制备。起始质粒pKS18HH(美国专利5,846,784,其内容据此以引用方式并入本文)包含从大肠杆菌(E.coli)菌株W677获得的潮霉素B磷酸转移酶(HPT),其处于T7启动子和35S花椰菜花叶病毒启动子的控制下。质粒pKS18HH因此包含T7启动子/HPT/T7终止子盒,以用于在某些大肠杆菌(E.coli)菌株如NovaBlue(DE3)[来自Novagen]中表达HPT酶,所述菌株对于λE3是溶原性的(其携带处于lacV5控制下的T7RNA聚合酶基因)。质粒pKS18HH也包含35S/HPT/NOS盒,以用于HPT酶在植物如大豆中的组成型表达。这两种表达体系允许在潮霉素存在的情况下就生长进行的选择被用作鉴定在细菌和植物体系中包含所述质粒的细胞的方法。pKS18HH还包含适合用于将其他嵌合基因克隆进该载体中的三个独特的限制性内切核酸酶位点。质粒ZBL100(2000年3月2日公布的PCT专利申请WO00/11176)是pKS18HH的衍生物,具有缩短的NOS3'终止子。质粒pKS67是ZBL100衍生物,其在NotI克隆位点前具有β‑大豆伴大豆球蛋白启动子的插入,接着是菜豆蛋白3'终止子(描述于1994年5月26日公布的PCT专利申请WO94/11516中)。
2.5kb质粒pKS17包含pSP72(获自Promega Biosystems)和T7启动子/HPT/T73'终止子区域,并且是包含35S/HPT/NOS盒的3.2kb BamHI‑SalI片段被插入至其中以形成pKS18HH的原始载体。质粒pKS102是pKS17衍生物,其用XhoI和SalI消化、用绿豆核酸酶处理以产生钝末端、并被连接以插入SEQ ID NO:69中所公开的以下接头。
质粒pKS83具有ML70的2.3kb BamHI片段,其包含连接到pKS17的BamHI位点的Kti3启动子/NotI/Kti33'终止子区域(描述于1994年5月26日公布的PCT专利申请WO94/11516中)。用于抑制内源性基因的附加的方法是本领域中为人们所熟知的,并且已被描述于本发明的具体实施方式中,而且可被用于在植物细胞中降低内源性质体HpaIL醛缩酶的基因表达、蛋白质或酶活性的表达。
实例19
通过ELVISLIVES互补区域的抑制
可制备具有“合成的互补区域”(SCR)的构建体。在该实例中,靶序列被置于已知不是任何生物来源的基因或基因组的部分的互补序列(即,“合成的”或由发明人凭空想象的序列)之间。靶DNA因此将处于有义或反义取向,并且所述互补RNA将与任何已知的核酸序列无关。设计任何靶基因的用于抑制的片段可被放入其中的标准“抑制载体”是有可能的。质粒pKS106、pKS124和pKS133(SEQ ID NO:70)例示了这一点。本领域的技术人员将会知道,全部的质粒载体均包含抗生素选择基因,例如但不限于带有启动子如T7诱导型启动子的潮霉素磷酸转移酶。
pKS106使用β‑大豆伴大豆球蛋白启动子,而pKS124和pKS133质粒使用Kti启动子,这些启动子均在大豆种子中表现出强组织特异性表达。pKS106使用来自菜豆蛋白基因的3'终止区域,而pKS124和pKS133使用Kti3'终止区域。pKS106和pKS124具有围绕NotI位点的36核苷酸EagI‑ELVISLIVES序列的单拷贝(所插入的氨基酸是从互补链反向翻译的):SEQ ID NO:71
EagI E L V I S L I V E SNotI
CGGCCGgAGCTGgTCATCTCGCTCATCgTCgAGTCGgCGGCCGC
(S)(E)(V)(I)(L)(S)(I)(V)(L)(E)EagI
CGACTCgACgATgAGCGAgATgACCAGCTCCGGCCG
pKS133具有围绕NotI位点的ELVISLIVES的2X拷贝:SEQ ID NO:72
EagIELVISLIVESEagIELVIS
cggccggagctggtcatctcgctcatcgtcgagtcggcggccggagctggtcatctcg
LIVESNotI(S)(E(V)(I)(L)(S)(I)(V)(L)(E)EagI
ctcatcgtcgagtcggcggccgccgactcgacgatgagcgagatgaccagctccggccgc
(S)(E)(V)(I)(L)(S)(I)(V)(L)(E)EagI
cgactcgacgatgagcgagatgaccagctccggccg
其思想是,单个的EL接头(SCR)可被复制,以提高茎的长度,提高的量为约40个核苷酸。一系列载体将覆盖介于40bp和300bp之间的SCR长度。多种靶基因长度也可被估计。据信靶长度和互补区域长度的某些组合将获得靶的抑制的最佳效果,然而,预期抑制现象在宽泛的大小和序列范围内均效果良好。此外,据信提供最佳的抑制效果的长度和比例可根据不同的靶序列和/或互补区域而变化。
质粒pKS106通过将ELVISLIVES(SEQ ID NO:71)的EagI片段放入pKS67的NotI位点中来制备。ELVISLIVES片段通过PCR制备,该PCR使用两种引物(SEQ ID NO:73和SEQ ID NO:74),没有使用其他的DNA。
用EagI(5'‑CGGCCG‑3')消化PCR反应的产物,然后连接到NotI消化过的pKS67。术语“ELVISLIVES”和“EL”在本文中是互换使用的。
附加的质粒可被用于测试该实例,并且任何合成序列或天然存在的序列可以类似的方式被使用。
实例20
对于油、蛋白质、淀粉和可溶性碳水化合物含量的改变对转基因品系的筛选
转基因品系可选自用抑制性质粒转化的大豆,所述抑制性质粒例如实例15和实例18中所述的那些。通过测量油、淀粉、蛋白质、可溶性碳水化合物和/或种子重量的改变,可针对质体HpaIL醛缩酶在大豆中的下调对转基因品系进行筛选。如下对来源于显示出PAE基因的种子特异性下调的转基因事件的大豆种子进行组成分析,包括对种子组成参数如蛋白质含量和可溶性碳水化合物含量的测量:
成熟的大豆种子或冻干的大豆体细胞胚的油含量可通过NMR来测量,如实例2中所述。
非结构性碳水化合物和蛋白质分析。
将干燥大豆种子在genoGrinder中研磨成细粉,称取子样品(精确度为0.0001g)并置入13×100mm玻璃管中;所述玻璃管配有内衬的密封旋盖。所测试的每种样品设三个重复。通过称量子样品在置于强制通风的烘箱内105℃烘干18小时之前和之后的重量,计算出组织干重。
通过向每一玻璃管加入2ml庚烷等分试样进行脂质的提取。将所述玻璃管进行涡旋混合,并置入充满60℃热水的超声波浴槽(VWR Scientific Model750D)中。以全功率(~360W)将样品超声处理15分钟,然后离心(5min×1700g)。将上层清液转移到干净的13×100mm玻璃管中,用庚烷(第二次提取2ml,第三次提取1ml)将沉淀再提取两次,合并每次提取的上层清液。脂质提取后,向沉淀中加入1ml丙酮,之后涡旋混合以完全分散材料,然后在Speedvac中进行干燥。
非结构性碳水化合物的提取和分析。
将2ml的80%乙醇加入丙酮干燥的沉淀中。将样品彻底地涡旋混合,直至植物材料完全分散于溶剂中,然后于60℃下超声处理15分钟。5分钟×1700g离心后,将上层清液倾析到干净的13×100mm玻璃管中。用80%酒精再进行两次提取,合并每次提取的上层清液。将提取后的沉淀悬浮于丙酮中并干燥(如上所述)。每次提取时加入β‑苯基吡喃葡萄糖苷(100μL0.5000+/‑0.0010g/100ml原液)作为内标物,然后在Speedvac中干燥。将提取物保持在干燥器中直至进一步分析。
将丙酮干燥的粉末悬浮于0.9ml包含100U热稳定的α淀粉酶(来自地衣芽孢杆菌(Bacillus licheniformis);Sigma A‑4551)的MOPS(3‑N[吗啉代]丙烷‑磺酸;50mM,5mM CaCl2,pH7.0)缓冲液中。将样品置于加热块(90℃)中75分钟,每15分钟涡旋混合一次。将样品冷却至室温,向每种样品中加入0.6ml包含5U淀粉葡萄糖苷酶(Roche110202367001)的醋酸盐缓冲液(285mM,pH4.5)。将样品在配有往复式摇动器的水浴中于55℃下温育15‑18小时;混入可溶性马铃薯淀粉(Sigma S‑2630)作为标准物以确保淀粉消化完全。
消化完成后提取释放出的碳水化合物,然后进行分析。向每一管中加入绝对乙醇(6ml),涡旋混合后将样品于60℃下超声处理15分钟。将样品离心(5min×1700g),然后将上层清液倾析到干净的13×100mm玻璃管中。用3ml80%乙醇将沉淀再提取两次,合并所得上层清液。对于每种样品,在用Speedvac干燥之前先加入内标物(100μLβ‑苯基吡喃葡萄糖苷,如上所述)。
样品的制备和分析
使来自可溶性和淀粉提取的干燥样品溶解于包含30mg/ml盐酸羟胺(Sigma‑Aldrich159417)的无水吡啶(Sigma‑Aldrich P57506)中。将样品置于轨道式震荡器上(300rpm)过夜,然后加热1小时(75C),每15分钟进行一次剧烈涡旋混合。在冷却至室温后,加入1ml六甲基二硅氮烷(Sigma‑Aldrich H‑4875)和100ul三氟乙酸(Sigma‑Aldrich T‑6508)。将样品涡旋混合,使沉淀物沉降,然后将上层清液转移到GC样品小瓶中。
在一台配有DB‑17MS毛细管柱(15m×0.32mm×0.25μm膜)的Agilent6890气相色谱仪上对样品进行分析。入口温度和检测器温度均为275℃。注射(2μl,20:1分流)后,将柱温以3℃/min的速率从初始温度(150℃)升高至180℃,然后以25℃/分钟的速率升高至320℃的最终温度。最终温度维持10min。载气为51cm/sec线速度的H2。通过火焰电离进行检测。利用Agilent ChemStation软件进行数据分析。每种糖相对于内标物进行定量,并记录每种单独的碳水化合物的检测器响应(从与每组样品一起受测的标准物计算)。最终的碳水化合物浓度基于组织干重计表示。
蛋白质分析
通过在一台Thermo Finnigan Flash1112EA燃烧分析器上进行燃烧分析,估计出蛋白质含量。用一台Mettler‑Toledo MX5微量天平以0.001mg精确度称量4‑8mg的样品以用于分析。通过将由分析器测定出的%N乘以6.25,来计算出蛋白质含量。最终的蛋白质含量基于%组织干重计表示。
此外,完整的单粒种子以及批量的种子或来源于它们的粉末的组成,可通过近红外线分析来测量。当结合适当的校准时,可进行大豆中的水分、蛋白质和油含量以及玉米中的水分、蛋白质、油和淀粉含量的测量。
实例21
对于油、蛋白质、淀粉和可溶性碳水化合物含量的改变对转基因玉米品系的筛选
通过实例11中所述的方法制备的转基因玉米品系可基本上如实例16中所述进行筛选。PAE或PAE样蛋白质的表达的胚特异性下调预期导致种子油含量的提高。与此相反,PAE或PAE样蛋白质在胚乳中的过表达预期导致种子淀粉含量的提高。
实例22
PAE样基因在大豆中的种子特异性RNAi
构建质粒载体(pKS426),其用于产生显示出与Glyma02g00930、Glyma10g27960、Glyma03g38430和Glyma19g41030基因具有相似性的大豆PAE样基因的种子特异性下调的转基因大豆事件。
简而言之,对应于Glyma03g38430(SEQ ID NO:44)的申请人的EST克隆sfp1n.pk031.o15的质粒DNA被用于采用引物SA156(SEQ ID NO:75)和SA157(SEQ ID NO:76)的PCR反应中。凝胶纯化了0.3kb的PCR产物,下文中称为产物A。对应于Glyma10g27960(SEQ ID NO:42)的申请人的EST克隆sfp1n.pk032.f12的质粒DNA被用于采用引物SA158(SEQ ID NO:77)和SA159(SEQ ID NO:78)的PCR反应中。凝胶纯化了0.55kb的PCR产物,下文中称为产物B。对应于Glyma10g27960(SEQ ID NO:42)的申请人的EST克隆sfp1n.pk032.f12的质粒DNA还被用于采用引物SA158(SEQ ID NO:76)和SA160(SEQ ID NO:79)的PCR反应中。凝胶纯化了0.3kb的PCR产物,下文中称为产物C。100ng的PCR产物A和B的混合物被用于采用PCR引物SA156和SA159的PCR反应中。凝胶纯化了大约0.86kb的PCR产物,下文中称为产物D。100ng的PCR产物C和A的混合物被用于采用PCR引物SA156和SA160的PCR反应中。凝胶纯化了大约0.6kb的PCR产物,下文中称为产物F。按照制造商的说明,将PCR产物D和F独立地克隆进pGEM T‑Easy(Promega,Wisconsin,USA)中。pGEM T‑Easy D和pGEMT‑Easy F的序列分别如SEQ ID NO:80和81所示。
用NotI和SpeI消化pGEM T‑Easy D,凝胶纯化了0.9kb片段。用NotI和SpeI消化pGEM T‑Easy F,凝胶纯化了0.62kb片段。使用T4连接酶连接凝胶纯化的产物,随后用NotI消化。凝胶纯化了1.5kb的Noti片段,并以有义取向克隆至用限制性酶NotI线性化的大豆表达载体KS126(PCT公开WO04/071467)的Kti启动子之后,以获得pKS426(SEQ ID NO:82)。
使用潮霉素选择,pKS426的质粒DNA可被用于产生大豆的转基因体细胞胚或种子,如实例14中所述。测定了用pKS423产生的转基因体细胞胚或大豆种子的组成,如实例17中所述。
质粒载体pKS123描述于PCT专利申请WO02/08269中。质粒pKS120(SEQ ID NO:83)与pKS123(参见上文)相同,不同的是包含Bcon/NotI/Phas3'盒的HindIII片段被去除。
转基因体细胞胚的生成:
用pKS120或pKS426的质粒DNA共轰击大豆体细胞胚大豆组织,如下所述
培养条件:
大豆胚胎生成悬浮培养物(cv.Jack)保持在旋转振荡器上的35mL液体SB196培养基(参见下文),150rpm、26℃和按16:8小时白天/黑夜光周期以60‑85μE/m2/s光强用白色冷光荧光灯照射。每7天至两周,通过将约35mg的组织接种至35mL新鲜的液体SB196,对培养物进行继代培养(优选的继代培养间隔时间为7天)。
用大豆表达质粒对大豆胚胎生成悬浮培养物进行的转化,通过的是基因枪轰击的方法(Klein等人,Nature327:70(1987)),所有转化均用一台DuPont Biolistic PDS1000/HE设备(氦气型)进行。
大豆胚胎发生悬浮培养物的诱导:
每月诱导大豆培养物两次,每次诱导之间相隔5‑7天。将种植45‑55天后的存活大豆植株的带有未成熟种子的豆荚摘下,将其去壳后置于一个杀菌后的Magenta盒子中。将大豆种子置于加入了1滴象牙皂的5%次氯酸钠溶液(即95mL灭菌蒸馏水加上5mL次氯酸钠和1滴象牙皂,混匀)中振荡杀菌15min。用2瓶1升瓶子的无菌蒸馏水清洗种子,并将小于4mm的种子分别置于显微镜载片上。将所述种子的较小一端切开,并将子叶从种皮中挤出。将子叶转移到包含SB199培养基的平版中(每板25‑30个子叶)2周,然后转移到SB1培养中2至4周。用纤维带包裹平板。此次之后,将次级胚切下,并置于SB196液体培养基中7天。
用于轰击的DNA的准备:
pKS120或pKS426的质粒DNA被用于轰击。
将包含1mg金颗粒的无菌蒸馏水的50μl等分试样加入5μl的1μg/μL质粒DNA溶液、50μl的2.5M CaCl2和20μl的0.1M亚精胺中。将混合物用调至4档的旋涡振荡器脉冲振荡5次,然后用台式微量离心机离心5秒。用150μL的100%乙醇洗涤后,然后在85μL的100%乙醇中通过超声处理使沉淀块悬浮。向Biolistic PDS1000/HE设备盘的每个飞盘中分配5μLDNA悬浮液。每次轰击(即每个盘)每5μL等分试样,其包含大约0.058mg金颗粒。
组织的制备和用DNA的轰击:
将7天大约100‑150mg的胚胎悬浮培养物置于一个空的60×15mm无菌培养皿中,并将所述培养皿置于一个空的150×25mm培养皿内部。组织在每个盘轰击一次,膜破裂压力设为650PSI,并且室被抽真空至27‑28英寸的汞柱。将组织置于距维持/终止屏大约2.5英寸处。
转化的胚的选择:
利用潮霉素作为选择性标记来选择转化的胚。具体地,轰击后,将组织置于新鲜的SB196培养基中,并如上所述进行培养。轰击后六至八天,将SB196替代为包含30mg/L潮霉素的新鲜SB196。选择培养基每周更新一次。选择后四至六周,观察到绿色的转化组织从坏死的未转化胚胎发生簇中长出。将分离的绿色组织移除,并接种至多孔板中,以产生新的、克隆繁殖的转化的胚胎发生悬浮培养物。
胚的成熟:
转化的胚发生簇在白色冷荧光灯(Phillips cool white Econowatt F40/CW/RS/EW)和Agro灯泡(Phillips F40Agro)(40瓦)以16:8小时光周期和90‑120μE/m2s光强照射下,于26℃在SB196中培养一至三周。然后将胚簇移入固体琼脂培养基SB166培养1周。然后用SB103培养基继代培养3周。作为另外一种选择,将胚簇移入于250mL锥形瓶中的35mL SB228(ShaM)液体培养基,培养2‑3周。在SB228中培养的组织保持在旋转振荡器上,130rpm、26℃和按16:8小时白天/黑夜光周期以60‑85μE/m2/s光强用白色冷光荧光灯照射。在此期间,将单个胚从簇中移出,并如上所述筛选其脂肪酸组成的变化。
培养基配方:
SB196‑FN Lite液体增殖培养基(每升)
FN Lite原液
SB1固体培养基(每升)
1个包装的MS盐(Gibco/BRL,目录号11117‑066)
1ml B5维生素1000X原液
31.5g葡萄糖
2ml2,4‑D(20mg/L最终浓度)
pH5.7
8g TC琼脂
SB199固体培养基(每升)
1个包装的MS盐(Gibco/BRL,目录号11117‑066)
1ml B5维生素1000X原液
30g蔗糖
4ml2,4‑D(40mg/L最终浓度)
pH7.0
2gm固化剂
SB166固体培养基(每升)
1个包装的MS盐(Gibco/BRL,目录号11117‑066)
1ml B5维生素1000X原液
60g麦芽糖
750mg MgCl2六水合物
5g活性炭
pH5.7
2g固化剂
SB103固体培养基(每升)
1个包装的MS盐(Gibco/BRL,目录号11117‑066)
1ml B5维生素1000X原液
60g麦芽糖
750mg MgCl2六水合物
pH5.7
2g固化剂
SB71‑4固体培养基(每升)
1瓶含蔗糖的Gamborg's B5盐(Gibco/BRL,目录号21153‑036)
pH5.7
5g TC琼脂
2,4‑D原液
Phytotech目录号D295预配液–浓度1mg/mL
B5维生素原液(每100ml)
分装保存于‑20℃
10g肌醇
100mg烟酸
100mg盐酸吡哆醇
1g硫胺
如果溶解不够迅速,则经由加热搅拌器施加低水平热。
SB228‑大豆组织分化&成熟(SHaM)(每升)
高压灭菌
向冷却后的培养基(<30C)中加入:
*谷氨酰胺(最终浓度30mM)4% 110ml
*注意:加入谷氨酰胺后,最终体积将为1010mL。
因谷氨酰胺降解相对迅速,可能最好在即将使用前加入培养基。培养基在加入谷氨酰胺后2周过期;不含谷氨酰胺的基本培养基可保持更长时间。
用于SHAM的FN‑lite Macro10X‑原液#1(每升)
MS Micro1000X‑原液#2(每升)
FeEDTA100X‑原液#3(每升)
Na2EDTA*(乙二胺四乙酸钠) 3.73g
FeSO4*7H20(七水硫酸铁) 2.78g
*在加入铁离子前EDTA必须完全溶解。
定容
溶液是感光的。瓶子应用铝箔包裹以避光。
高压灭菌
Ca100X‑原液#4(每升)
CaCl2*2H20(二水氯化钙) 44g
定容
高压灭菌
B5维生素1000X‑原液#5(每升)
4%谷氨酰胺‑原液#6(每升)
DDI水加热至30℃ 900ml
L‑谷氨酰胺 40g
逐渐加入同时搅拌并施加微热。
不超过35℃。
定容
过滤杀菌
冷冻保存*
*注意:在31℃水浴中热解冻原液以完全溶解晶体。
油分析:
使用NMR测量体细胞胚的油含量。简而言之,在均质器小瓶中将冻干的大豆体细胞胚组织磨成粉,如先前所述(实例2)。将20‑200mg组织粉末转移到NMR管中。如实例2中所述,从NMR信号计算体细胞胚组织粉末的油含量。
实例23
使用人工miRNA在大豆中对PAE样基因
的种子优选的沉默本实例描述了用于大豆转化的质粒载体的构建。所述质粒提供了以大豆基因Glyma02g00930(SEQ ID NO:41)、Glyma10g27960(SEQ ID NO:43)、Glyma03g38430(SEQ ID NO:45)和Glyma19g41030(SEQ ID NO:47)为靶标的人工miRNA的种子优选的表达。与携带对照质粒的胚相比,用质粒构建体转化的大豆体细胞胚表现出提高的油含量。
制备载体以使用人工miRNA沉默PAE样基因,很大程度上如2008年12月16日提交的美国专利申请12,335,717中所述。以下简要说明了上述流程。
人工miRNA序列的设计
人工miRNA(amiRNA)将具有沉默所期望的靶基因的能力,其设计很大程度上依照如Schwab R等人(2005)DevCell8:517‑27中所述的规则。概括地说,miRNA序列长度为21个核苷酸,起始于它们5'‑末端的“U”,相对于它们的星序列显示出5'不稳定性,星序列通过在位置19处包括C或G获得,并且它们的第10个核苷酸是“A”或“U”。用于人工miRNA设计的一个附加要求是当使用ZipFold算法进行计算时amiRNA具有高的自由Δ‑G(Markham,N.R.&Zuker,M.(2005)Nucleic Acids Res.33:W577‑W581)。对应于被用于沉默酯酶的amiRNA的DNA序列由SEQID NO:88)表示。
人工星序列的设计
“星序列”是前体RNA中碱基对与amiRNA序列在一起以形成不完全的茎结构的那些序列。为了形成完全的茎结构,星序列将是amiRNA的完全反向互补序列。使用mfold(M.Zuker(2003)Nucleic Acids Res.31:3406‑15;和D.H.Mathews,J.等人(1999)J. Mol.Biol.288:911‑940)折叠了如“Novel and nodulation‑regulated microRNAs in soybean roots”SubramanianS,Fu Y,Sunkar R,Barbazuk WB,Zhu JK,Yu O BMCgenomics.9:160(2008)中所述的并且从mirBase(“Conservation and divergence of microRNA families in plants”Dezulian T,Palatnik JF,Huson DH,Weigel Dhttp://genomebiology.com/2005/6/11/p13(2005))获得的大豆前体序列。然后用amiRNA序列取代miRNA序列,并且用amiRNA的完全反向互补序列取代内源性星序列。将引入人工星序列中的改变使得茎结构将保持与内源性结构相同。改变了的序列然后用mfold折叠并目测比较初始结构和改变后的结构。如果必要的话,可将更多的改变引入人工星序列中以保持初始结构。对应于被用于沉默所期望的靶基因的人工星序列的DNA序列示于SEQ ID NO:89中。
将基因组miRNA前体转化成人工miRNA前体
可使用重叠PCR将基因组miRNA前体基因转化成amiRNA,并且将所得DNA完整测序。然后将这些DNA克隆到能够转化大豆的载体中的合适启动子的下游。
作为另外一种选择,可商业合成amiRNA,例如通过Codon Devices,(Cambridge,MA)。然后将合成的DNA克隆到能够转化大豆的载体中的合适启动子的下游。
作为另外一种选择,可使用In‑FusionTM技术(Clontech,Mountain View,CA)构建amiRNA。
将基因组miRNA前体转化成人工miRNA前体
使用In‑FusionTM将基因组miRNA前体基因转化成amiRNA前体,如上所述。简而言之,miRNA396b前体(SEQ ID NO:90)被改变为包括紧密侧接星系列和miRNA序列的Pme I位点,以形成in‑fusion准备好的miRNA396b前体(SEQ ID NO:91)。该序列被克隆进KS126的NotI位点中,以形成in‑fusion准备好的miRNA396b‑KS126质粒(SEQ ID NO:92)。KS126描述于PCT公开WO04/071467中。
miRNA396b前体(SEQ ID NO:90)被用作PCR模板。按照Clontech提供的规程设计了引物(396b PAE样primA,SEQ ID NO:93和396b PAE样primB,SEQ ID NO:94),并且在In‑Fusion重组反应之后不留下任何Pme I位点的痕迹。所得扩增的DNA的序列示于SEQ ID NO:95中。
SEQ ID NO:95的序列被重组进经Pme I消化的in‑fusion准备好的miRNA396b‑KS126质粒(SEQ ID NO:92)中。这是用与In‑FusionTM试剂盒一起提供的规程进行的。所得质粒示于SEQ ID NO:96中。
396b‑PAE样(SEQ ID NO:96)和对照质粒KS120(SEQ ID NO:83)的质粒DNA被用于转化大豆细胞悬浮液和随后的大豆体细胞胚的产生,如实例22中所述。大豆体细胞胚的油含量通过NMR测量并汇总于表25中。
表25
由对照质粒(KS120)和396b‑PAE样质粒产生的大豆体细胞胚的油含量
事件名称%油(NMR)全部事件平均%油
KS120MSE2698‑196.6
MSE2698‑126.2
MSE2698‑95.0
MSE2698‑215.0
MSE2698‑155.0
MSE2698‑254.9
MSE2698‑14.8
MSE2698‑184.6
MSE2698‑34.3
MSE2698‑264.3
MSE2698‑84.2
MSE2698‑24.0
MSE2698‑73.9
MSE2698‑43.9
MSE2698‑143.8
MSE2698‑163.8
MSE2698‑53.7
MSE2698‑243.6
MSE2698‑203.5
MSE2698‑233.5
MSE2698‑223.4
MSE2698‑133.1
MSE2698‑113.1
MSE2698‑63.0
MSE2698‑172.6
MSE2698‑102.44.1
质粒事件名称%油(NMR)全部事件平均%油
396b‑酯酶MSE2701‑98.3
MSE2701‑17.5
MSE2701‑207.2
MSE2701‑117.1
MSE2701‑196.5
MSE2701‑306.3
MSE2701‑106.3
MSE2701‑85.9
MSE2701‑155.5
MSE2701‑295.5
MSE2701‑55.5
MSE2701‑135.4
MSE2701‑235.4
MSE2701‑165.3
MSE2701‑185.1
MSE2701‑274.9
MSE2701‑214.9
MSE2701‑124.7
MSE2701‑284.4
MSE2701‑224.4
MSE2701‑34.3
MSE2701‑64.3
MSE2701‑24.2
MSE2701‑243.8
MSE2701‑263.7
MSE2701‑43.4
MSE2701‑73.3
MSE2701‑173.0
MSE2701‑142.8
MSE2701‑252.25.0
实例24
由用于种子优选的表达PAE样基因的DNA构建体转化的拟南芥事件的组成分析
本实例描述了用pKR1478‑PAE(SEQ ID NO:14)产生的转基因事件的种子组成。其展示出由用于种子优选的过表达编码PAE样基因的基因的DNA构建体进行的转化导致了油含量降低,该油含量的降低伴有种子贮藏蛋白质含量的提高和可溶性碳水化合物(较小程度)的提高。
使实例4,表10中所述的转基因事件的T4种子经历蛋白质和可溶性碳水化合物的组成分析,如实例4中所述。
结果汇总于表26中。
表26
由用于过表达PAE样基因的DNA构建体转化的拟南芥事件的种子组成
表26展示出与pKR1478‑PAE转基因(SEQ ID NO:14)的存在相关联的油的降低伴有种子蛋白质含量的提高和可溶性碳水化合物含量的小幅提高。后者通过汇总松醇、山梨醇、果糖、葡萄糖、肌醇、蔗糖、棉子糖和水苏糖的含量进行计算。
实例25
由用于种子优选的沉默PAE样基因的DNA构建体转化的拟南芥事件的组成分析
本实例描述了用pKR1481‑PAE(SEQ ID NO:34)产生的转基因事件的种子组成。其展示出由用于种子优选的过表达编码PAE样基因的基因的DNA构建体进行的转化导致了油含量提高,该油含量的提高伴有种子贮藏蛋白质含量的降低和可溶性碳水化合物较小程度的降低。
使实例5,表12中所述的转基因事件的T4种子经历蛋白质和可溶性碳水化合物的组成分析,如实例4中所述。
结果汇总于表27中。
表27
由用于种子优选的沉默PAE样基因的DNA构建体转化的拟南芥事件的种子组成
表27展示出与pKR1481‑PAE转基因(SEQ ID NO:28)的存在相关联的油的提高伴有种子蛋白质含量的降低和可溶性碳水化合物含量的小幅降低。后者通过汇总松醇、山梨醇、果糖、葡萄糖、肌醇、蔗糖、棉子糖和水苏糖的含量进行计算。
实例26
用包含来源于At2g46930(PAE)基因序列的较少内含子反向重复构建体的DNA构建体转化的拟南芥事件的表征
构建了质粒载体lo125,其用于产生显示对应于At2g46930的PAE基因的种子特异性下调的转基因拟南芥事件。
简而言之,从合并的拟南芥cDNA库分离的质粒DNA被用于两个PCR反应,所述PCR反应使用引物SA335(SEQ ID NO:97)和SA336(SEQ ID NO:98)或者使用SA320(SEQ ID NO:99)和SA319(SEQ ID NO:100)。用SA335(SEQ ID NO:97)和SA336(SEQ ID NO:98)产生1.18kb的PCR产物。凝胶纯化该PCR产物,下文中称为产物A。用SA320(SEQ ID NO:99)和SA319(SEQ ID NO:100)产生0.7kb的PCR产物。凝胶纯化该PCR产物,下文中称为产物B。利用制造商的说明,将PCR产物A和B克隆进pGEM Teasy中,这产生了质粒pGEM T easy A(SEQ ID NO:101)和pGEM T easy B(SEQ ID NO:102)。用NotI和PstI从pGEM T easy A切下1.18bp的限制性片段,并将其克隆进pBluesript SK+(Stratagene,USA)中。用PstI和EcoRI使所得质粒pBluescript‑A(SEQ ID NO:103)线性化,并将其连接到用PstI和EcoRI从pGEM T easy B切下的0.7kb片段。用NotI从pBluescript‑AB(SEQ ID NO:104)切下1.9kb的片段,并将其连接到用NotI线性化的KS442(SEQ ID NO:105),以获得KS442‑AB(SEQ ID NO:106)。
在这之前,构建了KS442如下:用BamHI和XmnI消化KS121(PCT专利申请WO02/00904)并连接到包含大豆GYI启动子的片段。所述GYI启动子从KS349(2008年11月27日公布的US20080295204A1)获得。简而言之,用NcoI消化KS349,按照制造商的说明用Klenow DNA聚合酶(NEB,USA)补平了悬臂。用BamHI消化线性化KS349质粒,从而释放出用于构建KS442(SEQ ID NO:105)的GYI启动子。
用AscI消化KS442‑AB(SEQ ID NO:106),并且1.9kb的DNA片段被连接到Asc线性化的pKR92(SEQ ID NO:8),以获得lo125(SEQ ID NO:107)。
lo125(SEQ ID NO:107)的质粒DNA被用于农杆菌介导的拟南芥转化,如实例4中所述。用lo125产生总计22个事件。使这些事件的T1植物与野生型对照植物一起生长至成熟。收获种子,并通过NMR测量油含量,如实例2中所述。该分析的结果汇总于表28中。
表28
由用于种子特异性沉默At2g46930的二元载体lo125产生的T1植物的种子油含量
使事件K60333、K60344、K60345和K60332的T2种子在包含卡那霉素的选择性植物生长培养基上发芽,与野生型植株一起种植在土壤中并生长至成熟。通过NMR测量T3种子油含量。该分析的结果汇总于表29中。
表29
用种子优选的沉默At2g46930的二元载体lo125产生的T2植物的种子油含量
表28和29显示出使用包含无内含子反向重复序列的发夹构建体,沉默PAE基因如At2g46930,导致了可遗传的油提高。在lo125来源的T‑DNA插入依然分离的T3品系中,平均油含量比野生型对照植株的高介于4.2%和6.8%之间。