技术领域
本发明涉及拟南芥三烯甲素及其制备方法。
背景技术
萜类化合物是以异戊二烯为前体物质经缩合、环化、氧化及结构修饰而形成的一类广泛存在于动植物体内的天然产物。尽管萜类化合物的结构和功能多种多样,但它们都是由最基本的五碳单位—异戊烯基焦磷酸(IPP)及其异构体二甲基烯丙基焦磷酸(DMAPP)合成。作为萜类化合物生物合成的中心前体,在植物中由甲羟戊酸(MVA)途径和甲基赤藓醇-4-磷酸(MEP)途径合成。在异戊烯基转移酶催化作用下,形成具有五碳倍数的萜类骨架碳链的焦磷酸酯,然后经萜类合酶(TPS)环化作用、修饰酶的结构修饰,形成数目众多的萜类化合物。实际上,萜类化合物的多样性主要在于萜类合酶独特的催化机制,在该酶的作用下,线性的聚异戊二烯可以一步(或几步)合成含多环和多个手性中心的萜类化合物。
二倍半萜类化合物是由五个异戊二烯单元衍生而来的,主要分布于海洋生物、陆生真菌、地衣、植物等中,并具有抗炎、拒食、抗血小板凝集、抗病原微生物等多方面生物活性。迄今,已经有100多个不同结构的二半萜化合物从植物中分离鉴定,但人们对二半萜化合物在植物中的分布、可能的功效应用,特别是生物合成途径组成(酶和对应编码基因)还知之甚少。
发明内容
本文首次利用代谢工程菌株体系,将来源于植物拟南芥(A.thaliana)的二倍半萜途径的两个关键功能基因GFPPS和TPS18重组在大肠杆菌中,从中发现了其功能性代谢产物二倍半萜类化合物——拟南芥三烯甲素(thalianatriene)。
因此,本发明第一方面提供一种重组表达载体,所述重组表达载体表达拟南芥的GFPP合成酶和二倍半萜合成酶。
在一个或多个实施方案中,所述重组表达载体含有拟南芥GFPP合成酶的编码序列和拟南芥二倍半萜合成酶的编码序列。
在一个或多个实施方案中,所述拟南芥GFPP合成酶的编码序列如At3g14550所示。
在一个或多个实施方案中,所述拟南芥GFPP合成酶的编码序列如SEQ ID NO:2所示。
在一个或多个实施方案中,所述拟南芥GFPP合成酶的编码序列不含有GFPP合成酶N端信号肽的编码序列。
在一个或多个实施方案中,所述拟南芥二倍半萜合成酶的编码序列如At3g14520所示。
在一个或多个实施方案中,所述拟南芥二倍半萜合成酶的编码序列不含有二倍半萜合成酶N端信号肽的编码序列。
在一个或多个实施方案中,所述拟南芥二倍半萜合成酶的编码序列如SEQ ID NO:4所示。
在一个或多个实施方案中,所述重组表达载体含有SEQ ID NO:2和/或4所示的核苷酸序列。
在一个或多个实施方案中,所述重组表达载体以pET-28b为骨架载体,插入了拟南芥GFPP合成酶的编码序列和拟南芥二倍半萜合成酶的编码序列。
本发明第二方面提供一种重组大肠杆菌,所述重组大肠杆菌表达拟南芥GFPP合成酶和二倍半萜合成酶。
在一个或多个实施方案中,所述重组大肠杆菌含有拟南芥GFPP合成酶的编码序列和拟南芥二倍半萜合成酶的编码序列。
在一个或多个实施方案中,所述重组大肠杆菌携带本文第一方面所述的重组表达载体。
在一个或多个实施方案中,所述重组大肠杆菌还含有拟南芥MVA途径所有关键功能基因,以使其能由乙酰辅酶A(Acyl-CoA)合成甲羟戊酸,并由甲羟戊酸合成IPP和DMAPP。
在一个或多个实施方案中,所述重组大肠杆菌携带表达MVA途径所有关键功能基因的质粒。
在一个或多个实施方案中,所述重组大肠杆菌合成下式所示的化合物:
本发明第三方面提供下式所示的化合甲物:
本发明第四方面提供一种制备下式所示的拟南芥三烯甲素的方法:
所述方法包括发酵本发明第二方面所述重组大肠杆菌的步骤。
在一个或多个实施方案中,在TB培养基中低温(如10~20℃)培养发酵所述重组大肠杆菌。
在一个或多个实施方案中,获得发酵液后,离心发酵液,获得上清液和菌体;分别萃取上清液和破壁后的菌体,合并萃取液,减压浓缩得浸膏。
在一个或多个实施方案中,将浸膏进行硅胶柱层析,以正己烷洗脱,后经反相柱层析,以甲醇洗脱,获得拟南芥三烯甲素。
在一个或多个实施方案中,使用乙酸乙酯进行萃取。
在一个或多个实施方案中,反相柱层析的填料为ODS-A-HG。
附图说明
图1:pJS-GFPPS2-TPS18质粒图谱。
具体实施方式
应理解,在本发明范围内中,本发明的上述各技术特征和在下文(如实施例)中具体描述的各技术特征之间都可以互相组合,从而形成本发明其它技术方案。
本发明首次利用代谢工程菌株体系,将拟南芥中二倍半萜途径的两个关键基因GFPPS和TPS18功能重组到大肠杆菌中,进一步分离和纯化获得新颖骨架二半萜化合物——拟南芥三烯甲素(thalianatriene)。本文中,GFPPS是生成二半萜化合物前体物质GFPP(C25;Geranylfarnesyl diphosphate)的GFPP合酶(GFPPS,GFPP synthase)。TPS18是拟南芥二倍半萜合成酶。
本文中,拟南芥编码GFPP合成酶的AtGFPPS2基因序列可如At3g14550所示,或如SEQ ID NO:1所示;拟南芥编码二倍半萜合成酶的AtTPS18基因序列可如At3g14520所示,或如SEQ ID NO:3所示。应理解的是,GFPP合成酶和二倍半萜合成酶的酶活不变、优选是酶活提高的变异体及其编码序列也可用于实施本发明。
通常,为了构建可溶性蛋白,可切掉GFPP合成酶和二倍半萜合成酶的信号肽序列。已知GFPP合成酶的信号肽序列为其N端第1-39个氨基酸残基,二倍半萜合成酶的信号肽序列为其N端第1-51个氨基酸残基。因此,本发明拟南芥GFPP合成酶的编码序列通常不包括GFPP合成酶信号肽序列的编码序列,例如,所述编码序列如SEQ ID NO:1第118-1083所示;拟南芥二倍半萜合成酶的编码序列通常也不包括二倍半萜合成酶信号肽序列的编码序列,例如,所述编码序列如SEQ ID NO:3第154-1818所示。除此之外,在除去信号肽编码序列之后,还可在拟南芥GFPP合成酶编码序列以及拟南芥二倍半萜合成酶编码序列的5’端添加起始密码子,如ATG等。在某些实施方案中,拟南芥GFPP合成酶编码序列如SEQ ID NO:2所示;拟南芥二倍半萜合成酶编码序列如SEQ ID NO:4所示。
可采用本领域周知的PCR扩增法、重组法或人工合成的方法获得拟南芥GFPP合成酶编码序列和拟南芥二倍半萜合成酶编码序列。对于PCR扩增法,可根据本文所公开的核苷酸序列来设计引物,并用市售的cDNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。
可采用本领域常规的技术手段构建同时表达拟南芥GFPP合成酶和二倍半萜合成酶的表达载体。这些方法包括体外重组DNA技术、DNA合成技术、体内重组技术等。
适用于本文的表达载体可以是本领域熟知的细菌质粒、噬菌体、酵母质粒、植物细胞病毒、哺乳动物细胞病毒如腺病毒、逆转录病毒或其它载体。只要能在宿主(尤其是大肠杆菌)体内复制和稳定,任何质粒和载体都可以用。表达载体的一个重要特征是通常含有调控序列,包括但不限于复制起点、启动子、标记基因、翻译控制元件、翻译起始用的核糖体结合位点和转录终止子等。
代表性的启动子有:大肠杆菌的lac或trp启动子;λ噬菌体PL启动子;真核启动子包括CMV立即早期启动子、HSV胸苷激酶启动子、早期和晚期SV40启动子、反转录病毒的LTRs和其它一些已知的可控制基因在原核或真核细胞或其病毒中表达的启动子。
表达载体中,各种核酸和调控序列可被连接在一起,以产生可能包括一个或多个容许在这种位点插入或取代该编码多肽的核苷酸序列的方便限制性位点的重组表达载体。在制备本发明的表达载体时,本文所述的两种酶的编码序列位于载体中以使得该编码序列可操作地连接用于表达适当调控序列。
表达载体可以是能够方便地经受重组DNA方法并且可导致本文所述的酶的编码序列表达的任何载体(如质粒或病毒)。载体的选择一般取决于载体与其中被导入该载体的宿主细胞的相容性。该载体可以是线性或闭合的环形质粒。
载体可以是自主复制的载体,即作为染色体外实体存在,其复制不依赖于染色体复制的载体,例如质粒、染色体外元件、微型染色体或人工染色体。载体可包含用于保证自我复制的任何方式。或者,载体可以是当被导入宿主细胞时,整合到基因组中并且与其已经被整合进入的染色体一起复制的载体。此外,可使用一起包含将被导入宿主细胞基因组的总DNA的单个载体或质粒或两个或多个载体或质粒,或转座子。
表达载体优选包含一个或多个容许容易选择转化、转染、转导等细胞的可选择标记。可选择的标记是基因,其产物提供对抗生素或病毒的抗性、对重金属的抗性、原养型至营养缺陷型等。
优选地,表达载体包含容许该载体整合进入宿主细胞基因组或该载体在细胞中独立于基因组自主个复制的元件。
一个以上拷贝的本发明的编码序列可被插入宿主细胞以增加该基因产物的产量。多核苷酸拷贝数的增加可通过将至少一个附加拷贝的序列整合进入宿主细胞基因组或通过包括可扩增的选择标记基因和该多核苷酸来获得,其中包含扩增拷贝的选择标记基因并且由此包含附加拷贝多核苷酸的细胞可通过在存在适当的选择剂时培养该细胞来筛选。
优选地,表达载体包含人工合成的一段序列,含有多个限制内切酶识别位点,能为外源DNA提供多种可插入的位置或插入方案。
优选地,本文的表达载体适于在大肠杆菌中表达目的蛋白。表达载体中除含有编码拟南芥GFPP合成酶和二倍半萜合成酶的核苷酸序列外,还可含有其它适于在大肠杆菌中表达这两种酶的元件,包括但不限于前文所述的包括但不限于复制起点、启动子、标记基因、翻译控制元件、翻译起始用的核糖体结合位点和转录终止子等。
在某些实施方案中,本文使用抗性基因修改的pET28b(Apr)载体作为骨架载体构建本文的表达载体。在某些实施方案中,本文表达载体的结构如图1所示。
本领域一般技术人员都清楚如何选择适当的载体、启动子、增强子和宿主细胞等。
获得本本文的表达载体后,可采用本领域熟知的方法将其转化宿主细胞。例如,当宿主为原核生物如大肠杆菌时,能吸收DNA的感受态细胞可在指数生长期后收获,用CaCl2法处理,所用的步骤在本领域众所周知。另一种方法是使用MgCl2。如果需要,转化也可用电穿孔的方法进行。当宿主是真核生物,可选用如下的DNA转染方法:磷酸钙共沉淀法,常规机械方法如显微注射、电穿孔、脂质体包装等。
获得的转化子可以用常规方法培养,允许其表达所述酶。根据所用的宿主细胞,培养中所用的培养基可选自各种常规培养基。在适于宿主细胞生长的条件下进行培养。当宿主细胞生长到适当的细胞密度后,用合适的方法(如温度转换或化学诱导)诱导选择的启动子,将细胞再培养一段时间。
在本发明的实施方案中,在构建重组宿主细胞,尤其是重组大肠杆菌时,通常将表达拟南芥GFPP合成酶和二倍半萜合成酶的载体与表达MVA途径所有关键功能蛋白的载体共转入宿主细胞中。具体而言,在某些实施方案中,将携带拟南芥二半萜途径的两个关键功能基因GFPPS和TPS18的质粒及携带MVA途径所有关键功能基因的质粒共转入大肠杆菌中。本文中,所述MVA途径所有关键功能基因至少负责由Acyl-CoA合成甲羟戊酸,并由甲羟戊酸合成IPP和DMAPP。这类携带MVA途径所有关键功能基因的质粒可采用本领域已知的质粒,例如pXL13和pXL17(Wang,J.-F.;Li,S.-Y.;Xiong,Z.-Q.;Wang,Y.Cell Res.2016,26,258-261)。将所述表达载体共转到大肠杆菌宿主细胞中后,涂布到添加有相应抗生素的LB琼脂平板上,过夜培养,从而可筛选得到所需的重组大肠杆菌。因此,本文提供一种重组大肠杆菌,所述大肠杆菌表达拟南芥GFPP合成酶和二倍半萜合成酶。进一步地,所述大肠杆菌还表达MVA途径所有关键功能蛋白,这些蛋白至少负责由Acyl-CoA合成甲羟戊酸,以及由甲羟戊酸合成IPP和DMAPP。例如,所述重组大肠杆菌含有拟南芥GFPP合成酶的编码序列和拟南芥二倍半萜合成酶的编码序列,进一步地还含有MVA途径所有关键功能蛋白的编码序列。在某些实施方案中,所述重组大肠杆菌携带本文所述的重组表达载体,并进一步携带表达MVA途径所有关键功能基因的质粒。
在某些实施方案中,本文提供一种重组大肠杆菌,所述重组大肠杆菌能合成下式所示的化合物(拟南芥三烯甲素):
本文也提供下式所示的二倍半萜类化合物:
式I中,C7、C11和C15中任意一个或多个位置上的甲基可被替换成羧基或COOR基团,其中,R选自C1-C6烷基;和/或,C10和C11间的双键、C6和C7间的双键以及C3和C20间的双键可任选地被氧化或还原,从而形成在C3、C6、C7、C10、C11和C20中的任意一个或多个位置上被取代,和/或在C10和C11、C6和C7和/或C3和C20间形成环氧环的化合物;
式II中,C7、C11和C15中任意一个或多个位置上的甲基可被替换成羧基或COOR基团,其中,R选自C1-C6烷基;和/或,C3和C20间的双键可任选地被氧化或还原,从而形成在C3和C20中的任意一个或全部两个位置上被取代的化合物,或在C3和C20间形成环氧环的化合物。
本文中,取代基可以是例如C1-C6烷基,羟基,羧基,卤素(如F、Cl、Br或I),C1-C6酰基,氨基,C2-C6烯基中的一个或多个。
本领域已知,二倍半萜类化合物具有抗肿瘤、抗炎、拒食、抗血小板凝集、抗病原微生物等多方面生物活性。因此,预期本发明的二倍半萜类化合物也具有抗肿瘤、抗炎、拒食、抗血小板凝集、抗病原微生物等方面的生物活性。
因此,在某些方面,本文也提供一种药物组合物,所述药物组合物含有
和药学上可接受的载体。
药学上可接受的载体通常是安全、无毒的,且广义上可包括制药产业中用于制备药物组合物的任何已知物质,如填充剂、稀释剂、凝结剂、黏合剂、润滑剂、助流剂、稳定剂、着色剂、润湿剂、崩解剂等。在选择适用于投递合成肽的赋形剂时,主要需考虑此药物组合物的给药方式,本领域技术人员熟知此项技术。
药物组合物中可含有治疗或预防有效量的所示化合物。“有效量”指某成分的用量足以产生所期望的反应。具体的有效量取决于多种因素,包括但不限于欲治疗的特定病症、患者的身体条件(如患者体重、年龄或性别)、治疗持续时间、共同施与的疗法(如果有的话)以及所用的具体配方。“有效量”也指在该用量下,所述化合物的毒性或负面效果不及于其所带来的正面疗效。
可根据已知的药学程序来制备上述药物组合物,譬如《雷明顿制药科学》(Remington’s Pharmaceutical Sciences)(第17版,Alfonoso R.Gennaro编,麦克出版公司(Mack Publishing Company),伊斯顿,宾夕法尼亚(1985))一书中有详细的记载。
在某些方面,本发明还提供二倍半萜类化合物在抗肿瘤、抗炎、抗血小板凝集、抗病原微生物以及治疗和/预防拒食方面的应用,或在制备治疗抗肿瘤药、抗炎药、抗血小板凝集药、抗病原微生物的药物以及治疗和/预防拒食的药物中的应用。
本文制备拟南芥三烯甲素的方法可包括发酵本文所述重组大肠杆菌的步骤。在某些实施方案中,本文制备拟南芥三烯甲素的方法还包括构建大肠杆菌工程菌的步骤。在某些实施方案中,所述构建大肠杆菌工程菌的步骤包括:将携带拟南芥二半萜途径的两个关键功能基因GFPPS和TPS18的质粒及携带甲羟戊酸途径所有关键功能基因的质粒共转于大肠杆菌中,获得大肠杆菌工程菌。应理解的是,可将GFPPS基因、TPS18基因以及甲羟戊酸途径所有关键功能基因共同构建于一个表达载体中。
可采用常规的发酵大肠杆菌的方法进行发酵。例如,在某些实施方案中,在TB培养基中低温(如10~20℃)培养发酵所述重组大肠杆菌。TB培养基可以是市售的培养基,或根据已知的TB培养基的配方自行配制。通常,获得发酵液后,离心发酵液,所得菌体用水悬浮,破壁后用萃取;所得上清液同样进行萃取,合并萃取液,减压浓缩得浸膏;将浸膏进行硅胶柱层析,以正己烷洗脱,后经反相柱层析,以甲醇洗脱,即可获得拟南芥三烯甲素。可使用乙酸乙酯进行萃取。反相柱层析的填料可为ODS-A-HG。
实施例
下文将以具体实施例的方式阐述本发明。下列实施例中未注明具体条件的实验方法,通常按照常规条件如Sambrook等,《分子克隆:实验室指南》(美国纽约州:冷泉港实验室出版社(Cold Spring Harbor Laboratory Press),1989)所述的条件,或按照制造厂商所建议的条件进行。
所用溶剂和试剂均为分析纯,购自国药集团化学试剂有限公司;寡核苷酸引物购自生功生物工程(上海)股份有限公司;序列分析委托上海美吉生物医药有限公司;PCR使用Eppendorf Mastercycler personal PCR仪;旋光测定由美国鲁道夫旋光仪Autopol I测定;碳谱和氢谱分别由Bruker DRX 500和Agilent DD2 600测定;高分辨质谱由Thermo Fisher Scientific LTQ FT Ultra质谱仪测定;薄层层析所用硅胶板为预制硅胶板HSGF254(烟台淄福化学试剂有限公司),硅胶H(青岛海洋化工有限公司),反相硅胶(ODS-A-HG,日本东京YMC有限公司生产)。
实施例1:拟南芥三烯甲素的制备
重组质粒的构建:pXL13、pXL17为实验室前期构建的萜类MVA途径相关的质粒(Wang,J.-F.;Li,S.-Y.;Xiong,Z.-Q.;Wang,Y.Cell Res.2016,26,258-261)。pXL17作为上游途径质粒,由atoB、mvaA、mvaS基因组成,Amp抗性,负责Acyl-CoA到甲羟戊酸的合成。pXL13作为下游途径质粒,由mvak2、mvak1、mvaD、idi基因组成,Kan抗性,负责甲羟戊酸到IPP和DMAPP的合成。
以拟南芥(A.thaliana)的cDNA为模板,通过引物AtGFPPS2-F/R扩增其编码GFPP合成酶的AtGFPPS2基因(At3g14550;参考文献:Wang,C.-Y.;Chen,Q.-W.;Fan,D.-J.;Li,J.-X.;Wang,G.-D.;Zhang,P.Mol.Plant 2016,9,195-204)。为构建可溶表达蛋白,将AtGFPPS2的N端信号肽,即前39个氨基酸残基切掉,并在5’端添加ATG,从而得到新序列AtGFPPS2trun。拟南芥中编码二倍半萜合成酶的AtTPS18基因(At3g14520;参考文献:1.Wang,C.-Y.;Chen,Q.-W.;Fan,D.-J.;Li,J.-X.;2.Wang,G.-D.;Zhang,P.Mol.Plant 2016,9,195-204.Aubourg,S.;Lecharny,A.;Bohlmann,J.Mol.Genet.Genomics 2002,267,730-745)以相同的方法获得全长及截短基因(前51个氨基酸残基截掉)AtTPS18trun。AtGFPPS2trun基因经双酶切克隆到质粒pET-28b(Apr)(在市售载体的基础上将抗性基因由卡那霉素改成Apr)的BamH I和Not I位点处,得到质粒pJS-GFPPS2trun。同样,AtTPS18trun基因克隆到质粒pET-Duet(购自EMD Biosciences,Novagen)的BamH I和Not I位点处,得到质粒pJS-TPS18。接下来,以pJS-TPS18为模板,GFPP-TPS-infusionF/R为引物进行扩增,获得目的片段;pJS-GFPPS2trun用BamH I和Not I酶切,回收后与上述两种目的片段用In-Fusion HD Cloning Kit(Vazyme Biotech)连接,得到质粒pJS-GFPPS2-TPS18。详细引物序列如下表1所示。
表1:本实验所采用的引物序列(SEQ ID NO:5-14)
工程菌的发酵:将pXL13、pXL17、pJS-GFPPS2-TPS18三质粒共转到大肠杆菌宿主细胞BL21-DE3中,涂布到添加有相应抗生素的LB琼脂平板上,过夜培养。挑取重组菌株的单克隆于2mL液体LB培养基中,37℃,250rpm,过夜培养16h。用1.5mL离心管收集种子液加入等体积的20%甘油,混匀后-80℃冻存,作为摇瓶发酵的种子液。按1%接种量将一级种子接种到2个含250mL液体TB的500mL摇瓶中,37℃,250rpm,培养至OD600在0.4-0.6之间,作为二级种子液,待接种发酵。按10%接种量将二级种子液接种到12个含400mL TB培养基的2L摇瓶中,同时加入IPTG进行初始诱导,置于16℃,200rpm的摇床上发酵培养4d后,获得4.8升发酵液。
萃取:将大肠杆菌发酵液高速离心分离、获得细菌胞内和胞外两部分,胞内部分用水混悬后高压破碎,用乙酸乙酯萃取;上清液同样用乙酸乙酯萃取,合并萃取液,所得萃取液浓缩后得到乙酸乙酯浸膏。
分离:将所述乙酸乙酯浸膏进行硅胶柱层析(硅胶H)分离,以正己烷洗脱,用薄层层析(TLC)监测分成四个组分。其中第二个组分再进行反相硅胶柱层析分离,以甲醇洗脱,得到拟南芥三烯甲素。
分离纯化得到的本发明的拟南芥三烯甲素为无色油状物,比旋光[α]2D6+20.4(c 0.60,CHCl3),分子式由HR-DART-MS确定为C25H40。1H及13C数据如下表2所示。
表2:拟南芥三烯甲素的1H和13C NMR(ppp,CDCl3,室温)
(结构式中的阿拉伯数字是化1学结构中碳原子的标位)
a Bruker-DRX-500spectrometer仪测定(氢谱测定为500MHz,碳谱测定为125MHz),1H NMR位移值以氘代溶剂中残存的CHCl3(δ7.26ppm)为内标,13C NMR位移值以CDCl3(δ77.0ppm)为内标;偶合常数(J)的单位是Hz;b宽钝峰,由HSQC谱中的相关信号峰证实;cα或β朝向暂时如表所示d由于大环结构的缓慢旋转以及氢信号的严重重叠,NOESY相关信号峰暂时确定如表中所示。
实施例2:6,7-二环氧拟南芥三烯甲素的制备
称取拟南芥三烯甲素9mg,溶解于10mL二氯甲烷中,冰浴条件下加入10mg对间氯过氧苯甲酸,搅拌10分钟后,加入饱和的亚硫酸钠,反应液用乙酸乙酯萃取,获得拟南芥三烯甲素环氧化产物粗提物,该粗提物经200-300目硅胶柱层析正己烷/乙酸乙酯(100:0,95:5,90:10)梯度洗脱,经TLC检测分为四个部分。其中,第三部分进一步经硅胶柱层析正己烷/乙酸乙酯(95:5)洗脱,获得其二环氧化产物6,7-二环氧拟南芥三烯甲素。
分离纯化得到的本发明的6,7-二环氧拟南芥三烯甲素为白色固体,比旋光分子式由HR-DART-MS确定为C25H40O2。1H及13C数据如下表3所示。
表3:6,7-二环氧拟南芥三烯甲素的1H和13C NMR(ppp,CDCl3,-20℃)
(结构式中的阿拉伯数字是化学结构中碳原子的标位)
a Bruker-DRX-500核磁共振仪测定(射频500MHz做氢谱,125MHz做碳谱),1H NMR位移值以氘代溶剂中残存的CHCl3(δ7.26ppm)为内标,13C NMR位移值以CDCl3(δ77.0ppm)为内标;偶合常数(J)的单位是Hz。
实施例3:6,7-二环氧拟南芥三烯甲素的单晶测定
6,7-二环氧拟南芥三烯甲素在正己烷-乙醚(8:2)中重结晶得无色柱状晶体。该晶体的分子式为C25H40O2(M=372.57g/mol)。晶体属于单斜晶系,P2(1)空间群,晶胞参数:α=90.00°,β=98.6640(10)°,γ=90.00°,Z=2,μ(CuKα)=0.513mm-1,F(000)=412.0,Dcalc=1.101g/cm3。
晶体(0.2×0.15×0.05)置于Bruker Apex II CCD衍射仪中,经石墨单色仪单色化的CuKα射线用扫描方式收集衍射数据。于T=205K,在6.714°≤2θ≤129.982°范围内收集13,519个独立衍射点,其中可观测衍射点3453个(I>=2σ(I)),Flack常数为0.09(9)。
应用ShelXT程序解出结构,SHELXL对结构进行修正(修正因子为0.0302),得出6,7-二环氧拟南芥三烯甲素的绝对构型。
本晶体数据(不包括结构因素)已存入剑桥晶体数据中心,编号:CCDC1531107。
序列表
<110> 中国科学院上海生命科学研究院
中国科学院遗传与发育生物学研究所
<120> 拟南芥三烯甲素及其制备方法
<130> 172170
<160> 14
<170> PatentIn version 3.3
<210> 1
<211> 1083
<212> DNA
<213> 拟南芥(A. thaliana)
<400> 1
atggctacta ctgttcatct cagctcattc tccctcttca tccaatccag aggaagaaga 60
gacaactcca tatcttccgt caagagtctc aaaaaacgca caggtttgtc tccctcttct 120
gccctcacct cacaaggtgg cagagacatg attccaccag agggaaaatg caatgatcac 180
aactctgctt ttgatttcaa gttgtatatg atccgcaaag ccgaatctgt aaatgcggct 240
ctcgacgttt ctgtaccgct ccgagaaccc ctcactgtcc aggaagccgt gcggtactca 300
ttgctagcgg gcggaaaacg tgtgaggcct ctgctctgca ttgccgtctg cgagcttgtg 360
ggaggcgacg aggctactgc catgtcagct gcttgcgcgg ttgagatgat ccacacaagc 420
tctcttattc atgacgatct tccgtgcatg gacaatgccg acctccgcag aggcaagccc 480
accaaccaca aggtatatgg agaagacatg gcggttttgg caggtgatgc actccttgca 540
ttggcgtttg agcacatgac gtttgtgtcg agtgggttgg tcgctcccga gaggatgatt 600
cgcgcggtgg ttgagctggc cagggccata gggactacag ggctagttgc tggacaaatg 660
atagacctag ccagcgaaag actgaatcca gacaaggttg gattggagca tctagagttc 720
atccatctcc acaaaacggc ggcattgttg gaggcagcgg cggttttagg ggttataatg 780
ggaggtggaa cagaggaaga gatcgaaaag cttagaaagt atgctaggtg tattggacta 840
ctgtttcagg tggttgatga cattctcgac gtaacaaaat ctactgagga attgggaaag 900
actgcaggaa aagacgtaat ggctggaaag ctgacgtatc caaggctgat aggtttggag 960
agatcaaagg aagttgcaga gaaactgagg agagaagcag aggaacaact tctagggttt 1020
gatccaagta aggcggcgcc tctggtggct cttgctagct acatcgcttg cagacacaac 1080
tga 1083
<210> 2
<211> 969
<212> DNA
<213> 人工序列
<220>
<223> 切掉N端信号肽编码序列的拟南芥GFPP合成酶编码序列
<400> 2
atgtctgccc tcacctcaca aggtggcaga gacatgattc caccagaggg aaaatgcaat 60
gatcacaact ctgcttttga tttcaagttg tatatgatcc gcaaagccga atctgtaaat 120
gcggctctcg acgtttctgt accgctccga gaacccctca ctgtccagga agccgtgcgg 180
tactcattgc tagcgggcgg aaaacgtgtg aggcctctgc tctgcattgc cgtctgcgag 240
cttgtgggag gcgacgaggc tactgccatg tcagctgctt gcgcggttga gatgatccac 300
acaagctctc ttattcatga cgatcttccg tgcatggaca atgccgacct ccgcagaggc 360
aagcccacca accacaaggt atatggagaa gacatggcgg ttttggcagg tgatgcactc 420
cttgcattgg cgtttgagca catgacgttt gtgtcgagtg ggttggtcgc tcccgagagg 480
atgattcgcg cggtggttga gctggccagg gccataggga ctacagggct agttgctgga 540
caaatgatag acctagccag cgaaagactg aatccagaca aggttggatt ggagcatcta 600
gagttcatcc atctccacaa aacggcggca ttgttggagg cagcggcggt tttaggggtt 660
ataatgggag gtggaacaga ggaagagatc gaaaagctta gaaagtatgc taggtgtatt 720
ggactactgt ttcaggtggt tgatgacatt ctcgacgtaa caaaatctac tgaggaattg 780
ggaaagactg caggaaaaga cgtaatggct ggaaagctga cgtatccaag gctgataggt 840
ttggagagat caaaggaagt tgcagagaaa ctgaggagag aagcagagga acaacttcta 900
gggtttgatc caagtaaggc ggcgcctctg gtggctcttg ctagctacat cgcttgcaga 960
cacaactga 969
<210> 3
<211> 1818
<212> DNA
<213> 拟南芥(A. thaliana)
<400> 3
atggacgcaa caagaacgtt ttttggtctt cctaacgttc acaacgttcc tctctgtctc 60
acgtccaacc tctctctctt tcctcagcgt ttgcttcaaa agcacactct tcccctgaaa 120
ccggcaaaaa aacaccactt ggtatgtgta aggtctacaa agagtagtga tgatcttgag 180
ggtagtcgtc cttcaacgta cttttctccc tctctttggg gagatcactt tctctctgtt 240
tccctcgacc gcggtgaatt tgatgaacta gaaagagaga ttgaaactat gaagccactg 300
gtgaaagaca tgctcatgtc ttctcaaagc agcgacaagg agaagattcg tctaatccat 360
ttgctcgtta gcctcgggag ctcttatcat tttgataagg agattcaaga tatccttaaa 420
cacagtttca caaagttgga tgacataata gttggggaag atgatttgga gacaatctcc 480
atcatgtttg aggtctttag actatacggt cacaagatgt cttgtgatgc ctttgataga 540
ttcagaggtg aagatgggag gttcaaggag agtctagcca aagatgttag aggaatgcta 600
cagttgttcg aagtcgcgca tctaggaaca ccctctgaag atataatgga cgaagcatcg 660
agtttcgccc agaatcactt ggattcttgg ataggtggta acgtatccgg tgcaactccc 720
catctcttga agcatataca aaactcatta tacatacctc gatactgtaa catagaagta 780
ctagtggcaa gagaatatat atcttactac gaacaagaag aaggtcacaa caagatcctg 840
ctcaagtttg caaagcttaa cttcaacttt tgccagtttc attatatcca agaactcaaa 900
actctcacca aatggtggaa ggacctagat cttgcatcta agttacctta cattagggat 960
agacttgtag agagccatct cgggggtttg gggccgtact tcgagccaca ctattctctt 1020
gggaggatca tagtggctaa aatcatcatg accatggttg ttgtggatga cacttatgat 1080
gcacatgcaa ctgtacccga agttgcggtt cttaccgaat gtttgcagag gttgaatatt 1140
ggtgccgatg ataaacttcc ggactattta cgaacagtcc tcgaaagtgt gtttgaagtt 1200
atgggagaga ttgaacaaga aatgagaccg aaaggacgat catacggcgt gaaacaagtg 1260
ttggaaaggt tcaagaacgt agcaaaggcg gacaaacagt taacagagtg ggcacgaacg 1320
ggcgacgtac catcctttga tgagtacatg aaagttgggt tggtgacagc tgggatggat 1380
ggttatgcag gatattgctt tataggaatg gaagatgtca gtgaaaagga agcttttgag 1440
tggctcagtt ccaatcccct aatcatccaa gcgctaaatg taatgttccg tttagcaaat 1500
gacgtaggaa cctacgagac cgagataaac agaggagagg tggctaatgg gctcaactgt 1560
tacatgaaac aatatggagt caccaaagaa gaagcatccc aagagttgcg taaaatatac 1620
agcaacaaca aaaaagtggt tatggaggag ttcatgaact cacatgacca tgtgccacgc 1680
caggttctgc tgcgatgcct caactttgca cgcctcttcg atgtgatgta cacggagggt 1740
gatggataca gtgaacccaa aggcaaaatc gaacacttta tgacctcctt gtacgtccac 1800
ccaatacccc tttcataa 1818
<210> 4
<211> 1668
<212> DNA
<213> 人工序列
<220>
<223> 切掉N端信号肽编码序列的拟南芥二倍半萜合成酶编码序列
<400> 4
atgtctacaa agagtagtga tgatcttgag ggtagtcgtc cttcaacgta cttttctccc 60
tctctttggg gagatcactt tctctctgtt tccctcgacc gcggtgaatt tgatgaacta 120
gaaagagaga ttgaaactat gaagccactg gtgaaagaca tgctcatgtc ttctcaaagc 180
agcgacaagg agaagattcg tctaatccat ttgctcgtta gcctcgggag ctcttatcat 240
tttgataagg agattcaaga tatccttaaa cacagtttca caaagttgga tgacataata 300
gttggggaag atgatttgga gacaatctcc atcatgtttg aggtctttag actatacggt 360
cacaagatgt cttgtgatgc ctttgataga ttcagaggtg aagatgggag gttcaaggag 420
agtctagcca aagatgttag aggaatgcta cagttgttcg aagtcgcgca tctaggaaca 480
ccctctgaag atataatgga cgaagcatcg agtttcgccc agaatcactt ggattcttgg 540
ataggtggta acgtatccgg tgcaactccc catctcttga agcatataca aaactcatta 600
tacatacctc gatactgtaa catagaagta ctagtggcaa gagaatatat atcttactac 660
gaacaagaag aaggtcacaa caagatcctg ctcaagtttg caaagcttaa cttcaacttt 720
tgccagtttc attatatcca agaactcaaa actctcacca aatggtggaa ggacctagat 780
cttgcatcta agttacctta cattagggat agacttgtag agagccatct cgggggtttg 840
gggccgtact tcgagccaca ctattctctt gggaggatca tagtggctaa aatcatcatg 900
accatggttg ttgtggatga cacttatgat gcacatgcaa ctgtacccga agttgcggtt 960
cttaccgaat gtttgcagag gttgaatatt ggtgccgatg ataaacttcc ggactattta 1020
cgaacagtcc tcgaaagtgt gtttgaagtt atgggagaga ttgaacaaga aatgagaccg 1080
aaaggacgat catacggcgt gaaacaagtg ttggaaaggt tcaagaacgt agcaaaggcg 1140
gacaaacagt taacagagtg ggcacgaacg ggcgacgtac catcctttga tgagtacatg 1200
aaagttgggt tggtgacagc tgggatggat ggttatgcag gatattgctt tataggaatg 1260
gaagatgtca gtgaaaagga agcttttgag tggctcagtt ccaatcccct aatcatccaa 1320
gcgctaaatg taatgttccg tttagcaaat gacgtaggaa cctacgagac cgagataaac 1380
agaggagagg tggctaatgg gctcaactgt tacatgaaac aatatggagt caccaaagaa 1440
gaagcatccc aagagttgcg taaaatatac agcaacaaca aaaaagtggt tatggaggag 1500
ttcatgaact cacatgacca tgtgccacgc caggttctgc tgcgatgcct caactttgca 1560
cgcctcttcg atgtgatgta cacggagggt gatggataca gtgaacccaa aggcaaaatc 1620
gaacacttta tgacctcctt gtacgtccac ccaatacccc tttcataa 1668
<210> 5
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 5
atggctacta ctgttcatct cagc 24
<210> 6
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 6
tcagttgtgt ctgcaagcga 20
<210> 7
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 7
atggacgcaa caagaacgtt 20
<210> 8
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 8
ttatgaaagg ggtattgggt 20
<210> 9
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 9
catatagatg tctgccctca cctcacaag 29
<210> 10
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 10
ggatcctcag ttgtgtctgc aagcga 26
<210> 11
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 11
ggatccatgt ctacaaagag tagtgatg 28
<210> 12
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 12
gcggccgctt atgaaagggg tattgggt 28
<210> 13
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 13
gcagacacaa ctgaggatct ctagaaataa ttttg 35
<210> 14
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 14
gtggtgctcg agtgcggccg gtaccgacgt cagc 34