表达元件.pdf

上传人:n****g 文档编号:1619574 上传时间:2018-06-29 格式:PDF 页数:59 大小:1.89MB
返回 下载 相关 举报
摘要
申请专利号:

CN98802928.6

申请日:

1998.03.02

公开号:

CN1249003A

公开日:

2000.03.29

当前法律状态:

终止

有效性:

无权

法律详情:

专利权的终止(未缴年费专利权终止)授权公告日:2004.4.14|||授权|||实质审查的生效申请日:1998.3.2|||公开

IPC分类号:

C12N15/63; C12N15/80; C12N9/24

主分类号:

C12N15/63; C12N15/80; C12N9/24

申请人:

丹尼斯科有限公司;

发明人:

P·拉斯穆森

地址:

丹麦哥本哈根

优先权:

1997.02.28 GB 9704157.8

专利代理机构:

中国专利代理(香港)有限公司

代理人:

罗宏;谭明胜

PDF下载: PDF下载
内容摘要

本发明涉及序列CGGCAGGGTCTC,或者其变化,同系物或片段作为激活一种核苷酸序列或者多种核苷酸序列自启动子转录的控制元件的用途。本发明因此提供核酸构建体,其中至少一个该元件的异源拷贝与启动子的上游或下游操作连接,而启动子自身与核苷酸序列操作连接。

权利要求书

1: 具有序列CGGCAGGGTCTC的核酸元件调节核苷酸序列自启动子 转录的用途。
2: 权利要求1的用途其中总共三个具有序列CGGCAGGGTCTC的元 件用来正调节核苷酸序列自启动子的转录。
3: 一种包括与核苷酸序列操作连接的启动子的核酸构建体,特征 在于至少一个元件CGGCAGGGTCTC的异源拷贝操作连接于启动子。
4: 权利要求3的构建体,其是表达载体
5: 权利要求3或权利要求4的构建体,其包括元件CGGCAGGGTCTC 的多于一个的拷贝。
6: 权利要求5的构建体,其包含元件CGGCAGGGTCTC的3个拷贝。
7: 权利要求5的构建体,其包含元件CGGCAGGGTCTC的4个或多 个拷贝。
8: 权利要求1的用途,或者权利要求3-7任一项的构建体,其中 元件位于与核苷酸序列操作连接的启动子的上游。
9: 权利要求1的用途,或者权利要求3-7任一项的构建体,其中 启动子是真菌启动子。
10: 权利要求1的用途,或者权利要求3-7任一项的构建体,其中 核苷酸序列是异源核苷酸序列。
11: 用权利要求3-10任一项的构建体转化的宿主细胞。
12: 权利要求11的宿主细胞,其是植物细胞或真菌细胞。
13: 用权利要求3-10任一项的构建体转化的转基因有机体。
14: 权利要求13的转基因有机体,其是真菌。
15: 塔宾曲霉xlnB启动子的序列变体,其拥有元件CGGCAGGGTCTC 的至少三个拷贝。
16: 权利要求14的塔宾曲霉xlnB启动子的序列变体,其具有 SEQ.ID.No.3列出的序列。
17: 调节核苷酸序列自启动子转录水平的方法,包括插入至少一 个元件CGGCAGGGTCTC的外源性拷贝,使得其与启动子操作连接,和引 起核苷酸序列自启动子转录的步骤。
18: 权利要求3-10任一项的核酸构建体,包括从下面获得的序 列:pXylA,保藏在NCIMB,保藏号No.40861,pXylB,保藏在NCIMB,保 藏号No.40862,或pxlnB-AmyA,保藏在NCIMB,保藏号No.40858。

说明书


表达元件

    本发明涉及适于提高多肽在细胞或有机体中表达水平的表达元件。特别地,本发明涉及具有序列CGGCAGGGTCTC的表达元件。

    木聚糖,通常的植物细胞壁中发现的异质多糖,是自然界最常见多糖的一种。木聚糖酶是木聚糖分解中所涉及的主要的酶的一种,催化木聚糖向低聚木糖亚单位的消化作用。

    已经从非常大量不同的有机体分离到木聚糖酶和相应的基因。例子包括从青霉属(Penicillium)分离的木聚糖酶A和B,从Thermotogamartima和枯草芽孢杆菌(Bacillus subtilis)分离的木聚糖酶A,从产黄瘤胃球菌(Ruminococcus flavefaciens)分离的木聚糖酶B和D,以及很多其它的。

    一般既定的是期望在有机体例如丝状真菌(例如黑色曲霉(Aspergillus niger))或酵母中指导异源核苷酸序列的表达。得到的蛋白质或酶然后可以在工业上使用。或者,得到的蛋白质或酶对于有机体本身可能是有用的。例如,期望产生具有最佳氨基酸组成的真菌蛋白质产物,这样提高其营养值。例如真菌可以成为更有用的饲料。或者,期望分离得到的蛋白质或酶,然后使用这种蛋白质或酶来制备例如食品组合物。关于这一点,得到的蛋白质或酶可以是食品组合物地一种成分或者其可以用来制备食品组合物,包括改变食品组合物的性质或外观。甚至期望使用微生物,例如丝状真菌或酵母,例如为了相同的目的,表达异源基因。

    丝状真菌是工业上大规模生成蛋白质的特别令人感兴趣的宿主。它们具有将大量异源和/或同源蛋白质分泌到其生长培养基中的能力,它们已经被很好地研究并且是公知的,此外认为它们在制备用于食品,饲料和饮料工业的产物中使用是安全的。已知它们有分泌几种水解酶的能力,其中一种是木聚糖酶。多种不同的木聚糖酶是已知的,并且已被描述特征和/或克隆(例如参见Ito等,(1992),生物科学.生物技术.生物化学(Biosci.Biotech.Biochem.)56:906-912),包括来自泡盛曲霉(A.awamori)和川地曲霉(A.kawachii)的木聚糖酶和来自塔宾曲霉(Aspergillus tubingensis)的木聚糖酶A,B和C。后者中,已知木聚糖酶B更弱地表达(参见WO94/14965)。一般情况下,木聚糖酶属于两族糖基水解酶H族和F族中的一族。这两族之间几乎没有同源性,但是在每一族中有一些序列相同性。例如来自塔宾曲霉(A.tubingensis)的木聚糖酶A和B属于H族,并且在氨基酸水平上具有大约45%序列相同性。

    对于在丝状真菌以及绝大多数其它有机体中的异源表达,期望使用强的启动子指导所研究基因的表达。一般设想高度表达的基因包含强的启动子,并且结果来自高度表达的基因的启动子常常用于该目的。在丝状真菌中使用的表达系统的例子包括使用葡糖淀粉酶启动子(US5198345)和泡盛曲霉木聚糖酶A(xlnA)启动子(Gouka,等,(1996),应用微生物.生物技术(Appl.Microbiol.Biotechnol.)46,28-35)的系统。

    De Graaff等,在木聚糖和木聚糖酶,J.Visser等(编著),1992:235-246,Elsevier,和De Graaff等,(1994)分子微生物学(Molecular Microbiology)12:479-490中鉴定了塔宾曲霉xlnA基因的158bp上游调节区,其负责从xlnA启动子转录的激活。该区特别包含包括元件GTCCATTTAGCCA的三个重复的序列。De Graaff等指出整个158bp区能激活黑色曲霉葡萄糖氧化酶基因(goxC)核心启动子。但是没有测得元件GTCCATTTAGCCA是否本身负责上游区的活性或激活作用。

    根据本发明的第一个方面,提供具有序列CGGCAGGGTCTC的核酸元件调节核苷酸序列自启动子转录的用途。

    优选地,启动子是核心启动子。

    本发明涉及序列CGGCAGGGTCTC作为调控元件调节一种核苷酸序列或多种核苷酸序列自启动子转录的用途。因此本发明提供核酸构建体,其中该元件的至少一个异源拷贝与启动子操作连接,该启动子本身与核苷酸序列操作连接,包含这样的核酸构建体的载体和用这样的载体和/或本发明表达DNA构建体转化的宿主细胞。此外,本发明涉及与启动子操作连接的激活元件的多拷贝的用途,为了提供转录的进一步激活。另一方面,本发明涉及具有作为存在三个而不是两个本发明上游TATA盒元件拷贝结果的增强的表达特征的塔宾曲霉xlnB基因的序列变体,以及该变体在上述核酸构建体中的用途。

    根据本发明的元件优选位于与核苷酸序列操作连接的启动子的上游。该核苷酸序列优选是异源核苷酸序列。

    在其上游序列中,启动子已经包含本发明调节元件的一个或两个拷贝的情况下,为了进一步激活从该启动子的转录,根据本发明加上一个或多个外源拷贝。

    元件最佳数目是3。存在多于三个元件对于转录激活是不利的。在期望较低但是依旧明显的转录水平的情况下,使用四个或多个元件是可行的。因此本发明可以用来调节自启动子的转录(负调节以及正调节)。优选地,本发明元件用来正调节自启动子的转录这样转录的速度提高了。

    当存在多于一个本发明元件拷贝时,元件可能重叠。因此,例如,一个元件的初始核苷酸也可以是另一个元件的末端核苷酸。优选地,元件重叠1,2或3个核苷酸。优选地,重叠元件的序列是GGCAGGGTCTCGGCAGGGTCTC。

    优选地,与本发明核苷酸序列连接的激活的启动子被插入到可能是质粒载体或类似物的核酸构建体中。有利地,本发明载体是表达载体。

    如上所述,元件的三个拷贝提供最强的转录激活,较之两个元件更为优选。加上另外的元件,多于三个,导致激活水平的逐渐降低,这一点在下面的实施例中进一步详细描述。

    本发明表达载体用于转化细胞。因此本发明提供用本发明载体转化的细胞,用于异源核苷酸序列编码的多肽的表达。

    转化的细胞可以是培养的细胞,例如组织培养或器官培养的细胞,也可以是形成分立的活有机体的全部或部分的细胞。因此本发明提供用本发明核酸构建体转化的转基因非人有机体。这样的有机体可以是单细胞的或多细胞的。特别优选的是酵母和丝状真菌,特别是曲霉。

    本发明的第二个方面,提供了塔宾曲霉xlnB启动子的序列变体,特征在于,其具有元件CGGCAGGGTCTC至少三个拷贝。木聚糖酶B基因微弱表达(WO94/14965),考虑到其看起来好象拥有弱启动子,从来没有建议是异源表达系统的合适基础。现在分离了特别强的和适于异源核苷酸序列表达的聚糖酶B启动子的出人意料有效的序列变体,并且与WO94/14965公开的启动子相比较。新的序列变体与WO94/14965的启动子所不同之处在于存在三个拷贝元件CGGCAGGGTCTC而不只是两个。存在额外元件想必是负责所发现的转录激活的提高。

    本发明变体优选的序列是上文定义的SEQ.ID.No.1所示的xlnB启动子的序列,或者其变体,同系物或片段,前提是变体,同系物或片段包含至少三个本发明元件拷贝。SEQ.ID.No.1中的启动子位于转录起始位点的上游,在特别优选的实施方案中,启动子具有SEQ.ID.No.1位置1和720之间所示的序列。有利地,启动子具有较短序列,优选SEQ.ID.No.1位置342和720之间所示的序列。

    本发明序列变体可以插入到核酸分子中,这样其与核苷酸序列操作连接。该序列变体作为基因表达的启动子具有有利的性质,比WO94/14965所公开的xlnB启动子更强,对于各种各样的包括同源核苷酸序列编码的多肽例如木聚糖酶B的表达是有用的。

    本发明在生产用于食料,饲料和饮料工业中的物质中是特别有用的。优选的宿主曲霉是这些行业中普遍的生产宿主,原因在上文中述及。

    此外本发明提供提高自启动子的核苷酸序列转录水平的方法,包括插入至少一个元件CGGCAGGGTCTC异源拷贝步骤,使得其与启动子操作连接,并且引起核苷酸序列转录。

    这里所使用的术语“核酸”包括天然核酸DNA和RNA,或者至具有天然核酸的一种性质例如编码蛋白质的能力或者与其它核酸分子优选天然核酸分子杂交的能力的合成的核酸类似物。本发明中所使用的优选的核酸是DNA。编码序列可以优选包括cDNA。

    本发明元件CGGCAGGGTCTC的关联物包括对于该序列的任何取代,变异,修饰,置换,缺失或增加一个(或多个)核苷酸,只要得到的核苷酸序列当与表达系统中的启动子操作连接时具有作为激活元件起作用能力。特别地,本发明涉及序列和/或结构和/或功能相对相同性所证明的序列CGGCAGGGTCTC的同系物,只要得到的核苷酸序列具有作为本发明激活元件起作用能力。关于序列的“同源性”,优选有和序列CGGCAGGGTCTC至少75%的序列同源性,更优选至少85%,更优选至少90%。更优选地,本发明元件具有对于序列CGGCAGGGTCTC的不多于1,2或3个核苷酸改变。更优选地,元件具有序列CGGCAGGGTCTC。

    形成本发明部分的序列也可以是互补序列形式。术语“互补”指本发明还包括可以分别与核苷酸序列或启动子序列的核苷酸序列杂交的核苷酸序列。

    本发明元件能加强自启动子的转录。意思是,在元件存在下转录效率提高。启动子可以保留其它影响因素,例如组织特异性或影响营养的转录调节,其可以如此调控自启动子的转录,使得加上本发明元件看不到任何影响。但是,这样的进一步影响无效时,元件将引起自启动子的转录水平的提高。

    术语“构建体”是术语如“共轭物”,“盒”和“杂种分子”的同义词。。构建物可以根据本领域公知的技术通过直接或间接连接核酸序列来制备。间接连接的例子是提供例如内含子序列合适的间隔臂基,例如Shl-内含子或ADH内含子,间隔启动子和本发明核苷酸序列。关于涉及本发明的术语“融合的”也一样包括直接或间接连接。

    术语“载体”包括表达载体和转化载体。

    术语“表达载体”指能体内或体外表达插入到载体中的编码序列编码的多肽基因产物的构建体。

    术语“转化载体”指能从一个物种转移到另一个的构建体--例如从大肠杆菌质粒转移到丝状真菌,优选曲霉属。

    这里所使用的,“载体”指用来将异源DNA引入到细胞中用于其表达或复制的分立的元件。这样的载体的选择和使用是本领域技术人员公知的。很多载体是可得的,合适的载体的选择将取决于载体的使用,即其是用于DNA扩增还是用于表达,要插入到载体中的DNA的大小,和要用该载体转化的宿主细胞。各载体根据其功能和其相匹配的宿主细胞包含不同的组成。载体组成一般包括但不限于下面一项或多项:复制起始点,一个或多个标记基因,增强子元件,启动子,转录终止序列和信号序列。

    表达和克隆载体两者一般含有至少一个使载体在一个或多个选择的宿主细胞中复制的核酸序列。一般在克隆载体中该序列是能使该载体独立地宿主染色体DNA复制的序列,并且包括复制起始点或自主复制序列。这样的序列对于各种各样的细菌,酵母和其它真菌是公知的。自质粒pBR322的复制起始点适合大多数革兰氏阴性细菌,2μ质粒起始点适合细菌,真菌起始点可以在丝状真菌中使用,例如ama1复制子(Gems等,(1991),基因98:61-67)。

    大多数表达载体是穿梭载体,即它们能至少在一类有机体中复制但是能转染到另一种有机体中用于表达。例如载体在大肠杆菌中克隆后相同的载体被转染到酵母或其它真菌细胞中,尽管它不能独立地复制宿主细胞染色体。DNA也可以通过插入到宿主基因组中而复制。

    有利地,表达和克隆载体可以包含选择基因,也称之为可选择的标记,其使选择其转移在其中的例如丝状真菌优选曲霉属例如黑色曲霉中的基因构建体。该基因可以编码在选择培养基中生长的转化的宿主细胞的存活或生长所必需的蛋白质。没有被包含选择基因的载体转化的宿主细胞在培养基中不存活。典型的选择基因编码授予对抗生素和其它毒素例如氨苄青霉素,新霉素,甲氨蝶呤或四环素抗性,补充营养缺陷型缺陷,或者补充从培养基中不能获得的关键的营养物。

    关于适合于酵母的选择性基因标记,可以使用任何有利于选择由于标记基因的表型表达的转化物的标记基因。酵母的合适的标记基因是那些例如授予对抗生素G418,潮霉素或博来霉素抗性,或者提供营养缺陷型酵母突变体中原养型,例如URA3,LEU2,LYS2,TRP1或HIS3基因的那些种类。

    因为载体的复制在大肠杆菌中容易进行,因此有利地包括大肠杆菌基因标记和大肠杆菌复制起始点。这些是从大肠杆菌质粒获得的,例如pBR322,Bluescript载体或pUC质粒,例如pUC18或pUC19,其包含大肠杆菌复制起始点和带来抗生素例如氨苄青霉素抗性的大肠杆菌基因标记。

    此外,本发明载体优选包括为了促进多肽自宿主分泌的分泌序列,这样使得其将产生可溶性天然肽而不在内含体中。

    构建本发明载体使用常规连接技术。分离的质粒或DNA片段裂解,加尾,并且再连接成期望产生所需质粒的形式。如果期望,以已知的方式进行证明构建的质粒中正确的序列的分析。构建表达载体,制备体外转录的,将DNA引入到宿主细胞中,和进行评价表达和功能的分析的合适的方法对于本领域技术人员来说是公知的。基因存在,扩增和/或表达可以直接在样品中测定,例如使用以这里所提供的序列为基础的合适的标记探针通过DNA印迹,定量测定mRNA转录的RNA印迹,斑点印迹(DNA或RNA分析),或者原位杂交进行,本领域技术人员将容易判断如果期望将怎样改变这些方法。

    术语“宿主细胞”,如在这里所使用的,包括任何细胞类型,不管是单细胞有机体,来自多细胞有机体并且置于组织培养基中的细胞,还是作为多细胞有机体部分而存在的细胞,其容易用本发明核酸构建体转化。这样的宿主细胞,例如酵母和高等真核细胞,真菌细胞和植物细胞可以用来复制DNA和产生本发明中所使用的核苷酸序列编码的多肽。原核细胞适合复制DNA,并且包括真细菌,例如革兰氏阴性或革兰氏阳性有机体,例如大肠杆菌,例如大肠杆菌K-12菌株,DH5α和HB101或杆菌。适合复制核酸和表达在本发明载体上编码的编码序列的宿主细胞包括真核微生物例如丝状真菌,例如曲霉或酵母,例如糖酵母。

    特别优选的是来自丝状真菌优选曲霉例如黑色曲霉,泡盛曲霉和塔宾曲霉的细胞。

    DNA可以使用本领域公知的方法稳定地插入到细胞中,或者可以瞬时表达。稳定转染的细胞可以通过用带有选择性标记基因的表达载体转染细胞,并且使转染的细胞在表达标记基因的细胞选择条件下生长来制得。为了制备瞬时转染物,用报道基因转染细胞来监测转染效率。

    宿主细胞被用本发明表达或克隆载体转染或者优选地转化,并且在根据需要而改变的用于诱导表达,选择转化物或者扩增编码期望的序列的基因的常规营养培养基中培养。异源DNA可以通过任何本领域公知的方法引入到宿主细胞中,例如通过磷酸钙共沉淀技术或者通过电穿孔用编码异源DNA的载体转染。多种转染方法对于本领域技术人员来说是公知的。当宿主细胞中存在任何该载体操作的指征时一般识别为成功的转染。用适合所使用的特定宿主细胞的标准技术实现转化。

    克隆的DNA插入到合适的表达载体中,用质粒载体或各自编码一个或多个分离的基因的质粒载体的组合或者用线性DNA转染真核细胞,和选择转染细胞的方法是本领域公知的(参见例如Sambrook等(1989),分子克隆:实验室手册,第二版,冷泉港实验室出版),具体在其中15和16页提出。

    转染或转化的细胞使用本领域公知的培养基和培养方法,优选在异源核苷酸序列编码的多肽被表达的条件下培养。合适的培养基的组成对于本领域技术人员是公知的,这样其可以容易地制备,合适的培养基也可以购买到。

    本发明涉及的术语“有机体”包括能在本发明启动子控制下表达核苷酸序列的任何有机体。其中本发明分子被表达的有机体优选是真菌宿主。

    优选地有机体是丝状真菌,优选曲霉属,更优选黑色曲霉,泡盛曲霉或塔宾曲霉。

    其它优选的有机体包括米曲霉(Aspergillus oryzae),Trichoderma reesei,T.viride和T.longibrachiatum的任何之一种。

    本发明涉及的术语“转基因有机体”包括任何包含本发明启动子和编码异源核苷酸序列的核苷酸序列的有机体,其中本发明核苷酸序列可以在有机体内表达。优选地,启动子和核苷酸序列插入到有机体的基因组中。

    术语“转基因有机体”不包括当其在也是在其天然环境中的天然启动子控制下的其天然环境下的本发明天然核苷酸序列。另外,本发明不包括当其在其天然环境中和当其被也是在其天然环境中的天然核苷酸序列表达和当核苷酸序列在也是在其天然环境中的天然启动子控制下时本发明天然酶。

    转化的细胞或有机体可以用来制备可接受量的可容易从细胞或有机体回收的期望的化合物。

    术语“启动子”以本领域正常意义使用,例如基因表达的Jacob-Monod理论中RNA聚合酶结合位点。优选地,本发明中使用真菌启动子。与本发明相关可以使用任何合适的启动子,真菌源的优选诱导木聚糖的启动子是特别指明的。这里所使用的“核心”启动子在主要由TATA盒和转录起始位点构成的启动子中。

    真菌启动子是文献中公知的(例如,参见Gurr等,(1987)丝状真菌的核基因的结构和组织,In Kinghorn,J.R.(编著),真核微生物中的基因结构,IRL Press,Oxford,pp.93-139)。

    除了上文所描述的核苷酸序列外,本发明启动子另外包括确保或提高在合适的宿主中表达的特性。例如,这些特性可以是保守区例如TATA盒。一般发现TATA盒是转录起始位点30bp上游,并且相信涉及转录复合物的装配中。

    启动子甚至可以包含影响(例如保持,增强,降低)异源核苷酸序列表达水平的其它序列。例如,真菌启动子一般包含TATA盒和UAS(上游激活位点)。USA是对所研究的启动子的作用的激活调节物结合位点。确信本发明元件是USA。也可以包括启动子调节各方面所涉及的其它位点。

    根据本发明,本发明元件位于启动子上游。通过使转录激活水平最大化或者调节转录激活的水平的实验室试验,可以调整启动子和该元件之间的距离。

    关于本发明构建体的术语“异源核苷酸序列”指编码所感兴趣的多肽的任何序列,而不是正常下与使用的启动子相连的完全天然序列,或者能表达核酸的序列,例如能调节有机体代谢的调节RNA,例如反义RNA或核酶,或者tRNA或rRNA。相反,术语“核苷酸序列”包括正常下与使用的启动子相连的序列同源核苷酸序列。本发明包括使用同源和异源核苷酸序列。

    异源核苷酸序列可以是对于所研究的有机体(例如丝状真菌,优选曲霉属的,或者植物)是外来的或天然的任何核苷酸序列。术语“异源核苷酸序列”也包括例如通过插入,添加,缺失或改变而突变的同源核苷酸序列,这样其不再与天然同源核苷酸序列相同。

    异源核苷酸序列典型的例子包括编码改变代谢和分解代谢过程的蛋白质和酶的序列。异源核苷酸序列可以编码诱导或增加病原体抗性的分子。异源核苷酸序列可以是改变相关组织中存在的天然转录物的表达的反义构建体。异源核苷酸序列可以编码丝状真菌优选曲霉属的非天然蛋白质或者对动物或人有益的化合物。核苷酸序列编码的酶的例子包括果胶酶,果胶解聚酶,多聚半乳糖醛酸酶,果胶酯裂解酶,果胶裂解酶,己糖氧化酶,氧化还原酶,脂肪酶,葡聚糖裂解酶,鼠李糖半乳糖醛酸聚糖酶,半纤维素酶,内切-β-葡聚糖酶,阿拉伯糖酶或乙酰基酯转移酶或者它们的结合物,以及其反义序列。异源核苷酸序列可以是给予食物或作物营养价值的蛋白质。典型的例子包括能抑制抗营养因子生成的植物蛋白质和具有更多必需氨基酸成分(例如比非转基因植物更高的赖氨酸)的植物蛋白质。

    异源核苷酸序列可以编码可以在食品加工中使用的酶,例如凝乳酶,奇异果甜蛋白酶,α-半乳糖苷酶,葡聚糖酶或β-1,4-内切葡聚糖酶。

    异源核苷酸序列可以编码特殊的核苷酸序列的内含子,其中内含子可以是有义或反义取向。

    异源核苷酸序列可以是编码阿拉伯呋喃糖苷酶的核苷酸序列,阿拉伯呋喃糖苷酶是PCT专利申请PCT/EP96/01009(这里引作参考)的主题。异源核苷酸序列可以是编码ADP-葡聚糖焦磷酸酶的任何核苷酸序列,ADP-葡聚糖焦磷酸酶是PCT专利申请PCT/EP94/01082(这里引作参考)的主题。异源核苷酸序列可以是编码α-葡聚糖裂解酶的任何核苷酸序列,α-葡聚糖裂解酶在PCT专利申请PCT/EP94/03397(这里引作参考)中描述。异源核苷酸序列可以是编码T.lanuginosus淀粉酶的任何核苷酸序列,这一点在PCT专利申请PCT/EP95/02607中描述,这里引作参考。异源核苷酸序列可以是编码葡聚糖酶的任何核苷酸序列,葡聚糖酶是PCT专利申请PCT/EP96/01008(这里引作参考)的主题。异源核苷酸序列可以是这里所提出的木聚糖酶A或B。

    优选地,本发明启动子和核苷酸序列稳定保持在宿主细胞或转基因有机体中。为了举例,启动子和/或核苷酸序列可以在稳定的染色体外构建体保持在转基因有机体中。这对于转基因酵母或一些丝状真菌是优选的。或者,启动子和/或异源核苷酸序列(例如本发明的核苷酸序列)可以稳定地插入到转基因有机体基因组中。这对于一些转基因酵母是优选的,最优选丝状真菌。

    用于表达本发明核酸构建体和/或用于制备本发明异源多肽的优选的宿主有机体是曲霉属例如黑色曲霉的有机体。关于这一点,可以通过下面的技术制备本发明转基因曲霉:Rambosek,J.和Leach,J.1987(丝状真菌中的重组DNA:进展和展望(Recombinant DNAin filamentous fungi:Progress and Prospects),CRCCrit.Rev.Biotechnol.6:357-393),Davis R.W.1994(曲霉属中异源基因表达和蛋白质分泌(Heterologous gene express and proteinsecretion in Aspergillus):Martinelli S.D.,Kinghorn J.R.(编著)曲霉:工业微生物发展50年(Aspergillus:50years on:Progressin industrial microbiology),vol29,Elsevier Amsterdam1994,pp525-560),Ballance,D.J.1991(丝状真菌的转化系统和真菌基因结构综述(Transformation systems for Filamentous Fungiand an Overview of Fungal Gene structure):Leong,S.A.,BerkaR.M.(编著)分子工业真菌学。对于丝状真菌的系统和应用(MolecularIndustrial Mycology.Systems and Applications for FilamentousFungi),Marcel Dekker Inc.纽约1991,pp.1-29)和TurnerG.1994(用于遗传操作的载体(Vectors for genetic manipulation):Martinelli S.D.,Kinghorn J.R.(编著)曲霉:工业微生物发展50年(Aspergillus:50years on:Progress in industrialmicrobiology),vol29,Elsevier Amsterdam 1994,pp641-666)。  下面的说明提供产生本发明转基因曲霉的那些技术的总结。

    几乎一个世纪以来,丝状真菌被广泛用于生产有机化合物和酶的多类型工业中。例如传统的日本koji和大豆发酵都使用了曲霉。在本世纪,黑色曲霉用于生产有机酸特别是柠檬酸和用于生产在工业中使用的各种各样的酶。

    丝状真菌被如此广泛地用于工业有两个主要的原因。第一,丝状真菌能产生大量胞外产物,例如酶和有机化合物例如抗生素或有机酸。第二,丝状真菌可以在非常廉价的基质例如谷物,糠,甜菜肉等上面生长。相同的原因使丝状真菌引起兴趣的有机体成为用于本发明异源表达的宿主。

    为了制备转基因曲霉,通过将异源核苷酸序列(例如编码淀粉酶的核苷酸序列)插入到为在丝状真菌中表达而设计的构建体中来制备表达构建体。

    已经开发出用于异源表达的几种类型构建体。这些构建体包含在真菌中有活性的本发明启动子。该异源核苷酸序列可以与指导分泌异源核苷酸序列编码蛋白的信号序列融合。通常使用真菌源信号序列。也可以使用在真菌中有活性的终止子。

    在真菌中已经开发出另一种类型的表达系统,其中异源核苷酸序列与编码稳定蛋白质的真菌基因融合。这可以稳定编码所感兴趣的蛋白质的异源核苷酸序列编码的蛋白质(POI)。在这样的系统中,可以在真菌蛋白质和异源核苷酸序列编码的蛋白质之间引入为特异蛋白酶识别的裂解位点,使得产生的融合蛋白可以在该位置被特异蛋白酶裂解,从而释放出异源核苷酸序列编码的蛋白质。为了举例人们可以引入被至少在一些曲霉中发现的类KEX-2肽酶识别的位点(Broekhuijsen等,1993,生物技术杂志31,135-145)。这样的融合导致体内裂解,产生表达产物的保护作用和不是更大的融合蛋白(参见US5679543)。

    已经对几种编码细菌,真菌,脊椎动物和植物蛋白基因报道过在曲霉中的异源表达。如果本发明核苷酸序列(或者另一种异源核苷酸序列)不与信号序列融合,则蛋白质可以在细胞内贮存。这样的蛋白质可以在细胞质中蓄积并且一般不是糖基化的,这对一些细菌蛋白质有益。如果本发明核苷酸序列(或者另一种异源核苷酸序列)装备有信号序列,则蛋白质将在细胞外蓄积。

    关于产物稳定性和宿主株修饰,当被分泌到真菌培养液中时,一些异源蛋白质不是非常稳定的。大多数真菌产生几种细胞外蛋白酶,降解异源蛋白质。为了避免这个问题,已经使用了具有降低蛋白酶产生作用的特异真菌菌株作为异源生产的宿主。

    对于转化丝状真菌,对于很多丝状真菌已经开发出了几种转化方法(Ballance,D.J.1991(丝状真菌的转化系统和真菌基因结构综述(Transformation systems for Filamentous Fungi and Overview ofFungal Gene structure):Leong,S.A.Berka R.M.(编著)分子工业微生物学.系统和丝状真菌的应用(Molecular IndustrialMycology.Systems and Application for FilamentousFungi),Marcel Dekker Inc.纽约,1991,pp.1-29)。其中很多方法以制备原生质体和用PEG和Ca2+离子将DNA引入到原生质体为基础。然后再生转化的原生质体并且用各种选择性标记选择转化的真菌。用于转化的标记中有多种营养缺陷型标记例如argB,trpC,niaD和pyrG,抗生素抗性标记例如benomyl抗性,潮霉素抗性和phleomycin抗性。通常使用的转化标记是构巢曲霉(A.nidulans)的amdS基因,其以高拷贝数使真菌以酰胺作为唯一氮源下生长。

    在另一个实施方案中,转基因有机体可以是酵母。对于这一点,酵母已经被广泛用作异源基因表达的载体。啤酒糖酵母菌种有长的工业应用历史,包括其用于异源基因表达。Goodey等(1987,酵母生物技术,D.R.Berry等编著,pp.401-429 Allen and Vnwin,London)和King等(1989,酵母分子和细胞生物学,E.F.Walton和G.T.Yarranton编著,pp.107-133,Blackie,Glasgow)已经综述了在啤酒糖酵母中的异源基因表达。

    啤酒糖酵母很好地适合异源基因表达有几种原因。首先其对人是非病原性而且其不能产生某些内毒素。第二,其对于各种目的商业开发有几个世纪的安全使用历史。这使得公众广泛接受。第三,对于微生物的广泛的商业应用和研究集累了大量的关于啤酒糖酵母的遗传和生理以及大规模发酵性质知识。

    E Hinchcliffe E Kenny给出了异源基因在啤酒糖酵母中的表达和基因产物分泌的原理的综述(1993,“作为异源基因表达载体的酵母”,酵母,Vol5,Anthony H Rose和J Stuart Harrison编著,第二版,科学出版有限公司)。

    几种类型的酵母载体是可购得的,包括需要与保持它们的宿主基因组重组的整合载体,和自主复制质粒载体。

    为了制备转基因酵母,通过将包括本发明DNA构建体的核苷酸序列插入到设计在酵母中表达的构建体中来制备表达构建体。已经研究出几种类型的用于异源表达的构建体,其合适的组成部分在下文将讨论。

    已经研究出转化酵母的几种转化方法。例如本发明转基因糖酵母可以通过下面的技术制备:Hinden等(1978,美国国家科学院院刊75,1929);Beggs J.D.(1978,自然,伦敦,275,104);和Ito,H等(1983,细菌学杂志153,163-168)。

    在序列表中给出了下面的序列:

    SEQ.ID.No.1     塔宾曲霉木聚糖酶B

    SEQ.ID.No.2     塔宾曲霉木聚糖酶B氨基酸序列

    SEQ.ID.No.3     塔宾曲霉木聚糖酶B启动子区

    SEQ.ID.No.4     木聚糖酶A基因

    SEQ.ID.No.5     amyA基因

    SEQ.ID.No.6     pPR70完全的核苷酸序列

    SEQ.ID.No.7-15  合成的DNA寡核苷酸引物。

    保藏数据

    根据布达佩斯条约在NCIMB,23St.Machar Drive,Aberdeen,AB21RY,Scotland进行下面与本发明相关的保藏:

    大肠杆菌DH5αpXylA

    保藏号No.40861         保藏日1997年2月20日

    大肠杆菌DH5αpXylB

    保藏号No.40862     保藏日1997年2月20日

    大肠杆菌DH5α pxlnB-AmyA

    保藏号No.40858     保藏日1997年1月31日

    本发明下面的描述只是为了详细描述的目的,参照了下面的实施例,其中参考下面的附图。

    图1给出质粒pxlnB-AmyA,其包括xlnB启动子,amyA基因和xlnA终止子,和氨苄青霉素抗性选择标记。

    图2给出用pxlnB-AmyA转化的黑色曲霉培养液的mono-Q层析谱。

    图3给出质粒LMJterm。

    图4给出质粒pPR66。

    图5给出质粒pPR67。

    图6给出质粒pPR68。

    图7给出质粒pPR69。

    图8给出质粒pPR70。

    图9给出由pPR70和pPR70-6转化的黑色曲霉产生的产物的银染色凝胶图谱。

    图10给出用xlnB-xlnA表达构建体转化的塔宾曲霉的培养结果的图示。

    实施例1:制备xlnB-amyA-xlnA构建体

    根据已经建立的技术进行基础分子操作,这些技术描述于:J.Sambrook等,分子克隆,实验室手册,第二版,冷泉港出版社,纽约1989。根据厂商提供的说明使用限制性内切酶(New EnglandBiolabs Ltd.and Amersham Ltd.)。

    用BamHI和XbaI消化含有xlnA基因(SEQ.ID.No.4)的pXYLA,并且含有xlnA终止子的1081bp片段被纯化并且插入到用BamHI-XbaI消化的pBluescriptIISK+载体中。得到的载体称之为pPR15。

    包含整个xlnB基因(SEQ.ID.No.1)的pXYLB用NspI消化并且用Mung Bean核酸酶钝化末端。通过在65℃热处理15分钟灭活核酸酶,此后用ClaI消化DNA,并且纯化包含xlnB启动子的377bp片段。

    pPR15用EcoRI消化并且用Klenow聚合酶将后突出末端完全填在其中。该酶在75℃加热灭活15分钟,并且载体用ClaI消化。纯化的启动子插入到消化的载体中,获得得到的质粒pPR42。

    编码T.lanuginosus的α-淀粉酶,包含amyA(SEQ.ID.No.5)的pAMYA-3(参见PCT/EP95/02607;保藏登记号No.NCIMB40657)用ScaI和Ecl136II消化,并且纯化包含完全amyA基因的2106p片段并且插入用SmaI消化的和用小牛肠磷酸酶去磷酸化的pPR42中。通过限制酶切分析鉴定正确方向基因的转化并且得到的质粒命名为pxlnB-AmyA(图1)。

    xlnB启动子对应于SEQ.ID.No.1中序列的核苷酸342-720。

    amyA基因对应于SEQ.ID.No.5中序列的核苷酸406-2512。

    xlnA终止子对应于SEQ.ID.No.4中序列的核苷酸1883-2962。

    实施例2:泡盛曲霉中构建体的转化

    通过下面的方法,使用和潮霉素抗性标记(Werners,K.等(1987),分子和一般遗传学(209,71-77))的共转化作用将xlnB-amyA-xlnA构建体转化到泡盛曲霉中,泡盛曲霉一般以保藏号11358从ATCC获得(也参见WO96/29415)。

    泡盛曲霉的转化方法以下面的技术为基础:Buxton.F.P.,GwynneD.I.,Dayis,R.W.1985(使用构巢曲霉的argB基因转化黑色曲霉,基因37:207-214),Daboussi,M.J.,Djeballi,A.,Gerlinger,C.,Blaiseau,P.L.Cassan,Lebrun M.H.,Parisot,D.,Brygoo,Y.,1989(用构巢曲霉的硝酸还原酶基因转化7个物种的丝状真菌,当代遗传学15:453-456)和Punt,P.J.,van den Hondel,C.A.M.J.J.1992(以潮霉素B和腐草霉素抗性基因为基础的丝状真菌的转化,酶学方法216:447-457)。

    为了纯化原生质,来自新形成孢子N400(CBS120.49,Centraalbureau voor Schimmelcultures,Baarn)(7天生长期)一个PDA(马铃薯葡萄糖琼脂--购自Difco Lab.Detroit)平板的孢子在5-10ml水中冲洗。用该孢子悬浮液接种有200ml马铃薯葡萄糖培养液(Difco0549-17-9,Difco Lab.Detroit)的摇瓶,并且在30℃振荡(250rpm)16-20小时。

    用Miracloth(Nylon筛)收集菌丝体并且将3-4g湿的菌丝体转移到灭菌培养皿,培养皿中有10mlSTC(1.2M山梨糖醇,10mM TrisHClpH7.5,50mM氯化钙)和75mg裂解酶(Sigma L-2265)和4500单位溶细胞酶(Sigma L-8012)。

    菌丝体与酶温育直到菌丝体降解并释放原生质。然后降解的菌丝体通过灭菌60μm目过滤器过滤。通过在甩平式转头中以2000rpm离心10分钟收获原生质。弃除上清液,将沉积物溶解于8ml 1.5M硫酸镁中后以3000rpm离心10分钟。

    用转移吸移管将含有原生质的上层带转移到另一个试管中并且加入2ml0.6M氯化钾。小心在该溶液顶部加入5ml 30%蔗糖,试管以3000rpm离心15分钟。

    将存在于界面带中的原生质转移到新的试管中并且用1体积STC稀释。该溶液以3000rpm离心10分钟。沉积物用STC洗涤两次,最后加溶在1mlSTC中。计数原生质,并且最后在转化前浓缩。

    对于转化,100μl原生质溶液(106-107原生质)与含有5-10μgDNA的10μlDNA溶液混合并且在室温下温育25分钟。然后以200μl,200μl和800μl份小心加入60%PEG-4000。混合物在室温下温育20分钟。向混合物中加入3mlSTC并小心混合。混合物以3000rpm离心10分钟。

    取出上清液,原生质溶在剩下的上清液中。加入3-5ml顶层琼脂糖并且将原生质快速铺在选择平板上。接着挑出转化的菌落并且如下所述培养。

    实施例3:转化物分析

    潮霉素抗性转化物在含有基础无机盐,0.5%葡萄糖,0.5%燕麦斯匹尔托小麦木聚糖和50mM MES pH6.0的基本培养基中在30℃以250rpm振荡培养。培养5天后用Ceralpha底物(MegaZyme,澳大利亚)对培养样品分析α-淀粉酶。将一小瓶Ceralpha溶解于10ml水得到可使用的底物。分析在微量滴定孔中进行。在每个孔中混合175μl缓冲液(50mM柠檬酸缓冲液pH6.2,5mMCaCl2·2H2O),251μl样品(如果需要在缓冲液中稀释)和50μl Ceralpha底物,反应混合物在37℃温育15分钟。通过将100μl反应物转移到新的微量滴定孔中150μl 1%Trizma碱中终止反应。在Elisa读数计中根据测定的OD420的提高值测定活性。

    最好的产生的转化物在摇瓶中在由2%甜菜果肉,2%小麦麸,0.3%NaNO3,100mM MES pH5.5组成的培养基中生长。培养物在以250rpm振荡下在30℃生长5-7天。

    测定活性,并且令人惊奇地获得多于1g/l T.lanuginosusα-淀粉酶。图2给出了Mono-Q层析谱,并且如下进行。将其中生长转化物有机体的培养液的样品通过0.45μm过滤器过滤。1.5ml滤液用到用10mM三乙醇胺pH7.0(缓冲液A)平衡的PD-10柱子(Pharmacia,Sweden)上,并且用2.5ml缓冲液A洗脱。1ml滤液装载到用缓冲液A平衡的Mono-QHR5/5柱子(Pharmacia)上。柱子用缓冲液A洗脱直到基线稳定。然后用缓冲液A中0-0.5M NaCl盐梯度洗脱与柱子结合的蛋白质。洗脱的蛋白质在OD280处检测。

    实施例4:构建包含xlnB启动子的表达载体

    如下构建用于xlnB启动子分析的载体。用KpnI消化通过将位于PCT/EP97/04415的SEQ.ID.No.16的2330和2823位置之间的egl B基因终止子片段(来自GB9617184.8,1998年2月15日公开)插入到pBluescript中构建的pBluescriptSKI I+(Stratagene)中包含真菌终止子的载体pLMJterm。用T4 DNA聚合酶去除突出端,并且重新连接下面的平端载体,得到质粒pPR66。

    用ClaI和NspI消化pXYLB,并且纯化包含xlnB启动子的382个核苷酸片段。该片段用T4 DNA聚合酶去除突出端,并且接着连接pPR66,用SmaI消化和用小牛肠磷酸酶脱磷酸。从转化物中纯化质粒和用XbaI消化来分离期望的其中xlnB启动子向终止子转录的质粒。分离这样的质粒并且命名为pPR67。该质粒是包含xlnB启动子和功能真菌终止子的表达载体。

    为了在表达载体中插入报道基因,用ScaI和Ecl136II消化pAMYA-1(WO96/01323),并且纯化包括amyA基因的2106核苷酸片段,如实施例1。用ClaI和EcoRI消化pPR67,用Klenow聚合酶平端,和用小牛肠磷酸酶脱磷酸。该纯化的包含amyA的片段连接用该方法处理的pPR67。通过用NcoI限制性酶切分析发现正确取向的amyA基因的重组质粒。该质粒命名为pPR68。

    pPR68是带有控制amyA表达α-淀粉酶的xlnB启动子的表达载体。在xlnB启动子中,单一的KpnI位点位于其中xlnB元件另外的拷贝可以插入的位置。

    接着,选择性标记基因pyrG插入到载体中。遗憾的是该基因包含KpnI位点,这意味着该启动子中KpnI位点不是单一的。因此pPR68的KpnI位点转化成SnaBI位点。用Acc65I(其识别和KpnI一样的位点,但是给出5’突出端而不是3’突出端)消化pPR68,并且用Klenow聚合酶补平各端。再连接该载体,并且KpnI位点转化SnaBI位点。该载体称之为pPR69。

    最后pyrG选择标记插入到质粒中。从pAB4-1(VanHartingsveldt等,分子基因遗传学(1987)206:71-75)纯化1517核苷酸XbaI-HindIII片段。为了钝平端头用Klenow聚合酶处理该片段。pPR69用BamHI消化并且用Klenow聚合酶处理。该纯化和修饰的片段连接到消化和处理过的载体中,分离称之为pPR70的重组载体。

    pPR70是期望的表达载体。其包含xlnB启动子控制下的报道基因amyA,单一的SnaBI位点一般位于以插入xlnB元件另外的拷贝该启动子中,最后包括了选择标记pyrG,其使整合该质粒和变体进入pyrG基因座,这使比较更可靠。pPR70的完全序列在SEQ.ID.No.6中给出。

    实施例5:构建包含xlnB启动子的衍生物的表达载体

    在Applied Biosystems392DNA/RNA合成仪上合成下面的寡核苷酸:

    有义CGGCAGGGTCTC  (SEQ.ID.No.7)

    反义GAGACCCTGCCG  (SEQ.ID.No.8)

    寡核苷酸退火:100pmol各寡核苷酸在试管中以20μl总体积混合。该试管在70℃加热2分钟并且使缓慢冷却到室温。退火的寡核苷酸在-20℃下贮存并且在使用时保持在冰上。

    5pmol退火的寡核苷酸与大约100ng用SnaBI消化的pPR70连接。连接后用SnaBI消化反应以避免pPR70没有插入而重连接。通过测序分析失去SnaBI位点的转化物。

    设计下面的引物用于测序:TCGACTGAGCTTTCCACTCAT(SEQ.ID.No.9)。该引物是要在ALF测序仪(Pharmacia)中测序使用的5’端标记的Cy5。该引物结合amyA基因(pPR70中位置5407-5427),并且从引物的测序从xlnB启动子读起。

    通过测序,鉴定了几个带有修饰数目xlnB拷贝的pPR70衍生物:

    pPR70    tacgtacctgccGAGACCCTGCCGAGACCCTGCCG

             aggccctaaatgt GAGACCCTGCCG tac(SEQ.ID.No.10)

    pPR70-6  tacGAGACCCTGCCG aggccctaaatgt GAGACCCTGCCG tac(SEQ.

             ID.No.11)

    pPR70-16 tacGAGACCCTGCCGAGACCCTGCCG aggccctaaatgt

             GAGACCCTGCCG tac(SEQ.ID.No.12)

    pPR70-3  tacGAGACCCTGCCG gtacctgcc GAGACCCTGCC

             GAGACCCTGCCG aggccctaaatgt GAGACCCTGCCG tac(SEQ.

             ID.No.13)

    pPR70-5  tac GAGACCCTGCCG GAGACCCTGCCG gtacctgcc

             GAGACCCTGCC GAGACCCTGCCG aggccctaaatgt

             GAGACCCTGCCG tac(SEQ.ID.No.14)  pPR70-4    tac GAGACCCTGCCG CGGCAGGGTCTC CGGCAGGGTCTC

             gtacctgcc GAGACCCTGCCGAGACCCTGCCG aggccctaaatgt

             GAGACCCTGCCG tac(SEQ.ID.No.15)

    小写字母代表xlnB元件之间的序列。大写字母是xlnB元件。注意由于测序引物位点的位置,序列从-链产生。表1中给出了相应于SEQ.IDs中所示序列的互补(+链)序列的序列对比。所有的序列自pPR70的SnaBI位点(位置5661)或者其中已经插入另外的元件相应的位点开始。在发现缺失的构建体中最可能的解释是插入了元件,接着在已经失去一些核苷酸的两个xlnB元件之间发生重组,产生发现的缺失。

    以下面方式描述变体:

    pPR70-6  缺失了xlnB元件以及该元件下连的9个核苷酸。只有两个元件保留在该质粒中。

    pPR70-16  缺失了xlnB元件下连的9个核苷酸。三个元件在该构建体中。

    pPR70-3  加上一个xlnB元件,使得四个xlnB元件存在于该构建体中。

    pPR70-5  加上两个xlnB元件,使得五个xlnB元件存在于该构建体中。

    pPR70-4  加上了三个元件,其中一个和天然xlnB元件相同取向,另外两个反向取向。

    实施例6:构建体在黑色曲霉中的转化

    通过下面的方法(也参见WO96/29415),将质粒pPR70及其衍生物转化到黑色曲霉AB6-4中,黑色曲霉AB6-4得自P.Punt博士,荷兰应用科学研究组织(TNO),营养与食品研究所,生物化学和基因技术,Zeist,荷兰。

    黑色曲霉的转化方法以下面的技术为基础:Buxton,F.P.,GwynneD.I.,Davi s,R.W.1985(使用构巢曲霉的argB基因转化黑色曲霉,基因37:107-214),Daboussi,M.J.,Djeballi,A.,Gerlinger,C.,Blaiseau,P.L.Cassan,Lebrun M.H.,Parisot,D.,Brygoo,Y.,1989(用构巢曲霉的硝酸还原酶基因转化7个物种的丝状真菌,当代遗传学15:453-456)和Punt,P.J.,van den Hondel,C.A.M.J.J.1992(以潮霉素B和腐草霉素抗性基因为基础的丝状真菌的转化,酶学方法216:447-457)。

    黑色曲霉AB6-4(pyrG,ΔglaA,fwnA)用作表达宿主。AB6-4在马铃薯葡萄糖琼脂(PDA,Difco Labs,Detroit)中生长5-7天直到形成分生孢子。用10mlST(0.8%氯化钠,0.05%Tween-20)从培养物中洗出分生孢子。用106个孢子/ml接种含有200ml富集培养基的500ml摇瓶中并且在振荡下在30℃生长20小时。

    收集菌丝体并且用1%氯化钠冲洗,大约1g湿重的菌丝体和20mlSMC(1.33M山梨糖醇,50mM氯化钙,20mM MES缓冲液,pH5.8)和150mg赖氨酸酶(Sigma no.L2265)一起转移到300ml摇瓶中并且在37℃下温育,直到释放原生质(1-3小时)。

    通过20ml针管中玻璃棉过滤纯化原生质。在过滤中,原生质通过玻璃棉过滤器,而菌丝体残余物留在过滤器中。表1pPR70和xlnB元件中的变体的序列比较。序列的开始是其中插入元件的SnaBI位点(5661)野生型     gta CGGCAGGGTCTC acatttagggcct CGGCAGGGTCTCGGCAGGGTCTC ggcaggtac                                gtapPR70-6    gta CGGCAGGGTCTC acatttagggcct CGGCAGGGTCTC                                                     gtapPR70-16   gta CGGCAGGGTCTC acatttagggcct CGGCAGGGTCTCGGCAGGGTCTC                                          gtapPR70-3    gta CGGCAGGGTCTC acatttagggcct CGGCAGGGTCTCGGCAGGGTCTC ggcaggtac CGGCAGGGTCTC                   gtapPR70-5    gta CGGCAGGGTCTC acatttagggcct CGGCAGGGTCTCGGCAGGGTCTC ggcaggtac CGGCAGGGTCTC CGGCAGGGTCTC      gtapPR70-4    gta CGGCAGGGTCTC acatttagggcct CGGCAGGGTCTCGGCAGGGTCTC ggcagg tac CGGCAGGGTCTC(GAGACCCTGCCG)2  gta

    含有原生质的酶溶液在Hettisch通用30F离心机中以2500rpm离心10分钟。然后将含有原生质的沉积物溶解于10mlSTC(1.33M山梨糖醇,50mM氯化钙,10mM Tris·HCl,pH7.5)并再次离心。重复洗涤。最后将原生质分散于1mlSTC中并计数。用STC将原生质悬浮液稀释到终浓度每毫升5×107原生质。

    为了转化原生质,100μl原生质悬浮液与1-10μg质粒DNA混合并且在室温下温育25分钟。加入200,200和850μlPEG缓冲液(60%PEG-4000,10mM Tris·HCl,50mM氯化钙)等份,并且每次加入后小心混合混合物。然后混合物在室温下温育20分钟。

    然后用8mlSTC冲洗原生质2-3次,最后分散于大约0.5mlSTC中。

    将冷却到46℃与选择板(参见下文)相同配方制备只是使用0.6%琼脂糖代替琼脂的4ml融化的顶层琼脂糖加入到0.5ml该悬浮液中,将混合物立即倒入用于选择转化物的选择板上。

    在30℃温育4-6天后转化物形成并且在基础板上再培养。

    以下面的方法制备富集培养基:

    每升:

    100ml基础盐溶液

    1ml痕量元素溶液(Vishniak’s溶液:Vishniac,W.和SanterM.(1957)The Thiobaccilli.Bacteriol.Rev.21:195-213)

    10ml 1M硫酸铵

    高压灭菌后,将200ml转移到500ml灭菌摇瓶中并且在灭菌条件下加入20ml20%葡萄糖,20ml2%酪蛋白水解物和10ml5%酵母提取液。

    选择板每升:

    100ml 基础盐溶液

    1ml痕量元素溶液(Vishniak’s溶液)

    10ml 1M硫酸铵

    219g 山梨糖醇(=1.2mol)

    20g葡萄糖(当存在山梨糖醇时可以省略)

    20g琼脂

    该溶液在120℃高压灭菌20分钟,冷却到60℃并且倒入培养皿中。

    以相同的方法但是没有山梨糖醇来制备基础板。

    基础盐溶液,每升:

    5g氯化钾

    5g七水硫酸镁

    15g磷酸二氢钠

    1g氯化钙实施例7:测定整合基因座和拷贝数

    通过下面的方法从转化物提取全部的DNA:

    收集大约0.5g菌丝体并转移到Eppendorf试管。加入200μl玻璃珠(直径1mm)和0.5ml抽提缓冲液(100mM Tris·HCl,pH8.0,50mM乙二胺四乙酸二钠(EDTA),500mM氯化钠,1mM二硫代苏糖醇),并且菌丝体在Mini Bead Beater(Biospec Inc.)中匀浆30秒。

    加入50μl 20%SDS(十二烷基硫酸钠),试管在65℃温育10分钟。

    加入100μl5M KAc(根据Sambrook等制备),混合物在冰上温育10分钟。

    以15000g离心10分钟后,将900μl上清液转移到含有550μl异丙醇的新的试管中,并且通过在冰上保温10分钟沉淀DNA。

    通过以15000g离心10分钟收集DNA,并且重新溶解于200μlTE(10mM Tris·HCl,pH8.0,1mM EDTA)中。

    溶液使用用TE平衡过的200μl苯酚/氯仿(1∶1)抽提一次,并且通过加入20μl 3M NaAc pH4.8和500μl乙醇来沉淀。

    通过以15000g离心10分钟收集DNA,用70%乙醇洗涤和干燥。

    最后DNA再次溶解于50μl TE。DNA印迹

    大约5μg各DNA制剂用总体积100μl的EcoRI消化4小时。重新沉淀DNA并溶解于20μl TE。

    消化的样品用1×TBE为电泳缓冲液在1%琼脂糖凝胶上电泳。

    作为分子量标记,使用35S DNA商售分子量标记(22Kb-0.06Kb,购自Amersham)。

    凝胶电泳后,根据生产商说明,将DNA脱嘌呤,变性和转移到Hybond-N杂交膜(Amersham)。转移后通过UV交联固定DNA。

    通过用NcoI消化pPR70和纯化大约2000bp片段来制备杂交探针。

    该纯化的片段使用Ready-To-Go标记试剂盒(Pharmacia)使用脱氧胞苷-5’(α-32P)-三磷酸,三乙基铵盐--3000Ci/mmol(Amersham)标记。

    根据杂交膜的生产商的说明以高度严格性进行杂交,使用65℃的冲洗温度,接着下面的洗涤2×SSC,0.1%SDS,两次,15分钟,1×SSC,1×SSC,0.1%SDS15分钟和1×SSC,0.1%SDS10分钟。膜曝光过夜。

    在6000和1000bp片段能杂交的转化物在pyrG基因座含有单一拷贝整合的质粒,这些转化物在下面的试验中使用。

    弃除杂交的其它组合的转化物。实施例8:单一拷贝转化物的生长试验

    选择的转化物在300ml摇瓶中在100ml下面的培养基中生长:

    每升:

    100ml  基础盐溶液

    1ml    痕量元素溶液(Vishniak’s溶液)

    10ml   1M硫酸铵

    14.7g  柠檬酸三钠

    高压灭菌后,在无菌条件下加入100ml20%木聚糖和100ml2%酪蛋白水解产物。对于AB6-4’尿苷需要,向对照瓶中加入10ml 100mM尿苷,满足转化物中的载体需求。

    培养瓶接种每毫升105个孢子,并且在30℃在定轨摇床中温育。

    64小时后如下分析上清液的α-淀粉酶活性。

    在微量滴定板中测定α-淀粉酶活性。每个孔中175μl缓冲液(50mM柠檬酸盐缓冲液,pH6.5,5mM氯化钙)与25μl样品混合。通过向孔中加入50μl Ceralpha底物(MegaZyme,Canberra,澳大利亚)开始反应。平板在37℃温育。15和30分钟后,将100μl反应液转移到含有150μl终止缓冲液(1%trizma碱)新孔中。

    该底物是由七聚麦芽糖组成的显色底物,其中硝苯基偶联还原端,非还原端被另一种基团封闭。通过消化内部α-1,4键,底物中所包括的α葡萄糖苷酶降解现在未封闭的底物并释放出黄色化合物对-硝基苯酚。

    在Elisa读数仪中在波长405nm处测定活性。以15分钟内的吸收值计算活性。

    得到下面的结果:

    表2

                  α-淀粉酶活性

                  实验1      实验2      平均值  黑色曲霉AB6-4   0.137      0.097      0.117AB6-4∷pPR70      2.816      2.909      2.863AB6-4∷pPR70-6    0.440      0.273      0.356AB6-4∷pPR70-16   2.725      2.907      2.816AB6-4∷pPR70-3    1.005      0.749      0.877AB6-4∷pPR70-5    0.872      —                 0.872AB6-4∷pPR70-4    0.307      0.159      0.233

    这些结果表明xlnB元件最佳数目是3。缺失一个元件活性降低6倍。当加上更多元件时,活性依次降低。

    实施例9:含pPR70和pPR70-6的黑色曲霉AB6-4转化物的生长

    根据实施例8测定的未转化的宿主AB6-4和带有整合到其中的单一拷贝pPR70和pPR70-6的转化物在300ml摇瓶中在100ml下面的培养基中生长:每升:

    100ml  基础盐溶液

    1ml    痕量元素溶液(Vishniak’s溶液)

    10ml   1M硫酸铵

    14.7g  柠檬酸三钠

    高压灭菌后,在无菌条件下加入100ml20%木聚糖和100ml2%酪蛋白水解产物。向含有未转化宿主的培养瓶中加入10mM尿苷。

    培养瓶接种每毫升105个孢子,并且在30℃在定轨摇床中温育。64小时后根据实施例6分析上清液的α-淀粉酶活性,并且发现转化的真菌的培养瓶中有高的α-淀粉酶活性,而在含有未转化宿主的培养瓶中发现没有活性。

    为了目测结果,根据生产商说明将5和20μl培养液装载到预制12%Tris-甘氨酸凝胶(NOVEX,San Diego,CA)上。作为分子量标记,使用商售低分子量标记14.4-94KD(Pharmacia)。

    该凝胶经银染色。在转化的宿主中,可以见到非常弱的带。在转化物中除了未转化宿主中所见的该弱带外,转化的宿主中见到54KD处出现的强带,其相应于Thermomyces lanuginosusα-淀粉酶的迁移率。在pPR70-6中,该带的强度减弱,几乎看不到(参见图9)。

    银染色方法:

    --电泳后,该凝胶在50%乙醇,12%乙酸,0.05%37%甲醛中浸渍1小时或更长时间来固定蛋白质。

    --该凝胶在50%乙醇中冲洗三次20分钟。

    --在0.2g/l Na2SO3·5H2O中浸渍1分钟。

    --在水中冲洗三次20秒。

    --在2g/l AgNO3,750μl 37%甲醛中浸渍20分钟。

    --在水中冲洗两次20秒。

    --在(每升:60g碳酸钠,500μl 37%甲醛,20ml 0.2g/lNa2S2O3·5H2O)中显色直到泳带呈现清淅。

    --凝胶在水中冲洗两次2分钟。

    --通过将凝胶浸在50%乙醇,12%乙酸中10分钟终止反应。

    --凝胶在50%乙醇中冲洗20分钟或更长时间。

    --在3%甘油,1%乙酸中浸渍2小时或更长时间。然后对凝胶照相或者在凝胶干燥器中干燥用于长期贮存。实施例10:xlnB启动子控制下木聚糖酶A的表达

    在木聚糖酶A结构基因和终止子的前方插入包含木聚糖酶B启动子的400bpPCR片段。该构建体用来转化超量生产木聚糖酶的塔宾曲霉菌株6M179。如实施例2的方法,在共转化试验中潮霉素基因用作选择标记。通过使用0.25%刚果红平板测定来筛选共232个转化物。具有大的晕环直径的转化物在小规模液体培养基中生长并且测定培养物滤液中木聚糖酶活性。48小时诱导后,最好的转化物(T112-1-27)与未转化的6M 179相比,表现出木聚糖酶水平增加1.8倍。获得高水平木聚糖酶A表达的生长/诱导试验

    如下最好的转化物(T112-1-27)在大规模发酵中生长:来自转化物和对照6M 179的孢子在1升含有25g fibrex610,25g小麦麸和1.4g硫酸铵的培养基中生长7天。培养基双份在两个不同的温度下(34℃和37℃)以200rpm和初始pH3.57生长。在第4,5,6和7天收集培养物滤液样品。使第6天的样品进行使用MonoQ离子交换色谱,观察到明显的木聚糖酶A峰。色谱表明当与6M 179相比较时,来自含有木聚糖酶B启动子-木聚糖酶A构建体的转化物的木聚糖酶A峰增大了30%。对样品分析木聚糖酶活性,以GPU/ml表示,结果总结在下面的表3和图10中。结果证明木聚糖酶A产量提高了40%左右。

                              表3 培养物温度GPU/ml第4天GPU/ml第5天GPU/ml第6天GPU/ml第7天 6M179 34℃ 2603 3028 3261 3385 T112-1-27 34℃ 2966 4244 5445 5547 6M179 37℃ 1475 1560 1360 1626 T112-1-27 37℃ 1984 2698 3385 3289

                           序列表(1)一般信息:  (i)申请人:

    (A)姓名:Danisco A/S

    (B)街道:Langebogade 1.P.O.Box17

    (C)城市:哥本哈根

    (E)国家:Denmark丹麦

    (F)邮编(ZIP):DK-1001  (ii)发明题目:表达元件  (iii)序列数:15  (iv)计算机可读形式:

    (A)介质类型:Floppy盘

    (B)计算机:IBM PC兼容

    (C)操作系统:PC-DOS/MS-DOS

    (D)软盘:Patent In Release#1.0,Version#1.30(EPO)(2)SEQ ID NO:1的信息:  (i)序列特征:

    (A)长度:2055个碱基对

    (B)类型:核酸

    (C)链数:双链

    (D)拓扑学:线性  (ii)分子类型:DNA(基因组)  (iii)假拟结构:无  (iv)反义:无  (vi)来源:

    (A)有机体:塔宾曲霉(Aspergillus tubingensis)  (ix)特征:

    (A)名词/关键词:外显子

    (B)位置:721..998  (ix)特征:

    (A)名词/关键词:内含子

    (B)位置:999..1062  (ix)特征:

    (A)名词/关键词:外显子

    (B)位置:1063..1462  (ix)特征:

    (A)名词/关键词:CDS

    (B)位置:接合(721..998,1063..1462)  (xi)序列描述:SEQ ID NO:1:AATTGGAGCT CGACTTTACG TACGATGATA AGTAGTGATA GTATGATCCT CAATTTAAC      60GCGGCGGTGG CACTCTGCTA AGTCACTAAC GGCAGGAGAT ACACCCCTAA GTTAGCACAC    120GCTAGCATTT TCCTTCCTAA CTAGATACAG GCAGTATATC TCCGTCTAGA TTCCAGTAGG    180ATTATAATCA TTGCTAAAGT AGTATACAGT GTCCTAAATG GTTTCATATG CCATCCATGA    240TTGGATGAGA GTCAACCAAT GGGTCTTACG TAATGAACAA TAAAGCATTG AGCCAGGATG    300CATTCAACAC AGCAATAGAG TCAGGCTACG CAGGCGGATA TCGATGTTGA CATCAGCGAA    360TCTAGACCCT TGAAGCTCCA CTGCCTATTG TGAACAGGCG TTATAATTTC AGGATGTCTG    420CAGGACCTAG AAGGCGATTT AGGCTGTTTC GGGAGATCAA TTCGGCTTTC CAAATCGCCC    480ACGGATGCTC CACCGACTAG GCTAAACCCC ATCACAGCGA CGTTTCAGGT ACGGCAGGGT    540CTCACATTTA GGGCCTCGGC AGGGTCTCGG CAGGGTCTCG GCAGGTACCC TTCTTAATAA    600AGGCTAAATA GCTTCTGCAG AATCATGGGT ATATCAGGAA CGTCTCCTCC GTCGCTGCAG    660ACCTTCTCTT CTTACTCCGA GCCCCATTGA ATCAACTCCT CAAGCCAAGT CTCTTTCAAC    720ATG CTT ACC AAG AAC CTT CTC CTC TGC TTC GCC GCA GCT AAG GCT GTT      768Met Leu Thr Lys Asn Leu Leu Leu Cys Phe Ala Ala Ala Lys Ala Val  1               5                  10                  15CTG GCC GTT CCC CAC GAC TCT GTC GTC GAG CGT TCG GAT GCC TTG CAC      816Leu Ala Val Pro His Asp Ser Val Val Glu Arg Ser Asp Ala Leu His

             20                  25                  30AAG CTC TCT GAG CGT TCG ACC CCG AGC TCG ACC GGC GAG AAC AAC GGT      864Lys Leu Ser Glu Arg Ser Thr Pro Ser Ser Thr Gly Glu Asn Asn Gly

         35                  40                  45TAT TAC TAC TCC TTC TGG ACC GAC GGC GGT GGT GAT GTG ACC TAC ACC      912Tyr Tyr Tyr Ser Phe Trp Thr Asp Gly Gly Gly Asp Val Thr Tyr Thr

     50                  55                  60AAC GGT AAC GCT GGC TCG TAC TCC GTC GAG TGG TCC AAC GTT GGC AAC      960Asn Gly Asn Ala Gly Ser Tyr Ser Val Glu Trp Ser Asn Val Gly Asn 65                  70                  75                  80TTT GTT GGT GGA AAG GGC TGG AAC GCT GGA AGT GCG AA  GTAAGTTAAC      1008Phe Val Gly Gly Lys Gly Trp Asn Ala Gly Ser Ala Lys

                 85                  90CTCTCTCAAC CTGTCCCTCT AGGTATTCAG TGAAAAATGC TCACATAACT TCAG G       1063GAC ATC ACC TAT AGC GGC ACC TTC ACC CCT AGC GGC AAC GGC TAC CTC     1111Asp Ile Thr Tyr Ser Gly Thr Phe Thr Pro Ser Gly Asn Gly Tyr Leu

     95                 100                         105TCC GTC TAT GGC TGG ACC ACT GAC CCC CTG ATC GAG TAC TAC ATC GTC       1159Ser Val Tyr Gly Trp Thr Thr Asp Pro Leu Ile Glu Tyr Tyr Ile Val110                 115                 120                 125GAG TCC TAC GGC GAC TAC AAC CCC GGC AGT GGA GGC ACC TAC AAG GGC       1207Glu Ser Tyr Gly Asp Tyr Asn Pro Gly Ser Gly Gly Thr Tyr Lys Gly

                130                 135                 140ACC TGC ACC TCC GAT GGA TCT GTC TAC GAT ATC TAC ACG GCT ACC CGT       1255Thr Cys Thr Ser Asp Gly Ser Val Tyr Asp Ile Tyr Thr Ala Thr Arg

            145                 150                 155ACC AAC GCC CCT TCT ATC CAA GGA ACC GCT ACC TTC ACC CAG TAC TGG       1303Thr Asn Ala Pro Ser Ile Gln Gly Thr Ala Thr Phe Thr Gln Tyr Trp

        160                 165                 170GTC CGA TTC GAC CAG AAC AAG AGA GTC GGA GGA ACT GTT ACC ACT TCC       1351Val Arg Phe Asp Gln Asn Lys Arg Val Gly Gly Thr Val Thr Thr Ser

    175                 180                 185AAC CAC TTC AAC GCT TGG GCT AAG CTG GGC ATG AAC CTG GGT ACT CAC       1399Asn His Phe Asn Ala Trp Ala Lys Leu Gly Met Asn Leu Gly Thr His190                 195                 200                 205AAC TAC CAG ATC CTG GCT ACC GAG GGC TAC CAG AGC AGC GGA TCT TCC       1447Asn Tyr Gln Ile Leu Ala Thr Glu Gly Tyr Gln Ser Ser Gly Ser Ser

                210                 215                 220TCC ATC ACT ATT CAG TGAGCTTGGA TGTCCAACCG TGCTTGCAGA GATTGCCTGG       1502Ser Ile Thr Ile Gln

            225ATGTGGGTGT GGGAAATGAG TGCGATGGTG CTTGCAATAT TGAGCAGTCG TATGATGTGT     1562GAAACAATTA GTTGCTCGCT ATCAATGCAC TTGTCATTTG AAGTCCATCA AGCGGTCTAG     1622CGTCGTATTC TTCTTATCTC GAAAAAGTAC ATTACAAAGT ATGTCGGCAG ATCGAGGCGC     1682GCCACTATCC GAAAGATAAC CTTTTTTTGG TCTAGTTGTA GCAGTTCTGA GACATTAACG     1742TCAAGTATTA TGCGTGCAAG CTCCCGTCAT ATTGTAGCGG TCATTTCGGA GTAGACGACA     1802CCGGTTGATC GAGCCATAAC TATGTGAGCT ATAATTTGAA CAGCAGGAGT CCAGACGGTC     1862CCGACCTCAG TGATTCCAGT AGGCATCTTC TTTTACACGA CAAAAAAGTG TCTCAATCTC     1922AGACAACCAG CAATTTCACG TTCGGGATGT CCCAACTTAT CTCTTATGAT CCTGCAACAC     1982GTCTACCAAT GAAAGCCACT TTTTACTATG TAAGTAAAAA TCGACAAGCC CGTCAGCGCC     2042CATGGACAAG CTT                                                        2055(2)SEQ ID NO:2的信息:  (i)序列特征:

    (A)长度:226个氨基酸

    (B)类型:氨基酸

    (D)拓扑学:线性  (ii)分子类型:蛋白质  (xi)序列描述:SEQ ID NO:2:Met Leu Thr Lys Asn Leu Leu Leu Cys Phe Ala Ala Ala Lys Ala Val  1               5                  10                  15Leu Ala Val Pro His Asp Ser Val Val Glu Arg Ser Asp Ala Leu His

             20                  25                  30Lys Leu Ser Glu Arg Ser Thr Pro Ser Ser Thr Gly Glu Asn Asn Gly

         35                  40                  45Tyr Tyr Tyr Ser Phe Trp Thr Asp Gly Gly Gly Asp Val Thr Tyr Thr

     50                  55                  60Asn Gly Asn Ala Gly Ser Tyr Ser Val Glu Trp Ser Asn Val Gly Asn 65                  70                  75                  80Phe Val Gly Gly Lys Gly Trp Asn Ala Gly Ser Ala Lys Asp Ile Thr

                 85                  90                  95Tyr Ser Gly Thr Phe Thr Pro Ser Gly Asn Gly Tyr Leu Ser Val Tyr

            100                 105                 110Gly Trp Thr Thr Asp Pro Leu Ile Glu Tyr Tyr Ile Val Glu Ser Tyr

        115                 120                 125Gly Asp Tyr Asn Pro Gly Ser Gly Gly Thr Tyr Lys Gly Thr Cys Thr

    130                 135                 140Ser Asp Gly Ser Val Tyr Asp Ile Tyr Thr Ala Thr Arg Thr Asn Ala145                 150                 155                 160Pro Ser Ile Gln Gly Thr Ala Thr Phe Thr Gln Tyr Trp Val Arg Phe

                165                 170                 175Asp Gln Asn Lys Arg Val Gly Gly Thr Val Thr Thr Ser Asn His Phe

            180                 185                 190Asn Ala Trp Ala Lys Leu Gly Met Asn Leu Gly Thr His Asn Tyr Gln

        195                 200                 205Ile Leu Ala Thr Glu Gly Tyr Gln Ser Ser Gly Ser Ser Ser Ile Thr

    210                 215                 220Ile Gln225(2)SEQ ID NO:3的信息:  (i)序列特征:

    (A)长度:907个碱基对

    (B)类型:核酸

    (C)链数:单链

    (D)拓扑学:线性  (ii)分子类型:DNA(基因组)  (iii)假拟结构:无  (iv)反义:无  (xi)序列描述:SEQ ID NO:3:CACTATTGGC GCCCCACCCA GTGGAGACTT ATACTACAAG GTATCGGGCG GCTATCTGAG      60CAATCGGATC TTCTTAAGCC ACAGGCTAAT ATCAAAACAC TTGTGGCGTC TAGCCTTGTT     120TTTATTTGAC CGTCGGGAAG CCGGTTCTGC ACAACCTTTT CCCTCGCGTT CTACTTTCCA     180ATTAGGTTTC ATGCGAAGGA TCTCAATTGG CACCTTCCTT AATAAGTAGT GATAGTATTA     240TCCTCAAATT TAACGCGGCG GTGGCACTCT GCTAAGTCAC TAACGGCAGG AGACACTCCC     300TCAAGTTAGC ACACGCTAGC ATTTTCTTTC TTAACTAGGT AGAAGCAGTA CGTCTCCGTC     360TAGATTCCAG TAGAATTATA ATCATTGTTA AAGTAGTATA CAGTGTCATA AATGGTTTTA     420CATGCCATCC ATGATTGGAT GAGAGCCAAC CAATGGGTCT TACGTAATGG ACAATGAAGC     480ATTCGAGCCA GGATGCATTT AACGCAGCAA GAGTCAGGCT ACACAGGTGG ATATCGATGT     540TCACAACCGT AAATCTAGAC CCTTGAAGCT CCACTGCCTA TTCGAACAGG CATTATGATT     600TCAGGATGTC TGCAGGACCC TAGAAGGCGA TTTAGGCTGT TTCGGAGATC AATTCGGCTT     660CCAAATCGCC CACGGATGCT CCACCGACTA GGCTAAACCC CATCACAGCG GACGTTTCAG     720GTACGGCAGG GTCTCACATT TAGGGCCTCG GCAGGGTCTC GGCAGGTACC CTTCTTAATA     780AAGGCTAAAT AGCTTCTGCA GAATCATGGG TATATCAGGA ACGTCTCCTC CGTCGCTGCA     840GACCTTCTCT TCTTACTCCC AGTCCCATTG AATCAACTCC TCAAGCCAAG TCTCTTTCAA     900CATGATG                                                               907(2)SEQ ID NO:4的信息:  (i)序列特征:

    (A)长度:2967个碱基对

    (B)类型:核酸

    (C)链数:单链

    (D)拓扑学:线性  (ii)分子类型:DNA(基因组)  (iii)假拟结构:无  (iv)反义:无  (xi)序列描述:SEQ ID NO:4:GAATTCATCC CGGTCGGTGT CCAGTCCCAG GCGGTGAACT TACAGTAGCA AGCTGTAAAC     60TTACCTCAGG TACACTGTCA GAAGCAGATA ATCTCATTAT TGATGAGACT TTCACGCTCT    120CCTGAGCCAT AAAAGGAGTA CCTTTTTTTT GAAGAACAGC TCCACATCTT AGTTACTGAT    180ACCTCATCAC AAGTCGCCAG GAAATGCCAG TAACGTCTGC AGGCCTGTAC TATTTACCAA    240GAAGGCCAGG TCACTGGTGG ATATACAACT TTGTTATAGG TTGCGGGAGT CAGCCCCTAC    300TCCCTGATGG GTTCCCACTC CCCAGTCATT TCCTACTGGA TAGTAGGCTC CTAGAGTTGG    360GTAAAGATTG CCAAGGGTTT AGGCCCAATC TTGTATATGC TTGGCTAGGC AGGACCTCGG    420TAAACTGATG GCTCCTGCAT TTTGACCTGA GTATTTCCAG CTATAAGCGA GATTTGCAAT    480ACTCTGCCTT CATCACCTAC AGAAAGAACT CCTCGGCCAA CTCCCGGTGG CCTTTGAGCT    540CCAAAGTACC TTCGATCAAG CTTCGCGATC TTTTGGCCAG TGTTTCTCGC AGCGTTAACT    600GAGCCTAAGG CTTGCATCAA GAAATAAAGA AACATAACCC TGCACTACAT ACGTCTTGTA    660TGAGCGATGA ACTGTGTTCA TTCAGTAGAT CAGTGGGTAC ATAATCATGA ACATACTTTT    720AGTAAGAAAA CCTTCTGCAG GACGCCGGTC AAGAATCCCC ACTTCCCCGC CTCCCCCAAC    780TCGCAGCCCT TTTATCCGTC TGCCGTCCAT TTAGCCAAAT GTAGTCCATT TAGCCAAGTG    840CGGTCCATTT AGCCAAGACC AGTGGCTAGA TTGATAGCTA GCACAGGAAA CGCATGACTG    900AGACACAACT ATAGAACTGT CTCTGGAAAT AGGCTCGAGG TTGTTCAAGC GTTTAAGGTG    960ATGCGGCAAA ATGCATATGA CTGAGCTGCT TCATCTTGCA GGGGGAAGGG ATAAATAGTC   1020TTTTTCGCAG AATATAAATA CAGGGAGAGT GGGCTCGCAG CAATATTGAC CAGCACAGCG   1080CTGCTCTCCA GTTGCATAAA TACCATCACC AGGATTTAGC TTCTTCAATC ATCATGAAGG   1140TCACTGCGGC TTTTGCAGGT CTTTTGGTCA CGGCATTCGC CGCTCCTGTG CCGGAACCTG   1200TTCTGGTGTC GCGAAGTGCT GGTATTAACT ACGTGCAAAA CTACAACGGC AACCTTGGTG   1260ATTTCACCTA TGACGAGAGT GCCGGAACAT TTTCCATGTA CTGGGAAGAT GGAGTGAGCT   1320CCGACTTTGT CGTTGGTCTG GGCTGGACCA CTGGTTCTTC TAAGTGAGTG ACTGCATTCT     1380TTAACCAAAG TCTAGGATCT AACGTTTTTT AGCGCTATCA CCTACTCTGC CGAATACAGT     1440GCTTCTGGCT CCTCTTCCTA CCTCGCTGTG TACGGCTGGG TCAACTATCC TCAGGCTGAA     1500TACTACATCG TCGAGGATTA CGGTGATTAC AACCCTTGCA GCTCGGCCAC AAGCCTTGGT     1560ACCGTGTACT CTGATGGAAG CACCTACCAA GTCTGCACCG ACACTCGAAC AAACGAACCG     1620TCCATCACGG GAACAAGCAC GTTCACGCAG TACTTCTCCG TTCGGGAGAG CACGCGCACA     1680TCTGGAACGG TGACTGTTGC CAACCATTTC GACTTCTGGG CGCAGCATGG GTTCGGCAAT     1740AGCGACTTCA ATTATCAGGT CATGGCAGTG GAAGCATGGA GCGGTGCTGG CAGCGCCAGT     1800GTCACGATCT CCTCTTAGGA GATAGTGCCT TAGTAGTCGG AAGATGTCAA CGCGAGCTTT     1860GTTCTCAGCT GGTGTGATGA TCGGATCCGG TTCTCTAGCG GTTACATTGA GGCTGTATAA     1920GCTGTTGTGG GGCCGAGCTG TCAGCGCTGC GTTTTCAACT TGCACAGATA ATCAACTCTC     1980GTTTACTATT TCTTGCGTTT TCTCGCTGCT TATCCTATCC ATAGATAATA TTTTGCTCAA     2040TACATATTAT CTATATACAA CTTTTTCAGT CGCAGTAGTC ACTCCGAGCA AGGCATTGGG     2100AAATCGGGGG ATGCGGGGTG CTGCGTAGCC TCTAACCTAG GGCATTTAAA GGATATTTAA     2160TCTCCGGATA TCCTATACTA ACAGACTCCT AATGACTGCG GAAAATATAG AGGGCCAGGA     2220TCTCTACAAT TCGACGAAGT TCAATGCAAT CAGAGGGGGA ATAACTAATG AGAGTGCAAT     2280GAGTTAGAGA AGGACAATAT GGCAGTCTTA GTGTGGACTT ACATAACGAT ATGGAGTATA     2340GAAAAAAGTG GGGAGGTCCG TCTACTATAT ATAATGCCCA TTACGTGTAT CCGATGCTTG     2400CCCATTGCCA CTGAGTAGGT GACTCTTCGA GTCCACTTAA CATCGGTATA TGAGAAAATC     2460ATGCCCCCTT TGCAGGAAAC TTAGCTTTTC ATTCCTTGTT TGAAGCCATA ATTATCACGA     2520AACCCATTAA AGACTTATCT TCCTGTAACT GAAACAAATA TTTCGGGATT GGAATAGCCT     2580TTTGCCCGAC ATCAGTATTT TTTTGCGACG GTAAATCTGG GAGTATACGA TGTCCTTTCA     2640CGCATCTCAA CAAAACTCTG TCGCATCGGG TAACCTACGG ATAGTACTGT ATCCAGACGC     2700ATTTTTTCTA ATAACAGGTC ACTGTGCAAT TTCCGGGAAA GTTTCTATGT ATAATACTCT     2760CTCGTTGCAT CTCAAATATT GTGGCTGATT GAGACCCACA CTATGTCTTG CATCTATTGT     2820ACCATCCTTG CTTGAGGCCA ATTGGCGCAC CTGTACCCGG TTAATGATAT AATGATGAAG     2880CTGCAGCTGG TTACCAATGG GAATGACATA CCATGTACAT AAACTGCCAG CGTCACAGAG     2940GAGCTGTCAA TAGTACTGAA ATCTAGA                                         2967(2)SEQ ID NO:5的信息:  (i)序列特征:

    (A)长度:3311个碱基对

    (B)类型:核酸

    (C)链数:单链

    (D)拓扑学:线性  (ii)分子类型:DNA(基因组)  (iii)假拟结构:无  (iv)反义:无  (xi)序列描述:SEQ ID NO:5:GTTCAATTGG GCGTGATGAG ATGCCGTCGC GGGTGGAGTT GTCTGCCCAT CACAATAAAC     60CTTTGTCCAA ACATTTGCCT AATTGCCCAT CACCAACGGC TTTAAGAATC ATGTACCTCG    120CTCATTTGAG AAGATGGAAG ATGCCATTGC CACGGCAGTC GATCAATCTA CTGGCTATGG    180ATGGTCCGAA TTTTCCGTCG TCGCCTTTTG CTCTAATCTC GGTATGACCT TCACCGAGCG    240AATCGTAGAA TATTTAAAGG GTTGATCGAG CCACTTTGTC GCCGATGTCT GACTCTGTCG    300TGTCACAACT GAACTGATCA GACGAGGTCA TCTGAGTCTC TCGTCGAAAA AAGACTCGTT    360GGATGATTCT CGATTTCAAC TCGGGACAAG TCATAGAACG AGTAGTACTT CAGTTGGCCA    420CAAAAGATGA AGTCTCTCGC CGCAATTGCT GCTCTGCTGT CGCCCACACT GGTCCGGGCA    480GCGACTCCGG ATGAGTGGAA AGCTCAGTCG ATCTATTTCA TGCTGACGGA CCGGTTTGCG    540CGTACCGACA ATTCGACCAC GGCTCCCTGT GACACCACTG CCGGGGTATG CAACTAACCC    600TGTGTTTCTC TTCCCGGGAC GTACAAGGGG TCTTCTCCAT GCTAACCGTG CACATGCAGA    660AATATTGCGG GGGAACATGG CGAGGTATCA TCAACAACGT AAGTGGCTTC TGATTTTCGC    720TCAATAATCT TCGTCGCGTG ACTTTATTTC CTAGCTGGAT TACATCCAGG ATATGGGCTT    780CACAGCTATC TGGATAACTC CAGTGACAGC CCAGTGGGAC GACGATGTGG ATGCGGCAGA    840TGCAACGTCG TATCACGGTT ATTGGCAGAA AGACCTGTGC GCAACCCTGC TCCATGGATC    900GCTGGCTGCA AACTCGTGCT GATCGGTGAT TTTTTTTTTT TTTTTTTTGA AACAGATACT    960CTCTGAATTC GAAATTCGGC ACTGCCGATG ACTTGAAAGC CCTGGCTGAT GCCCTTCACG   1020CCCGTGGGAT GCTTCTCATG GTCGACGTCG TGGCTAATCA CTTTGTACGG ACCATCTACA   1080TACCTGGGAA ACGCGAAGAA GGAAAAAAAA AAAAAGGCGC ACGCTAACAT TTCGCGTTTA     1140GGGCTACGGC GGTTCTCATA GCGAGGTGGA TTACTCGATC TTCAATCCTC TGAACAGCCA     1200GGATTACTTC CACCCGTTCT GTCTCATTGA GGACTACGAC AACCAGGAAG AAGTCGAACA     1260ATGCTGGCTG GCCGATACTC CGACGACATT GCCCGACGTG GACACCACCA ATCCTCAGGT     1320TCGGACGTTT TTCAACGACT GGATCAAGAG CCTGGTGGCG AACTACTCCA GTATGATTGT     1380TCCCGCGGTA ACGCTTTAGG GCTTGCTCTA ACTGAAATCG ACAGTCGATG GTCTGCGCGT     1440CGACACCGTT AAGCACGTGG AGAAAGATTT CTGGCCCGAC TTCAACGAAG CTGCTGCGTG     1500TACCGTCGGC GAGGTGTTCA ACGGTGACCC AGCGTACACC TGCCCATACC AGGAAGTGCT     1560GGATGGCGTT CTGAACTATC CGATGTGAGT GATTCCGAAA GTTCCATCGA TCAGGCTTTC     1620TGACGCATGA GAACAGCTAC TATCCTGCGC TTGATGCATT CAAGTCTGTC GGCGGCAATC     1680TCGGCGGCTT GGCTCAGGCC ATCACCACCG TGCAGGAGAG CTGCAAGGAT TCCAATCTGC     1740TCGGCAATTT CCTTGAGAAT CACGACATTG CTCGCTTTGC TTCGTATGGA CACTCTTTTT     1800GAAGCCCTCA TCGATTGGGG ATGCTGACAC GGACAACAAC AACAGGTACA CGGATGACCT     1860TGCTCTCGCC AAGAATGGTC TCGCTTTCAT CATCCTCTCG GATGGTATTC CGATCATCTA     1920CACGGGCCAG GAGCAGCACT ACGCCGGTGA TCACGATCCC ACAAATCGTG AGGCCGTCTG     1980GCTGTCTGGC TACAATACCG ACGCCGAGCT GTACCAGTTC ATCAAGAAGG CCAATGGCAT     2040CCGCAACTTG GCTATCAGCC AGAACCCGGA ATTCACCTCC TCCAAGGTGA GTACAATAAC     2100AAACTTTTCG AAAAATTTTT CACCGGAGAA AACCTAAGAT TCGGCTAACA AAACAAAAAA     2160AAAAAAGACC AAGGTCATCT ACCAAGACGA TTCGACCCTT GCCATTAACC GGGGCGGCGT     2220CGTTACTGTC CTGAGCAATG AAGGCGCCTC CGGGGAGACC GGGACTGTCT CCATTCCGGG     2280AACTGGCTTC GAGGCCGGCA CGGAATTGAC TGATGTCATC TCCTGCAAGA CCGTGACTGC     2340GGGGGACAGC GGGGCGGTCG ACGTGCCCTT GTCGGGCGGA CTGCCAAGCG TGCTCTATCC     2400CAGCTCCCAG CTGGCCAAGA GTGGTCTGTG TGCGTCGGCG TGAGGGGATT CTCTCATCAC     2460CAGGCGATGT CAGGAGACAA TTTTTTTCTG AACTCAGGGG TTTCTCAGAG AGCTCAAAAT     2520CGGGAACTTT TTTTTTGCAG GAACTCCGAG TGTACATATA TTGAGTGGAG TCTCTCATTC     2580GTCTTTTGTG TAGCTTAGGT TGATCCATAG TGAGTGATTT TTCACGTTGC TCCACGTGGT     2640TTTCTTGACA GTTCGGGCTA TGGGGTGTTA GCCTTGTTGG GCACGAAGAT CCACACTAAA     2700ATCTGACACT ATGAAGTCAA CTCACCATCC TGATCGGATT TGTGCTCTCA TTCCGTCATT     2760TGTCCAATCA ACTCTCCGTA AACCCCCATC CTAACTCCCT CCCCAAGTGA ACCTATTCCC           2820TTTCTTGTTT CGTAAGCTCC CCAAGGTCCA ATGGCCATGT CACTTTGATG ACGCGTAGCA           2880CGTCAGCTGT TCCGTACCTT TTCTCGCCCG ATCAGCGGCG GCGGCGGCGG CGGCGGCGGC           2940AGCAGCAGCA GCAGCAGCAG CAGCAGCAGC AGCAGTCAAG GGGACCAAAC CAGGAACCCA           3000ATTCGGCAGG GAGACGCGCC GAATCCGCCG ACGTTGAACG CGGCTAGGAG ATTCTTCGCA           3060CTTTGTCCCT TTCCCATTGC TCCTCGTCAT TGTAGCTTAT TCCTAGTCTC GTTAAACCCG           3120GAACTAGCGG CCGAATGATT TGGCCACCGC TTCCATACTA TGGTACACCT GCGCTGTACT           3180CCGGACGCAG AATGTCGGCC TTTACGCCCC AATCCCTGTA CCTCGGAGTT ATGGTTCGAA           3240GAGTGAATCC TCTTCGATTG CACACTTCAT GACACAGAAG CCGCTTCGTA ATCCCAATCC           3300AATTGCTGCA G                                                                3311(2)SEQ ID NO:6的信息:  (i)序列特征:

    (A)长度:7432个碱基对

    (B)类型:核酸

    (C)链数:双链

    (D)拓扑学:环状  (ii)分子类型:DNA(基因组)  (iii)假拟结构:无  (iv)反义:无  (xi)序列描述:SEQ ID NO:6:GATCCACTAG TTCTAGAGCG GCCGCCACCG CGGTGGAGCT CCAGCTTTTG TTCCCTTTAG       60TGAGGGTTAA TTGCGCGCTT GGCGTAATCA TGGTCATAGC TGTTTCCTGT GTGAAATTGT      120TATCCGCTCA CAATTCCACA CAACATACGA GCCGGAAGCA TAAAGTGTAA AGCCTGGGGT      180GCCTAATGAG TGAGCTAACT CACATTAATT GCGTTGCGCT CACTGCCCGC TTTCCAGTCG      240GGAAACCTGT CGTGCCAGCT GCATTAATGA ATCGGCCAAC GCGCGGGGAG AGGCGGTTTG      300CGTATTGGGC GCTCTTCCGC TTCCTCGCTC ACTGACTCGC TGCGCTCGGT CGTTCGGCTG      360CGGCGAGCGG TATCAGCTCA CTCAAAGGCG GTAATACGGT TATCCACAGA ATCAGGGGAT              420AACGCAGGAA AGAACATGTG AGCAAAAGGC CAGCAAAAGG CCAGGAACCG TAAAAAGGCC              480GCGTTGCTGG CGTTTTTCCA TAGGCTCCGC CCCCCTGACG AGCATCACAA AAATCGACGC              540TCAAGTCAGA GGTGGCGAAA CCCGACAGGA CTATAAAGAT ACCAGGCGTT TCCCCCTGGA              600AGCTCCCTCG TGCGCTCTCC TGTTCCGACC CTGCCGCTTA CCGGATACCT GTCCGCCTTT              660CTCCCTTCGG GAAGCGTGGC GCTTTCTCAT AGCTCACGCT GTAGGTATCT CAGTTCGGTG              720TAGGTCGTTC GCTCCAAGCT GGGCTGTGTG CACGAACCCC CCGTTCAGCC CGACCGCTGC              780GCCTTATCCG GTAACTATCG TCTTGAGTCC AACCCGGTAA GACACGACTT ATCGCCACTG              840GCAGCAGCCA CTGGTAACAG GATTAGCAGA GCGAGGTATG TAGGCGGTGC TACAGAGTTC              900TTGAAGTGGT GGCCTAACTA CGGCTACACT AGAAGGACAG TATTTGGTAT CTGCGCTCTG              960CTGAAGCCAG TTACCTTCGG AAAAAGAGTT GGTAGCTCTT GATCCGGCAA ACAAACCACC             1020GCTGGTAGCG GTGGTTTTTT TGTTTGCAAG CAGCAGATTA CGCGCAGAAA AAAAGGATCT             1080CAAGAAGATC CTTTGATCTT TTCTACGGGG TCTGACGCTC AGTGGAACGA AAACTCACGT             1140TAAGGGATTT TGGTCATGAG ATTATCAAAA AGGATCTTCA CCTAGATCCT TTTAAATTAA             1200AAATGAAGTT TTAAATCAAT CTAAAGTATA TATGAGTAAA CTTGGTCTGA CAGTTACCAA             1260TGCTTAATCA GTGAGGCACC TATCTCAGCG ATCTGTCTAT TTCGTTCATC CATAGTTGCC             1320TGACTCCCCG TCGTGTAGAT AACTACGATA CGGGAGGGCT TACCATCTGG CCCCAGTGCT             1380GCAATGATAC CGCGAGACCC ACGCTCACCG GCTCCAGATT TATCAGCAAT AAACCAGCCA             1440GCCGGAAGGG CCGAGCGCAG AAGTGGTCCT GCAACTTTAT CCGCCTCCAT CCAGTCTATT             1500AATTGTTGCC GGGAAGCTAG AGTAAGTAGT TCGCCAGTTA ATAGTTTGCG CAACGTTGTT             1560GCCATTGCTA CAGGCATCGT GGTGTCACGC TCGTCGTTTG GTATGGCTTC ATTCAGCTCC             1620GGTTCCCAAC GATCAAGGCG AGTTACATGA TCCCCCATGT TGTGCAAAAA AGCGGTTAGC             1680TCCTTCGGTC CTCCGATCGT TGTCAGAAGT AAGTTGGCCG CAGTGTTATC ACTCATGGTT             1740ATGGCAGCAC TGCATAATTC TCTTACTGTC ATGCCATCCG TAAGATGCTT TTCTGTGACT             1800GGTGAGTACT CAACCAAGTC ATTCTGAGAA TAGTGTATGC GGCGACCGAG TTGCTCTTGC             1860CCGGCGTCAA TACGGGATAA TACCGCGCCA CATAGCAGAA CTTTAAAAGT GCTCATCATT             1920GGAAAACGTT CTTCGGGGCG AAAACTCTCA AGGATCTTAC CGCTGTTGAG ATCCAGTTCG             1980ATGTAACCCA CTCGTGCACC CAACTGATCT TCAGCATCTT TTACTTTCAC CAGCGTTTCT             2040GGGTGAGCAA AAACAGGAAG GCAAAATGCC GCAAAAAAGG GAATAAGGGC GACACGGAAA     2100TGTTGAATAC TCATACTCTT CCTTTTTCAA TATTATTGAA GCATTTATCA GGGTTATTGT     2160CTCATGAGCG GATACATATT TGAATGTATT TAGAAAAATA AACAAATAGG GGTTCCGCGC     2220ACATTTCCCC GAAAAGTGCC ACCTAAATTG TAAGCGTTAA TATTTTGTTA AAATTCGCGT     2280TAAATTTTTG TTAAATCAGC TCATTTTTTA ACCAATAGGC CGAAATCGGC AAAATCCCTT     2340ATAAATCAAA AGAATAGACC GAGATAGGGT TGAGTGTTGT TCCAGTTTGG AACAAGAGTC     2400CACTATTAAA GAACGTGGAC TCCAACGTCA AAGGGCGAAA AACCGTCTAT CAGGGCGATG     2460GCCCACTACG TGAACCATCA CCCTAATCAA GTTTTTTGGG GTCGAGGTGC CGTAAAGCAC     2520TAAATCGGAA CCCTAAAGGG AGCCCCCGAT TTAGAGCTTG ACGGGGAAAG CCGGCGAACG     2580TGGCGAGAAA GGAAGGGAAG AAAGCGAAAG GAGCGGGCGC TAGGGCGCTG GCAAGTGTAG     2640CGGTCACGCT GCGCGTAACC ACCACACCCG CCGCGCTTAA TGCGCCGCTA CAGGGCGCGT     2700CCCATTCGCC ATTCAGGCTG CGCAACTGTT GGGAAGGGCG ATCGGTGCGG GCCTCTTCGC     2760TATTACGCCA GCTGGCGAAA GGGGGATGTG CTGCAAGGCG ATTAAGTTGG GTAACGCCAG     2820GGTTTTCCCA GTCACGACGT TGTAAAACGA CGGCCAGTGA GCGCGCGTAA TACGACTCAC     2880TATAGGGCGA ATTGGCGGGC CCGTCTCTCA TCCATGGTTC CTCTTCGGCC TCGACCATCC     2940CATCACTGCC ATACCTGCAC TCGTTGTTTT CTCTTGCATT CACATCGCGG TGTTCATCCA     3000CGAACATCAT CTATCCGATA AGGCTGATGA GGAGAACTAT GTATATCCTA TGACCAGTGG     3060GTCGTCAGAT CCCTACTTCA TACGCAATTC GTTGAGCTAT ACTCGATGAT CGTTGATAAG     3120AATCCACTGA CTACTTATTA CGGTGTACAA CGTGCACTAT TTCAGCGACA GGCGTGCCTC     3180ACTGCCTAGT GCCTACAGGT AACACTCAAC AGAATGCACA AGGATGGAGC GTCCAAAACG     3240GAATGCCTTG TGACGTCAGT CAGTGCGCTG CCACTAATGT ATACTAGTAC TCCTCTCTGT     3300ACCACCACCG CCCACCCGGA CAAGATACTC CGTATAGTTC TCCGATGCAC CGCATCTTGC     3360GACCCACCCA GACCTCAAAG ATATGCCTCC AGGATGACGG TATCGCTCTC TGAGAAACCC     3420CTGAGTTCAG AAAAAAATTG TCTCCTGACA TCGCCTGGTG ATGAGAGAAT CCCCTCACGC     3480CGACGCACAC AGACCACTCT TGGCCAGCTG GGAGCTGGGA TAGAGCACGC TTGGCAGTCC     3540GCCCGACAAG GGCACGTCGA CCGCCCCGCT GTCCCCCGCA GTCACGGTCT TGCAGGAGAT     3600GACATCAGTC AATTCCGTGC CGGCCTCGAA GCCAGTTCCC GGAATGGAGA CAGTCCCGGT     3660CTCCCCGGAG GCGCCTTCAT TGCTCAGGAC AGTAACGACG CCGCCCCGGT TAATGGCAAG     3720GGTCGAATCG TCTTGGTAGA TGACCTTGGT CTTTTTTTTT TTTGTTTTGT TAGCCGAATC           3780TTAGGTTTTC TCCGGTGAAA AATTTTTCGA AAAGTTTGTT ATTGTACTCA CCTTGGAGGA           3840GGTGAATTCC GGGTTCTGGC TGATAGCCAA GTTGCGGATG CCATTGGCCT TCTTGATGAA           3900CTGGTACAGC TCGGCGTCGG TATTGTAGCC AGACAGCCAG ACGGCCTCAC GATTTGTGGG           3960ATCGTGATCA CCGGCGTAGT GCTGCTCCTG GCCCGTGTAG ATGATCGGAA TACCATCCGA           4020GAGGATGATG AAAGCGAGAC CATTCTTGGC GAGAGCAAGG TCATCCGTGT ACCTGTTGTT           4080GTTGTCCGTG TCAGCATCCC CAATCGATGA GGGCTTCAAA AAGAGTGTCC ATACGAAGCA           4140AAGCGAGCAA TGTCGTGATT CTCAAGGAAA TTGCCGAGCA GATTGGAATC CTTGCAGCTC           4200TCCTGCACGG TGGTGATGGC CTGAGCCAAG CCGCCGAGAT TGCCGCCGAC AGACTTGAAT           4260GCATCAAGCG CAGGATAGTA GCTGTTCTCA TGCGTCAGAA AGCCTGATCG ATGGAACTTT           4320CGGAATCACT CACATCGGAT AGTTCAGAAC GCCATCCAGC ACTTCCTGGT ATGGGCAGGT           4380GTACGCTGGG TCACCGTTGA ACACCTCGCC GACGGTACAC GCAGCAGCTT CGTTGAAGTC           4440GGGCCAGAAA TCTTTCTCCA CGTGCTTAAC GGTGTCGACG CGCAGACCAT CGACTGTCGA           4500TTTCAGTTAG AGCAAGCCCT AAAGCGTTAC CGCGGGAACA ATCATACTGG AGTAGTTCGC           4560CACCAGGCTC TTGATCCAGT CGTTGAAAAA CGTCCGAACC TGAGGATTGG TGGTGTCCAC           4620GTCGGGCAAT GTCGTCGGAG TATCGGCCAG CCAGCATTGT TCGACTTCTT CCTGGTTGTC           4680GTAGTCCTCA ATGAGACAGA ACGGGTGGAA GTAATCCTGG CTGTTCAGAG GATTGAAGAT           4740CGAGTAATCC ACCTCGCTAT GAGAACCGCC GTAGCCCTAA ACGCGAAATG TTAGCGTGCG           4800CCTTTTTTTT TTTTTCCTTC TTCGCGTTTC CCAGGTATGT AGATGGTCCG TACAAAGTGA           4860TTAGCCACGA CGTCGACCAT GAGAAGCATC CCACGGGCGT GAAGGGCATC AGCCAGGGCT           4920TTCAAGTCAT CGGCAGTGCC GAATTTCGAA TTCAGAGAGT ATCTGTTTCA AAAAAAAAAA           4980AAAAAAAATC ACCGATCAGC ACGAGTTTGC AGCCAGCGAT CCATGGAGCA GGGTTGCGCA           5040CAGGTCTTTC TGCCAATAAC CGTGATACGA CGTTGCATCT GCCGCATCCA CATCGTCGTC           5100CCACTGGGCT GTCACTGGAG TTATCCAGAT AGCTGTGAAC CCCATATCCT GGATGTAATC           5160CAGCTAGGAA ATAAAGTCAC GCGACGAAGA TTATTGAGCG AAAATCAGAA GCCACTTACG           5220TTGTTGATGA TACCTCGCCA TGTTCCCCCG CAATATTTCT GCATGTGCAC GGTTAGCATG           5280GAGAAGACCC CTTGTACGTC CCGGGAAGAG AAACACAGGG TTAGTTGCAT ACCCCGGCAG           5340TGGTGTCACA GGGAGCCGTG GTCGAATTGT CGGTACGCGC AAACCGGTCC GTCAGCATGA           5400AATAGATCGA CTGAGCTTTC CACTCATCCG GAGTCGCTGC CCGGACCAGT GTGGGCGACA           5460GCAGAGCAGC AATTGCGGCG AGAGACTTCA TCTTTTGTGG CCAACTGAAG TAATTCCTGC           5520AGCCCTTGAA AGAGACTTGG CTTGAGGAGT TGATTCAATG GGGCTCGGAG TAAGAAGAGA           5580AGGTCTGCAG CGACGGAGGA GACGTTCCTG ATATACCCAT GATTCTGCAG AAGCTATTTA           5640GCCTTTATTA AGAAGGGTAC GTACCTGCCG AGACCCTGCC GAGACCCTGC CGAGGCCCTA           5700AATGTGAGAC CCTGCCGTAC CTGAAACGTC GCTGTGATGG GGTTTAGCCT AGTCGGTGGA           5760GCATCCGTGG GCGATTTGGA AAGCCGAATT GATCTCCCGA AACAGCCTAA ATCGCCTTCT           5820AGGTCCTGCA GACATCCTGA AATTATAACG CCTGTTCACA ATAGGCAGTG GAGCTTCAAG           5880GGTCTAGATT CGCTGATGTC AACATCGGGG GGATCGCAGG GAAAAATACG AGCTCCAATG           5940AACCTGGGTG TGGCAACTTC AATGGAAAGG AACTGCCTTT GCAGGTGTGG CTGAACCCCA           6000CGGTTCCGGT CGGAGGCGGC GAAATCACCC GATGTGGCTG GTGCGTGGAG GGTCGCGATG           6060ATTTACTGAG CTCCTCTTTT GCTCGACATT GAATGTGCAT TGTTCACCTC ATATAAGGGC           6120CAGTCGCTGC TAAATTATTC GGTAGTATTT GCGCATCTCT GGATCTACCA ATTAGGGCCT           6180ATCAGTCGAA ACTCCAAGCT ACTCATATTG CACAAGCCTC TTTCATCCCC GCATTAACCC           6240CTCCACCGAC ACCATGTCCT CCAAGTCGCA ATTGACCTAC ACTGCCCGTG CCAGCAAGCA           6300CCCCAATGCT CTGGCCAAGC GGCTGTTCGA AATTGCTGAG GCCAAGAAGA CCAATGTGAC           6360CGTCTCTGCC GACGTTACCA CCACTAAGGA GCTACTAGAT CTTGCTGACC GTAGGCCGAC           6420CCGCCATTCT GCCTGTTTAT GCTGCATACA AACTTATTAA CGGTGATACC GGACTGAGGT           6480CTCGGTCCCT ACATCGCCGT GATCAAAACC CACATCGATA TCCTCTCTGA CTTCAGCGAC           6540GAGACCATTG AGGGCCTCAA GGCTCTTGCG CAGAAGCACA ACTTCCTCAT CTTCGAGGAC           6600CGCAAATTCA TCGACATTGG CAACACTGTC CAGAAGCAAT ACCACCGTGG TACCCTCCGC           6660ATCTCAGAAT GGGCCCATAT CATCAACTGC AGCATCCTGC CTGGCGAGGG TATCGTCGAG           6720GCTCTCGCTC AGACGGCGTC TGCACCGGAC TTCTCCTACG GCCCCGAACG TGGTCTGTTG           6780ATCTTGGCGG AAATGACCTC TAAGGGTTCC TTGGCCACCG GCCAGTACAC TACTTCTTCG           6840GTTGATTATG CCCGGAAATA CAAGAACTTC GTCATGGGAT TTGTGTCGAC CCGCTCGTTG           6900GGTGAGGTGC AGTCGGAAGT CAGCTCTCCT TCGGATGAGG AGGACTTTGT GGTCTTCACG           6960ACTGGTGTGA ACATTTCGTC CAAGGGAGAT AAGCTCGGTC AGCAGTACCA GACTCCCGCA           7020TCGGCTATCG GTCGGGGTGC TGACTTCATT ATCGCGGGTC GCGGTATCTA CGCCGCGCCG           7080GACCCGGTGC AGGCTGCGCA ACAGTACCAG AAGGAAGGTT GGGAGGCGTA CCTGGCCCGT           7140GTCGGCGGAA ACTAATACTA TAAAATGAGG AAAAAAGTTT TGATGGTTAT GAATGATATA           7200GAAATGCAAC TTGCCGCTAC GATACGCATA CAAACTAATG TCGAGCACGG GTAGTCAGAC           7260TGCGGCATCG GATGTCAAAA CGGTATTGAT CCTGCAGGCT ATTATAGGGT GGCACGGGAT           7320TAATGCGGTA CGACGATTTG ATGCAGATAA GCAGGCTGCG AAGTACTTAG TCCTGTAACT           7380CTTGCGTAGA GCAAATGGCG ACGGGTGGCT GATAAGGGAC GGTGATAAGC TT                   7432(2)SEQ ID NO:7的信息:  (i)序列特征:

    (A)长度:12个碱基对

    (B)类型:核酸

    (C)链数:单链

    (D)拓扑学:线性  (ii)分子类型:其它核酸

      (A)描述:/desc=“合成的DNA”  (iii)假拟结构:无  (iv)反义:无  (xi)序列描述:SEQ ID NO:7:CGGCAGGGTC TC                                       12(2)SEQ ID NO:8的信息:  (i)序列特征:

    (A)长度:12个碱基对

    (B)类型:核酸

    (C)链数:单链

    (D)拓扑学:线性  (ii)分子类型:其它核酸

    (A)描述:/desc=“合成的DNA”  (iii)假拟结构:无  (iv)反义:无  (xi)序列描述:SEQ ID NO:8:GAGACCCTGC CG                                    12(2)SEQ ID NO:9的信息:  (i)序列特征:

    (A)长度:21个碱基对

    (B)类型:核酸

    (C)链数:单链

    (D)拓扑学:线性  (ii)分子类型:其它核酸

      (A)描述:/desc=“合成的DNA”  (iii)假拟结构:无  (iv)反义:无  (xi)序列描述:SEQ ID NO:9:TCGACTGAGC TTTCCACTCA T                          21(2)SEQ ID NO:10的信息:  (i)序列特征:

    (A)长度:63个碱基对

    (B)类型:核酸

    (C)链数:双链

    (D)拓扑学:线性  (ii)分子类型:DNA(基因组)  (iii)假拟结构:无  (iv)反义:无  (xi)序列描述:SEQ ID NO:10:TACGTACCTG CCGAGACCCT GCCGAGACCC TGCCGAGGCC CTAAATGTGA GACCCTGCCG     60TAC                                                                   63(2)SEQ ID NO:11的信息:  (i)序列特征:

    (A)长度:43个碱基对

    (B)类型:核酸

    (C)链数:双链

    (D)拓扑学:线性  (ii)分子类型:DNA(基因组)  (iii)假拟结构:无  (iv)反义:无  (xi)序列描述:SEQ ID NO:11:TACGAGACCC TGCCGAGGCC CTAAATGTGA GACCCTGCCG TAC                      43(2)SEQ ID NO:12的信息:  (i)序列特征:

    (A)长度:54个碱基对

    (B)类型:核酸

    (C)链数:双链

    (D)拓扑学:线性  (ii)分子类型:DNA(基因组)  (iii)假拟结构:无  (iv)反义:无  (xi)序列描述:SEQ ID NO:12:TACGAGACCC TGCCGAGACC CTGCCGAGGC CCTAAATGTG AGACCCTGCC GTAC          54(2)SEQ ID NO:13的信息:  (i)序列特征:

    (A)长度:75个碱基对

    (B)类型:核酸

    (C)链数:双链

    (D)拓扑学:线性  (ii)分子类型:DNA(基因组)  (iii)假拟结构:无  (iv)反义:无  (xi)序列描述:SEQ ID NO:13:TACGAGACCC TGCCGGTACC TGCCGAGACC CTGCCGAGAC CCTGCCGAGG CCCTAAATGT      60GAGACCCTGC CGTAC                                                       75(2)SEQ ID NO:14的信息:  (i)序列特征:

    (A)长度:87个碱基对

    (B)类型:核酸

    (C)链数:双链

    (D)拓扑学:线性  (ii)分子类型:DNA(基因组)  (iii)假拟结构:无  (iv)反义:无  (xi)序列描述:SEQ ID NO:14:TACGAGACCC TGCCGGAGAC CCTGCCGGTA CCTGCCGAGA CCCTGCCGAG ACCCTGCCGA      60GGCCCTAAAT GTGAGACCCT GCCGTAC                                          87(2)SEQ ID NO:15的信息:  (i)序列特征:

    (A)长度:99个碱基对

    (B)类型:核酸

    (C)链数:双链

    (D)拓扑学:线性  (ii)分子类型:DNA(基因组)  (iii)假拟结构:无  (iv)反义:无  (xi)序列描述:SEQ ID NO:15:TACGAGACCC TGCCGCGGCA GGGTCTCCGG CAGGGTCTCG TACCTGCCGA GACCCTGCCG      60AGACCCTGCC GAGGCCCTAA ATGTGAGACC CTGCCGTAC                             99

表达元件.pdf_第1页
第1页 / 共59页
表达元件.pdf_第2页
第2页 / 共59页
表达元件.pdf_第3页
第3页 / 共59页
点击查看更多>>
资源描述

《表达元件.pdf》由会员分享,可在线阅读,更多相关《表达元件.pdf(59页珍藏版)》请在专利查询网上搜索。

本发明涉及序列CGGCAGGGTCTC,或者其变化,同系物或片段作为激活一种核苷酸序列或者多种核苷酸序列自启动子转录的控制元件的用途。本发明因此提供核酸构建体,其中至少一个该元件的异源拷贝与启动子的上游或下游操作连接,而启动子自身与核苷酸序列操作连接。。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 化学;冶金 > 生物化学;啤酒;烈性酒;果汁酒;醋;微生物学;酶学;突变或遗传工程


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1