本发明寻求克服与用抗氧化剂制备食品的现有技术方法相关联
的任何问题。
按照本发明的第一个方面,提供制备包含抗氧化剂和至少一种
其它组分的介质的方法,所述方法包括在所述介质中原位制备所述抗
氧化剂;并且其中通过使用重组DNA技术从葡聚糖制备所述抗氧化
剂。
按照本发明的第二个方面,提供制备包含抗氧化剂和至少一种
其它组分的介质的方法,所述方法包括在所述介质中原位制备所述抗
氧化剂;并且其中通过使用重组葡聚糖裂合酶制备所述抗氧化剂。
按照本发明的第三个方面,提供通过按照本发明的方法制备的
介质。
本发明的其它方面包括:
使用果糖酐(anhydrofructose)做为介质的抗氧化剂,所述介
质包含至少一种其它组分,其中所述果糖酐在所述介质中原位
制备。
使用果糖酐做为赋予或改进植物逆境耐性的手段,其中所
述果糖酐在所述植物中原位制备。
使用果糖酐做为赋予或改进葡萄转化的手段,其中所述果
糖酐在所述葡萄中原位制备。
使用果糖酐做为提高食品(优选为水果或蔬菜,更优选为新
鲜水果或新鲜蔬菜)中抗氧化剂水平的手段,其中所述果糖酐在
所述食品中原位制备。
使用果糖酐做为食品中的药物,其中所述果糖酐在所述食
品中原位制备。
给予包含果糖酐的食品的方法,其中所述果糖酐处于药用
可接受的量,并做为药物起作用;并且其中已在所述食品中原
位制备所述果糖酐。
使用果糖酐做为食品中的营养药,其中所述果糖酐在所述
食品中原位制备。
给予包含果糖酐的食品的方法,其中所述果糖酐处于营养
药可接受的量,并做为营养药起作用;并且其中已在所述食品
中原位制备所述果糖酐。
使用葡聚糖裂合酶做为赋予或改进植物逆境耐性的手段,
其中所述葡聚糖裂合酶在所述植物中原位制备。
使用葡聚糖裂合酶做为赋予或改进葡萄转化的手段,其中
所述葡聚糖裂合酶在所述葡萄中原位制备。
使用葡聚糖裂合酶做为提高食品(优选为水果或蔬菜,更优
选为新鲜水果或新鲜蔬菜)中抗氧化剂水平的手段,其中所述葡
聚糖裂合酶在所述食品中原位制备。
使用葡聚糖裂合酶制备食品中的药物,其中所述葡聚糖裂
合酶在所述食品中原位制备。
给予包含抗氧化剂的食品的方法,其中所述抗氧化剂处于
药用可接受的量,并做为药物起作用;并且其中已在所述食品
中从葡聚糖裂合酶制备所述抗氧化剂。
使用葡聚糖裂合酶制备食品中的营养药,其中所述葡聚糖
裂合酶在所述食品中原位制备。
给予包含抗氧化剂的食品的方法,其中所述抗氧化剂处于
营养药可接受的量,并做为营养药起作用;并且其中已在所述
食品中从葡聚糖裂合酶原位制备所述果糖酐。
使用编码葡聚糖裂合酶的核苷酸序列做为赋予或改进植物
逆境耐性的手段,其中所述核苷酸序列在所述植物中原位表
达。
使用编码葡聚糖裂合酶的核苷酸序列做为赋予或改进葡萄
转化的手段,其中所述核苷酸序列在所述葡萄中原位表达。
使用编码葡聚糖裂合酶的核苷酸序列做为提高食品(优选为
水果或蔬菜,更优选为新鲜水果或新鲜蔬菜)中抗氧化剂水平的
手段,其中所述核苷酸序列在所述食品中原位表达。
使用编码葡聚糖裂合酶的核苷酸序列做为在食品中产生药
物的手段,其中所述核苷酸序列在所述食品中原位表达。
给予包含抗氧化剂的食品的方法,其中所述抗氧化剂处于
药用可接受的量,并做为药物起作用;并且其中已在所述食品
中借助编码葡聚糖裂合酶的核苷酸序列制备所述抗氧化剂。
使用编码葡聚糖裂合酶的核苷酸序列做为在食品中产生营
养药的手段,其中所述核苷酸序列在所述食品中原位表达。
给予包含抗氧化剂的食品的方法,其中所述抗氧化剂处于
营养药可接受的量,并做为营养药起作用;并且其中已在所述
食品中借助编码葡聚糖裂合酶的核苷酸序列制备所述抗氧化
剂。
术语“营养药”指可以做为营养物质(即,它适于例如口服)起作
用、又可以表现出药学效果和/或化妆品效果的化合物。
与加入抗氧化剂介质的常用方法相反(所述介质诸如食品),我们
现在发现可以在所述介质中原位制备特定的抗氧化剂。
原位制备抗氧化剂特别优越,因为需要向所述介质中加入较少
的其它抗氧化剂或不需要加入其它抗氧化剂,所述介质诸如食品。
本发明由于提供改进植物逆境耐性的方法,因此也被认为是优
越的。
由于本发明提供能生存发育的转化葡萄,因此也是优越。
本发明是更加优越的,因为它能得食品中的抗氧化剂水平提
高。这可能具有有益的健康意义。在此方面,近期的报道(例如
Biotechnology Newswatch 1997年4月21日“在咖啡中发现的与水果中
同样有效的抗氧化剂”,Marjorie Shaffer)提出抗氧化剂例如在防止或
抑制癌形成方面具有药物的益处。
以前Badiani等在Agro-Food-Industry Hi-Tech(1996年3月/4月,第
21-26页)中以及综述了在植物中一般性原位制备抗氧化剂。但是注意
到该综述没有提及从葡聚糖原位制备抗氧化剂,更不用说利用重组葡
聚糖裂合酶原位制备抗氧化剂。
优选地,所述葡聚糖包含α-1,4键。
优选地,所述葡聚糖是淀粉或淀粉的单位。
优选地,所述葡聚糖是重组酶的底物,使得所述葡聚糖与所述
重组酶的接触产生所述抗氧化剂。
优选地,所述酶是葡聚糖裂合酶。
优选地,所述酶是α-1,4葡聚糖裂合酶。
优选地,所述酶包含SEQ ID No 1-6所示序列的任何一个序列,
或其变异体、同源物或片段。
优选地,所述酶是SEQ ID No 1-6所示序列的任何一个序列。
优选地,所述酶由包含SEQ ID No 7-12所示序列的任何一个序列
的核苷酸序列或其变异体、同源物或片段编码。
优选地,所述酶由具有SEQ ID No 7-12所示序列的任何一个序列
的核苷酸序列编码。
优选地,所述抗氧化剂是果糖酐。
优选地,所述抗氧化剂是1,5-D-果糖酐。
优选地,所述介质是食品,或用于制备食品。
优选地,所述食品是饮料。
优选地,所述饮料是酒精饮料。
优选地,所述饮料是葡萄酒。
优选地,所述抗氧化剂在所述组分中原位制备,然后释放进入
所述介质中。
优选地,所述组分是植物或其一部分。
优选地,所述组分是谷类作物或水果的整体或一部分。
优选地,所述组分是葡萄的整体或其一部分。
所述介质可以用作食品或用于制备食品,所述食品包括饮料。
或者,所述介质可以用于聚合物化学。在此方面,所述原位产生的抗
氧化剂可以因此做为在例如聚合物合成的过程中的氧清除剂,所述聚
合物的合成诸如生物可降解塑料的合成。
按照本发明,在所述介质中原位制备所述抗氧化剂(优选为果糖
酐)。换言之,在所述介质中原位制备的所述抗氧化剂(优选为果糖酐)
用作所述介质中的抗氧化剂。在一个实施方案中,在所述介质中原位
制备的所述抗氧化剂(优选为果糖酐)用作所述介质中的主要的抗氧化
剂。
本文使用的术语“在所述介质中原位”包括由所述组分表达的
重组酶对葡聚糖的作用制备抗氧化剂,该葡聚糖是所述酶的底物。该
术语亦包括通过由所述组分表达的重组酶对所述组分内的葡聚糖作用
制备抗氧化剂和所述抗氧化剂的后续产生。该术语亦包括由所述组分
表达所述重组酶并且然后将其释放进入所述介质中,该酶作用于存在
于所述介质中的葡聚糖,以在所述介质中形成所述抗氧化剂,其中该
葡聚糖是所述酶的底物。该术语亦包括在所述介质中存在另一组分或
将另一组分加入所述介质,该组分然后表达重组核苷酸序列,导致所
述介质的一部分或全部暴露于抗氧化剂,所述抗氧化剂可以是由另一
组分表达和释放的重组酶或重组蛋白质,或可以是在已暴露于所述重
组酶或重组蛋白质的介质中的葡聚糖的产物,该葡聚糖是所述酶的底
物。
本文使用的术语“通过使用重组DNA技术”包括通过使用作用
于所述葡聚糖的重组酶或重组蛋白质得到任何抗氧化剂。该术语亦包
括通过使用作用于重组葡聚糖的酶或蛋白质得到的抗氧化剂。
与本发明相关的术语“淀粉”包括天然淀粉、降解淀粉、改性
淀粉,包括其组分直链淀粉和支链淀粉以及其葡萄糖单位。
与所述酶相关的术语“变异体”、“同源物”或“片段”包括
所述序列的一个(或多个)氨基酸的任何置换、变异、修饰、取代、缺
失或添加,只要产生的氨基酸序列具有α-葡聚糖裂合酶活性,优选至
少具有与如SEQ ID No 1-6所示酶的任何一个的相同的活性。具体地
说,术语“同源物”包括结构和/或功能方面的同源性,只要产生的
酶具有α-葡聚糖裂合酶活性。关于序列同源性,与SEQ ID No 1-6所
示序列的任何一个的同源性优选地为至少75%,更优选为至少85%,
更加优选为至少90%。与SEQ ID No 1-6所示序列的任何一个的同源性
更加优选为至少95%,更加优选为至少98%。
与编码所述酶的核苷酸序列相关的术语“变异体”、“同源
物”或“片段”包括所述序列的一个(或多个)核酸的任何置换、变
异、修饰、取代、缺失或添加,只要产生的核苷酸序列编码具有α-葡
聚糖裂合酶活性的酶,该酶优选至少具有与如SEQ ID No 1-6所示酶
的任何一个的相同的活性。具体地说,术语“同源物”包括结构和/
或功能方面的同源性,只要产生的核苷酸序列编码酶具有α-葡聚糖裂
合酶活性的酶。关于序列同源性,与SEQ ID No 7-12所示序列的任何
一个的同源性优选地为至少75%,更优选为至少85%,更加优选为至
少90%。与SEQ ID No 7-12所示序列的任何一个的同源性更加优选为
至少95%,更加优选为至少98%。
上述术语与所述序列的等位变异同义。
本发明亦包括可以与本发明的核苷酸序列杂交的核苷酸序列。
与本发明相关的术语“核苷酸”包括cDNA。
按照本发明,因此提供了在可氧化介质中原位制备抗氧化剂的
方法。在一个优选实施方案中,所述抗氧化剂是果糖酐,更优选是
1,5-D-果糖酐。1,5-D-果糖酐已经被化学合成(Lichtenthaler,载于
Tetrahedron Letters第21卷第1429-1432页)。在WO 95/10616、WO
95/10618和GB-B-2294048中进一步讨论了1,5-D-果糖酐。
使用1,5-D-果糖酐做为抗氧化剂的主要优点是,它是一种天然产
物、是不可代谢的、容易制造、是水溶性的,并且它一般无毒。
按照WO 95/10616、WO 95/10618和GB-B-2294048,可以通过利
用α-1,4-葡聚糖裂合酶对基于α-1,4-葡聚糖的底物进行酶修饰而制备
1,5-D-果糖酐。典型的基于α-1,4-葡聚糖的底物是淀粉。
目前,淀粉在工业中有广泛的用途,主要是因为它是廉价的原
材料。在本领域中有许多有关淀粉的参考资料。例如,Salisbury和
Ross在Plant Physiology(第4版,1991,Wadsworth Publishing
Company出版,特别是第11.7节)。然而,简言之,淀粉是植物主要的
能量储备之一。常常在许多植物的无色质体(造粉体)中、在贮藏组织
中和在叶绿体的基质中发现淀粉。淀粉是多糖碳水化合物。它包含二
种主要成分:直链淀粉和/或支链淀粉。直链淀粉和/或支链淀粉均由
α(1,4)-连接的葡萄糖单位(即糖基残基)直链组成,但是支链淀粉还包
含α(1,6)分枝的葡萄糖单位。
在WO 95/10616和WO 95/10618中讨论的适于从淀粉产生1,5-D-
果糖酐的一些葡聚糖裂合酶以SEQ I.D.No 1-4显示。在GB-B-2294048
中讨论的适于从淀粉产生1,5-D-果糖酐的一些葡聚糖裂合酶以SEQ I.D.
No 5-6显示。
一些编码在WO 95/10616和WO 95/10618中讨论的适于从淀粉产
生1,5-D-果糖酐的葡聚糖裂合酶的核苷酸序列如SEQ I.D.No 7-10所
示。一些编码在GB-B-2294048中讨论的适于从淀粉产生1,5-D-果糖酐
的葡聚糖裂合酶的核苷酸序列如SEQ I.D.No 11-12所示。
在WO 94/09122中讨论了再一种葡聚糖裂合酶。
可以从诸如真菌(优选为中肋羊肚菌(Morchella costata)或普通羊
肚菌(Morchella vulgaris))的来源、或从真菌感染的藻类(优选为
Gracilariopsis lemaneiformis)、或仅从藻类(优选为Gracilariopsis
lemaneiformis)克隆编码所述酶的重组核苷酸序列。
在一个优选实施方案中,通过用重组α-1,4-葡聚糖裂合酶处理α-
1,4-葡聚糖制备α-1,5-果糖酐,所述葡聚糖裂合酶诸如SEQ I.D.No 1-6
所示的任何一个。
可以在WO 95/10616、WO 95/10618和GB-B-2294048的叙述中找
到怎样制备如SEQ I.D.No 1-6所示的酶的详细评述。同样,可以在
WO 95/10616、WO 95/10618和GB-B-2294048的叙述中找到怎样分离
和克隆核苷酸序列SEQ I.D.No 7-12的详细评述。
如果所述葡聚糖包含不同于α-1,4-键的键或者在α-1,4-键之外还
有其它的键,则可以将所述重组α-1,4-葡聚糖裂合酶与可以打断这种
其它键的合适的试剂联合使用,所述合适的试剂例如重组水解酶,它
优选为重组葡聚糖水解酶。
在Sambrook,J.,Fritsch,E.F.,Maniatis T.(编辑)分子克隆实验指
南,第二版,冷泉港实验室出版社,纽约1989中找到重组DNA技术
的一般叙述。
为表达核苷酸序列,宿主生物可以是原核生物或真核生物。合
适的原核生物宿主的实例包括大肠杆菌和枯草杆菌。原核宿主转化的
叙述在本领域中已充分记载,例如参见Sambrook等(分子克隆实验指
南,第二版,1989,冷泉港实验室出版社)。如果使用原核宿主,则
在转化之前可能需适当修饰所述基因,例如通过除去内含子而修
饰。
在一个实施方案中,宿主生物可以是曲霉属(Aspergillus),例如
黑曲霉(Aspergillus niger)。通过遵循Rambosek,J.和Leach,J.1987(丝
状真菌的重组DNA:进展和展望。CRC Crit.Rev.Biotechnol.6:357-
393)、Davis R.W.1994(曲霉属中的异源基因表达和蛋白分泌。载
于:Martinelli S.D.,Kinghorn J.R.(编辑)曲霉属:50年。Progress in
industrial microbiology第29卷。Elsevier Amsterdam 1994.第525-560
页)、Balance,D.J.1991(丝状真菌的转化系统和真菌基因结构总览。
载于:Leong,S.A.,Berka R.M.(编辑)分子工业真菌学.丝状真菌的系
统和应用。Marcel Dekker Inc.New York 1991.第1-29页)和Turner G.
1994(遗传操作载体。载于:Martinelli S.D.,Kinghorn J.R.(编辑)曲霉
属:50年。Progress in industrial microbiology第29卷。Elsevier
Amsterdam 1994.第641-666页)的叙述,可以制备转基因曲霉属。不
过,以下评述提供了那些制备转基因曲霉属的叙述的概要。
近一个世纪以来,丝状真菌已广泛地应用于许多类型的工业中
以生产有机化合物和酶。例如,传统日本酒曲和酱油的发酵就使用了
曲霉属菌种(Aspergillus sp)。在本世纪,黑曲霉亦被用于生产有机
酸,特别是柠檬酸,并用于生产在工业中使用的各种酶。
丝状真菌在工业中得到广泛的应用的原因主要有二个。首先,
丝状真菌可以产生大量的胞外产物,例如酶和诸如抗生素或有机酸的
有机化合物。其次,丝状真菌可以在低成本底物上生长,例如谷物、
糠、甜菜粕等。同样的原因使得丝状真菌成为异源表达按照本发明的
重组酶的宿主的有吸引力的生物。
为制备所述转基因曲霉属,通过将需要的核苷酸序列插入设计
用于在丝状真菌中表达的构建物中,制备表达构建物。
已经开发了几种类型的用于异源表达的构建物。这些构建物可
以包含一个在真菌中有活性的启动子。启动子的实例包括高度表达的
胞外酶的真菌启动子,例如葡糖淀粉酶启动子或α-淀粉酶启动子。可
以将所述核苷酸序列与信号序列融合,所述信号序列指导由所述核苷
酸序列编码的蛋白的分泌。通常使用真菌来源的信号序列。在真菌中
有活性的终止子位于表达系统末端。
在真菌中已开发了另一种类型的表达系统,其中可以将所述核
苷酸序列融合至编码稳定蛋白的真菌基因的较小部分或较大部分。这
样可以稳定由所述核苷酸序列编码的蛋白。在这种系统中,可以将特
定蛋白酶识别的酶切位点导入所述真菌蛋白和由所述核苷酸序列编码
的蛋白之间,使得可以由所述特定蛋白酶在该位置酶切产生的融合蛋
白,由此释放由所述核苷酸序列编码的蛋白质。作为实例,可以导入
由在至少一些曲霉属菌中发现的KEX-2样肽酶识别的位点。这种融合
导致体内酶切,产生对所述表达产物的保护,而不是对较大的融合蛋
白的保护。
已报道了几种编码细菌、真菌、脊椎动物和植物蛋白质的基因
在曲霉属中的异源表达。如果所述核苷酸序列未与信号序列融合,则
所述蛋白质可以在细胞内存储。这种蛋白将在细胞质中积累,并且通
常不会糖基化,这对一些细菌蛋白是有利的。如果所述核苷酸序列配
有信号序列,则所述蛋白质将在胞外累积。
对于产物稳定性和宿主菌株的修饰而言,一些异源蛋白质当分
泌进入真菌培养液中时不是非常稳定。大多数真菌产生降解异源蛋白
质的几种胞外蛋白酶。为避免这种问题,已经使用了几种降低了蛋白
酶产生的特定真菌菌株做为异源生产的宿主。
为转化丝状真菌,已针对许多丝状真菌开发了几种转化方案
(Ballance 1991,出处同上)。许多这些方案都是基于制备原生质体和
使用PEG和Ca2+离子将DNA导入所述原生质体。然后再生所述转化的
原生质体,并使用各种选择性标记选择所述转化的真菌。用于转化的
标记之中有一些是营养缺陷标记(例如argB、trpC、niaD和pyrG)、抗
生素抗性标记例如苯菌灵抗性、潮霉素抗性和腐草霉素抗性。常用的
转化标记是构巢曲霉(A.nidulans)的amdS基因,其为高拷贝数,允许
所述真菌以丙烯酰胺做为唯一氮源而生长。
在另一个实施方案中,所述转基因生物可以是酵母菌。在这方
面,酵母菌也已被广泛地用作异源基因表达的载体。酿酒酵母
(Saccharomyces cerevisiae)有长期的工业应用历史,包括其用于异源
基因表达。Goodey等(1987,Yeast Biotechnology,D R Berry等编辑,第
401-429页,Allen and Unwin,London)和King等(1989,酵母的分子和细
胞生物学,E F Walton和G T Yarronton编辑,第107-133页,Blackie,
Glasgow)已经综述了异源基因在酿酒酵母中的表达。
由于几个原因,酿酒酵母很适于异源基因表达。首先,它对人
类无致病性,并且不会产生某些内毒素。其次,它有几个世纪的各种
目的的商用使用的很长的安全使用历史。这使得它有广泛的公众接受
性。第三,对该生物体的广泛商业应用和研究已经产生有关酿酒酵母
的遗传学和生理学以及大规模发酵特征的大量知识。
E Hinchcliffe E Kenny(1993,“做为异源基因表达载体的酵母”,
酵母,第5卷,Anthony H Rose和J Stuart Harrison编辑,第2版,
Academic Press Ltd.)给出了在酿酒酵母中异源基因表达和基因产物分
泌的原则的综述。
可以得到几种类型的酵母载体,包括整合型载体,其需要与宿
主基因组重组以保持它们,还有自主复制型质粒载体。
为制备转基因酵母属菌,通过将所述核苷酸序列插入设计用于
在酵母中表达的构建物中,制备表达构建物。已经开发了几种类型的
用于异源表达的构建物。所述构建物包含融合至所述核苷酸序列的在
酵母中有活性的启动子,通常使用酵母来源的启动子,例如GAL1启
动子。通常使用酵母来源的信号序列,例如使用了编码SUC2信号肽
的序列。在酵母中有活性的终止子位于所述表达系统末端。
已经开发了用于酵母转化的几种转化方案。例如,可以通过遵
循Hinnen等所述(1978,Proceedings of the National Academy of
Sciences of the USA 75,1929);Beggs,J D(1978,Nature,London,275,
104);和Ito,H等(1983,J Bacteriology 153,163-168)制备转基因酵母属
菌。
使用各种选择标记选择转化的酵母细胞。用于转化的标记之中
有许多营养缺陷标记(诸如LEU2、HIS4和TRP1),以及显性抗生素抗
性标记例如氨基糖苷抗生素标记,例如G418。
另一种宿主生物是植物。在此方面,本领域有充实的制备转基
因植物的参考资料。二个提供可以使用以制备转基因植物的技术类型
的背景评述的文件是EP-B-0470145和CA-A-2006454,其一部分评述
在下文提供。
遗传修饰植物构建的基本原则是,将遗传信息插入到所述植物
的基因组中,使得可以稳定地保持插入的遗传物质。
有几种插入遗传信息的技术,二条主要的原则是直接导入所述
遗传信息和通过使用载体系统导入所述遗传信息。可以在Potrykus
(Annu Rev Plant Physiol Plant Mol Biol[1991]42:205-225)和Christou
(Agro-Food-Industry Hi-Tech 1994年3/4月17-27)的文章中找到一般技
术的综述。
因此,在一个方面,本发明涉及载体系统,该载体系统携带重
组核苷酸序列并且可以将所述核苷酸序列导入诸如植物的生物体的基
因组,其中所述核苷酸序列可以在原位产生抗氧化剂。
所述载体系统可以包含一个载体,但是它可以包含至少二个载
体。在二个载体的情况下,通常将所述载体系统称为双载体系统。在
Gynheung An等(1980),双载体,Plant Molecular Biology Manual A3,
1-19中进一步详细描述了双载体系统。
一种广泛使用的用指定启动子或核苷酸序列或构建物转化植物
细胞的系统,基于使用源自根癌农杆菌(Agrobacterium tumefaciens)的
Ti质粒或源自毛根农杆菌(Agrobacterium rhizogenes)的Ri质粒(An等
(1986),Plant Physiol. 81,301-305和Butcher D.N.等(1980),植物病理学
家的组织培养方法,编辑:D.S.Ingrams和J.P.Helgeson,203-208)。
已经构建了几种不同的Ti和Ri质粒,所述质粒适于构建上述植物
或植物细胞构建物。
本发明的核苷酸序列应优选在T-DNA的边界序列之间或邻近T-
DNA序列插入所述Ti质粒,以避免破坏紧接T-DNA边界的序列,因
为看来这些区域中的至少一个对于将修饰的T-DNA插入植物基因组是
必需的。
从上述解释可以理解,如果所述生物体是植物,则本发明的载
体系统优选为包含感染植物所必需的序列(例如,vir区),并且包含T-
DNA序列的至少一个边界部分,所述边界部分与所述遗传构建物位
于同一个载体上。优选地,所述载体系统是根癌农杆菌Ti-质粒或毛
根农杆菌Ri-质粒或其衍生物,因为这些质粒在构建转基因植物方面
是众所周知的并得到广泛应用的,许多现有的载体系统都是基于这些
质粒或其衍生物。
在构建转基因植物时,本发明的核苷酸序列或构建物或载体可
以首先在微生物中构建,在所述微生物中,在插入所述植物之前,所
述载体可以复制并且所述微生物易于操作。有用的微生物的实例是大
肠杆菌,但是也可以使用具有上述性质的其它微生物。当如上述定义
的载体系统的载体已在大肠杆菌中构建后,如果需要,就将其转移进
入合适的农杆菌菌株,例如根癌农杆菌。因此包含本发明的第一核苷
酸序列或构建物的Ti-质粒优选地转移进入合适的农杆菌菌株,例如
根癌农杆菌,以得到包含本发明的启动子或核苷酸序列或构建物的农
杆菌细胞,所述DNA接着转移进入欲修饰的所述植物细胞。
如CA-A-2006454中所报道的,可以得到大量的克隆载体,它们
含有大肠杆菌中的复制系统和允许选择转化的细胞的标记。所述载体
包括例如pBR322、pUC系列、M13 mp系列、pACYC 184等。如此,
本发明的启动子或核苷酸或构建物可以导入所述载体中的合适限制位
置。所述包含的质粒用于转化大肠杆菌。将所述大肠杆菌细胞在合适
的营养培养基中培养,然后收获和溶菌。然后回收所述质粒并且进行
分析,例如通过以下技术的任何一种或多种进行分析:序列分析、限
制性分析、电泳和其它生化-分子生物学方法。在每次操作之后,可
以将使用的DNA进行限制酶切或通过PCR计数选择性扩增,并且与下
一个DNA序列连接。每个序列可以在同一质粒或不同的质粒中克
隆。
遵循将按照本发明的核苷酸序列或构建物或载体导入植物的每
个方法后,可能必需存在和/或插入其它DNA序列。如果,例如,使
用Ti-或Ri-质粒转化植物细胞,则可以连接所述Ti-和Ri-质粒T-DNA的
至少右边界、经常是右边界和左边界,做为导入基因的侧翼区域。已
深入研究了使用T-DNA转化植物细胞,在EP-A-120516;Hoekema,载
于:双载体植物载体系统分支-drukkerij Kanters B.B.,Alblasserdam,
1985,第5章;Fraley等,Crit.Rev.Plant Sci.,4:1-46;和An等,EMBO J.
(1985)4:277-284中进行了描述。
用农杆菌直接感染植物组织是简单的技术,该技术已被广泛使
用,在Butcher D.N.等(1980),植物病理学家的组织培养方法,编辑:
D.S.Ingrams和J.P.Helgeson,203-208进行了描述。对于这一主题的其
它叙述请参见Potrykus(Annu Rev Plant Physiol Plant Mol Biol[1991]
42:205-225)和Christou(Agro-Food-Industry Hi-Tech 1994年3/4月17-
27)。使用这一技术,可以在所述植物的某一部分或组织进行植物的
感染,即,在所述植物的叶、根、茎或其它部分的一部分上进行感
染。
通常,使用携带所述第一核苷酸序列或构建物的农杆菌直接感
染植物组织时,在欲感染的植物上制造创伤,例如,通过用刀片切割
所述植物或用针头针刺所述植物或用摩擦性物质摩擦所述植物。然后
用所述农杆菌接种伤口。然后让已接种的植物或植物部分在合适的培
养基上生长。
当构建植物细胞时,按照众所周知的组织培养方法,在按照本
发明的培养基中生长和可选地保持这些细胞,例如通过在添加了诸如
氨基酸、植物激素、维生素等的必需生长因子的合适培养基中培养所
述细胞,但是其中该培养基包含按照本发明的一种组分。所转化的细
胞再生成为遗传修饰的植株可以通过使用从细胞或组织培养再生植株
的方法完成,例如通过选择转化的苗并在含有适当营养物、植物激素
等的培养基上继代培养所述苗。
可以在EP-A-0449375中找到植物转化的其它叙述。
甚至可以参考Spngstad等(1995 Plant Cell Tissue Organ Culture 40
第1-15页),因为这些作者提供了转基因植物构建的一般性概述。
在一个实施方案中,所述植物是葡萄藤。在本领域中有一些关
于怎样制备转化葡萄藤的叙述。例如,可以参考Baribault等(J Exp Bot
41(229)1990 1045-1050)、Baribault等(Plant Cell Rep 8(3)1989 137-
140)、Scorza等(J Am Soc Horticultural Science 121(4)1996 616-619)、
Kikkert等(Plant Cell Reports 15(5)1996 311-316)、Golles等(Acta
Hortic 1997第447卷号:体外培养和育种的园艺生物技术第265-275
页)、Gray和Scorza(WO-A-97/49277)和Simon Robinson等(“21世纪的
生物技术-食品和健康”中提交的会议摘要和论文,Adelaide,澳大利
亚,1998)。做为实例,Robinson等(出处同上)公开了转化葡萄藤的方
法,其中在从另一种组织形成的愈伤组织上诱导体细胞胚,使用农杆
菌感染将靶基因转移进所述胚组织。
可以进一步参考Andrew Walker在Nature Biotechnology(14卷,
1996年5月,第582页)中的叙述,表述为:
“葡萄做为世界上最重要的水果植物之一,非常难以进行
工程改造,因为它有高水平的鞣质和酚,它们干扰细胞培养和
转化;所述化合物快速氧化并促使葡萄细胞腐烂。”
在同一期Nature Biotechnology中,Perl等(第624-628页)报道了使
用聚乙烯聚吡咯烷酮和二硫苏糖醇的组合改进农杆菌感染时葡萄转化
的生存力。
由此,本发明提供了转化葡萄的替代方法。在此方面,按照本
发明转化的葡萄原位产生的抗氧化剂改进了农杆菌感染时葡萄转化的
生存力。
因此,按照本发明的一个方面,提供了原位制备的抗氧化剂用
于有效转化葡萄的用途。
在一些情况下,需要使所述重组酶或蛋白质容易地分泌进入所
述培养基以做为其中的抗氧化剂起作用或在其中产生抗氧化剂。在这
种情况下,将编码所述重组酶的DNA融合至特别是源自选定宿主的
合适的信号序列、适当的启动子和适当的终止子。
例如,为在黑曲霉中表达,将gpdA(源自构巢曲霉(Aspergillus
nidulans)的甘油醛-3-磷酸脱氢酶基因)启动子和信号序列融合至编码
所述成熟裂合酶的DNA的5’末端。将源自黑曲霉trpC基因的终止子序
列置于所述基因的3’(Punt,P.J.等,1991-(1991):J.Biotech.17,19-
34)。将此构建物插入含有大肠杆菌复制起点和选择起点以及黑曲霉
的选择标记的载体。黑曲霉的选择标记的实例是amdS基因、argB基
因、pyrG基因、hygB基因、BmlR基因,它们都已被用于选择转化
体。该质粒可以转化进入黑曲霉,可以从所述转化体的培养基中回收
成熟的裂合酶。最终可以将此构建物转化进入蛋白酶缺陷型菌株,以
降低所述裂合酶在培养基中的蛋白酶水解降解(Archer D.B.等1992-
Biotechnol.Lett.14,357-362)。
另外,如上述表明的,除了使用黑曲霉做为宿主外,还有其它
工业上重要的微生物可以用作表达系统。这些其它宿主的实例包括:
米曲霉(Aspergillus oryzae)、曲霉属菌种(Aspergillus sp.)、木霉属菌种
(Trichoderma sp.)、酿酒酵母、克鲁维酵母属菌种(Kluyveromyces
sp.)、汉逊酵母属菌种(Hansenula sp.)、毕赤酵母属菌种(Pichia sp.)、
枯草杆菌(Bacillus subtilis)、解淀粉芽孢杆菌(B.amyloliquefaciens)、
芽孢杆菌属菌种(Bacillus sp.)、链霉菌属菌种(Streptomyces sp.)或大肠
杆菌。
按照本发明,可以将合适的标记或选择工具导入欲用所述核苷
酸序列转化的宿主。合适的标记或选择工具的实例在以下文献中的任
何一个中都有描述:WO-A-93/05163、WO-A-94/20627、GB专利申
请第9702591.0号(1997年2月7日申请)、GB专利申请地9702576.1号
(1997年2月7日申请)、GB专利申请第9702539.9号(1997年2月7日申
请)、GB专利申请地9702510.0号(1997年2月7日申请)和GB专利申请第
9702592.8号(1997年2月7日申请)。
简言之,本发明涉及包括制备一种包含抗氧化剂和至少一种其
它组分的介质的方法,该方法包括在所述介质中原位制备所述抗氧化
剂;并且其中所述抗氧化剂通过使用重组DNA技术从葡聚糖制备和/
或所述抗氧化剂通过使用重组葡聚糖裂合酶制备。
在一个优选实施方案中,本发明涉及制备包括抗氧化剂和至少
一种其它组分的介质的方法,所述方法包括在所述介质中原位制备所
述抗氧化剂;并且其中所述抗氧化剂通过使用重组葡聚糖裂合酶由葡
聚糖制备。
在一个更优选的实施方案中,本发明涉及制备包含抗氧化剂和
至少一种其它组分的介质的方法,所述方法包括在所述介质中原位制
备所述抗氧化剂;其中所述抗氧化剂通过使用重组葡聚糖裂合酶由葡
聚糖制备;并且其中所述抗氧化剂是果糖酐。
现在仅通过实施例描述本发明。
转基因葡萄
按照Perl等(出处同上)的叙述制备转基因葡萄,但是其中使用聚
乙烯聚吡咯烷酮和二硫苏糖醇的组合是可选的。在这些研究中,用如
SEQ ID No 7-12提出的任何一个核苷酸序列转化所述葡萄。所述转化
导致原位制备1,5-D-果糖酐。由于前述的一个或多个理由,所述转化
的葡萄是有益的。
这些研究的细节如下。
转化研究的组织培养系统
从葡萄优质无核栽培品种(Vitis vinifera CV Superior Seedless)的花
药营养组织发育出长期体细胞胚发生(somatic embryogenic)愈伤组织
培养物。先前描述了花药培养、诱导体细胞胚发生和胚胎培养物的保
持方法(Perl等,1995,Plant Sci 104:193-200)。简言之,将胚胎发生愈
伤组织保持在固化(0.25%脱乙酰吉兰糖胶)MS培养基(Murashige和
Skoog,1962,Physiol Plant 15:473-497)上,该MS培养基添加了6%蔗
糖、2mg/L 2,4-二氯苯氧基乙酸(2,4-D)、5mg/L吲哚-3-天冬氨酸
(IASP)、0.2mg/L 6-苄基腺嘌呤(BAP)和1mg/L脱落酸(ABA)。将所
述愈伤组织转移至添加了同样的植物激素但用2mg/L 2-萘氧基乙酸
(NOA)取代了2,4-D的MS培养基上,诱导原胚发生愈伤组织。该阶段
用于转化实验。
农杆菌菌株
为研究葡萄胚胎发生愈伤组织对存在不同农杆菌菌株的敏感
性、或者为进行稳定转化实验,使用以下根癌农杆菌菌株尝试协同培
养:EHA 101-p492(Perl等1993,Bio/Technology 11:715-718);LBA
4404-pGPTV(Becker等,1992,Plant Mol Biol 20:1195-1197);和GVE
3101-pPCV91(Vancanneyt等,1990,Mol Gen Genet 220:245-250)。这
些菌株带有分别赋予对卡那霉素(nptII)、basta(bar)和潮霉素(hpt)抗性
的双载体,它们均在胭脂氨酸合酶(NOS)启动子和终止子的控制之
下。将细菌在液体LB培养基中与抗生素一起于28℃、200rpm下培养
24小时。
协同培养
为研究葡萄胚胎发生愈伤组织对不同农杆菌菌株的敏感性,从
农杆菌菌株的过夜培养物制备具有不同光密度(于630nm时为0.1-0.7)
的细菌培养物。将细菌于5000rpm离心5分钟,再悬浮于无抗生素
McCown Woody植物培养基(WPM)(Lloyd和McCown,1981,Int Plant
Prop Soc Proc 30:421-427)。将3克鲜重的胚胎发生愈伤组织(转移至含
有NOA的培养基7天后)再悬浮于10ml过夜培养细菌悬浮液5分钟,吸
干并转移至含有再生培养基[基础WPM培养基,添加噻苯隆(TDZ)(0.5
mg/L)、玉米素核苷(ZR)(0.5mg/L)和蔗糖(3%)]的培养皿。用脱乙酰
吉兰糖胶(0.25%w/v)固化所述再生培养基,所述愈伤组织在起始时排
干多余的细菌后,于25℃于黑暗中协同培养不同的时间(从5分钟至7
天)。对于稳定转化实验,从LBA 4404或GVE 3101的过夜培养物制备
接种物(于630nm时OD 0.6)。将细菌于5000rpm离心5分钟,再悬浮于
无抗生素WPM培养基中。将胚胎发生愈伤组织(3克鲜重)再悬浮于10
ml细菌中5分钟,吸干并转移至含有固化(0.25%w/v)脱乙酰吉兰糖胶
再生培养基的培养皿,该培养基添加了不同的抗氧化剂。所述愈伤组
织于25℃于黑暗中协同培养48小时。
选择性培养
协同培养48小时后,将所述胚胎发生愈伤组织在含有抗氧化剂
的再生培养基上于黑暗中保持7天。接着,将愈伤组织收集在无菌金
属网上,在40μE/m2/s(白色荧光管)下于25℃转移至新鲜WPM再生培
养基。所有的再生培养基都添加了400mg/L头孢噻肟、1.5g/L麦芽汁
和不同的选择标记:卡那霉素(50-500mg/L)、潮霉素(15mg/L)和
Basta(1-10mg/L)。使用了潮霉素浓度的周期性增加。将推测的转化
愈伤组织在添加了15mg/L潮霉素的再生培养基上培养。每二周将再
生的愈伤组织转移至分别添加了20和25mg/L潮霉素的新鲜培养基
上。亦将对照、未转化的葡萄愈伤组织在选择性培养基上培养,并周
期性地暴露于升高的潮霉素浓度。将在选择性再生培养基上培养8-10
周的愈伤组织上发育的绿色不定胚转移至发芽培养基。如所述(Perl
等,1995,Plant Sci 104:193-200),在WPM上诱导胚胎发芽、生根和
后续小植物的发育,所述WPM添加了25mg/L潮霉素或10mg/L
basta。使用如所述(Perl等,1995,Plant Sci 104:193-200)添加了0.1
mg/L NAA的固化WPM培养基,得到玻璃化异常小植物向正常外表葡
萄小植物的转化。
转基因马铃薯
可以在我们的共同未决的专利申请PCT/EP96/03053、
PCT/EP96/03052和PCT/EP94/01082(每个的内容通过引用结合到本文
中)中找到马铃薯转化的一般叙述。
对于目前的研究,采用了以下程序。
质粒构建
将含有辅助vir质粒pRAL4404(Hoekema等,1983 Nature 303第
179-180页)的解除武装(disarmed)的根癌农杆菌菌株LBA 4404,在含
有100mg l-1利福平和500mg l-1硫酸链霉素的YMB琼脂(K2HPO4.3H2O
660mg l-1,MgSO4 200mg l-1,NaCl 100mg l-1,甘露醇10g l-1,酵母膏
400mg l-1,0.8%w/v琼脂,pH7.0)上培养。使用Holters等的冻融法
(1978 Mol Gen Genet 163 181-187),用pVICTOR IV GNG E35S nagB
IV2’或pVICTOR IV GNG rbc nagB IV2’或pVICTOR IV GNG E35S
nagB’(各对应于pVICTOR IV GNG E35S nagB IV2或pVICTOR IV
GNG rbc nagB IV2或pVICTOR IV GNG E35S nagB,但是其中那些质
粒的每一个亦含有与功能性启动子可操作地连接的如SEQ ID No 7-12
所示的任何一个核苷酸序列)完成转化,将转化体在含有100mg l-1利
福平和500mg l-1链霉素和50mg l-1硫酸庆大霉素的YMB琼脂上选择。
植物转化
将马铃薯Saturna栽培品种(Solanum tuberosum cv Saturna)的苗培
养物在含有Murashige Skoog基础盐(Sigma M6899)(Murashige和Skoog,
1965,Physiol Plant 15 473-497)、具有2μM硫代硫酸银和如Linsmaier和
Skoog(1965 Physiol Plant 18 100-127)描述的营养物和维生素的LS琼脂
上保持。以每日16小时光周期于25℃保持所述培养物。约40天后,进
行继代培养,在此期间除去叶,将苗切成约8mm长的单节段。
将约40天成熟度(5-6cm高)的苗培养物切成8mm的节间段,将其
放置在液体LS培养基中,该培养基含有用pVICTOR IV GNG E35S
nagB IV2’或pVICTOR IV GNG rbc nagB IV2’或pVICTOR IV GNG
E35S nagB’转化的根癌农杆菌(A660=0.5,光程1cm)。于室温温育30分
钟后,通过将所述节间段于无菌滤纸上吸干干燥,转移至含有2mg l-1
2,4-D和500μg l-1反式玉米素的LS琼脂(0.8%w/v)。用滤纸覆盖所述外
植体,用LS培养基湿润,用纱布于25℃覆盖3天。该处理后,用含有
800mg l-1羧苄青霉素的液体LS培养基洗涤所述节段,转移至含有1
mg l-1反式玉米素、100μg l-1赤霉酸(GA3)、具有做为选择剂的蔗糖
(例如7.5g l-1)和葡糖胺(例如2.5g l-1)的LS琼脂(0.8%w/v)。
每3-4周将所述节段继代培养至新鲜基质。在3-4周内,从所述节
段发育出苗,新苗的形成持续3-4个月。
再生苗生根
将再生的苗转移至包含LS-基质、琼脂(8g/l)和羧苄青霉素(800
mg/l)的生根基质。
通过按照Hodal,L.等所述(Pl.Sci.(1992),87:115-122)对共导入的
β-葡糖醛酸酶基因进行GUS检测,可以确认转基因植物。
或者,通过进行NPTII检测(Radke,S.E.等,Theor.Appl.Genet.
(1988),75:685-694)或通过按照Wang等所述(1993,NAR 21第4153-
4154页)进行PCR分析,可以确认所述再生苗的转基因基因型。
转移至土壤
将新生根的植株(高度约2-3cm)从生根基质移植至土壤,置于生
长室中(21℃,16小时光照200-400uE/m2/秒)。当所述植株已经确立
后,将其转移至温室,它们在温室中生长至发育出块茎,并且植株上
部衰老。
收获
约3个月后收获马铃薯。
转基因玉米植株
介绍
自从1983年首次发表转基因植物的产生(Leemans,1993
Biotechnology 11 s22)以来,有许多产生转基因植物的公告,包括特别
是双子叶作物。
直至最近,几乎没有成功产生转基因单子叶作物的报道。单子
叶植物的这种相对较慢的进展有二个原因。首先,直至二十世纪80年
代早期,从单子叶植物的培养细胞和组织有效再生植株一直是非常困
难的。通过将来自保留形态发生潜力的未成熟和胚胎发生组织的外植
体在含有植物生长调节剂的营养培养基上培养,最终解决了这个问
题。其次,单子叶植物不是根癌农杆菌的天然宿主,意味着在双子叶
植物中使用它们的天然载体根癌农杆菌成功开发的技术多年来在单子
叶植物中是不成功的。
不过,现在可以使用诸如以下的方法成功地转化并产生育性转
基因玉米植株:(1)碳化硅晶须;(2)粒子轰击;(3)PEG处理的原生质
体摄入DNA;或(4)在组织电穿孔中摄入DNA。可以使用每个这些方
法制备特别是按照本发明的转基因玉米,Thompson综述了这些方法
(1995 Euphtytica 85第75-80页)。
具体地说,粒子枪方法已经成功地用于单子叶植物的转化。不
过,EP-A-0604662报道了转化单子叶植物的不同方法。所述方法包括
在去分化下或去分化后用含有使用潮霉素抗性基因做为选择性标记的
超级双载体的农杆菌转化单子叶植物的培养组织。使用潮霉素选择证
明转基因愈伤组织和植株的产生。可以使用该方法制备特别是按照本
发明的转基因玉米。
在EP-A-0604662的方法之后,EP-A-0672752报道了非去分化的
未成熟胚。在此方面,同时使用了潮霉素抗性和PPT抗性基因做为选
择标记,PPT产生10%或更多的独立转化植株。可以使用该方法制备
特别是按照本发明的转基因玉米。
迄今为止,看来可以从容易培育的变种-例如近交系A188成功地
产生转基因玉米植株。在此方面,请参见Ishida等的叙述(1996 Nature
Biotechnology 14第745-750页)。可以使用由这些研究工作者公开的方
法制备特别是按照本发明的转基因玉米植株。
Vasil(1996 Nature Biotechnology 14 702-703页)发表了玉米转化
的进一步的综述文章。尽管可以使用例如粒子枪介导的转化制备转化
的玉米,但是对于本研究采用了以下的程序。
质粒构建
将含有辅助vir质粒pRAL4404(Hoekema等,1983 Nature 303 179-
180页)的解除武装的根癌农杆菌菌株LBA 4404,在含有100mg l-1利
福平和500mg l-1硫酸链霉素的YMB琼脂(K2HPO4.3H2O 660mg l-1,
MgSO4 200mg l-1,NaCl 100mg l-1,甘露醇10g l-1,酵母膏400mg l-1,
0.8%w/v琼脂,pH7.0)上培养。使用Holters等的冻融法(1978 Mol Gen
Genet 163 181-187),用pVICTOR IV GNG E35S nagB IV2’或
pVICTOR IV GNG rbc nagB IV2’或pVICTOR IV GNG E35S nagB’完成
转化,将转化体在含有100mg l-1利福平和500mg l-1链霉素和50mg l-1
硫酸庆大霉素的YMB琼脂上选择。
分离和协同培养外植体
分离尺寸为1.5-2.5mm的例如玉米品系A188的未成熟胚,于25℃
在光照下与N6-AS中的根癌农杆菌菌株LBA 4404协同培养2-3天。其
后,用含有250mg/l的氨噻肟头孢霉素的无菌水洗涤所述胚,并将所
述胚转移至LS培养基和250mg/l的氨噻肟头孢霉素和浓度高至100
mg/l的葡糖胺(所述培养基此后称为LSS1)
选择转基因植物的条件
将所述外植体在LSS1培养基上培养3周,然后转移至含有葡糖胺
和氨噻肟头孢霉素的LS培养基。在此培养基上3周后,分离绿色的
苗。
转化苗生根
将转化的苗转移至含有2mg/l的MS培养基以生根。在此培养基
上4周后,将小植株转移至装有无菌土壤的盆中驯化。
转基因瓜尔豆植株
按照Joersbo和Okkels所述(PCT/DK95/00221),使用携带合适质粒
的根癌农杆菌LBA4404转化瓜尔豆的子叶外植体。
按照本发明可以转化其它植物,诸如其它水果、其它蔬菜和其
它诸如咖啡植物、茶树的植物等等。
对本发明的其它修饰对本领域技术人员是显而易见的。
序列表
(1)一般资料
(i)申请人:
(A)姓名:DANISCO A/S
(B)街道:LANGEBROGADE 1
(C)城市:COPENHAGEN
(D)州:COPENHAGENK
(E)国家:丹麦
(F)邮政编码:DK-1001
(2)SEQ ID NO:1的信息:
(i) 顺序特征:
(A)长度:1088个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性
(ii) 分子类型:蛋白质
(xi) 顺序描述:SEQ ID NO:1:
Met Phe Ser Thr Leu Ala Phe Val Ala Pro Ser Ala Leu Gly Ala Ser
1 5 10 15
Thr Phe Val Gly Ala Glu Val Arg Ser Asn Val Arg Ile His Ser Ala
20 25 30
Phe Pro Ala Val His Thr Ala Thr Arg Lys Thr Asn Arg Leu Asn Val
35 40 45
Ser Met Thr Ala Leu Ser Asp Lys Gln Thr Ala Thr Ala Gly Ser Thr
50 55 60
Asp Asn Pro Asp Gly Ile Asp Tyr Lys Thr Tyr Asp Tyr Val Gly Val
65 70 75 80
Trp Gly Phe Ser Pro Leu Ser Asn Thr Asn Trp Phe Ala Ala Gly Ser
85 90 95
Ser Thr Pro Gly Gly Ile Thr Asp Trp Thr Ala Thr Met Asn Val Asn
100 105 110
Phe Asp Arg Ile Asp Asn Pro Ser Ile Thr Val Gln His Pro Val Gln
115 120 125
Val Gln Val Thr Ser Tyr Asn Asn Asn Ser Tyr Arg Val Arg Phe Asn
130 135 140
Pro Asp Gly Pro Ile Arg Asp Val Thr Arg Gly Pro Ile Leu Lys Gln
145 150 155 160
Gln Leu Asp Trp Ile Arg Thr Gln Glu Leu Ser Glu Gly Cys Asp Pro
165 170 175
Gly Met Thr Phe Thr Ser Glu Gly Phe Leu Thr Phe Glu Thr Lys Asp
180 185 190
Leu Ser Val Ile Ile Tyr Gly Asn Phe Lys Thr Arg Val Thr Arg Lys
195 200 205
Ser Asp Gly Lys Val Ile Met Glu Asn Asp Glu Val Gly Thr Ala Ser
210 215 220
Ser Gly Asn Lys Cys Arg Gly Leu Met Phe Val Asp Arg Leu Tyr Gly
225 230 235 240
Asn Ala Ile Ala Ser Val Asn Lys Asn Phe Arg Asn Asp Ala Val Lys
245 250 255
Gln Glu Gly Phe Tyr Gly Ala Gly Glu Val Asn Cys Lys Tyr Gln Asp
260 265 270
Thr Tyr Ile Leu Glu Arg Thr Gly Ile Ala Met Thr Asn Tyr Asn Tyr
275 280 285
Asp Asn Leu Asn Tyr Asn Gln Trp Asp Leu Arg Pro Pro His His Asp
290 295 300
Gly Ala Leu Asn Pro Asp Tyr Tyr Ile Pro Met Tyr Tyr Ala Ala Pro
305 310 315 320
Trp Leu Ile Val Asn Gly Cys Ala Gly Thr Ser Glu Gln Tyr Ser Tyr
325 330 335
Gly Trp Phe Met Asp Asn Val Ser Gln Ser Tyr Met Asn Thr Gly Asp
340 345 350
Thr Thr Trp Asn Ser Gly Gln Glu Asp Leu Ala Tyr Met Gly Ala Gln
355 360 365
Tyr Gly Pro Phe Asp Gln His Phe Val Tyr Gly Ala Gly Gly Gly Met
370 375 380
Glu Cys Val Val Thr Ala Phe Ser Leu Leu Gln Gly Lys Glu Phe Glu
385 390 395 400
Asn Gln Val Leu Asn Lys Arg Ser Val Met Pro Pro Lys Tyr Val Phe
405 410 415
Gly Phe Phe Gln Gly Val Phe Gly Thr Ser Ser Leu Leu Arg Ala His
420 425 430
Met Pro Ala Gly Glu Asn Asn Ile Ser Val Glu Glu Ile Val Glu Gly
435 440 445
Tyr Gln Asn Asn Asn Phe Pro Phe Glu Gly Leu Ala Val Asp Val Asp
450 455 460
Met Gln Asp Asn Leu Arg Val Phe Thr Thr Lys Gly Glu Phe Trp Thr
465 470 475 480
Ala Asn Arg Val Gly Thr Gly Gly Asp Pro Asn Asn Arg Ser Val Phe
485 490 495
Glu Trp Ala His Asp Lys Gly Leu Val Cys Gln Thr Asn Ile Thr Cys
500 505 510
Phe Leu Arg Asn Asp Asn Glu Gly Gln Asp Tyr Glu Val Asn Gln Thr
515 520 525
Leu Arg Glu Arg Gln Leu Tyr Thr Lys Asn Asp Ser Leu Thr Gly Thr
530 535 540
Asp Phe Gly Met Thr Asp Asp Gly Pro Ser Asp Ala Tyr Ile Gly His
545 550 555 560
Leu Asp Tyr Gly Gly Gly Val Glu Cys Asp Ala Leu Phe Pro Asp Trp
565 570 575
Gly Arg Pro Asp Val Ala Glu Trp Trp Gly Asn Asn Tyr Lys Lys Leu
580 585 590
Phe Ser Ile Gly Leu Asp Phe Val Trp Gln Asp Met Thr Val Pro Ala
595 600 605
Met Met Pro His Lys Ile Gly Asp Asp Ile Asn Val Lys Pro Asp Gly
610 615 620
Asn Trp Pro Asn Ala Asp Asp Pro Ser Asn Gly Gln Tyr Asn Trp Lys
625 630 635 640
Thr Tyr His Pro Gln Val Leu Val Thr Asp Met Arg Tyr Glu Asn His
645 650 655
Gly Arg Glu Pro Met Val Thr Gln Arg Asn Ile His Ala Tyr Thr Leu
660 665 670
Cys Glu Ser Thr Arg Lys Glu Gly Ile Val Glu Asn Ala Asp Thr Leu
675 680 685
Thr Lys Phe Arg Arg Ser Tyr Ile Ile Ser Arg Gly Gly Tyr Ile Gly
690 695 700
Asn Gln His Phe Gly Gly Met Trp Val Gly Asp Asn Ser Thr Thr Ser
705 710 715 720
Asn Tyr Ile Gln Met Met Ile Ala Asn Asn Ile Asn Met Asn Met Ser
725 730 735
Cys Leu Pro Leu Val Gly Ser Asp Ile Gly Gly Phe Thr Ser Tyr Asp
740 745 750
Asn Glu Asn Gln Arg Thr Pro Cys Thr Gly Asp Leu Met Val Arg Tyr
755 760 765
Val Gln Ala Gly Cys Leu Leu Pro Trp Phe Ar9 Asn His Tyr Asp Arg
770 775 780
Trp Ile Glu Ser Lys Asp His Gly Lys Asp Tyr Gln Glu Leu Tyr Met
785 790 795 800
Tyr Pro Asn Glu Met Aso Thr Leu Arg Lys Phe Val Glu Phe Arg Tyr
805 810 815
Arg Trp Gln Glu Val Leu Tyr Thr Ala Met Tyr Gln Asn Ala Ala Phe
820 825 830
Gly Lys Pro Ile Ile Lys Ala Ala Ser Met Tyr Asn Asn Asp Ser Asn
835 840 845
Val Arg Arg Ala Gln Asn Asp His Phe Leu Leu Gly Gly His Asp Gly
850 855 860
Tyr Arg Ile Leu Cys Ala Pro Val Val Trp Glu Asn Ser Thr Glu Arg
865 870 875 880
Glu Leu Tyr Leu Pro Val Leu Thr Gln Trp Tyr Lys Phe Gly Pro Asp
885 890 895
Phe Asp Thr Lys Pro Leu Glu Gly Ala Met Asn Gly Gly Asp Arg Ile
900 905 910
Tyr Asn Tyr Pro Val Pro Gln Ser Glu Ser Pro Ile Phe Val Arg Glu
915 920 925
Gly Ala Ile Leu Pro Thr Arg Tyr Thr Leu Asn Gly Glu Asn Lys Ser
930 935 940
Leu Asn Thr Tyr Thr Asp Glu Asp Pro Leu Val Phe Glu Val Phe Pro
945 950 955 960
Leu Gly Asn Asn Arg Ala Asp Gly Met Cys Tyr Leu Asp Asp Gly Gly
965 970 975
Val Thr Thr Asn Ala Glu Asp Asn Gly Lys Phe Ser Val Val Lys Val
980 985 990
Ala Ala Glu Gln Asp Gly Gly Thr Glu Thr Ile Thr Phe Thr Asn Asp
995 1000 1005
Cys Tyr Glu Tyr Val Phe Gly Gly Pro Phe Tyr Val Arg Val Arg Gly
1010 1015 1020
Ala Gln Ser Pro Ser Asn Ile His Val Ser Ser Gly Ala Gly Ser Gln
1025 1030 1035 1040
Asp Met Lys Val Ser Ser Ala Thr Ser Arg Ala Ala Leu Phe Asn Asp
1045 1050 1055
Gly Glu Asn Gly Asp Phe Trp Val Asp Gln Glu Thr Asp Ser Leu Trp
1060 1065 1070
Leu Lys Leu Pro Asn Val Val Leu Pro Asp Ala Val Ile Thr Ile Thr
1075 1080 1085
(2)SEQ ID NO:2的信息:
(i) 顺序特征:
(A)长度:1091个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性
(ii) 分子类型:蛋白质
(xi) 顺序描述:SEQ ID NO:2:
Met Tyr Pro Thr Leu Thr Phe Val Ala Pro Ser Ala Leu Gly Ala Arg
1 5 10 15
Thr Phe Thr Cys Val Gly Ile Phe Arg Ser His Ile Leu Ile His Ser
20 25 30
Val Val Pro Ala Val Arg Leu Ala Val Arg Lys Ser Asn Arg Leu Asn
35 40 45
Val Ser Met Ser Ala Leu Phe Asp Lys Pro Thr Ala Val Thr Gly Gly
50 55 60
Lys Asp Asn Pro Asp Asn Ile Asn Tyr Thr Thr Tyr Asp Tyr Val Pro
65 70 75 80
Val Trp Arg Phe Asp Pro Leu Ser Asn Thr Asn Trp Phe Ala Ala Gly
85 90 95
Ser Ser Thr Pro Gly Asp Ile Asp Asp Trp Thr Ala Thr Met Asn Val
100 105 110
Asn Phe Asp Arg Ile Asp Asn Pro Ser Phe Thr Leu Glu Lys Pro Val
115 120 125
Gln Val Gln Val Thr Ser Tyr Lys Asn Asn Cys Phe Arg Val Arg Phe
130 135 140
Asn Pro Asp Gly Pro Ile Arg Asp Val Asp Arg Gly Pro Ile Leu Gln
145 150 155 160
Gln Gln Leu Asn Trp Ile Arg Lys Gln Glu Gln Ser Lys Gly Phe Asp
165 170 175
Pro Lys Met Gly Phe Thr Lys Glu Gly Phe Leu Lys Phe Glu Thr Lys
180 185 190
Asp Leu Asn Val Ile Ile Tyr Gly Asn Phe Lys Thr Arg Val Thr Arg
195 200 205
Lys Arg Asp Gly Lys Gly Ile Met Glu Asn Asn Glu Val Pro Ala Gly
210 215 220
Ser Leu Gly Asn Lys Cys Arg Gly Leu Met Phe Val Asp Arg Leu Tyr
225 230 235 240
Gly Thr Ala Ile Ala Ser Val Asn Glu Asn Tyr Arg Asn Asp Pro Asp
245 250 255
Arg Lys Glu Gly Phe Tyr Gly Ala Gly Glu Val Asn Cys Glu Phe Trp
260 265 270
Asp Ser Glu Gln Asn Arg Asn Lys Tyr Ile Leu Glu Arg Thr Gly Ile
275 280 285
Ala Met Thr Asn Tyr Asn Tyr Asp Asn Tyr Asn Tyr Asn Gln Ser Asp
290 295 300
Leu Ile Ala Pro Gly Tyr Pro Ser Asp Pro Asn Phe Tyr Ile Pro Met
305 310 315 320
Tyr Phe Ala Ala Pro Trp Val Val Val Lys Gly Cys Ser Gly Asn Ser
325 330 335
Asp Glu Gln Tyr Ser Tyr Gly Trp Phe Met Asp Asn Val Ser Gln Thr
340 345 350
Tyr Met Asn Thr Gly Gly Thr Ser Trp Asn Cys Gly Glu Glu Asn Leu
355 360 365
Ala Tyr Met Gly Ala Gln Cys Gly Pro Phe Asp Gln His Phe Val Tyr
370 375 380
Gly Asp Gly Asp Gly Leu Glu Asp Val Val Gln Ala Phe Ser Leu Leu
385 390 395 400
Gln Gly Lys Glu Phe Glu Asn Gln Val Leu Asn Lys Arg Ala Val Met
405 410 415
Pro Pro Lys Tyr Val Phe Gly Tyr Phe Gln Gly Val Phe Gly Ile Ala
420 425 430
Ser Leu Leu Arg Glu Gln Arg Pro Glu Gly Gly Asn Asn Ile Ser Val
435 440 445
Gln Glu Ile Val Glu Gly Tyr Gln Ser Asn Asn Phe Pro Leu Glu Gly
450 455 460
Leu Ala Val Asp Val Asp Met Gln Gln Asp Leu Arg Val Phe Thr Thr
465 470 475 480
Lys Ile Glu Phe Trp Thr Ala Asn Lys Val Gly Thr Gly Gly Asp Ser
485 490 495
Asn Asn Lys Ser Val Phe Glu Trp Ala His Asp Lys Gly Leu Val Cys
500 505 510
Gln Thr Asn Val Thr Cys Phe Leu Arg Asn Asp Asn Gly Gly Ala Asp
515 520 525
Tyr Glu Val Asn Gln Thr Leu Arg Glu Lys Gly Leu Tyr Thr Lys Asn
530 535 540
Asp Ser Leu Thr Asn Thr Asn Phe Gly Thr Thr Asn Asp Gly Pro Ser
545 550 555 560
Asp Ala Tyr Ile Gly His Leu Asp Tyr Gly Gly Gly Gly Asn Cys Asp
565 570 575
Ala Leu Phe Pro Asp Trp Gly Arg Pro Gly Val Ala Glu Trp Trp Gly
580 585 590
Asp Asn Tyr Ser Lys Leu Phe Lys Ile Gly Leu Asp Phe Val Trp Gln
595 600 605
Asp Met Thr Val Pro Ala Met Met Pro His Lys Val Gly Asp Ala Val
610 615 620
Asp Thr Arg Ser Pro Tyr Gly Trp Pro Asn Glu Asn Asp Pro Ser Asn
625 630 635 640
Gly Arg Tyr Asn Trp Lys Ser Tyr His Pro Gln Val Leu Val Thr Asp
645 650 655
Met Arg Tyr Glu Asn His Gly Arg Glu Pro Met Phe Thr Gln Arg Asn
660 665 670
Met His Ala Tyr Thr Leu Cys Glu Ser Thr Arg Lys Glu Gly Ile Val
675 680 685
Ala Asn Ala Asp Thr Leu Thr Lys Phe Arg Arg Ser Tyr Ile Ile Ser
690 695 700
Arg Gly Gly Tyr Ile Gly Asn Gln His Phe Gly Gly Met Trp Val Gly
705 710 715 720
Asp Asn Ser Ser Ser Gln Arg Tyr Leu Gln Met Met Ile Ala Asn Ile
725 730 735
Val Asn Met Asn Met Ser Cys Leu Pro Leu Val Gly Ser Asp Ile Gly
740 745 750
Gly Phe Thr-Ser Tyr Asp Gly Arg Asn Val Cys Pro Gly Asp Leu Met
755 760 765
Val Arg Phe Val Gln Ala Gly Cys Leu Leu Pro Trp Phe Arg Asn His
770 775 780
Tyr Gly Arg Leu Val Glu Gly Lys Gln Glu Gly Lys Tyr Tyr Gln Glu
785 790 795 800
Leu Tyr Met Tyr Lys Asp Glu Met Ala Thr Leu Arg Lys Phe Ile Glu
805 810 815
Phe Arg Tyr Arg Trp Gln Glu Val Leu Tyr Thr Ala Met Tyr Gln Asn
820 825 830
Ala Ala Phe Gly Lys Pro Ile Ile Lys Ala Ala Ser Met Tyr Asp Asn
835 840 845
Asp Arg Asn Val Arg Gly Ala Gln Asp Asp His Phe Leu Leu Gly Gly
850 855 860
His Asp Gly Tyr Arg Ile Leu Cys Ala Pro Val Val Trp Glu Asn Thr
865 870 875 880
Thr Ser Arg Asp Leu Tyr Leu Pro Val Leu Thr Lys Trp Tyr Lys Phe
885 890 895
Gly Pro Asp Tyr Asp Thr Lys Arg Leu Asp Ser Ala Leu Asp Gly Gly
900 905 910
Gln Met Ile Lys Asn Tyr Ser Val Pro Gln Ser Asp Ser Pro Ile Phe
915 920 925
Val Arg Glu Gly Ala Ile Leu Pro Thr Arg Tyr Thr Leu Asp Gly Ser
930 935 940
Asn Lys Ser Met Asn Tyr Tyr Tyr Asp Lys Asp Pro Leu Val Phe Glu
945 950 955 960
Val Phe Pro Leu Gly Asn Asn Arg Ala Asp Gly Met Cys Tyr Leu Asp
965 970 975
Asp Gly Gly Ile Thr Thr Asp Ala Glu Asp His Gly Lys Phe Ser Val
980 985 990
Ile Asn Val Glu Ala Leu Arg Lys Gly Val Thr Thr Thr Ile Lys Phe
995 1000 1005
Ala Tyr Asp Thr Tyr Gln Tyr Val Phe Asp Gly Pro Phe Tyr Val Arg
1010 1015 1020
Ile Arg Asn Leu Thr Thr Ala Ser Lys Ile Asn Val Ser Ser Gly Ala
1025 1030 1035 1040
Gly Glu Glu Asp Met Thr Pro Thr Ser Ala Asn Ser Arg Ala Ala Leu
1045 1050 1055
Phe Ser Asp Gly Gly Val Gly Glu Tyr Trp Ala Asp Asn Asp Thr Ser
1060 1065 1070
Ser Leu Trp Met Lys Leu Pro Asn Leu Val Leu Gln Asp Ala Val Ile
1075 1080 1085
Thr Ile Thr
1090
(2)SEQ ID NO:3的信息:
(i) 顺序特征:
(A)长度:1066个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性
(ii) 分子类型:蛋白质
(xi) 顺序描述:SEQ ID NO:3:
Met Ala Gly Phe Ser Asp Pro Leu Asn Phe Cys Lys Ala Glu Asp Tyr
1 5 10 15
Tyr Ser Val Ala Leu Asp Trp Lys Gly Pro Gln Lys Ile Ile Gly Val
20 25 30
Asp Thr Thr Pro Pro Lys Ser Thr Lys Phe Pro Lys Asn Trp His Gly
35 40 45
Val Asn Leu Arg Phe Asp Asp Gly Thr Leu Gly Val Val Gln Phe Ile
50 55 60
Arg Pro Cys Val Trp Arg Val Arg Tyr Asp Pro Gly Phe Lys Thr Ser
65 70 75 80
Asp Glu Tyr-Gly Asp Glu Asn Thr Arg Thr Ile Val Gln Asp Tyr Met
85 90 95
Ser Thr Leu Ser Asn Lys Leu Asp Thr Tyr Arg Gly Leu Thr Trp Glu
100 105 110
Thr Lys Cys Glu Asp Ser Gly Asp Phe Phe Thr Phe Ser Ser Lys Val
115 120 125
Thr Ala Val Glu Lys Ser Glu Arg Thr Arg Asn Lys Val Gly Asp Gly
130 135 140
Leu Arg Ile His Leu Trp Lys Ser Pro Phe Arg Ile Gln Val Val Arg
145 150 155 160
Thr Leu Thr Pro Leu Lys Asp Pro Tyr Pro Ile Pro Asn Val Ala Ala
165 170 175
Ala Glu Ala Arg Val Ser Asp Lys Val Val Trp Gln Thr Ser Pro Lys
180 185 190
Thr Phe Arg Lys Asn Leu His Pro Gln His Lys Met Leu Lys Asp Thr
195 200 205
Val Leu Asp Ile Val Lys Pro Gly His Gly Glu Tyr Val Gly Trp Gly
210 215 220
Glu Met Gly Gly Ile Gln Phe Met Lys Glu Pro Thr Phe Met Asn Tyr
225 230 235 240
Phe Asn Phe Asp Asn Met Gln Tyr Gln Gln Val Tyr Ala Gln Gly Ala
245 250 255
Leu Asp Ser Arg Glu Pro Leu Tyr His Ser Asp Pro Phe Tyr Leu Asp
260 265 270
Val Asn Ser Asn Pro Glu His Lys Asn Ile Thr Ala Thr Phe Ile Asp
275 280 285
Asn Tyr Ser Gln Ile Ala Ile Asp Phe Gly Lys Thr Asn Ser Gly Tyr
290 295 300
Ile Lys Leu Gly Thr Arg Tyr Gly Gly Ile Asp Cys Tyr Gly Ile Ser
305 310 315
Ala Asp Thr Val Pro Glu Ile Val Arg Leu Tyr Thr Gly Leu Val Gly
325 330 335
Arg Ser Lys Leu Lys Pro Arg Tyr Ile Leu Gly Ala His Gln Ala Cys
340 345 350
Tyr Gly Tyr Gln Gln Glu Ser Asp Leu Tyr Ser Val Val Gln Gln Tyr
355 360 365
Arg Asp Cys Lys Phe Pro Leu Asp Gly Ile His Val Asp Val Asp Val
370 375 380
Gln Asp Gly Phe Arg Thr Phe Thr Thr Asn Pro His Thr Phe Pro Asn
385 390 395 400
Pro Lys Glu Met Phe Thr Asn Leu Arg Asn Asn Gly Ile Lys Cys Ser
405 410 415
Thr Asn Ile Thr Pro Val Ile Ser Ile Asn Asn Arg Glu Gly Gly Tyr
420 425 430
Ser Thr Leu Leu Glu Gly Val Asp Lys Lys Tyr Phe Ile Met Asp Asp
435 440 445
Arg Tyr Thr Glu Gly Thr Ser Gly Asn Ala Lys Asp Val Arg Tyr Met
450 455 460
Tyr Tyr Gly Gly Gly Asn Lys Val Glu Val Asp Pro Asn Asp Val Asn
465 470 475 480
Gly Arg Pro Asp Phe Lys Asp Asn Tyr Asp Phe Pro Ala Asn Phe Asn
485 490 495
Ser Lys Gln Tyr Pro Tyr His Gly Gly Val Ser Tyr Gly Tyr Gly Asn
500 505 510
Gly Ser Ala Gly Phe Tyr Pro Asp Leu Asn Arg Lys Glu Val Arg Ile
515 520 525
Trp Trp Gly Met Gln Tyr Lys Tyr Leu Phe Asp Met Gly Leu Glu Phe
530 535 540
Val Trp Gln Asp Met Thr Thr Pro Ala Ile His Thr Ser Tyr Gly Asp
545 550 555 560
Met Lys Gly Leu Pro Thr Arg Leu Leu Val Thr Ser Asp Ser Val Thr
565 570 575
Asn Ala Ser Glu Lys Lys Leu Ala Ile Glu Thr Trp Ala Leu Tyr Ser
580 585 590
Tyr Asn Leu His Lys Ala Thr Trp His Gly Leu Ser Arg Leu Glu Ser
595 600 605
Arg Lys Asn-Lys Arg Asn Phe Ile Leu Gly Arg Gly Ser Tyr Ala Gly
610 615 620
Ala Tyr Arg Phe Ala Gly Leu Trp Thr Gly Asp Asn Ala Ser Asn Trp
625 630 635 640
Glu Phe Trp Lys Ile Ser Val Ser Gln Val Leu Ser Leu Gly Leu Asn
645 650 655
Gly Val Cys Ile Ala Gly Ser Asp Thr Gly Gly Phe Glu Pro Tyr Arg
660 665 670
Asp Ala Asn Gly Val Glu Glu Lys Tyr Cys Ser Pro Glu Leu Leu Ile
675 680 685
Arg Trp Tyr Thr Gly Ser Phe Leu Leu Pro Trp Leu Arg Asn His Tyr
690 695 700
Val Lys Lys Asp Arg Lys Trp Phe Gln Glu Pro Tyr Ser Tyr Pro Lys
705 710 715 720
His Leu Glu Thr His Pro Glu Leu Ala Asp Gln Ala Irp Leu Tyr Lys
725 730 735
Ser Val Leu Glu Ile Cys Arg Tyr Tyr Val Glu Leu Arg Tyr Ser Leu
740 745 750
Ile Gln Leu Leu Tyr Asp Cys Met Phe Gln Asn Val Val Asp Gly Met
755 760 765
Pro Ile Thr Arg Ser Met Leu Leu Thr Asp Thr Glu Asp Thr Thr Phe
770 775 780
Phe Asn Glu Ser Gln Lys Phe Leu Asp Asn Gln Tyr Met Ala Gly Asp
785 790 795 800
Asp Ile Leu Val Ala Pro Ile Leu His Ser Arg Lys Glu Ile Pro Gly
805 810 815
Glu Asn Arg Asp Val Tyr Leu Pro Leu Tyr His Thr Trp Tyr Pro Ser
820 825 830
Asn Leu Arg Pro Trp Asp Asp Gln Gly Val Ala Leu Gly Asn Pro Val
835 840 845
Glu Gly Gly Ser Val Ile Asn Tyr Thr Ala Arg Ile Val Ala Pro Glu
850 855 860
Asp Tyr Asn Leu Phe His Ser Val Val Pro Val Tyr Val Arg Glu Gly
865 870 875 880
Ala Ile Ile Pro Gln Ile Glu Val Arg Gln Trp Thr Gly Gln Gly Gly
885 890 895
Ala Asn Arg Ile Lys Phe Asn Ile Tyr Pro Gly Lys Asp Lys Glu Tyr
900 905 910
Cys Thr Tyr Leu Asp Asp Gly Val Ser Arg Asp Ser Ala Pro Glu Asp
915 920 925
Leu Pro Gln Tyr Lys Glu Thr His Glu Gln Ser Lys Val Glu Gly Ala
930 935 940
Glu Ile Ala Lys Gln Ile Gly Lys Lys Thr Gly Tyr Asn Ile Ser Gly
945 950 955 960
Thr Asp Pro Glu Ala Lys Gly Tyr His Arg Lys Val Ala Val Thr Gln
965 970 975
Thr Ser Lys Asp Lys Thr Arg Thr Val Thr Ile Glu Pro Lys His Asn
980 985 990
Gly Tyr Asp Pro Ser Lys Glu Val Gly Asp Tyr Tyr Thr Ile Ile Leu
995 1000 1005
Trp Tyr Ala Pro Gly Phe Asp Gly Ser Ile Val Asp Val Ser Lys Thr
1010 1015 1020
Thr Val Asn Val Glu Gly Gly Val Glu His Gln Val Tyr Lys Asn Ser
1025 1030 1035 1040
Asp Leu His Thr Val Val Ile Asp Val Lys Glu Val Ile Gly Thr Thr
1045 1050 1055
Lys Ser Val Lys Ile Thr Cys Thr Ala Ala
1060 1065
(2)SEQ ID NO:4的信息:
(i) 顺序特征:
(A)长度:1070个氨基酸
(B)类型:氨基酸
(D)拓扑学:线性
(ii) 分子类型:蛋白质
(xi) 顺序描述:SEQ ID NO:4:
Met Ala Gly Leu Ser Asp Pro Leu Asn Phe Cys Lys Ala Glu Asp Tyr
1 5 10 15
Tyr Ala Ala Ala Lys Gly Trp Ser Gly Pro Gln Lys Ile Ile Arg Tyr
20 25 30
Asp Gln Thr Pro Pro Gln Gly Thr Lys Asp Pro Lys Ser Trp His Ala
35 40 45
Val Asn Leu Pro Phe Asp Asp Gly Thr Met Cys Val Val Gln Phe Val
50 55 60
Arg Pro Cys Val Trp Arg Val Arg Tyr Asp Pro Ser Val Lys Thr Ser
65 70 75 80
Asp Glu Tyr Gly Asp Glu Asn Thr Arg Thr Ile Val Gln Asp Tyr Met
85 90 95
Thr Thr Leu Val Gly Asn Leu Asp Ile Phe Arg Gly Leu Thr Trp Val
100 105 110
Ser Thr Leu Glu Asp Ser Gly Glu Tyr Tyr Thr Phe Lys Ser Glu Val
115 120 125
Thr Ala Val Asp Glu Thr Glu Arg Thr Arg Asn Lys Val Gly Asp Gly
130 135 140
Leu Lys Ile Tyr Leu Trp Lys Asn Pro Phe Arg Ile Gln Val Val Arg
145 150 155 160
Leu Leu Thr Pro Leu Val Asp Pro Phe Pro Ile Pro Asn Val Ala Asn
165 170 175
Ala Thr Ala Arg Val Ala Asp Lys Val Val Trp Gln Thr Ser Pro Lys
180 185 190
Thr Phe Arg Lys Asn Leu His Pro Gln His Lys Met Leu Lys Asp Thr
195 200 205
Val Leu Asp Ile Ile Lys Pro Gly His Gly Glu Tyr Val Gly Trp Gly
210 215 220
Glu Met Gly Gly Ile Glu Phe Met Lys Glu Pro Thr Phe Met Asn Tyr
225 230 235 240
Phe Asn Phe Asp Asn Met Gln Tyr Gln Gln Val Tyr Ala Gln Gly Ala
245 250 255
Leu Asp Ser Arg Glu Pro Leu Tyr His Ser Asp Pro Phe Tyr Leu Asp
260 265 270
Val Asn Ser Asn Pro Glu His Lys Asn Ile Thr Ala Thr Phe Ile Asp
275 280 285
Asn Tyr Ser Gln Ile Ala Ile Asp Phe Gly Lys Thr Asn Ser Gly Tyr
290 295 300
Ile Lys Leu Gly Thr Arg Tyr Gly Gly Ile Asp Cys Tyr Gly Ile Ser
305 310 315 320
Ala Asp Thr Val Pro Glu Ile Val Arg Leu Tyr Thr Gly Leu Val Gly
325 330 335
Arg Ser Lys Leu Lys Pro Arg Tyr Ile Leu Gly Ala His Gln Ala Cys
340 345 350
Tyr Gly Tyr Gln Gln Glu Ser Asp Leu His Ala Val Val Gln Gln Tyr
355 360 365
Arg Asp Thr Lys Phe Pro Leu Asp Gly Leu His Val Asp Val Asp Phe
370 375 380
Gln Asp Asn Phe Arg Thr Phe Thr Thr Asn Pro Ile Thr Phe Pro Asn
385 390 395 400
Pro Lys Glu Met Phe Thr Asn Leu Arg Asn Asn Gly Ile Lys Cys Ser
405 410 415
Thr Asn Ile Thr Pro Val Ile Ser Ile Arg Asp Arg Pro Asn Gly Tyr
420 425 430
Ser Thr Leu Asn Glu Gly Tyr Asp Lys Lys Tyr Phe Ile Met Asp Asp
435 440 445
Arg Tyr Thr-Glu Gly Thr Ser Gly Asp Pro Gln Asn Val Arg Tyr Ser
450 455 460
Phe Tyr Gly Gly Gly Asn Pro Val Glu Val Asn Pro Asn Asp Val Trp
465 470 475 480
Ala Arg Pro Asp Phe Gly Asp Asn Tyr Asp Phe Pro Thr Asn Phe Asn
485 490 495
Cys Lys Asp Tyr Pro Tyr His Gly Gly Val Ser Tyr Gly Tyr Gly Asn
500 505 510
Gly Thr Pro Gly Tyr Tyr Pro Asp Leu Asn Arg Glu Glu Val Arg Ile
515 520 525
Trp Trp Gly Leu Gln Tyr Glu Tyr Leu Phe Asn Met Gly Leu Glu Phe
530 535 540
Val Trp Gln Asp Met Thr Thr Pro Ala Ile His Ser Ser Tyr Gly Asp
545 550 555 560
Met Lys Gly Leu Pro Thr Arg Leu Leu Val Thr Ala Asp Ser Val Thr
565 570 575
Asn Ala Ser Glu Lys Lys Leu Ala Ile Glu Ser Trp Ala Leu Tyr Ser
580 585 590
Tyr Asn Leu His Lys Ala Thr Phe His Gly Leu Gly Arg Leu Glu Ser
595 600 605
Arg Lys Asn Lys Arg Asn Phe Ile Leu Gly Arg Gly Ser Tyr Ala Gly
610 615 620
Ala Tyr Arg Phe Ala Gly Leu Trp Thr Gly Asp Asn Ala Ser Thr Trp
625 630 635 640
Glu Phe Trp Lys Ile Ser Val Ser Gln Val Leu Ser Leu Gly Leu Asn
645 650 655
Gly Val Cys Ile Ala Gly Ser Asp Thr Gly Gly Phe Glu Pro Ala Arg
660 665 670
Thr Glu Ile Gly Glu Glu Lys Tyr Cys Ser Pro Glu Leu Leu Ile Arg
675 680 685
Trp Tyr Thr Gly Ser Phe Leu Leu Pro Trp Leu Arg Asn His Tyr Val
690 695 700
Lys Lys Asp Arg Lys Trp Phe Gln Glu Pro Tyr Ala Tyr Pro Lys His
705 710 715 720
Leu Glu Thr His Pro Glu Leu Ala Asp Gln Ala Trp Leu Tyr Lys Ser
725 730 735
Val Leu Glu Ile Cys Arg Tyr Trp Val Glu Leu Arg Tyr Ser Leu Ile
740 745 750
Gln Leu Leu Tyr Asp Cys Met Phe Gln Asn Val Val Asp Gly Met Pro
755 760 765
Leu Ala Arg Ser Met Leu Leu Thr Asp Thr Glu Asp Thr Thr Phe Phe
770 775 780
Asn Glu Ser Gln Lys Phe Leu Asp Asn Gln Tyr Met Ala Gly Asp Asp
785 790 795 800
Ile Leu Val Ala Pro Ile Leu His Ser Arg Asn Glu Val Pro Gly Glu
805 810 815
Asn Arg Asp Val Tyr Leu Pro Leu Phe HisT hr Trp Tyr Pro Ser Asn
820 825 830
Leu Arg Pro Trp Asp Asp Gln Gly Val Ala Leu Gly Asn Pro Val Glu
835 840 845
Gly Gly Ser Val Ile Asn Tyr Thr Ala Arg Ile Val Ala Pro Glu Asp
850 855 860
Tyr Asn Leu Phe His Asn Val Val Pro Val Tyr Ile Arg Glu Gly Ala
865 870 875 880
Ile Ile Pro Gln Ile Gln Val Arg Gln Trp Ile Gly Glu Gly Gly Pro
885 890 895
Asn Pro Ile Lys Phe Asn Ile Tyr Pro Gly Lys Asp Lys Glu Tyr Val
900 905 910
Thr Tyr Leu Asp Asp Gly Val Ser Arg Asp Ser Ala Pro Asp Asp Leu
915 920 925
Pro Gln Tyr Arg Glu Ala Tyr Glu Gln Ala Lys Val Glu Gly Lys Asp
930 935 940
Val Gln Lys Gln Leu Ala Val Ile Gln Gly Asn Lys Thr Asn Asp Phe
945 950 955 960
Ser Ala Ser Gly Ile Asp Lys Glu Ala Lys Gly Tyr His Arg Lys Val
965 970 975
Ser Ile Lys-Gln Glu Ser Lys Asp Lys Thr Arg Thr Val Thr Ile Glu
980 985 990
Pro Lys His Asn Gly Tyr Asp Pro Ser Lys Glu Val Gly Asn Tyr Tyr
995 1000 1005
Thr Ile Ile Leu Trp Tyr Ala Pro Gly Phe Asp Gly Ser Ile Val Asp
1010 1015 1020
Val Ser Gln Ala Thr Val Asn Ile Glu Gly Gly Val Glu Cys Glu Ile
1025 1030 1035 1040
Phe Lys Asn Thr Gly Leu His Thr Val Val Val Asn Val Lys Glu Val
1045 1050 1055
Ile Gly Thr Thr Lys Ser Val Lys Ile Thr Cys Thr Thr Ala
1060 1065 1070
SEQ.ID.NO.5
顺序类型:酶
分子类型:氨基酸
原始来源:藻类
序列长度:1092个氨基酸
序列:
5 10 15
1 Met Phe Pro Thr Leu Thr Phe Ile Ala Pro Ser Ala Leu Ala Ala
16 Ser Thr Phe Val Gly Ala Asp Ile Arg Ser Gly Ile Arg Ile Gln
31 Ser Ala Leu Pro Ala Val Arg Asn Ala Val Arg Arg Ser Lys His
46 Tyr Asn Val Ser Met Thr Ala Leu Ser Asp Lys Gln Thr Ala Ile
61 Ser Ile Gly Pro Asp Asn Pro Asp Gly Ile Asn Tyr Gln Asn Tyr
76 Asp Tyr Ile Pro Val Ala Gly Phe Thr Pro Leu Ser Asn Thr Asn
91 Trp Tyr Ala Ala Gly Ser Ser Thr Pro Gly Gly Ile Thr Asp Trp
106 Thr Ala Thr Met Asn Val Lys Phe Asp Arg Ile Asp Asn Pro Ser
121 Tyr Ser Asn Asn His Pro Val Gln Ile Gln Val Thr Ser Tyr Asn
136 Asn Asn Ser Phe Arg Ile Arg Phe Asn Pro Asp Gly Pro Ile Arg
151 Asp Val Ser Arg Gly Pro Ile Leu Lys Gln Gln Leu Thr Trp Ile
166 Arg Asn Gln Glu Leu Ala Gln Gly Cys Asn Pro Asn Met Ser Phe
181 Ser Pro Glu Gly Phe Leu Ser Phe Glu Thr Lys Asp Leu Asn Val
196 Ile Ile Tyr Gly Asn Cys Lys Met Arg Val Thr Lys Lys Asp Gly
211 Tyr Leu Val Met Glu Asn Asp Glu Cys Asn Ser Gln Ser Asp Gly
226 Asn Lys Cys Arg Gly Leu Met Tyr Val Asp Arg Leu Tyr Gly Asn
241 Ala Ile Ala Ser Val Gln Thr Asn Phe His Lys Asp Thr Ser Arg
256 Asn Glu Lys Phe Tyr Gly Ala Gly Glu Val Asn Cys Arg Tyr Glu
271 Glu Gln Gly Lys Ala Pro Thr Tyr Val Leu Glu Arg Ser Gly Leu
286 Ala Met Thr Asn Tyr Asn Tyr Asp Asn Leu Asn Tyr Asn Gln Pro
301 Asp Val Val Pro Pro Gly Tyr Pro Asp His Pro Asn Tyr Tyr Ile
316 Pro Met Tyr Tyr Ala Ala Pro Trp Leu Val Val Gln Gly Cys Ala
331 Gly Thr Ser Lys Gln Tyr Ser Tyr Gly Trp Phe Met Asp Asn Val
346 Ser Gln Ser Tyr Met Asn Thr Gly Asp Thr Ala Trp Asn Cys Gly
361 Gln Glu Asn Leu Ala Tyr Met Gly Ala Gln Tyr Gly Pro Phe Asp
376 Gln His Phe Val Tyr Gly Asp Gly Asp Gly Leu Glu Asp Val Val
391 Lys Ala Phe Ser Phe Leu Gln Gly Lys Glu Phe Glu Asp Lys Lys
406 Leu Asn Lys Arg Ser Val Met Pro Pro Lys Tyr Val Phe Gly Phe
421 Phe Gln Gly Val Phe Gly Ala Leu Ser Leu Leu Lys Gln Asn Leu
436 Pro Ala Gly Glu Asn Asn Ile Ser Val Gln Glu Ile Val Glu Gly
451 Tyr Gln Asp Asn Asp Tyr Pro Phe Glu Gly Leu Ala Val Asp Val
466 Asp Met Gln Asp Asp Leu Arg Val Phe Thr Thr Lys Pro Glu Tyr
481 Trp Ser Ala Asn Met Val Gly Glu Gly Gly Asp Pro Asn Asn Arg
496 Ser Val Phe Glu Trp Ala His Asp Arg Gly Leu Val Cys Gln Thr
511 Asn Val Thr Cys Phe Leu Arg Asn Asp Asn Ser Gly Lys Pro Tyr
526 Glu Val Asn Gln Thr Leu Arg Glu Lys Gln Leu Tyr Thr Lys Asn
541 Asp Ser Leu Asn Asn Thr Asp Phe Gly Thr Thr Ser Asp Gly Pro
556 Gly Asp Ala Tyr Ile Gly His Leu Asp Tyr Gly Gly Gly Val Glu
571 Cys Asp Ala Ile Phe Pro Asp Trp Gly Arg Pro Asp Val Ala Gln
586 Trp Trp Gly Glu Asn Tyr Lys Lys Leu Phe Ser Ile Gly Leu Asp
601 Phe Val Trp Gln Asp Met Thr Val Pro Ala Met Met Pro His Arg
616 Leu Gly Asp Ala Val Asn Lys Asn Ser Gly Ser Ser Ala Pro Gly
631 Trp Pro Asn Glu Asn Asp Pro Ser Asn Gly Arg Tyr Asn Trp Lys
646 Ser Tyr His Pro Gln Val Leu Val Thr Asp Met Arg Tyr Gly Ala
661 Glu Tyr Gly Arg Glu Pro Met Val Ser Gln Arg Asn Ile His Ala
676 Tyr Thr Leu Cys Glu Ser Thr Arg Arg Glu Gly Ile Val Gly Asn
691 Ala Asp Ser Leu Thr Lys Phe Arg Arg Ser Tyr Ile Ile Ser Arg
706 Gly Gly Tyr Ile Gly Asn Gln His Phe Gly Gly Met Trp Val Gly
721 Asp Asn Ser Ala Thr Glu Ser Tyr Leu Gln Met Met Leu Ala Asn
736 Ile Ile Asn Met Asn Met Ser Cys Leu Pro Leu Val Gly Ser Asp
751 Ile Gly Gly Phe Thr Gln Tyr Asn Asp Ala Gly Asp Pro Thr Pro
766 Glu Asp Leu Met Val Arg Phe Val Gln Ala Gly Cys Leu Leu Pro
781 Trp Phe Arg Asn His Tyr Asp Arg Trp Ile Glu Ser Lys Lys His
796 Gly Lys Lys Tyr Gln Glu Lep Tyr Met Tyr Pro Gly Gln Lys Asp
811 Thr Leu Lys Lys Phe Val Glu Phe Arg Tyr Arg Trp Gln Glu Val
826 Leu Tyr Thr Ala Met Tyr Gln Asn Ala Thr Thr Gly Glu Pro Ile
841 Ile Lys Ala Ala Pro Met Tyr Asn Asn Asp Val Asn Val Tyr Lys
856 Ser Gln Asn Asp His Phe Leu Leu Gly Gly His Asp Gly Tyr Arg
871 Ile Leu Cys Ala Pro Val Val Arg Glu Asn Ala Thr Ser Arg Glu
886 Val Tyr Leu Pro Val Tyr Ser Lys Trp Phe Lys Phe Gly Pro Asp
901 Phe Asp Thr Lys Pro Leu Glu Asn Glu Ile Gln Gly Gly Gln Thr
916 Leu Tyr Asn Tyr Ala Ala Pro Leu Asn Asp Ser Pro Ile Phe Val
931 Arg Gly Gly Thr Ile Leu Pro Thr Arg Tyr Thr Leu Asp Gly Val
946 Asn Lys Ser Ile Asn Thr Tyr Thr Asp Asn Asp Pro Leu Val Phe
961 Glu Leu Phe Pro Leu Glu Asn Asn Gln Ala His Gly Leu Phe Tyr
976 His Asp Asp Gly Gly Val Thr Thr Asn Ala Glu Asp Phe Gly Lys
991 Tyr Ser Val Ile Ser Val Lys Ala Ala Gln Glu Gly Ser Gln Met
1006 Ser Val Lys Phe Asp Asn Glu Val Tyr Glu His Gln Trp Gly Ala
1021 Ser Phe Tyr Val Arg Val Arg Asn Met Gly Ala Pro Ser Asn Ile
1036 Asn Val Ser Ser Gln Ile Gly Gln Gln Asp Met Gln Gln Ser Ser
1051 Val Ser Ser Arg Ala Gln Met Phe Thr Ser Ala Asn Asp Gly Glu
1066 Tyr Trp Val Asp Gln Ser Thr Asn Ser Leu Trp Leu Lys Leu Pro
1081 Gly Ala Val Ile Gln Asp Ala Val Ile Thr Val Arg
氨基酸残基数:1092
氨基酸组成(包括信号序列):
64 Ala 14 Cys 18 His 33 Met 56 Thr
48 Arg 55 Gln 45 Ile 49 Phe 22 Trp
89 Asn 49 Glu 65 Leu 59 Pro 67 Tyr
73 Asp 94 Gly 46 Lys 73 Ser 73 Val
SEQ.ID.NO.6
顺序类型:酶
分子类型:氨基酸
原始来源:藻类
序列长度:570个氨基酸
序列:
5 10 15
1 Met Thr Asn Tyr Asn Tyr Asp Asn Leu Asn Tyr Asn Gln Pro Asp
16 Leu Ile Pro Pro Gly His Asp Ser Asp Pro Asp Tyr Tyr Ile Pro
31 Met Tyr Phe Ala Ala Pro Trp Val Ile Ala His Gly Tyr Arg Gly
46 Thr Ser Asp Gln Tyr Ser Tyr Gly Trp Phe Leu Asp Asn Val Ser
61 Gln Ser Tyr Thr Asn Thr Gly Asp Asp Ala Trp Ala Gly Gln Lys
76 Asp Leu Ala Tyr Met Gly Ala Gln Cys Gly Pro Phe Asp Gln His
91 Phe Val Tyr Glu Ala Gly Asp Gly Leu Glu Asp Val Val Thr Ala
106 Phe Ser Tyr Leu Gln Gly Lys Glu Tyr Glu Asn Gln Gly Leu Asn
121 Ile Arg Ser Ala Met Pro Pro Lys Tyr Val Phe Gly Phe Phe Gln
136 Gly Val Phe Gly Ala Thr Ser Leu Leu Arg Asp Asn Leu Pro Ala
151 Gly Glu Asn Asn Val Ser Leu Glu Glu Ile Val Glu Gly Tyr Gln
166 Asn Gln Asn Val Pro Phe Glu Gly Leu Ala Val Asp Val Asp Met
181 Gln Asp Asp Leu Arg Val Phe Thr Thr Arg Pro Ala Phe Trp Thr
196 Ala Asn Lys Val Gly Glu Gly Gly Asp Pro Asn Asn Lys Ser Val
211 Phe Glu Trp Ala His Asp Arg Gly Leu Val Cys Gln Thr Asn Val
226 Thr Cys Phe Leu Lys Asn Glu Lys Asn Pro Tyr Glu Val Asn Gln
241 Ser Leu Arg Glu Lys Gln Leu Tyr Thr Lys Ser Asp Ser Leu Asp
256 Asn Ile Asp Phe Gly Thr Thr Pro Asp Gly Pro Ser Asp Ala Tyr
271 Ile Gly His Leu Asp Tyr Gly Gly Gly Val Glu Cys Asp Ala Leu
286 Phe Pro Asp Trp Gly Arg Pro Asp Val Ala Gln Trp Trp Gly Asp
301 Asn Tyr Lys Lys Leu Phe Ser Ile Gly Leu Asp Phe Val Trp Gln
316 Asp Met Thr Val Pro Ala Met Met Pro His Arg Leu Gly Asp Pro
331 Val Gly Thr Asn Ser Gly Glu Thr Ala Pro Gly Trp Pro Asn Asp
346 Lys Asp Pro Ser Asn Gly Arg Tyr Asn Trp Lys Ser Tyr His Pro
361 Gln Val Leu Val Thr Asp Met Arg Tyr Asp Asp Tyr Gly Arg Asp
376 Pro Ile Val Thr Gln Arg Asn Leu His Ala Tyr Thr Leu Cys Glu
391 Ser Thr Arg Arg Glu Gly Ile Val Gly Asn Ala Asp Ser Leu Thr
406 Lys Phe Arg Arg Ser Tyr Ile Ile Ser Arg Gly Gly Tyr Ile Gly
421 Asn Gln His Phe Gly Gly Met Trp Val Gly Asp Asn Ser Ser Thr
436 Glu Asp Tyr Leu Ala Met Met Val Ile Asn Val Ile Asn Met Asn
451 Met Ser Gly Val Pro Leu Val Gly Ser Asp Ile Gly Gly Phe Thr
466 Glu His Asp Lys Arg Asn Pro Cys Thr Pro Asp Leu Met Met Arg
481 Phe Val Gln Ala Gly Cys Leu Leu Pro Trp Phe Arg Asn His Tyr
496 Asp Arg Trp Ile Glu Ser Lys Lys His Gly Lys Asn Tyr Gln Glu
511 Leu Tyr Met Tyr Arg Asp His Leu Asp Ala Leu Arg Ser Phe Val
526 Glu Leu Arg Tyr Arg Trp Gln Glu Val Leu Tyr Thr Ala Met Tyr
541 Gln Asn Ala Leu Asn Gly Lys Pro Ile Ile Lys Thr Val Ser Met
556 Tyr Asn Asn Asp Met Asn Val Lys Asp Ala Gln Asn Asp His Phe
(2)SEQ ID NO:7的信息:
(i) 顺序特征:
(A)长度:3267个碱基对
(B)类型:核酸
(C)链型:双链
(D)拓扑学:线性
(ii) 分子类型:DNA(基因组)
(xi) 顺序描述:SEQ ID NO:7:
ATGTTTTCAA CCCTTGCGTT TGTCGCACCT AGTGCGCTGG GAGCCAGTAC CTTCGTAGGG 60
GCGGAGGTCA GGTCAAATGT TCGTATCCAT TCCGCTTTTC CAGCTGTGCA CACAGCTACT 120
CGCAAAACCA ATCGCCTCAA TGTATCCATG ACCGCATTGT CCGACAAACA AACGGCTACT 180
GCGGGTAGTA CAGACAATCC GGACGGTATC GACTACAAGA CCTACGATTA CGTCGGAGTA 240
TGGGGTTTCA GCCCCCTCTC CAACACGAAC TGGTTTGCTG CCGGCTCTTC TACCCCGGGT 300
GGCATCACTG ATTGGACGGC TACAATGAAT GTCAACTTCG ACCGTATCGA CAATCCGTCC 360
ATCACTGTCC AGCATCCCGT TCAGGTTCAG GTCACGTCAT ACAACAACAA CAGCTACAGG 420
GTTCGCTTCA ACCCTGATGG CCCTATTCGT GATGTGACTC GTGGGCCTAT CCTCAAGCAG 480
CAACTAGATT GGATTCGAAC GCAGGAGCTG TCAGAGGGAT GTGATCCCGG AATGACTTTC 540
ACATCAGAAG GTTTCTTGAC TTTTGAGACC AAGGATCTAA GCGTCATCAT CTACGGAAAT 600
TTCAAGACCA GAGTTACGAG AAAGTCTGAC GGCAAGGTCA TCATGGAAAA TGATGAAGTT 660
GGAACTGCAT CGTCCGGGAA CAAGTGCCGG GGATTGATGT TCGTTGATAG ATTATACGGT 720
AACGCTATCG CTTCCGTCAA CAAGAACTTC CGCAACGACG CGGTCAAGCA GGAGGGATTC 780
TATGGTGCAG GTGAAGTCAA CTGTAAGTAC CAGGACACCT ACATCTTAGA ACGCACTGGA 840
ATCGCCATGA CAAATTACAA CTACGATAAC TTGAACTATA ACCAGTGGGA CCTTAGACCT 900
CCGCATCATG ATGGTGCCCT CAACCCAGAC TATTATATTC CAATGTACTA CGCAGCACCT 960
TGGTTGATCG TTAATGGATG CGCCGGTACT TCGGAGCAGT ACTCGTATGG ATGGTTCATG 1020
GACAATGTCT CTCAATCTTA CATGAATACT GGAGATACTA CCTGGAATTC TGGACAAGAG 1080
GACCTGGCAT ACATGGGCGC GCAGTATGGA CCATTTGACC AACATTTTGT TTACGGTGCT 1140
GGGGGTGGGA TGGAATGTGT GGTCACAGCG TTCTCTCTTC TACAAGGCAA GGAGTTCGAG 1200
AACCAAGTTC TCAACAAACG TTCAGTAATG CCTCCGAAAT ACGTCTTTGG TTTCTTCCAG 1260
GGTGTTTTCG GGACTTCTTC CTTGTTGAGA GCGCATATGC CAGCAGGTGA GAACAACATC 1320
TCAGTCGAAG AAATTGTAGA AGGTTATCAA AACAACAATT TCCCTTTCGA GGGGCTCGCT 1380
GTGGACGTGG ATATGCAAGA CAACTTGCGG GTGTTCACCA CGAAGGGCGA ATTTTGGACC 1440
GCAAACAGGG TGGGTACTGG CGGGGATCCA AACAACCGAT CGGTTTTTGA ATGGGCACAT 1500
GACAAAGGCC TTGTTTGTCA GACAAATATA ACTTGCTTCC TGAGGAATGA TAACGAGGGG 1560
CAAGACTACG AGGTCAATCA GACGTTAAGG GAGAGGCAGT TGTACACGAA GAACGACTCC 1620
CTGACGGGTA CGGATTTTGG AATGACCGAC GACGGCCCCA GCGATGCGTA CATCGGTCAT 1680
CTGGACTATG GGGGTGGAGT AGAATGTGAT GCACTTTTCC CAGACTGGGG ACGGCCTGAC 1740
GTGGCCGAAT GGTGGGGAAA TAACTATAAG AAACTGTTCA GCATTGGTCT CGACTTCGTC 1800
TGGCAAGACA TGACTGTTCC AGCAATGATG CCGCACAAAA TTGGCGATGA CATCAATGTG 1860
AAACCGGATG GGAATTGGCC GAATGCGGAC GATCCGTCCA ATGGACAATA CAACTGGAAG 1920
ACGTACCATC CCCAAGTGCT TGTAACTGAT ATGCGTTATG AGAATCATGG TCGGGAACCG 1980
ATGGTCACTC AACGCAACAT TCATGCGTAT ACACTGTGCG AGTCTACTAG GAAGGAAGGG 2040
ATCGTGGAAA ACGCAGACAC TCTAACGAAG TTCCGCCGTA GCTACATTAT CAGTCGTGGT 2100
GGTTACATTG GTAACCAGCA TTTCGGGGGT ATGTGGGTGG GAGACAACTC TACTACATCA 2160
AACTACATCC AAATGATGAT TGCCAACAAT ATTAACATGA ATATGTCTTG CTTGCCTCTC 2220
GTCGGCTCCG ACATTGGAGG ATTCACCTCA TACGACAATG AGAATCAGCG AACGCCGTGT 2280
ACCGGGGACT TGATGGTGAG GTATGTGCAG GCGGGCTGCC TGTTGCCGTG GTTCAGGAAC 2340
CACTATGATA GGTGGATCGA GTCCAAGGAC CACGGAAAGG ACTACCAGGA GCTGTACATG 2400
TATCCGAATG AAATGGATAC GTTGAGGAAG TTCGTTGAAT TCCGTTATCG CTGGCAGGAA 2460
GTGTTGTACA CGGCCATGTA CCAGAATGCG GCTTTCGGAA AGCCGATTAT CAAGGCTGCT 2520
TCGATGTACA ATAACGACTC AAACGTTCGC AGGGCGCAGA ACGATCATTT CCTTCTTGGT 2580
GGACATGATG GATATCGCAT TCTGTGCGCG CCTGTTGTGT GGGAGAATTC GACCGAACGC 2640
GAATTGTACT TGCCCGTGCT GACCCAATGG TACAAATTCG GTCCCGACTT TGACACCAAG 2700
CCTCTGGAAG GAGCGATGAA CGGAGGGGAC CGAATTTACA ACTACCCTGT ACCGCAAAGT 2760
GAATCACCAA TCTTCGTGAG AGAAGGTGCG ATTCTCCCTA CCCGCTACAC GTTGAACGGT 2820
GAAAACAAAT CATTGAACAC GTACACGGAC GAAGATCCGT TGGTGTTTGA AGTATTCCCC 2880
CTCGGAAACA ACCGTGCCGA CGGTATGTGT TATCTTGATG ATGGCGGTGT GACCACCAAT 2940
GCTGAAGACA ATGGCAAGTT CTCTGTCGTC AAGGTGGCAG CGGAGCAGGA TGGTGGTACG 3000
GAGACGATAA CGTTTACGAA TGATTGCTAT GAGTACGTTT TCGGTGGACC GTTCTACGTT 3060
CGAGTGCGCG GCGCTCAGTC GCCGTCGAAC ATCCACGTGT CTTCTGGAGC GGGTTCTCAG 3120
GACATGAAGG TGAGCTCTGC CACTTCCAGG GCTGCGCTGT TCAATGACGG GGAGAACGGT 3180
GATTTCTGGG TTGACCAGGA GACAGATTCT CTGTGGCTGA AGTTGCCCAA CGTTGTTCTC 3240
CCGGACGCTG TGATCACAAT TACCTAA 3267
(2)SEQ ID NO:8的信息:
(i) 顺序特征:
(A)长度:3276个碱基对
(B)类型:核酸
(C)链型:双链
(D)拓扑学:线性
(ii) 分子类型:DNA(基因组)
(xi) 顺序描述:SEQ ID NO:8:
ATGTATCCAA CCCTCACCTT CGTGGCGCCT AGTGCGCTAG GGGCCAGAAC TTTCACGTGT 60
GTGGGCATTT TTAGGTCACA CATTCTTATT CATTCGGTTG TTCCAGCGGT GCGTCTAGCT 120
GTGCGCAAAA GCAACCGCCT CAATGTATCC ATGTCCGCTT TGTTCGACAA ACCGACTGCT 180
GTTACTGGAG GGAAGGACAA CCCGGACAAT ATCAATTACA CCACTTATGA CTACGTCCCT 240
GTGTGGCGCT TCGACCCCCT CAGCAATACG AACTGGTTTG CTGCCGGATC TTCCACTCCC 300
GGCGATATTG ACGACTGGAC GGCGACAATG AATGTGAACT TCGACCGTAT CGACAATCCA 360
TCCTTCACTC TCGAGAAACC GGTTCAGGTT CAGGTCACGT CATACAAGAA CAATTGTTTC 420
AGGGTTCGCT TCAACCCTGA TGGTCCTATT CGCGATGTGG ATCGTGGGCC TATCCTCCAG 480
CAGCAACTAA ATTGGATCCG GAAGCAGGAG CAGTCGAAGG GGTTTGATCC TAAGATGGGC 540
TTCACAAAAG AAGGTTTCTT GAAATTTGAG ACCAAGGATC TGAACGTTAT CATATATGGC 600
AATTTTAAGA CTAGAGTTAC GAGGAAGAGG GATGGAAAAG GGATCATGGA GAATAATGAA 660
GTGCCGGCAG GATCGTTAGG GAACAAGTGC CGGGGATTGA TGTTTGTCGA CAGGTTGTAC 720
GGCACTGCCA TCGCTTCCGT TAATGAAAAT TACCGCAACG ATCCCGACAG GAAAGAGGGG 780
TTCTATGGTG CAGGAGAAGT AAACTGCGAG TTTTGGGACT CCGAACAAAA CAGGAACAAG 840
TACATCTTAG AACGAACTGG AATCGCCATG ACAAATTACA ATTATGACAA CTATAACTAC 900
AACCAGTCAG ATCTTATTGC TCCAGGATAT CCTTCCGACC CGAACTTCTA CATTCCCATG 960
TATTTTGCAG CACCTTGGGT AGTTGTTAAG GGATGCAGTG GCAACAGCGA TGAACAGTAC 1020
TCGTACGGAT GGTTTATGGA TAATGTCTCC CAAACTTACA TGAATACTGG TGGTACTTCC 1080
TGGAACTGTG GAGAGGAGAA CTTGGCATAC ATGGGAGCAC AGTGCGGTCC ATTTGACCAA 1140
CATTTTGTGT ATGGTGATGG AGATGGTCTT GAGGATGTTG TCCAAGCGTT CTCTCTTCTG 1200
CAAGGCAAAG AGTTTGAGAA CCAAGTTCTG AACAAACGTG CCGTAATGCC TCCGAAATAT 1260
GTGTTTGGTT ACTTTCAGGG AGTCTTTGGG ATTGCTTCCT TGTTGAGAGA GCAAAGACCA 1320
GAGGGTGGTA ATAACATCTC TGTTCAAGAG ATTGTCGAAG GTTACCAAAG CAATAACTTC 1380
CCTTTAGAGG GGTTAGCCGT AGATGTGGAT ATGCAACAAG ATTTGCGCGT GTTCACCACG 1440
AAGATTGAAT TTTGGACGGC AAATAAGGTA GGCACCGGGG GAGACTCGAA TAACAAGTCG 1500
GTGTTTGAAT GGGCACATGA CAAAGGCCTT GTATGTCAGA CGAATGTTAC TTGCTTCTTG 1560
AGAAACGACA ACGGCGGGGC AGATTACGAA GTCAATCAGA CATTGAGGGA GAAGGGTTTG 1620
TACACGAAGA ATGACTCACT GACGAACACT AACTTCGGAA CTACCAACGA CGGGCCGAGC 1680
GATGCGTACA TTGGACATCT GGACTATGGT GGCGGAGGGA ATTGTGATGC ACTTTTCCCA 1740
GACTGGGGTC GACCGGGTGT GGCTGAATGG TGGGGTGATA ACTACAGCAA GCTCTTCAAA 1800
ATTGGTCTGG ATTTCGTCTG GCAAGACATG ACAGTTCCAG CTATGATGCC ACACAAAGTT 1860
GGCGACGCAG TCGATACGAG ATCACCTTAC GGCTGGCCGA ATGAGAATGA TCCTTCGAAC 1920
GGACGATACA ATTGGAAATC TTACCATCCA CAAGTTCTCG TAACTGATAT GCGATATGAG 1980
AATCATGGAA GGGAACCGAT GTTCACTCAA CGCAATATGC ATGCGTACAC ACTCTGTGAA 2040
TCTACGAGGA AGGAAGGGAT TGTTGCAAAT GCAGACACTC TAACGAAGTT CCGCCGCAGT 2100
TATATTATCA GTCGTGGAGG TTACATTGGC AACCAGCATT TTGGAGGAAT GTGGGTTGGA 2160
GACAACTCTT CCTCCCAAAG ATACCTCCAA ATGATGATCG CGAACATCGT CAACATGAAC 2220
ATGTCTTGCC TTCCACTAGT TGGGTCCGAC ATTGGAGGTT TTACTTCGTA TGATGGACGA 2280
AACGTGTGTC CCGGGGATCT AATGGTAAGA TTCGTGCAGG CGGGTTGCTT ACTACCGTGG 2340
TTCAGAAACC ACTATGGTAG GTTGGTCGAG GGCAAGCAAG AGGGAAAATA CTATCAAGAA 2400
CTGTACATGT ACAAGGACGA GATGGCTACA TTGAGAAAAT TCATTGAATT CCGTTACCGC 2460
TGGCAGGAGG TGTTGTACAC TGCTATGTAC CAGAATGCGG CTTTCGGGAA ACCGATTATC 2520
AAGGCAGCTT CCATGTACGA CAACGACAGA AACGTTCGCG GCGCACAGGA TGACCACTTC 2580
CTTCTCGGCG GACACGATGG ATATCGTATT TTGTGTGCAC CTGTTGTGTG GGAGAATACA 2640
ACCAGTCGCG ATCTGTACTT GCCTGTGCTG ACCAAATGGT ACAAATTCGG CCCTGACTAT 2700
GACACCAAGC GCCTGGATTC TGCGTTGGAT GGAGGGCAGA TGATTAAGAA CTATTCTGTG 2760
CCACAAAGCG ACTCTCCGAT ATTTGTGAGG GAAGGAGCTA TTCTCCCTAC CCGCTACACG 2820
TTGGACGGTT CGAACAAGTC AATGAACACG TACACAGACA AAGACCCGTT GGTGTTTGAG 2880
GTATTCCCTC TTGGAAACAA CCGTGCCGAC GGTATGTGTT ATCTTGATGA TGGCGGTATT 2940
ACTACAGATG CTGAGGACCA TGGCAAATTC TCTGTTATCA ATGTCGAACG CTTACGGAAA 3000
GGTGTTACGA CGACGATCAA GTTTGCGTAT GACACTTATC AATACGTATT TGATGGTCCA 3060
TTCTACGTTC GAATCCGTAA TCTTACGACT GCATCAAAAA TTAACGTGTC TTCTGGAGCG 3120
GGTGAAGAGG ACATGACACC GACCTCTGCG AACTCGAGGG CAGCTTTGTT CAGTGATGGA 3180
GGTGTTGGAG AATACTGGGC TGACAATGAT ACGTCTTCTC TGTGGATGAA GTTGCCAAAC 3240
CTGGTTCTGC AAGACGCTGT GATTACCATT ACGTAG 3276
(2)SEQ ID NO:9的信息:
(i) 顺序特征:
(A)长度:3201个碱基对
(B)类型:核酸
(C)链型:双链
(D)拓扑学:线性
(ii) 分子类型:DNA(基因组)
(xi) 顺序描述:SEQ ID NO:9:
ATGGCAGGAT TTTCTGATCC TCTCAACTTT TGCAAAGCAG AAGACTACTA CAGTGTTGCG 60
CTAGACTGGA AGGGCCCTCA AAAAATCATT GGAGTAGACA CTACTCCTCC AAAGAGCACC 120
AAGTTCCCCA AAAACTGGCA TGGAGTGAAC TTGAGATTCG ATGATGGGAC TTTAGGTGTG 180
GTTCAGTTCA TTAGGCCGTG CGTTTGGAGG GTTAGATACG ACCCTGGTTT CAAGACCTCT 240
GACGAGTATG GTGATGAGAA TACGAGGACA ATTGTGCAAG ATTATATGAG TACTCTGAGT 300
AATAAATTGG ATACTTATAG AGGTCTTACG TGGGAAACCA AGTGTGAGGA TTCGGGAGAT 360
TTCTTTACCT TCTCATCCAA GGTCACCGCC GTTGAAAAAT CCGAGCGGAC CCGCAACAAG 420
GTCGGCGATG GCCTCAGAAT TCACCTATGG AAAAGCCCTT TCCGCATCCA AGTAGTGCGC 480
ACCTTGACCC CTTTGAAGGA TCCTTACCCC ATTCCAAATG TAGCCGCAGC CGAAGCCCGT 540
GTGTCCGACA AGGTCGTTTG GCAAACGTCT CCCAAGACAT TCAGAAAGAA CCTGCATCCG 600
CAACACAAGA TGCTAAAGGA TACAGTTCTT GACATTGTCA AACCTGGACA TGGCGAGTAT 660
GTGGGGTGGG GAGAGATGGG AGGTATCCAG TTTATGAAGG AGCCAACATT CATGAACTAT 720
TTTAACTTCG ACAATATGCA ATACCAGCAA GTCTATGCCC AAGGTGCTCT CGATTCTCGC 780
GAGCCACTGT ACCACTCGGA TCCCTTCTAT CTTGATGTGA ACTCCAACCC GGAGCACAAG 840
AATATCACGG CAACCTTTAT CGATAACTAC TCTCAAATTG CCATCGACTT TGGAAAGACC 900
AACTCAGGCT ACATCAAGCT GGGAACCAGG TATGGTGGTA TCGATTGTTA CGGTATCAGT 960
GCGGATACGG TCCCGGAAAT TGTACGACTT TATACAGGTC TTGTTGGACG TTCAAAGTTG 1020
AAGCCCAGAT ATATTCTCGG GGCCCATCAA GCCTGTTATG GATACCAACA GGAAAGTGAC 1080
TTGTATTCTG TGGTCCAGCA GTACCGTGAC TGTAAATTTC CACTTGACGG GATTCACGTC 1140
GATGTCGATG TTCAGGACGG CTTCAGAACT TTCACCACCA ACCCACACAC TTTCCCTAAC 1200
CCCAAAGAGA TGTTTACTAA CTTGAGGAAT AATGGAATCA AGTGCTCCAC CAATATCACT 1260
CCTGTTATCA GCATTAACAA CAGAGAGGGT GGATACAGTA CCCTCCTTGA GGGAGTTGAC 1320
AAAAAATACT TTATCATGGA CGACAGATAT ACCGAGGGAA CAAGTGGGAA TGCGAAGGAT 1380
GTTCGGTACA TGTACTACGG TGGTGGTAAT AAGGTTGAGG TCGATCCTAA TGATGTTAAT 1440
GGTCGGCCAG ACTTTAAAGA CAACTATGAC TTCCCCGCGA ACTTCAACAG CAAACAATAC 1500
CCCTATCATG GTGGTGTGAG CTACGGTTAT GGGAACGGTA GTGCAGGTTT TTACCCGGAC 1560
CTCAACAGAA AGGAGGTTCG TATCTGGTGG GGAATGCAGT ACAAGTATCT CTTCGATATG 1620
GGACTGGAAT TTGTGTGGCA AGACATGACT ACCCCAGCAA TCCACACATC ATATGGAGAC 1680
ATGAAAGGGT TGCCCACCCG TCTACTCGTC ACCTCAGACT CCGTCACCAA TGCCTCTGAG 1740
AAAAAGCTCG CAATTGAAAC TTGGGCTCTC TACTCCTACA ATCTCCACAA AGCAACTTGG 1800
CATGGTCTTA GTCGTCTCGA ATCTCGTAAG AACAAACGAA ACTTCATCCT CGGGCGTGGA 1860
AGTTATGCCG GAGCCTATCG TTTTGCTGGT CTCTGGACTG GGGATAATGC AAGTAACTGG 1920
GAATTCTGGA AGATATCGGT CTCTCAAGTT CTTTCTCTGG GCCTCAATGG TGTGTGCATC 1980
GCGGGGTCTG ATACGGGTGG TTTTGAACCC TACCGTGATG CAAATGGGGT CGAGGAGAAA 2040
TACTGTAGCC CAGAGCTACT CATCAGGTGG TATACTGGTT CATTCCTCTT GCCGTGGCTC 2100
AGGAACCATT ATGTCAAAAA GGACAGGAAA TGGTTCCAGG AACCATACTC GTACCCCAAG 2160
CATCTTGAAA CCCATCCAGA ACTCGCAGAC CAAGCATGGC TCTATAAATC CGTTTTGGAG 2220
ATCTGTAGGT ACTATGTGGA GCTTAGATAC TCCCTCATCC AACTACTTTA CGACTGCATG 2280
TTTCAAAACG TAGTCGACGG TATGCCAATC ACCAGATCTA TGCTCTTGAC CGATACTGAG 2340
GATACCACCT TCTTCAACGA GAGCCAAAAG TTCCTCGACA ACCAATATAT GGCTGGTGAC 2400
GACATTCTTG TTGCACCCAT CCTCCACAGT CGCAAAGAAA TTCCAGGCGA AAACAGAGAT 2460
GTCTATCTCC CTCTTTACCA CACCTGGTAC CCCTCAAATT TGAGACCATG GGACGATCAA 2520
GGAGTCGCTT TGGGGAATCC TGTCGAAGGT GGTAGTGTCA TCAATTATAC TGCTAGGATT 2580
GTTGCACCCG AGGATTATAA TCTCTTCCAC AGCGTGGTAC CAGTCTACGT TAGAGAGGGT 2640
GCCATCATCC CGCAAATCGA AGTACGCCAA TGGACTGGCC AGGGGGGAGC CAACCGCATC 2700
AAGTTCAACA TCTACCCTGG AAAGGATAAG GAGTACTGTA CCTATCTTGA TGATGGTGTT 2760
AGCCGTGATA GTGCGCCGGA AGACCTCCCA CAGTACAAAG AGACCCACGA ACAGTCGAAG 2820
GTTGAAGGCG CGGAAATCGC AAAGCAGATT GGAAAGAAGA CGGGTTACAA CATCTCAGGA 2880
ACCGACCCAG AAGCAAAGGG TTATCACCGC AAAGTTGCTG TCACACAAAC GTCAAAAGAC 2940
AAGACGCGTA CTGTCACTAT TGAGCCAAAA CACAATGGAT ACGACCCTTC CAAAGAGGTG 3000
GGTGATTATT ATACCATCAT TCTTTGGTAC GCACCAGGTT TCGATGGCAG CATCGTCGAT 3060
GTGAGCAAGA CGACTGTGAA TGTTGAGGGT GGGGTGGAGC ACCAAGTTTA TAAGAACTCC 3120
GATTTACATA CGGTTGTTAT CGACGTGAAG GAGGTGATCG GTACCACAAA GAGCGTCAAG 3180
ATCACATGTA CTGCCGCTTA A 3201
(2)SEQ ID NO:10的信息:
(i) 顺序特征:
(A)长度:3213个碱基对
(B)类型:核酸
(C)链型:双链
(D)拓扑学:线性
(ii) 分子类型:DNA(基因组)
(xi) 顺序描述:SEQ ID NO:10:
ATGGCAGGAT TATCCGACCC TCTCAATTTC TGCAAAGCAG AGGACTACTA CGCTGCTGCC 60
AAAGGCTGGA GTGGCCCTCA GAAGATCATT CGCTATGACC AGACCCCTCC TCAGGGTACA 120
AAAGATCCGA AAAGCTGGCA TGCGGTAAAC CTTCCTTTCG ATGACGGGAC TATGTGTGTA 180
GTGCAATTCG TCAGACCCTG TGTTTGGAGG GTTAGATATG ACCCCAGTGT CAAGACTTCT 240
GATGAGTACG GCGATGAGAA TACGAGGACT ATTGTACAAG ACTACATGAC TACTCTGGTT 300
GGAAACTTGG ACATTTTCAG AGGTCTTACG TGGGTTTCTA CGTTGGAGGA TTCGGGCGAG 360
TACTACACCT TCAAGTCCGA AGTCACTGCC GTGGACGAAA CCGAACGGAC TCGAAACAAG 420
GTCGGCGACG GCCTCAAGAT TTACCTATGG AAAAATCCCT TTCGCATCCA GGTAGTGCGT 480
CTCTTGACCC CCCTGGTGGA CCCTTTCCCC ATTCCCAACG TAGCCAATGC CACAGCCCGT 540
GTGGCCGACA AGGTTGTTTG GCAGACGTCC CCGAAGACGT TCAGGAAAAA CTTGCATCCG 600
CAGCATAAGA TGTTGAAGGA TACAGTTCTT GATATTATCA AGCCGGGGCA CGGAGAGTAT 660
GTGGGTTGGG GAGAGATGGG AGGCATCGAG TTTATGAAGG AGCCAACATT CATGAATTAT 720
TTCAACTTTG ACAATATGCA ATATCAGCAG GTCTATGCAC AAGGCGCTCT TGATAGTCGT 780
GAGCCGTTGT ATCACTCTGA TCCCTTCTAT CTCGACGTGA ACTCCAACCC AGAGCACAAG 840
AACATTACGG CAACCTTTAT CGATAACTAC TCTCAGATTG CCATCGACTT TGGGAAGACC 900
AACTCAGGCT ACATCAAGCT GGGTACCAGG TATGGCGGTA TCGATTGTTA CGGTATCAGC 960
GCGGATACGG TCCCGGAGAT TGTGCGACTT TATACTGGAC TTGTTGGGCG TTCGAAGTTG 1020
AAGCCCAGGT ATATTCTCGG AGCCCACCAA GCTTGTTATG GATACCAGCA GGAAAGTGAC 1080
TTGCATGCTG TTGTTCAGCA GTACCGTGAC ACCAAGTTTC CGCTTGATGG GTTGCATGTC 1140
GATGTCGACT TTCAGGACAA TTTCAGAACG TTTACCACTA ACCCGATTAC GTTCCCTAAT 1200
CCCAAAGAAA TGTTTACCAA TCTAAGGAAC AATGGAATCA AGTGTTCCAC CAACATCACC 1260
CCTGTTATCA GTATCAGAGA TCGCCCGAAT GGGTACAGTA CCCTCAATGA GGGATATGAT 1320
AAAAAGTACT TCATCATGGA TGACAGATAT ACCGAGGGGA CAAGTGGGGA CCCGCAAAAT 1380
GTTCGATACT CTTTTTACGG CGGTGGGAAC CCGGTTGAGG TTAACCCTAA TGATGTTTGG 1440
GCTCGGCCAG ACTTTGGAGA CAATTATGAC TTCCCTACGA ACTTCAACTG CAAAGACTAC 1500
CCCTATCATG GTGGTGTGAG TTACGGATAT GGGAATGGCA CTCCAGGTTA CTACCCTGAC 1560
CTTAACAGAG AGGAGGTTCG TATCTGGTGG GGATTGCAGT ACGAGTATCT CTTCAATATG 1620
GGACTAGAGT TTGTATGGCA AGATATGACA ACCCCAGCGA TCCATTCATC ATATGGAGAC 1680
ATGAAAGGGT TGCCCACCCG TCTGCTCGTC ACCGCCGACT CAGTTACCAA TGCCTCTGAG 1740
AAAAAGCTCG CAATTGAAAG TTGGGCTCTT TACTCCTACA ACCTCCATAA AGCAACCTTC 1800
CACGGTCTTG GTCGTCTTGA GTCTCGTAAG AACAAACGTA ACTTCATCCT CGGACGTGGT 1860
AGTTACGCCG GTGCCTATCG TTTTGCTGGT CTCTGGACTG GAGATAACGC AAGTACGTGG 1920
GAATTCTGGA AGATTTCGGT CTCCCAAGTT CTTTCTCTAG GTCTCAATGG TGTGTGTATA 1980
GCGGGGTCTG ATACGGGTGG TTTTGAGCCC GCACGTACTG AGATTGGGGA GGAGAAATAT 2040
TGCAGTCCGG AGCTACTCAT CAGGTGGTAT ACTGGATCAT TCCTTTTGCC ATGGCTTAGA 2100
AACCACTACG TCAAGAAGGA CAGGAAATGG TTCCAGGAAC CATACGCGTA CCCCAAGCAT 2160
CTTGAAACCC ATCCAGAGCT CGCAGATCAA GCATGGCTTT ACAAATCTGT TCTAGAAATT 2220
TGCAGATACT GGGTAGAGCT AAGATATTCC CTCATCCAGC TCCTTTACGA CTGCATGTTC 2280
CAAAACGTGG TCGATGGTAT GCCACTTGCC AGATCTATGC TCTTGACCGA TACTGAGGAT 2340
ACGACCTTCT TCAATGAGAG CCAAAAGTTC CTCGATAACC AATATATGGC TGGTGACGAC 2400
ATCCTTGTAG CACCCATCCT CCACAGCCGT AACGAGGTTC CGGGAGAGAA CAGAGATGTC 2460
TATCTCCCTC TATTCCACAC CTGGTACCCC TCAAACTTGA GACCGTGGGA CGATCAGGGA 2520
GTCGCTTTAG GGAATCCTGT CGAAGGTGGC AGCGTTATCA ACTACACTGC CAGGATTGTT 2580
GCCCCAGAGG ATTATAATCT CTTCCACAAC GTGGTGCCGG TCTACATCAG AGAGGGTGCC 2640
ATCATTCCGC AAATTCAGGT ACGCCAGTGG ATTGGCGAAG GAGGGCCTAA TCCCATCAAG 2700
TTCAATATCT ACCCTGGAAA GGACAAGGAG TATGTGACGT ACCTTGATGA TGGTGTTAGC 2760
CGCGATAGTG CACCAGATGA CCTCCCGCAG TACCGCGAGG CCTATGAGCA AGCGAAGGTC 2820
GAAGGCAAAG ACGTCCAGAA GCAACTTGCG GTCATTCAAG GGAATAAGAC TAATGACTTC 2880
TCCGCCTCCG GGATTGATAA GGAGGCAAAG GGTTATCACC GCAAAGTTTC TATCAAACAG 2940
GAGTCAAAAG ACAAGACCCG TACTGTCACC ATTGAGCCAA AACACAACGG ATACGACCCC 3000
TCTAAGGAAG TTGGTAATTA TTATACCATC ATTCTTTGGT ACGCACCGGG CTTTGACGGC 3060
AGCATCGTCG ATGTGAGCCA GGCGACCGTG AACATCGAGG GCGGGGTGGA ATGCGAAATT 3120
TTCAAGAACA CCGGCTTGCA TACGGTTGTA GTCAACGTGA AAGAGGTGAT CGGTACCACA 3180
AAGTCCGTCA AGATCACTTG CACTACCGCT TAG 3213
SEQ.ID.NO.11
顺序类型:核酸
分子类型:DNA(基因组)
原始来源:藻类
序列长度:3279BP
链型:双链
序列:
10 20 30 40 50 60
1 ATGTTTCCTA CCCTGACCTT CATAGCGCCC AGCGCGCTGG CCGCCAGCAC CTTTGTGGGC
61 GCGGATATCC GATCGGGCAT TCGCATTCAA TCCGCTCTTC CGGCCGTGCG CAACGCTGTG
121 CGCAGGAGCA AACATTACAA TGTATCCATG ACCGCATTGT CTGACAAGCA AACCGCTATC
181 AGTATTGGCC CTGACAATCC GGACGGTATC AACTACCAAA ACTACGATTA CATCCCTGTA
241 GCGGGCTTTA CGCCCCTCTC CAACACCAAC TGGTATGCTG CCGGCTCTTC CACTCCGGGC
301 GGCATCACCG ACTGGACCGC TACCATGAAT GTCAAATTCG ACCGCATTGA CAATCCGTCG
361 TACTCCAATA ACCATCCTGT TCAGATTCAG GTCACGTCGT ACAACAACAA CAGCTTCAGG
421 ATTCGCTTCA ACCCTGATGG CCCCATTCGT GACGTCTCTC GAGGACCTAT CCTGAAACAG
481 CAACTCACTT GGATTCGAAA CCAGGAGCTG GCGCAGGGAT GTAATCCGAA CATGAGCTTC
541 TCTCCTGAAG GTTTTTTGTC TTTTGAAACC AAAGACCTAA ACGTTATAAT CTACGGCAAC
601 TGCAAGATGA GAGTCACGAA GAAGGATGGC TACCTCGTCA TGGAGAATGA CGAGTGCAAC
661 TCGCAATCAG ATGGCAATAA GTGTAGAGGA TTGATGTACG TTGACCGGCT ATACGGTAAT
721 GCTATTGCTT CCGTACAAAC GAATTTTCAC AAAGACACTT CTCGGAACGA GAAATTCTAT
781 GGTGCAGGTG AAGTCAACTG TCGCTATGAG GAGCAGGGTA AGGCGCCGAC TTATGTTCTA
841 GAACGCTCTG GACTCGCCAT GACCAATTAC AATTACGACA ACTTGAACTA CAACCAACCA
901 GACGTCGTTC CTCCAGGTTA TCCCGACCAT CCCAACTACT ACATTCCAAT GTACTACGCA
961 GCACCGTGGT TGGTCGTTCA GGGATGCGCG GGGACATCGA AGCAATACTC GTACGGTTGG
1021 TTTATGGACA ATGTCTCTCA GTCGTACATG AACACTGGAG ATACGGCGTG GAACTGCGGA
1081 CAGGAAAACC TGGCATACAT GGGCGCGCAA TACGGGCCAT TTGATCAGCA CTTTGTGTAT
1141 GGTGATGGAG ATGGCCTTGA AGATGTCGTC AAAGCGTTCT CCTTTCTTCA AGGAAAGGAG
1201 TTCGAAGACA AAAAACTCAA CAAGCGTTCT GTAATGCCTC CGAAGTACGT GTTTGGTTTC
1261 TTCCAGGGTG TTTTCGGTGC ACTTTCACTG TTGAAGCAGA ATCTGCCTGC CGGAGAGAAC
1321 AACATCTCAG TGCAAGAGAT TGTGGAGGGT TACCAGGATA ACGACTACCC CTTTGAAGGG
1381 CTCGCGGTAG ATGTTGATAT GCAAGATGAT CTGCGAGTGT TTACTACCAA ACCAGAATAT
1441 TGGTCGGCAA ACATGGTAGG CGAAGGCGGT GATCCTAATA ACAGATCAGT CTTTGAATGG
1501 GCACATGACA GGGGCCTTGT CTGTCAGACG AACGTAACTT GCTTCTTGAG GAACGATAAC
1561 AGTGGGAAAC CATACGAAGT GAATCAGACA TTGAGGGAGA AACAGTTGTA TACGAAGAAT
1621 GATTCCTTGA ACAACACCGA TTTTGGAACT ACCTCGGATG GGCCTGGCGA TGCGTACATT
1681 GGACATTTGG ACTATGGTGG TGGAGTGGAG TGTGATGCAA TCTTCCCAGA CTGGGGTCGA
1741 CCAGACGTGG CTCAATGGTG GGGAGAAAAC TACAAGAAGC TGTTCAGCAT TGGTCTCGAT
1801 TTCGTGTGGC AGGATATGAC GGTACCTGCG ATGATGCCGC ACCGACTCGG TGATGCTGTC
1861 AACAAAAATT CCGGTAGTTC GGCGCCGGGC TGGCCGAATG AGAACGATCC ATCCAACGGA
1921 CGATACAACT GGAAATCTTA TCATCCGCAA GTGCTCGTGA CCGACATGCG CTATGGTGCA
1981 GAGTATGGAA GGGAACCGAT GGTGTCTCAA CGCAACATTC ACGCCTACAC TCTTTGTGAA
2041 TCTACCAGAC GGGAGGGAAT TGTGGGAAAC GCAGACAGTT TGACCAAGTT CCGCCGCAGT
2101 TACATCATCA GTCGAGGAGG TTACATCGGT AACCAGCATT TCGGAGGGAT GTGGGTTGGG
2161 GACAACAGTG CCACAGAATC CTACCTCCAA ATGATGTTGG CGAACATTAT CAACATGAAT
2221 ATGTCGTGCC TCCCGCTAGT TGGCTCTGAT ATTGGCGGGT TCACCCAGTA CAATGATGCG
2281 GGCGACCCAA CCCCCGAGGA TTTGATGGTA AGATTCGTGC AGGCTGGCTG TCTGCTACCG
2341 TGGTTCAGAA ACCACTATGA CAGGTGGATT GAGTCCAAGA AGCACGGGAA GAAATACCAG
2401 GAGTTATACA TGTACCCGGG GCAAAAGGAT ACGTTGAAGA AGTTCGTTGA ATTCCGCTAC
2461 CGCTGGCAGG AGGTTTTGTA CACAGCCATG TACCAAAATG CTACCACTGG AGAGCCGATC
2521 ATCAAGGCGG CGCCCATGTA CAACAACGAC GTCAACGTGT ATAAATCGCA GAATGATCAT
2581 TTCCTTCTCG GTGGACATGA CGGCTATCGT ATTCTCTGCG CACCTGTTGT GCGCGAAAAT
2641 GCGACAAGTC GCGAAGTGTA CCTGCCTGTG TATAGCAAGT GGTTCAAATT CGGACCGGAC
2701 TTTGACACTA AGCCCTTGGA AAATGAGATT CAAGGAGGTC AGACGCTTTA TAATTACGCT
2761 GCACCGCTGA ACGATTCGCC GATATTTGTG AGGGAAGGGA CTATTCTTCC GACACGGTAC
2821 ACGCTGGACG GTGTGAACAA ATCTATCAAC ACGTACACAG ACAATGATCC GCTTGTATTT
2881 GAGCTGTTCC CTCTCGAAAA CAACCAGGCG CATGGCTTGT TCTATCATGA TGATGGCGGT
2941 GTCACCACCA ACGCTGAAGA CTTTGGCAAG TATTCTGTGA TCAGTGTGAA GGCCGCGCAG
3001 GAAGGTTCTC AAATGAGTGT CAAGTTTGAC AATGAAGTTT ATGAACACCA ATGGGGAGCA
3061 TCGTTCTATG TTCGTGTTCG TAATATGGGT GCTCCGTCTA ACATCAACGT ATCTTCTCAG
3121 ATTGGTCAAC AGGACATGCA ACAGAGCTCC GTGAGTTCCA GGGCGCAAAT GTTCACTAGT
3181 GCTAACGATG GCGAGTACTG GGTTGACCAG AGCACGAACT CGTTGTGGCT CAAGTTGCCT
3241 GGTGCAGTTA TCCAAGACGC TGCGATCACT GTTCGTTGA
SEQ.ID.NO.12
顺序类型:核酸
分子类型:DNA(基因组)
原始来源:藻类
序列长度:1712BP
链型:双链
序列:
10 20 30 40 50 60
1 ATGACAAACT ATAATTATGA CAATTTGAAC TACAATCAAC CGGACCTCAT CCCACCTGGC
61 CATGATTCAG ATCCTGACTA CTATATTCCG ATGTCATTTG CGGCACCATG GGTGATCGCA
121 CATGGATATC GTGGCACCAG CGACCAGTAC TCTTATGGAT GGTTTTTGGA CAATGTATCC
181 CAGTCCTACA CAAACACTGG CGATGATGCA TGGGCTGGTC AGAAGGATTT GGCGTACATG
241 GGGGCACAAT GTGGGCCTTT CGATCAACAT TTTGTGTATG AGGCTGGAGA TGGACTTGAA
301 GACGTTGTGA CCGCATTCTC TTATTTGCAA GGCAAGGAAT ATGAGAACCA GGGACTGAAT
361 ATACGTTCTG CAATGCCTCC GAAGTACGTT TTCGGATTTT TCCAAGGCGT ATTCGGAGCC
421 ACATCGCTGC TAAGGGACAA CTTACCTGCC GGCGAGAACA ACGTCTCTTT GGAAGAAATT
481 GTTGAAGGAT ATCAAAATCA GAACGTGCCA TTTGAAGGTC TTGCTGTGGA TGTTGATATG
541 CAAGATGACT TGAGAGTGTT CACTACGAGA CCAGCGTTTT GGACGGCAAA CAAGGTGGGG
601 GAAGGCGGTG ATCCAAACAA CAAGTCAGTG TTTGAGTGGG CACATGACAG GGGCCTTGTC
661 TGCCAGACGA ATGTAACTTG CTTCTTGAAG AACGAGAAAA ATCCTTACGA AGTGAATCAG
721 TCATTGAGGG AGAAGCAGTT GTATACGAAG AGTGATTCCT TGGACAACAT TGATTTTGGA
781 ACTACTCCAG ATGGGCCTAG CGATGCGTAC ATTGGACACT TAGACTACGG TGGTGGTGTG
841 GAGTGTGATG CACTATTCCC AGACTGGGGT CGACCAGACG TGGCTCAATG GTGGGGCGAT
901 AACTACAAGA AACTATTCAG CATTGGTCTC GATTTCGTCT GGCAAGATAT GACGGTACCT
961 GCGATGATGC CGCACCGACT CGGTGACCCT GTCGGCACAA ATTCCGGTGA GACGGCGCCG
1021 GGCTGGCCGA ATGATAAGGA TCCATCCAAC GGACGATACA ATTGGAAGTC TTACCATCCG
1081 CAAGTGCTCG TGACTGACAT GAGGTATGAC GATTACGGAA GAGATCCCAT TGTTACGCAA
1141 CGCAATCTCC ATGCCTACAC TCTTTGTGAG TCTACTAGGA GGGAAGGCAT TGTTGGAAAC
1201 GCAGATAGTC TGACGAAGTT CCGCCGCAGC TATATTATCA GTCGTGGAGG CTACATCGGT
1261 AATCAGCACT TTGGTGGGAT GTGGGTAGGA GACAACTCTT CTACGGAAGA CTACCTCGCA
1321 ATGATGGTTA TCAACGTTAT CAACATGAAC ATGTCCGGTG TCCCGCTCGT TGGTTCCGAT
1381 ATTGGAGGTT TCACGGAGCA TGACAAGAGA AACCCTTGCA CACCGGACTT GATGATGAGA
1441 TTTGTGCAGG CTGGATGCTT GCTACCGTGG TTCAGGAACC ACTACGATAG GTGGATCGAG
1501 AGCAAGAAAC ACGGAAAGAA CTACCAAGAG TTGTACATGT ACCGCGACCA CTTGGACGCC
1561 TTGAGAAGTT TTGTGGAACT CCGCTATCGC TGGCAGGAAG TGTTATACAC AGCCATGTAT
1621 CAGAATGCTT TGAACGGGAA GCCGATCATC AAAACGGTCT CCATGTACAA CAACGATATG
1681 AACGTCAAAG ATGCTCAGAA TGACCACTTC CT