生物素的制备方法.pdf

上传人:00****42 文档编号:1619408 上传时间:2018-06-29 格式:PDF 页数:61 大小:2.21MB
返回 下载 相关 举报
摘要
申请专利号:

CN98807467.2

申请日:

1998.07.02

公开号:

CN1265147A

公开日:

2000.08.30

当前法律状态:

终止

有效性:

无权

法律详情:

未缴年费专利权终止IPC(主分类):C12N 15/54申请日:19980702授权公告日:20041201终止日期:20090803|||授权|||实质审查的生效申请日:1998.7.2|||公开

IPC分类号:

C12N15/54; C12N9/10; C12N5/10; C12N1/21; C12P17/18

主分类号:

C12N15/54; C12N9/10; C12N5/10; C12N1/21; C12P17/18

申请人:

BASF公司;

发明人:

H·施勒德尔; B·豪尔

地址:

德国路德维希港

优先权:

1997.07.22 DE 19731274.8

专利代理机构:

中国专利代理(香港)有限公司

代理人:

罗宏;谭明胜

PDF下载: PDF下载
内容摘要

本发明描述了一种包括具有序列SEQ ID No.1或SEQ ID No.3的生物素基因的基因构建体、含有这种基因构建体的生物体、这些序列或所述基因构建体用于制备生物素的用途以及一种用于制备生物素的方法。

权利要求书

1.一种用于制备生物素的方法,包括下列步骤:在能够合成生物
素的原核或真核宿主生物体内表达一种具有序列SEQ ID No.1或SEQ
ID No.3的生物素基因及其功能性变体、类似物或衍生物;培养这
种生物体并在分离生物量后或纯化生物素后直接使用所述合成的生
物素。
2.一种如权利要求1中所述的方法,其中权利要求1中所述生物
素基因的表达导致去硫生物素向生物素的转化提高。
3.一种如权利要求1或2中所述的方法,其中所述变体是这样的
变体,它在来源于权利要求1中所述序列的氨基酸水平上具有40-
100%同源性的基因且该基因使得生物素合成的增加成为可能。
4.一种如权利要求1-3中任意一项中所述的方法,其中所用的
宿主生物体是一种选自下列属组成的组中的生物体:埃希氏杆菌属、
柠檬杆菌属、沙雷氏菌属、克雷白氏杆菌属、沙门氏菌属、假单胞菌
属、丛毛单胞菌属、不动杆菌属、固氮杆菌属、色杆菌属、芽孢杆菌
属、梭状芽孢杆菌属、节杆菌属、棒状杆菌属、短杆菌属、乳球菌属、
乳芽孢杆菌属、链霉菌属、根瘤菌属、土壤杆菌属、葡萄球菌属、红
酵母属、掷孢酵母属、Yarrowia、裂殖糖酵母属或糖酵母属。
5.一种如权利要求1-4中任意一项所述的方法,其中将一种生
物素调节缺损型突变体用作宿主生物体。
6.一种如权利要求1-5中任意一项所述的方法,其中在原核或
真核宿主生物体内存在着如权利要求1中所述生物素基因的至少一
个拷贝的单独表达或与至少一种其它生物素基因的一个或多个拷贝
一起表达,所述的其它生物素基因选自下列基因组成的组:bioA、
bioB、bioF、bioC、bioD、bioH、bioP、bioW、bioX、bioY或bioR。
7.一种包括具有SEQ ID No.1或SEQ ID No.3的生物素基因
及其功能性变体、类似物或衍生物的基因构建体,其中将其有效地上
与一种或多种调节信号连接以增加基因的表达和/或蛋白质的表达和
/或已经将其自然调节阻断。
8.一种如权利要求7中所述的基因构建体,其中将其插入适合于
在原核或真核宿主生物体内表达所述基因的载体中。
9.一种如权利要求7或8中所述的基因构建体,其中如权利要求
7中所述的生物素基因在所述载体内以一个或多个拷贝与至少一种其
它基因的一个或多个拷贝同时存在,所述的其它基因选自下列基因组
成的组:bioA、bioB、bioF、bioC、bioD、bioH、bioP、bioW、bioX、
bioY或bioR。
10.一种包括如权利要求7-9中任意一项所述基因构建体的生
物体。
11.一种如权利要求1中所述的序列用于制备生物素的用途。
12.一种如权利要求7-9中任意一项所述基因构建体用于制备
生物素的用途。

说明书

生物素的制备方法

本发明涉及一种包括具有序列SEQ ID No.1或SEQ ID No.3
的生物素基因的基因构建体、含有这种基因构建体的生物体、用于制
备生物素的这些序列或所述基因构建体的用途以及一种用于制备生
物素的方法。

生物素(维生素H)在酶催化的羧化和脱羧反应中作为辅酶起主
要作用。由此生物素在活细胞中是一种必需的因子。几乎所有的动物
和某些微生物必须从外界摄取生物素,这是因为它们自身不能合成生
物素。因此,它对于这些生物体来说是一处必需的维生素。相反,细
菌、酵母和植物自身能够从前体合成生物素(Brown等《生物技术遗
传工程回顾》(Biotechnol.Genet.Eng.Rev.)9,1991:295-326,
DeMoll,E.,《大肠杆菌和沙门氏菌属》(Escherichia coli and
Salmonella),Neidhardt,F.C.等编辑,ASM出版社出版,华盛顿
特区,美国,1996:704-708,ISBN 1-55581-084-5)。

已经研究了细菌生物体、特别是在革兰氏阴性菌大肠杆菌中和在
革兰氏阳性菌球形芽孢杆菌中的生物素合成(Brown等《生物技术遗
传工程回顾》(Biotechnol.Genet.Eng.Rev.)9,1991:295-326)。
认为目前在大肠杆菌中公知的第一种中间体是庚二酰辅酶A(Pm-
CoA),它来源于脂肪酸的合成(DeMoll,E.,《大肠杆菌和沙门氏
菌属》(Escherichia coli and Salmonella),Neidhardt,F.C.
等编辑,ASM出版社出版,华盛顿特区,美国1996:704-708,ISBN
1-55581-084-5 1996)。目前实际上还不了解大肠杆菌中这种生物
素前体的合成途径(Ifuku 1993,Lemoine,1996)。已经鉴定了
两种基因、即bioC和bioH,它们的相应蛋白质是导致合成Pm-CoA
的原因。目前还不了解所述基因产物BioH和BioC的酶功能(Lemoine
等《分子微生物学》(Mol.Microbio.)19,1996:645-647,DeMoll,
E.,《大肠杆菌和沙门氏菌属》(Escherichia coli and
Salmonella),Neidhardt,F.C.等编辑,ASM出版社出版,华盛顿
特区,美国1996:704-708,ISBN 1-55581-084-5)。在4个进一步
的酶促步骤中将Pm-CoA转化成生物素。最初从Pm-CoA与丙氨酸的缩
合开始而得到7-酮基-8-氨基壬酸(KAPA)。针对这种转化的基因产
物是BioF(KAPA合成酶)。通过BioA(KAPA氨基转移酶)与共底
物S-腺苷甲硫氨酸使KAPA转氨基化而得到7,8-二氨基壬酸。在ATP-
依赖性羧化反应后,下一步产生去硫生物素(DTB)并由BioD(去硫
生物素合酶)催化。在最后的步骤中,DTB被转化成生物素。该步骤
由BioB(生物素合成酶)催化。在大肠杆菌内的双向操纵子上编码
用于编码已经描述的蛋白质的基因bioF、bioA、bioD和bioB。这种
操纵子位于大肠杆菌染色体上的λ附着位点与uvrB基因的基因座之
间约17分钟。(Berlyn等1996:1715-1902)。另外在这种操纵
子上编码两种其它的基因,其中之一bioC具有在合成Pm-CoA中已进
行了描述的功能,而它仍已不可能给予位于bioA之后的可读框的功
能(WO94/8023,Otsuka等《生物化学杂志》(J.Biol.Chem.)263,
1988:19577-85)。已经在球形芽孢杆菌、枯草芽孢杆菌、集胞蓝细
菌属(SyneCcocystis sp.)(Brown等《生物技术遗传工程回顾》
(Biotechnol.Genet.Eng.Rev.)9,1991:295-326,Bower等
《细菌学杂志》(J.Bacteriol.)175,1996:4122-4130,Kaneko
等《DNA研究》(DNA Res.)3,3,1996:109-136)、诸如詹氏甲
烷球菌(Methanococcus janaschi)这样的古生菌纲、诸如啤酒糖
酵母这样的酵母(Zhang等《生物化学和生物物理学记录》(Arch.
Biochem.Biophys.)309,1,1994:29-35)或在诸如鼠耳芥(Baldet
等,C.R.Acad.Sci.III,Sci.Vie.319,2,1996:99-106)
这样的植物中发现了与大肠杆菌蛋白质BioF、A、D、B的高度保守的
同系物。

看起来Pm-CoA的合成不同地发生在迄今已经被研究过的两种革
兰氏阳性微生物中而不是在大肠杆菌中。已经不可能发现bioH和
bioC的任何同系物了(Brown等《生物技术遗传工程回顾》
(Biotechnol.Genet.Eng.Rev.)9,1991:295-326)。

生物素是一种具有三个手性中心的旋光物。目前在商业上仅用一
种多级昂贵的化学合成法来制备生物素。

作为一种可替换这种化学合成的方法,已经进行了许多种尝试来
确定使用微生物制备生物素的发酵方法。通过在多拷贝质粒上克隆生
物素操纵子已经能够在用这些基因转化的微生物中增加生物素的合
成。通过经筛选birA突变体使生物素基因表达失去调节已经实现了
生物素合成的进一步增加(Pai C.H.,《细菌学杂志》(J.
Bacteriol.)112,1972:1280-1287)。将两种方法结合使用、即
在一种调节缺陷的菌株中表达编码质粒的生物合成基因(EP-B-0 236
429)这一过程导致产量的进一步提高。在这种情况中,生物素操纵
子可以在其天然双向启动子的控制下保留下来(EP-B-0 236 429);
或者可以将其基因置于一种可被外部调节的启动子的控制下
(WO94/8023)。

通过以前经在大肠杆菌中发酵而制备生物素的方法已不可能在
商业上得到足够的产量。已经显示通过发酵制备生物素的产量是由
BioB基因产物(生物素合酶)将DTB不完全转化成生物素而导致的。
在bioB基因中隐藏突变的细胞不能够在DTB上生长且由此不能将
DTB转化成生物素。目前对将DTB转化成生物素的化学和酶的机理仅
仅被不完全地理解和解释。

目前的精细的遗传研究已不能够鉴定参与反应的另外的蛋白
质。迄今仅在细菌和植物细胞提取物中进行了DTB转化成生物素的特
性记述(WO94/8023,EP-B-0 449 724,Sanyal等《生物化学和生物
物理学记录》(Arch.Biochem.Biophys.)第326卷第1期,1996:
48-56和《生物化学》(Biochemistry)33,1994:3625-3631,Baldet
等《欧洲生物化学杂志》(Europ.J.Biochem.)217,1,1993:479-485,
Mejean等《生物化学和生物物理学研究通讯》(Biochem.Biophys.
Res.Commun.)第217卷第3期1995:1231-1237,Ohshiro等《生
物科学、生物技术和生物化学》(Biosci.Biotechnol.Biochem.)
58,9,1994:1738-1741)。

这些研究已经证实低分子量的因子诸如S-腺苷甲硫氨酸、
NADPH、半胱氨酸、硫胺素、Fe2+、天冬酰胺、丝氨酸、果糖-1,6-二
磷酸可刺激生物素的合成(Ohshiro等《生物科学、生物技术和生物
化学》(Biosci.Biotechnol.Biochem.)58,9,1994:1738-1741,
Birch等《生物化学杂志》(J.Biol.Chem.)270,32,1995:
19158-19165,Ifuk等《生物科学、生物技术和生物化学》(Biosci.
Biotechnol.Biochem.)59,2,1995:185-189)。除这些低分子
量的因子外,还鉴定了在BioB存在的情况下刺激从DTB合成生物素
的其它蛋白质。它们是黄素氧还蛋白和黄素氧还蛋白-NADPH还原酶
(Birch等《生物化学杂志》(J.Biol.Chem.)270,32,1995:
19158-19165,Ifuku等《生物科学、生物技术和生物化学》(Biosci.
Biotechnol.Biochem.)59,2,1995:185-189,Sanyal等《生
物化学和生物物理学记录》(Arch.Biochem.Biophys.)326,1,
1996:48-56)。

生物素的合成和硫辛酸的合成显示出巨大的同源性。在两种合成
途径中,在合成最后阶段的非活化碳原子之间插入了一个硫原子或两
个硫原子。不过,目前硫辛酸的合成仅仅不充分地进行了特征记述
(DeMoll,E.,《大肠杆菌和沙门氏菌属》(Escherichia coli and
Salmonella),Neidhardt,F.C.等编辑,ASM出版社出版,华盛顿
特区,美国1996:704-708,ISBN 1-55581-084-5)。目前,仅在大
肠杆菌中鉴定了两种必须的基因:lipA和lipB。两种基因均位于一
个操纵子中,在两种基因之间有一个仍未进行特征鉴定的可读框(=
ORF)。另一种基因lplA能够通过硫辛酰-AMP中间体将硫辛酸转化
成赖氨酸。由此这种反应与birA的活性类似。通过LipA和BioB之
间的序列比较已经鉴定了氨基酸序列中的同源区。它们包括、特别是
半胱氨酸簇。已经证实LipA催化将两个硫原子引入硫辛酸的过程
(DeMoll,E.,《大肠杆菌和沙门氏菌属》(Escherichia coli and
Salmonella),Neidhardt,F.C.等编辑,ASM出版社出版,华盛顿
特区,美国1996:704-708,ISBN 1-55581-084-5)。

与生物素分子中硫原子来源相关的结果是矛盾的。在整个细胞提
取物中对生物素合成的研究证实:在35S-标记的半胱氨酸存在的情况
下放射性被引入生物素中;用35S-标记的甲硫氨酸或用S-腺苷甲硫氨
酸将硫原子引入生物素分子是检测不到的(Ifuku等《生物科学、
生物技术和生物化学》(Biosci.Biotechnol.Biochem.)59,2,
1995:184-189,Birch等《生物化学杂志》(J.Biol.Chem.)270,
32,1995:19158-19165)。

这与在有35S-标记的半胱氨酸存在且没有添加细胞提取物的情况
下对纯化的BioB蛋白质的研究相反,在这种情况中,尽管观察到了
生物素的合成,但是没有将放射性引入生物素分子(Sanyal等《生
物化学和生物物理学记录》(Arch.Biochem.Biophys.)326,1,
1996:48-56,Mejean等《生物化学和生物物理学研究通讯》(Biochem.
Biophys.Res.Commun.)2127,3,1995:1231-1237)。在这些
合成条件下(没有添加细胞提取物),所形成的生物素的量很小且相
应的最大量为约2mol的生物素/mol的BioB(Sanyal等《生物化学
和生物物理学记录》(Arch.Biochem.Biophys.)326,1,1996:
48-56)或0.1mol的生物素/mol的BioB(Mejean等《生物化学和
生物物理学研究通讯》(Biochem.Biophys.Res.Commun.)2127,
3,1995:1231-1237)。根据这些研究结果,可以将硫引入生物素
而不用将半胱氨酸用作硫的供体。这种没有硫的外部来源的生物素形
成可以被解释为已经在BioB中检测到的从2Fe-2S簇中硫的转移。用
于生物素合成的硫的实际来源仍然是不清楚的。由此已不可能证明体
外BioB的真正催化活性。

尽管有大量的方法,但是来自微生物发酵的生物素产量对于工业
化生产来说目前是不足的。

本发明的一个目的是开发一种用于通过发酵制备生物素的工业
化方法,该方法尽可能使去硫生物素转化成生物素达到最佳化并由此
使得生物素的合成得到改进成为可能。

我们已经发现通过用于制备生物素的新方法来实现这一目的,所
述的新方法包括下列步骤:在能够合成生物素的原核或真核宿主生物
体内表达一种具有序列SEQ ID No.1或SEQ ID No.3的生物素基
因及其功能性变体、类似物或衍生物;培养这种生物体并在分离生物
量后或纯化生物素后直接使用合成的生物素。

将在新方法中所用并具有序列SEQ ID No.1或SEQ ID No.3
的生物素基因分别保存在SwissProt数据库中并给予其登记号
AE000364和D90811。序列D90811已经另外由Aiba等在《DNA研究》
(DNA Res.)3,6,1996:363-377中进行了描述。对于所述数据库
中的两种序列来说,已经注意到它们与Nifs蛋白质同源。有关这些
序列的进一步的信息无法从所述数据库或出版物中得到。

通过在原核或真核宿主生物体内表达序列SEQ ID No.1和/或
SEQ ID No.3可以显著增加生物素合成的产量。与不含这些基因的
对照组比较,所述基因的表达使得从去硫生物素合成生物素提高了至
少2倍,优选超过3倍。优选使用序列SEQ ID No.1。

在分离和测序后,可能获得在新方法中所用的生物素基因或其等
位变体,所述基因具有核苷酸序列SEQ ID No.1和SEQ ID No.3
并且编码SEQ ID No.2和SEQ ID No.4中表示的氨基酸序列。等
位变体指的是在氨基酸水平上显示有40-100%同源性的SEQ ID No.
1或SEQ ID No.3的变体,优选50-100%,特别优选80-100%。
等位变体包括、特别是通过缺失、插入或置换来自SEQ ID No.1或
SEQ ID No.3中所述序列的核苷酸而获得的功能性变体,然而,其
中仍保留了酶活性。

SEQ ID No.1或SEQ ID No.3的类似物指的是例如它们的细菌、
真菌、植物或酵母的同系物、截短的序列、编码和非编码DNA序列的
单链DNA或RNA。

衍生物指的是例如启动子变体。位于所述核苷酸序列之前的启动
子可通过一个或多个核苷酸的交换、通过插入和/或缺失来改变,然
而,这不会对所述启动子的功能或活性有副作用。此外,所述启动子
可以通过改变其序列使其活性增加或者被更有效的、甚至来源于异源
生物体的启动子完全取代。

衍生物还指某些变体,其核苷酸序列已经在起始密码子前-1--
30区中以基因表达和/或蛋白质表达得到增加这样一种方式被改变。
它受到改变SD序列的有利影响。

在新方法中合适的原核宿主生物体一般是所有合成生物素的革
兰氏阴性菌或革兰氏阳性菌。可以提及的革兰氏阴性菌的实例是:肠
杆菌科(Enterobacteriaceae),诸如埃希氏杆菌属、气杆菌属、
肠杆菌属、柠檬杆菌属、志贺氏菌属、克雷白氏杆菌属、沙雷氏菌属、
欧文氏杆菌属或沙门氏菌属;假单胞菌科,诸如假单胞菌属、黄单胞
菌属、伯克霍尔德氏菌属、葡糖杆菌属、亚硝化单胞菌属、硝化杆菌
属、甲烷单胞菌属、丛毛单胞菌属、纤维单胞菌属或醋杆菌属;固氮
菌科,诸如固氮菌属、氮单胞菌属、拜叶林克氏菌属或德克斯氏菌属;
奈瑟氏球菌科,诸如莫拉氏菌属、不动杆菌属、金氏菌属、奈瑟氏球
菌属或布兰汉氏球菌属;根瘤菌科,诸如根瘤菌属或土壤杆菌属;或
者革兰氏阴性的发酵单胞菌属、色杆菌属或黄杆菌属。可以提及的革
兰氏阳性菌的实例是:形成内生孢子的革兰氏阳性需氧或厌氧菌,诸
如芽孢杆菌属、乳孢芽孢杆菌属或梭状芽孢杆菌属;棒状杆菌的细
菌,诸如节杆菌属、纤维单胞菌属、短小杆菌属、科里氏杆菌属、短
杆菌属、微杆菌属或库特氏菌属;放线菌目,诸如分枝杆菌属、红球
菌属、链霉菌属或诺卡氏菌属;乳杆菌科,诸如乳杆菌属或乳球菌属;
革兰氏阳性球菌,诸如微球菌属或葡萄球菌属。

所述新方法中优选使用的细菌是埃希氏杆菌属、柠檬杆菌属、沙
雷氏菌属、克雷白氏杆菌属、沙门氏菌属、假单胞菌属、丛毛单胞菌
属、不动杆菌属、固氮杆菌属、色杆菌属、芽孢杆菌属、梭状芽孢杆
菌属、节杆菌属、棒状杆菌属、短杆菌属、乳球菌属、乳芽孢杆菌属、
链霉菌属、根瘤菌属、土壤杆菌属或葡萄球菌属。

特别优选的属和种是大肠杆菌、弗劳地氏柠檬杆菌、粘质沙雷氏
菌、鼠伤寒沙门氏菌、门多茜娜假单胞菌、铜绿假单胞菌、Pseudomonas
mutabilis、绿叶假单胞菌、荧光假单胞菌、食酸丛毛单胞菌、睾丸
酮丛毛单胞菌、醋酸钙不动杆菌、棕色固氮杆菌、紫色杆菌、枯草芽
孢杆菌、球形芽孢杆菌、嗜热脂肪芽孢杆菌、短小芽孢杆菌、地衣形
芽孢杆菌、解淀粉芽孢杆菌、巨大芽孢杆菌、蜡状芽孢杆菌、苏云芽
孢杆菌、柠檬色节杆菌、石蜡节杆菌、谷氨酸棒状杆菌、
Corynebacterium primorioxydans、棒状杆菌属、酮戊二酸短杆菌、
亚麻短杆菌、短杆菌属、变青链霉菌、豌豆根瘤菌或根癌土壤杆菌。
可有利使用的是已经增加了天然生物素产量的细菌。

近年来已经对所述属的分类定位进行了重大改变且仍然不断进
行改变,这是因为将不正确的属和种名进行了改正。过去对细菌分类
范围内的所述属进行分类重新编制的这种频繁需求指的是非上述的
科、属和种也适合于新方法。

用于新方法的合适的真核宿主生物体一般是所有合成生物素的
生物体,诸如真菌、酵母、植物或植物细胞。作为优选提及的酵母是
红酵母属、Yarrowia、掷孢酵母属、糖酵母属或裂殖糖酵母属。特别
优选的属和种是深红酵母、胶粘红酵母、禾木科红酵母、Yarrowia
lipolytica、赭色掷孢酵母、Sporobolomyces shibatanus或啤酒糖
酵母。

原则上能够使用所有的植物作为宿主生物体,且优选的植物是那
些在家蓄饲养或人体营养中重要的植物,诸如玉米、小麦、大麦、黑
麦、马铃薯、豌豆、黄豆、向日葵、棕榈、小米、芝麻、干椰子肉或
油菜。诸如鼠耳芥或薰衣草这样的植物也是合适的。特别优选的是植
物细胞培养物、来自植物的原生质体或愈伤组织的培养物。

有利的是在新方法中使用微生物,诸如细菌、真菌、酵母或植物
细胞,它们能够将生物素分泌入培养基且在合适的情况下它们另外具
有增加的天然生物素的合成。对于这些生物体来说,还可能且有利的
是使对其生物素生物合成调节的缺乏,即对所述的合成没有调节或仅
有很小的调节。这种调节的缺乏导致这些生物体具有显著较高的生物
素产量。例如,对于作为birA缺损突变体的大肠杆菌来说这种类型
的调节缺乏是公知的且应优选存在于呈可受外部影响而诱导(例如是
温度诱导的)的缺损形式的细胞中。在已用生物素基因转化后,原则
上也可以使用不能天然生产生物素的生物体。

为了进一步提高总生物素的产量,有利的是新方法中的生物体应
另外含有至少一种其它的生物素基因,该基因选自下列基因组成的
组:bioA、bioB、bioF、bioC、bioD、bioH、bioP、bioW、bioX、
bioY或bioR。这种附加的基因或这些附加的基因可以一个或多个拷
贝存在于细胞内。它们可以位于与序列SEQ ID No.1和/或SEQ ID No.
3的相同载体上,或者它们已经被整合在单个载体上或者另外已经被
整合入染色体。还可以将序列SEQ ID No.1和/或SEQ ID No.3插
入所述的基因组。

新型基因构建体指的是生物素基因序列SEQ ID No.1和SEQ ID
No.3及其功能性变体、类似物或衍生物,在功能上它们与一种或多
种调节信号连接以增加基因的表达。除这些新型调节序列外,在实际
结构基因前的这些序列的天然调节可以依然存在,且如果合适,已经
将它们进行遗传修饰以便阻断天然调节并已经增加了所述基因的表
达。然而,所述基因构建体还可以具有一种较为简单的结构,即在序
列SEQ ID No.1和/或SEQ ID No.3前没有插入另外的调节信号,
且具有这种调节的天然启动子没有缺失。而可以由生物素不再进行任
何调节这样一种方式使天然调节序列突变,且基因的表达得到了增
加。也可能在DNA序列的3’端插入另外有利的调节元件。具有序列
SEQ ID No.1和/或SEQ ID No.3的生物素基因可以以一个或多个
拷贝存在于所述基因构建体中。

例如,用于新方法的有利的调节序列存在于诸如cos、tac、trp、
tet、trp-tet、lpp、lac、lpp-lac、lacIq-、T7、T5、T3、gal、trc、
ara、SP6、λ-PR或λ-PL启动子这样的启动子中,有利的是它们用于
革兰氏阴性菌中。例如另外有利的调节序列存在于革兰氏阳性启动子
amy和SPO2、酵母启动子ADC1、MFα、AC、P-60、CYC1、GAPDH或
植物启动子CaMV/35S、SSU、OCS、lib4、usp、STLS1、B33、nos或
遍在蛋白或菜豆蛋白启动子中。

原则上可能将具有与如上所述类似的其调节序列的所有天然启
动子用于新方法。此外,使用合成的启动子是可能和有利的。

基因构建体可以以一个或多个拷贝含有另外的生物素基因,这些
基因选自下列基因组成的组::bioA、bioB、bioF、bioC、bioD、
bioH、bioP、bioW、bioX、bioY或bioR,它们中的每一种均可以带
有其自身的启动子,否则,它们中的每一种均可以处于序列SEQ ID No.
1或SEQ ID No.3的启动子的控制下。

为了在上述宿主生物体中表达,将基因构建体有利地插入一种宿
主特异性载体中,该载体使得所述基因在宿主中的最佳表达成为可
能。在大肠杆菌中的合适载体的实例是pLG338、pACYC184、pBR322、
pUC18、pUC19、pKC30、pRep4、pHS1、pHS2、pPLc236、pMBL24、pLG200、
pUR290、pIN-III113-B1、λgtll或pBdCI;在链霉菌属中的合适载体
的实例是pIJ101、pIJ364、pIJ702或pIJ361;在芽孢杆菌属中合适
的载体的实例是pUB110、pC194或pBD214;在棒状杆菌属中合适的
载体的实例是pSA77或pAJ667;在真菌中合适的载体的实例是
pALS1、pIL2或pBB116;在酵母中合适的载体的实例是YEp6、YEp13
或pEMBLYe23;或者在植物中合适的载体的实例是pLGV23、pGHlac+、
pBIN19、pAK2004或pDH51。所说的载体代表选自可能载体中的一小
部分。另外的载体对于本领域技术人员来说是众所周知的且例如可以
在《克隆载体》(Cloning Vectors)(Pouwels P.H.等编辑,Elsevier,
阿姆斯特丹-纽约-牛津1985,ISBN 0444 904018)一书中找到。

表达系统指的是上述通过实例所述的宿主生物体与适于生物体
的载体(诸如质粒、病毒或噬菌体,诸如T7 RNA聚合酶/启动子系统
或具有针对噬菌体λ的调节序列的载体)的结合体。

术语表达系统优选指的是大肠杆菌及其质粒和噬菌体和相关启
动子的结合体以及芽孢杆菌属及其质粒和启动子的结合体。

另外适于SEQ ID No.1和SEQ ID No.3的有利的新型表达的
是其它3’和/或5’末端的调节序列。

将这些调节序列用来使得生物素基因的特异性表达和蛋白质的
表达成为可能。例如,这可能意味着随着宿主生物体的不同仅在诱导
后将基因进行表达或超表达或者迅速将基因进行表达和/或超表达。

此外,调节序列和因子可以优选对生物素基因的表达有有利的作
用且由此增加生物素基因的表达。因此,通过使用强转录信号(诸如
启动子和/或“增强子”)而能够并有利地促进调节元件的转录水平。
不过,除此之外,还能够通过例如改进mRNA的稳定性而促进翻译。

“增强子”指的是例如通过RNA聚合酶与DNA之间改进的相互作
用而显示出的生物素基因表达增加的DNA序列。

例如,通过与原始酶进行比较、通过经由经典的诱变(诸如UV
照射或用化学诱变剂处理)和/或经由特异性诱变(诸如定点诱变、
缺失、插入和/或置换)修饰相应的基因序列或其同源序列,可以达
到来源于序列SEQ ID No.1或SEQ ID No.3的蛋白质及其酶活性
的增加。除所述的基因扩增外,通过消除阻抑酶生物合成的因子和/
或通过合成活性的而不是非活性的酶也可以实现酶活性的增强。

所述的新方法通过经载体已被克隆入生物体和/或克隆入染色体
的具有序列SEQ ID No.1或SEQ ID No.3的生物素基因而有利于
增加DTB转化成生物素并由此整体上增加了生物素的产量。

在所述的新方法中,将包括SEQ ID No.1和/或SEQ ID No.3
的微生物在一种可以使这些生物体生长的培养基中培养。该培养基可
以是一种合成的或一种天然的培养基。使用对于本领域技术人员来说
是公知的并取决于所述生物体的培养基。用于使微生物生长的培养基
包括碳源、氮源、无机盐和(如果合适)小量的维生素和微量元素。

有利的碳源的实例是糖类,诸如单糖、二糖或多糖,诸如葡萄糖、
果糖、甘露糖、木糖、半乳糖、核糖、山梨糖、核酮糖、乳糖、麦芽
糖、蔗糖、棉子糖、淀粉或纤维素;复合来源的糖类,诸如糖蜜;磷
酸糖类,诸如果糖-1,6-二磷酸;糖醇类,诸如甘露糖醇;多元醇,
诸如甘油;醇类,诸如甲醇或乙醇;羧酸类,诸如柠檬酸、乳酸或乙
酸;脂肪类,诸如大豆油或菜子油;氨基酸类,诸如谷氨酸或天冬氨
酸;或氨基糖类,也可将它们用作氮源。

有利的氮源是有机或无机氮化合物或含有这些化合物的物质。它
们的实例是:铵盐,诸如NH4Cl或(NH4)2SO4、硝酸盐、脲;或复合
的氮源,诸如玉米浆、酿造酵母自溶物、大豆粉、面筋、酵母提取物、
肉膏、酪蛋白水解物、酵母或马铃薯蛋白,它们通常也可起到氮源的
作用。

无机盐的实例是钙盐、镁盐、钠盐、锰盐、钾盐、锌盐、铜盐和
铁盐。应特别提及的这些盐中的阴离子是氯离子、硫酸根离子和磷酸
根离子。在新方法中增加产量的重要因素是向生产培养基中添加Fe2+
或Fe3+盐和/或钾盐。

如果合适,向营养培养基中添加其它的生长因子,诸如维生素类
或生长促进剂类,诸如核黄素、硫胺素、叶酸、烟酸、泛酸盐或吡哆
醇;氨基酸类,诸如丙氨酸、半胱氨酸、天冬酰胺、天冬氨酸、谷氨
酰胺、丝氨酸、甲硫氨酸或赖氨酸;羧酸类,诸如柠檬酸、甲酸、庚
二酸或乳酸;或者诸如二硫苏糖醇这样的物质。

如果合适,能够向培养基中添加抗生素以使细胞内具有生物素基
因的载体保持稳定。

所说营养物的混合比例取决于发酵的方式并根据各种情况来确
定。可能的情况是在发酵开始时存在已被分别灭菌或一起灭菌(如果
必要)后的所有培养基成分,否则,根据需要在发酵过程中添加它们。

确定培养条件以便生物体以最佳方式生长并获得最佳的可能的
产量。优选的培养温度为15℃-40℃。

温度在25℃-37℃是特别有利的。优选将pH保持在3-9的范
围。pH在5-8之间是特别有利的。一般足够的培养时间为8-240
小时,优选8-120小时。在此期间,在所述培养基中累积了最大量
的生物素和/或在细胞破裂后可以得到它们。

可以连续或分批实施制备生物素的新方法。如果完整的植物从用
生物素基因转化的植物细胞中再生,那么可以根据所述的新方法使这
些植物完全正常地生长和繁殖。

实施例:

除BioB和其它公知的辅因子外,基于DTB转化成生物素的过程
可能涉及一种Fe-S簇再生酶的考虑,已经做了鉴定并克隆这样一种
假拟基因的尝试。

Nifs基因能够使涉及氮固定的蛋白质Fe-S簇中的硫原子再生
(Zheng等《美国国家科学院学报》(Proc.Natl.Acad.Sci.USA)
90,1993:2754-2758和《生物化学》(Biochemistry)33,1994:
4714-4720)。按照megalign模式,通过使用Lasergene程序包
(DNA-Star Inc.)比较Swiss-Prot和PIR数据库中所有公知的Nifs
类蛋白质,可能鉴定出具有氨基酸序列HK(I,L)xGPxG(x相当于
保守性较低或没有得到保持的氨基酸)的那些蛋白质的严格保守区。
这种序列具有完整的保守性这一事实表明这些氨基酸(=Aa)在这些
蛋白质的功能性上是重要的。将这些保守的氨基酸在下文称作基元
I。

将这种方式中所述的Aa基元用作进一步分析Swiss-Prot/PIR93
或94版数据库的比较序列,以便检索出其中这种Nifs功能序列是完
全保守的蛋白质或ORFS(=可读框)。用于序列分析的程序是来自
DNA-Star包的Geneman程序。将分析参数规定如下:共有序列菜单
中含有80%保守性的基元。

除已被鉴定为Nifs同源蛋白的蛋白质外,这种检索导致这样一
项发现,即存在具有这种序列基元的其它蛋白质或ORFS。在数据库
中存在的其它序列中,可能鉴定出一种来自大肠杆菌的可读框,所述
的可读框具有共有序列的显著保守性并参与生物素的合成(这正如的
我们的研究表明的)。称作ECU29581_24(=SEQ ID No.1=ORF401)
的这种可读框编码一种来源于这种序列的401Aa的假拟蛋白。F.
Blattner及合作者(《DNA-研究》1996)的研究显示出该序列已作
为大肠杆菌基因组测序的一部分进行了测序而尚未识别其功能。将该
序列(SEQ ID No.1)在下文称作BioS1。

BioS1的蛋白质序列与来自棕色固氮杆菌的Nifs蛋白质序列的
比较结果(程序:DNA-Star“megalign”模式:配对Lipman-Pearson
校正,分析参数:k-元组2,缺口补偿4,缺口长度补偿12)证实
ECU29581_24还与在218 Aa范围内所述序列其它区中的来自棕色固
氮杆菌的Nifs具有27.6%的同源性。与鉴定为来自荚膜红球菌Nifs
的蛋白质具有的同源性在376 Aa的范围内为25.3%。

可能在SwissProt/PIR数据库中鉴别出与ECU29581_24具有同
源性的另外的序列(Geneman程序/序列相似性模式;默认设置)。
对ECU29581_24序列发现的最大相似性由从流感嗜血杆菌(数据库中
的名称为HIU00082_62)翻译的ORF(=可读框)来证实。发现在两
种蛋白质的全长内BioS1与HIU00082_62具有45.5%的序列同源
性。由此所述两种蛋白质的序列相似性或同源性均显著高于
ECU29581_24(=BioSI)与来自荚膜红球菌或棕色固氮杆菌的Nifs
间的相似性或同源性。因此,所述蛋白质可能是BioS1的流感嗜血杆
菌同系物。

Fleischmann等(《科学》(Science),269,1995:495-512)
在流感嗜血杆菌中以其与Nifs序列的相似性为基础不仅发现了ORF
HIU00082_62、而且发现了另一种ORF(HIU00072_10)。

以Fleischmann等的这种描述为基础得出结论:除bioS1外,
另一种Nifs类基因也存在于大肠杆菌中。已将这种假拟基因称作
bioS2。

1.载体pHS1和pHS2的构建:

质粒pHS1和pHS2由携带复制起点、抗性弹夹、启动子、克隆位
点和终止子的各种弹夹组成。该质粒由各种DNA片段组装。使用各种
质粒作为模板、通过PCR来制备为此所需的所述DNA片段。

a.)使用复制起点制备所述弹夹:

为了从含P15A复制子的质粒中提供复制起点作为可以克隆的弹
夹,使用质粒pRep4(Quiagen)与寡核苷酸P15A,1(5’-
GGCCCCTAGGGGATATATTCCGCTTCCTCGC-3’)和P15A,2(5’-
GGCCACTAGTAACAACTTATATCGTATGGGG-3’)、通过PCR从所述质粒中
分离出具有919个碱基长度的DNA片段。在一种合适的缓冲液中用限
制酶AvrII和SpeI切下所述片段。

PCR条件:

在100μl溶液中使用2.5U的Taq聚合酶和15pmol的寡核苷
酸来从质粒pRep4中分离复制弹夹。在50℃下使寡核苷酸退火。链
延伸在72℃下进行1分钟、30个循环以上。

b.)卡那霉素抗性弹夹的制备:

为了提供一种卡那霉素抗性弹夹作为克隆弹夹,从含有卡那霉素
抗性弹夹的质粒(pRep4,Quiagen)中、用寡核苷酸Kan-R,1(5’-
GGCCGAGCTCTCGAACCCCAGAGTCCCGCT-3’)和Kan-R,2(5’-
GGCCGACGTCGGAATTGCCAGCTGGGGCGC-3’)通过PCR来分离具有952个
碱基长度的DNA片段。在一种合适的缓冲液中用AatII和SacI切割
所述片段。

PCR条件:

在100μl溶液中使用2.5U的Taq聚合酶和15pmol的寡核苷
酸来从质粒pRep4中分离卡那霉素抗性弹夹。在50℃下使寡核苷酸
退火。链延伸在72℃下进行1分钟、30个循环以上。

c.)终止区的制备:

*为了从噬菌体λ提供终止子T0作为克隆弹夹,使用质粒
pDS12-luzi(Schroder H.等《欧洲分子生物学组织杂志》(EMBO
Journal.)12,11,1993:4137-4144)作为模板与寡核苷酸T0,1
(5’-GGCCGAGCTCGCTTGGACTCCTGTTGATAG-3’)和T0,2(5’-
GGCCACTAGTGCTTGGATTCTCACCAATAAAAAACGCCC-3’)一起通过PCR来
分离具有120个碱基长度的DNA片段。在一种合适的缓冲液中用酶
SpeI和SacI切割所述片段。

针对T0:pDS12-luzi的模板

在100μl溶液中使用2.5U的Taq聚合酶和15pmol的寡核苷
酸来从质粒pDS12-luzi中分离终止区。在50℃下使寡核苷酸退火。
链延伸在72℃下进行0.5分钟、30个循环以上。然后将120bp大小
的片段进行分离和纯化。用SpeI和SacI各20U来消化该片段。

为了从rrnB操纵子中提供终止子T1作为克隆弹夹,使用质粒
pDS12-luzi(Schroder H.等,参见上述文献)作为模板并借助于寡
核苷酸T1,1(5’-GGCCCCTAGGTCTAGGGCGGCGGATTTGTCC-3’)和T1,2
(5’-GGCCTCTAGAGGCATCAAATAAAACGAAAGGC-3’)通过PCR来分离具有
120bp长度的DNA片段。在一种合适的缓冲液中用酶XbaI和AvrII
切割所述片段。

针对T1:pDS12-luzi的模板

在100μl溶液中使用2.5U的Taq聚合酶和15pmol的寡核苷
酸来从质粒pDS12-luzi中分离终止区。在50℃下使寡核苷酸退火。
链延伸在72℃下进行0.5分钟、30个循环以上。然后将120bp大小
的片段进行分离和纯化。用XbaI和AvrII各20U来消化该片段。

d.)针对pHS1和pHS2的启动子的制备:

通过化学合成来制备寡核苷酸PPHS1,1(5’-
TCGAGATAGCATTTTTATCCATAAGATTAGCCGATCCTAAGGTTTACAATTGTGAGC
GCTCACAATTATGATAGATTCAATTGTGAGCGGATAACAATTTCACACACGCTAGCG
GTAC-3’)和PPHS1,2(5’-CGCTAGCGTGTGTGAAATTGTTATC
CGCTCACAATTGAATCTATCATAATTGTGAGCGCTCACAATTGTAAACCTTAGGATC
GGCTAATCTTATGGATAAAAATGCTATC-3’)以及PPHS2,1(5’-AATTCTC
CCTATCAGTGATAGAGATTGACATCCCTATCAGTGATAGAGATACTGAGACATCACC
AGGACGCACTGACCG-3’)和PPHS 2,2(5’-AATTCGGTCAGTGCGTCCTGG
TGATGTCTCAGTATCTCTATCACTGATAGGGATGTCAATCTCTATCACTGATAGGGA
GG-3’)。分别以1μg/μl的浓度混合寡核苷酸PPHS1,1和PPHS1,2
以及PPHS2,1和PPHS2,2、将它们在95℃下培养5分钟且然后缓慢冷
却。在连接中使用的退火的寡核苷酸浓度为10ng/μl。寡核苷酸
PPHS1,1和PPHS1,2形成针对质粒pHS1的启动子,而寡核苷酸
PPHS2,1和PPHS2,2形成针对质粒pHS2的启动子。

e.)克隆位点的制备:

为了构建克隆位点,合成两种寡核苷酸PMCS1,1(5’-
GTACCGGGCCCCCCCTCGAGGTCGACGGTATCGATAAGCTTGATATCGAATTCCTGC
AGCCCGGGGGATCCCATGGTA-3’)和PMCS1,2(5’-ACGCGTACCATGGGAT
CCCCCGGGCTGCAGGAATTCGATATCAAGCTTATCGATACCGTCGACCTCGAGGGGG
GGCCCGGTACC-3’)。以1μg/μl的浓度混合所述的两种寡核苷酸、
将它们在95℃下培养5分钟且然后缓慢冷却。在连接中使用的退火
的寡核苷酸浓度为10ng/μl。

f.)用于克隆pHS1和pHS2的过程

从pDS12 luci开始,通过SacI/AatII消化而将所述质粒的ampR
弹夹切下并用相应的含有卡那霉素抗性弹夹的SacI/AatII片段来取
代。使转化和分离阳性克隆后获得的载体进行SpeI/SacI消化并将
PCR扩增的终止子T0插入作为卡那霉素抗性弹夹下游的SpeI/SacI
片段。用XbaI/AvrII消化转化和分离阳性克隆后获得的载体并将PCR
扩增的终止子T1插入作为XbaI/AvrII片段。将所得载体用
XhoI/EcoRI消化并分别与退火的启动子寡核苷酸(PPHS1,1和
PPHS1,2以及PPHS2,1和PPHS2,2)连接。使所得的载体进行XbaI
消化并使用克列诺片段补平,在KpnI消化后分离出不含luziferase
片段的载体带。将两种另外退火的含有所述克隆位点的寡核苷酸
(PMCS1,1PMCS1,2)与用这种方式消化的所述载体连接。

2.bioS1(ECU29851_24,SEQ ID No.1)的克隆:

在提供优化过的翻译信号的条件下,通过PCR、从大肠杆菌染色
体中扩增编码BioS1的基因并将其克隆入使得所述基因在大肠杆菌
菌株中的超表达成为可能的载体中。

a.)用于从大肠杆菌染色体中扩增bioS1基因的寡核苷酸的研
制:

将BioS1扩增为一种表达弹夹,该弹夹由核糖体结合位点、编码
序列的起始密码子和用于限制酶的两种识别位点间的终止密码子组
成。对两种限制切割位点选择MluI的识别序列。借助于寡核苷酸
PbioS1,1(5’-CGCACGCGTGAGGAGTACCATGAACGT-3’)和PbioS1,2
(5’-CGCACGCGTTTAATCCACCAATAATT-3’)来克隆bioS1基因。

PCR过程:

条件:

将0.5μg来自大肠杆菌W3110的染色体DNA用作模板。所使用
的寡核苷酸PbioS1,1和PbioS1,2的浓度各自为15pM。dNTPs的浓
度为200μM。将溶于制造商提供的反应缓冲液的2.5U的Pwo DNA
聚合酶(Boehringer Mannheim)用作聚合酶。用于PCR的体积为100
μl。

扩增条件:

使DNA在94℃下变性2分钟。然后在55℃下使寡核苷酸退火30
秒。链延伸在72℃下进行45秒。将所述的PCR进行30个循环以上。

将具有1200bp大小的所得DNA产物纯化并在一种合适的缓冲液
中通过MluI来消化。

通过MluI消化5μg的载体pHS1并通过shrimp碱性磷酸酶
(SAP)(Boehringer Mannheim)使其去磷酸化。在使SAP变性后,
通过快速DNA连接试剂盒、按照制造商的说明以1∶3的摩尔比将所
述载体与片段进行连接。将连接混合物转入菌株大肠杆菌XLl-blue
中。通过质粒的制备和限制酶切分析来鉴定阳性克隆。通过限制酶切
消化和测序来确定pHS1中bioS1片段的正确取向。将所得构建体称
作pHS1 bioS1(附图1)。pHS1 bioS1的序列是在SEQ ID No.5中
被发现的。载体中衍生的bioS1的氨基酸序列是在SEQ ID No.6中
被发现的。用MluI消化2μg的载体pHS1 bioS1并通过琼脂糖凝胶
分离基因bioS1。用MluI消化载体pHS2、用SAP使其去磷酸化并以
接合连接方式与片段bioS1连接。将所述的连接混合物转入XLl-
blue,并通过质粒分离和限制酶切消化来鉴定以正确取向的阳性克
隆。将所得载体称作pHS2 bioS1(附图2)。PHS2 bioS1的序列是
在SEQ ID No.9中被发现的。载体中衍生的bioS1的氨基酸序列是
在SEQ ID No.10中被发现的。

3.bioS2(SEQ ID No.3)的克隆:

克隆入编码涉及Fe-S簇装配的基因产物的大肠杆菌另外的基因
的方式如下:

和与来自棕色固氮杆菌的NifS蛋白质高度同源(>40%)的
SwissProt/PIR数据库中蛋白质的Aa序列进行的序列比较(Megalign
程序,群体模式)证实:除上述的序列基元I外,这些蛋白质的N末
端也表现出显著的保守性。将Aa序列MIYLDNXATT鉴定为典型的Nifs
族蛋白质N末端的保守序列并称作基元IIa。

SwissProt/PIR数据库对高于80%保守性的该序列的分析证实
了公知该蛋白质N末端序列中大肠杆菌11Aa内的另一种蛋白质来源
于Edman降解(数据库中的名称:UP06_Ecoli)。将这种蛋白质看
作假拟Nifs的同系物并在下文称作BioS2(与BioS1相似)。

对蛋白质BioS2的基因克隆和测序的方式如下。从蛋白质序列
HIU00072_10开始,一方面将保守的氨基酸基元I、而另一方面将上
述UP06_Ecoli的Aa序列用于制备能够扩增bioS2基因片段的简并
的寡核苷酸。为达到这一目的,将两种Aa基元HIU00072_10(基元I)
和UP06_Ecoli(基元IIb,MKLPIYLDYSAT)反向翻译成相应的DNA
序列。通过这种方式,从基元II合成简并寡核苷酸PbioS2,1(5’-
ATGAARYTNCCNATHTAYYTNGAYTAYWSNGCNAC-3’),并从基元I合成简
并寡核苷酸PbioS2,2(5’-cccaghggrccrtgcagyttrtgrccrga-3’)。

PCR过程:

将来自大肠杆菌W3110的染色体DNA作为模板。使寡核苷酸
PbioS2,1和PbioS2,2各0.5μg在各自情况下与15pmol的核苷酸
混合物、2.5U溶于制造商提供的反应缓冲液的Pwo DNA聚合酶
(Boehringer Mannheim)反应。用于PCR的体积为100μl。

扩增条件:

变性过程在94℃下进行2分钟。在45℃下进行所述寡核苷酸的
退火并在72℃下使链延伸进行45秒。使PCR进行30个循环以上。
通过PCR可能选择性地扩增三种片段,其中之一具有来自序列比较所
预期的600bp的大小。通过琼脂糖凝胶纯化来分离这种DNA片段并
使用寡核苷酸PbioS2,2对其进行测序。在所有六种可能的读框内翻
译所得的DNA序列。然后将所得翻译的Aa序列与翻译的HIU00072_10
的Aa序列和来自棕色固氮杆菌的Nifs进行比较。翻译的读框之一显
示出与所述ORF HIU00072_10的Aa序列的高度同源性并称作bioS2。

测定并克隆bioS2完整的DNA序列(=SEQ ID No.3)的方式如
下:

首先,制备与bioS2同源的标记的DNA探针。该步骤使用PCR-
DIG标记试剂盒(Boehringer Mannheim)来进行。用于制备DIG-DNA
探针的模板是由寡核苷酸PbioS2,1和PbioS2,2制备的所述PCR产
物。

PCR的条件是:

所用物质如下:1μl的PCR模板,5μl的核苷酸DIG-dUTP混
合物,寡核苷酸PbioS2,1和PbioS2,2各15pmol,来自含有1.75mM
MgCl2的试剂盒的缓冲液,0.75μl的扩展聚合酶混合物(Boehringer
Mannheim)。

扩增条件:

DNA在94℃下解链2分钟;DNA在94℃下解链10秒;在45℃下
退火30秒;在68℃下链延伸3.30分钟、持续10个循环以上;DNA
在94℃下解链10秒;在45℃下退火30秒;在68℃下链延伸3.30
分钟;每个循环链延伸延长20秒、持续20个循环以上。用PCR纯化
试剂盒来纯化所述DIG-标记的片段。

4.用染色体DNA进行的bioS2的Southern分析

在进一步的步骤中,用限制酶消化基因组DNA并使用标记的DNA
探针、通过Southern杂交来对其进行分析。

用下列限制酶来完全消化大肠杆菌W3110染色体DNA(10μg):
EcoRI、BamHI、Acc65I、HindIII、SalI。所述混合物的体积为50μl,
且每一种酶的用量为30U。将所述的混合物培养4小时。通过TBE
缓冲液中1%的琼脂糖凝胶来对以该方式消化的DNA进行分级分离
(Sambrook,J.Fritsch,E F.Maniatis,T.第二版,冷泉港实验
室出版社,1989,ISBN0-87969-373-8)并借助于一种压力转化室
(Stratagene)将其转移到一种尼龙膜上(Boehringer Mannheim)
且通过UV照射(Stratalinker Stratagene)以共价键的方式固定
在该膜上。与DIG-标记的DNA探针的杂交在65℃下、DIG Easyhyb
缓冲液(Boehringer Mannheim)中进行15小时。按照制造商提供
的说明印迹的显影表明BioS2 DIG-DNA探针与条带进行了杂交,在
Acc65I、EcoRI和HindIII的情况下测定所述条带大小约为3-4kb。
BamHI消化的DNA证明了与带有相当高分子量的片段的bioS2探针杂
交的过程。优选将3-4kb的片段用于进一步的克隆步骤。

通过反向PCR克隆bioS2

在用EcoRI消化的情况中,鉴定了隐藏着被寻找基因的约4kb
的片段。然后通过反向PCR技术扩增并克隆完整的基因。在反向PCR
的第一个步骤中,用EcoRI完全消化大肠杆菌染色体DNA。在第二个
步骤中,在从统计学的观点来看存在分子内键的条件下,然后从前述
的限制酶切消化中,将EcoRI消化的DNA通过连接酶以共价键的方式
在低DNA浓度(约20ng/ml)下连接。在第三个步骤中,使用寡核
苷酸进行PCR,所述的寡核苷酸的序列对所寻找的靶基因具有特异
性。

可以将特异性扩增的DNA片段以其大小为基础进行鉴定,所述的
DNA片段的大小从来自Southern分析的限制片段的大小和来自所述
基因公知部分中寡核苷酸的定位来显示。然后将以这种方式鉴定的片
段克隆入一种诸如pBS SK Bluescript/pCR Script(Stratagene)
这样的合适载体中并对其进行测序。

实验步骤:

用15U、50μl体积的EcoRI(Boehringer Mannheim)将来自
菌株W3110的1μg染色体DNA完全消化。通过将30μl装上琼脂糖
凝胶来检测消化的完全性。在15℃下,将100μl体积的来自这种染
色体DNA消化的片段(10μl的消化物=200ng)与10μl的连接缓
冲液和2U的T4连接酶(Boehringer Mannheim)一起温育15小时
(分子内连接反应)。在该连接反应后,通过在65℃下温育20分钟
来使T4连接酶失活。将5μl的这种连接混合物用作PCR的模板。从
bioS2的序列开始合成引物PbioS2,3(5’-GCGTGGGTAAACTGCCTA
TCGACCTGAGCC-3’)和PbioS2,4(5’-CTACGCTTC CTTCAGCCTGCCAG
CCGAAA-3’)。

使寡核苷酸PbioS2,3在bioS2的5’端上杂交并导致在3’方向上
在互补链的5’端上进行编码序列的扩增延伸。

使寡核苷酸PbioS2,4在bioS2的3’端上杂交并导致在3’方向上
在编码链的3’端上进行编码序列的扩增延伸。

所用的物质如下:5μl的连接混合物,1.75μl的脱氧核苷酸
混合物(350μmol,Boehringer Mannheim),寡核苷酸PbioS2,5
和PbioS2,6各15pmol,来自含有1.75mM MgCl2的试剂盒的缓冲
液1,0.75μl的扩展聚合酶混合物。

用引物PbioS2,3/PbioS2,4扩增连接的大肠杆菌DNA的条件。扩
展试剂盒(Boehringer Mannheim),DNA在94℃下解链2分钟;DNA
在94℃下解链10秒;在61℃下退火30秒;在68℃下链延伸3.30
分钟、持续10个循环以上;DNA在94℃下解链10秒;在61℃下退
火30秒;在68℃下链延伸3.30分钟;每个循环链延伸伸长20秒、
持续20个循环以上。

所述的扩增产生约3kb的PCR产物。这种DNA片段证明了在严格
条件下与上述bioS2-DIG-DNA探针的Southern杂交是显著的。

设想这种DNA片段含有与bioS2高度同源的DNA序列。由此将这
种DNA片段克隆入一种载体以便进一步对其进行特征鉴定并对其测
序。使用pCR Script试剂盒(Stratagene),首先将所述的DNA片
段按照制造商提供的说明用Pfu聚合酶进行处理,然后将其连入载体
pCR Script。将该连接混合物转入XL1-blue细胞(Stratagene)并
铺在LB-Amp上。通过小量制备分析来鉴定隐藏片段的阳性克隆。测
序结果显示出如SEQ ID No.3(=bioS2)所述的完整的序列。

然后将BioS2作为类似于bioS1的表达弹夹来扩增并克隆。为了
达到这一目的,通过使用寡核苷酸PbioS2,5(5’-CATGACGCGTAAA
GAGGAGAAATTAACTATGAAATTACCGATTTATTTGG-3’)和PbioS2,6(5’-
GCGACGCGTGATTAATGATGAGCCCAT-3’)的PCR而将MluI识别位点和最
优化的SD序列添加到所述基因的5’端上并将MluI识别位点添加到所
述基因的3’端上。

PCR过程:

将来自W3110的0.5μg染色体DNA用作模板。所用的寡核苷酸
PbioS2,5和PbioS2,6的浓度各为15pM。dNTPS的浓度为200μM。
在制造商提供的反应缓冲液中将2.5U的Pwo DNA聚合酶
(Boehringer Mannheim)用作聚合酶。用于PCR的体积为100μl。

扩增条件:

变性过程在94℃下进行2秒。寡核苷酸在55℃下退火30秒,链
延伸在72℃下进行45秒。使PCR进行30个循环以上。

用PCR纯化试剂盒(Boehringer Mannheim)来纯化所得具有约
1200bp正确大小的DNA产物并用溶于合适缓冲液的MluI对其进行
消化。

通过MluI消化5μg的载体pHS2并通过shrimp碱性磷酸酶
(SAP)(Boehringer Mannheim)使其去磷酸化。在使SAP变性后,
通过快速DNA连接试剂盒、按照制造商的说明以1∶3的摩尔比将所
述载体与片段进行连接。将该连接混合物转入菌株XL1-blue中。通
过质粒的制备和限制酶切分析来鉴定阳性克隆。通过限制酶切消化和
测序来确定pHS2中bioS2片段的正确取向。将所述载体称作pHS2
bioS2(附图3)。pHS2 bioS2的序列是在SEQ ID No.11中被发现
的。载体中衍生的bioS2的氨基酸序列是在SEQ ID No.12中被发现
的。以一种类似的方式将bioS2克隆入载体pHS1。 pHS1 bioS2的序
列是在SEQ ID No.7中被发现的(附图4)。载体中衍生的bioS2的
氨基酸序列是在SEQ ID No.8中被发现的。

5.质粒pHBbio14的构建:

用一种转导λ噬菌体在体内克隆Bio操纵子。通过将大肠杆菌
bio-阴性菌株转导成bio+来筛选λbio+噬菌体。繁殖所分离的bio+
转导λ噬菌体并纯化λDNA。随后从λ噬菌体DNA中切下具有完整生物
素操纵子的8.7kb EcoRI/HindIII片段并将所述片段连入已用
EcoRI/HindIII切割的pBR322。通过质粒的制备和限制酶切分析来
鉴定阳性克隆。

1.2kb的bioD的3’片段的缺失

使bioD基因3’端上的非必须基因序列缺失。为了达到这一目
的,通过PCR将EcoRI切割位点引入bioD终止密码子之后。根据
Otsuka等所述的操纵子序列(《生物化学杂志》(J.Bio.Chem.)
263,1988:19577-85)开发了用于该PCR的寡核苷酸Pbio1,1
(5’-AATAAGGAATTCTTATGTACTTTCCGGTTGCCG-3’)和Pbio1,2(5’-
AACAGCAGCCTGCAGCTGGATTA-3’)。

PCR的条件:

使2.5U Taq聚合酶(Perkin Elmer)与15pmol的每一种引
物在100μl的体积中反应。在50℃下进行退火并使链延伸在72℃下
进行1分钟、30个循环以上。分离488bp的片段并在琼脂糖凝胶上
纯化。用EcoRI/PstI消化所得的片段。用EcoRI/PstI消化pHBbio1。
分离得到9.5kb的片段。

将所述的9.5kb的片段连入488bp的片段并转入XL1-blue细
胞。通过质粒的制备并通过使用酶EcoRI和HindIII对所述质粒DNA
的限制酶切分析来分析所得的克隆,并鉴定了隐藏5.9kb片段的阳
性克隆。分离一种克隆并称作pHBbio2。从该克隆中获得质粒DNA。
用EcoRI/HindIII消化5μg的pHBbio2,并分离出含有完整生物素
生物合成基因的5.9kb片段。

用EcoRI和HindIII消化5μg的质粒pAT153。将所得的含有生
物素生物合成基因的5.9kb片段与所消化的载体pAT153连接并转入
XL1-blue。通过质粒的制备并通过使用酶EcoRI和HindIII对所述
质粒DNA的限制酶切分析来分析所得的克隆。鉴定阳性克隆,且分离
一种克隆并称作pHBbio14。

6.通过超表达bioS1增加生物素的产量

通过使用已生长在隐藏recA::Tn10的菌株上的P1裂解物的P1
转导而将菌株BM4092(Barker和Campbell)转导成recA-。通过阳
性转导体UV敏感性的增加来检测转导是否成功。然后用质粒
pHBbio14、通过CaCl2法来转化所得菌株LU8091并在含氨苄青霉素
100μg/ml的LB上进行培养。分离一种克隆并各自用质粒pHS1 bioS1
和pHS2 bioS2、通过CaCl2法将其转化并在含氨苄青霉素100μg/ml
和卡那霉素25μg/ml的LB琼脂上进行筛选。

将各转化体中的一个菌落接种入含有合适抗生素的DYT培养基
中并培养12小时。取10ml放置过夜的培养物用于接种入含有合适
抗生素的TB培养基(Sambrook,J.Fritsch,E F.Maniatis,T.
第二版,冷泉港实验室出版社,1989 ISBN0-87969-373-8)并培养
24小时。生长完成后,通过离心从培养上清液中取出细胞并使用所
述上清液中的链霉抗生物素蛋白和抗生物素蛋白、通过ELISA来测定
生物素和去硫生物素的浓度。该测定结果可以在表I中找到。

表I:生物素和去硫生物素浓度的测定结果
  菌株
  质粒I
  质粒II
生物素mg/l
去硫生物素mg/l
 Lu8091
 PHBbio14
    9.4
    45.6
 Lu8091
 PHBbio14
 pHS1 bioS1
    15.3
    19.7
 Lu8091
 PHBbio14
 pHS2 bioS1
    19.2
    15.8

                           序列表
(1)一般信息:

(i)申请人:

  (A)姓名:BASF Aktiengesellschaft

  (B)街:Carl BoSch Strasse

  (C)城市:Ludwigshafen

  (D)州:Rheinland-Pfalz

  (E)国家:德国

  (F)邮政编码:D-67056

(ii)发明名称:生物素的制备方法

(iii)序列数:12

(iv)计算机可读形式:

  (A)媒体类型:软盘

  (B)计算机:IBM PC兼容机

  (C)操作系统:PC-DOS/MS-DOS

  (D)软件:PatentIn Release#1.0,版本#1.25(EPO)
(2)SEQ ID NO:1的信息:

(i)序列特征:

  (A)长度:1217个碱基对

  (B)类型:核酸

  (C)链型:单链

  (D)拓扑结构:线性

(ii)分子类型:DNA(基因组)

(iii)假拟结构:无

(iv)反义:无

(vi)原始来源:

  (A)生物体:大肠杆菌

  (B)菌株:W3110

(ix)特征:

  (A)名称/关键词:5’UTR

  (B)位置:1..11

(ix)特征:

  (A)名称/关键词:CDS

  (B)位置:12..1217

(xi)序列描述:SEQ ID NO:1:
CGAGGAGTAC C ATG AAC GTT TTT AAT CCC GCG CAG TTT CGC GCC CAG TTT  50

         Met Asn Val Phe Asn Pro Ala Gln Phe Arg Ala Gln Phe

           1               5                  10
CCC GCA CTA CAG GAT GCG GGC GTC TAT CTC GAC AGC GCC GCG ACC GCG   98
Pro Ala Leu Gln Asp Ala Gly Val Tyr Leu Asp Ser Ala Ala Thr Ala

 15                 20                   25
CTT AAA CCT GAA GCC GTG GTT GAA GCC ACC CAA CAG TTT TAC AGT CTG   146
Leu Lys Pro Glu Ala Val Val Glu Ala Thr Gln Gln Phe Tyr Ser Leu
 30                  35                  40                  45
AGC GCC GGA AAC GTC CAT CGC AGC CAG TTT GCC GAA GCC CAA CGC CTG   194
Ser Ala Gly Asn Val His Arg Ser Gln Phe Ala Glu Ala Gln Arg Leu

             50                  55                  60
ACC GCG CGT TAT GAA GCT GCA CGA GAG AAA GTG GCG CAA TTA CTG AAT   242
Thr Ala Arg Tyr Glu Ala Ala Arg Glu Lys Val Ala Gln Leu Leu Asn

         65                  70                      75
GCA CCG GAT GAT AAA ACT ATC GTC TGG ACG CGC GGC ACC ACT GAA TCC   290
Ala Pro Asp Asp Lys Thr Ile Val Trp Thr Arg Gly Thr Thr Glu Ser

     80                  85                  90
ATC AAC ATG GTG GCA CAA TGC TAT GCG CGT CCG CGT CTG CAA CCG GGC   338
Ile Asn Met Val Ala Gln Cys Tyr Ala Arg Pro Arg Leu Gln Pro Gly

 95                 100                 105
GAT GAG ATT ATT GTC AGC GTG GCA GAA CAC CAC GCC AAC CTC GTC CCC   386
Asp Glu Ile Ile Val Ser Val Ala Glu His His Ala Asn Leu Val Pro
110                 115                 120                 125
TGG CTG ATG GTC GCC CAA CAA ACT GGA GCC AAA GTG GTG AAA TTG CCG   434
Trp Leu Met Val Ala Gln Gln Thr Gly Ala Lys Val Val Lys Leu Pro

            130                 135                 140
CTT AAT GCG CAG CGA CTG CCG GAT GTC GAT TTG TTG CCA GAA CTG ATT   482
Leu Asn Ala Gln Arg Leu Pro Asp Val Asp Leu Leu Pro Glu Leu Ile

        145                 150                 155
ACT CCC CGT AGT CGG ATT CTG GCG TTG GGT CAG ATG TCG AAC GTT ACT   530
Thr Pro Arg Ser Arg Ile Leu Ala Leu Gly Gln Met Ser Asn Val Thr

    160                 165                 170
GGC GGT TGC CCG GAT CTG GCG CGA GCG ATT ACC TTT GCT CAT TCA GCC   578
Gly Gly Cys Pro Asp Leu Ala Arg Ala Ile Thr Phe Ala His Ser Ala

175                 180                 185
GGG ATG GTG GTG ATG GTT GAT GGT GCT CAG GGG GCA GTG CAT TTC CCC   626
Gly Met Val Val Met Val Asp Gly Ala Gln Gly Ala Val His Phe Pro
190                 195                 200                 205
GCG GAT GTT CAG CAA CTG GAT ATT GAT TTC TAT GCT TTT TCA GGT CAC   674
Ala Asp Val Gln Gln Leu Asp Ile Asp Phe Tyr Ala Phe Ser Gly His

            210                 215                 220
AAA CTG TAT GGC CCG ACA GGT ATC GGC GTG CTG TAT GGT AAA TCA GAA   722
Lys Leu Tyr Gly Pro Thr Gly Ile Gly Val Leu Tyr Gly Lys Ser Glu

        225                 230                 235
CTG CTG GAG GCG ATG TCG CCC TGG CTG GGC GGC GGC AAA ATG GTT CAC   770
Leu Leu Glu Ala Met Ser Pro Trp Leu Gly Gly Gly Lys Met Val His

    240                 245                 250
GAA GTG AGT TTT GAC GGC TTC ACG ACT CAA TCT GCG CCG TGG AAA CTG   818
Glu Val Ser Phe Asp Gly Phe Thr Thr Gln Ser Ala Pro Trp Lys Leu

255                 260                 265
GAA GCT GGA ACG CCA AAT GTC GCT GGT GTC ATA GGA TTA AGC GCG GCG   866
Glu Ala Gly Thr Pro Asn Val Ala Gly Val Ile Gly Leu Ser Ala Ala
270                 275                 280                 285
CTG GAA TGG CTG GCA GAT TAC GAT ATC AAC CAG GCC GAA AGC TGG AGC   914
Leu Glu Trp Leu Ala Asp Tyr Asp Ile Asn Gln Ala Glu Ser Trp Ser

            290                 295                 300
CGT AGC TTA GCA ACG CTG GCG GAA GAT GCG CTG GCG AAA CGT CCC GGC   962
Arg Ser Leu Ala Thr Leu Ala Glu Asp Ala Leu Ala Lys Arg Pro Gly

        305                 310                 315
TTT CGT TCA TTC CGC TGC CAG GAT TCC AGC CTG CTG GCC TTT GAT TTT   1010
Phe Arg ser Phe Arg Cys Gln Asp Ser Ser Leu Leu Ala Phe Asp Phe

    320                 325                 330
GCT GGC GTT CAT CAT AGC GAT ATG GTG ACG CTG CTG GCG GAG TAC GGT   1058
Ala Gly Val His His Ser Asp Met Val Thr Leu Leu Ala Glu Tyr Gly

335                 340                 345
ATT GCC CTG CGG GCC GGG CAG CAT TGC GCT CAG CCG CTA CTG GCA GAA   1106
Ile Ala Leu Arg Ala Gly Gln His Cys Ala Gln Pro Leu Leu Ala Glu
350                 355                 360                 365
TTA GGC GTA ACC GGC ACA CTG CGC GCC TCT TTT GCG CCA TAT AAT ACA   1154
Leu Gly Val Thr Gly Thr Leu Arg Ala Ser Phe Ala Pro Tyr Asn Thr

            370                 375                 380
AAG AGT GAT GTG GAT GCG CTG GTG AAT GCC GTT GAC CGC GCG CTG GAA   1202
Lys Ser Asp Val Asp Ala Leu Val Asn Ala Val Asp Arg Ala Leu Glu

        385                 390                 395
TTA TTG GTG GAT TA                                                1217
Leu Leu Val Asp

    400
(2)SEQ ID NO:2的信息:

(i)序列特征:

 (A)长度:401个氨基酸

 (B)类型:氨基酸

 (D)拓扑结构:线性

(ii)分子类型:蛋白质

(xi)序列描述:SEQ ID NO:2:
Met Asn Val Phe Asn Pro Ala Gln Phe Arg Ala Gln Phe Pro Ala Leu
 1                5                  10                  15
Gln Asp Ala Gly Val Tyr Leu Asp Ser Ala Ala Thr Ala Leu Lys Pro

         20                  25                  30
Glu Ala Val Val Glu Ala Thr Gln Gln Phe Tyr Ser Leu Ser Ala Gly

     35                  40                  45
Asn Val His Arg Ser Gln Phe Ala Glu Ala Gln Arg Leu Thr Ala Arg

 50                  55                  60
Tyr Glu Ala Ala Arg Glu Lys Val Ala Gln Leu Leu Asn Ala Pro Asp
 65                  70                  75                  80
Asp Lys Thr Ile Val Trp Thr Arg Gly Thr Thr Glu Ser Ile Asn Met

             85                  90                  95
Val Ala Gln Cys Tyr Ala Arg Pro Arg Leu Gln Pro Gly Asp Glu Ile

        100                 105                 110
Ile Val Ser Val Ala Glu His His Ala Asn Leu Val Pro Trp Leu Met

    115                 120                 125
Val Ala Gln Gln Thr Gly Ala Lys Val Val Lys Leu Pro Leu Asn Ala

130                 135                 140
Gln Arg Leu Pro Asp Val Asp Leu Leu Pro Glu Leu Ile Thr Pro Arg
145                 150                 155                 160
Ser Arg Ile Leu Ala Leu Gly Gln Met Ser Asn Val Thr Gly Gly Cys

            165                 170                 175
Pro Asp Leu Ala Arg Ala Ile Thr Phe Ala His Ser Ala Gly Met Val

        180                 185                 190
Val Met Val Asp Gly Ala Gln Gly Ala Val His Phe Pro Ala Asp Val

    195                 200                 205
Gln Gln Leu Asp Ile Asp Phe Tyr Ala Phe Ser Gly His Lys Leu Tyr

    210                       215                       220
Gly Pro Thr Gly Ile Gly Val Leu Tyr Gly Lys Ser Glu Leu Leu Glu
225                     230                     235         240
Ala Met Ser Pro Trp Leu Gly Gly Gly Lys Met Val His Glu Val Ser

            245                 250                 255
Phe Asp Gly Phe Thr Thr Gln Ser Ala Pro Trp Lys Leu Glu Ala Gly

        260                 265                 270
Thr Pro Asn Val Ala Gly Val Ile Gly Leu Ser Ala Ala Leu Glu Trp

    275                 280                 285
Leu Ala Asp Tyr Asp Ile Asn Gln Ala Glu Ser Trp Ser Arg Ser Leu

290                 295                 300
Ala Thr Leu Ala Glu Asp Ala Leu Ala Lys Arg Pro Gly Phe Arg Ser
305                 310                 315                 320
Phe Arg Cys Gln Asp Ser Ser Leu Leu Ala Phe Asp Phe Ala Gly Val

            325                 330                 335
His His Ser Asp Met Val Thr Leu Leu Ala Glu Tyr Gly Ile Ala Leu

        340                 345                 350
Arg Ala Gly Gln His Cys Ala Gln Pro Leu Leu Ala Glu Leu Gly Val

    355                 360                 365
Thr Gly Thr Leu Arg Ala Ser Phe Ala Pro Tyr Asn Thr Lys Ser Asp

370                 375                 380
Val Asp Ala Leu Val Asn Ala Val Asp Arg Ala Leu Glu Leu Leu Val
385                 390                 395                 400
Asp
(2)SEQ ID NO:3的信息:

(i)序列特征:

 (A)长度:1233个碱基对

 (B)类型:核酸

 (C)链型:单链

 (D)拓扑结构:线性

(ii)分子类型:DNA(基因组)

(iii)假拟结构:无

(iv)反义:无

(vi)原始来源:

  (A)生物体:大肠杆菌

  (B)菌株:W3110

(ix)特征:

  (A)名称/关键词:CDS

  (B)位置:19..1233

(ix)特征:

  (A)名称/关键词:5’UTR

  (B)位置:1..18

(xi)序列描述:SEQ ID NO:3:
AAAGAGGAGA AATTAACT ATG AAA TTA CCG ATT TAT CTC GAC TAC TCC GCA   51

                Met Lys Leu Pro Ile Tyr Leu Asp Tyr Ser Ala

                 1                5                  10
ACC ACG CCG GTG GAC CCG CGT GTT GCC GAG AAA ATG ATG CAG TTT ATG   99
Thr Thr Pro Val Asp Pro Arg Val Ala Glu Lys Met Met Gln Phe Met

         15                  20                  25
ACG ATG GAC GGA ACC TTT GGT AAC CCG GCC TCC CGT TCT CAC CGT TTC   147
Thr Met Asp Gly Thr Phe Gly Asn Pro Ala Ser Arg Ser His Arg Phe

     30                  35                  40
GGC TGG CAG GCT GAA GAA GCG GTA GAT ATC GCC CGT AAT CAG ATT GCC   195
Gly Trp Gln Ala Glu Glu Ala Val Asp Ile Ala Arg Asn Gln Ile Ala

 45                  50                  55
GAT CTG GTC GGC GCT GAT CCG CGT GAA ATC GTC TTT ACC TCT GGT GCA   243
Asp Leu Val Gly Ala Asp Pro Arg Glu Ile Val Phe Thr Ser Gly Ala
 60                  65                  70                  75
ACC GAA TCT GAC AAC CTG GCG ATC AAA GGT GCA GCC AAC TTT TAT CAG   291
Thr Glu Ser Asp Asn Leu Ala Ile Lys Gly Ala Ala Asn Phe Tyr Gln

             80                  85                  90
AAA AAA GGC AAG CAC ATC ATC ACC AGC AAA ACC GAA CAC AAA GCG GTA   339
Lys Lys Gly Lys His Ile Ile Thr Ser Lys Thr Glu His Lys Ala Val

         95                 100                 105
CTG GAT ACC TGC CGT CAG CTG GAG CGC GAA GGT TTT GAA GTC ACC TAC   387
Leu Asp Thr Cys Arg Gln Leu Glu Arg Glu Gly Phe Glu Val Thr Tyr

    110                 115                 120
CTG GCA CCG CAG CGT AAC GGC ATT ATC GAC CTG AAA GAA CTT GAA GCA   435
Leu Ala Pro Gln Arg Asn Gly Ile Ile Asp Leu Lys Glu Leu Glu Ala

125                 130                 135
GCG ATG CGT GAC GAC ACC ATC CTC GTG TCC ATC ATG CAC GTA AAT AAC   483
Ala Met Arg Asp Asp Thr Ile Leu Val Ser Ile Met His Val Asn Asn
140                 145                 150                 155
GAA ATC GGC GTG GTG CAG GAT ATC GCG GCT ATC GGC GAA ATG TGC CGT   531
Glu Ile Gly Val Val Gln Asp Ile Ala Ala Ile Gly Glu Met Cys Arg

            160                 165                 170
GCT CGT GGC ATT ATC TAT CAC GTT GAT GCA ACC CAG AGC GTG GGT AAA   579
Ala Arg Gly Ile Ile Tyr His Val Asp Ala Thr Gln Ser Val Gly Lys

        175                 180                 185
CTG CCT ATC GAC CTG AGC CAG TTG AAA GTT GAC CTG ATG TCT TTC TCC   627
Leu Pro Ile Asp Leu Ser Gln Leu Lys Val Asp Leu Met Ser Phe Ser

    190                 195                 200
GGT CAC AAA ATC TAT GGC CCG AAA GGT ATC GGT GCG CTG TAT GTA CGT   675
Gly His Lys Ile Tyr Gly Pro Lys Gly Ile Gly Ala Leu Tyr Val Arg

205                 210                 215
CGT AAA CCG CGC GTA CGC ATC GAA GCG CAA ATG CAC GGC GGC GGT CAC   723
Arg Lys Pro Arg Val Arg Ile Glu Ala Gln Met His Gly Gly Gly His
220                 225                 230                 235
GAG CGC GGT ATG CGT TCC GGC ACT CTG CCT GTT CAC CAG ATC GTC GGA   771
Glu Arg Gly Met Arg Ser Gly Thr Leu Pro Val His Gln Ile Val Gly

            240                 245                 250
ATG GGC GAG GCC TAT CGC ATC GCA AAA GAA GAG ATG GCG ACC GAG ATG   819
Met Gly Glu Ala Tyr Arg Ile Ala Lys Glu Glu Met Ala Thr Glu Met

        255                 260                 265
GAA CGT CTG CGC GGC CTG CGT AAC CGT CTG TGG AAC GGC ATC AAA GAT   867
Glu Arg Leu Arg G1y Leu Arg Asn Arg Leu Trp Asn Gly Ile Lys Asp

    270                 275                 280
ATC GAA GAA GTT TAC CTG AAC GGT GAC CTG GAA CAC GGT GCG CCG AAC   915
Ile Glu Glu Val Tyr Leu Asn Gly Asp Leu Glu His Gly Ala Pro Asn

285                 290                 295
ATT CTC AAC GTC AGC TTC AAC TAC GTT GAA GGT GAG TCG CTG ATT ATG   963
Ile Leu Asn Val Ser Phe Asn Tyr Val Glu Gly Glu Ser Leu Ile Met
300                 305                 310                 315
GCG CTG AAA GAC CTC GCA GTT TCT TCA GGT TCC GCC TGT ACG TCA GCA   1011
Ala Leu Lys Asp Leu Ala Val Ser Ser Gly Ser Ala Cys Thr Ser Ala

            320                 325                 330
AGC CTC GAA CCG TCC TAC GTG CTG CGC GCG CTG GGG CTG AAC GAC GAG   1059
Ser Leu Glu Pro Ser Tyr Val Leu Arg Ala Leu Gly Leu Asn Asp Glu

        335                 340                 345
CTG GCA CAT AGC TCT ATC CGT TTC TCT TTA GGT CGT TTT ACT ACT GAA   1107
Leu Ala His Ser Ser Ile Arg Phe Ser Leu Gly Arg Phe Thr Thr Glu

    350                 355                 360
GAA GAG ATC GAC TAC ACC ATC GAG TTA GTT CGT AAA TCC ATC GGT CGT   1155
Glu Glu Ile Asp Tyr Thr Ile Glu Leu Val Arg Lys Ser Ile Gly Arg

365                 370                 375
CTG CGT GAC CTT TCT CCG CTG TGG GAA ATG TAC AAG CAG GGC GTG GAT   1203
Leu Arg Asp Leu Ser Pro Leu Trp Glu Met Tyr Lys Gln Gly Val Asp
380                 385                 390                 395
CTG AAC AGC ATC GAA TGG GCT CAT CAT TA                            1233
Leu Asn Ser Ile Glu Trp Ala His His

            400                 405
(2)SEQ ID NO:4的信息:

(i)序列特征:

 (A)长度:404个氨基酸

 (B)类型:氨基酸

 (D)拓扑结构:线性

(ii)分子类型:蛋白质

(xi)序列描述:SEQ ID NO:4:
Met Lys Leu Pro Ile Tyr Leu Asp Tyr Ser Ala Thr Thr Pro Val Asp
1                 5                  10                  15
Pro Arg Val Ala Glu Lys Met Met Gln Phe Met Thr Met Asp Gly Thr

         20                  25                  30
Phe Gly Asn Pro Ala Ser Arg Ser His Arg Phe Gly Trp Gln Ala Glu

     35                  40                  45
Glu Ala Val Asp Ile Ala Arg Asn Gln Ile Ala Asp Leu Val Gly Ala

 50                  55                  60
Asp Pro Arg Glu Ile Val Phe Thr Ser Gly Ala Thr Glu Ser Asp Asn
 65                  70                  75                  80
Leu Ala Ile Lys Gly Ala Ala Asn Phe Tyr Gln Lys Lys Gly Lys His

             85                  90                  95
Ile Ile Thr Ser Lys Thr Glu His Lys Ala Val Leu Asp Thr Cys Arg

        100                 105                 110
Gln Leu Glu Arg Glu Gly Phe Glu Val Thr Tyr Leu Ala Pro Gln Arg

    115                 120                 125
Asn Gly Ile Ile ASp Leu Lys Glu Leu Glu Ala Ala Met Arg Asp Asp

130                 135             140
Thr Ile Leu Val Ser Ile Met His Val Asn Asn Glu Ile Gly Val Val
145                 150                 155                 160
Gln Asp Ile Ala Ala Ile Gly Glu Met Cys Arg Ala Arg Gly Ile Ile

            165                 170                 175
Tyr His Val Asp Ala Thr Gln Ser Val Gly Lys Leu Pro Ile Asp Leu

        180                 185                 190
Ser Gln Leu Lys Val Asp Leu Met Ser Phe Ser Gly His Lys Ile Tyr

    195                 200                 205
Gly Pro Lys Gly Ile Gly Ala Leu Tyr Val Arg Arg Lys Pro Arg Val

210                 215                 220
Arg Ile Glu Ala Gln Met His Gly Gly Gly His Glu Arg Gly Met Arg
225                 230                 235                 240
Ser Gly Thr Leu Pro Val His Gln Ile Val Gly Met Gly Glu Ala Tyr

            245                 250                 255
Arg Ile Ala Lys Glu Glu Met Ala Thr Glu Met Glu Arg Leu Arg Gly

        260                 265                 270
Leu Arg Asn Arg Leu Trp Asn Gly Ile Lys Asp Ile Glu Glu Val Tyr

    275                 280                 285
Leu Asn Gly Asp Leu Glu His Gly Ala Pro Asn Ile Leu Asn Val Ser

290                 295                 300
Phe Asn Tyr Val Glu Gly Glu Ser Leu Ile Met Ala Leu Lys Asp Leu
305                 310                 315                 320
Ala Val Ser Ser Gly Ser Ala Cys Thr Ser Ala Ser Leu Glu Pro Ser

            325                 330                 335
Tyr Val Leu Arg Ala Leu Gly Leu Asn Asp Glu Leu Ala His Ser Ser

        340                 345                 350
Ile Arg Phe Ser Leu Gly Arg Phe Thr Thr Glu Glu Glu Ile Asp Tyr

    355                 360                 365
Thr Ile Glu Leu Val Arg Lys Ser Ile Gly Arg Leu Arg Asp Leu Ser

370                 375                 380
Pro Leu Trp Glu Met Tyr Lys Gln Gly Val Asp Leu Asn Ser Ile Glu
385                 390                 395                 400
Trp Ala His His
(2)SEQ ID NO:5的信息:

(i)序列特征:

 (A)长度:3794个碱基对

 (B)类型:核酸

 (C)链型:单链

 (D)拓扑结构:环状

(ii)分子类型:DNA(基因组)

(iii)假拟结构:无

(iv)反义:无

(vii)直接来源:

 (B)克隆:pHS1bioS1

(ix)特征:

 (A)名称/关键词:CDS

 (B)位置:601..1806

(xi)序列描述:SEQ ID NO:5:
GACGTCTGTG TGGAATTGTG AGCGGATAAC AATTTCACAC AGGGCCCTCG GACACCGAGG   60
AGAATGTCAA GAGGCGAACA CACAACGTCT TGGAGCGCCA GAGGAGGAAC GAGCTAAAAC  120
GGAGCTTTTT TGCCCTGCGT GACCAGATCC CGGAGTTGGA AAACAATGAA AAGGCCCCCA  180
AGGTAGTTAT CCTTAAAAAA GCCACAGCAT ACATCCTGTC CGTCCAAGCA GAGGAGCAAA  240
AGCTCATTTC TGAAGAGGAC TTGTTGCGGA AACGACGAGA ACAGTTGAAA CACAAACTTG  300
AACAGCTACG GAACTCTTGT GCGTAAGGAA AAGTAAGGAA AACGATTCCT TCTAACAGAA  360
ATGTCCTGAG CAATCACCTA TGAACTGTCG ACTCGAGATA GCATTTTTAT CCATAAGATT  420
AGCCGATCCT AAGGTTTACA ATTGTGAGCG CTCACAATTA TGATAGATTC AATTGTGAGC  480
GGATAACAAT TTCACACACG CTAGCGGTAC CGGGCCCCCC CTCGAGGTCG ACGGTATCGA  540
TAAGCTTGAT ATCGAATTCC TGCAGCCCGG GGGATCCCAT GGTACGCGTC GAGGAGTACC  600
ATG AAC GTT TTT AAT CCC GCG CAG TTT CGC GCC CAG TTT CCC GCA CTA    648
Met Asn Val Phe Asn Pro Ala Gln Phe Arg Ala Gln Phe Pro Ala Leu
 1                5                  10                  15
CAG GAT GCG GGC GTC TAT CTC GAC AGC GCC GCG ACC GCG CTT AAA CCT    696
Gln Asp Ala Gly Val Tyr Leu Asp Ser Ala Ala Thr Ala Leu Lys Pro

         20                  25                  30
GAA GCC GTG GTT GAA GCC ACC CAA CAG TTT TAC AGT CTG AGC GCC GGA  744
Glu Ala Val Val Glu Ala Thr Gln Gln Phe Tyr Ser Leu Ser Ala Gly

     35                  40                  45
AAC GTC CAT CGC AGC CAG TTT GCC GAA GCC CAA CGC CTG ACC GCG CGT  792
Asn Val His Arg Ser Gln Phe Ala Glu Ala Gln Arg Leu Thr Ala Arg

 50                  55                  60
TAT GAA GCT GCA CGA GAG AAA GTG GCG CAA TTA CTG AAT GCA CCG GAT  840
Tyr Glu Ala Ala Arg Glu Lys Val Ala Gln Leu Leu Asn Ala Pro Asp
 65                  70                  75                  80
GAT AAA ACT ATC GTC TGG ACG CGC GGC ACC ACT GAA TCC ATC AAC ATG  888
Asp Lys Thr Ile Val Trp Thr Arg Gly Thr Thr Glu Ser Ile Asn Met

             85                  90                  95
GTG GCA CAA TGC TAT GCG CGT CCG CGT CTG CAA CCG GGC GAT GAG ATT  936
Val Ala Gln Cys Tyr Ala Arg Pro Arg Leu Gln Pro Gly Asp Glu Ile

        100                 105                 110
ATT GTC AGC GTG GCA GAA CAC CAC GCC AAC CTC GTC CCC TGG CTG ATG  984
Ile Val Ser Val Ala Glu His His Ala Asn Leu Val Pro Trp Leu Met

    115                 120                 125
GTC GCC CAA CAA ACT GGA GCC AAA GTG GTG AAA TTG CCG CTT AAT GCG  1032
Val Ala Gln Gln Thr Gly Ala Lys Val Val Lys Leu Pro Leu Asn Ala

130                 135                 140
CAG CGA CTG CCG GAT GTC GAT TTG TTG CCA GAA CTG ATT ACT CCC CGT  1080
Gln Arg Leu Pro Asp Val Asp Leu Leu Pro Glu Leu Ile Thr Pro Arg
145                 150                 155                 160
AGT CGG ATT CTG GCG TTG GGT CAG ATG TCG AAC GTT ACT GGC GGT TGC  1128
Ser Arg Ile Leu Ala Leu Gly Gln Met Ser Asn Val Thr Gly Gly Cys

            165                 170                 175
CCG GAT CTG GCG CGA GCG ATT ACC TTT GCT CAT TCA GCC GGG ATG GTG  1176
Pro Asp Leu Ala Arg Ala Ile Thr Phe Ala His Ser Ala Gly Met Val

        180                 185                 190
GTG ATG GTT GAT GGT GCT CAG GGG GCA GTG CAT TTC CCC GCG GAT GTT  1224
Val Met Val Asp Gly Ala Gln Gly Ala Val His Phe Pro Ala Asp Val

    195                 200                 205
CAG CAA CTG GAT ATT GAT TTC TAT GCT TTT TCA GGT CAC AAA CTG TAT  1272
Gln Gln Leu Asp Ile Asp Phe Tyr Ala Phe Ser Gly His Lys Leu Tyr

210                 215                 220
GGC CCG ACA GGT ATC GGC GTG CTG TAT GGT AAA TCA GAA CTG CTG GAG  1320
Gly Pro Thr Gly Ile Gly Val Leu Tyr Gly Lys Ser Glu Leu Leu Glu
225         230                         235                 240
GCG ATG TCG CCC TGG CTG GGC GGC GGC AAA ATG GTT CAC GAA GTG AGT  1368
Ala Met Ser Pro Trp Leu Gly Gly Gly Lys Met Val His Glu Val Ser

            245                 250                 255
TTT GAC GGC TTC ACG ACT CAA TCT GCG CCG TGG AAA CTG GAA GCT GGA  1416
Phe Asp Gly Phe Thr Thr Gln Ser Ala Pro Trp Lys Leu Glu Ala Gly

        260                 265                 270
ACG CCA AAT GTC GCT GGT GTC ATA GGA TTA AGC GCG GCG CTG GAA TGG    1464
Thr Pro Asn Val Ala Gly Val Ile Gly Leu Ser Ala Ala Leu Glu Trp

    275                 280                 285
CTG GCA GAT TAC GAT ATC AAC CAG GCC GAA AGC TGG AGC CGT AGC TTA    1512
Leu Ala Asp Tyr Asp Ile Asn Gln Ala Glu Ser Trp Ser Arg Ser Leu

290                 295                 300
GCA ACG CTG GCG GAA GAT GCG CTG GCG AAA CGT CCC GGC TTT CGT TCA    1560
Ala Thr Leu Ala Glu Asp Ala Leu Ala Lys Arg Pro Gly Phe Arg Ser
305                 310                 315                 320
TTC CGC TGC CAG GAT TCC AGC CTG CTG GCC TTT GAT TTT GCT GGC GTT    1608
Phe Arg Cys Gln Asp Ser Ser Leu Leu Ala Phe Asp Phe Ala Gly Val

            325                 330                 335
CAT CAT AGC GAT ATG GTG ACG CTG CTG GCG GAG TAC GGT ATT GCC CTG    1656
His His Ser Asp Met Val Thr Leu Leu Ala Glu Tyr Gly Ile Ala Leu

        340                 345                 350
CGG GCC GGG CAG CAT TGC GCT CAG CCG CTA CTG GCA GAA TTA GGC GTA    1704
Arg Ala Gly Gln His Cys Ala Gln Pro Leu Leu Ala Glu Leu Gly Val

    355                 360                 365
ACC GGC ACA CTG CGC GCC TCT TTT GCG CCA TAT AAT ACA AAG AGT GAT    1752
Thr Gly Thr Leu Arg Ala Ser Phe Ala Pro Tyr Asn Thr Lys Ser Asp

370                 375                 380
GTG GAT GCG CTG GTG AAT GCC GTT GAC CGC GCG CTG GAA TTA TTG GTG    1800
Val Asp Ala Leu Val Asn Ala Val Asp Arg Ala Leu Glu Leu Leu Val
385                 390                 395                 400
GAT TAAACGCGTG CTAGAGGCAT CAAATAAAAC GAAAGGCTCA GTCGAAAGAC         1853
Asp
TGGGCCTTTC GTTTTATCTG TTGTTTGTCG GTGAACGCTC TCCTGAGTAG GACAAATCCG  1913
CCGCCCTAGA CCTAGGGGAT ATATTCCGCT TCCTCGCTCA CTGACTCGCT ACGCTCGGTC  1973
GTTCGACTGC GGCGAGCGGA AATGGCTTAC GAACGGGGCG GAGATTTCCT GGAAGATGCC  2033
AGGAAGATAC TTAACAGGGA AGTGAGAGGG CCGCGGCAAA GCCGTTTTTC CATAGGCTCC  2093
GCCCCCCTGA CAAGCATCAC GAAATCTGAC GCTCAAATCA GTGGTGGCGA AACCCGACAG  2153
GACTATAAAG ATACCAGGCG TTTCCCCCTG GCGGCTCCCT CGTGCGCTCT CCTGTTCCTG  2213
CCTTTCGGTT TACCGGTGTC ATTCCGCTGT TATGGCCGCG TTTGTCTCAT TCCACGCCTG  2273
ACACTCAGTT CCGGGTAGGC AGTTCGCTCC AAGCTGGACT GTATGCACGA ACCCCCCGTT  2333
CAGTCCGACC GCTGCGCCTT ATCCGGTAAC TATCGTCTTG AGTCCAACCC GGAAAGACAT  2393
GCAAAAGCAC CACTGGCAGC AGCCACTGGT AATTGATTTA GAGGAGTTAG TCTTGAAGTC  2453
ATGCGCCGGT TAAGGCTAAA CTGAAAGGAC AAGTTTTGGT GACTGCGCTC CTCCAAGCCA  2513
GTTACCTCGG TTCAAAGAGT TGGTAGGTCA GAGAACCTTC GAAAAACCGC CCTGCAAGGC  2573
GGTTTTTTCG TTTTCAGAGC AAGAGATTAC GCGCAGACCA AAACGATCTC AAGAAGATCA  2633
TCTTATTAAT CAGATAAAAT ATTTCTAGAT TTCAGTGCAA TTTATCTCTT CAAATGTAGC  2693
ACCTGAAGTC AGCCCCATAC GATATAAGTT GTTACTAGTG CTTGGATTCT CACCAATAAA  2753
AAACGCCCGG CGGCAACCGA GCGTTCTGAA CAAATCCAGA TGGAGTTCTG AGGTCATTAC  2813
TGGATCTATC AACAGGAGTC CAAGCGAGCT CTCGAACCCC AGAGTCCCGC TCAGAAGAAC  2873
TCGTCAAGAA GGCGATAGAA GGCGATGCGC TGCGAATCGG GAGCGGCGAT ACCGTAAAGC  2933
ACGAGGAAGC GGTCAGCCCA TTCGCCGCCA AGCTCTTCAG CAATATCACG GGTAGCCAAC  2993
GCTATGTCCT GATAGCGGTC CGCCACACCC AGCCGGCCAC AGTCGATGAA TCCAGAAAAG  3053
CGGCCATTTT CCACCATGAT ATTCGGCAAG CAGGCATCGC CATGGGTCAC GACGAGATCC  3113
TCGCCGTCGG GCATGCGCGC CTTGAGCCTG GCGAACAGTT CGGCTGGCGC GAGCCCCTGA  3173
TGCTCTTCGT CCAGATCATC CTGATCGACA AGACCGGCTT CCATCCGAGT ACGTGCTCGC  3233
TCGATGCGAT GTTTCGCTTG GTGGTCGAAT GGGCAGGTAG CCGGATCAAG CGTATGCAGC  3293
CGCCGCATTG CATCAGCCAT GATGGATACT TTCTCGGCAG GAGCAAGGTG AGATGACAGG  3353
AGATCCTGCC CCGGCACTTC GCCCAATAGC AGCCAGTCCC TTCCCGCTTC AGTGACAACG  3413
TCGAGCACAG CTGCGCAAGG AACGCCCGTC GTGGCCAGCC ACGATAGCCG CGCTGCCTCG  3473
TCCTGCAGTT CATTCAGGGC ACCGGACAGG TCGGTCTTGA CAAAAAGAAC CGGGCGCCCC  3533
TGCGCTGACA GCCGGAACAC GGCGGCATCA GAGCAGCCGA TTGTCTGTTG TGCCCAGTCA  3593
TAGCCGAATA GCCTCTCCAC CCAAGCGGCC GGAGAACCTG CGTGCAATCC ATCTTGTTCA  3653
ATCATGCGAA ACGATCCTCA TCCTGTCTCT TGATCAGATC TTGATCCCCT GCGCCATCAG  3713
ATCCTTGGCG GCAAGAAAGC CATCCAGTTT ACTTTGCAGG GCTTCCCAAC CTTACCAGAG  3773
GGCGCCCCAG CTGGCAATTC C                                            3794
(2)SEQ ID NO:6的信息:
   (i)序列特征:

(A)长度:401个氨基酸

(B)类型:氨基酸

(D)拓扑结构:线性
   (ii)分子类型:蛋白质
   (xi)序列描述:SEQ ID NO:6:
Met Asn Val Phe Asn Pro Ala Gln Phe Arg Ala Gln Phe Pro Ala Leu
 1                5                  10                  15
Gln Asp Ala Gly Val Tyr Leu Asp Ser Ala Ala Thr Ala Leu Lys Pro

         20                  25                  30
Glu Ala Val Val Glu Ala Thr Gln Gln Phe Tyr Ser Leu Ser Ala Gly

     35                  40                  45
Asn Val His Arg Ser Gln Phe Ala Glu Ala Gln Arg Leu Thr Ala Arg

 50                  55                  60
Tyr Glu Ala Ala Arg Glu Lys Val Ala Gln Leu Leu Asn Ala Pro Asp
 65                  70                  75                  80
Asp Lys Thr Ile Val Trp Thr Arg Gly Thr Thr Glu Ser Ile Asn Met

             85                  90                  95
Val Ala Gln Cys Tyr Ala Arg Pro Arg Leu Gln Pro Gly Asp Glu Ile

        100                 105                 110
Ile Val Ser Val Ala Glu His His Ala Asn Leu Val Pro Trp Leu Met

    115                 120                 125
Val Ala Gln Gln Thr Gly Ala Lys Val Val Lys Leu Pro Leu Asn Ala

130                 135                 140
Gln Arg Leu Pro Asp Val Asp Leu Leu Pro Glu Leu Ile Thr Pro Arg
145                 150                 155                 160
Ser Arg Ile Leu Ala Leu Gly Gln Met Ser Asn Val Thr Gly Gly Cys

            165                 170                 175
Pro Asp Leu Ala Arg Ala Ile Thr Phe Ala His Ser Ala Gly Met Val

        180                 185                 190
Val Met Val Asp Gly Ala Gln Gly Ala Val His Phe Pro Ala Asp Val

    195                 200                 205
Gln Gln Leu Asp Ile Asp Phe Tyr Ala Phe Ser Gly His Lys Leu Tyr

210                 215                 220
Gly Pro Thr Gly Ile Gly Val Leu Tyr Gly Lys Ser Glu Leu Leu Glu
225                 230                 235                 240
Ala Met Ser Pro Trp Leu Gly Gly Gly Lys Met Val His Glu Val Ser

            245                 250                 255
Phe Asp Gly Phe Thr Thr Gln Ser Ala Pro Trp Lys Leu Glu Ala Gly

        260                 265                 270
Thr Pro Asn Val Ala Gly Val Ile Gly Leu Ser Ala Ala Leu Glu Trp

    275                 280                 285
Leu Ala Asp Tyr Asp Ile Asn Gln Ala Glu Ser Trp Ser Arg Ser Leu

290                 295                 300
Ala Thr Leu Ala Glu Asp Ala Leu Ala Lys Arg Pro Gly Phe Arg Ser
305                 310                 315                 320
Phe Arg Cys Gln Asp Ser Ser Leu Leu Ala Pne Asp  Phe Ala Gly Val

            325                 330                  335
His His Ser Asp Met Val Thr Leu Leu Ala Glu Tyr Gly Ile Ala Leu

        340                 345                 350
Arg Ala Gly Gln His Cys Ala Gln pro Leu Leu Ala Glu Leu Gly Val

    355                 360                 365
Thr Gly Thr Leu Arg Ala Ser Phe Ala Pro Tyr Asn Thr Lys Ser Asp

370                 375                 380
Val Asp Ala Leu Val Asn Ala Val Asp Arg Ala Leu Glu Leu Leu Val
385                 390                 395                 400
Asp

(2)SEQ ID NO:7的信息:

  (i)序列特征:

   (A)长度:3810个碱基对

   (B)类型:核酸

   (C)链型:单链

   (D)拓扑结构:环状

  (ii)分子类型:DNA(基因组)

  (iii)假拟结构:无

  (iv)反义:无

  (vii)直接来源:

   (B)克隆:pHS1bioS2

  (ix)特征:

   (A)名称/关键词:CDS

   (B)位置:608..1822

  (xi)序列描述:SEQ ID NO:7:
GACGTCTGTG TGGAATTGTG AGCGGATAAC AATTTCACAC AGGGCCCTCG GACACCGAGG   60
AGAATGTCAA GAGGCGAACA CACAACGTCT TGGAGCGCCA GAGGAGGAAC GAGCTAAAAC  120
GGAGCTTTTT TGCCCTGCGT GACCAGATCC CGGAGTTGGA AAACAATGAA AAGGCCCCCA  180
AGGTAGTTAT CCTTAAAAAA GCCACAGCAT ACATCCTGTC CGTCCAAGCA GAGGAGCAAA  240
AGCTCATTTC TGAAGAGGAC TTGTTGCGGA AACGACGAGA ACAGTTGAAA CACAAACTTG  300
AACAGCTACG GAACTCTTGT GCGTAAGGAA AAGTAAGGAA AACGATTCCT TCTAACAGAA  360
ATGTCCTGAG CAATCACCTA TGAACTGTCG ACTCGAGATA GCATTTTTAT CCATAAGATT  420
AGCCGATCCT AAGGTTTACA ATTGTGAGCG CTCACAATTA TGATAGATTC AATTGTGAGC  480
GGATAACAAT TTCACACACG CTAGCGGTAC CGGGCCCCCC CTCGAGGTCG ACGGTATCGA  540
TAAGCTTGAT ATCGAATTCC TGCAGCCCGG GGGATCCCAT GGTACGCGTA AAGAGGAGAA  600
ATTAACT ATG AAA TTA CCG ATT TAT CTC GAC TAC TCC GCA ACC ACG CCG    649

    Met Lys Leu Pro Ile Tyr Leu Asp Tyr Ser Ala Thr Thr Pro

      1               5                  10
GTG GAC CCG CGT GTT GCC GAG AAA ATG ATG CAG TTT ATG ACG ATG GAC    697
Val Asp Pro Arg Val Ala Glu Lys Met Met Gln Phe Met Thr Met Asp
 15                  20                  25                  30
GGA ACC TTT GGT AAC CCG GCC TCC CGT TCT CAC CGT TTC GGC TGG CAG    745
Gly Thr Phe Gly Asn Pro Ala Ser Arg Ser His Arg Phe Gly Trp Gln

             35                  40                  45
GCT GAA GAA GCG GTA GAT ATC GCC CGT AAT CAG ATT GCC GAT CTG GTC    793
Ala Glu Glu Ala Val Asp Ile Ala Arg Asn Gln Ile Ala Asp Leu Val

         50                  55                  60
GGC GCT GAT CCG CGT GAA ATC GTC TTT ACC TCT GGT GCA ACC GAA TCT    841
Gly Ala Asp Pro Arg Glu Ile Val Phe Thr Ser Gly Ala Thr Glu Ser

     65                  70                  75
GAC AAC CTG GCG ATC AAA GGT GCA GCC AAC TTT TAT CAG AAA AAA GGC    889
Asp Asn Leu Ala Ile Lys Gly Ala Ala Asn Phe Tyr Gln Lys Lys Gly

 80                  85                  90
AAG CAC ATC ATC ACC AGC AAA ACC GAA CAC AAA GCG GTA CTG GAT ACC    937
Lys His Ile Ile Thr Ser Lys Thr Glu His Lys Ala Val Leu Asp Thr
 95                 100                 105                 110
TGC CGT CAG CTG GAG CGC GAA GGT TTT GAA GTC ACC TAC CTG GCA CCG    985
Cys Arg Gln Leu Glu Arg Glu Gly Phe Glu Val Thr Tyr Leu Ala Pro

            115                 120                 125
CAG CGT AAC GGC ATT ATC GAC CTG AAA GAA CTT GAA GCA GCG ATG CGT    1033
Gln Arg Asn Gly Ile Ile Asp Leu Lys Glu Leu Glu Ala Ala Met Arg

        130                 135                 140
GAC GAC ACC ATC CTC GTG TCC ATC ATG CAC GTA AAT AAC GAA ATC GGC    1081
Asp Asp Thr Ile Leu Val Ser Ile Met His Val Asn Asn Glu Ile Gly

    145                 150                 155
GTG GTG CAG GAT ATC GCG GCT ATC GGC GAA ATG TGC CGT GCT CGT GGC    1129
Val Val Gln Asp Ile Ala Ala Ile Gly Glu Met Cys Arg Ala Arg Gly

160                 165                 170
ATT ATC TAT CAC GTT GAT GCA ACC CAG AGC GTG GGT AAA CTG CCT ATC    1177
Ile Ile Tyr His Val Asp Ala Thr Gln Ser Val Gly Lys Leu Pro Ile
175                 180                 185                 190
GAC CTG AGC CAG TTG AAA GTT GAC CTG ATG TCT TTC TCC GGT CAC AAA   1225
Asp Leu Ser Gln Leu Lys Val Asp Leu Met Ser Phe Ser Gly His Lys

            195                 200                 205
ATC TAT GGC CCG AAA GGT ATC GGT GCG CTG TAT GTA CGT CGT AAA CCG   1273
Ile Tyr Gly Pro Lys Gly Ile Gly Ala Leu Tyr Val Arg Arg Lys Pro

        210                 215                 220
CGC GTA CGC ATC GAA GCG CAA ATG CAC GGC GGC GGT CAC GAG CGC GGT   1321
Arg Val Arg Ile Glu Ala Gln Met His Gly Gly Gly His Glu Arg Gly

    225                 230                 235
ATG CGT TCC GGC ACT CTG CCT GTT CAC CAG ATC GTC GGA ATG GGC GAG   1369
Met Arg Ser Gly Thr Leu Pro Val His Gln Ile Val Gly Met Gly Glu

240                 245                 250
GCC TAT CGC ATC GCA AAA GAA GAG ATG GCG ACC GAG ATG GAA CGT CTG   1417
Ala Tyr Arg Ile Ala Lys Glu Glu Met Ala Thr Glu Met Glu Arg Leu
255                 260                 265                 270
CGC GGC CTG CGT AAC CGT CTG TGG AAC GGC ATC AAA GAT ATC GAA GAA   1465
Arg Gly Leu Arg Asn Arg Leu Trp Asn Gly Ile Lys Asp Ile Glu Glu

            275                 280                 285
GTT TAC CTG AAC GGT GAC CTG GAA CAC GGT GCG CCG AAC ATT CTC AAC   1513
Val Tyr Leu Asn Gly Asp Leu Glu His Gly Ala Pro Asn Ile Leu Asn

        290                 295                 300
GTC AGC TTC AAC TAC GTT GAA GGT GAG TCG CTG ATT ATG GCG CTG AAA   1561
Val Ser Phe Asn Tyr Val Glu Gly Glu Ser Leu Ile Met Ala Leu Lys

    305                 310                 315
GAC CTC GCA GTT TCT TCA GGT TCC GCC TGT ACG TCA GCA AGC CTC GAA   1609
Asp Leu Ala Val Ser Ser Gly Ser Ala Cys Thr Ser Ala Ser Leu Glu

320                 325                 330
CCG TCC TAC GTG CTG CGC GCG CTG GGG CTG AAC GAC GAG CTG GCA CAT   1657
Pro Ser Tyr Val Leu Arg Ala Leu Gly Leu Asn Asp Glu Leu Ala His
335                 340                 345                 350
AGC TCT ATC CGT TTC TCT TTA GGT CGT TTT ACT ACT GAA GAA GAG ATC   1705
Ser Ser Ile Arg Phe Ser Leu Gly Arg Phe Thr Thr Glu Glu Glu Ile

            355                 360                 365
GAC TAC ACC ATC GAG TTA GTT CGT AAA TCC ATC GGT CGT CTG CGT GAC   1753
Asp Tyr Thr Ile Glu Leu Val Arg Lys Ser Ile Gly Arg Leu Arg Asp

        370                 375                 380
CTT TCT CCG CTG TGG GAA ATG TAC AAG CAG GGC GTG GAT CTG AAC AGC   1801
Leu Ser Pro Leu Trp Glu Met Tyr Lys Gln Gly Val Asp Leu Asn Ser

    385                 390                 395
ATC GAA TGG GCT CAT CAT TAAACGCGTG CTAGAGGCAT CAAATAAAAC              1849
Ile Glu Trp Ala His His

400                 405
GAAAGGCTCA GTCGAAAGAC TGGGCCTTTC GTTTTATCTG TTGTTTGTCG GTGAACGCTC     1909
TCCTGAGTAG GACAAATCCG CCGCCCTAGA CCTAGGGGAT ATATTCCGCT TCCTCGCTCA     1969
CTGACTCGCT ACGCTCGGTC GTTCGACTGC GGCGAGCGGA AATGGCTTAC GAACGGGGCG     2029
GAGATTTCCT GGAAGATGCC AGGAAGATAC TTAACAGGGA AGTGAGAGGG CCGCGGCAAA     2089
GCCGTTTTTC CATAGGCTCC GCCCCCCTGA CAAGCATCAC GAAATCTGAC GCTCAAATCA     2149
GTGGTGGCGA AACCCGACAG GACTATAAAG ATACCAGGCG TTTCCCCCTG GCGGCTCCCT     2209
CGTGCGCTCT CCTGTTCCTG CCTTTCGGTT TACCGGTGTC ATTCCGCTGT TATGGCCGCG     2269
TTTGTCTCAT TCCACGCCTG ACACTCAGTT CCGGGTAGGC AGTTCGCTCC AAGCTGGACT     2329
GTATGCACGA ACCCCCCGTT CAGTCCGACC GCTGCGCCTT ATCCGGTAAC TATCGTCTTG     2389
AGTCCAACCC GGAAAGACAT GCAAAAGCAC CACTGGCAGC AGCCACTGGT AATTGATTTA     2449
GAGGAGTTAG TCTTGAAGTC ATGCGCCGGT TAAGGCTAAA CTGAAAGGAC AAGTTTTGGT     2509
GACTGCGCTC CTCCAAGCCA GTTACCTCGG TTCAAAGAGT TGGTAGCTCA GAGAACCTTC     2569
GAAAAACCGC CCTGCAAGGC GGTTTTTTCG TTTTCAGAGC AAGAGATTAC GCGCAGACCA     2629
AAACGATCTC AAGAAGATCA TCTTATTAAT CAGATAAAAT ATTTCTAGAT TTCAGTGCAA     2689
TTTATCTCTT CAAATGTAGC ACCTGAAGTC AGCCCCATAC GATATAAGTT GTTACTAGTG     2749
CTTGGATTCT CACCAATAAA AAACGCCCGG CGGCAACCGA GCGTTCTGAA CAAATCCAGA     2809
TGGAGTTCTG AGGTCATTAC TGGATCTATC AACAGGAGTC CAAGCGAGCT CTCGAACCCC     2869
AGAGTCCCGC TCAGAAGAAC TCGTCAAGAA GGCGATAGAA GGCGATGCGC TGCGAATCGG     2929
GAGCGGCGAT ACCGTAAAGC ACGAGGAAGC GGTCAGCCCA TTCGCCGCCA AGCTCTTCAG     2989
CAATATCACG GGTAGCCAAC GCTATGTCCT GATAGCGGTC CGCCACACCC AGCCGGCCAC     3049
AGTCGATGAA TCCAGAAAAG CGGCCATTTT CCACCATGAT ATTCGGCAAG CAGGCATCGC     3109
CATGGGTCAC GACGAGATCC TCGCCGTCGG GCATGCGCGC CTTGAGCCTG GCGAACAGTT     3169
CGGCTGGCGC GAGCCCCTGA TGCTCTTCGT CCAGATCATC CTGATCGACA AGACCGGCTT     3229
CCATCCGAGT ACGTGCTCGC TCGATGCGAT GTTTCGCTTG GTGGTCGAAT GGGCAGGTAG     3289
CCGGATCAAG CGTATGCAGC CGCCGCATTG CATCAGCCAT GATGGATACT TTCTCGGCAG     3349
GAGCAAGGTG AGATGACAGG AGATCCTGCC CCGGCACTTC GCCCAATAGC AGCCAGTCCC     3409
TTCCCGCTTC AGTGACAACG TCGAGCACAG CTGCGCAAGG AACGCCCGTC GTGGCCAGCC     3469
ACGATAGCCG CGCTGCCTCG TCCTGCAGTT CATTCAGGGC ACCGGACAGG TCGGTCTTGA   3529
CAAAAAGAAC CGGGCGCCCC TGCGCTGACA GCCGGAACAC GGCGGCATCA GAGCAGCCGA   3589
TTGTCTGTTG TGCCCAGTCA TAGCCGAATA GCCTCTCCAC CCAAGCGGCC GGAGAACCTG   3649
CGTGCAATCC ATCTTGTTCA ATCATGCGAA ACGATCCTCA TCCTGTCTCT TGATCAGATC   3709
TTGATCCCCT GCGCCATCAG ATCCTTGGCG GCAAGAAAGC CATCCAGTTT ACTTTGCAGG   3769
GCTTCCCAAC CTTACCAGAG GGCGCCCCAG CTGGCAATTC C                       3810

(2)SEQ ID NO:8的信息:

  (i)序列特征:

   (A)长度:404个氨基酸

   (B)类型:氨基酸

   (D)拓扑结构:线性

  (ii)分子类型:蛋白质

  (xi)序列描述:SEQ ID NO:8:
Met Lys Leu Pro Ile Tyr Leu Asp Tyr Ser Ala Thr Thr Pro Val Asp
  1               5                  10                  15
Pro Arg Val Ala Glu Lys Met Met Gln Phe Met Thr Met Asp Gly Thr

         20                  25                  30
Phe Gly Asn Pro Ala Ser Arg Ser His Arg Phe Gly Trp Gln Ala Glu

     35                  40                  45
Glu Ala Val Asp Ile Ala Arg Asn Gln Ile Ala Asp Leu Val Gly Ala

 50                  55                  60
Asp Pro Arg Glu Ile Val phe Thr Ser Gly Ala Thr Glu Ser Asp Asn
 65                  70                  75                  80
Leu Ala Ile Lys Gly Ala Ala Asn Phe Tyr Gln Lys Lys Gly Lys His

             85                  90                  95
Ile Ile Thr Ser Lys Thr Glu His Lys Ala Val Leu Asp Thr Cys Arg

        100                 105                 110
Gln Leu Glu Arg Glu Gly phe Glu Val Thr Tyr Leu Ala Pro Gln Arg

    115                 120                 125
Asn Gly Ile Ile Asp Leu Lys Glu Leu Glu Ala Ala Met Arg Asp Asp

130                 135                 140
Thr Ile Leu Val Ser Ile Met His Val Asn Asn Glu Ile Gly Val Val
145                 150                 155                 160
Gln Asp Ile Ala Ala Ile Gly Glu Met Cys Arg Ala Arg Gly Ile Ile

            165                 170                 175
Tyr His Val Asp Ala Thr Gln Ser Val Gly Lys Leu Pro Ile Asp Leu

        180                 185                 190
Ser Gln Leu Lys Val Asp Leu Met Ser Phe Ser Gly His Lys Ile Tyr

    195                 200                 205
Gly Pro Lys Gly Ile Gly Ala Leu Tyr Val Arg Arg Lys Pro Arg Val

210                 215                 220
Arg Ile Glu Ala Gln Met His Gly Gly Gly His Glu Arg Gly Met Arg
225                 230                 235                 240
Ser Gly Thr Leu Pro Val His Gln Ile Val Gly Met Gly Glu Ala Tyr

            245                 250                 255
Arg Ile Ala Lys Glu Glu Met Ala Thr Glu Met Glu Arg Leu Arg Gly

        260                 265                 270
Leu Arg Asn Arg Leu Trp Asn Gly Ile Lys Asp Ile Glu Glu Val Tyr

    275                 280                 285
Leu Asn Gly Asp Leu Glu His Gly Ala Pro Asn Ile Leu Asn Val Ser

290                 295                 300
Phe Asn Tyr Val Glu Gly Glu Ser Leu Ile Met Ala Leu Lys Asp Leu
305                 310                 315                 320
Ala Val Ser Ser Gly Ser Ala Cys Thr Ser Ala Ser Leu Glu Pro Ser

            325                 330                 335
Tyr Val Leu Arg Ala Leu Gly Leu Asn Asp Glu Leu Ala His Ser Ser

        340                 345                 350
Ile Arg Phe Ser Leu Gly Arg Phe Thr Thr Glu Glu Glu Ile Asp Tyr

    355                 360                 365
Thr Ile Glu Leu Val Arg Lys Ser Ile Gly Arg Leu Arg Asp Leu Ser

370                 375                 380
Pro Leu Trp Glu Met Tyr Lys Gln Gly Val Asp Leu Asn Ser Ile Glu
385                 390                 395                 400
Trp Ala His His

(2)SEQ ID NO:9的信息:

   (i)序列特征:

    (A)长度:3465个碱基对

    (B)类型:核酸

    (C)链型:单链

    (D)拓扑结构:环状

   (ii)分子类型:DNA(基因组)

   (iii)假拟结构:无

   (iv)反义:无

   (vii)直接来源:

    (B)克隆:pHS2bioSl

   (ix)特征:

    (A)名称/关键词:CDS

    (B)位置:272..1477

   (xi)序列描述:SEQ ID NO:9:
GACGTCTAAG AAACCATTAT TATCATGACA TTAACCTATA AAAATAGGCG TATCACGAGG   60
CCCTTTCGTC TTCACCTCGA GTCCCTATCA GTGATAGAGA TTGACATCCC TATCAGTGAT  120
AGAGATACTG AGCACATCAG CAGGACGCAC TGACCGAATT CATTAAAGAG GAGAAAGGTA  180
CCGGGCCCCC CCTCGAGGTC GACGGTATCG ATAAGCTTGA TATCGAATTC CTGCAGCCCG  240
GGGGATCCCA TGGTACGCGT CGAGGAGTAC C ATG AAC GTT TTT AAT CCC GCG     292

                               Met Asn Val Phe Asn Pro Ala

                                 1               5
CAG TTT CGC GCC CAG TTT CCC GCA CTA CAG GAT GCG GGC GTC TAT CTC    340
Gln Phe Arg Ala Gln Phe Pro Ala Leu Gln Asp Ala Gly Val Tyr Leu

     10                  15                  20
GAC AGC GCC GCG ACC GCG CTT AAA CCT GAA GCC GTG GTT GAA GCC ACC    388
Asp Ser Ala Ala Thr Ala Leu Lys Pro Glu Ala Val Val Glu Ala Thr

 25                  30                  35
CAA CAG TTT TAC AGT CTG AGC GCC GGA AAC GTC CAT CGC AGC CAG TTT    436
Gln Gln phe Tyr Ser Leu Ser Ala Gly Asn Val His Arg Ser Gln Phe
 40                  45                  50                  55
GCC GAA GCC CAA CGC CTG ACC GCG CGT TAT GAA GCT GCA CGA GAG AAA    484
Ala Glu Ala Gln Arg Leu Thr Ala Arg Tyr Glu Ala Ala Arg Glu Lys

             60                  65                  70
GTG GCG CAA TTA CTG AAT GCA CCG GAT GAT AAA ACT ATC GTC TGG ACG   532
Val Ala Gln Leu Leu Asn Ala Pro Asp Asp Lys Thr Ile Val Trp Thr

         75                      80                      85
CGC GGC ACC ACT GAA TCC ATC AAC ATG GTG GCA CAA TGC TAT GCG CGT   580
Arg Gly Thr Thr Glu Ser Ile Asn Met Val Ala Gln Cys Tyr Ala Arg

     90                  95                 100
CCG CGT CTG CAA CCG GGC GAT GAG ATT ATT GTC AGC GTG GCA GAA CAC   628
Pro Arg Leu Gln Pro Gly Asp Glu Ile Ile Val Ser Val Ala Glu His

105                 110                 115
CAC GCC AAC CTC GTC CCC TGG CTG ATG GTC GCC CAA CAA ACT GGA GCC   676
His Ala Asn Leu Val Pro Trp Leu Met Val Ala Gln Gln Thr Gly Ala
120                 125                 130                 135
AAA GTG GTG AAA TTG CCG CTT AAT GCG CAG CGA CTG CCG GAT GTC GAT   724
Lys Val Val Lys Leu Pro Leu Asn Ala Gln Arg Leu Pro Asp Val Asp

            140                 145                 150
TTG TTG CCA GAA CTG ATT ACT CCC CGT AGT CGG ATT CTG GCG TTG GGT   772
Leu Leu Pro Glu Leu Ile Thr Pro Arg Ser Arg Ile Leu Ala Leu Gly

        155                 160                 165
CAG ATG TCG AAC GTT ACT GGC GGT TGC CCG GAT CTG GCG CGA GCG ATT   820
Gln Met Ser Asn Val Thr Gly Gly Cys Pro Asp Leu Ala Arg Ala Ile

    170                 175                 180
ACC TTT GCT CAT TCA GCC GGG ATG GTG GTG ATG GTT GAT GGT GCT CAG   868
Thr Phe Ala His Ser Ala Gly Met Val Val Met Val Asp Gly Ala Gln

185                 190                 195
GGG GCA GTG CAT TTC CCC GCG GAT GTT CAG CAA CTG GAT ATT GAT TTC   916
Gly Ala Val His Phe Pro Ala Asp Val Gln Gln Leu Asp Ile Asp Phe
200                 205                 210                 215
TAT GCT TTT TCA GGT CAC AAA CTG TAT GGC CCG ACA GGT ATC GGC GTG   964
Tyr Ala Phe Ser Gly His Lys Leu Tyr Gly Pro Thr Gly Ile Gly Val

            220                 225                 230
CTG TAT GGT AAA TCA GAA CTG CTG GAG GCG ATG TCG CCC TGG CTG GGC   1012
Leu Tyr Gly Lys Ser Glu Leu Leu Glu Ala Met Ser Pro Trp Leu Gly

        235                 240                 245
GGC GGC AAA ATG GTT CAC GAA GTG AGT TTT GAC GGC TTC ACG ACT CAA   1060
Gly Gly Lys Met Val His Glu Val Ser Phe Asp Gly Phe Thr Thr Gln

    250                 255                 260
TCT GCG CCG TGG AAA CTG GAA GCT GGA ACG CCA AAT GTC GCT GGT GTC   1108
Ser Ala Pro Trp Lys Leu Glu Ala Gly Thr Pro Asn Val Ala Gly Val

265                 270                 275
ATA GGA TTA AGC GCG GCG CTG GAA TGG CTG GCA GAT TAC GAT ATC AAC   1156
Ile Gly Leu Ser Ala Ala Leu Glu Trp Leu Ala Asp Tyr Asp Ile Asn
280                 285                 290                 295
CAG GCC GAA AGC TGG AGC CGT AGC TTA GCA ACG CTG GCG GAA GAT GCG   1204
Gln Ala Glu Ser Trp Ser Arg Ser Leu Ala Thr Leu Ala Glu Asp Ala

            300                 305                 310
CTG GCG AAA CGT CCC GGC TTT CGT TCA TTC CGC TGC CAG GAT TCC AGC   1252
Leu Ala Lys Arg Pro Gly Phe Arg Ser Phe Arg Cys Gln Asp Ser Ser

        315                 320                 325
CTG CTG GCC TTT GAT TTT GCT GGC GTT CAT CAT AGC GAT ATG GTG ACG   1300
Leu Leu Ala Phe Asp Phe Ala Gly Val His His Ser Asp Met Val Thr

    330                 335                 340
CTG CTG GCG GAG TAC GGT ATT GCC CTG CGG GCC GGG CAG CAT TGC GCT   1348
Leu Leu Ala Glu Tyr Gly Ile Ala Leu Arg Ala Gly Gln His Cys Ala

345                 350                 355
CAG CCG CTA CTG GCA GAA TTA GGC GTA ACC GGC ACA CTG CGC GCC TCT   1396
Gln Pro Leu Leu Ala Glu Leu Gly Val Thr Gly Thr Leu Arg Ala Ser
360                 365                 370                 375
TTT GCG CCA TAT AAT ACA AAG AGT GAT GTG GAT GCG CTG GTG AAT GCC   1444
Phe Ala Pro Tyr Asn Thr Lys Ser Asp Val Asp Ala Leu Val Asn Ala

            380                 385                 390
GTT GAC CGC GCG CTG GAA TTA TTG GTG GAT TAAACGCGTG CTAGAGGCAT     1494
Val Asp Arg Ala Leu Glu Leu Leu Val Asp

        395                 400
CAAATAAAAC GAAAGGCTCA GTCGAAAGAC TGGGCCTTTC GTTTTATCTG TTGTTTGTCG 1554
GTGAACGCTC TCCTGAGTAG GACAAATCCG CCGCCCTAGA CCTAGGGGAT ATATTCCGCT 1614
TCCTCGCTCA CTGACTCGCT ACGCTCGGTC GTTCGACTGC GGCGAGCGGA AATGGCTTAC 1674
GAACGGGGCG GAGATTTCCT GGAAGATGCC AGGAAGATAC TTAACAGGGA AGTGAGAGGG 1734
CCGCGGCAAA GCCGTTTTTC CATAGGCTCC GCCCCCCTGA CAAGCATCAC GAAATCTGAC 1794
GCTCAAATCA GTGGTGGCGA AACCCGACAG GACTATAAAG ATACCAGGCG TTTCCCCCTG 1854
GCGGCTCCCT CGTGCGCTCT CCTGTTCCTG CCTTTCGGTT TACCGGTGTC ATTCCGCTGT 1914
TATGGCCGCG TTTGTCTCAT TCCACGCCTG ACACTCAGTT CCGGGTAGGC AGTTCGCTCC 1974
AAGCTGGACT GTATGCACGA ACCCCCCGTT CAGTCCGACC GCTGCGCCTT ATCCGGTAAC 2034
TATCGTCTTG AGTCCAACCC GGAAAGACAT GCAAAAGCAC CACTGGCAGC AGCCACTGGT 2094
AATTGATTTA GAGGAGTTAG TCTTGAAGTC ATGCGCCGGT TAAGGCTAAA CTGAAAGGAC 2154
AAGTTTTGGT GACTGCGCTC CTCCAAGCCA GTTACCTCGG TTCAAAGAGT TGGTAGCTCA 2214
GAGAACCTTC GAAAAACCGC CCTGCAAGGC GGTTTTTTCG TTTTCAGAGC AAGAGATTAC 2274
GCGCAGACCA AAACGATCTC AAGAAGATCA TCTTATTAAT CAGATAAAAT ATTTCTAGAT 2334
TTCAGTGCAA TTTATCTCTT CAAATGTAGC ACCTGAAGTC AGCCCCATAC GATATAAGTT 2394
GTTACTAGTG CTTGGATTCT CACCAATAAA AAACGCCCGG CGGCAACCGA GCGTTCTGAA 2454
CAAATCCAGA TGGAGTTCTG AGGTCATTAC TGGATCTATC AACAGGAGTC CAAGCGAGCT 2514
CTCGAACCCC AGAGTCCCGC TCAGAAGAAC TCGTCAAGAA GGCGATAGAA GGCGATGCGC 2574
TGCGAATCGG GAGCGGCGAT ACCGTAAAGC ACGAGGAAGC GGTCAGCCCA TTCGCCGCCA  2634
AGCTCTTCAG CAATATCACG GGTAGCCAAC GCTATGTCCT GATAGCGGTC CGCCACACCC  2694
AGCCGGCCAC AGTCGATGAA TCCAGAAAAG CGGCCATTTT CCACCATGAT ATTCGGCAAG  2754
CAGGCATCGC CATGGGTCAC GACGAGATCC TCGCCGTCGG GCATGCGCGC CTTGAGCCTG  2814
GCGAACAGTT CGGCTGGCGC GAGCCCCTGA TGCTCTTCGT CCAGATCATC CTGATCGACA  2874
AGACCGGCTT CCATCCGAGT ACGTGCTCGC TCGATGCGAT GTTTCGCTTG GTGGTCGAAT  2934
GGGCAGGTAG CCGGATCAAG CGTATGCAGC CGCCGCATTG CATCAGCCAT GATGGATACT  2994
TTCTCGGCAG GAGCAAGGTG AGATGACAGG AGATCCTGCC CCGGCACTTC GCCCAATAGC  3054
AGCCAGTCCC TTCCCGCTTC AGTGACAACG TCGAGCACAG CTGCGCAAGG AACGCCCGTC  3114
GTGGCCAGCC ACGATAGCCG CGCTGCCTCG TCCTGCAGTT CATTCAGGGC ACCGGACAGG  3174
TCGGTCTTGA CAAAAAGAAC CGGGCGCCCC TGCGCTGACA GCCGGAACAC GGCGGCATCA  3234
GAGCAGCCGA TTGTCTGTTG TGCCCAGTCA TAGCCGAATA GCCTCTCCAC CCAAGCGGCC  3294
GGAGAACCTG CGTGCAATCC ATCTTGTTCA ATCATGCGAA ACGATCCTCA TCCTGTCTCT  3354
TGATCAGATC TTGATCCCCT GCGCCATCAG ATCCTTGGCG GCAAGAAAGC CATCCAGTTT  3414
ACTTTGCAGG GCTTCCCAAC CTTACCAGAG GGCGCCCCAG CTGGCAATTC C           3465
  (2)SEQ ID NO:10的信息:

(i)序列特征:

 (A)长度:401个氨基酸

 (B)类型:氨基酸

 (D)拓扑结构:线性

(ii)分子类型:蛋白质

(xi)序列描述:SEQ ID NO:10:
Met Asn Val Phe Asn Pro Ala Gln Phe Arg Ala Gln Phe Pro Ala Leu
  1               5                  10                  15
Gln Asp Ala Gly Val Tyr Leu Asp Ser Ala Ala Thr Ala Leu Lys Pro

         20                  25                  30
Glu Ala Val Val Glu Ala Thr Gln Gln Phe Tyr Ser Leu Ser Ala Gly

     35                  40                  45
Asn Val His Arg Ser Gln Phe Ala Glu Ala Gln Arg Leu Thr Ala Arg

 50                  55                  60
Tyr Glu Ala Ala Arg Glu Lys Val Ala Gln Leu Leu Asn Ala Pro Asp
 65                  70                  75                  80
Asp Lys Thr Ile Val Trp Thr Arg Gly Thr Thr Glu Ser Ile Asn Met

             85                  90                  95
Val Ala Gln Cys Tyr Ala Arg Pro Arg Leu Gln Pro Gly Asp Glu Ile

        100                 105                 110
Ile Val Ser Val Ala Glu His His Ala Asn Leu Val Pro Trp Leu Met

    115                 120                 125
Val Ala Gln Gln Thr Gly Ala Lys Val Val Lys Leu Pro Leu Asn Ala

130                 135                 140
Gln Arg Leu Pro Asp Val Asp Leu Leu Pro Glu Leu Ile Thr Pro Arg
145                 150                 155                 160
Ser Arg Ile Leu Ala Leu Gly Gln Met Ser Asn Val Thr Gly Gly Cys

            165                 170                 175
Pro Asp Leu Ala Arg Ala Ile Thr Phe Ala His Ser Ala Gly Met Val

        180                 185                 190
Val Met Val Asp Gly Ala Gln Gly Ala Val His Phe Pro Ala Asp Val

    195                 200                 205
Gln Gln Leu Asp Ile Asp Phe Tyr Ala Phe Ser Gly His Lys Leu Tyr

210                 215                 220
Gly Pro Thr Gly Ile Gly Val Leu Tyr Gly Lys Ser Glu Leu Leu Glu
225                 230                 235                 240
Ala Met Ser Pro Trp Leu Gly Gly Gly Lys Met Val His Glu Val Ser

            245                 250                 255
Phe Asp Gly Phe Thr Thr Gln Ser Ala Pro Trp Lys Leu Glu Ala Gly

        260                 265                 270
Thr Pro Asn Val Ala Gly Val Ile Gly Leu Ser Ala Ala Leu Glu Trp

    275                 280                 285
Leu Ala Asp Tyr Asp Ile Asn Gln Ala Glu Ser Trp Ser Arg Ser Leu

290                 295                 300
Ala Thr Leu Ala Glu Asp Ala Leu Ala Lys Arg Pro Gly Phe Arg Ser
305                 310                 315                 320
Phe Arg Cys Gln Asp Ser Ser Leu Leu Ala Phe Asp Phe Ala Gly Val

            325                 330                 335
His His Ser Asp Met Val Thr Leu Leu Ala Glu Tyr Gly Ile Ala Leu

        340                 345                 350
Arg Ala Gly Gln His Cys Ala Gln Pro Leu Leu Ala Glu Leu Gly Val

    355                 360                 365
Thr Gly Thr Leu Arg Ala Ser Phe Ala Pro Tyr Asn Thr Lys Ser Asp

370                 375                 380
Val Asp Ala Leu Val Asn Ala Val Asp Arg Ala Leu Glu Leu Leu Val
385                 390                 395                 400
Asp
  (2)SEQ ID NO:11的信息:

(i)序列特征:

 (A)长度:3481个碱基对

 (B)类型:核酸

 (C)链型:单链

 (D)拓扑结构:环状

(ii)分子类型:DNA(基因组)

(iii)假拟结构:无

(iv)反义:无

(vi)直接来源:

 (B)克隆:pHS2bioS2

(ix)特征:

 (A)名称/关键词:CDS

 (B)位置:279..1493

(xi)序列描述:SEQ ID NO:11:
GACGTCTAAG AAACCATTAT TATCATGACA TTAACCTATA AAAATAGGCG TATCACGAGG   60
CCCTTTCGTC TTCACCTCGA GTCCCTATCA GTGATAGAGA TTGACATCCC TATCAGTGAT  120
AGAGATACTG AGCACATCAG CAGGACGCAC TGACCGAATT CATTAAAGAG GAGAAAGGTA  180
CCGGGCCCCC CCTCGAGGTC GACGGTATCG ATAAGCTTGA TATCGAATTC CTGCAGCCCG  240
GGGGATCCCA TGGTACGCGT AAAGAGGAGA AATTAACT ATG AAA TTA CCG ATT      293

                                      Met Lys Leu Pro Ile

                                        1               5
TAT CTC GAC TAC TCC GCA ACC ACG CCG GTG GAC CCG CGT GTT GCC GAG    341
Tyr Leu Asp Tyr Ser Ala Thr Thr Pro Val Asp Pro Arg Val Ala Glu

             10                  15                  20
AAA ATG ATG CAG TTT ATG ACG ATG GAC GGA ACC TTT GGT AAC CCG GCC  389
Lys Met Met Gln Phe Met Thr Met Asp Gly Thr Phe Gly Asn Pro Ala

         25                  30                  35
TCC CGT TCT CAC CGT TTC GGC TGG CAG GCT GAA GAA GCG GTA GAT ATC  437
Ser Arg Ser His Arg Phe Gly Trp Gln Ala Glu Glu Ala Val Asp Ile

     40                  45                  50
GCC CGT AAT CAG ATT GCC GAT CTG GTC GGC GCT GAT CCG CGT GAA ATC  485
Ala Arg Asn Gln Ile Ala Asp Leu Val Gly Ala Asp Pro Arg Glu Ile

 55                  60                  65
GTC TTT ACC TCT GGT GCA ACC GAA TCT GAC AAC CTG GCG ATC AAA GGT  533
Val Phe Thr Ser Gly Ala Thr Glu Ser Asp Asn Leu Ala Ile Lys Gly
 70                  75                  80                  85
GCA GCC AAC TTT TAT CAG AAA AAA GGC AAG CAC ATC ATC ACC AGC AAA  581
Ala Ala Asn Phe Tyr Gln Lys Lys Gly Lys His Ile Ile Thr Ser Lys

             90                  95                 100
ACC GAA CAC AAA GCG GTA CTG GAT ACC TGC CGT CAG CTG GAG CGC GAA  629
Thr Glu His Lys Ala Val Leu Asp Thr Cys Arg Gln Leu Glu Arg Glu

        105                 110                 115
GGT TTT GAA GTC ACC TAC CTG GCA CCG CAG CGT AAC GGC ATT ATC GAC  677
Gly Phe Glu Val Thr Tyr Leu Ala Pro Gln Arg Asn Gly Ile Ile Asp

    120                 125                 130
CTG AAA GAA CTT GAA GCA GCG ATG CGT GAC GAC ACC ATC CTC GTG TCC  725
Leu Lys Glu Leu Glu Ala Ala Met Arg Asp Asp Thr Ile Leu Val Ser

135                 140                 145
ATC ATG CAC GTA AAT AAC GAA ATC GGC GTG GTG CAG GAT ATC GCG GCT  773
Ile Met His Val Asn Asn Glu Ile Gly Val Val Gln Asp Ile Ala Ala
150                 155                 160                 165
ATC GGC GAA ATG TGC CGT GCT CGT GGC ATT ATC TAT CAC GTT GAT GCA  821
Ile Gly Glu Met Cys Arg Ala Arg Gly Ile Ile Tyr His Val Asp Ala

            170                 175                 180
ACC CAG AGC GTG GGT AAA CTG CCT ATC GAC CTG AGC CAG TTG AAA GTT  869
Thr Gln Ser Val Gly Lys Leu Pro Ile Asp Leu Ser Gln Leu Lys Val

        185                 190                 195
GAC CTG ATG TCT TTC TCC GGT CAC AAA ATC TAT GGC CCG AAA GGT ATC  917
Asp Leu Met Ser Phe Ser Gly His Lys Ile Tyr Gly Pro Lys Gly Ile

    200                 205                 210
GGT GCG CTG TAT GTA CGT CGT AAA CCG CGC GTA CGC ATC GAA GCG CAA  965
Gly Ala Leu Tyr Val Arg Arg Lys Pro Arg Val Arg Ile Glu Ala Gln

215                 220                 225
ATG CAC GGC GGC GGT CAC GAG CGC GGT ATG CGT TCC GGC ACT CTG CCT  1013
Met His Gly Gly Gly His Glu Arg Gly Met Arg Ser Gly Thr Leu Pro
230                 235                 240                 245
GTT CAC CAG ATC GTC GGA ATG GGC GAG GCC TAT CGC ATC GCA AAA GAA    1061
Val His Gln Ile Val Gly Met Gly Glu Ala Tyr Arg Ile Ala Lys Glu

            250                 255                 260
GAG ATG GCG ACC GAG ATG GAA CGT CTG CGC GGC CTG CGT AAC CGT CTG    1109
Glu Met Ala Thr Glu Met Glu Arg Leu Arg Gly Leu Arg Asn Arg Leu

        265                 270                 275
TGG AAC GGC ATC AAA GAT ATC GAA GAA GTT TAC CTG AAC GGT GAC CTG    1157
Trp Asn Gly Ile Lys Asp Ile Glu Glu Val Tyr Leu Asn Gly Asp Leu

    280                 285                 290
GAA CAC GGT GCG CCG AAC ATT CTC AAC GTC AGC TTC AAC TAC GTT GAA    1205
Glu His Gly Ala Pro Asn Ile Leu Asn Val Ser Phe Asn Tyr Val Glu

295                 300                 305
GGT GAG TCG CTG ATT ATG GCG CTG AAA GAC CTC GCA GTT TCT TCA GGT    1253
Gly Glu Ser Leu Ile Met Ala Leu Lys Asp Leu Ala Val Ser Ser Gly
310                 315                 320                 325
TCC GCC TGT ACG TCA GCA AGC CTC GAA CCG TCC TAC GTG CTG CGC GCG    1301
Ser Ala Cys Thr Ser Ala Ser Leu Glu Pro Ser Tyr Val Leu Arg Ala

            330                 335                 340
CTG GGG CTG AAC GAC GAG CTG GCA CAT AGC TCT ATC CGT TTC TCT TTA    1349
Leu Gly Leu Asn Asp Glu Leu Ala His Ser Ser Ile Arg Phe Ser Leu

        345                 350                 355
GGT CGT TTT ACT ACT GAA GAA GAG ATC GAC TAC ACC ATC GAG TTA GTT    1397
Gly Arg Phe Thr Thr Glu Glu Glu Ile Asp Tyr Thr Ile Glu Leu Val

    360                 365                 370
CGT AAA TCC ATC GGT CGT CTG CGT GAC CTT TCT CCG CTG TGG GAA ATG    1445
Arg Lys Ser Ile Gly Arg Leu Arg Asp Leu Ser Pro Leu Trp Glu Met

375                 380                 385
TAC AAG CAG GGC GTG GAT CTG AAC AGC ATC GAA TGG GCT CAT CAT TAAACGCGTG 1500
Tyr Lys Gln Gly Val Asp Leu Asn Ser Ile Glu Trp Ala His His
390                 395                 400                 405
CTAGAGGCAT CAAATAAAAC GAAAGGCTCA GTCGAAAGAC TGGGCCTTTC GTTTTATCTG  1560
TTGTTTGTCG GTGAACGCTC TCCTGAGTAG GACAAATCCG CCGCCCTAGA CCTAGGGGAT  1620
ATATTCCGCT TCCTCGCTCA CTGACTCGCT ACGCTCGGTC GTTCGACTGC GGCGAGCGGA  1680
AATGGCTTAC GAACGGGGCG GAGATTTCCT GGAAGATGCC AGGAAGATAC TTAACAGGGA  1740
AGTGAGAGGG CCGCGGCAAA GCCGTTTTTC CATAGGCTCC GCCCCCCTGA CAAGCATCAC  1800
GAAATCTGAC GCTCAAATCA GTGGTGGCGA AACCCGACAG GACTATAAAG ATACCAGGCG  1860
TTTCCCCCTG GCGGCTCCCT CGTGCGCTCT CCTGTTCCTG CCTTTCGGTT TACCGGTGTC  1920
ATTCCGCTGT TATGGCCGCG TTTGTCTCAT TCCACGCCTG ACACTCAGTT CCGGGTAGGC  1980
AGTTCGCTCC AAGCTGGACT GTATGCACGA ACCCCCCGTT CAGTCCGACC GCTGCGCCTT  2040
ATCCGGTAAC TATCGTCTTG AGTCCAACCC GGAAAGACAT GCAAAAGCAC CACTGGCAGC  2100
AGCCACTGGT AATTGATTTA GAGGAGTTAG TCTTGAAGTC ATGCGCCGGT TAAGGCTAAA  2160
CTGAAAGGAC AAGTTTTGGT GACTGCGCTC CTCCAAGCCA GTTACCTCGG TTCAAAGAGT  2220
TGGTAGCTCA GAGAACCTTC GAAAAACCGC CCTGCAAGGC GGTTTTTTCG TTTTCAGAGC  2280
AAGAGATTAC GCGCAGACCA AAACGATCTC AAGAAGATCA TCTTATTAAT CAGATAAAAT  2340
ATTTCTAGAT TTCAGTGCAA TTTATCTCTT CAAATGTAGC ACCTGAAGTC AGCCCCATAC  2400
GATATAAGTT GTTACTAGTG CTTGGATTCT CACCAATAAA AAACGCCCGG CGGCAACCGA  2460
GCGTTCTGAA CAAATCCAGA TGGAGTTCTG AGGTCATTAC TGGATCTATC AACAGGAGTC  2520
CAAGCGAGCT CTCGAACCCC AGAGTCCCGC TCAGAAGAAC TCGTCAAGAA GGCGATAGAA  2580
GGCGATGCGC TGCGAATCGG GAGCGGCGAT ACCGTAAAGC ACGAGGAAGC GGTCAGCCCA  2640
TTCGCCGCCA AGCTCTTCAG CAATATCACG GGTAGCCAAC GCTATGTCCT GATAGCGGTC  2700
CGCCACACCC AGCCGGCCAC AGTCGATGAA TCCAGAAAAG CGGCCATTTT CCACCATGAT  2760
ATTCGGCAAG CAGGCATCGC CATGGGTCAC GACGAGATCC TCGCCGTCGG GCATGCGCGC  2820
CTTGAGCCTG GCGAACAGTT CGGCTGGCGC GAGCCCCTGA TGCTCTTCGT CCAGATCATC  2880
CTGATCGACA AGACCGGCTT CCATCCGAGT ACGTGCTCGC TCGATGCGAT GTTTCGCTTG  2940
GTGGTCGAAT GGGCAGGTAG CCGGATCAAG CGTATGCAGC CGCCGCATTG CATCAGCCAT  3000
GATGGATACT TTCTCGGCAG GAGCAAGGTG AGATGACAGG AGATCCTGCC CCGGCACTTC  3060
GCCCAATAGC AGCCAGTCCC TTCCCGCTTC AGTGACAACG TCGAGCACAG CTGCGCAAGG  3120
AACGCCCGTC GTGGCCAGCC ACGATAGCCG CGCTGCCTCG TCCTGCAGTT CATTCAGGGC  3180
ACCGGACAGG TCGGTCTTGA CAAAAAGAAC CGGGCGCCCC TGCGCTGACA GCCGGAACAC  3240
GGCGGCATCA GAGCAGCCGA TTGTCTGTTG TGCCCAGTCA TAGCCGAATA GCCTCTCCAC  3300
CCAAGCGGCC GGAGAACCTG CGTGCAATCC ATCTTGTTCA ATCATGCGAA ACGATCCTCA  3360
TCCTGTCTCT TGATCAGATC TTGATCCCCT GCGCCATCAG ATCCTTGGCG GCAAGAAAGC  3420
CATCCAGTTT ACTTTGCAGG GCTTCCCAAC CTTACCAGAG GGCGCCCCAG CTGGCAATTC  3480
C                                                                  3481
(2)SEQ ID NO:12的信息:

(i)序列特征:

 (A)长度:404个氨基酸

 (B)类型:氨基酸

 (D)拓扑结构:线性

(ii)分子类型:蛋白质

(xi)序列描述:SEQ ID NO:12:
Met Lys Leu Pro Ile Tyr Leu Asp Tyr Ser Ala Thr Thr Pro Val Asp
  1               5                  10                  15
Pro Arg Val Ala Glu Lys Met Met Gln Phe Met Thr Met Asp Gly Thr

         20                  25                  30
Phe Gly Asn Pro Ala Ser Arg Ser His Arg Phe Gly Trp Gln Ala Glu

     35                  40                  45
Glu Ala Val Asp Ile Ala Arg Asn Gln Ile Ala Asp Leu Val Gly Ala

 50                  55                  60
Asp Pro Arg Glu Ile Val Phe Thr Ser Gly Ala Thr Glu Ser Asp Asn
 65                  70                  75                  80
Leu Ala Ile Lys Gly Ala Ala Asn Phe Tyr Gln Lys Lys Gly Lys His

             85                  90                  95
Ile Ile Thr Ser Lys Thr Glu His Lys Ala Val Leu Asp Thr Cys Arg

        100                 105                 110
Gln Leu Glu Arg Glu Gly Phe Glu Val Thr Tyr Leu Ala Pro Gln Arg

    115                 120                 125
Asn Gly Ile Ile Asp Leu Lys Glu Leu Glu Ala Ala Met Arg Asp Asp

130                 135                 140
Thr Ile Leu Val Ser Ile Met His Val Asn Asn Glu Ile Gly Val Val
145                 150                 155                 160
Gln Asp Ile Ala Ala Ile Gly Glu Met Cys Arg Ala Arg Gly Ile Ile

            165                 170                 175
Tyr His Val Asp Ala Thr Gln Ser Val Gly Lys Leu Pro Ile Asp Leu

        180                 185                 190
Ser Gln Leu Lys Val Asp Leu Met Ser Phe Ser Gly His Lys Ile Tyr

    195                 200                 205
Gly Pro Lys Gly Ile Gly Ala Leu Tyr Val Arg Arg Lys Pro Arg Val

210                 215                             220
Arg Ile Glu Ala Gln Met His Gly Gly Gly His Glu Arg Gly Met Arg
225                 230                 235                 240
Ser Gly Thr Leu Pro Val His Gln Ile Val Gly Met Gly Glu Ala Tyr

            245                 250                 255
Arg Ile Ala Lys Glu Glu Met Ala Thr Glu Met Glu Arg Leu Arg Gly

        260                 265                 270
Leu Arg Asn Arg Leu Trp Asn Gly Ile Lys Asp Ile Glu Glu Val Tyr

    275                 280                 285
Leu Asn Gly Asp Leu Glu His Gly Ala Pro Asn Ile Leu Asn Val Ser

290                 295                 300
Phe Asn Tyr Val Glu Gly Glu Ser Leu Ile Met Ala Leu Lys Asp Leu
305                 310                 315                 320
Ala Val Ser Ser Gly Ser Ala Cys Thr Ser Ala Ser Leu Glu Pro Ser

            325                 330                 335
Tyr Val Leu Arg Ala Leu Gly Leu Asn Asp Glu Leu Ala His Ser Ser

        340                 345                 350
Ile Arg Phe Ser Leu Gly Arg Phe Thr Thr Glu Glu Glu Ile Asp Tyr

    355                 360                 365
Thr Ile Glu Leu Val Arg Lys Ser Ile Gly Arg Leu Arg Asp Leu Ser

370                 375                 380
Pro Leu Trp Glu Met Tyr Lys Gln Gly Val Asp Leu Asn Ser Ile Glu
385                 390                 395                 400
Trp Ala His His

生物素的制备方法.pdf_第1页
第1页 / 共61页
生物素的制备方法.pdf_第2页
第2页 / 共61页
生物素的制备方法.pdf_第3页
第3页 / 共61页
点击查看更多>>
资源描述

《生物素的制备方法.pdf》由会员分享,可在线阅读,更多相关《生物素的制备方法.pdf(61页珍藏版)》请在专利查询网上搜索。

本发明描述了一种包括具有序列SEQ ID No.1或SEQ ID No.3的生物素基因的基因构建体、含有这种基因构建体的生物体、这些序列或所述基因构建体用于制备生物素的用途以及一种用于制备生物素的方法。。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 化学;冶金 > 生物化学;啤酒;烈性酒;果汁酒;醋;微生物学;酶学;突变或遗传工程


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1