米多霉素生物合成基因簇.pdf

上传人:Y948****062 文档编号:865401 上传时间:2018-03-15 格式:PDF 页数:59 大小:3.72MB
返回 下载 相关 举报
摘要
申请专利号:

CN200910056338.8

申请日:

2009.08.13

公开号:

CN101812472A

公开日:

2010.08.25

当前法律状态:

终止

有效性:

无权

法律详情:

未缴年费专利权终止IPC(主分类):C12N 15/60申请日:20090813授权公告日:20110720终止日期:20140813|||授权|||实质审查的生效IPC(主分类):C12N 15/60申请日:20090813|||公开

IPC分类号:

C12N15/60; C12N15/55; C12N15/54; C12N15/52; C12N15/31; C12R1/625(2006.01)N

主分类号:

C12N15/60

申请人:

上海交通大学

发明人:

邓子新; 贺新义; 李力; 徐志南

地址:

200240 上海市闵行区东川路800号

优先权:

专利代理机构:

上海交达专利事务所 31201

代理人:

王锡麟;王桂忠

PDF下载: PDF下载
内容摘要

一种生物技术领域的米多霉素生物合成基因簇,该基因簇的序列如SEQ IDNO:1所示;该基因簇包含16个基因:结构基因11个:milA,milB,milC,milD,milE,milG,milH,milJ,milM,milN和milQ;调节基因2个:milK和milO;抗性基因1个:milP;其他基因2个:milF、milI。本发明提供了米多霉素生物合成相关的所有基因和蛋白信息,为生物合成米多霉素和遗传改造提供了基础;本发明的米多霉素生物合成基因簇及其蛋白可广泛用于农业、工业和医药领域。

权利要求书

1: 一种米多霉素生物合成基因簇,其特征在于,序列如SEQ ID NO:1中第6125位至第25935位所示。
2: 根据权利要求1所述的米多霉素生物合成基因簇,其特征是,所述基因簇包含16个基因:milA,milB,milC,milD,milE,milG,milH,milJ,milM,milN,milQ,milK,milO,milP,milF和milI;其中: 所述基因milC编码的蛋白的序列如SEQ ID NO:4所示,该蛋白为胞嘧啶/羟甲基胞嘧啶葡萄糖醛酸合成酶; 所述基因milG编码的蛋白的序列如SEQ ID NO:8所示。

说明书


米多霉素生物合成基因簇

    【技术领域】

    本发明涉及一种生物技术领域的基因簇,具体是一种米多霉素生物合成基因簇。

    背景技术

    核苷类抗生素是一类通常由微生物次级代谢产生的,在结构上含有修饰的核苷和核苷酸的分子的总称。它们具有广泛的生物活性,包括抗细菌、抗真菌、抗线虫、抗肿瘤、抗病毒、除草、免疫刺激和免疫抑制等活性(J.Antibiot.(1998)41,1711-39)。米多霉素(mildiomycin)是由生裂链轮丝菌(Streptoverticilliumrimofaciens)产生的一种水溶性碱性抗生素(J.Antibiot.(1978)31,511-8),在化学结构上包括一个5-羟甲基胞嘧啶(自然界中仅发现存在于T偶数噬菌体的DNA中)、一个特殊的带有γ-羟化的胍基和一个带有丝氨酸残基的4-氨基-吡喃-3-烯部分(J.Am.Chem.Soc.(1978)100,4895-7),属于核苷类抗生素(结构见图1)。米多霉素并不像其它核苷类和氨基糖苷类抗生素那样容易通过细胞膜,它作用机制在于能够抑制蛋白质合成中肽键的转移(J.Antibiot.(1985)38,415-9)。米多霉素对多数细菌和真菌都有抑制活性,尤其对植物白粉病具有强烈的抑制活性。白粉病是由子囊菌纲白粉菌目(Erysiphales)白粉菌引起的植物真菌性病害。白粉菌能侵染650多种单子叶植物和9000多种双子叶植物。目前用于防治白粉病的主要是三唑类化学农药,然而,化学农药对人类的可持续发展的危害日益引起关注(农药学学报,(2001)3,12-8)。米多霉素低毒高效的特点成为良好的抑制植物白粉病的农药。目前,市场上销售的是日本武田药业(TAKADA)生产的米多霉素可湿性粉剂,由于价格较高,多用于防治高档观赏植物的白粉病原菌。

    Kishimoto等人研究发现,在亚铁离子存在的情况下,培养基中添加适当的无机磷酸盐能够提高米多霉素的产量(J.Antibiot.(1996)49,775-80);Sawade等通过用环丝氨酸(D-Cycloserine)诱变,并在含氨蝶呤(aminopterin)的平板上进行筛选米多霉素高产菌株,得到了产量是原始菌株2.6倍的高产突变株(J.Antibiot.(1997)50,206-11)。通过原生质体融合等手段,徐志南教授得到了一株突变株Sv.rimofaciens ZJU5119,其米多霉素产量比出发菌株ZD615提高了170%,达到了1015mg/L(浙江大学学报(工学版)(2006)40,1262-6)。Sawada等在Sv.rimofaciens的培养基中添加5-羟甲基胞嘧啶,5-甲基胞嘧啶(5-methyl-cytosine)、5-溴胞嘧啶(5-bromo-cytosine)、5-碘胞嘧啶(5-iodo-cytosine)和5-氟胞嘧啶(5-fluoro-cytosine),能够分别得到一系列对应的米多霉素衍生物(J.Ferment.Technol.(1984)62,537-43)。通过改变发酵条件,我们前期还在生裂链轮丝菌ZJU5119分离到去羟甲基米多霉素、去羟基米多霉素和去羟基去羟甲基米多霉素(上海交通大学学报(2009)43,1-4)。

    通过DNA重组技术可以对抗生素化学结构进行改造,提高效价、扩大抗菌谱、降低毒性,同时对调节基因的遗传工程改造还可以提高抗生素的产量,这方面的先驱Hopwood等利用来自不同链霉菌菌株的结构基因转移产生出新的杂合的抗生素(Nature(1985)314,642-4)。由于抗生素生物合成的相关基因,包括结构基因,抗性基因以及调节基因一般都成簇存在(Annu.Rev.Microbiol.(1989)43,173~06)。我们以生裂链轮丝菌ZJU5119产生的米多霉素为目标分子,从克隆其生物合成基因簇出发,阐明了合成米多霉素的基因簇。

    经对现有技术的文献检索发现,尚未见到有关于米多霉素生物合成基因簇的报道。

    【发明内容】

    本发明的目的在于克服现有技术的不足,提供一种米多霉素生物合成基因簇。本发明提供了米多霉素生物合成相关的所有基因和蛋白信息,为生物合成米多霉素和遗传改造提供了基础;本发明的米多霉素生物合成基因簇及其蛋白可广泛用于农业、工业和医药领域。

    本发明是通过以下的技术方案实现的:

    本发明涉及一种米多霉素生物合成基因簇,其序列如SEQID NO:1所示。

    所述米多霉素生物合成基因簇包含16个基因:

    结构基因11个:milA,milB,milC,milD,milE,milG,milH,milJ,milM,milN和milQ;其中:

    所述基因milA,位于SEQ ID NO:1的第6125~7126位,

    所述基因milB,位于SEQ ID NO:1的第7252~7761位,

    所述基因milC,位于SEQ ID NO:1的第7906~9165位,

    所述基因milD,位于SEQ ID NO:1的第9185~10369位,

    所述基因milE,位于SEQ ID NO:1的第10380~11198位,

    所述基因milG,位于SEQ ID NO:1的第11627~12631位,

    所述基因milH,位于SEQ ID NO:1的第12729~14948位,

    所述基因milJ,位于SEQ ID NO:1的第16202~17152位,

    所述基因milM,位于SEQ ID NO:1的第19548~20714位,

    所述基因milN,位于SEQ ID NO:1的第20710~21483位,

    所述基因milQ,位于SEQ ID NO:1的第25168~25935位;

    调节基因2个:milK和milO;其中:

    所述基因milK,位于SEQ ID NO:1的第17152~18477位,

    所述基因milO,位于SEQ ID NO:1的第23289~22222位;

    抗性基因1个:milP,所述基因milP,位于SEQ ID NO:1的第23298~24878位;

    其他基因2个:milF、milI;其中:

    所述基因milF,位于SEQ ID NO:1的第11194~11664位,

    所述基因milI,位于SEQ ID NO:1的第14948~16027位。

    所述11个结构基因编码的蛋白具体为:

    所述基因milA编码的蛋白的序列如SEQ ID NO:2所示,该蛋白为CMP羟甲基转移酶;

    所述基因milB编码的蛋白的序列如SEQ ID NO:3所示,该蛋白为CMP/羟甲基水解酶;

    所述基因milC编码的蛋白的序列如SEQID NO:4所示,该蛋白为胞嘧啶/羟甲基胞嘧啶葡萄糖醛酸合成酶;

    所述基因milD编码的蛋白的序列如SEQ ID NO:5所示,该蛋白为degT/dnrT/eryC1/strS氨基转移酶;

    所述基因milE编码的蛋白的序列如SEQ ID NO:6所示,该蛋白为氨基糖苷类磷酸转移酶;

    所述基因milG编码的蛋白的序列如SEQ ID NO:8所示,该蛋白为RadicalSAM蛋白;

    所述基因milH编码的蛋白的序列如SEQ ID NO:9所示,该蛋白为连接酶;

    所述基因milJ编码的蛋白的序列如SEQ ID NO:11所示,该蛋白为精氨酸羟化酶;

    所述基因milM编码的蛋白的序列如SEQ ID NO:14所示,该蛋白为Asp/Tyr/Aro氨基转移酶;

    所述基因milN编码的蛋白的序列如SEQID NO:15所示,该蛋白为二氢二吡啶甲酸合酶;

    所述基因milQ编码的蛋白的序列如SEQ ID NO:18所示,该蛋白为氨基糖苷磷酸转移酶。

    所述2个调节基因编码的蛋白具体为:

    所述基因milK编码的蛋白的序列如SEQ ID NO:12所示,该蛋白为Majorfacilitator superfamily家族蛋白;

    所述基因milO编码的蛋白的序列如SEQ ID NO:16所示,该蛋白为LuxR家族调节蛋白。

    所述1个抗性基因编码的蛋白具体为:

    所述基因milP编码的蛋白的序列如SEQ ID NO:17所示,该蛋白为ABCtransporter。

    与现有技术相比,本发明具有如下的有益效果:利用本发明的基因簇可实现以下目的:

    包含本发明所提供的核苷酸序列或至少部分核苷酸序列的克隆DNA可用于从生裂链轮丝菌(Sv.rimofaciens ZJU5119)基因组文库中定位更多的文库质粒。这些文库质粒至少包含本发明中的部分序列,也包含有基因组中以前临近区域未克隆的DNA。

    包含本发明所提供的核苷酸序列或至少部分核苷酸序列可以被修饰或突变。这些途径包括插入、置换或缺失、聚合酶链式反应、错误介导聚合酶链式反应、位点特异性突变、不同序列的重新连接、序列的不同部分或其它来源的同源序列进行定向进化(DNA Shuffling),或提供紫外线或化学试剂诱变等。

    包含本发明所提供的核苷酸序列或至少部分核苷酸序列的克隆基因可以提供合适的表达体系在外源宿主中表达以得到相应的酶或其它更高的生物活性物质及产量。这些外源宿主包括链霉菌、大肠杆菌、芽孢杆菌、酵母、植物和动物等。

    包含本发明所提供的氨基酸序列或至少部分序列可以用来分离所需要的蛋白质并可用于抗体的制备。

    包含本发明所提供的氨基酸序列或至少部分序列的多肽可能在去除或替代某些氨基酸之后仍有生物活性甚至有新的生物学活性,或者提高了产量或优化了蛋白动力学特征或其它致力于得到的性质。

    包含本发明所提供的核苷酸序列或至少部分核苷酸序列的基因或基因簇可以在异源宿主中表达并通过DNA芯片技术了解它们在宿主代谢链中的功能。

    包含本发明所提供的核苷酸序列编码的蛋白可以催化合成羟甲基胞嘧啶葡萄糖醛酸,进一步催化合成抗生素-米多霉素。

    包含本发明所提供的核苷酸序列或至少部分核苷酸序列的基因或基因簇可以通过遗传重组来构建质粒以获得新型生物合成途径,也可以通过插入、置换、缺失或失活进而获得新型生物合成途径。

    包含本发明所提供的核苷酸序列或至少部分核苷酸序列的克隆基因或DNA片段可以通过中断米多霉素生物合成的一个或几个步骤而得到新的米多霉素结构类似物或前体。

    包含本发明所提供的核苷酸序列或至少部分核苷酸序列可以用来提高米多霉素或其衍生物的产量,例如增加正调节基因的拷贝数或增强其表达以及负调节基因的敲除等。本发明提供了在基因工程微生物中提高产量的途径。

    总之,本发明提供了米多霉素生物合成相关的所有基因和蛋白信息,为生物合成米多霉素和遗传改造提供了基础;本发明的米多霉素生物合成基因簇及其蛋白可广泛用于农业、工业和医药领域。

    【附图说明】

    图1为米多霉素和去羟甲基米多霉素的化学结构示意图;

    图2生裂链轮丝菌产生米多霉素及去羟甲基米多霉素的LC-MS检测结果图;

    图3为米多霉素的异源表达示意图;

    图4为米多霉素生物合成基因簇边界的确定示意图;

    图5为与米多霉素生物合成的相关基因分析示意图;

    图6为MilC蛋白催化胞嘧啶葡萄糖醛酸和羟甲基胞嘧啶葡萄糖醛酸的合成示意图;

    图7为MilG蛋白负责4’-酮基羟甲基胞嘧啶葡萄糖醛酸的合成示意图;

    图8为推导的米多霉素生物合成途径示意图。

    【具体实施方式】

    下面结合具体实施例,进一步阐述本发明。这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件,例如Sambrook等分子克隆:实验室手册(New York:Cold SpringHarbor Laboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。

    以下结合图1~8对本发明做进一步说明

    图1中:米多霉素:R=CH2OH;去羟甲基米多霉素:R=H

    (1)米多霉素的发酵及LC-MS检测

    将米多霉素的产生菌生裂链轮丝菌ZJU5119接种到TSBY(10.3%蔗糖)培养基于含有弹簧的三角瓶中30℃培养6天。调节发酵液ph至5,离心取上清进行LC-MS检测,所用仪器为安捷伦公司的Agilent 1100series LC/MSD Trap system。采用Agilent TC-C18(5μm,4.6×250mm反向柱,流动相为10m M三氯乙酸(Sigma公司)/HPLC级乙腈(Merck公司)(92∶8,v/v),流速为0.3ml/min。质谱检测是在离子阱的正离子模式下进行。干燥气流为8l/min,喷雾器压力为40psi。干燥气温为325℃。多级质谱断裂分析轰击电压在1.0~1.8V之间。以米多霉素标准品(购自武田药业公司)为对照,结果见图2,可见生裂链轮丝菌ZJU5119不仅能够产生米多霉素,同时能够产生米多霉素的衍生物-去羟甲基米多霉素。

    (2)米多霉素的异源表达

    利用来自杀稻瘟菌素生物合成基因簇上的胞嘧啶核苷单磷酸水解酶基因blsM及其同源基因设计兼并引物,从生裂链轮丝菌ZJU5119的基因组文库中筛选出六个相互重叠的包含有blsM同源基因的科斯质粒。基因敲除milA和milB证明了它们是合成米多霉素生物合成的必须基因。将包含milA和milB基因的一个科斯质粒14A6提供原生质体转化的方式转入到链霉菌模式菌株变铅青链霉菌1326(Streptomyces lividans 1326)中,并将转化子在YEME培养基中(Difco酵母提取粉3g、Difco蛋白胨5g、Oxoid麦芽糖3g、葡萄糖10g、蔗糖340g、蒸馏水1000ml,灭菌后补加2ml 2∶5M MgCl2)发酵6天。

    生物测定:将指示菌红酵母接种到10.3%YEME液体培养基中,30℃摇床(220rpm/min)培养约24小时,离心收集菌体,用LB培养基洗涤一次,融化PDA培养基并冷却至50℃左右,每20ml培养基中加入100μl上述指示菌,立即混匀后倒入培养皿,使其凝固。收集20μl发酵液,利用灭菌后的牛津杯放置在制备好的含红酵母指示菌的PDA平板上,30℃培养1~2天后观察指示菌生长被抑制的结果。

    HPLC-MS分析:将收集的发酵液用草酸调节pH 5.0,12,000g离心5分钟,用阳离子交换小柱(Supelclean LC-SCX,500mg/3ml,Supelco公司)处理上清。小柱先用3ml甲醇活化,上样后分别用2ml纯水和2ml 0.5%氨水洗涤,最后收集3%氨水洗脱组份供测定分析。在检测米多霉素中所用的高压液相色谱-质谱联用是安捷伦公司的Agilent 1100series LC/MSD Trap system。采用AgilentTC-C18(5μm,4.6×250mm)反向柱,流动相为10m M三氯乙酸(Sigma公司)/HPLC级乙腈(Merck公司)(92∶8,v/v),流速为0.3ml/min。质谱检测是在离子阱的正离子模式下进行。干燥气流为8l/min,喷雾器压力为40psi。干燥气温为325℃。多级质谱断裂分析轰击电压在1.0~1.8V之间。

    如图3A所示,指示菌为红酵母,I米多霉素;II和III分别是从两个携带14A6的变铅青链霉菌的发酵提取物;IV从携带空载体的变铅青链霉菌的发酵提取物;科斯质粒14A6的变铅青链霉菌1326的转化子发酵液和米多霉素标准品一样产生了抑菌圈,而空载体的转化子的发酵液不能够产生抑菌圈。图3B为米多霉素和14A6和空载体的变铅青链霉菌转化子在YEME培养基中的发酵提取物的HPLC图谱;显示了14A6的变铅青链霉菌转化子发酵液提取物中的米多霉素的峰,而空载体的转化子没有此峰。

    这样通过生物测定和HPLC-MS的数据证明了科斯质粒14A6能够赋予变铅青链霉菌1326米多霉素的生产能力,也就表明了14A6包含了米多霉素生物合成所必须的全部功能基因。

    (3)米多霉素生物合成基因簇的边界确定

    突变株LL2(敲除milA)丧失了生产米多霉素的能力,仅能够产生去羟甲基米多霉素,证明了milA是必须基因,因此对其上游基因进行了敲除,通过筛选得到了生裂链轮丝菌突变株LL4(敲除orf-1的突变株)和LL23(敲除orf-5至orf-1的突变株),生物测定实验结果表明它们仍然能够产生米多霉素,因此米多霉素生物合成基因簇的上游边界确定在orf-1和milA之间。LL17(敲除orf+1至orf+2的突变株)、LL18(敲除orf+3至orf+6的突变株)和LL9((敲除orf+7的突变株)的生测实验结果表明它们仍然能够正常产生米多霉素;(见图4A LL4:敲除orf-1的突变株;LL23:敲除orf-1至orf-5的突变株;LL17:敲除orf+1至orf+2的突变株;LL18:敲除orf+3至orf+6的突变株;LL9:敲除orf+7的突变株;WT:野生型;CK:琼脂块对照);

    而milQ的突变株LL11丧失了生产米多霉素的能力(图4B,从下至上分别为米多霉素;生裂链轮丝菌野生型ZJU5119和生裂链轮丝菌LL11:milQ突变株发酵液的HPLC图谱)。因此,把米多霉素生物合成基因簇下游边界确定在milQ和orf+1之间。这样,米多霉素的生物合成基因簇就确定在milA至milQ范围内。

    (4)米多霉素生物合成基因簇的功能分析

    通过对生裂链轮丝菌ZJU5119的米多霉素生物合成基因簇上的基因进行系统的敲除和各个突变株的发酵产物检测,这些基因在米多霉素生物合成中的相关可通过图5所示的内容阐述,其中,结构基因、调节基因和抗性基因等用不同的颜色表示。+表示基因的敲除丧失了米多霉素的生产能力;-表示基因敲除对米多霉素的生产没有影响;/表示基因的敲除降低了米多霉素的产量。包括相关的结构基因11个(包括milA、milB、milC、milD、milE、milG、milH、milJ、milM、milN、和milQ),它们的突变株丧失了米多霉素的生产能力;负责米多霉素生物合成的调节基因(milO和milK),LuxR家族的调节蛋白MilO的突变株样丧失了米多霉素的生产能力,而主要易化家族蛋白MilK突变株的米多霉素产量降低;米多霉素生物合成的抗性基因milP的突变株不能够生产米多霉素;功能未知的基因milF、milI和milL,其中敲除milL的突变株仍然能够正常的产生米多霉素,而敲除milF和milI突变株丧失了米多霉素的生产能力,这说明了milF和milI和米多霉素生物合成的相关性,证明了它们是米多霉素生物合成基因簇的一部份。

    (5)体外反应进一步证明MilC的功能

    MilC是由463个氨基酸编码的蛋白质,序列比对的结果显示它和杀稻瘟菌素生物合成中的BlsD(AAP03118)具有一定的同源性(Identities=144/338(42%),Positives=180/338(53%),e-value=2e-49),BlsD被认为是一种UDP-葡萄糖转移酶,负责在杀稻瘟菌素生物合成中cytosylglucuronic acid(CGA)的合成,称之为CGA合成酶。Guo等在1991年发现S:griseochromogenes中存在着催化胞嘧啶和UDP葡萄糖醛酸合成CGA的酶,并在1994年从菌体中纯化了CGA合成酶,研究发现,UDP-葡萄糖(UDP-glucose)、UDP-半乳糖(UDP-galactose)和UDP-半乳糖醛酸(UDP-galacturonic acid)都不是CGA的合适底物,同时除了胞嘧啶外,腺嘌呤(adenine)、尿嘧啶(uracil)、4-硝基酚(4-nitrophenol)和α-萘酚(α-naphthol)都不是合适的糖基配体。Cone等在分析杀稻瘟菌素生物合成基因簇的时候发现,把包含blsD的6∶5kb DNA片段克隆到pIJ702上,并在S:lividans中表达,有胞嘧啶存在条件下,能够产生CGA,表明BlsD就是Guo等人纯化的CGA合成酶。然而,Guo等人纯化的CGA合成酶大小是43kD与通过氨基酸序列计算出的Bl sD大小34∶5kD并不一致[J:Bacteriol:1994(176):1282-6;ChemBioChem 2003(4):821-9]。通过MilC做BLASTP仅能找到BlsD,并且在保守域的搜索中也没有如何结果。于是我们采用了PSI-BLAST。Position specific iterative BLAST(PSI-BLAST)是位点特异的迭代blast搜索,主要针对蛋白序列。第一次blast搜索后,结果中最相似的序列重新构建PSSM(位点特异性打分矩阵),然后再使用该矩阵进行第二轮blast搜索,再调整矩阵,搜索,如此迭代。最终高度保守的区域就会得到比较高的分值,而不保守的区域则分数降低,趋近0。这样可以提高blast搜索的灵敏度。在检索结果中我们发现了一些相似的N-己酰氨基葡萄糖转移酶(N-acetylglucosaminyl transferase)序列,这让我们相信MilC可能与CGA合成有关(UDP-葡萄糖醛酸为底物),负责糖基的转移。尽管UDP-葡萄糖醛酸基转移酶在哺乳动物的异生物质代谢(Xenobiotic metabolism)中非常普遍,在真菌中也有发现,但在细菌中却很少报道。

    敲除milC的突变株丧失了米多霉素的生产能力,证明了它的必要性。为了进一步研究milC的确切功能,进行了蛋白的表达和纯化,我们把MilC基因克隆到原核表达载体pET28a+上,并在大肠杆菌中进行超表达。然而,几乎所有的重组蛋白均以包含体形式存在。经过复性纯化后得到了可溶的重组MilC蛋白,如图6A所示,其中,MW:蛋白质分子量标准;泳道1:透析后重新折叠的可溶性蛋白;泳道2:从可溶性蛋白中纯化的MilC。

    分别以胞嘧啶和羟甲基胞嘧啶为底物,分析它们在MilC的催化下与UDP-葡萄糖醛酸(UDP-glucoronic acid)的作用,结果见图6B,(以失活的MilC作为对照)。在A中,经过30分钟的温浴,做为对照的加入煮沸失活的MilC的HPLC图谱显示仍然只有底物胞嘧啶和UDP-葡萄糖醛酸(下部),而在上部的HPLC图谱中可以发现,不仅存在着胞嘧啶和UDP-葡萄糖醛酸,而且出现了两个产物UDP和cytosylglucuronic acid(CGA),它们的保留时间,紫外吸收和MS都与标准品一致。在B中,经过30分钟的温浴,做为对照的加入煮沸失活的MilC的HPLC图谱显示仍然只有底物羟甲基胞嘧啶和UDP-葡萄糖醛酸(下部),而在上部的HPLC图谱中可以发现,不仅存在着羟甲基胞嘧啶和UDP-葡萄糖醛酸,而且出现了两个产物UDP和HM-cytosylglucuronic acid(HM-CGA)。可见,胞嘧啶和羟甲基胞嘧啶都能够在MilC的作用下与UDP-葡萄糖醛酸反应,分别生成CGA和HM-CGA。在对糖基供体的实验中,MilC不能够催化UDP-葡萄糖(UDP-glucose)和胞嘧啶或羟甲基胞嘧啶的反应。

    MilC的酶动力学参数的研究具有非常重要的意义,因为它可以表明对于胞嘧啶和羟甲基胞嘧啶哪一个是酶的最适底物。因此,我们在反应体系中加入过量的UDP-葡萄糖醛酸,来计算胞嘧啶和羟甲基胞嘧啶对MilC的米氏常数,结果见图6C和表1,可见,MilC对胞嘧啶和羟甲基胞嘧啶来说有着近似的Km值,但胞嘧啶的Kcat值却是羟甲基胞嘧啶的1.9倍,可见对MilC来说胞嘧啶是更适合的底物。

    表1MilC对胞嘧啶和羟甲基胞嘧啶的酶动力学参数比较

       胞嘧啶  羟甲基胞嘧啶  Kcat(10-4s-1)  1.070±0.0037  0.5623±0.0257  Km(μm)  200.0±18.26  206.8±24.49  Kcat/Km(M-1s-1)  0.5250±0.0019  0.2719±0.0012


    MilC在米多霉素生物合成途径中所催化的反应如图6D所示。

    (6)检测到中间产物进一步证明Radical SAM家族蛋白MilG的功能

    milG编码一335氨基酸残基的蛋白,通过对MilG的Pfam数据库检索发现它属于一类被称为Radical SAM的超家族蛋白(Radical SAM superfamily,PF04055)。这类蛋白通过一个特殊的铁硫中心来还原性的分解S-腺苷甲硫氨酸(SAM)产生自由基。这类蛋白家族的发现表明了自由基依赖的催化反应对以前未能解决的一些复杂的化学反应途径的重要性,同时也反映了这个家族蛋白既古老而又保守的性质。Radical SAM能够催化多种反应,包括特殊的甲基化反应、异构化反应、硫的搀入、成环反应、厌氧氧化反应和蛋白自由基的形成等。它们在DNA前体物、维生素、辅酶、抗生素和除草素的生物合成和生物降解过程中起着重要作用,如赖氨酸2,3变位酶(lysine 2,3-aminomutase)、孢子光合产物裂解酶(spore photoproduct lyase)、丙酮酸甲酸裂解酶(pyruvate formatelyase)、厌氧核糖核苷酸还原酶(anaerobic ribonucleotide reductase)和生物素合成酶(biotin synthase)等(Chem:Rev:2003(103):2129-48)。

    图7A(MIL:米多霉素;WT:生裂链轮丝菌野生型ZJU5119;LL8:生裂链轮丝菌milG突变株LL8,羟甲基胞嘧啶葡萄糖醛酸的化学结构显示在图上)显示敲除milG的生裂链轮丝菌丧失了生产米多霉素的能力,同时,在突变株的发酵液中,中间产物羟甲基胞嘧啶葡萄糖醛酸([M+H]/Z 318)得到了大量积累,这表明了MilG可能是以羟甲基胞嘧啶葡萄糖醛酸为底物,同时,在整个米多霉素生物合成基因簇中,milG是唯一一个可能编码参与氧化反应的基因,因此推断MilG负责催化羟甲基胞嘧啶葡萄糖醛酸的糖上碳4位羟基氧化成羰基,milG是米多霉素生物合成所必须的基因,在米多霉素生物合成途径中它所负责的功能如图7B所示。

    (7)米多霉素生物合成基因簇中各种基因的作用

    根据前面对蛋白MilA、MilB和MilC的功能研究,已经能够明确了从CMP出发至合成出(羟甲基)CGA的步骤。而米多霉素生物合成基因簇边界的确定、各个基因的敲除和生物信息学的利用提供了米多霉素生物合成基因簇中各个基因的作用。

    milG的功能:由羟甲基CGA出发合成米多霉素需要在碳4位上转入氨基,而转氨基之前的羟基必须被氧化成羰基。MilG是一类Radical SAM,它能够利用自由基来催化许多在化学上及其难以发生的反应。而MilG的中断突变株生裂链轮丝菌LL8的发酵产物中羟甲基CGA的大量积累则支持了我们的判断。同时,在其它的突变株中未能找到积累的中间产物的原因可能就是MilG作用后的中间产物的不稳定性。通过和杀稻瘟菌素的生物合成基因簇的对比,同样发现的一个Radical SAM-BlsE,考虑到米多霉素和杀稻瘟菌素的结构上相似性,MilG和BlsE可能就就负责(羟甲基)CGA的糖基的碳4为上羟基的氧化,转化为羰基。

    milM和milN的功能:对于精氨酸侧链和葡萄糖醛酸的缩合反应,类似于MilN催化的二氢吡啶甲酸合成,即半醛和酮酸的缩合。而MilM这个氨基转移酶可以将精氨酸脱去氨基转化为α酮酸,而MilN催化α酮酸和脱羧的己糖的反应。milM和milN的基因中断突变株都失去了生产米多霉素的能力。

    milE和milQ的功能:关于糖基部分2位碳与3位碳间双键的形成也是米多霉素生物合成途径中非常特殊的反应,尽管现在没有直接的证据显示哪个基因与此相关,但通过生物合成基因簇边界确定和基因中断实验,我们认为很可能是MilE和MilQ这两个磷酸转移酶负责这个双键的形成。milE和milQ的基因中断突变株都失去了生产米多霉素的能力。

    milD,milI和milH的功能:对于丝氨酸残基侧链的形成,MilD是个degT/dnrJ/eryC/strS类型的氨基转移酶,它可以在被MilG氧化成羰基的4位碳上转入氨基。MilI包含一磷酸泛酰巯基乙胺结合位点,磷酸泛酰巯基乙胺是一些多酶复合体中的酰基载体蛋白的辅基,它作为一个结合活化的脂肪酸和氨基酸基团的摆臂,因此MilI可能参与的丝氨酸的活化。MilH作为一个具有ATP结合位点的连接酶可能催化丝氨酸残基和糖上碳4位的氨基之间的缩合反应,形成类似肽键的酰胺键。对比杀稻瘟菌素的生物合成,MilH的同源蛋白BlsK可能同样负责氨基酸残基和糖的结合,同样,在杀稻瘟菌素的生物合成以及嘌呤霉素的生物合成途径中,催化这一反应的都是连接酶,而并不是NRPS(ChemBioChem2003(4):821-9)。

    负责米多霉素生物合成的调节基因milO和milK,LuxR家族的调节蛋白MilO的突变株样丧失了米多霉素的生产能力,而主要易化家族蛋白MilK突变株的米多霉素产量降低。这说明了两个调节基因在米多霉素生物合成途径中的重要作用。米多霉素生物合成的抗性基因milP的突变株不能够生产米多霉素,所用它是合成的必不可少基因;milJ做为米多霉素生物合成基因簇中唯一的氧化还原酶基因负责精氨酸的羟化反应。敲除milF突变株丧失了米多霉素的生产能力,这说明了milF和米多霉素生物合成的相关性,证明了它是米多霉素生物合成基因簇的一部份。

    根据体外酶活实验、体内突变实验和生物信息学分析整个基因簇的的功能,总结如图8所示。

    实施例

    步骤一,米多霉素产生菌生裂链轮丝菌ZJU5119总DNA的提取

    接种链轮丝菌至TSBY(10.3%蔗糖)培养基于含有弹簧的三角瓶中30℃培养48h。离心收集菌体,重悬于5ml SET缓冲液中(75mM NaCl,25mM EDTA pH8.0,20mM Tris-HCl pH7.5)。加入100μl溶菌酶溶液(50mg/ml),置37℃约60分钟。溶菌后然后加入140μl蛋白酶K溶液(20mg/ml)混均匀,再加600μl 10%SDS,通过颠倒混匀,置55℃温浴2h,期间偶尔颠倒几次。再加入2ml 5M NaCl,彻底混匀,冷却置37℃后,加入5ml氯仿,于室温轻轻混匀。20℃、4500g离心15分钟。转移上清至新管中,加入0.6倍体积的异丙醇颠倒混匀,约3分钟后用玻棒挑取至含70%(v/v)乙醇的新管中洗涤,重复2次,空气中干燥,溶解在TE中。

    步骤二,生裂链轮丝菌基因组文库的构建

    (1)链轮丝菌总DNA的部分酶解和大片段DNA的回收

    将提取的链轮丝菌总DNA用Sau3AI部分酶解,用1%低熔点琼脂糖凝胶,在装有0.5倍TBE电泳缓冲液的脉冲场电泳(Pulse Field Gel Electrophoresis,PFGE,Bio-Rad)中分离。回收约40kb大小的DNA片段。用热敏的碱性磷酸酶(APexTMHeat-Labile Alkaline Phosphatase,EPICENTRE Biotechnologies公司)处理是末端去磷酸化,供载体的连接及包装转染用。

    (2)柯斯质粒载体的构建和处理

    为了方便在链霉菌中做异源表达,从pOJ446和pSET152质粒出发,构建了新的可整合在链霉菌染色体的穿梭柯斯质粒载体,pOJ446被XbaI和XhoI双酶切后,包含多柯斯位点的部分和来自pSET152的用同样酶切的包含整合酶和attP位点的片段连接。将提取的pJTU2554质粒用单酶切位点的HpaI酶切成线性片段,然后用CIAP(NEB公司)酶处理末端使其去磷酸化,然后再用BamHI酶切成两条片段。

    (3)连接和包装

    将处理好的链轮丝菌基因组DNA(大小约40kb)和柯斯质粒载体按照1∶1分子数比例用T4连接酶(NEB公司)连接。将在冰上溶解的噬菌体包装蛋白(MaxPlaxLambda Packing Extracts,EPICENTRE Biotechnologies公司)加入连接产物中,混匀,避免产生气泡,短暂离心,在30℃中温浴90分钟,再加入另一份包装蛋白,继续温浴90分钟后加入噬菌体稀释缓冲液(Phage Dilution Buffer,100mM NaCl,10mM MgCl,10mM Tris-HCl pH8.3)至1ml,并加入25μl氯仿,4℃保存。

    (4)转染与保存

    将大肠杆菌EPI300培养至OD600=0.8~1.0作为感受态菌,可在4℃保存72h。将包装产物与感受态菌混合,37℃温浴20分钟后涂含阿伯拉抗生素的LB平板。37℃培养过夜。挑取单克隆至含抗生素的LB培养基96孔板中继续培养18小时,加入灭菌的甘油至终浓度20%,于-70℃中保存。

    步骤三,基因组文库的筛选

    采用PCR的方法从基因组文库中筛选所需要的柯斯质粒。为筛选基因组文库,从每个板的96孔孔中取出等量菌液混合,接种培养,提取质粒为一个模板进行PCR筛选,在得到的阳性平板中,从每排的12个孔中取出等量菌液混合,接种培养,提取质粒为一个模板进行PCR筛选。然后在那些阳性的排中进行单个的PCR筛选,直至筛出所有阳性克隆。

    步骤四,双交换基因置换质粒的构建(以pJTU412为载体,目的基因被壮观霉素抗性基因替换)

    基因置换载体的构建采用PCR-Targeting方法。因为构建文库所用的柯斯质粒(pJTU2554)在链霉菌中属于整合型载体,会将整个质粒片段整合到染色体上的aatB位置,所以不适合用于基因置换。因此,首先要构建中间载体,本研究采用的是以pJTU412为载体,它是一种大肠杆菌链霉菌的穿梭质粒,具有在链霉菌中遗传不稳定的特点,在非抗性选择的条件下,质粒极容易丢失。将基因组文库中筛选到的负责米多霉素生物合成的柯斯质粒酶切,连接到经相应限制性内切酶酶切的pJTU412载体上,构建了中间载体。分别将各中间载体转化至含有pIJ790质粒的大肠杆菌BW25113中(E.coli BW25113/pIJ790)中制备成感受态细胞,以通过PCR扩增的pIJ779或pIJ778中含有的aadA基因(带有与目的替换基因两侧同源的尾端)DNA进行电转化,得到基因置换质粒,并转化到大肠杆菌ET12567中以消除DNA甲基化影响。

    步骤五,融合蛋白的表达

    (1)表达质粒构建

    本实施例均以pET28a+(Novagen公司)为表达载体,将待表达的基因用高保真的KOD酶和带有限制性酶切位点的引物扩增出,酶切后连接至相应酶切处理的表达载体上,构建成融合表达质粒,并转化至大肠杆菌DH10B中,测序正确后,将质粒转化到含有pLysE质粒大肠杆菌BL21(DE3)(Novagen公司)。

    (2)融合蛋白的表达

    含有融合表达质粒的大肠杆菌BL21(DE3)(Novagen公司)接种到含氯霉素和卡那霉素的LB培养基中37℃培养过夜。然后将10ml的种子接种到1L的含相应抗生素的LB培养基中培养至OD600=0.6,将培养温度降至28℃,加入IPTG至终浓度为1mM,继续培养5小时。

    (3)融合蛋白的纯化

    12,000g离心5分钟收集菌体,然后重悬于25ml的裂解缓冲液(20mM磷酸钠,0.5M NaCl,pH7.4),反复冻融两次,放置在冰浴中,用超声波仪破碎细胞和打断DNA分子(60s 10次,每次间隔60s),然后在4℃,16,000g离心45分钟。

    对可溶性融合蛋白,取上清过镍金属鳌合小柱(HisTrap HP column,GEHealthcare公司),用FPLC(GE Healthcare公司)纯化,采用线性方式用洗脱液(20mM磷酸钠,0.5M NaCl,0.5M咪唑,pH7.4)洗脱,收集蛋白,用SDS-PAGE电泳来鉴定。纯化后的蛋白用脱盐柱(HisTrap Desalting column,GE Healthcare公司)进行缓冲液置换,置换为50mM的Tris-HCl(pH7.4)缓冲液,加入甘油至浓度20%,保存于-80℃。对不可溶蛋白,则收集细胞破碎后的沉淀物,按照蛋白复性试剂盒(Protein Refolding Kit,Novagen公司)的说明书进行蛋白复性,然后在按照上述对可溶的重组蛋白的纯化方法进行纯化。蛋白定量采用Bradford方法(Bradford Protein Assay Kit,Bio-Rad公司)。

    【序列表】

    <110>上海交通大学

    <120>米多霉素生物合成基因簇

    <160>18

    <170>PatentIn version 3.5

    <210>1

    <211>43561

    <212>DNA

    <213>生裂链轮丝菌ZJU5119(Streptoverticillium rimofaciens ZJU5119)

    <400>1

    ccaagcttgg gctgcaggtc gactctagag atatcggatc accgtcagct tctcgcaggt     60

    ctcgccctcg gcggcgatga cctgcccggc ctcgaaggcc accggctcga aggcgcccgc    120

    gagttcggcc agtaaggcct cgtcggcctc gcgcaggaag ggcagttcgc gcaggtcctc    180

    ggggacgacg cggtgcgcgc cgccctcgct gtagcagctg atgcggtcgt cgccgaggat    240

    gaacgtccgg cggcggttga cgcggtagac accggactcg acgtcgaccc agggcagcgc    300

    gcgcagcaga tagcgcggcg tgatcccgcg catctgcggg gtggtcttgg tggtcgtggc    360

    caactgccgt gcggcatcgg gcgcgagact gagacgatcg ttcatgcggt cctcctcgaa    420

    gagcccgcgc ggcagcccgc gcgggagcgc agaccgatcg tccggtcggt gggttcgtgt    480

    cacaagacag gggattccga cacggtccgg aaatgatcga ctggcggagt gtgatgccgc    540

    ggccctcgat ccggggcaag ggcttcaccg ccgcgcgccc gcttggtccg gaccgcgaga    600

    tgaccggatt ccacccactg agacccgcct cccgggcgcg tcgcaccgac ggggcagcgc    660

    aaaaccgccc tcgccgccgg ttcggtcccc cgaaaaccgg tcccgtcccc gaagcagaac    720

    cgcccctacc gcccccggaa aacagaaccg ccccgatccg gtgatccgga tcggggcggt    780

    tccacaagcg gtagcggtgg gatttgaacc cacggtggag ttgcccccac acacgctttc    840

    gaggcgtgct ccttaggccg ctcggacacg ctaccgagag agagcttagc ggacggtggg    900

    ccgtgctctg aaatccgttc cccggtgaca gggtgtggtg ctggtcaccg gtcgcggaag    960

    aagcgggtga gtagctcggc gcagtcgtcg gcgaggacgc cggtgacgac ctcgggacgg   1020

    tggttgagac ggcggtcgcg gacgacgtcc cagagggagc ccgccgcgcc ggccttctcg   1080

    tcgacggcgc cgtagacgac gcggtccagg cgggagagga cgatcgcgcc cgcgcacatc   1140

    gtgcagggct ccagggtgac gacgagcgtg cagcccgaca ggcgccactc gccgacggcc    1200

    cgcgcggcct cgcggatggc gaggacctcc gcgtgaccgg tggggtcgcc ggtggcctcg    1260

    cgctcgttgc ggccgcggcc gatgacggag ccgtccctgt ccagcacgac ggcacccacc    1320

    ggcacgtcgc cggtggcggg ggccgccgcg gcctccgcca gggcggcccg catgggagcg    1380

    acccaggggt cgcgcaccgg gtcggggacg gggacggctg cgtcgtggac ggcttcgttc    1440

    atggcaccag tgtgagcgca cccgccctgg cggacgtcag cggacggcct ccaggacgtc    1500

    ggtgcagccg agggcctcgg cgatcgagcc gagggcgtcc ccgtccagcg acaggatctc    1560

    cttctcgctc accccgaggt cctccaggag cctgccgtcg cccagcgggc cgctgggcgc    1620

    gacggaggcg cccgccccgt cgtcgctctc gtcctcctcc gtctcgggtt cgccgtcctc    1680

    ggtgccgtcg aggtcgaggg tgtccagcgc gtcgtcctcg tcgtcgtcgc ggccgacgag    1740

    ctcgtcgacg agcatcgccc cgtacgagct gcggttggcg acgacggcgt tcgagacgta    1800

    gacccggggg tcgtcctcgc cgtccacccg gacgacgccg aaccaggcgt cctcctgctc    1860

    gatgagcacc aggaccgtgt cgtcgtcgta cgaggcctcg cgggcgaggt cggcgatgtc    1920

    ggacagggtc tccacgttgt cgagttctgt gtcgctcgct tcccacccgt cttcggtgcg    1980

    cgcgagcatt gcggcgaagt acaccgtgac tctcccactg gtcataggcg gtgccgggtc    2040

    ggacggggac caccccgccc actcggaatc gtggcagaaa cctgggcgtt gcgagaggtc    2100

    ttccgcgctg cgtcgtgcag cagtccgaga gatgtcgctc acgtggggcc cgtgagggcg    2160

    ccgtacgggc gtgacgcggc gcgacacggt gcggcatggt gcgacgcggc gccctgggcg    2220

    tggcgcggac gggtccgccg ggacggtcac cagcggaagg tgcgcatccg catctgctga    2280

    cgcatccggg ccgcccgggc ccggcgcggc tggacgcggt cgcgcagctc cttggcctcg    2340

    ttcagctcac ggaggaactg ggcccggcgc cgtctgcggt cctcggcgct ctcggggctc    2400

    tcgtccgggt cggcggcctc ccggggccgc cgggggtccg gccgctcgcc gccgggcgtc    2460

    cggcgccggt cctcgcggcg tttcccggtg tctatggagt ccggttcccg ggtgtccgct    2520

    tccgctgtct cccggggcgt ccgggcaccc gacccggatc cccgcctgtc atggccggcc    2580

    atgggcagca ccacctcgtg ccgaggtcct cgcccggcga caggccgggc gtacgtgccc    2640

    actttccccc taagtggtgg tttgatgcca gggctgcgac agaccgtcga agcctcgccg    2700

    aagccccgcc gtggcgcctc ggcgggagcc cgggcattaa agctcggtta atgtcgatgt    2760

    catgcggatc cacgtcgtcg accaccccct ggtggctcac aagctcacca cgctgcgcga    2820

    caagcgcacc gattccccca ccttccggcg cctctgcgac gagctggtca ccctgctcgc    2880

    gtacgaggcc acgcgcgacg tgcgcaccga gcaggtcagc atcgagtccc cggtgaccgc    2940

    caccaccggc gtccggctct cccacccgcg tccgctggtg gtgccgatcc tccgggccgg    3000

    cctgggcatg ctggacggca tggtccggct gctgccgacg gccgaggtcg gcttcctcgg    3060

    catgatccgc aatgaggaga ccctcaaggc ggagacgtac gcgacgcgca tgccggagga    3120

    cctctccggt cgccaggtct acgtcctgga cccgatgctc gccaccggtg gcacgctcgt    3180

    cgccgcgatc aacgagctga tcgcccgtgg cgcggacgac gtcaccgcga tctgcctgct    3240

    ggccgcgccg gagggcgtcg aggtcatgga gcgcgagctc gagggcgcgc cggtgaccgt    3300

    cgtcaccgcg tccgtggacg agcggctcaa cgagcacggc tacatcgtcc cgggcctcgg    3360

    cgacgccggc gaccggatgt acggcaccgc gggctgaccc ccgagccggt ttccctctcc    3420

    tccgcccgcc gacctcggcg accgcccggc gccgtcctcg gcgaccgccc ggcggccgag    3480

    ctcagcgtct gcccggccgc cggcccaggc gaccgcccgg cgccgtcctc agcgaccgcc    3540

    cgccgccctc agcacttggc ggcgggcgag cccggtgcgg ccgacgccga cggcggggga    3600

    gagcccgtgg cgccgggcga ggccgacacc gagggcgcgg gccggcccgt gaggccggtc    3660

    agcgccttgt cggcctcctc ctggggcatg agcccctgaa aggccgcccc cagcacgagg    3720

    tcgacgtcct gtccctcgcg ctggtcgctc ttgggctccg ccccggcgag ctgggtgccc    3780

    agcacccgga gcgcgccctc cagggactcc tgggacccca gcagtatgcc ggtgccctcc    3840

    accttcttgt cgtagtcggc ctgggcgttg cccaccttgc cgatcctgaa gccgcgcttc    3900

    tccagctcgt ccgccgtgat cttggcgagc ccgccgcgcg gcgtggcgtt gtagacgttg    3960

    acggtgatgt cgccgggccg gggcaggtcc ctgggcagct tccgggcggg gacccgggcc    4020

    gcgtcggccc cgctcttgca gtcgccgctc cgctttcccg aagccgcggc ccgcgtcgga    4080

    gcgggcccgc ccgagaagac gtcgacgagc tggaccgttc cccacccggc cagccccagc    4140

    acgacggccg tggcggtgcc ggcgagcacg atcctgcggc ggttccgggt gcggcgcata    4200

    tgcgggaacc gatggcccgt gatgcggtac ttaccaccca tgccaggagg ggtgagcatg    4260

    ctcatgagcg cagcgtagtg ccgggcggag ccgctgccta ctagatgatc aatgggttgc    4320

    ccggacccct acccaaaagg gccaataacc gcccatgcga ccgtttttcc ggagggcggt    4380

    acgagcccgg aacgacggcc cggaaagcgc ccggtccgca tatcggtccg ggaatcgaca    4440

    aaagtgccga acgaagcgcc gagacggcgg ccggacgggt gacggccccg gcggtcagtc    4500

    cagttcgagc acgcgcgcgt gcagcacctg gcgctgctgc agcgcggccc gtacggcccg    4560

    gtgcagcccg tcctccaggt agagatcgcc ccgccacttc acgacgtggg cgaagaggtc    4620

    cccgtagaac gtcgagtcct ccgcgagcag cgtctcgagg tcgagctgct gcttggtggt    4680

    caccagctgg tccaggcgta ccgggcgagg ggcaacatcc gcccactggc gggtgctttc    4740

    ccggccgtgg tcggggtacg gccgcccgtt tccgatgcgc ttgaagatca cacggaaagc    4800

    ctaccgggcg agcggctccc ggcgcagcca tggcgcggga gtgcgatggt gacaatcagc    4860

    cgcataccgg gagtgatgca tggaactctt gagcgagaat tctttcgtca gagctccgga    4920

    ttccggatgg ggtccaccgg aatccgctcg cccgggccgt tccccgccgc cgcgaccgcc    4980

    cgctcactcg gcgatctcgg tccgctccca ccactcgtag acgggcagcc tgccctcggc    5040

    ggtgtcctga tgccgcgagg tcttcttgaa gtgctcgtag ccgcccttga acgggatctt    5100

    cagctcgacc ccgggagggg tgatcgtgac gacccgctcc ggaagatcgt ccggaccgcc    5160

    ttcgaggaat gctttgggag cgctgctcat gggggacagt cttccggcgc tccccgccgt    5220

    acgtgcggcg cgacgcgccg caggccgagg gggcgggcgt cacgccttct tgaccgccgt    5280

    cttcttggcg gctcgtttca tttcctgctt gtaggcccgg accttgtcca gggactccgg    5340

    cccggtgatg tcggccaccg agcggtacga ccccgcctcc ccgtaggagc cggccgcctc    5400

    ccgccagccc tccggcgtca cccccagtcg cttgcccagc agcgccagga agatctgcgc    5460

    cttctgcttg ccgaaccccg gcagcgcctg gagccgctcc agcagttcgc gccccgtcgc    5520

    cgcgccggac cacaccgcgc tcgcgtcccc gtcgtacgtc tcgaccagat ggcggcacag    5580

    ctgctgcacc cggcccgcca tggaccccgg atagcggtgc acggccggct tctccgcgca    5640

    cagcgcggcg aacgcctcgg ggtcgtacgc cgcgatctcg tgcgcgtcca gatcgtctcg    5700

    cccgagccgc cgggcgatgg tgtacgggcc ggtgaaggcc cactccatcg ggatctgctg    5760

    gtccagcaac atgccgacca gggcagccag cgggctgcgc gagagcaggg cgtcggcgtc    5820

    gggctgctgg gcgagccgga ggggacggtc catgggccga tggtccctcc gggagggcgg    5880

    cggcgcatgc cgtcccggcc gttcggcggt gtcgggtggt ggtgcccggt cgtgtcgccc    5940

    ggtcgtgtcg ctcggtggtg tccgccggtg ccccggggtg tccaccggtg ttctgtggtg    6000

    tcagcaattg cggtctgcag ctagtggtca acgcggcggc attggtccgc ggcccggccc    6060

    tgggcaggat ggcggacgcc gatcggcaag tcctgtggta cctcactatt acgggcgggc    6120

    agtgatggaa acccatacgt tcgggacgtt ccaagacgct tatctgagcc agctgcgcga    6180

    catctaccac tcaccggaat tccgtaacgc accgcgtgga caggcgagtc gcgaacggat    6240

    cggcgccgga ttccggctgc tggatcccgt gcagcgccac atatccgtgc cggcccggcg    6300

    cgccaacgtc gtgttcaact tcgccgaggc gctctggtac ctctccggct ccgaccgcct    6360

    cgacttcatc cagtactacg cgcccggcat cgcggcctat tcggccgacg ggcggaccct    6420

    gcggggcacc gcctacgggc cccgtatctt ccgccacccg gcgggcgggg tgaaccagtg    6480

    ggagaacgtc gtcaagacgc tgacggacga ccccgacagc aaacgggccg tcatccagat    6540

    cttcgacccc cgggaactgg ccgtcgccga caacatcgac gtcgcctgca ccctggccct    6600

    gcaattcctg atccgcgacg ggctgctctg cggcatcggc tacatgcggg cgaacgacgc    6660

    cttccggggc gccgtgagcg acgtcttctc cttcactttc ctgcaggaat tcacggcccg    6720

    ctatctcggg ctcggtatcg gcacgtacca ccacgtcgtg gggtccgtgc acatctacga    6780

    cagcgacgcc cggtgggcgg agcgggtgct ggacgccgcg acgccggacg gcggcccgcg    6840

    gcccggcttc cccgccatgc cggacggcga caactggccg cacgtccgcc gtgtactgga    6900

    gtgggaggaa cgcctccgca cgaacgcggc gcgcctctcg gcggacgccc tggacgccct    6960

    ggacctgccc gcctactgga agcacgtcgt ggcgctgttc gaggcccacc gtcaggtccg    7020

    gcacgaggac acgcccgacc gggcgctgct cgccgcgctg cccgaggtct accggcagtc    7080

    gctggccgtc aaatggcccg gccacttcgg ctctccggcc ggctcctgac cccgatcggc    7140

    tcctgacctc ggtccgttcc cgaccccggt ccgttcccga ccgttcgccg ggcacgcccg    7200

    gacgacgcga ccccaccaga gacgcgaccc caccagaaag gaacaacccc ggtgaccacc    7260

    acccccaagc cccgtaccgc ccccgcggtc ggctcggtct tcctcggcgg gccgttccgc    7320

    cagctcgtcg acccccgcac cggtgtgatg agcagcggtg accagaacgt cttcagccgc    7380

    ctcatcgagc acttcgagag ccgcggcacg acggtctaca acgcccaccg ccgcgaggcc    7440

    tggggcgccg aattcctgtc gcccgccgag gcgacccggc tcgaccacga cgagatcaag    7500

    gccgcggacg tcttcgtcgc cttccccggc gtcccggcct cccccggcac ccatgtggag    7560

    atcggctggg cgagcggcat gggcaagccc atggtcctgc tgctggagcg cgacgaggac    7620

    tacgcgttcc tggtcaccgg tctggagagc caggccaatg tggagatcct ccggttctcc    7680

    ggcaccgagg agatcgtcga gcggctggac ggggccgtcg cccgggtgct gggccgggcg    7740

    ggcgagccga cggtcatcgg ctgaggcgcg gcccgcatgg acctcttatc ggcggcccgg    7800

    gcggaccggg cggatcggtc ggaccaggcg gatcggccga ctcggccgga cggagcggat    7860

    cgggcggact ggacggctcg ggcggacgga cccgtgaccc tggcggtggc gggtgccgag    7920

    ttcggctggg ggagcgcggg gaagctggcc gcgatcgtcg ccgcgttgcg cgaacggcac    7980

    ggcgagcggg tccggttcgc cggcctgggc tccgggctcg ggcgccccgt gctgggcgcc    8040

    ctggacgccc gcgactggac ggacgtgccg gagccgggcg acggcccggc gggcgaggcc    8100

    gcgctggcgg cgctgctgcg cgagcggggc gtggacgcgg cggtcgtcgt cctcgacggc    8160

    ctgctggcgg cccggctgga ggcggtgggg tgtcccgtcg tctacgtcga cagcctgccc    8220

    ttcctgtgga ccgagcacga cttcgtcccg tccggagtcc acacctactg cgcgcagttg    8280

    tgcccctcgc tgccccggca gagctggccc gtgctgcgcg ggatcgaggc actgcgctgg    8340

    gtggaaccgg tggtgggcac gtacggggcc ggcggcctcg acccggtgcc ggggaaggcc    8400

    gtgctcaacg tcggcggcct gcgctcgccg ttcaccgccg aggacgacga ctcctatgtg    8460

    gagctcgtcc tgggccccgc cctgcgggcg ctgcgggcgg cgggcttcgg acaggtcgtg    8520

    atcagcggca atgtggatcc cggcctggcc cgggtgccgc acgccggtac gcacgggctg    8580

    accgtgacgg cggggcggct ggaccacggc gcgttcatcg aggaactgcg cacggcggag    8640

    ctgctggtga cctcgccggg ccgcaccacc ctgctggagg cggcggcgct cggccagcgg    8700

    gccgtcgtcc tgcccccgca gaacttcagc caggtcatga acgccgcgga cgtcgcggac    8760

    ctggtggacc cggccgtcgt ggtcccctgg ccggccgccg tcctggacct ggccgagctg    8820

    gcccgggtcc gcgaccaggg cgaggagggc gcggtgcggc tgatgtacgc ccgtatcgcc    8880

    gcggcgcgcc gggagccggg gacggtggcc ggcccgctgg ccgacgcgct cggcgccgcc    8940

    gtcgcccacg tccgccggca cgacgtccgc atggggccgt tcgccggcac ggacgggagc    9000

    ggcgcgggaa cgcgaggcgc gggaggcgca agagatacag gaggcgcagg aggagcgcgg    9060

    agtgtggcgg acgccgtcga cgagctgatc gggaagctga cggacggccc ggccgccggg    9120

    aatcgcaggg acggatcacc actggcggcg ccggtccggg cgcgctgagg gagagaagga    9180

    agcgatgcgg caccccaggg aactcaggca ggacacctcg ctcgcgatca acggggggac    9240

    ccccacgttc gccgcgctcc cggaggagga caccgggatc gtggccgagg ccgccgacga    9300

    ggtggcggag ctgatcagga ccaggcgcac cgtccactgg ggcggcggcc cccacacccg    9360

    cgtcctggaa cgggacttcg cggccctcgt cggccgggag cgcgcgttct tccacaactc    9420

    cggcacggcg gccctgcaga ccgccctctt cgccctggag gtcgaggagg gcacccccgt    9480

    cgccctcagc gactccggtt tcgtcgccag tctcaacgcc ctctaccacc tccgggcgcg    9540

    gccggtcttc ctgcccaccc acccggccac gctgcagtgc gtcgacgacg tcgcggagtg    9600

    gaccgccggg accggcgtcc acacggcgct gatcacccac ttcttcggca acgtcgccga    9660

    cgtcgaggcg atctggcgca cctccggggc ccggcatctg gtcgaggacg gcggccaggc    9720

    ccacggcgcg cggctgcggg gccggccggt cggctccttc gggaccgtcg gctccttcgc    9780

    gggctcgacg aagaagctgg tcaccgccgg gcagggcggg ctgaacgtcc acgacgacga    9840

    gcacctggac tggcggatgc gcacctacgc gcaccacggc aagtccggga actacgaagg    9900

    gacgttcccc ggctacaact tccggggcgg ggagatggag gcgatcctcg cccacgccgc    9960

    cctgcggcgc ctggacgagc gcgtcgcggc ccgcaaccgc accgccgaca cgatgttccg   10020

    gatcttcgac gaggccggga tccgcaccgc gcgcccggcg cccggactcg actgctcgcc   10080

    cgcctggttc gacgtcgcgc tgatcctcga cgaggagtgg ctgggccacc gcgactggct   10140

    ggtcgaggcg atggtcgccg acggcatccc cggctggcac tacccggcgc tgatcggcat    10200

    gccctgggtc gagccgtgga tgcgatccaa gggctggtgg ggcgagcgcg aacaggagct    10260

    gctcgcctcg gagaccgcgc tgtggggccg caccctcgtc ctcggcgccc agatgaacgc    10320

    cgtggacgcc gagcggatcg cccacgccgt cgtggcgctg ctcaagggat gacacggcga    10380

    tgacctgcgg cgagatctcc gaggtgcgcc gggtgctgcg ccggctcggc gacggcgggc    10440

    cgcgttccgt ccgggtcagg gagaacggga actgcgcggt gtacgtgggg gaccggctcg    10500

    tggtgcgcgt cggccactcc tggccgctgg acgcccgggg cgagctccac tgctggagcg    10560

    tcgcccggga tgcgggggtg cccgcccccg agcggatcga cgagggccgg ctgcccggcg    10620

    ggcgtacgta cgtggcgtac gtgtacgtca tgggcacccc ggccgggacg cccgcctccc    10680

    tcgcggccgc gggcgccgtg ctggcgcggc tgcacacggt gccgggcgag cacttcccgg    10740

    ccgtggcgca caacctgccc cggcgcaggg accgttaccg cacggcggtg cggtgcgcgc    10800

    gggccgccgg gctcgcgccc ggcggcctcg cccaccgctg tctgctgcgc gcggcggacg    10860

    actggcggcg gtcgcgggag gtggccgcgc acggcgactt ccgcacgccc aacctggtgg    10920

    tccggggccg gggggtgagg gccgtcctgg actggagcga cgcccgcgcc gccagccccg    10980

    agagcgatct gggccagctc gggcccgggc agctgcgccc gctcctgcgg ggctatctgg    11040

    accgtgcccg gcgcgccccg gacctggagc tggtggccgg gcacatgctg gcccggcatc    11100

    tcgccctgga ggccgccggg gtgttcccgg cgggcacgtc ggcggcgctc gcccggaggt    11160

    tcgggccggg gctgtcccgg gggaggtgga ccgttgcctg accggagtcc ggcggccgag    11220

    ccgctgatcc tcgacgtcgg cagcgcgggc cagctcgcgg agctggccgg cgacctggtc    11280

    gacctggccg ggcccggcgg cgcgaccggc ccctgggtgc tcacctgggc ccacggcgcc    11340

    ggggagccgg gcggggagcc gggcgagggg cagaaccggg ggccgaacgg gggcacgggc    11400

    gggggcccgg gcgggacggt ggcccggccg ccgggcgcca cggtcgtgcg ccacggcggg    11460

    ctggaggtgg tcacggtgcc ccgtccgcca cgcgacctcg gcggtttcct cgacgcgtgc    11520

    tgccgcaccg gcccggtctc gggccacccg gacgtcaccc gcacgatcct catccttgcc    11580

    gaccccacgg accgggaccg gtccgcttcc cctccggagg cacctcatga cgcaccccgc    11640

    gacggggccc gcgacgggcg gccgtgaccg ctatctcttc atcaggatcc tggaggcgtg    11700

    caacgccgac tgcttcatgt gcgagttcgc cctctcccgc gacacctacc gcttcaccct    11760

    cgacgacttc cgcgaactgc tgccgcaggc acaggagtcg ggcgtgcgat acgtccggtt    11820

    caccggcggc gagccgctga tgcacggcga ggtgctcgac ctgatccgcg agggcaccgc    11880

    cgccggcatg cggatgtcgc tcatcaccaa cggcttccgg ctgccgcaga tggtcgacaa    11940

    gctggcggag gcggggctgg cgcaggtcat cgtcagcctc gacggctcct ccggtgagac    12000

    gcacgacgtc taccggcgca cccccgggat gttcgaccgc gggctggacg gactcgtacg    12060

    cgcctcccgg gcgggcatgc tcacccgcgt caacacggtc gtcgggccgc acaacttcgc    12120

    gcagatgccg gagctgcagc gggtcctgac cgaggcccgc gtggagcagt gggagatgtc    12180

    cgcgctcaag ctggaacggc acatcgccta ccccccggcc gaggaggtgc tccacgcctg    12240

    cgaacccgtc ttcctggccg acccgaagcg gtggctggtg cccctgggca agcgcttcta    12300

    cggggagacc gccgaggaac gggaggcgtt cttcgagcgc ggcacgaccc cgagcgcgtc    12360

    acggccgctg tgccatgtga ccgacgacgt gatgtacctg gaccccaagc tgggccgcac    12420

    cttcgcctgc agctgtctgc cccaccggga cggcccgggc gccgacatgc gcgacgagcg    12480

    gggccgcgtc ttcctcaaca gcccttcgtt ccgcgcgcac gccgaggagt tcaagcagca    12540

    ggggcccgtg atctgcagcg gctgctcgac cacggcggcc ggctacagcg acgacgtggc    12600

    ccggctcggc tcggtgcccg cctggcacta ctgaccgggg cgccacgccc tttgctcgca    12660

    cgccccgtcc gtacacccgt acgcctcctc caccgcccgc acgtcatcct ccgcccagga    12720

    agccgaacat gatcctgcgt accgaccacg tggacgcgta tctgtccgcc gtgtccgcca    12780

    tcctcgacga gcccggccgc gccggggccg gcgtccccgt gctgtgccgg ccgggctctc    12840

    cgctggacgt gctggtgacc cgctggtccg ccctgctggg ccacgccggg ccgcgtgccc    12900

    gctcggaccg gccgggccgg gccgtcgtcg cggtcggcga cgaccccgtc gtctccgcgg    12960

    cggcacggct gctcgccgtg ctcacgggac ggaccgcgct ggccgtcgcc gacgtcaagg    13020

    agctgcccgc cctgtgggag cggcacgacc tcgtctccac cgcgctggtg ggcatcggca    13080

    ccgggttcga cgtcccgggc gtcgagccca gcgccttctg gcggctcgac gcgaccgacg    13140

    cgaccctcgg catcctgacc ggccgggacc gggagtccct gacctggttc gtcgccaaga    13200

    gtctgctcac ctccaccgtc cccggcgacg cgcagacgct gctgctgccg gaccgcaagc    13260

    cgcgcgagga cacggcgtcg gcgggcgtgg gtgccggggg cgtcgaggtg ctgtacgggg    13320

    ccgccgccga ggaggcgctg cccgcgctcg ccgaggacga gcgggtacgg gcgctgatcg    13380

    ccgtggaggc ccacggcagg gccgaccacc tgggggtgcg ggacggcatc atctgcggcg    13440

    accggctggc ccatctgggc cggtccagcg agccggaggg catcgggcgg gtgccgcagt    13500

    gcgcgttcgg gcacggctgc ttcaagcccg gcgcccgggt ggcgatctcc cgtatgccgg    13560

    cgcagtcgct gttcctgcac agctgcacca gttcgcacac cgaggcggac atgtacgaga    13620

    agtcgttcct gctgggcctg gccgccctgg aagggcccgc ccggcacgtg ctgggcaccg    13680

    tccgcccgat gcacgacggg ggccacgagg tcggactcgt ctcggcgttg acggcggcgg    13740

    gcgcctccgc cggcgaggtg acccggctgc tgaacgcctc ctaccaccag caccgcggcg    13800

    agcccgcgcc ctatctgctg ctcggcgacc cggagctgcc gttcgcggac gggccggtgg    13860

    gcgggccgga cgcgggcccg gccgtggagc tggacgcctc cgccggcgcg ctgccgctcg    13920

    gcggccggcg cacggcggtc ctgggcagcg gccccggcgt gctggtcgtg ggcgacgcga    13980

    ccggggacga ggacggggac ggcccggggc ttcccgcggg cgtgggcgcg ctgaccgtcc    14040

    ggcgcggcga ccgtacggac gtcgtggcgt ggagcaccga gggcccgctc cccgaagggg    14100

    cgcttccgtt ggtccgccgg gagggcgggg cggtggccgc ggacggcggt gccgaggagc    14160

    tccacgcccg ctgggaccac gtcgaccacg gcatcgcgtc gggcggcgcg ctcggcctgc    14220

    tgcccaagga cctcacgggc aggctccagg agctgcggga cctcgccgca gccgtcggca    14280

    ccgccgaccg ggacgcccgc ttcttccccg gccgcctggg cgcggtccgg cgcgcagcgg    14340

    cccggctcga ccagcggatc cgcgacgccg accgggcact gatgcacgcg ctgctcggcc    14400

    gcaacggcaa gccgttcgac gccgacgaca ggctggagag cgccttcgtg ccgctggagt    14460

    cccagtacgg ccgccaggtg tgctggtgcg gccgggacgc ggtcgtcagc cggctgcggc    14520

    cccggctggg cgcccgggaa gtgcgccgga agtacaactg catgcagtgc ggggactacg    14580

    cccaggtcgc ggtggacggc gtcgacgtgc gctgggaggc cccggagttc gtggcctcgg    14640

    gaggcgagct ggagcactcc ttccggatcg ccaaccccct tccccacccg gtcaccgggg    14700

    tgctcgcgct gagcgtgtcc ccctggtacg gcggcgacgt gtccttccgc cccggcatcg    14760

    cgaccttctc ggtggcgccg ggcggcacgt gccgggtggg cgtcacgatg cgcgccgccg    14820

    ggctgaagcc ccaccgctac acggtcgacg cgacggtggt cagccatctg cgcatcaacg    14880

    cctatcgcaa gttcgtgcag gtccgcccgg cgggacccgt cggcccgagc gacgaggacg    14940

    gtgcgctgtg acagcaccta cgaccggacc gaccaccgga cccacgaccg ggcccacggc    15000

    cgggcccacg accgggccca cggccgggcc cacggccggg cccacggccg gatcggcggt    15060

    cgccgaggag gccgtggcgg agtgggccgc ggcctggctg gagcaggtgc acggggtgcg    15120

    ctacgggccc gacgacgcgc tcttcggctc gctcgactcg ctcgcgctga ccgagctcct    15180

    ggtggcctgc gaggcccatt tcgggctgcg catcgacgag gggttcggct ggcaggcgct    15240

    cgcctcggtc cgcagcctcg ccgcccatgt ggccacgggg gtccgcccgc ccagcgaccg    15300

    cgtctggttc cggtcgggcc ccggcgcgac cggggacgcg gacctggacc gtacggccgt    15360

    cgtccgggtg gcgctggggc tgccgccggg cgcggccgtg gcccggctct ccccgaggga    15420

    gctggcgctg ggcatcggcg ccgccgcagc gccttccgag aagccggcca cgaccctgcc    15480

    gcccgagcgc gaacggcttt ccctcgctcg ggagtcgagc acccggcccg gctcgctgct    15540

    ggccgtcggc gccacggccg cgcggatccg ggcgttcgcc gggcgcctcg acgccgcgct    15600

    cgcggcggtg ggggccacgc ccgtctggta cccgatcacg accgacagcc ccgtcggcgc    15660

    cgaccacgtc cagggcatcc cctccgagct gacggcgggc cgcctcgggc acgcgggctg    15720

    tctgcagctg ctcgccgaac tgcccgcgga acgcgacgtc gtgtactcgg gcatcgccta    15780

    cgccttccgg gacgagcccg gccgccgctg ggaacccgcc ggccggctgg aggcctaccg    15840

    ggtccacgag acggtcgtgc acggcaccga ggagttccgc acggcgatgt ggcgacggct    15900

    gtacgagctg gtggaccggg agctgtcggc cctcggcccg ggcggctggc aggaggggcg    15960

    ggacggcttc accccccggc atggaccgca agctcgaatg gctgctggaa ctcgacgctg    16020

    ggcacggtga gcgtgggggg cacggccatc cgggtggacg gatcgcggtg gcctcgctca    16080

    acgaccacgg cgggctcttc gcggcggcgc cggacggctc cggcacgccg gacggcggcc    16140

    cgccgggctc cttctgtctg ggcatcggcg tcgaccggct cgcctcgctg ggggtgatct    16200

    gatggacgcc gcgcccggca ccgcccgtac ggccgcgggc acgtccgtac cgcccgtact    16260

    ccccgtcgat gccgaacgtc ccgccgcccg gcgcaccctg gccatggagg agggcacacc    16320

    ccggcagtgg gagggcctag ggctgcacgg tgttccggag gccgtggagg cggcgctggg    16380

    cccggccgcc gagctggtcg tcgccgcgcg gggcggcggc cggtccccgc tgcccggcct    16440

    cgtcttcgcc cagccctgcc tcggccgctc cgccggcgtg gcccgggacc tgcccgtctc    16500

    cgtggtgtgg gagacgggcg tggccctcgc gatcgcccgg gcgctggacc ggcccgcggt    16560

    gatcgggctg tgcgtgtacg aggagatcct ccagcagccg caccgggacg ccgagttcac    16620

    cgcgctgggc gcggccgtcg cgcggaccgt cgaggcgctg ggccggctgc tgggcgtggc    16680

    ggtcaccgcc cgcgtcgaga ccgccgcgcc ccgcgccgcg gaggtgccgg cgcgacggct    16740

    ctacggtctg tacacgccgt tctccgaatc cacctatccg aggggtttcc ccaacgaggc    16800

    ggaggtgctg cgcgccttct ccgcgtactg cgggcgctac gaggacgccg cccggcggga    16860

    ggcgtccctg tgggtgacgg aaggcgtgca cctggccaag gcggcgctcc tcggcctcgg    16920

    ccccggcgtg cccttcctgg ccaccacccc gctgcccgac cctgcgcacc ccggccggct    16980

    tctccaggac gccccggccg ccacccgggt caccctggaa cgccgctcgg cgctgcctgc    17040

    cgactggtgg ccggagcagg cgctggaacg cgcgctcggg accggtctgc ggcggctgac    17100

    cgaggacttc cacgcgctga tcgaagactt ccacgacccg gcgggagacc gatgagaacg    17160

    ccccggaccg gagccgtcct cggcgggcgc ggccccgccc tgcccttcgt cgcctatatg    17220

    gcgctctcca acgcccagtt cacccggggc gtgttcgtcc tcttcctgct gcgcgggaac    17280

    atcagcctgg ccgaagtcgg actgctggag agcctgttcc acctcacccg ggtgctctgc    17340

    gaggtgcccg ccggcagcgt cgccgaccgc tggggccgcc gtcgtacgat ccaggcgggc    17400

    ctgatcctct cggcggcggc gatgccggcg ttcctgctcg gcgggatgtt ctggtacgcg    17460

    ctggcgttcg tgttccaggg cgcgggctgg gccgcccagc gcggcgccga caccgcgctg    17520

    ctgtacgagc tgctggaacg gaccggcggg accgatcgct acgcccgcat cctggggcgc    17580

    tcccacgcgg cctcgtacgg gacgctcgcc ctcaccaccg cgctcggcgc gatgctctac    17640

    cagcggcacg tcagcctgcc gttctggctt caggcggccg tcaccctgct ggccgtcggg    17700

    gcgatcggcg tgctgccgga gagctcgggg acggcggcgt cgggggcggg gtcttcgggg    17760

    tcggggtcct cgggggagcc ggccgaacgg cccatgggtg tctggcggct ggcccgcgcg    17820

    ggggcccggc tggtggtcgg ccaccccgtg ctgaggctct tcgtcgcctt cgtcgccctg    17880

    gtcgaggccg ggacgacggt ggtgagcatc ttctcccaga gcttcttccg gacgctcgga    17940

    tacggcaccg ccaccaccgg gctgatcctc gccctggtca cggccttcag cgcggcggcc    18000

    gcgctgcagt cccaccgcct cgtcgaacgc ggtccggtcc gggtgctgat ggccgcttcg    18060

    agcctgtacc tcgtggggct ggccgggatg gcctcgctgc agccgcagct ggccgtcgtg    18120

    ggctactacc tcgtcttcct caaccttgac ctgctcgccc cggtgctgag cgccttcttc    18180

    caccgctctg tggacgagga ggtgcgagcg accgccggtt cgtacctcaa cctgtcgacc    18240

    agcgtgctca ccttcgccgc cttcccgctc tccggctcgc tgatcgacgc cggcggctac    18300

    cgcccgctgc tgatcatcac cgccctggtc agcctgccgc tcctggtctt cctcgtcggc    18360

    gcggcccggc gggtcctctc accgccggaa gagggcgatt ccggggagga cgccggggag    18420

    cgggccgggc ccaaggggcc cggtgcggcg gcacccgaca ccaccacgac gggagtgtga    18480

    gaacaccatg accaccaggg ctgactcccc gtctcccggg tccggcgggc ctgtcggacc    18540

    cggcgggtcc ggcggcgacg acggacggcc ggtgatcgcg ctgcgcttcg ccccggccga    18600

    cgtcgaagcg gcggccgcgg cggagtacgt cgccgcgcac ctcggcggtt tccggtgcct    18660

    gccggagtgt ccccaggagg gcgattccgg cccgggccgg aatccacccg ccgccgtgat    18720

    cgtcttcggg cggtccggtg ccgccggagg ggccggtccc gcgggcgtgc ccaccgtcct    18780

    ggtcgagggc gcggaaccgg tgcccggcac ggacgcggac gtcgtctgcc ggcaggcgcc    18840

    cggctggctc accgccgggg aaccgcccgc cccgcccgcc gtacgccccg gcggcggccg    18900

    gatccgcacc gtggacgtgg ccgccgtcgc gcccttccgt caggtgcggt cgggcggggg    18960

    tggcgggcgg gctgccctcc tgctcggcgg ggccggtggg cccgacgggt ccggtgcgtc    19020

    cgccgggggc gaggctcttc ccggcgccct cgcccggttc atcgccgggc atccggccgc    19080

    cgccggtgac gcgtgggccg tgctcaccga tctcaccggg gagcccctgc gggagctgct    19140

    cggcctgctg cccccgaccg cccgcacggt gggtgcggcg gactgggccc aggtcctgcg    19200

    ccgcgcggac tcgttggtgg cgacccccac cctgctggcc gccgcccatg cccgtaccgc    19260

    ccggatcccc ctgcacgtac tggacccggc gggaccggcc cagcggcgcg tccaccgggc    19320

    gctggccgcg atcgccggcg ctcccgggga gccgggcggc ctcccggtgg tcgggcccga    19380

    cgactggccg cgtgacgacg gccgcgccgg agccctgggc ggggccgcgc agatcgcccg    19440

    gcaggtgcgg cagttgtgcc tcgcgccggc ctgaaccgtc cggcgggtcc tgtcacgtcc    19500

    cttgagacgt ccctccgggg cgtcccccac gcaaaggtat ggatggcatg tccgacactc    19560

    tcgcgcacaa ccgtcccctc gacctgaccc agcacgagat agcggccctg cgctccgagc    19620

    acaatctcgc ggacgcgcac acgcaccagt accagtcgcc ggcccagcag ctcatcgtgg    19680

    actccctgcc cgccctctgg cacgaggcgg agaagggccg gcaggccgat ttcgaacagc    19740

    ggttcatcga ggcgttcttc cggctgcacg gccagcccac ggccatcggc ctggaccgca    19800

    cgctgctcac ctacgccgcc tccatctcca cgatgatcgc cgggatgttc ctcaagcgcc    19860

    gcgacgcgcg ggtgacgctg gtcgagccct gcttcgacaa cctccccgac ctgctcgtca    19920

    atctgggcgt tccgctcacc gccctccccg aggatgccct gcgcgacccc gcgcgcatcc    19980

    accgcgaact gtcacggctg gtgaccaccg aggcgctttt tctcgtcgac cccaacaacc    20040

    cgactggcca tagcctgttc gccgacggca tgcgcggctt cgaggaggtc gtacggttct    20100

    gccgcgagcg cggcacggtc ctcgtcctcg acctgtgctt cgcggccttc gccctcggca    20160

    gtggcggacc cggccgtcac gacgtctacg agctgctgga gaactccggc gtcacctaca    20220

    tcgccatgga ggacaccggc aagacctggc ccgtccagga cgccaaatgc gccctgctca    20280

    ccaccagcgc cgacatctac cccgccgtgt acaacctcca caccagcgtc ctgctgaacg    20340

    tctcgccctt catcctgaac accctcaccc gctacatcga ggattcccgg cgggacggct    20400

    tcgcctccgt gaccgacgtc ctcgaacgca atcgcaagtc cctgcgggcg gccaccgagg    20460

    gcacggtgct ccgcgcccac gagcccgacg tcccggtcag cgtcgcctgg ttcaccatcg    20520

    acgaccgcgg cccggacgcc acgcagctgc agcgcgacct ctccggccac ggcatccacg    20580

    tcctgcccgg tacgtacttc tactggaacg agccgagccg cggcgagcgc tacgtccggg    20640

    tggcgctggc gcgtgatccc ggggagttcg acgcctccat ggcccggctg cggacgcttc    20700

    tcgcccgcta tgcgtgagcc cggcctcatc gctccgctgg tcaccccgct gacccccgac    20760

    ggcgcggtct cggaagcgtg cgtacgggcg caggtcgcgc gcgtccgccc gtacgtccgc    20820

    gccctgatgc ccggcatcag ctgcggggag gggtggctcc tggaccgtcc gcggtgggag    20880

    cggctggccg ccgccgtcct ggactgccgc gacggcctgc ccgtccacct cggtgtccag    20940

    gcggcggaca cggcggaggt gatccggcgc gcccgctggg ccgtacggca cggggccgac    21000

    gccgtcacgg tcggcccccc gcacggcgcg ggcgcccggc agcgggcggt ccacgagcac    21060

    ttcgcgcggg tctgcgcggc ggtcgacacc cccgtctgcg tctaccacga gagcgtcgtc    21120

    agcggcacgc gcatgacgcc cgccacgctg accgccgtct gccggctcga cggcgtccgc    21180

    gccgtgaagg agtcgggccg cgagccgtcc gtcaccaacg acctcatcgc cgcggttccc    21240

    gacgtggccg tccaccaggg ctgggaggac ctcttccacg ccacgcccgg ggccgccggg    21300

    ctgatcgggc cccttgtcct catcgacccg gcgctgtgcg cggagctcgt cgccggggtg    21360

    ggtggggtgc agggggtggt gacggaccgc tgtcgtgagc tggggctttt ccgacctgat    21420

    tatgtggccc gcaccaagcg ggagttgtgc cggctgggtg tcctggccca tgccgtgacg    21480

    ctgtgacccc ccaccgtacg gaaatgggag tgaccatgaa tccttcgaag acctttctcg    21540

    ttgtcgggcc gctgcgtgcc gacaccggct ggcagtagag ggcacggccg atcatttctg    21600

    agttctcgtg gagcgaggcg gtgcggctgg ccggcgtcgc ggcggaggcg ctcggggcgg    21660

    gagatctggc gggcgccgtc ggggcgcttg accgggtggc cgcgctgatc cggctggcgg    21720

    gggagtcggg gggcgggggt gctgcggccg gggtgcgggg ctttcgggcg agtgcggcgc    21780

    tgatctggga cgccttcgcg gcggctgcgt ccgggccgtg cgacgcgctg cggatcgcgg    21840

    aggtctgccg ggcgctgcgg gggctggacg aggcggtggc ctcctgggag gagacctgtt    21900

    accggttctt cccggcgctg ggtggggagg agggggcggg ctgtgcgggg cctacggctt    21960

    ggtgagcgtc gggggcgggg ccgtgggtcg ggggcggggt ggggtggacg ggcccttacg    22020

    gggctgatct cttcgcggtg cctgccttca ggggagggtg ccccgtattt ggcttcagcg    22080

    gcgaagagct ctttacgccc ctaccagggc ccgttcaccc caccccgccc cctcgcgtca    22140

    ccacctcgcg ggctgcggtt ccgggtgggc gggtgggcga aaccccgcgc cgccaggcgc    22200

    gggaaacccc acggcgggtc agccggagag tccacggaac ccccgcaggg gaggcggtcc    22260

    gccggaaagg cggaggaggc cgcggtccgc cgccagaacg cccgcctgga agcgactctc    22320

    cgcccccaac tccgccatca tctccgcgat gtgccgccga cacgtccgcg tggacatgtt    22380

    catccgcttg gcgatgacct cgtccttcgc cccggccgcc atcagccgca agatgcccgc    22440

    gcggatctcg tcggcggcgg ggccgtagcc cacgtgcgtg tagacgaagg gtttcgccag    22500

    gcgccagacc tgttcgatgg tccggtagag gtagtccacg accgccgggt ggcggatgac    22560

    gaccgcgccg gggccgtcgg agcggcggtc ggccaggaag gccagcgatt ggtcgaagat    22620

    gacgacgcga tcgagcaccc cggtcgtggt cctgatctgg gtgccggcct cgtgcatcag    22680

    cgagaagtgc tgctggaccg ccgggctcga caggacggtg tgcggataca cggtccgtat    22740

    ggcgatgccc cgggtcagca gggacaggtc ccgggggcgg ctgtcggcga gggtgctctc    22800

    cagcagggct tcgggctggg cggtgagcac ctcgtgccgg cagtcgcgcg cggcagcgct    22860

    caacagcccg cggatcgtgc tgatgtcggt gagggactcg atctgcggcg ccttccgggc    22920

    gcgcccctcg ttgaccgcgt cgtacgcgtc ctggagcgag gccatggcgc tgcgcagccg    22980

    ctcgtcctcc aggcgctgcc gctggatctc gccctcgcgg accgcgctca gcgcggcggc    23040

    cgccgactgc gggctgatcg cggccagcag tcgcccgcgg tccgtgtgct ggatcaggcg    23100

    cagcgcgacg agcgcgtcga tcgcctccgt gagttcgtgg tccccgtcgg cgtccgttcc    23160

    ctcgccgctg tgttccgggg ggccgggcgt gcgcagggcc gtacggggca gggagccgcc    23220

    ggcccgcagg atctccaggt acacggcgcg ggcccggccg gtcagccggg cctccgtcag    23280

    ggggcacacg ccggtcatcg gccggcctgc ccggcgccct ccaccacggc gggctcccag    23340

    accggggcgg tcacctcctt gaccgcgccg tccccccgga agtgcaggaa gcggtcgaag    23400

    gaccgggtga accagcggtc gtgggtgacg gccagtacgg tgccgcggaa gcccgcgagg    23460

    ccctgctcca gcgcttcggc gctcgcgagg tccaggttgt ccgtcggctc gtcgagcagc    23520

    agcaaggtcg ccccggagag ctccaggagg aggatgagga agcgggcctg ttggcctccg    23580

    gacagcgtct cgaagcgctg gccgccctgg ccggccagtt cgtagcggcc gagggcggcc    23640

    atcgcctcgt ccctgggcag gctgtcgcgc cggacgtcgc ccttccagag gatgtcctcg    23700

    agggtgcggc ccacgagttc gggccggtcg tgggtctggg agaagtgccc gggcaccacc    23760

    cgggcgccca gtcgggcgct gccggtgtgc gccacgggct ccagcggggt gagcgacggc    23820

    agctcggggt cgctgccccc gcggcccagc agccgcagga agtgggactt gccggtgccg    23880

    ttcgccccca ggacggcgat gcggtcgccg taccaggcct cgaagccgaa gggatccgtc    23940

    agcccgtcca gtcccagccg ctcgcagacg acggcccgtt tgccggtgcg gtcgcccgtc    24000

    agccgcatcc ggatgttctg ctcgcgcggc cggggcggcg ggggcggctg cgcctcgaac    24060

    ttcgccagcc gggtgcgggc ggcctgcagc cggctggcca tggcgtcgtt gtgcgaggcc    24120

    ttgacctggt agtggcggac gagctccttg agcttggcgt gctcctcgtc ccagcgacgg    24180

    cgctcctcct cgaagcgctc gtagcgggag acgcgggcgt cgtgccagga ggcgaacgag    24240

    cccgggtgca tccaggcgga gccgccctcg acggtgacca cgcgcgaggc ggtgttggcc    24300

    agcagctcgc ggtcgtgcga gacgtagagc accgtcttcg gggactcggc gaggcgggcc    24360

    tccagccggc gcttgccggg gacgtcgagg aagttgtcgg gctcgtcgag gagcaggacc    24420

    tcgtccggcc cggcgagcag gagcgagagg gcgaacctct tctgctcgcc gcccgacagg    24480

    gtgcgcaccg gacgcgaacg ggcctcgtcc cagggtgtgc cgaggatgtc ggtgacgacg    24540

    gtgtcgaaga cgacctcctg ttcgtatccc ccggcgtcgc cccaggccac cagggcctcg    24600

    gcgtagcgca gttgtgcctt ctcgccggcg ccgggtacgg ccatcgcggt ctccgcccgc    24660

    gccagtgcct cgccggcgcc gcggagcccg gcgggggaga gggagagggc cagcccggcg    24720

    agcgtggtct cgtcgctgac catcccgatg aactgccgca tcacgccgag cccgcccgag    24780

    cgggcgacgg ccccgcgcgt cacggggaga tcgcccgcga tcatgcgcaa caacgtggtc    24840

    ttgccggcgc cgttcggtcc gacgagggcg accttcatgc cctcgcccac tctgaaggag    24900

    acgtcttcga agagaacgcg cccatctggc agtacatgac ggagacttgt cacatcgaca    24960

    tatcccatgt gcggaatctt gcaacatgca cgggatctct gtcacgcgac tttgcggaac    25020

    cagccactct ggtatgtatc cctgggtaag cggcttgatt cgcatgtccg ttcgcaaggg    25080

    gtggatgtcc tttccggctc ttgatctcgt gtgcgccagg cggtaattgg gcccgttcgg    25140

    ggggcccgtt tcccgtaggg tggacgcgtg atcgaggacg gcggcagcgc gcggggaagt    25200

    gtcaccacgg tgcggcgtgt gggggacacc gtccgccgtc cgcgcggccg ctggaccgcc    25260

    aacgtgcacg ccctgctgcg ccatctggcg gacgccgggt tcctccgcgc gccccgggcg    25320

    ctgggcgtcg acgaggacgg gagcgagatc ctgtccttcc tcgacggcga ggtcgcgatg    25380

    cgtccctggc cggccgcgtt gcgggagcgg tccggtgttg tcgagctggc cgtgtggctg    25440

    cgcgaatacc acgatgttgt acgggacttc cgtccgccgt gccctgatga gtggttcgtg    25500

    cccggtgtct cctggcgtcc cgggcggctc gtccgccacg gtgacctggg accctggaac    25560

    tccgtctggc gtggctcccg gctcgtgggc ttcatcgact gggacttcgc cgagcccggc    25620

    gatcccctcg acgacctggc ccagctcgcc tggtactgcg tccctctggg cgggcgtgcg    25680

    actggggcgg gcggtgagga gagccgggtg cgggtccggg agcgcctcgc ggccgtgtgc    25740

    acggcctacg gggccgagcc cgtgtccgtc ctggacgccc tggccgggct gcaggagcgc    25800

    gaggcccgcc gcatcaccga cctgggcggc cggggcctcg agccgtggac gtccttcctc    25860

    gcccggggcg acgcgacggc gatcgaggag gagcgcgctt ggctgctgac ccaccgggag    25920

    gggttgctgg tgggatgagc gggcccggtg ggtggggcgg gggcggggtg gggtggacgg    25980

    gcccttgacg gggctgagct cttcgcggtg cctgccttca ggggagggtg ccccgtgttt    26040

    tcctccagcg gcgaagagct ctttacgccc ctaccagggc ccgtccgccc caccccgccc    26100

    cctcgcgtca ccaccaccgg tcgctcgtgg ccgagcaatc aggtccgggt gatcggggcg    26160

    ggtgggcgaa atccccgcgc cgccaggcgc gggaaccccc caccggcggg cagccggaaa    26220

    gccacggcac cccgccaggg ggtcacgggc gcgtgggggc atccgtcgat cgatggccgc    26280

    ccggcggtca gacgtccgcg tcgcccgcca aaaggtcgac gccgaacagc tcccgaaagg    26340

    cccgttcacc cgctgcggtg atcttcaacg cccgcccgga cccgatccgt tccacccagt    26400

    gccgctcgag cgccgcacgg caaagcgccg cgccgagcgc accgccgagg tgcccccggc    26460

    gttcggtcca gtccaggcag ctgcggacca cgggtctcga ccccgtgcgg accggcaggg    26520

    ggacgcccag ctcggcgagg cgggtccggc cgtgcccggt gatggagagc ccggcgtcgt    26580

    cggtgacgat cccctgtccg agcagggcgt cggagagggc cacccccagg cggccggcga    26640

    ggtggtcgta gcaggtgcga gcccgcgcct cggcgctcgt ccggctcgcc ccgcgcaggt    26700

    tgccgggggc cgggtcgggc ggtgaccagg aggtcaggtc ctcgatcagg gcggccactt    26760

    cgggcccggc cagccggacg tagcggtgcc ggccctggcg ctcctcggcg agcaggccgg    26820

    cggagatcag ccgggagagg tgctcgctgg cggtggaccg cgcgactccg gcgtgccggg    26880

    ccagttcgcc cgcggtccag gcccggccgt cgagcagggc cgtgcagaag gcggcccggg    26940

    tccggtcggc gagcagcccg gcgatctgag cgagtgacat gcgcccatca tgcggcggga    27000

    tcggttcggc ggccgccgaa cagttccgct cctaccgtcg gggcatgacc cacaccccgc    27060

    ataccttcac ccggtacgcc gccgtcggca ccccggtcgc cctcggcgat ggcgtgccga    27120

    tccgggcccg cgcgtccgtg gcggaccaca ccccggtctg gcggcccgca gccgccgcta    27180

    cggccgcagc cgaatccgtc gccaccccgg cggcagccga gcgcctcgcc gccccggcct    27240

    cggccgcaac cgaggccacg acccccttcg cggccttcgc cgcgctgcat cggcccggct    27300

    cgccgcttct gcttcccaat gcctgggacc acgcctcggc ggtggctctc gtcgaggcgg    27360

    gcttcctggc gatcgggacg acgagtctcg gtgtggccgc ggcggtcggt cggcccgacg    27420

    ccgtgggggc gacccgggag gagaccctgc ggctggcccg gcggctcggg cgggggcggg    27480

    aacgggggcg gttcctgctg tccgtggacg ctgaaggcgg gttctccgac gatccggcgg    27540

    acgtggccga gctggcccgt gagctggccg gggccggggt ggtcggcatc aacctggagg    27600

    acggccgctc cgacggcacg ctcgcccccg tggagctgca cgtcgcgaag atcgaggcgg    27660

    tgaaggccgc ggtccccggc ctcttcgtca acgcccgtac cgacgtctac tggctgggcg    27720

    gcggccagga gggcgaggac aaggacgagg acgagacgtc gtaccggctc gacgcctaca    27780

    gccgggcggg cgccgacggc gtgttcgtac cgggcctgtc cgaccgtacg ggcatcgcga    27840

    ggctggtgga gcggctccac gtgccgctga acatcctcca caccccctcc ggccccaccg    27900

    tcgccgagct cggcgagctg ggcgtggcca gggtcagcct cggttccctg ctgttccggg    27960

    tggccctggg cgcggcggtc ggcgcggcgg tggacatccg ggcgggccgt ccggcgggag    28020

    cgggcgcgcc gtcctacgac gaggtccagg accggatccg gatcacgggc ccgctgggct    28080

    gagctcagcc gacgcgtacg gccaggacgg cgatgtcgtc gttgaggccc tggtcgctgt    28140

    ggtcgaggag atcgcggtgc agcctgtcga gcagctcgcg ggggtgggcc gggggctgct    28200

    gccgcatcca gtccgccagg gggaagaagc cgccgtcgcg gccgcgggcc tcggtgacgc    28260

    cgtcggtgta gaggagcagc tgatcgccgg gggcgatgtc gaaggtgtcg acggtgtagg    28320

    agtcgccgat gaggtccgcg aggctgagca gcggggaggg ggccgtgggt ttcagggagc    28380

    ggagttcccc gcggttcagg aggagcggtg gggggtggcc gcagttgagg atccggatgc    28440

    ggccgtcctc gtgcgggatc tcgacgagga gggcggtggc gaagcgttcc accaggtcct    28500

    cggggggaaa cgcggcgctg tagcggctgc tgctggcctc cagacgccgt gcgatgccgc    28560

    ccaggtcggg ttcgtcgtgg gcggcctccc ggaaggagtt caccaccgcc gcggccgccc    28620

    ccacggccgg caggcccttg ccccgtacgt cgccgatgag cagccggact ccgtacgcgg    28680

    tgtcggccgc ctcgtagaag tcgccgccga tccgggcctc cgccgcggcc gcgaggtaca    28740

    gcgagtcgat ctcgacgtcc ccgaagcggc gcggcatggg ccccaggacc accatctgcg    28800

    ccgcgtcggc gacgagccgg acctggaaga gggtgcgttc ccgctggagc cgcacatggc    28860

    ttccgtacgc cgccgccacg gtgacggcga cgatgccccc cgccgtccac cacgtcccca    28920

    gcccggggaa gacgatgctc aggccgatca tgaggaacag gcagaccgtc cccagcagca    28980

    cggtggggag cacgggccac atggctgcgg cgagcgcggg cgcggcgggc aggagccggc    29040

    tgaaggccat gcgccggggc gtgttgtagg ccagggcggc gatgaccacg gtcaggatca    29100

    ccggggagag gagaacaggg gaccacctgc cgtggagacg gcggggccgc ggccggtcat    29160

    gcttgaccat gagacatagc ttatccgtat aaaacggaca tagggctccg ggaagtcacc    29220

    cggtcggagg gtctcctagc cctgtgtggg gcgaggggag gggtggtggg gcgggtggtc    29280

    gtgggtcggc gggtccagga agcggtcgac cagcagacgg cgcgggcccg gccccgccct    29340

    cccgagccgg tccttgggat tggccgccat gcagcggtcc agggacaggc atccgcagcc    29400

    gatgcagtcg tcgagccggt cgcgcagccg tgtcagctgt tcgatgcggg cgtcgaggtc    29460

    gtcccgccag ctccgggaca gggcttccca gtcctcctgg ttcggcgtgc gccgctcggg    29520

    caggtcggcc agcgcttcct ggacctcgcg cagggagatg ccgacgctct gggcgacccg    29580

    tacgagcgcc acctgccgga gcgtggcccg ggggtagcgg cgctggttgc ccgaggtgcg    29640

    gcggctgtgg atcaggccca tggactcgta gaaccgcagc gcgctggtcg cgacgccgct    29700

    gcgctccgcg agctcgccga tggtgagttc cttcgcgttg caagggggcc tttccatgtc    29760

    tccaccgtat ctgggtcttc aagttaagtt gaggtttttg gggtgggggc ggtggggggc    29820

    ggtgcgcggt gcgccgtgcg cggtgagccg cgtacggcgt acggtcggcg ctccgcctca    29880

    gcgctccgcc cgtacggacg tggccgagcc gcgccgcccc gcgcaggcgg tgacgcccgc    29940

    cagggccgcg acggcggcga acccgaacag gacgtagtgc gccgagcgcg tcatggcggg    30000

    tgcgccgagg ttgaccagga cgccggcgag ggcggcgccg aaggagaagg cgaacagccc    30060

    gatcgtgttc agggccgcgg acgccttcgc cgcctcctcg gggtcccggg tgctgcccat    30120

    caccgccgtg gacaggtggg gcatggccat gccgatgccg gagcccgcca ccagataggc    30180

    cgcggcccag gccgccaccg tgagcggtcc ggcgtcctcg cgctggagga ggcccgtgag    30240

    cgtcaggccg gcggccagga cgaacggtcc cgccaggctc aggcggccga gcgtcgcggg    30300

    ccgggcgccg gagaccgcga cctgcgtcag cgcccacccg acgggcaacg aggtgcccag    30360

    gaagccggcc gccaccggcg gcagaccgcc cagccgctgg ccgaacaggg agatgaacgc    30420

    ctcgacggag gcggcggtcg tgatgaggac cctgacgagg tagagccacc ggagcgagga    30480

    cccggcggcg taggtcgccg ccggcagcac ccgggcgcgt gctccgggcc gccgctcgct    30540

    catcacgtag accacgatca gggcgcacgc gacggtgacg gccacggcgg tgggcccggg    30600

    cccggacagc acgccggcca cgctgatcac cgtcgccgtc gcggtgagca gcaccaggga    30660

    gaccagtggg agcgcgccgg cgtcccccgc ccggcggccc gagggaacgg ctcgcgacac    30720

    gagtgccacc aagggcagcg ccaggaccgc cacgacggcg aacgccagcc gccaggcccc    30780

    gagctgggcg aacagcccgc cgatcgcggg cccgacgaag aagccggccg ccatcatcgc    30840

    cgacaccagg cccgtgcccc gcgcccagag gcgctcgggc agcaccgact ggacggtgac    30900

    gtagctcagc cccgccagga gcccggcgcc gaacccctgg aggacccgcc ccgccagcag    30960

    cacctccatc gtgggcgtga cggccgcgac gaccgtgccg aggacgaacg ccccgatgcc    31020

    gatccggtag ccgccccggg ggccgcgcgt ggacaggacg cggctgacga gcatcgcgga    31080

    gatcaccgag gcgatcgcga aggcggtcgc ggtccacgcg tagaggcgtt cgccgccgat    31140

    gtcctcgatg gccgtgggca gcaggctggt ggtcacccac gtactggtgc cgtccaggag    31200

    catcaccccg gcgagcagca gagcggtggc ccggtgttcg ggcccgaaga gctcgcgcca    31260

    gccgccgggg cgtgtgccgg ggaggggtac ggaagtctcg gacgtctcgg agatctcgga    31320

    ggtgttgttc ggtatcgcca cccccgcacc aaacaacttc aacagctctt gaagtcaacc    31380

    gcgcgtccgc gcgtccacgc cggtgggctg ccgtacgagt ccaggttgtc ggtcatccgc    31440

    tccaggacgg tgacggcgat ccggtactcc tcgcgggtga tgccgaccgt cgacagctcg    31500

    cggaaggcgt ggacgtgctc ggcgacgtcg gcgaggcggg tacggccgtc ttcggtcagg    31560

    gccagacggc ccggttccgg gcgggcgacc cagccgtcgg cgatgaccgc cccgatggcg    31620

    gcggccaggg cggtggcgtc cgcgttggcg gccaggacgg tcagcacttc ggtgtcggtg    31680

    gcctgtggat cgtccttgat gacgttgagg acctgccagt cggtccgggt gatgccgaat    31740

    ccggccagca aggagttcat acggtgggtg agagcgctgt cggtgcggtt gagccagtag    31800

    ccgatgggct tcatgttcgc gttcctgagc cgggtcagtg atgccgggcc ccggccttgc    31860

    ggggcagcag gcgtacgagg gcgcagcagg cgagggtggc cgcggcgacc acggcgaggc    31920

    tgtggacggt cgcggtcgcg gttgcggtcg tggaggcgcc ggggcgtgga agcaagggga    31980

    cggacctgtg cggtgcgggc ccggccggat cagtgccggg tgaaggcggc ggcgttctcg    32040

    cgcgcccact gccggaaggt gcgggcgggg cggccgagga gggtacgggt ggtgtcggcg    32100

    atggccgcgg gaccgtggtc ggcggcctcc cacaggtcga gcagcgaggt gaccatcggc    32160

    gcgggcatgt agtggcccat ctgctgctcg gcctcggcgc gggtgatgcg ctcgacgggg    32220

    atctcgcggc cgagggcgtc cgcgaggacg gcgagttgct cgcggaacgt gagcgactcg    32280

    gggccggtca gggtgaccga gcggccggtg agggaggtgc cggtcagcgc ctcgacggcg    32340

    atgtcggcga tgtcctcggg gtggatgggc gcgatgtgcg cgtccgggta ggcgagccgg    32400

    acgggcagcg accggccgat gaagtgggcc cagccgaggg agttgctggc gaaggcgtcc    32460

    gggcgcagga acgtacgggt gagaccggag ccggcgaggg cgcgctcgac ctggaggctg    32520

    tggcccgcga gcgggtcggt ctcggcgtcc gggcccagga ccgaggagga cgagagcagg    32580

    acgacgtgct cgacaccggc gccctcggcc gccttgatca gctcatggat gccggacggc    32640

    tgggggtaga ggaagacctg gcggacgccg cggagcgcgg ggccgaaggt ctcgggccgg    32700

    tcgaggacga gctcggcggt ctcgacgccg tccgggacgg ccagttcggc ggggaccgcg    32760

    ctggcggcgc ggacggtgag gccggcggag tgcagacggt gggtgaccgc ctgggcgacc    32820

    ttgccgcggg cgccggtgac gaggatggcc atggagtgct ccattcattg ctgatgacat    32880

    atgcatgctt gcatgcacac atttgttggt caacacatgc cttcgtgatg tcatccatgt    32940

    ctgtacgatg aggggcatgg cgaagcgcga acccaagacg gcggacgagc tgctggacgc    33000

    cgtgggcccg gccttcggga agctgcggcg ctcctcgctc ctcgaggtcg agaacccgat    33060

    ctcccagaag gacctgagcc gcacgctggt gctcagagtc gtcctggagg cggaacggga    33120

    agcggagccg gcagcggaac agggcgccgc gcagggcgag gcggacgagc ggtccgacgc    33180

    cggggagatc acggtcggcg cggtcgccca gcacctggga gtggacccgt cggtggccag    33240

    ccgtatggtc tccgactgca tctcggccgg ctatctggtc cgcgcggcct cccagcgcga    33300

    cggccgccgc accgtcctcc acctcagccc cgagggccgt gagctgatgg cccgcttcgg    33360

    ccgccaccag cgctcggcct tcgagtgcat caccgccgac tggaccgagc gggaccgcct    33420

    ggaattcgcc cgcctcatgc tcaagtacgt cgactcccag gacgccctcc gccaccggcc    33480

    cccggtcaag gacgccgtgc gctgaaccgc ccggcgggcc gtcccccggg cggctcgtcc    33540

    ccgggcggtg cgctcgctgg tgcgacgacg gtgtgaccgt aggcgcgaca gtacgaccgc    33600

    gggcatcacg ctgtgaccgt aggcgcgatg gtgcggccgc aggtgcgacg acggcacgac    33660

    cgcaggcatg acgaaggccc cgaccactcg agtggtcggg gccttcgtgg cagctgacgg    33720

    catacgaacc cgcccgcctc acccctcctt cggcgcaagg ccggtgagcg cggcccccag    33780

    ccggcgcgcg ccctcggcca gctcggcgtg atcggcggtc gcggcgaacc cgatgcgcag    33840

    gtgggccgca ggcggctccg cggcgaagtg gcgactgccg gcgctcacgg cgacgccgcg    33900

    ctgccgggcg gcgccggcga gggcggtgtc gtccacgccc gacggcaggc ggacccacag    33960

    gtgcagtccg cccgtgggca accgggccag ggtcgcatcg ggaagctcct gggcgatcgc    34020

    cgcggccagg acggcgcacc gctcccgcag cgccgtaccg agggaacgga cgtgccggtc    34080

    ccaggacggg gagctgagca cctccagtgc cgcctcctgg agcgggcgcg tgacgaagaa    34140

    gtcgtcgacc aggcgcaccg cccgcatgcg ctccatgacc ggtccgcggg ccaccagcgc    34200

    cccgatccgc aggctcggcg cggcgggctt ggtgagcgag gtgacgtgga cgaccgtgcc    34260

    gtcacggtcg tcggcgatca acggccgtgc cacggcgccg ccgtgtccca ggtgccgtgc    34320

    gaagtcgtcc tcgagcacga aggcgcccga ggcgcgcgcc acgtcgagga tctggcggcg    34380

    tcgttcgggt gccagcacgg cgccggtcgg gttctggaag gtcggctggc agtacagcag    34440

    tcgcgcgccg gtcatcgcga acgcgtcggc cagcatgtcg ggccgcaggc cgtcggcgtc    34500

    gagcggtacc ggaaccggtc gcagccccgc ggcgcgagcc gcggccaggg cctggggata    34560

    ggtcggggac tccaccagga ccgggctgcc gggaccggcg atggcccgga acgcgatcga    34620

    cagggcactc tgcccaccgg cggtgaccag cacgtcctcc ggcgccactc cgccgccgac    34680

    gatccgggcg aacacggtgc gcagcgccgt cagtccgtcg gccggggcac ggtcccaggc    34740

    gtccggacga cgtgccgccc gcgcgagcgc cgcgctcagg gcccgggcgg gctggagcga    34800

    gctgtgcacg tagccgccgt ccatcgcgat cgtcccggcc ggtggcgggc cgagcggctc    34860

    ggcgatcagg tgggtgtcga ccgcgcggtc ggtgagggcg accgtctgcc agtcggtgtc    34920

    catctgccag ttggcgtcca tgtcgccgcc gctaccgccg cccctgccgc cgcccgcgcc    34980

    gcggagtcgg ctgcgctgcg ccacgaacgt cccgctgccc gggcgggtca ccaccgcgcc    35040

    ctcggcggcc agcgcggcga tggtccgcgc cactgtcgcc ggaccgatcc ggtactcctt    35100

    gatcagctcc cggctgctcg gcagccggtc gccgggcgcc agccgggaga ccagcgcgcg    35160

    gaggctatcg gccaactcgg cagaagtgct accgtcgttc atgagagatc acagtagcgc    35220

    ttctggttct gctcgggaag cacttcagct ggacgtcccc gccctgcggg ccgacacccc    35280

    ggggtgccgc cgggtcatcc acttcaacaa cgcgggctgc ggactgatgg cggcgcccgt    35340

    gacggacgcg atggtcggcc atctgaacct cgaggccagg atcggtggtt acgaggcgtc    35400

    ggccgcccgg gccgccgagg tccgcgggtt ccacacggag atcgccgccc tcatcaacac    35460

    cacacccgac aacatcgcct tcgccggcag cgccacccac gcctacgcca acgccctgtc    35520

    ctcgataccg ttcgaggccg acgacgtcat cctcaccacc cgcgacgact tcgtctccca    35580

    ccagatcgcc ttcctctccc tgcgcaaacg attcggcgta cgcgtcgtcc acgcgcccaa    35640

    caccccggag ggcgggcccg atgtggaggc gatggccgcg ctgatgcgga cccaccgccc    35700

    ccgcctggtc tccgtcaccc acgtcccgac caactcgggc ctcgtctcgc ccgtcgccgc    35760

    gatcggccgc cactgccggg agctggacct gctctacctg gtcgacgcct gtcagtcggt    35820

    gggccagctc gtcatcgacg tggaggagat cggctgcgac ctcctcaccg ccacctgccg    35880

    caagttcctc cgcggcccgc gcggttccgg cttcctctac gtatccgatc gcgtcctgcg    35940

    cgcgggttac gaaccgctgt tcatcgacat gcacggggcc cgctggaccg agccgggcgg    36000

    ctacgagccc gtggggacgg cggcccgttt cgaggagtgg gagttcccgt acgccacggt    36060

    gctcggcagc gccgccgcgg tgcgctacgc ccgcgaggtc ggtgtcgagg ccatcgagcg    36120

    gcgcaccccg gcgctcgcgg cccggctccg cgaccggctc gcacccatcc cgggggtgcg    36180

    cgtgctcgac cgcggcccgc gtctcgccgc gctcgtcacc ttcgaggtag cgggctggca    36240

    gccgcagccg ttcaaggcgg ccatggacgc ccgaagcatc aactcggcgc tcagcttccg    36300

    tgagttcgcg caattcgact tcggggacaa ggacgtcgac tggtgcctcc gcctgtcgcc    36360

    gcactactac aacaccgagg aggaagtgga ccacgtcgcg gaggcggtcg cggccctcgc    36420

    cggccagggg cggcgatgac cgacacccgg acacgcgcgg aggagccggc cggggaacgg    36480

    cctgaggagc cgcccgggca acggtctgaa gggccgcccg gggaatcgca cgcggagccg    36540

    tccgcggagc cacccggggg aagcctctgg cacaaccgcg acttcctcag gttctggttc    36600

    ggcgagacgc tgtcgctcct cggtacccag gtcacgaacc tcgccctgcc gctgaccgcg    36660

    atcaacgcct tccacgccac cgacgagcag gtcggtgtcc tgcggttcct gcagctcgtc    36720

    ccgtacctcg gtctcgccct ggtcttcggg gtgtgggtgg accgggcccg tcggcggcgg    36780

    atcatgctgg gcgccaacct cgtccggatg gtcctgctga ccctcgtacc cgtcctgtac    36840

    tggtcggacg cgctcgacat ggtctccctg ctggtgatcg cctgtgccgt cggcgccgcc    36900

    tcggtgctgt tcgacgtgag ctggatgtcg tacgtgccca cgctcgtgcg cgagcccgag    36960

    cactacgtcg aagccggcgc caagatgggg atgagctcat cggcggccga tgtggcgggg    37020

    cccgggctcg cgggcgtgct ggtgggcgcc ctgagtgccc cggtggcgct gatcgccgac    37080

    gcgttctcct atctggtgtc cttgatctcg ctgctgctca tccgcacgcc cgagccccgc    37140

    cccgaaccgg cggccgcgcg gaggcatctg ccgaccgaga tccgggacgg cctgcgctgg    37200

    gtgctgaaga acccggtcct gcggtcgctg gccgtgatcg gcttctgctg caacttctcg    37260

    atgatcaccg tctggacgat gttcctgctg tacggaacgc gcgacctgcg tctggactcg    37320

    acgaccctcg gcgggatctt cgccaccgct tccgtgggcg gactgatcgg cgccgcgatc    37380

    tcccgcaagg tcatccggcg cttcaggctc ggcctcgtct acctcgtcgc ccagtccgcc    37440

    ctcctcgtcg gcccgacgct gatcgtcctg gcgaccggtc ccaggtgggt gatggtgggg    37500

    atgttcgtcc tctccttctt caccacctac ctcgggctcg gcgtcgccgc cgtcgtcatc    37560

    gtcagcctgc gccaggtcag taccccgccg tcgatgatgg gccggatgac ggcggtcttc    37620

    cgcaccctgc tcttcggtgg cggcgccctc ggcggcctgt tcgcgggcct gctgtccggc    37680

    cggatcggcg cccgaggggc attgaccgtg gcggcgaccg gatccgccgc cgtactgatc    37740

    gcgctcgccc tgtccccggt gacccggcta cggggcctgc cgccggcaac ggaggaaccc    37800

    gtcgcggcgg cgaactgagg tcgcggcgac gtactgaggt cgcggcggcg aactgaggtc    37860

    gcggcggcga actgaggcgg agaacgtcga agggccccac cgcaagcggt ggggcccttc    37920

    gagtcgtgcc cggtgaggca ctggcggagg atacgagatt cgaactcgtg aggggttgcc    37980

    cccaacacgc tttccaagcg tgcgccctag gcctctaggc gaatcctccg ccgcaaacaa    38040

    tacaagactc cgaggggtgc tcgcgaacac gtgctctcgg gagggcctcg gaaggacccg    38100

    ggaggacccc gggagggggt ggagtgggtc gaggggtggc cgagcacccc cggcgatccg    38160

    ctaggctggg ggcaagcccc tcacgtggcg ctatctcacc caactccccc agggccggaa    38220

    ggcagcaagg gtaagtgggc tctggcgggt gcgtgagggg cccttgtgtt ttccggggga    38280

    tcccgggggc tccgggagcc aggagcgggg cggggagcgg gctccgggat ctgtgacgga    38340

    gaccacttgt cggtggggcc cgatatcgtc gtaggtgtgt cgtccctcgc gctctaccgc    38400

    cgctaccgcc ccgagtcctt cgccgaggtc atcgggcagg agcatgtcac caccccgttg    38460

    cagcaggctc tgcggaacaa ccgggtcaac cacgcgtacc tgttcagcgg cccgcgcggc    38520

    tgcggcaaga cgaccagcgc gcgcatcctc gcccgctgtc tgaactgcga gcaggggccg    38580

    acgcccactc cctgcggcga gtgccactcg tgcgtggacc tcgcgcgcaa cggtcgtgga    38640

    tcgatcgacg tcatcgagat cgacgccgcg tcccacggtg gtgtcgacga cgcccgtgag    38700

    ctgcgcgaaa aggccttctt cggccccgcc gccagccggt acaagatcta catcatcgac    38760

    gaggcccaca tggtcacctc ggcgggcttc aacgccctgc tgaaggtcgt cgaggagccc    38820

    ccggagcatc tgaagttcat cttcgcgacg accgagcccg agaaggtcat cggcacgatc    38880

    cgttcgcgta cgcaccacta tccgttccgg ctcgtcccgc ccggcaccct ccgtgactat    38940

    ctgggcgagg tctgcgagca ggagaagatc cccgtcgagg acggcgtcct gccgctggtc    39000

    gtccgggccg gtgccggttc cgtgcgtgac tcgatgtccg tgatggacca gctgctggcc    39060

    ggcgccgccg aggacggtgt gacatacgcc atggcgacgt ccctcctcgg ctacacggac    39120

    ggctccctgc tggacgccgt ggtcgacgcc ttcgccgccg gcgacggcgc cgcggccttc    39180

    gaggtcgtcg accgcgtcat cgagggcggc aacgaccccc gccgcttcgt cgccgacctg    39240

    ctggagcggc tgcgcgacct ggtgatcctc gccgccgtgc cggacgccgc cgagaagggc    39300

    ctcatcgacg ccccggtgga tgtcatcgag cgcatgcagg cccaggcgtc cgtcttcggc    39360

    gccggcgagc tcagccgcgc cgccgacctc gtcaacgagg gcctgacgga gatgcgcggc    39420

    gccacgtccc cgcgcctcca gctggagctc atctgcgcgc gcgtgctgct gcccgccgcc    39480

    ttcgacgacg agcggtccgt acgggcccgc ctcgagcgtc tggagcgcgg cgccgcgagt    39540

    gcggccgccg ccttcacgcc cgcgcccccc ggtacggcca tgggctacgt ccccggtccg    39600

    gatgcccacg cccacgctcc cgccccggcc gccggtctct ccggcccggc ggcggcccgc    39660

    gcggccgtga cgggggcggg gcccgcggca ggtcctgccc ctgttcctgc tgcccctgcc    39720

    cctgctgctg ctcctgtcgc tgccgttccc gcgtcgggtc aggccgctcc cgctccggcg    39780

    caggctccgg gcgcgcaggc cggtggcgcg tggccggcgg gcgccgcccc cgccgccccg    39840

    gcccccgccg cctccgcgcc cgcatcgcag cccggcgcgt ggcctgcggc ctccggcgcc    39900

    cccactcctg ccccggccgc cccgcaggcg ggtccccagc ccggcgcctg gccgaccgcc    39960

    gcggcgcccg gctcgggccc cgcgcaggct ccggcccccg ccgcgagcgc cccgcaggcc    40020

    ggttcctggc ccacgggcgc cgcccccgcc gccccggctc ccgccgcgcc cacgggcgcg    40080

    cccatgggcg ccccgcaggg cgacgcaggc caggcgcgcc agctctggcc gaacatcctg    40140

    gaggccgtga agaaccgccg ccgcttcacc tggatcctgc tcagccagaa cgcccaggtc    40200

    tccggctgcg acggcatcac gctccaggtc ggcttcgcca ccgccggagc gcgcgacagc    40260

    ttcgccaaca gcggtagcga ggacgtcctg cggcaggccc tcggcgacct cggcctgcag    40320

    tggaagaccg agctgctcgt cgatccctcc ggcggcgcca acgcgcccgg cggcggctcg    40380

    ggcggcttcg gcggcggctc aagcggtttc ggtggctccg gcggttccgg cggtggctac    40440

    ggaggagggt tcggcggcgg cgcccctgcg gcctccccgg cccccgccta cgcccgcccg    40500

    caggcccagg cccaggccca gagcccggct cccgccccgg ccgcctccgc cccgcagcag    40560

    gccgcgtccg ccgccccgga gtcccgtccg gccccgtcgg cggccccggc cgccggcccg    40620

    gcgcagcggt acggcggcga gcccgaggcc cccccggtcg cccccgagga cgacatcccc    40680

    gccgaggacg atccggacct cgacgacacc gccctgaccg gccacgatct gatcgtgcgc    40740

    gagctcggag cgaccgtcat cgaagagatc gccaacgaat aacgggcgaa caatcaccgc    40800

    cgcgcagtcg aacgagtgcc cggatgtgta aagacgtcgc aggtcaggag cgcgggcggc    40860

    gcgaagtgcg tcagtgcgcc cgttctcctt cctgcggcgt agggcgtacc gcgcggtgag    40920

    cacgtaggct cgggctaccg aagcaatcag tcgtcgagag cccaggagcg aaaccgtgtt    40980

    ccccggtggt ggtcagccca acatgcagca gctgctccag caggcccaga agatgcagca    41040

    ggatctcgcc aaggcccagg aggagctggc gcgcaccctc gtcgacggca cggccggcgg    41100

    cggcctggtc aaggccaccg tcaccggcgc gggcgagctc cagagcctgg tcatcgaccc    41160

    caaggccgtg gacccggacg acaccgagac cctcgcggac ctcgtcgtgg ccgccgtgcg    41220

    cgacgccaac gagaccgccc agaagatgca gcagcagaag ctcggcccgc tcgcccaggg    41280

    cctgggtggc ggcggcagcg gcatcccggg tctcccgttc tgacggaccc gacggccgga    41340

    gcggccgggt ccgtaaggtt ccggccgttc cgacagacgt agcactcctc cccgggccgg    41400

    ccccgtggag acaaccgcag acgcagaagc cgaagaaacc gaagaaggag aacccgatcc    41460

    gtgtatgaag gcgtggtcca ggacctcatc gacgagctgg gcaggctgcc cggcgtcggt    41520

    cccaagagcg cgcagcggat cgccttccac atcctccagg ccgagcccgc cgacgtccgc    41580

    cggctcgccc acgccctgac cgaagtgaag gccaaggtcc gcttctgcgc ggtctgcggc    41640

    aacgtcgcgc aggaggagcg ctgccgggtc tgccaggacc cgcgccgcga ccccgcggtc    41700

    atctgtgtcg tggaggagcc caaggacgtc gtcgccatcg agcggacgcg cgagttccgc    41760

    ggccgctacc acgtgctcgg cggggccatc agccccatcg agggcgtcgg cccggacgac    41820

    ctgcggatcc gtgagctgct ggcccggctc gcggacggca cggtcaccga gctgatcctg    41880

    gccaccgacc ccaacctcga gggcgaggcc accgccacgt acctcgcgcg catggtgaag    41940

    cccatggggc tgagggtcac ccggctggcc agcggtctgc ccgtgggtgg ggatcttgaa    42000

    tacgccgacg aggtcacgct cggccgtgcc ttcgaaggga gaagacttct cgatgtctga    42060

    cgcaacgctc cacgacgcca agcgcgatcc cgacgacttc gtcgtctcgc tcgcggactc    42120

    gatcgagagt ttcatcgtgg ccgtcacgga ggtgtcccgc ggcgacgagc ccgacagcgc    42180

    cgtgccgttc ctgctcctgg aggtctccca gctcctcctc acgggtggcc ggctcggcgc    42240

    gcacgaggac ttcgtcccgg acgagcgcta cgagccggac gtcggtcccg agccggacgt    42300

    cgacgagctc cgcgagcggt tcgccaccat gctcgacccc gtcgacgtct actccgaggt    42360

    cttcgacccc tacgtcccgc gcagcgcgcc cgtcgcctcc cggatctccg acgacctcgc    42420

    cgacatcatc accgacctcc gccacggcat ggcccactac cgcgacggcc gcgtcagcga    42480

    ggccctctgg tggtggcagt tctcctacct ctccaactgg ggccccaccg cctccgcctg    42540

    cctccgcgcc ctgcagtcgc tcgtcgccca cgtccgcctc gaccagcccc tggacgagct 42600

    cgacggcctc gacaccgacg tcatcggccc ggaggaccag ctggccgagg aagccggccg 42660

    cgtcatggcc gccgagatcg gcggcccgat gcggatgcga gcacgaggcg cctcccaggg 42720

    cgcctgaggc ggcctgccgg gatctgcgcc cctaggggcg cagcccgccg agttgtcgtc 42780

    tttcgggggc gccgcccgcc ggggtgccgg ccggggtggc cgtgccacgg ggccgccgcc 42840

    ctgcgggatc gtcgcctccg ggaaggacgt ccctagaggc cgccgccctc cgagttctac 42900

    gcccggcagt tggcgaccgt gccgcccgcg cggttgtcgg tacggcagat gttgtcgcca 42960

    cgcccgccgt cgacggtccc gtattcgccg acgacgatcg cggtgccgcc cggtccctgg 43020

    atgacgtcat cgtcgtcgtc cccggagacc gtgacgaatg cggcctgccc gatggagggc 43080

    acctcgatga ggtcggcgtc ggcgccccca cggacgtgga cggggcgtgc cttgtcgtcg 43140

    acgccgatcg ccccgacgcg gatgacgtcg tccccttcgt cgccgtcgat ggtgacgggg 43200

    ttggggagac gggacgacag gcgggaggcc ctttccacgg tgatcttgtc cgcgccgggg 43260

    ccgccacgga gcggtccgcc gagttccccg accgtgatgg tgtcgtcgcc gagtccgccg 43320

    tcgaggctgc tcgacttgtc ccaggcgggt acgacgtagg cggcgatgcg gagggtgtcg 43380

    tccccgtcgc cgccctcgat cctggtgctg aacacggcgc cggtggtgat cacgtcgttc 43440

    ccggcggcgc cgtcgatgag cccccggtac gacacggcgc ccgtggtgat gatgtcgttg 43500

    cccgcgccgc cgtagatggt gccctggacg ctccacgcgt ccttgtcggt cacggtgatc 43560

    c                                                                 43561

    <210>2

    <211>334

    <212>PRT

    <213>生裂链轮丝菌ZJU5119(Streptoverticillium rimofaciens ZJU5119)

    <400>2

    Met Glu Thr His Thr Phe Gly Thr Phe Gln Asp Ala Tyr Leu Ser Gln

    1               5                   10                  15

    Leu Arg Asp Ile Tyr His Ser Pro Glu Phe Arg Asn Ala Pro Arg Gly

                20                  25                  30

    Gln Ala Ser Arg Glu Arg Ile Gly Ala Gly Phe Arg Leu Leu Asp Pro

            35                  40                  45

    Val Gln Arg His Ile Ser Val Pro Ala Arg Arg Ala Asn Val Val Phe

        50                  55                  60

    Asn Phe Ala Glu Ala Leu Trp Tyr Leu Ser Gly Ser Asp Arg Leu Asp

    65                  70                  75                  80

    Phe Ile Gln Tyr Tyr Ala Pro Gly Ile Ala Ala Tyr Ser Ala Asp Gly

                    85                  90                  95

    Arg Thr Leu Arg Gly Thr Ala Tyr Gly Pro Arg Ile Phe Arg His Pro

                100                 105                 110

    Ala Gly Gly Val Asn Gln Trp Glu Asn Val Val Lys Thr Leu Thr Asp

            115                 120                 125

    Asp Pro Asp Ser Lys Arg Ala Val Ile Gln Ile Phe Asp Pro Arg Glu

        130                 135                 140

    Leu Ala Val Ala Asp Asn Ile Asp Val Ala Cys Thr Leu Ala Leu Gln

    145                 150                 155                 160

    Phe Leu Ile Arg Asp Gly Leu Leu Cys Gly Ile Gly Tyr Met Arg Ala

                    165                 170                 175

    Asn Asp Ala Phe Arg Gly Ala Val Ser Asp Val Phe Ser Phe Thr Phe

                180                 185                 190

    Leu Gln Glu Phe Thr Ala Arg Tyr Leu Gly Leu Gly Ile Gly Thr Tyr

            195                 200                 205

    His His Val Val Gly Ser Val His Ile Tyr Asp Ser Asp Ala Arg Trp

        210                 215                 220

    Ala Glu Arg Val Leu Asp Ala Ala Thr Pro Asp Gly Gly Pro Arg Pro

    225                 230                 235                 240

    Gly Phe Pro Ala Met Pro Asp Gly Asp Asn Trp Pro His Val Arg Arg

                    245                 250                 255

    Val Leu Glu Trp Glu Glu Arg Leu Arg Thr Asn Ala Ala Arg Leu Ser

                260                 265                 270

    Ala Asp Ala Leu Asp Ala Leu Asp Leu Pro Ala Tyr Trp Lys His Val

            275                 280                 285

    Val Ala Leu Phe Glu Ala His Arg Gln Val Arg His Glu Asp Thr Pro

        290                 295                 300

    Asp Arg Ala Leu Leu Ala Ala Leu Pro Glu Val Tyr Arg Gln Ser Leu

    305                 310                 315                 320

    Ala Val Lys Trp Pro Gly His Phe Gly Ser Pro Ala Gly Ser

                    325                 330

    <210>3

    <211>170

    <212>PRT

    <213>生裂链轮丝菌ZJU5119(Streptoverticillium rimofaciens ZJU5119)

    <400>3

    Val Thr Thr Thr Pro Lys Pro Arg Thr Ala Pro Ala Val Gly Ser Val

    1               5                   10                  15

    Phe Leu Gly Gly Pro Phe Arg Gln Leu Val Asp Pro Arg Thr Gly Val

                20                  25                  30

    Met Ser Ser Gly Asp Gln Asn Val Phe Ser Arg Leu Ile Glu His Phe

            35                  40                  45

    Glu Ser Arg Gly Thr Thr Val Tyr Asn Ala His Arg Arg Glu Ala Trp

        50                  55                  60

    Gly Ala Glu Phe Leu Ser Pro Ala Glu Ala Thr Arg Leu Asp His Asp

    65                  70                  75                  80

    Glu Ile Lys Ala Ala Asp Val Phe Val Ala Phe Pro Gly Val Pro Ala

                    85                  90                  95

    Ser Pro Gly Thr His Val Glu Ile Gly Trp Ala Ser Gly Met Gly Lys

                100                 105                 110

    Pro Met Val Leu Leu Leu Glu Arg Asp Glu Asp Tyr Ala Phe Leu Val

            115                 120                 125

    Thr Gly Leu Glu Ser Gln Ala Asn Val Glu Ile Leu Arg Phe Ser Gly

        130                 135                 140

    Thr Glu Glu Ile Val Glu Arg Leu Asp Gly Ala Val Ala Arg Val Leu

    145                 150                 155                 160

    Gly Arg Ala Gly Glu Pro Thr Val Ile Gly

                    165                 170

    <210>4

    <211>420

    <212>PRT

    <213>生裂链轮丝菌ZJU5119(Streptoverticillium rimofaciens ZJU5119)

    <400>4

    Val Ala Gly Ala Glu Phe Gly Trp Gly Ser Ala Gly Lys Leu Ala Ala

    1               5                   10                  15

    Ile Val Ala Ala Leu Arg Glu Arg His Gly Glu Arg Val Arg Phe Ala

                20                  25                  30

    Gly Leu Gly Ser Gly Leu Gly Arg Pro Val Leu Gly Ala Leu Asp Ala

            35                  40                  45

    Arg Asp Trp Thr Asp Val Pro Glu Pro Gly Asp Gly Pro Ala Gly Glu

        50                  55                  60

    Ala Ala Leu Ala Ala Leu Leu Arg Glu Arg Gly Val Asp Ala Ala Val

    65                  70                  75                  80

    Val Val Leu Asp Gly Leu Leu Ala Ala Arg Leu Glu Ala Val Gly Cys

                    85                  90                  95

    Pro Val Val Tyr Val Asp Ser Leu Pro Phe Leu Trp Thr Glu His Asp

                100                 105                 110

    Phe Val Pro Ser Gly Val His Thr Tyr Cys Ala Gln Leu Cys Pro Ser

            115                 120                 125

    Leu Pro Arg Gln Ser Trp Pro Val Leu Arg Gly Ile Glu Ala Leu Arg

        130                 135                 140

    Trp Val Glu Pro Val Val Gly Thr Tyr Gly Ala Gly Gly Leu Asp Pro

    145                 150                 155                 160

    Val Pro Gly Lys Ala Val Leu Asn Val Gly Gly Leu Arg Ser Pro Phe

                    165                 170                 175

    Thr Ala Glu Asp Asp Asp Ser Tyr Val Glu Leu Val Leu Gly Pro Ala

                180                 185                 190

    Leu Arg Ala Leu Arg Ala Ala Gly Phe Gly Gln Val Val Ile Ser Gly

            195                 200                 205

    Asn Val Asp Pro Gly Leu Ala Arg Val Pro His Ala Gly Thr His Gly

        210                 215                 220

    Leu Thr Val Thr Ala Gly Arg Leu Asp His Gly Ala Phe Ile Glu Glu

    225                 230                 235                 240

    Leu Arg Thr Ala Glu Leu Leu Val Thr Ser Pro Gly Arg Thr Thr Leu

                    245                 250                 255

    Leu Glu Ala Ala Ala Leu Gly Gln Arg Ala Val Val Leu Pro Pro Gln

                260                 265                 270

    Asn Phe Ser Gln Val Met Asn Ala Ala Asp Val Ala Asp Leu Val Asp

            275                 280                 285

    Pro Ala Val Val Val Pro Trp Pro Ala Ala Val Leu Asp Leu Ala Glu

        290                 295                 300

    Leu Ala Arg Val Arg Asp Gln Gly Glu Glu Gly Ala Val Arg Leu Met

    305                 310                 315                 320

    Tyr Ala Arg Ile Ala Ala Ala Arg Arg Glu Pro Gly Thr Val Ala Gly

                    325                 330                 335

    Pro Leu Ala Asp Ala Leu Gly Ala Ala Val Ala His Val Arg Arg His

                340                 345                 350

    Asp Val Arg Met Gly Pro Phe Ala Gly Thr Asp Gly Ser Gly Ala Gly

            355                 360                 365

    Thr Arg Gly Ala Gly Gly Ala Arg Asp Thr Gly Gly Ala Gly Gly Ala

        370                 375                 380

    Arg Ser Val Ala Asp Ala Val Asp Glu Leu Ile Gly Lys Leu Thr Asp

    385                 390                 395                 400

    Gly Pro Ala Ala Gly Asn Arg Arg Asp Gly Ser Pro Leu Ala Ala Pro

                    405                 410                 415

    Val Arg Ala Arg

                420

    <210>5

    <211>395

    <212>PRT

    <213>生裂链轮丝菌ZJU5119(Streptoverticillium rimofaciens ZJU5119)

    <400>5

    Met Arg His Pro Arg Glu Leu Arg Gln Asp Thr Ser Leu Ala Ile Asn

    1               5                   10                  15

    Gly Gly Thr Pro Thr Phe Ala Ala Leu Pro Glu Glu Asp Thr Gly Ile

                20                  25                  30

    Val Ala Glu Ala Ala Asp Glu Val Ala Glu Leu IIe Arg Thr Arg Arg

            35                  40                  45

    Thr Val His Trp Gly Gly Gly Pro His Thr Arg Val Leu Glu Arg Asp

        50                  55                  60

    Phe Ala Ala Leu Val Gly Arg Glu Arg Ala Phe Phe His Asn Ser Gly

    65                  70                  75                  80

    Thr Ala Ala Leu Gln Thr Ala Leu Phe Ala Leu Glu Val Glu Glu Gly

                    85                  90                  95

    Thr Pro Val Ala Leu Ser Asp Ser Gly Phe Val Ala Ser Leu Asn Ala

                100                 105                 110

    Leu Tyr His Leu Arg Ala Arg Pro Val Phe Leu Pro Thr His Pro Ala

            115                 120                 125

    Thr Leu Gln Cys Val Asp Asp Val Ala Glu Trp Thr Ala Gly Thr Gly

        130                 135                 140

    Val His Thr Ala Leu Ile Thr His Phe Phe Gly Asn Val Ala Asp Val

    145                 150                 155                 160

    Glu Ala Ile Trp Arg Thr Ser Gly Ala Arg His Leu Val Glu Asp Gly

                    165                 170                 175

    Gly Gln Ala His Gly Ala Arg Leu Arg Gly Arg Pro Val Gly Ser Phe

                180                 185                 190

    Gly Thr Val Gly Ser Phe Ala Gly Ser Thr Lys Lys Leu Val Thr Ala

            195                 200                 205

    Gly Gln Gly Gly Leu Asn Val His Asp Asp Glu His Leu Asp Trp Arg

        210                 215                 220

    Met Arg Thr Tyr Ala His His Gly Lys Ser Gly Asn Tyr Glu Gly Thr

    225                 230                 235                 240

    Phe Pro Gly Tyr Asn Phe Arg Gly Gly Glu Met Glu Ala Ile Leu Ala

                    245                 250                 255

    His Ala Ala Leu Arg Arg Leu Asp Glu Arg Val Ala Ala Arg Asn Arg

                260                 265                 270

    Thr Ala Asp Thr Met Phe Arg Ile Phe Asp Glu Ala Gly Ile Arg Thr

            275                 280                 285

    Ala Arg Pro Ala Pro Gly Leu Asp Cys Ser Pro Ala Trp Phe Asp Val

        290                 295                 300

    Ala Leu Ile Leu Asp Glu Glu Trp Leu Gly His Arg Asp Trp Leu Val

    305                 310                 315                 320

    Glu Ala Met Val Ala Asp Gly Ile Pro Gly Trp His Tyr Pro Ala Leu

                    325                 330                 335

    Ile Gly Met Pro Trp Val Glu Pro Trp Met Arg Ser Lys Gly Trp Trp

                340                 345                 350

    Gly Glu Arg Glu Gln Glu Leu Leu Ala Ser Glu Thr Ala Leu Trp Gly

            355                 360                 365

    Arg Thr Leu Val Leu Gly Ala Gln Met Asn Ala Val Asp Ala Glu Arg

        370                 375                 380

    Ile Ala His Ala Val Val Ala Leu Leu Lys Gly

    385                 390                 395

    <210>6

    <211>273

    <212>PRT

    <213>生裂链轮丝菌ZJU5119(Streptoverticillium rimofaciens ZJU5119)

    <400>6

    Met Thr Cys Gly Glu Ile Ser Glu Val Arg Arg Val Leu Arg Arg Leu

    1               5                   10                  15

    Gly Asp Gly Gly Pro Arg Ser Val Arg Val Arg Glu Asn Gly Asn Cys

                20                  25                  30

    Ala Val Tyr Val Gly Asp Arg Leu Val Val Arg Val Gly His Ser Trp

            35                  40                  45

    Pro Leu Asp Ala Arg Gly Glu Leu His Cys Trp Ser Val Ala Arg Asp

        50                  55                  60

    Ala Gly Val Pro Ala Pro Glu Arg Ile Asp Glu Gly Arg Leu Pro Gly

    65                  70                  75                  80

    Gly Arg Thr Tyr Val Ala Tyr Val Tyr Val Met Gly Thr Pro Ala Gly

                    85                  90                  95

    Thr Pro Ala Ser Leu Ala Ala Ala Gly Ala Val Leu Ala Arg Leu His

                100                 105                 110

    Thr Val Pro Gly Glu His Phe Pro Ala Val Ala His Asn Leu Pro Arg

            115                 120                 125

    Arg Arg Asp Arg Tyr Arg Thr Ala Val Arg Cys Ala Arg Ala Ala Gly

        130                 135                 140

    Leu Ala Pro Gly Gly Leu Ala His Arg Cys Leu Leu Arg Ala Ala Asp

    145                 150                 155                 160

    Asp Trp Arg Arg Ser Arg Glu Val Ala Ala His Gly Asp Phe Arg Thr

                    165                 170                 175

    Pro Asn Leu Val Val Arg Gly Arg GIy Val Arg Ala Val Leu Asp Trp

                180                 185                 190

    Ser Asp Ala Arg Ala Ala Ser Pro Glu Ser Asp Leu Gly Gln Leu Gly

            195                 200                 205

    Pro Gly Gln Leu Arg Pro Leu Leu Arg Gly Tyr Leu Asp Arg Ala Arg

        210                 215                 220

    Arg Ala Pro Asp Leu Glu Leu Val Ala Gly His Met Leu Ala Arg His

    225                 230                 235                 240

    Leu Ala Leu Glu Ala Ala Gly Val Phe Pro Ala Gly Thr Ser Ala Ala

                    245                 250                 255

    Leu Ala Arg Arg Phe Gly Pro Gly Leu Ser Arg Gly Arg Trp Thr Val

                260                 265                 270

    Ala

    <210>7

    <211>157

    <212>PRT

    <213>生裂链轮丝菌ZJU5119(Streptoverticillium rimofaciens ZJU5119)

    <400>7

    Leu Pro Asp Arg Ser Pro Ala Ala Glu Pro Leu Ile Leu Asp Val Gly

    1               5                   10                  15

    Ser Ala Gly Gln Leu Ala Glu Leu Ala Gly Asp Leu Val Asp Leu Ala

                20                 25                 30

    Gly Pro Gly Gly Ala Thr Gly Pro Trp Val Leu Thr Trp Ala His Gly

            35                  40                  45

    Ala Gly Glu Pro Gly Gly Glu Pro Gly Glu Gly Gln Asn Arg Gly Pro

        50                  55                  60

    Asn Gly Gly Thr Gly Gly Gly Pro Gly Gly Thr Val Ala Arg Pro Pro

    65                  70                  75                  80

    Gly Ala Thr Val Val Arg His Gly Gly Leu Glu Val Val Thr Val Pro

                    85                  90                  95

    Arg Pro Pro Arg Asp Leu Gly Gly Phe Leu Asp Ala Cys Cys Arg Thr

                100                 105                 110

    Gly Pro Val Ser Gly His Pro Asp Val Thr Arg Thr Ile Leu Ile Leu

            115                 120                 125

    Ala Asp Pro Thr Asp Arg Asp Arg Ser Ala Ser Pro Pro Glu Ala Pro

        130                 135                 140

    His Asp Ala Pro Arg Asp Gly Ala Arg Asp Gly Arg Pro

    145                 150                 155

    <210>8

    <211>335

    <212>PRT

    <213>生裂链轮丝菌ZJU5119(Streptoverticillium rimofaciens ZJU5119)

    <400>8

    Met Thr His Pro Ala Thr Gly Pro Ala Thr Gly Gly Arg Asp Arg Tyr

    1               5                   10                  15

    Leu Phe Ile Arg Ile Leu Glu Ala Cys Asn Ala Asp Cys Phe Met Cys

                20                  25                  30

    Glu Phe Ala Leu Ser Arg Asp Thr Tyr Arg Phe Thr Leu Asp Asp Phe

            35                  40                  45

    Arg Glu Leu Leu Pro Gln Ala Gln Glu Ser Gly Val Arg Tyr Val Arg

        50                  55                  60

    Phe Thr Gly Gly Glu Pro Leu Met His Gly Glu Val Leu Asp Leu Ile

    65                  70                  75                  80

    Arg Glu Gly Thr Ala Ala Gly Met Arg Met Ser Leu Ile Thr Asn Gly

                    85                  90                  95

    Phe Arg Leu Pro Gln Met Val Asp Lys Leu Ala Glu Ala Gly Leu Ala

                100                 105                 110

    Gln Val Ile Val Ser Leu Asp Gly Ser Ser Gly Glu Thr His Asp Val

            115                 120                 125

    Tyr Arg Arg Thr Pro Gly Met Phe Asp Arg Gly Leu Asp Gly Leu Val

        130                 135                 140

    Arg Ala Ser Arg Ala Gly Met Leu Thr Arg Val Asn Thr Val Val Gly

    145                 150                 155                 160

    Pro His Asn Phe Ala Gln Met Pro Glu Leu Gln Arg Val Leu Thr Glu

                    165                 170                 175

    Ala Arg Val Glu Gln Trp Glu Met Ser Ala Leu Lys Leu Glu Arg His

                180                 185                 190

    Ile Ala Tyr Pro Pro Ala Glu Glu Val Leu His Ala Cys Glu Pro Val

            195                 200                 205

    Phe Leu Ala Asp Pro Lys Arg Trp Leu Val Pro Leu Gly Lys Arg Phe

        210                 215                 220

    Tyr Gly Glu Thr Ala Glu Glu Arg Glu Ala Phe Phe Glu Arg Gly Thr

    225                 230                 235                 240

    Thr Pro Ser Ala Ser Arg Pro Leu Cys His Val Thr Asp Asp Val Met

                    245                 250                 255

    Tyr Leu Asp Pro Lys Leu Gly Arg Thr Phe Ala Cys Ser Cys Leu Pro

                260                 265                 270

    His Arg Asp Gly Pro Gly Ala Asp Met Arg Asp Glu Arg Gly Arg Val

            275                 280                 285

    Phe Leu Asn Ser Pro Ser Phe Arg Ala His Ala Glu Glu Phe Lys Gln

        290                 295                 300

    Gln Gly Pro Val Ile Cys Ser Gly Cys Ser Thr Thr Ala Ala Gly Tyr

    305                 310                 315                 320

    Ser Asp Asp Val Ala Arg Leu Gly Ser Val Pro Ala Trp His Tyr

                    325                 330                 335

    <210>9

    <211>740

    <212>PRT

    <213>生裂链轮丝菌ZJU5119(Streptoverticillium rimofaciens ZJU5119)

    <400>9

    Met Ile Leu Arg Thr Asp His Val Asp Ala Tyr Leu Ser Ala Val Ser

    1               5                   10                  15

    Ala Ile Leu Asp Glu Pro Gly Arg Ala Gly Ala Gly Val Pro Val Leu

                20                  25                  30

    Cys Arg Pro Gly Ser Pro Leu Asp Val Leu Val Thr Arg Trp Ser Ala

            35                  40                  45

    Leu Leu Gly His Ala Gly Pro Arg Ala Arg Ser Asp Arg Pro Gly Arg

        50                  55                  60

    Ala Val Val Ala Val Gly Asp Asp Pro Val Val Ser Ala Ala Ala Arg

    65                  70                  75                  80

    Leu Leu Ala Val Leu Thr Gly Arg Thr Ala Leu Ala Val Ala Asp Val

                    85                  90                  95

    Lys Glu Leu Pro Ala Leu Trp Glu Arg His Asp Leu Val Ser Thr Ala

                100                 105                 110

    Leu Val Gly Ile Gly Thr Gly Phe Asp Val Pro Gly Val Glu Pro Ser

            115                 120                 125

    Ala Phe Trp Arg Leu Asp Ala Thr Asp Ala Thr Leu Gly Ile Leu Thr

        130                 135                 140

    Gly Arg Asp Arg Glu Ser Leu Thr Trp Phe Val Ala Lys Ser Leu Leu

    145                 150                 155                 160

    Thr Ser Thr Val Pro Gly Asp Ala Gln Thr Leu Leu Leu Pro Asp Arg

                    165                 170                 175

    Lys Pro Arg Glu Asp Thr Ala Ser Ala Gly Val Gly Ala Gly Gly Val

                180                 185                 190

    Glu Val Leu Tyr Gly Ala Ala Ala Glu Glu Ala Leu Pro Ala Leu Ala

            195                 200                 205

    Glu Asp Glu Arg Val Arg Ala Leu Ile Ala Val Glu Ala His Gly Arg

        210                 215                 220

    Ala Asp His Leu Gly Val Arg Asp Gly Ile Ile Cys Gly Asp Arg Leu

    225                 230                 235                 240

    Ala His Leu Gly Arg Ser Ser Glu Pro Glu Gly Ile Gly Arg Val Pro

                    245                 250                 255

    Gln Cys Ala Phe Gly His Gly Cys Phe Lys Pro Gly Ala Arg Val Ala

                260                 265                 270

    Ile Ser Arg Met Pro Ala Gln Ser Leu Phe Leu His Ser Cys Thr Ser

            275                 280                 285

    Ser His Thr Glu Ala Asp Met Tyr Glu Lys Ser Phe Leu Leu Gly Leu

        290                 295                 300

    Ala Ala Leu Glu Gly Pro Ala Arg His Val Leu Gly Thr Val Arg Pro

    305                 310                 315                 320

    Met His Asp Gly Gly His Glu Val Gly Leu Val Ser Ala Leu Thr Ala

                    325                 330                 335

    Ala Gly Ala Ser Ala Gly Glu Val Thr Arg Leu Leu Asn Ala Ser Tyr

                340                 345                 350

    His Gln His Arg Gly Glu Pro Ala Pro Tyr Leu Leu Leu Gly Asp Pro

            355                 360                 365

    Glu Leu Pro Phe Ala Asp Gly Pro Val Gly Gly Pro Asp Ala Gly Pro

        370                 375                 380

    Ala Val Glu Leu Asp Ala Ser Ala Gly Ala Leu Pro Leu Gly Gly Arg

    385                 390                 395                 400

    Arg Thr Ala Val Leu Gly Ser Gly Pro Gly Val Leu Val Val Gly Asp

                    405                 410                 415

    Ala Thr Gly Asp Glu Asp Gly Asp Gly Pro Gly Leu Pro Ala Gly Val

                420                 425                 430

    Gly Ala Leu Thr Val Arg Arg Gly Asp Arg Thr Asp Val Val Ala Trp

            435                 440                 445

    Ser Thr Glu Gly Pro Leu Pro Glu Gly Ala Leu Pro Leu Val Arg Arg

        450                 455                 460

    Glu Gly Gly Ala Val Ala Ala Asp Gly Gly Ala Glu Glu Leu His Ala

    465                 470                 475                 480

    Arg Trp Asp His Val Asp His Gly Ile Ala Ser Gly Gly Ala Leu Gly

                    485                 490                 495

    Leu Leu Pro Lys Asp Leu Thr Gly Arg Leu Gln Glu Leu Arg Asp Leu

                500                 505                 510

    Ala Ala Ala Val Gly Thr Ala Asp Arg Asp Ala Arg Phe Phe Pro Gly

            515                 520                 525

    Arg Leu Gly Ala Val Arg Arg Ala Ala Ala Arg Leu Asp Gln Arg Ile

        530                 535                 540

    Arg Asp Ala Asp Arg Ala Leu Met His Ala Leu Leu Gly Arg Asn Gly

    545                 550                 555                 560

    Lys Pro Phe Asp Ala Asp Asp Arg Leu Glu Ser Ala Phe Val Pro Leu

                    565                 570                 575

    Glu Ser Gln Tyr Gly Arg Gln Val Cys Trp Cys Gly Arg Asp Ala Val

                580                 585                 590

    Val Ser Arg Leu Arg Pro Arg Leu Gly Ala Arg Glu Val Arg Arg Lys

            595                 600                 605

    Tyr Asn Cys Met Gln Cys Gly Asp Tyr Ala Gln Val Ala Val Asp Gly

        610                 615                 620

    Val Asp Val Arg Trp Glu Ala Pro Glu Phe Val Ala Ser Gly Gly Glu

    625                 630                 635                 640

    Leu Glu His Ser Phe Arg Ile Ala Asn Pro Leu Pro His Pro Val Thr

                    645                 650                 655

    Gly Val Leu Ala Leu Ser Val Ser Pro Trp Tyr Gly Gly Asp Val Ser

                660                 665                 670

    Phe Arg Pro Gly Ile Ala Thr Phe Ser Val Ala Pro Gly Gly Thr Cys

            675                 680                 685

    Arg Val Gly Val Thr Met Arg Ala Ala Gly Leu Lys Pro His Arg Tyr

        690                 695                 700

    Thr Val Asp Ala Thr Val Val Ser His Leu Arg Ile Asn Ala Tyr Arg

    705                 710                 715                 720

    Lys Phe Val Gln Val Arg Pro Ala Gly Pro Val Gly Pro Ser Asp Glu

                    725                 730                 735

    Asp Gly Ala Leu

                740

    <210>10

    <211>360

    <212>PRT

    <213>生裂链轮丝菌ZJU5119(Streptoverticillium rimofaciens ZJU5119)

    <400>10

    Val Thr Ala Pro Thr Thr Gly Pro Thr Thr Gly Pro Thr Thr Gly Pro

    1               5                   10                  15

    Thr Ala Gly Pro Thr Thr Gly Pro Thr Ala Gly Pro Thr Ala Gly Pro

                20                  25                  30

    Thr Ala Gly Ser Ala Val Ala Glu Glu Ala Val Ala Glu Trp Ala Ala

            35                  40                  45

    Ala Trp Leu Glu Gln Val His Gly Val Arg Tyr Gly Pro Asp Asp Ala

        50                  55                  60

    Leu Phe Gly Ser Leu Asp Ser Leu Ala Leu Thr Glu Leu Leu Val Ala

    65                  70                  75                  80

    Cys Glu Ala His Phe Gly Leu Arg Ile Asp Glu Gly Phe Gly Trp Gln

                    85                  90                  95

    Ala Leu Ala Ser Val Arg Ser Leu Ala Ala His Val Ala Thr Gly Val

                100                 105                 110

    Arg Pro Pro Ser Asp Arg Val Trp Phe Arg Ser Gly Pro Gly Ala Thr

            115                 120                 125

    Gly Asp Ala Asp Leu Asp Arg Thr Ala Val Val Arg Val Ala Leu Gly

        130                 135                 140

    Leu Pro Pro Gly Ala Ala Val Ala Arg Leu Ser Pro Arg Glu Leu Ala

    145                 150                 155                 160

    Leu Gly Ile Gly Ala Ala Ala Ala Pro Ser Glu Lys Pro Ala Thr Thr

                    165                 170                 175

    Leu Pro Pro Glu Arg Glu Arg Leu Ser Leu Ala Arg Glu Ser Ser Thr

                180                 185                 190

    Arg Pro Gly Ser Leu Leu Ala Val Gly Ala Thr Ala Ala Arg Ile Arg

            195                 200                 205

    Ala Phe Ala Gly Arg Leu Asp Ala Ala Leu Ala Ala Val Gly Ala Thr

        210                 215                 220

    Pro Val Trp Tyr Pro Ile Thr Thr Asp Ser Pro Val Gly Ala Asp His

    225                 230                 235                 240

    Val Gln Gly Ile Pro Ser Glu Leu Thr Ala Gly Arg Leu Gly His Ala

                    245                 250                 255

    Gly Cys Leu Gln Leu Leu Ala Glu Leu Pro Ala Glu Arg Asp Val Val

                260                 265                 270

    Tyr Ser Gly Ile Ala Tyr Ala Phe Arg Asp Glu Pro Gly Arg Arg Trp

            275                 280                 285

    Glu Pro Ala Gly Arg Leu Glu Ala Tyr Arg Val His Glu Thr Val Val

        290                 295                 300

    His Gly Thr Glu Glu Phe Arg Thr Ala Met Trp Arg Arg Leu Tyr Glu

    305                 310                 315                 320

    Leu Val Asp Arg Glu Leu Ser Ala Leu Gly Pro Gly Gly Trp Gln Glu

                    325                 330                 335

    Gly Arg Asp Gly Phe Thr Pro Arg His Gly Pro Gln Ala Arg Met Ala

                340                 345                 350

    Ala Gly Thr Arg Arg Trp Ala Arg

            355                 360

    <210>11

    <211>317

    <212>PRT

    <213>生裂链轮丝菌ZJU5119(Streptoverticillium rimofaciens ZJU5119)

    <400>11

    Met Asp Ala Ala Pro Gly Thr Ala Arg Thr Ala Ala Gly Thr Ser Val

    1               5                   10                  15

    Pro Pro Val Leu Pro Val Asp Ala Glu Arg Pro Ala Ala Arg Arg Thr

                20                  25                  30

    Leu Ala Met Glu Glu Gly Thr Pro Arg Gln Trp Glu Gly Leu Gly Leu

            35                  40                  45

    His Gly Val Pro Glu Ala Val Glu Ala Ala Leu Gly Pro Ala Ala Glu

        50                  55                  60

    Leu Val Val Ala Ala Arg Gly Gly Gly Arg Ser Pro Leu Pro Gly Leu

    65                  70                  75                  80

    Val Phe Ala Gln Pro Cys Leu Gly Arg Ser Ala Gly Val Ala Arg Asp

                    85                  90                  95

    Leu Pro Val Ser Val Val Trp Glu Thr Gly Val Ala Leu Ala Ile Ala

                100                 105                 110

    Arg Ala Leu Asp Arg Pro Ala Val Ile Gly Leu Cys Val Tyr Glu Glu

            115                 120                 125

    Ile Leu Gln Gln Pro His Arg Asp Ala Glu Phe Thr Ala Leu Gly Ala

        130                 135                 140

    Ala Val Ala Arg Thr Val Glu Ala Leu Gly Arg Leu Leu Gly Val Ala

    145                 150                 155                 160

    Val Thr Ala Arg Val Glu Thr Ala Ala Pro Arg Ala Ala Glu Val Pro

                    165                 170                 175

    Ala Arg Arg Leu Tyr Gly Leu Tyr Thr Pro Phe Ser Glu Ser Thr Tyr

                180                 185                 190

    Pro Arg Gly Phe Pro Asn Glu Ala Glu Val Leu Arg Ala Phe Ser Ala

            195                 200                 205

    Tyr Cys Gly Arg Tyr Glu Asp Ala Ala Arg Arg Glu Ala Ser Leu Trp

        210                 215                 220

    Val Thr Glu Gly Val His Leu Ala Lys Ala Ala Leu Leu Gly Leu Gly

    225                 230                 235                 240

    Pro Gly Val Pro Phe Leu Ala Thr Thr Pro Leu Pro Asp Pro Ala His

                    245                 250                 255

    Pro Gly Arg Leu Leu Gln Asp Ala Pro Ala Ala Thr Arg Val Thr Leu

                260                 265                 270

    Glu Arg Arg Ser Ala Leu Pro Ala Asp Trp Trp Pro Glu Gln Ala Leu

            275                 280                 285

    Glu Arg Ala Leu Gly Thr Gly Leu Arg Arg Leu Thr Glu Asp Phe His

        290                 295                 300

    Ala Leu Ile Glu Asp Phe His Asp Pro Ala Gly Asp Arg

    305                 310                 315

    <210>12

    <211>442

    <212>PRT

    <213>生裂链轮丝菌ZJU5119(Streptoverticillium rimofaciens ZJU5119)

    <400>12

    Met Arg Thr Pro Arg Thr Gly Ala Val Leu Gly Gly Arg Gly Pro Ala

    1               5                   10                  15

    Leu Pro Phe Val Ala Tyr Met Ala Leu Ser Asn Ala Gln Phe Thr Arg

                20                  25                  30

    Gly Val Phe Val Leu Phe Leu Leu Arg Gly Asn Ile Ser Leu Ala Glu

            35                  40                  45

    Val Gly Leu Leu Glu Ser Leu Phe His Leu Thr Arg Val Leu Cys Glu

        50                  55                  60

    Val Pro Ala Gly Ser Val Ala Asp Arg Trp Gly Arg Arg Arg Thr Ile

    65                  70                  75                  80

    Gln Ala Gly Leu Ile Leu Ser Ala Ala Ala Met Pro Ala Phe Leu Leu

                    85                  90                  95

    Gly Gly Met Phe Trp Tyr Ala Leu Ala Phe Val Phe Gln Gly Ala Gly

                100                 105                 110

    Trp Ala Ala Gln Arg Gly Ala Asp Thr Ala Leu Leu Tyr Glu Leu Leu

            115                 120                 125

    Glu Arg Thr Gly Gly Thr Asp Arg Tyr Ala Arg Ile Leu Gly Arg Ser

        130                 135                 140

    His Ala Ala Ser Tyr Gly Thr Leu Ala Leu Thr Thr Ala Leu Gly Ala

    145                 150                 155                 160

    Met Leu Tyr Gln Arg His Val Ser Leu Pro Phe Trp Leu Gln Ala Ala

                    165                 170                 175

    Val Thr Leu Leu Ala Val Gly Ala Ile Gly Val Leu Pro Glu Ser Ser

                180                 185                 190

    Gly Thr Ala Ala Ser Gly Ala Gly Ser Ser Gly Ser Gly Ser Ser Gly

            195                 200                 205

    Glu Pro Ala Glu Arg Pro Met Gly Val Trp Arg Leu Ala Arg Ala Gly

        210                 215                 220

    Ala Arg Leu Val Val Gly His Pro Val Leu Arg Leu Phe Val Ala Phe

    225                 230                 235                 240

    Val Ala Leu Val Glu Ala Gly Thr Thr Val Val Ser Ile Phe Ser Gln

                    245                 250                 255

    Ser Phe Phe Arg Thr Leu Gly Tyr Gly Thr Ala Thr Thr Gly Leu Ile

                260                 265                 270

    Leu Ala Leu Val Thr Ala Phe Ser Ala Ala Ala Ala Leu Gln Ser His

            275                 280                 285

    Arg Leu Val Glu Arg Gly Pro Val Arg Val Leu Met Ala Ala Ser Ser

        290                 295                 300

    Leu Tyr Leu Val Gly Leu Ala Gly Met Ala Ser Leu Gln Pro Gln Leu

    305                 310                 315                 320

    Ala Val Val Gly Tyr Tyr Leu Val Phe Leu Asn Leu Asp Leu Leu Ala

                    325                 330                 335

    Pro Val Leu Ser Ala Phe Phe His Arg Ser Val Asp Glu Glu Val Arg

                340                 345                 350

    Ala Thr Ala Gly Ser Tyr Leu Asn Leu Ser Thr Ser Val Leu Thr Phe

            355                 360                 365

    Ala Ala Phe Pro Leu Ser Gly Ser Leu Ile Asp Ala Gly Gly Tyr Arg

        370                 375                 380

    Pro Leu Leu Ile Ile Thr Ala Leu Val Ser Leu Pro Leu Leu Val Phe

    385                 390                 395                 400

    Leu Val Gly Ala Ala Arg Arg Val Leu Ser Pro Pro Glu Glu Gly Asp

                    405                 410                 415

    Ser Gly Glu Asp Ala Gly Glu Arg Ala Gly Pro Lys Gly Pro Gly Ala

                420                 425                 430

    Ala Ala Pro Asp Thr Thr Thr Thr Gly Val

            435                 440

    <210>13

    <211>328

    <212>PRT

    <213>生裂链轮丝菌ZJU5119(Streptoverticillium rimofaciens ZJU5119)

    <400>13

    Met Thr Thr Arg Ala Asp Ser Pro Ser Pro Gly Ser Gly Gly Pro Val

    1               5                   10                  15

    Gly Pro Gly Gly Ser Gly Gly Asp Asp Gly Arg Pro Val Ile Ala Leu

                20                  25                  30

    Arg Phe Ala Pro Ala Asp Val Glu Ala Ala Ala Ala Ala Glu Tyr Val

            35                  40                  45

    Ala Ala His Leu Gly Gly Phe Arg Cys Leu Pro Glu Cys Pro Gln Glu

        50                  55                  60

    Gly Asp Ser Gly Pro Gly Arg Asn Pro Pro Ala Ala Val Ile Val Phe

    65                  70                  75                  80

    Gly Arg Ser Gly Ala Ala Gly Gly Ala Gly Pro Ala Gly Val Pro Thr

                    85                  90                  95

    Val Leu Val Glu Gly Ala Glu Pro Val Pro Gly Thr Asp Ala Asp Val

                100                 105                 110

    Val Cys Arg Gln Ala Pro Gly Trp Leu Thr Ala Gly Glu Pro Pro Ala

            115                 120                 125

    Pro Pro Ala Val Arg Pro Gly Gly Gly Arg Ile Arg Thr Val Asp Val

        130                 135                 140

    Ala Ala Val Ala Pro Phe Arg Gln Val Arg Ser Gly Gly Gly Gly Gly

    145                 150                 155                 160

    Arg Ala Ala Leu Leu Leu Gly Gly Ala Gly Gly Pro Asp Gly Ser Gly

                    165                 170                 175

    Ala Ser Ala Gly Gly Glu Ala Leu Pro Gly Ala Leu Ala Arg Phe Ile

                180                 185                 190

    Ala Gly His Pro Ala Ala Ala Gly Asp Ala Trp Ala Val Leu Thr Asp

            195                 200                 205

    Leu Thr Gly Glu Pro Leu Arg Glu Leu Leu Gly Leu Leu Pro Pro Thr

        210                 215                 220

    Ala Arg Thr Val Gly Ala Ala Asp Trp Ala Gln Val Leu Arg Arg Ala

    225                 230                 235                 240

    Asp Ser Leu Val Ala Thr Pro Thr Leu Leu Ala Ala Ala His Ala Arg

                    245                 250                 255

    Thr Ala Arg Ile Pro Leu His Val Leu Asp Pro Ala Gly Pro Ala Gln

                260                 265                 270

    Arg Arg Val His Arg Ala Leu Ala Ala Ile Ala Gly Ala Pro Gly Glu

            275                 280                 285

    Pro Gly Gly Leu Pro Val Val Gly Pro Asp Asp Trp Pro Arg Asp Asp

        290                 295                 300

    Gly Arg Ala Gly Ala Leu Gly Gly Ala Ala Gln Ile Ala Arg Gln Val

    305                 310                 315                 320

    Arg Gln Leu Cys Leu Ala Pro Ala

                    325

    <210>14

    <211>389

    <212>PRT

    <213>生裂链轮丝菌ZJU5119(Streptoverticillium rimofaciens ZJU5119)

    <400>14

    Met Ser Asp Thr Leu Ala His Asn Arg Pro Leu Asp Leu Thr Gln His

    1               5                   10                  15

    Glu Ile Ala Ala Leu Arg Ser Glu His Asn Leu Ala Asp Ala His Thr

                20                  25                  30

    His Gln Tyr Gln Ser Pro Ala Gln Gln Leu Ile Val Asp Ser Leu Pro

            35                  40                  45

    Ala Leu Trp His Glu Ala Glu Lys Gly Arg Gln Ala Asp Phe Glu Gln

        50                  55                  60

    Arg Phe Ile Glu Ala Phe Phe Arg Leu His Gly Gln Pro Thr Ala Ile

    65                  70                  75                  80

    Gly Leu Asp Arg Thr Leu Leu Thr Tyr Ala Ala Ser Ile Ser Thr Met

                    85                  90                  95

    Ile Ala Gly Met Phe Leu Lys Arg Arg Asp Ala Arg Val Thr Leu Val

                100                 105                 110

    Glu Pro Cys Phe Asp Asn Leu Pro Asp Leu Leu Val Asn Leu Gly Val

            115                 120                 125

    Pro Leu Thr Ala Leu Pro Glu Asp Ala Leu Arg Asp Pro Ala Arg Ile

        130                 135                 140

    His Arg Glu Leu Ser Arg Leu Val Thr Thr Glu Ala Leu Phe Leu Val

    145                 150                 155                 160

    Asp Pro Asn Asn Pro Thr Gly His Ser Leu Phe Ala Asp Gly Met Arg

                    165                 170                 175

    Gly Phe Glu Glu Val Val Arg Phe Cys Arg Glu Arg Gly Thr Val Leu

                180                 185                 190

    Val Leu Asp Leu Cys Phe Ala Ala Phe Ala Leu Gly Ser Gly Gly Pro

            195                 200                 205

    Gly Arg His Asp Val Tyr Glu Leu Leu Glu Asn Ser Gly Val Thr Tyr

        210                 215                 220

    Ile Ala Met Glu Asp Thr Gly Lys Thr Trp Pro Val Gln Asp Ala Lys

    225                 230                 235                 240

    Cys Ala Leu Leu Thr Thr Ser Ala Asp Ile Tyr Pro Ala Val Tyr Asn

                    245                 250                 255

    Leu His Thr Ser Val Leu Leu Asn Val Ser Pro Phe Ile Leu Asn Thr

                260                 265                 270

    Leu Thr Arg Tyr Ile Glu Asp Ser Arg Arg Asp Gly Phe Ala Ser Val

            275                 280                 285

    Thr Asp Val Leu Glu Arg Asn Arg Lys Ser Leu Arg Ala Ala Thr Glu

        290                 295                 300

    Gly Thr Val Leu Arg Ala His Glu Pro Asp Val Pro Val Ser Val Ala

    305                 310                 315                 320

    Trp Phe Thr Ile Asp Asp Arg Gly Pro Asp Ala Thr Gln Leu Gln Arg

                    325                 330                 335

    Asp Leu Ser Gly His Gly Ile His Val Leu Pro Gly Thr Tyr Phe Tyr

                340                 345                 350

    Trp Asn Glu Pro Ser Arg Gly Glu Arg Tyr Val Arg Val Ala Leu Ala

            355                 360                 365

    Arg Asp Pro Gly Glu Phe Asp Ala Ser Met Ala Arg Leu Arg Thr Leu

        370                 375                 380

    Leu Ala Arg Tyr Ala

    385

    <210>15

    <211>258

    <212>PRT

    <213>生裂链轮丝菌ZJU5119(Streptoverticillium rimofaciens ZJU5119)

    <400>15

    Met Arg Glu Pro Gly Leu Ile Ala Pro Leu Val Thr Pro Leu Thr Pro

    1               5                   10                  15

    Asp Gly Ala Val Ser Glu Ala Cys Val Arg Ala Gln Val Ala Arg Val

                20                  25                  30

    Arg Pro Tyr Val Arg Ala Leu Met Pro Gly Ile Ser Cys Gly Glu Gly

            35                  40                  45

    Trp Leu Leu Asp Arg Pro Arg Trp Glu Arg Leu Ala Ala Ala Val Leu

        50                  55                  60

    Asp Cys Arg Asp Gly Leu Pro Val His Leu Gly Val Gln Ala Ala Asp

    65                  70                  75                  80

    Thr Ala Glu Val Ile Arg Arg Ala Arg Trp Ala Val Arg His Gly Ala

                    85                  90                  95

    Asp Ala Val Thr Val Gly Pro Pro His Gly Ala Gly Ala Arg Gln Arg

                100                 105                 110

    Ala Val His Glu His Phe Ala Arg Val Cys Ala Ala Val Asp Thr Pro

            115                 120                 125

    Val Cys Val Tyr His Glu Ser Val Val Ser Gly Thr Arg Met Thr Pro

        130                 135                 140

    Ala Thr Leu Thr Ala Val Cys Arg Leu Asp Gly Val Arg Ala Val Lys

    145                 150                 155                 160

    Glu Ser Gly Arg Glu Pro Ser Val Thr Asn Asp Leu Ile Ala Ala Val

                    165                 170                 175

    Pro Asp Val Ala Val His Gln Gly Trp Glu Asp Leu Phe His Ala Thr

                180                 185                 190

    Pro Gly Ala Ala Gly Leu Ile Gly Pro Leu Val Leu Ile Asp Pro Ala

            195                 200                 205

    Leu Cys Ala Glu Leu Val Ala Gly Val Gly Gly Val Gln Gly Val Val

        210                 215                 220

    Thr Asp Arg Cys Arg Glu Leu Gly Leu Phe Arg Pro Asp Tyr Val Ala

    225                 230                 235                 240

    Arg Thr Lys Arg Glu Leu Cys Arg Leu Gly Val Leu Ala His Ala Val

                    245                 250                 255

    Thr Leu

    <210>16

    <211>356

    <212>PRT

    <213>生裂链轮丝菌ZJU5119(Streptoverticillium rimofaciens ZJU5119)

    <400>16

    Val Cys Pro Leu Thr Glu Ala Arg Leu Thr Gly Arg Ala Arg Ala Val

    1               5                   10                  15

    Tyr Leu Glu Ile Leu Arg Ala Gly Gly Ser Leu Pro Arg Thr Ala Leu

                20                  25                  30

    Arg Thr Pro Gly Pro Pro Glu His Ser Gly Glu Gly Thr Asp Ala Asp

            35                  40                  45

    Gly Asp His Glu Leu Thr Glu Ala Ile Asp Ala Leu Val Ala Leu Arg

        50                  55                  60

    Leu Ile Gln His Thr Asp Arg Gly Arg Leu Leu Ala Ala Ile Ser Pro

    65                  70                  75                  80

    Gln Ser Ala Ala Ala Ala Leu Ser Ala Val Arg Glu Gly Glu Ile Gln

                    85                  90                  95

    Arg Gln Arg Leu Glu Asp Glu Arg Leu Arg Ser Ala Met Ala Ser Leu

                100                 105                 110

    Gln Asp Ala Tyr Asp Ala Val Asn Glu Gly Arg Ala Arg Lys Ala Pro

            115                 120                 125

    Gln Ile Glu Ser Leu Thr Asp Ile Ser Thr Ile Arg Gly Leu Leu Ser

        130                 135                 140

    Ala Ala Ala Arg Asp Cys Arg His Glu Val Leu Thr Ala Gln Pro Glu

    145                 150                 155                 160

    Ala Leu Leu Glu Ser Thr Leu Ala Asp Ser Arg Pro Arg Asp Leu Ser

                    165                 170                 175

    Leu Leu Thr Arg Gly Ile Ala Ile Arg Thr Val Tyr Pro His Thr Val

                180                 185                 190

    Leu Ser Ser Pro Ala Val Gln Gln His Phe Ser Leu Met His Glu Ala

            195                 200                 205

    Gly Thr Gln Ile Arg Thr Thr Thr Gly Val Leu Asp Arg Val Val Ile

        210                 215                 220

    Phe Asp Gln Ser Leu Ala Phe Leu Ala Asp Arg Arg Ser Asp Gly Pro

    225                 230                 235                 240

    Gly Ala Val Val Ile Arg His Pro Ala Val Val Asp Tyr Leu Tyr Arg

                    245                 250                 255

    Thr Ile Glu Gln Val Trp Arg Leu Ala Lys Pro Phe Val Tyr Thr His

                260                 265                 270

    Val Gly Tyr Gly Pro Ala Ala Asp Glu Ile Arg Ala Gly Ile Leu Arg

            275                 280                 285

    Leu Met Ala Ala Gly Ala Lys Asp Glu ValIle Ala Lys Arg Met Asn

        290                 295                 300

    Met Ser Thr Arg Thr Cys Arg Arg His Ile Ala Glu Met Met Ala Glu

    305                 310                 315                 320

    Leu Gly Ala Glu Ser Arg Phe Gln Ala Gly Val Leu Ala Ala Asp Arg

                    325                 330                 335

    Gly Leu Leu Arg Leu Ser Gly Gly Pro Pro Pro Leu Arg Gly Phe Arg

                340                 345                 350

    Gly Leu Ser Gly

            355

    <210>17

    <211>527

    <212>PRT

    <213>生裂链轮丝菌ZJU5119(Streptoverticillium rimofaciens ZJU5119)

    <400>17

    Met Lys Val Ala Leu Val Gly Pro Asn Gly Ala Gly Lys Thr Thr Leu

    1               5                   10                  15

    Leu Arg Met Ile Ala Gly Asp Leu Pro Val Thr Arg Gly Ala Val Ala

                20                  25                  30

    Arg Ser Gly Gly Leu Gly Val Met Arg Gln Phe Ile Gly Met Val Ser

            35                  40                  45

    Asp Glu Thr Thr Leu Ala Gly Leu Ala Leu Ser Leu Ser Pro Ala Gly

        50                  55                  60

    Leu Arg Gly Ala Gly Glu Ala Leu Ala Arg Ala Glu Thr Ala Met Ala

    65                  70                  75                  80

    Val Pro Gly Ala Gly Glu Lys Ala Gln Leu Arg Tyr Ala Glu Ala Leu

                    85                  90                  95

    Val Ala Trp Gly Asp Ala Gly Gly Tyr Glu Gln Glu Val Val Phe Asp

                100                 105                 110

    Thr Val Val Thr Asp Ile Leu Gly Thr Pro Trp Asp Glu Ala Arg Ser

            115                 120                 125

    Arg Pro Val Arg Thr Leu Ser Gly Gly Glu Gln Lys Arg Phe Ala Leu

        130                 135                 140

    Ser Leu Leu Leu Ala Gly Pro Asp Glu Val Leu Leu Leu Asp Glu Pro

    145                 150                 155                 160

    Asp Asn Phe Leu Asp Val Pro Gly Lys Arg Arg Leu Glu Ala Arg Leu

                    165                 170                 175

    Ala Glu Ser Pro Lys Thr Val Leu Tyr Val Ser His Asp Arg Glu Leu

                180                 185                 190

    Leu Ala Asn Thr Ala Ser Arg Val Val Thr Val Glu Gly Gly Ser Ala

            195                 200                 205

    Trp Met His Pro Gly Ser Phe Ala Ser Trp His Asp Ala Arg Val Ser

        210                 215                 220

    Arg Tyr Glu Arg Phe Glu Glu Glu Arg Arg Arg Trp Asp Glu Glu His

    225                 230                 235                 240

    Ala Lys Leu Lys Glu Leu Val Arg His Tyr Gln Val Lys Ala Ser His

                    245                 250                 255

    Asn Asp Ala Met Ala Ser Arg Leu Gln Ala Ala Arg Thr Arg Leu Ala

                260                 265                 270

    Lys Phe Glu Ala Gln Pro Pro Pro Pro Pro Arg Pro Arg Glu Gln Asn

            275                 280                 285

    Ile Arg Met Arg Leu Thr Gly Asp Arg Thr Gly Lys Arg Ala Val Val

        290                 295                 300

    Cys Glu Arg Leu Gly Leu Asp Gly Leu Thr Asp Pro Phe Gly Phe Glu

    305                 310                 315                 320

    Ala Trp Tyr Gly Asp Arg Ile Ala Val Leu Gly Ala Asn Gly Thr Gly

                    325                 330                 335

    Lys Ser His Phe Leu Arg Leu Leu Gly Arg Gly Gly Ser Asp Pro Glu

                340                 345                 350

    Leu Pro Ser Leu Thr Pro Leu Glu Pro Val Ala His Thr Gly Ser Ala

            355                 360                 365

    Arg Leu Gly Ala Arg Val Val Pro Gly His Phe Ser Gln Thr His Asp

        370                 375                 380

    Arg Pro Glu Leu Val Gly Arg Thr Leu Glu Asp Ile Leu Trp Lys Gly

    385                 390                 395                 400

    Asp Val Arg Arg Asp Ser Leu Pro Arg Asp Glu Ala Met Ala Ala Leu

                    405                 410                 415

    Gly Arg Tyr Glu Leu Ala Gly Gln Gly Gly Gln Arg Phe Glu Thr Leu

                420                 425                 430

    Ser Gly Gly Gln Gln Ala Arg Phe Leu Ile Leu Leu Leu Glu Leu Ser

            435                 440                 445

    Gly Ala Thr Leu Leu Leu Leu Asp Glu Pro Thr Asp Asn Leu Asp Leu

        450                 455                 460

    Ala Ser Ala Glu Ala Leu Glu Gln Gly Leu Ala Gly Phe Arg Gly Thr

    465                 470                 475                 480

    Val Leu Ala Val Thr His Asp Arg Trp Phe Thr Arg Ser Phe Asp Arg

                    485                 490                 495

    Phe Leu His Phe Arg Gly Asp Gly Ala Val Lys Glu Val Thr Ala Pro

                500                 505                 510

    Val Trp Glu Pro Ala Val Val Glu Gly Ala Gly Gln Ala Gly Arg

            515                 520                 525

    <210>18

    <211>256

    <212>PRT

    <213>生裂链轮丝菌ZJU5119(Streptoverticillium rimofaciens ZJU5119)

    <400>18

    Val Ile Glu Asp Gly Gly Ser Ala Arg Gly Ser Val Thr Thr Val Arg

    1               5                   10                  15

    Arg Val Gly Asp Thr Val Arg Arg Pro Arg Gly Arg Trp Thr Ala Asn

                20                  25                  30

    Val His Ala Leu Leu Arg His Leu Ala Asp Ala Gly Phe Leu Arg Ala

            35                  40                  45

    Pro Arg Ala Leu Gly Val Asp Glu Asp Gly Ser Glu Ile Leu Ser Phe

        50                  55                  60

    Leu Asp Gly Glu Val Ala Met Arg Pro Trp Pro Ala Ala Leu Arg Glu

    65                  70                  75                  80

    Arg Ser Gly Val Val Glu Leu Ala Val Trp Leu Arg Glu Tyr His Asp

                    85                  90                  95

    Val Val Arg Asp Phe Arg Pro Pro Cys Pro Asp Glu Trp Phe Val Pro

                100                 105                 110

    Gly Val Ser Trp Arg Pro Gly Arg Leu Val Arg His Gly Asp Leu Gly

            115                 120                 125

    Pro Trp Asn Ser Val Trp Arg Gly Ser Arg Leu Val Gly Phe Ile Asp

        130                 135                 140

    Trp Asp Phe Ala Glu Pro Gly Asp Pro Leu Asp Asp Leu Ala Gln Leu

    145                 150                 155                 160

    Ala Trp Tyr Cys Val Pro Leu Gly Gly Arg Ala Thr Gly Ala Gly Gly

                    165                 170                 175

    Glu Glu Ser Arg Val Arg Val Arg Glu Arg Leu Ala Ala Val Cys Thr

                180                 185                 190

    Ala Tyr Gly Ala Glu Pro Val Ser Val Leu Asp Ala Leu Ala Gly Leu

            195                 200                 205

    Gln Glu Arg Glu Ala Arg Arg Ile Thr Asp Leu Gly Gly Arg Gly Leu

        210                 215                 220

    Glu Pro Trp Thr Ser Phe Leu Ala Arg Gly Asp Ala Thr Ala Ile Glu

    225                 230                 235                 240

    Glu Glu Arg Ala Trp Leu Leu Thr His Arg Glu Gly Leu Leu Val Gly

                    245                 250                 255

    

米多霉素生物合成基因簇.pdf_第1页
第1页 / 共59页
米多霉素生物合成基因簇.pdf_第2页
第2页 / 共59页
米多霉素生物合成基因簇.pdf_第3页
第3页 / 共59页
点击查看更多>>
资源描述

《米多霉素生物合成基因簇.pdf》由会员分享,可在线阅读,更多相关《米多霉素生物合成基因簇.pdf(59页珍藏版)》请在专利查询网上搜索。

一种生物技术领域的米多霉素生物合成基因簇,该基因簇的序列如SEQIDNO:1所示;该基因簇包含16个基因:结构基因11个:milA,milB,milC,milD,milE,milG,milH,milJ,milM,milN和milQ;调节基因2个:milK和milO;抗性基因1个:milP;其他基因2个:milF、milI。本发明提供了米多霉素生物合成相关的所有基因和蛋白信息,为生物合成米多霉素和遗。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 化学;冶金 > 生物化学;啤酒;烈性酒;果汁酒;醋;微生物学;酶学;突变或遗传工程


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1