用于羊毛硫抗生素 107891 的生物合成的基因和蛋白质 概述
本发明涉及羊毛硫抗生素 (lantibiotics) 的领域, 更特别地涉及编码羊毛硫 抗生素 107891 和其同系物的生物合成途径所需的酶的核酸分子的分离。公开的是涉及 107891 产生的基因产物的功能。 本发明提供了 107891 产生所必需的新的生物合成基因、 编 码的多肽、 包含编码所述多肽的核酸序列的重组载体、 用所述载体转化的宿主细胞以及利 用所述转化的宿主细胞生产羊毛硫抗生素的方法, 包括生产 107891、 其前体、 其衍生物、 或 不同于 107891 的修饰的羊毛硫抗生素或其前体的方法。
发明背景
对现有抗生素有抗性的病原细菌的持续增多是全球性的卫生问题, 因而存在着发 现和开发对抗性细菌有活性的新化合物的迫切需求。这重新引起了对天然产物的兴趣, 这 些天然产物过去是抗生素如青霉素、 大环内酯类和糖肽的丰富来源。吸引人的候选物还有 抗微生物肽以及在它们之中被称为羊毛硫抗生素的那些, 即含羊毛硫氨酸的抗生素。羊毛 硫抗生素形成抗微生物肽内的特殊基团, 通过几个特征来辨别, 例如一级和立体结构特征、 独特的生物合成途径以及肽修饰反应和强力的抗细菌活性。这些是由革兰氏阳性细菌分 泌的、 并主要作用于革兰氏阳性细菌的一组肽衍生的抗微生物化合物。羊毛硫抗生素作为 前原肽 (prepropeptide) 由核糖体合成, 所述前原肽被翻译后修饰为它们的生物学活性形 式。前肽 (prepeptide) 由 N- 末端前导序列和 C- 末端区域 ( 原肽 (propeptide)) 组成, 所 述 N- 末端前导序列不经历任何翻译后修饰, 在从细胞分泌期间或之后被裂解, 所述 C- 末端 区域被翻译后修饰。羊毛硫抗生素由不同的细菌产生 : 这些化合物的共同特征是一个或更 多个羊毛硫氨酸残基的存在, 羊毛硫氨酸残基由通过硫醚键共价交联的两个丙氨酸残基组 成。 当半胱氨酸残基与脱氢丙氨酸或脱氢氨基丁酸部分反应来分别形成羊毛硫氨酸或甲基 羊毛硫氨酸残基时形成硫醚键。 脱氢氨基酸残基依次分别通过丝氨酸和苏氨酸的脱水来形 成。根据它们的结构和功能性质, 羊毛硫抗生素通常被分为两类, A 型和 B 型。A 型羊毛硫 抗生素是长度从 20 到 34 个氨基酸残基的长形的阳离子肽 : 乳链菌肽、 枯草菌素、 表皮素和 Pep5 是这个类别的成员。B 型是具有净负电荷的球形的肽 : 这个羊毛硫抗生素类别的实例 有 mersacidin、 肉桂霉素、 乳链球菌素 481 和 actagardine。这些结构上的不同反映在了作 用的机制上。通过可能由或不由对细胞靶脂质 II 的先期对接所辅助的一种机制, A 型化合 物通过阻断细胞壁生物合成和通过在细胞膜中形成孔来发挥它们的抗微生物活性。B 型羊 毛硫抗生素还通过抑制肽聚糖生物合成来发挥它们的抗微生物活性, 但是这些化合物在与 脂质 II 结合时不形成孔。
羊毛硫抗生素已经显示了具有作为食品添加剂和抗菌剂的效力和用途。最多研 究的羊毛硫抗生素乳链菌肽由乳酸乳球菌 (Lactococcus lactis) 产生, 在低浓度 ( 低 纳摩尔 MIC) 下针对多种革兰氏阳性细菌包括药物抗性菌株和食物传染的病原体肉毒杆 菌 (Clostridium botulinum) 和单核细胞增生利斯特氏菌 (Listeria monocytogenes) 具 有 活 性。 它 已 经 广 泛 地 用 作 食 品 防 腐 剂 而 没 有 细 菌 抗 性 的 实 质 性 发 生。 其 他 的 羊毛硫抗生素显示了感兴趣的生物学活性 : 例 如, 表皮素显示了针对疮疱丙酸杆菌
(Propionibacteriumacnes) 的高效力 ; 肉桂霉素和耐久霉素抑制磷脂酶 A2 和血管紧张肽 转变酶, 分别提供了作为抗炎剂和用于血压调节的应用潜力 ; mersacidin 抑制许多革兰氏 阳性细菌, 包括甲氧西林抗性金黄葡萄球菌 (Staphylococcus aureas)(MRSA)。
对羊毛硫抗生素的生物合成负责的基因以成为基因座符号 lan 的聚簇来组织, 对 每种羊毛硫抗生素具有更为具体的遗传型名称 ( 例如, 乳链菌肽为 nis, gallidermin 为 gdm, 肉桂霉素为 cin)。许多 lan 基因已经被测序, 证明了在基因结构上高水平的相似性。 每个聚簇包括 : 编码前肽的结构基因 lanA ; 以及在 LanA 的原肽部分中 Ser 和 Thr 残基的 脱水和硫醚形成所需的一或多个基因。对于 A 型羊毛硫抗生素, LanB 进行脱水反应, LanC 致力于硫醚键连, 而在 B 型羊毛硫抗生素中, 单个 LanM 酶催化这两种反应。其他基因通常 存在于羊毛硫抗生素聚簇中 : lanT 编码用于羊毛硫抗生素的分泌的 ABC 转运蛋白, 通常与 由 lanEFG 基因编码的第二转运系统组合 ; lanP 编码加工蛋白酶, 但是某些聚簇缺少这一基 因, 其可以是 lanT 的部分或它的功能由细胞的蛋白酶提供 ; lanI 编码涉及自我保护的蛋白 质; lanKR 对调节 lan 基因的表达负责。
存在着通过操作天然化合物来获得改进的羊毛硫抗生素的可能性和实用性。然 而, 羊毛硫抗生素是结构上复杂的肽, 它们对化学作用的可接近性限于分子中的一些位置。 化学作用的主要局限性之一是改变肽主链中存在的氨基酸的类型或顺序。鉴于此, 希望的 是拥有对于在羊毛硫抗生素形成中重定向这些步骤有用的基因和酶, 以获得通过化学手段 难以或不可能制得的衍生物。因而, 直接通过使用精确工程化的菌株的发酵过程来设计新 的羊毛硫抗生素衍生物的一般方法将是高度期望的。 实际上, 在羊毛硫抗生素中的异常氨基酸单独地促进了它们的生物学活性并且还 增强它们的结构稳定性。 涉及羊毛硫抗生素生物合成的酶表现了通过将异常氨基酸导入期 望的肽中用于肽工程化的高度潜力。
羊毛硫抗生素 107891 显示了针对革兰氏阳性细菌包括甲氧西林和万古霉素抗 性菌株的抗细菌活性, 但是对革兰氏阴性细菌示出了有限的活性 ( 例如某些莫拉氏菌属 (Moraxella spp.)、 奈瑟氏菌属 (Neisseria spp.) 和嗜血杆菌属 (Haemophilus spp.))。 107891 分离自小双孢菌 (Microbispora sp.)PTA-5024 的发酵物 (WO 2005/04628A1)。它 由紧密相关的因子 A1 和 A2 的复合物组成, 它的结构可以重新推导为肽骨架, 长度 24 个氨 基酸, 含有羊毛硫氨酸和甲基羊毛硫氨酸作为组成部分。此外, 氯原子和一个或两个 -OH 残 基存在于分子上。107891 复合物的组分的结构由图 3 的式 1 代表, 其中 R 代表 [OH] 和因 子 A1(R = OH)、 因子 A2(R = -(OH)2)。107891 看起来组合了 A 型和 B 型羊毛硫抗生素的元 件: 107891 中的环 A 和 B 与 A 型化合物中的等价的环高度相关 ; 然而, 如在 B 型羊毛硫抗生 素中的, 107891 是更为球形的, 它缺少柔性 C- 末端尾部并且缺乏带电的氨基酸残基。 因此, 不能预测致力于 107891 形成的 lan 聚簇是编码单独的 LanM 酶还是独立的 LanB 和 LanC 蛋 白。 此外, 对于含氯的羊毛硫抗生素没有先例, 因而对这种翻译后修饰负责的基因无法从现 有数据预测。
抗生素生产的工业过程的设计是相对成功的, 产生了抗生素滴度达到每升几克 的水平的大规模发酵。这主要是通过经验性的、 尝试与错误的方法来实现的, 缺少理论基 础。 因而新工艺的开发和现有技术的改进仍然是费时的, 可能产生不稳定的细菌培养物、 不 一致地进行和积累不需要的副产品。近年来, 已经成功地应用了理论方法来提高链霉菌属
(Streptomycesspp.) 产生的抗生素的水平, 其通常涉及感兴趣的基因簇内存在的关键调节 元件的操作或途径中限速步骤的过表达。因而, 编码这样的聚簇相关的调节物或合成限制 步骤的基因可能成为产量改进的有效工具。然而, 迄今为止在放线菌中鉴定的聚簇相关的 调节物属于几个不同的蛋白质家族。甚至在一个家族内部, 存在着序列相同性方面相当大 的变异。因而, 聚簇相关的调节物的存在、 性质、 数量和序列不能通过与其他聚簇比较来预 测, 甚至是指定了相关抗生素的那些。举例来说, 泰乐菌素基因簇编码四种不同的调节物, 而在指定相关的大环内脂类抗菌素红霉素的聚簇中都没有发现。类似地, 生物合成途径中 限速步骤的性质和原因不能先验地确定。
因而, 提高 107891 产量的工具是高度期望的。然而, 没有来自小双孢菌属的其他 成员的聚簇的实例。因而, 不能预测生产者菌株保护自身免于 107891 作用、 调节其他 lan 基因表达、 或 lan 基因与它的其他细胞过程配合表达的机制。与这些相关的信息对于优化 生产过程将是非常有用的。
发明描述
本发明提供了微生物中羊毛硫抗生素 107891 的生物合成所需的一组分离的多核 苷酸分子。 因而, 根据一个方面, 本发明涉及选自连续 DNA 序列 (SEQ ID NO : 1) 的多核苷酸分 子, 所述 DNA 序列代表了分离自小双孢菌 (Microbisporasp.)PTA-5024 的、 由编码 107891 形成所需多肽的 17 个 ORF 组成的 mlb 基因簇。
由所述 17 个 ORF 编码的多肽的氨基酸序列在 SEQ ID NO : 2 到 18 中提供。
本发明还提供了包含选自由以下组成的组中的核苷酸序列的分离的核酸 :
a) 编码 107891 和其同系物的合成所需的多肽的 mlb 基因簇 (SEQ IDNO : 1) ;
b) 编码由 mlb 基因簇 (SEQ ID NO : 1) 编码的相同多肽、 与 mlb 基因簇自身的核苷 酸序列不同的核苷酸序列 ;
c)mlb ORF 1 到 17 的任何核苷酸序列, 编码由 SEQ ID NO : 2 到 18 编码的多肽 ;
d) 编码由 mlb OFR 1 到 17 的任一个编码的相同的多肽 (SEQ ID NO : 2 到 18)、 与 所述 ORF 的核苷酸序列不同的核苷酸序列。
本发明的进一步的主题是提供了包含选自由以下组成的组中的核苷酸序列的分 离的核酸 :
e) 编码一多肽的核苷酸序列, 所述多肽在其全长上在氨基酸序列上与 mlb ORF 1 到 17 的任一个编码的多肽 (SEQ ID NO : 2 到 18) 至少具有 65%、 优选 86%、 更优选 90%、 最优选 95%或更高的相同性。
在一个实施方案中, 本发明的分离的核酸包含选自 ORF 1 到 17(SEQ IDNO : 2 到 18) 的 ORF, 其编码 107891 的前原肽的合成所需的多肽。
在另一个实施方案中, 所述核酸包含选自 ORF 1 到 17(SEQ ID NO : 2 到 18) 的 ORF, 其编码 107891 脱水酶的合成所需的多肽。在又一个实施方案中, 所述核酸包含选自 ORF 1 到 17(SEQ ID NO : 2 到 18) 的 ORF, 其编码 107891 的羊毛硫氨酸和甲基 - 羊毛硫氨酸残基 的合成所需的多肽。
根据另一个实施方案, 在本发明的核酸中, 提供了选自 ORF 1 到 17(SEQ ID NO : 2 到 18) 的 ORF, 其编码 107891 的氨基酸 4 的色氨酸残基的氯化所需的多肽。
在又一个实施方案中, 提供了包含选自 ORF 1 到 17(SEQ ID NO : 2 到 18) 的 ORF 的 核酸, 其编码 107891 的氨基酸 14 的脯氨酸残基的羟基化所需的多肽。
在又一个实施方案中, 提供了包含选自 ORF 1 到 17(SEQ ID NO : 2 到 18) 的 ORF 的 核酸, 其编码氧化脱羧作用所需的黄素蛋白, 氧化脱羧作用在 107891 的位置 21 和 24 产生 S-[(Z)-2- 氨基乙烯基 ]-(3S)-3- 甲基 -D- 半胱氨酸 (AviMeCys) 残基。
根据另一个实施方案, 在本发明的核酸中, 提供了选自 ORF 1 到 17(SEQ ID NO : 2 到 18) 的 ORF, 其编码黄素蛋白还原所需的多肽。
根据又一个实施方案, 提供了核酸, 其包含选自 ORF 1 到 17(SEQ IDNO : 2 到 18) 的 ORF 的组合, 编码对 107891 的输出和抗性所需的多肽。
在又一个实施方案中, 提供了核酸, 其包含选自 ORF 1 到 17(SEQ IDNO : 2 到 18) 的 ORF 的组合, 编码调节 mlb 基因簇表达所需的多肽。
本领域技术人员理解的是, 已经提供了编码 107891 生物合成途径的多肽的核苷 酸序列, 本发明还提供了编码来自这样的多肽的片段的核苷酸。 根据本发明, 本领域技术人 员理解的是, 由于遗传密码是简并性的, 由 SEQID NO : 2 到 18 所编码的相同的多肽可以由 ORF 1 到 17 的天然或人工变体编码, 即由 ORF 1 到 17 所指定的基因组核苷酸序列之外的、 但是编码相同的多肽的核苷酸序列编码。 此外, 还要理解的是, 天然发生的或人工制造的变体可以出自 SEQ IDNO : 2 到 18 编 码的多肽, 所述变体具有与上述原始多肽相同的一或多种功能, 但是含有对于折叠或催化 功能非关键的氨基酸的添加、 缺失或取代, 或必需氨基酸的保守性取代。
本领域技术人员还理解的是, 提供了 107891 生物合成所需的全部聚簇的核苷酸 序列, 本发明还提供了所述聚簇中存在的基因的表达所需的核苷酸序列。这样的调节序列 包括但不限于启动子和增强子序列、 反义序列、 转录终止子和抗终止子序列。 这些序列对于 调节 mlb 基因簇中存在的基因的表达是有用的。带有单独的或与其他核苷酸序列融合的所 述核苷酸序列的细胞也在本发明的范围之内。
在一个方面, 本发明提供了包含核苷酸序列的分离的核酸, 所述核苷酸序列编码 ORF6 多肽 (SEQ ID NO : 7)、 或所述多肽的天然发生的变体或衍生物, 编码 107891 的前原肽。
在另一个方面, 本发明提供了包含核苷酸序列的核酸, 所述核苷酸序列编码 ORF7 多肽 (SEQ ID NO : 8)、 或所述多肽的天然发生的变体或衍生物, 对于羊毛硫抗生素前体中丝 氨酸和苏氨酸残基的脱水化是有用的。
在又一个方面, 本发明提供了包含核苷酸序列的核酸, 所述核苷酸序列编码 ORF8 多肽 (SEQ ID NO : 9)、 或所述多肽的天然发生的变体或衍生物, 对于羊毛硫抗生素前体中羊 毛硫氨酸和甲基 - 羊毛硫氨酸形成是有用的。
在另一个方面, 本发明提供了包含核苷酸序列的核酸, 所述核苷酸序列编码 ORF9 多肽 (SEQ ID NO : 10)、 或所述多肽的天然发生的变体或衍生物, 对于抗生素前体中 AviMeCys 形成是有用的。 在另一个方面, 本发明提供了包含核苷酸序列的核酸, 所述核苷酸 序列编码 ORF15 多肽 (SEQ IDNO : 16)、 或所述多肽的天然发生的变体或衍生物, 对于羊毛硫 抗生素前体中色氨酸残基的氯化是有用的。
在又一个方面, 本发明提供了包含核苷酸序列的核酸, 所述核苷酸序列编码 ORF2 多肽 (SEQ ID NO : 3)、 或所述多肽的天然发生的变体或衍生物, 对于羊毛硫抗生素前体中脯
氨酸残基的羟基化是有用的。
在另一个方面, 本发明提供了包含核苷酸序列的核酸, 所述核苷酸序列编码 ORF1、 10 到 11、 13 到 14 和 17(SEQ ID NO : 2、 11 到 12、 14 到 15、 和 18) 所指定的多肽, 或所述多肽 的天然或人工发生的变体或衍生物, 对于 107891 或 107891 前体的细胞输出是有用的。
在另一个方面, 本发明提供了包含核苷酸序列的核酸, 所述核苷酸序列编码 ORF3 和 5 多肽 (SEQ ID NO : 4 和 6)、 或所述多肽的天然或人工发生的变体或衍生物, 对于调节羊 毛硫抗生素产生是有用的。
在一个实施方案中, 本发明提供了带有核苷酸序列的额外的拷贝的羊毛硫抗生素 生产菌株, 所述核苷酸序列指定选自 ORF 1 到 17(SEQ ID NO : 2 到 18) 的任一个的至少一个 ORF。
在 一 个 优 选 的 实 施 方 案 中, 这样的羊毛硫抗生素生产菌株是属于放线菌目 (Actinomycetales) 的任何菌株。
在又一个优选的实施方案中, 这样的羊毛硫抗生素生产菌株是小双孢菌属的成 员。
在一个优选的实施方案中, 本发明提供了小双孢菌菌株, 其含有 SEQ IDNO : 1 中指 定的核苷酸序列中的一个或更多个变异, 所述变异引起 ORF 1 到 17(SEQ ID NO : 2 到 18) 的 一个或更多个的提高或降低的表达。
在一个优选的实施方案中, 本发明提供了携带在一个或更多个载体上的包含 SEQ ID NO : 1 指定的核苷酸序列或其部分的核酸, 对于通过其他细胞生产 107891、 一种或更多 种的其前体或其衍生物是有用的。
在一个优选的实施方案中, 所述核苷酸序列或其部分被携带在单个载体上。适合 的载体是能够携带此处定义的完整 mlb 聚簇的任何粘粒、 F 粘粒、 BAC、 PAC、 ESAC 载体。适 合的载体是本领域技术人员公知的, 在文献 (Kieser et al., 2000, 以及其中描述的参考文 献 ) 中描述。
在一个方面, 本发明提供了提高 107891 的产生的方法, 所述方法包括以下步骤 :
- 用重组 DNA 载体转化微生物, 所述微生物通过生物合成途径生产 107891 或其 同系物或 107891 的前体或其同系物, 所述载体包含 DNA 序列, 所述 DNA 序列选自 ORF 1 到 17(SEQ ID NO : 2 到 18) 的任一个, 其编码所述途径中速率限制性的活性。
- 在适合于细胞生长的条件下培养用所述载体转化的所述微生物, 表达所述基因 并产生所述抗生素或抗生素前体。
适 合 的 宿 主 细 胞 是 放 线 菌 目, 到 链 孢 囊 菌 科 (Streptosporangiaceae)、 小单 孢 菌 科 (Micromonosporaceae)、 假 诺 卡 氏 菌 科 (Pseudonocardiaceae) 和 链 霉 菌 科 (Streptomycetaceae), 到小双孢菌属 (Microbispora)、 游动放线菌属 (Actinoplanes)、 游 动单胞菌属 (Planomonospora)、 链霉菌属 (Streptomyces) 等等。
在另一个方面, 本发明提供了生产 107891 的衍生物和其同系物的方法, 所述方法 包括以下步骤 :
- 在适合的载体中克隆选自 SEQ ID NO : 1 所定义的核苷酸序列的片段, 所述片段 含有 ORF 1 到 17(SEQ ID NO : 2 到 18) 之一的至少一部分, 所述 ORF 编码多肽, 所述多肽催 化希望绕过的生物合成步骤 ;- 通过除去或置换一个或更多个指定氨基酸的密码子来失活所述 ORF, 所述氨基 酸对于所述多肽的活性是必需的 ;
- 用所述重组 DNA 载体转化微生物, 所述微生物通过生物合成途径生产 107891 或 其同系物或其 107891 前体 ;
- 在所述产生的转化体中筛选出所述 DNA 序列被突变的拷贝置换的那些转化体 ;
- 在适合于细胞生长的条件下培养突变细胞, 表达所述途径并生产所述途径类似 物。
在又一个方面, 本发明提供了生产新的羊毛硫抗生素的方法, 所述方法包括以下 步骤 :
- 用重组 DNA 载体转化微生物, 所述微生物通过生物合成途径生产羊毛硫抗生素 或其同系物或其前体, 所述载体包含一个或更多个 ORF, 所述 ORF 选自 ORF 1 到 17(SEQ ID NO : 2 到 18), 其编码能够修饰所述羊毛硫抗生素或羊毛硫抗生素前体的一或多种酶 ;
- 在适合于细胞生长的条件下培养用所述载体转化的所述微生物, 表达所述基因 并产生所述羊毛硫抗生素或其同系物或其羊毛硫抗生素前体。
在又一个方面, 本发明提供了生产新的羊毛硫抗生素的方法, 所述方法包括以下 步骤 : - 用重组 DNA 载体转化微生物, 所述载体包含一个或更多个 ORF, 所述 ORF 选自 ORF 1 到 17(SEQ ID NO : 2 到 18), 其编码能够修饰羊毛硫抗生素或羊毛硫抗生素前体的一或多 种酶 ;
- 在适合于细胞生长的条件下培养用所述载体转化的所述微生物, 在存在所述羊 毛硫抗生素或羊毛硫抗生素前体的情况下表达所述基因。
在又一个方面, 本发明提供了生产新的羊毛硫抗生素的方法, 所述方法包括以下 步骤 :
- 用重组 DNA 载体转化微生物, 所述载体包含一个或更多个 ORF, 所述 ORF 选自 ORF 1 到 17(SEQ ID NO : 2 到 18), 其编码修饰羊毛硫抗生素或羊毛硫抗生素前体的一种或更多 种多肽 ;
- 在适合于一或多种活性多肽的存在的条件下制备所述微生物的细胞提取物或细 胞级分, 所述细胞提取物或细胞级分至少含有所述一或多种多肽 ;
- 将羊毛硫抗生素或羊毛硫抗生素前体添加到所述细胞提取物或细胞级分中, 在 所述一或多种多肽可以修饰所述羊毛硫抗生素或羊毛硫抗生素前体的条件下保温所述混 合物。
本发明的进一步的方面包括涉及 107891 的生物合成途径的分离的多肽, 选自
- 由 mlb ORF 1 到 17(SEQ ID NO : 2 到 18) 的任一个编码的 ORF 多肽, 和
- 一多肽, 所述多肽在其全长上在氨基酸序列上与 mlb ORF 1 到 17(SEQID NO : 2到 18) 的任一个、 优选 mlb ORF 1 到 3、 5 到 11、 13 到 17(SEQID NO : 2 到 4、 6 到 12、 14 到 18) 的 任一个编码的多肽具有至少 65%、 优选 95%或更高的相同性。
优选的多肽组包含由 mlb ORF 1 到 3、 5 到 11、 13 到 17(SEQ ID NO : 2 到 4、 6 到 12、 14 到 18) 的任一个编码的任何 ORF 多肽, 或在其全长上在氨基酸序列上与所述 mlb ORF 的 任一个编码的多肽具有至少 65%、 优选 86%、 更优选 90%、 最优选 95%或更高的相同性的
任何多肽。
定义
术语 “分离的核酸” 在此是指 DNA 分子, 作为基因组 DNA 或互补 DNA(cDNA), 其可以 是单链或双链的、 天然或合成来源的。该术语还指天然或合成来源的 RNA 分子。
术语 “核苷酸序列” 在此是指此处公开的 ORF 的全长或部分长度序列以及基因间 区域。
术语 “核苷酸序列” 在此还指和 / 或包含序列表中所示的本发明的核苷酸序列的 任一个。序列表的任一核苷酸序列是
A) 编码序列,
B) 来自 (A) 转录的 RNA 分子,
C) 利用了遗传密码的简并性来编码相同多肽的编码序列,
D) 基因间区域, 含有启动子、 增强子、 终止子和抗终止子序列。
术语 “基因簇” 、 “聚簇” 和 “生物合成聚簇” 在此是指微生物的基因组的连续片段, 其含有次级代谢产物的合成所需的全部基因。
术语 “mlb” 在此是指对小双孢菌 PTA-5024 中的 107891 生物合成负责的遗传元件。 该术语是 Microbispora LantiBiotic 的简称。 术语 “ORF” 在此是指编码一个多肽的基因组核苷酸序列。在本发明的上下文中, 术语 ORF 与 “基因” 同义。
术语 “ORF 多肽” 在此是指由 ORF 编码的多肽。
术语 “mlb ORF” 在此是指包含在 mlb 基因簇之内的 ORF。
术语 “次级代谢产物” 在此是指微生物通过由基因簇指定的一组基因的表达产生 的生物学活性物质。
术语 “载体” 在此被定义为包括特别是任何质粒、 粘粒、 噬菌体, 其可以通过整合到 细胞基因组中或染色体外地存在 ( 例如, 具有复制起点的自主复制质粒 ) 来转化原核宿主。
术语 “生产宿主” 、 “宿主细胞” 在此是微生物, 其中次级代谢产物的形成由来自供 体微生物的基因簇指导。
术语 “同系物” 在此是指由生物合成基因簇编码的多肽, 其在其全长上与由 mlb 聚 簇编码的任何多肽享有至少 65%的序列相同性。
附图简述
附图 1 显示了来自小双孢菌 PTA-5024 的染色体的分离的 DNA 片段。粗线表示了 SEQ ID NO : 1 中描述的片段。带有所述分离的 DNA 片段的粘粒被称为 1G6 和 6H6。
附图 2 显示了 mlb 聚簇的遗传结构。每个 ORF 由箭头表示, 如表 1 中的编号 ( 附 图 4)。取向与附图 1 中相同。标尺条上的数字表示序列坐标 ( 按照 kb)。
附图 3 显示了 107891 复合物的成分的结构。
附图 4 显示了 ORF 的主要特征。
A. 分离自小双孢菌的 mlb 基因
107891 是小双孢菌 PTA-5024 产生的紧密相关的肽抗生素的复合物。本发明提供 了用于 107891 生物合成的 mlb 基因簇的核酸序列和表征。mlb 基因簇的物理组织与侧翼 DNA 序列一起在附图 1 中报告, 其说明了来自小双孢菌 PTA-5024 的基因组的 20-kb 基因组
片段、 以及定义这样的片段的两个粘粒的物理图谱。调节 107891 生物合成的 DNA 片段的遗 传组织结构在附图 2 中示出, 它的核苷酸序列由 SEQ ID NO : 1 报告。
聚簇的精确边界可以根据它的基因产物的功能来建立。因此, 在左侧末端 ( 附图 1), mlb 聚簇由 mlb ORF1 划界, 编码 ABC 转运蛋白 (SEQ IDNO : 2), 涉及 107891 的输出。在 右侧, mlb 聚簇由 mlb ORF 17 划界, 一种膜离子反向转运蛋白 (SEQ ID NO : 18)。mlb 聚簇 跨越大约 20,000 个碱基对, 含有 17 个 ORF, 称为 mlb ORF1 到 mlb ORF17。SEQ ID NO : 1的 连续核苷酸序列 (20000 个碱基对 ) 编码 17 种推断的蛋白质, 列于 SEQ IDNO : 2 到 18 中。
ORF1(SEQ ID NO : 2) 代表从核苷酸 67 到 969 翻译 SEQ ID NO : 1 推断出的 300 个 氨基酸。
ORF2(SEQ ID NO : 3) 代表从核苷酸 966 到 2210 翻译 SEQ ID NO : 1 推断出的 414 个氨基酸。
ORF3(SEQ ID NO : 4) 代表从核苷酸 2941 到 3723 翻译 SEQ ID NO : 1 推断出的 260 个氨基酸。
ORF4(SEQ ID NO : 5) 代表从核苷酸 3948 到 4614 翻译 SEQ ID NO : 1 推断出的 221 个氨基酸。 ORF5(SEQ ID NO : 6) 代表在互补链上从核苷酸 5283 到 4621 翻译 SEQ ID NO : 1推 断出的 220 个氨基酸。
ORF6(SEQ ID NO : 7) 代表从核苷酸 5414 到 5587 翻译 SEQ ID NO : 1 推断出的 57 个氨基酸。
ORP7(SEQ ID NO : 8) 代表从核苷酸 5706 到 9053 翻译 SEQ ID NO : 1 推断出的 1115 个氨基酸。
ORF8(SEQ ID NO : 9) 代表从核苷酸 9080 到 10507 翻译 SEQ ID NO : 1 推断出的 475 个氨基酸。
ORF9(SEQ ID NO : 10) 代表从核苷酸 10537 到 11184 翻译 SEQ ID NO : 1 推断出的 215 个氨基酸。
ORE 10(SEQ ID NO : 11) 代表从核苷酸 11181 到 12131 翻译 SEQ IDNO : 1 推断出的 316 个氨基酸。
ORF11(SEQ ID NO : 12) 代表从核苷酸 12253 到 12981 翻译 SEQ ID NO : 1 推断出的 242 个氨基酸。
ORF12(SEQ ID NO : 13) 代表从核苷酸 13357 到 13992 翻译 SEQ ID NO : 1 推断出的 211 个氨基酸。
ORF13(SEQ ID NO : 14) 代表从核苷酸 14795 到 15544 翻译 SEQ ID NO : 1 推断出的 249 个氨基酸。
ORF14(SEQ ID NO : 15) 代表从核苷酸 15546 到 16256 翻译 SEQ ID NO : 1 推断出的 236 个氨基酸。
ORF15(SEQ ID NO : 16) 代表从核苷酸 16370 到 17995 翻译 SEQ ID NO : 1 推断出的 541 个氨基酸。
0RF16(SEQ ID NO : 17) 代表从核苷酸 17992 到 18528 翻译 SEQ ID NO : 1 推断出的 178 个氨基酸。
ORF17(SEQ ID NO : 18) 代表从核苷酸 18525 到 19817 翻译 SEQ ID NO : 1 推断出的 430 个氨基酸。
mlb 聚簇的基因组结构和一级序列将 107891 置于 A 型羊毛硫抗生素中。
mlb 和其他羊毛硫抗生素基因簇之间的比较揭示了重要的不同。实际上, mlb 聚簇 的特征在于在其他羊毛硫抗生素聚簇中没有找到同系物的几种 ORF 的存在。这些包括 ORF 1 到 6、 12、 15 到 18(SEQ ID NO : 2 到 7、 13、 16 到 19)。总之, 此处描述的 mlb 聚簇的结构实 质上不同于其他羊毛硫抗生素的合成中所涉及的其他聚簇的结构。 因而它代表了具有这样 的基因组结构的聚簇的第一个实例。
B.mlb 基因的作用
本发明公开了负责 107891 的前原肽前体的合成的 DNA 序列。107891 前原肽由 33-aa 长度的前导肽和 24-aa 的原肽组成。在此所指的核酸序列是编码 107891 前原肽或 其片段的那些。57-aa 的 107891 前原肽代表了新的元件, 其在它的全长上与来自鸡葡萄球 菌 (Staphylococcus gallinarum) 的羊毛硫抗生素 gallidermin 的前原肽、 UniProt 登记 号 P21838 仅具有 41%的相同性。
mlb 聚簇中存在的其他基因代表了对于提高 107891 的产生或合成新的代谢物有 用的新的遗传元件。在这些之中, mlb ORF 7 到 8(SEQ ID NO : 8 到 9) 编码涉及 mlb ORF6 的翻译产物的翻译后修饰的蛋白质, 在成熟的 107891 中导入羊毛硫氨酸残基。特别是, mlb ORF7 多肽负责 107891 的前原肽部分中 Ser 和 Thr 残基的脱水, 分别产生脱氢丙氨酸和脱氢 氨基丁酸残基。mlb ORF8 多肽催化前原肽内部半胱氨酸残基对脱氢氨基酸残基的亲核攻 击。 这些基因可以在异源宿主中克隆和表达以产生能够将羊毛硫氨酸残基导入其他前原肽 的有活性的酶。
本发明的另一个优选的核酸分子包括 mlb ORF9(SEQ ID NO : 10), 其编码在产生 S-[(Z)-2- 氨基乙烯基 ]-(3S)-3- 甲基 -D- 半胱氨酸残基 ( 式 I) 的氧化脱羧作用中涉及的 蛋白质。
本发明的又一个优选的核酸分子包括 mlb ORF16(SEQ ID NO : 17), 其编码色氨酸 卤化酶 (halogenase), 负责将氯原子加到 107891 的氨基酸 4。 mlb ORF 16 代表新的和独特 的遗传元件, 早先在其他羊毛硫抗生素聚簇中没有报道。实际上, 氯化是 107891 在已知的 羊毛硫抗生素中相当独特的特征。这个基因可以在异源宿主中克隆和表达, 产生能够氯化 羊毛硫抗生素分子的色氨酸残基的活性酶。或者, mlb ORP16 可以在生产菌株中失活, 导致 缺乏附着于氨基酸 4 的氯的 107891 衍生物的形成。
本发明的又一个优选的核酸分子包括 mlb ORF2(SEQ ID NO : 3), 其编码对 107891 前原肽的翻译后修饰负责的细胞色素 P450 羟化酶, 通过添加一个或两个氧到位置 14 的脯 氨酸残基。mlb ORF2 代表新的和独特的遗传元件, 在其他羊毛硫抗生素聚簇中从未被报道 过。实际上, 107891 脯氨酸羟基化谱在羊毛硫抗生素中相当独特的。这个基因可以在异源 宿主中克隆和表达, 产生能够氧化羊毛硫抗生素分子中存在的脯氨酸残基的活性酶。 或者, mlb ORP2 可以在生产菌株中失活, 导致氨基酸 14 处缺乏氧原子的 107891 衍生物的形成。
mlb 聚簇还包括许多调节基因, 对 107891 生产期间直接或间接地活化生物合成和 抗性基因的表达负责。这些基因包括 mlb ORF 3 和 5(SEQ IDNO : 4 和 6) : mlb ORF3(SEQ ID NO : 4) 代表独立的群体感应 (quorum-sensing) 肽, 对 107891 生产的调节部分地负责 ; mlbORF5(SEQID NO : 6) 是与 Sigma-70 高度相关的, Sigma-70 是一种作为正转录调节物的 RNA 聚合酶 sigma 因子的细胞质外功能家族。mlb ORF 3 和 5 代表了其他羊毛硫抗生素聚簇没 有的新的遗传元件。这两个基因, mlb ORF 3 和 5 可以单独地或按它们任何的组合在另一 个羊毛硫抗生素生产者菌株中克隆和表达来提高形成的产物的产量。
宿主菌株包括但不限于属于放线菌目的菌株, 属于链孢囊菌科、 小单孢菌科、 假诺 卡氏菌科和链霉菌科的菌株, 属于小双孢菌属、 游动放线菌属、 游动单胞菌属、 链霉菌属的 菌株等等。或者, 这些基因可以单独地或它们的任何组合在 107891 生产菌株中过表达来提 高 107891 的产量。
mlb 聚簇还包括对输出羊毛硫抗生素中间物或终产物到细胞质外负责的、 以及对 生产者细胞赋予抗性负责的许多基因。 这些基因包括 mlb ORF 1、 10 到 11、 13 到 14 和 17(SEQ ID NO : 2、 11 到 12、 14 到 15 和 18)。mlb ORF1、 10 到 11、 13 到 14 编码 ABC 类别的转运蛋白, 对 107891 或它的中间物的 ATP 依赖性排出负责。mlb ORF17 编码 Na/K 离子反向转运蛋白, 对于对抗质子梯度输出 107891 或它的中间物负责。这些基因可以单独地或按它们任何组 合在另一个羊毛硫抗生素生产者菌株中克隆和表达来提高形成的产物的产量。 宿主菌株包 括但不限于属于放线菌目的菌株, 属于链孢囊菌科、 小单孢菌科、 假诺卡氏菌科和链霉菌科 的菌株, 属于小双孢菌属、 游动放线菌属、 游动单胞菌属、 链霉菌属的菌株等等。
或者, 这些基因可以单独地或它们的任何组合地在 107891 生产菌株中过表达来 提高 107891 的产量。
C.mlb 聚簇的用途
本发明还提供了用于完整 107891 分子、 其任何前体或其衍生物的表达的核酸。这 样的核酸包括一或多个分离的基因簇, 所述基因簇包含编码足以指导 107891 组装的多肽 的 ORF。 在一个实例中, 完整的 mlb 聚簇 (SEQID NO : 1) 可以被导入适合的载体中, 用于转化 期望的生产宿主。在另一个方面, mlb 聚簇作为两个独立的片段克隆到两个不同的载体中, 所述载体在期望的生产宿主中是相容的。在又一个方面, mlb 聚簇可以分成三个片段, 各自 克隆到独立的、 相容的载体中。一、 二或三载体系统的使用的实例已经在文献中描述了。
一旦 mlb 聚簇被适当地克隆到一个或更多个载体中, 它可以被导入许多适合的生 产宿主中, 在其中羊毛硫抗生素的生产可以以比天然宿主中更高的效率发生。优选的宿主 细胞是可以有效地表达放线菌基因的那些物种或菌株。 这样的宿主包括但不限于属于放线 菌目, 链孢囊菌科、 小单孢菌科、 假诺卡氏菌科和链霉菌科, 小双孢菌属、 游动放线菌属、 游 动单胞菌属、 链霉菌属等等。或者, 被克隆到一个或更多个适合的载体中的 mlb 聚簇的第二 拷贝可以被导入 107891 生产菌株中, 在其中 mlb 基因的第二拷贝将提高 107891 的产量。
生产能力向良好表征的宿主的转移可以实质上改善导致优化和发展的过程的几 个部分 : 生产菌株中天然产物的滴度可以更有效地提高 ; 天然产物的纯化可以在可能干扰 活性的已知背景中进行 ; 复合物的组成可以更有效地控制 ; 天然产物的改变的衍生物可以 通过发酵条件的操作或通过途径工程化来更有效地产生。
或者, 生物合成基因簇可以被修饰, 插入到宿主细胞中, 用于合成或化学地修饰各 种各样的代谢物 : 例如, 开放阅读框可以被重新排序, 修饰, 和与其他羊毛硫抗生素生物合 成基因簇组合。
使用在此提供的信息, 107891 核酸的克隆和表达可以利用常规和公知的方法实现。 在另一个可能的用途中, 从 mlb 基因簇选择的 ORF 可以通过使用常规的分子生物 学技术来分离和失活。克隆在含有 DNA 片段的适合的载体中的突变的 ORF 被导入所述小双 孢菌菌株中, 所述 DNA 片段侧翼于小双孢菌 PTA-5024 染色体中的所述 ORF, 其中同源重组 的两次交叉事件引起所述生产者菌株中所述 ORF 的失活。这个过程对于以有效的方式生产 107891 的前体或衍生物是有用的。
在另一种可能的用途中, 从 mlb 基因簇选择的 ORF 被分离并置于期望的启动子的 控制下。克隆在适合的载体中的工程化的 ORF 然后被导入小双孢菌 PTA-5024, 通过如上所 述置换原始 ORF、 或作为所述 ORF 的另外的拷贝。 这个操作对于提高或降低对 107891 分子、 其前体或衍生物的生产是关键的 ORF 的表达水平是有用的。
实验小节
以下实施例用来说明鉴定出 107891 基因簇的原理和方法, 以及鉴定和分析所有 mlb 基因的原理和方法。 这些实施例用来说明本发明的原理和方法, 但是不意味着限制它的 范围。
一般方法
除非另外指出, 细菌菌株和克隆载体全部可以从公众保藏机构或商业来源获得。 使用分子生物学的标准方法。小双孢菌属在 HT 琼脂和在 V6 培养基 (20g/l 葡萄糖, 5g/l 酵 母提取物, 3g/l 酪蛋白水解物, 5g/l 肉类提取物, 5g/l 蛋白胨, 1.5g/l NaCl, 0.5%甘油 ) 中 生长。根据公开的过程分离羊毛硫抗生素。使用标准程序进行序列分析。在公众站点使用 Blast 或 Fasta 程序进行数据库检索。
实施例 1-107891 生物合成基因的分离
使用来自小双孢菌 PTA-5024 的 DNA 在接合粘粒载体 Supercos 3 中制备基因组文 库。这通过将来自 pSET152 的 aacIV-oriT-intΦC31 盒插入 Supercos 1(Stratagene, La Jolla, CA 92037) 中来构建如下 : aacIV-oriT-intΦC31 盒通过 PCR 从载体 pSET152 作为 3.8kb 长的 NruI 片段获得, 插入到 supercosl 的相同位点中。来自小双孢菌 PTA-5024 的总 DNA 用 Sau3AI 部分地消化以将片段大小优化在 40kb 范围内。部分消化的 DNA 用碱性磷酸 酶处理, 连接到早先用 BamHI 消化的 Supercos3。连接混合物体外包装, 用于转染大肠杆菌 (E.coli)XL1Blue 细胞。产生的粘粒文库通过与寡核苷酸探针 5′ -GTS ACS WSS TGG WSS YTS WSS ACS GGS CCS TGCACS WSS CCS GGS GGS WSS AAC WSS WSS TCC WSS TG-3′ (SEQ IDNO : 19) 杂交来筛选。根据从 107891 的结构推测出的氨基酸序列设计寡核苷酸。分离出 对于该探针为阳性的两个粘粒, 用限制性内切酶物理作图。根据这样的实验, 鉴定了附图 1 中报道的粘粒。由此从小双孢菌 PTA-5024 的基因组鉴定的片段含有对抗生素 107891 的合 成负责的 mlb 基因簇。
以上实施例用来说明 mlb 聚簇被分离的原理和方法。本领域技术人员将想到的是 mlb 聚簇可以克隆在多种载体中。然而, 本领域技术人员将理解, 考虑到 mlb 聚簇的 20-kb 大小, 优选的载体是能够携带大的插入物的那些, 例如 lambda、 粘粒和 BAC 载体。本领域技 术人员理解, 其他探针可用于从这样的文库鉴定 mlb 聚簇。根据在 SEQ ID NO : 1 中报告的 序列, 任何片段可以从小双孢菌 PTA-5024DNA 中 PCR 扩增, 用于筛选使用这些 DNA 制得的文 库。从所述文库可以鉴定出包括 SEQ ID NO : 1 覆盖的任何片段的一个或更多个克隆。此
外, 还可能的是通过使用异源探针例如来自其他 lan 聚簇的那些利用表 1 中提供的信息鉴 定 mlb 聚簇。或者, 指导次级代谢产物的合成的其他基因簇含有与 mlb 基因足够相关的基 因以允许异源杂交。所有这些变体属于本发明的范围。
实施例 2-107891 基因簇的序列分析
如实施例 1 所述鉴定的 mlb 聚簇通过鸟枪法测序。mlb 聚簇的序列在此由 SEQ ID NO : 1 提供。分析产生的 DNA 序列来鉴定可能的编码序列, 编码序列与其他 lan 聚簇比较或 针对 GenBank 来检索。每个 ORF 的确切起始密码子通过相关序列的多次比对或通过搜索上 游核糖体结合位点来确定。总共鉴定了 17 个 ORF, 命名为 mlb ORF 1 到 ORF 17。这些分析 的结果在表 1 中概述, 在此在序列表中作为 SEQ ID NO : 2 到 SEQ ID NO : 18 来提供。 详述如 下。
2A.107891 前原肽的合成
mlb ORF 6 对前原肽的合成负责。前原肽含有 49-aa 的前导序列和 24-aa 的原肽 (SEQ ID NO : 7), 原肽被翻译后修饰来产生成熟的羊毛硫抗生素。 羊毛硫抗生素前导肽的两 个共同特征在 107891 中被保留 : A 型羊毛硫抗生素的保守序列 ( 例如, F-D/N-L-D/E 基序 ) 和在位置 -2 的脯氨酸残基。前原肽 (SEQ ID NO : 7) 的 C- 末端部分与公开的 107891 一级 结构以及它的预定的原肽序列相一致。 2B.107891 原肽的翻译后修饰
由 mlb ORF 7 到 9 和 mlb ORF 17 编码的四种蛋白质 (SEQ ID NO : 8 到 10 和 SEQ ID NO : 18) 涉及 107891 前原肽的翻译后修饰。这些基因产物的同系物在许多羊毛硫抗生 素聚簇中发现。 根据与其他羊毛硫抗生素聚簇中发现的脱水酶和环化酶的序列相同性以及 它们的作用, 可以进行以下的预测。mlb ORF7 多肽对 107891 原肽的位置 3、 5、 13、 18 和 21 处的丝氨酸残基以及位置 2 和 8 处的苏氨酸残基的脱水负责, 产生相应的脱水的残基。mlb ORF8 多肽催化 107891 原肽中存在的半胱氨酸残基向四个脱氢丙氨酸和一个脱氢氨基丁酸 残基的区域和立体特异共轭加成, 产生相应的五个硫醚。特别地, mlb ORF 8 多肽涉及 3-7、 13-20、 18-23 和 21-24 羊毛硫氨酸的形成和 8-11 甲基羊毛硫氨酸的形成。
在表皮素和 mersacidin 聚簇编码的脱羧酶观察到的序列相同性的基础上, mlb ORF9 编码对 21-24 羊毛硫氨酸部分的脱羧作用负责的酶。 在其他抗生素聚簇编码的黄素还 原酶观察到的序列相同性的基础上, mlb ORF16 编码黄素蛋白还原酶。考虑到在表皮素和 mersacidin 形成期间氧化脱羧作用预计的作用, mlb ORF9 和 16 多肽催化 107891 中存在的 S-[(Z)-2- 氨基乙烯基 ]-D- 半胱氨酸残基的形成 ( 式 I)。
2C.β- 羟脯氨酸和色氨酸氯化的形成
由 mlb ORF 2 和 15(SEQ ID NO : 3 和 16) 编码的两种蛋白质涉及一个或两个 β 羟 基基团向位置 14 处的脯氨酸残基的添加和 107891 原肽的位置 4 处的色氨酸残基的氯化。 mlb ORF2 多肽显示了与 P450 单加氧酶的显著的相同性 ( 表 1), 涉及脯氨酸残基的羟基化。 在其他羊毛硫抗生素聚簇中没有发现 mlb ORF2 的同系物, 因而这个基因代表了涉及羊毛硫 抗生素分子的羟基化的 P450 单加氧酶的独特实例。此外, 在与其他卤化酶的相同性水平的 基础上, mlb ORF15 多肽涉及色氨酸氯化, 代表了羊毛硫抗生素分子的修饰中涉及的卤化酶 的独特实例。
2D. 输出和抗性
由 ORF 1、 10、 11、 13、 14 和 17(SEQ ID NO : 2、 11、 12、 14、 15 和 18) 编码的五种蛋白 质涉及将 107891 或它的前体输出到细胞质外部, 以及涉及为生产菌株赋予抗性。它们预测 的作用如下。
ORF1(SEQ ID NO : 2) 的同系物在其他羊毛硫抗生素聚簇中不存在。这个基因编 码另外的 ABC 型转运蛋白 ( 表 1), 因而涉及在生产菌株小双孢菌 PTA 中赋予对 107891 的 抗性。ORF 10、 13 到 14 和 17(SEQ ID NO : 11、 14 到 15 和 18) 的同系物存在于其他羊毛硫 抗生素聚簇中 ( 表 1)。它们分别编码 ABC- 型和离子依赖性跨膜转运蛋白。因而它们涉及 107891 或其前体的输出或区室化。mlb ORF17 编码 Na/K 离子反向转运蛋白, 对抗质子梯度 输出 107891 或它的中间物负责。
2E. 调节
由 ORF3 和 5(SEQ ID NO : 4 和 6) 编码的两种蛋白质涉及调节一种或更多种 mlb 基 因的表达。mlb ORF5 多肽 (SEQ ID NO : 6) 代表新的遗传元件, 其同系物在其他羊毛硫抗生 素聚簇中没有发现。这种蛋白质属于作为正转录调节物起作用的 sigma 因子的细胞质外功 能家族。ORF3 多肽 (SEQID NO : 4) 属于 LuxR 型转录调节物的家族。ORF3(SEQ ID NO : 4) 因 而可能是一种或更多种 mlb 基因的表达所需的。
2F. 其他功能
在 mlb 聚簇中存在两个另外的 ORF : ORF4(SEQ ID NO : 5) 和 ORF12(SEQ ID NO : 13)。 两个 ORF 分别与 Salinispora tropica 和产二素链霉菌 (Streptomyces ambofaciens) 中 存在的未知功能的蛋白质相关 ( 表 1)。 然而, 它们在 107891 生物合成中的确切作用还不能 预测。
实施例 3- 通过基因置换的 107891 途径的操作
使用实施例 2 中提供的信息, 如下构建 ORF2 中的符合读框的缺失。通过用寡聚物 5′ -AAGCTTGCATCTGCGTGGGCGTCCTGC-3′ (SEQ ID NO : 20) 和 5′ -TCTAGACGGTCCGAAGATCAT GGCCGCGG-3′ (SEQ ID NO : 21) 扩增获得片段 A ; 用寡聚物 5′ -TCTAGATCCATGTGAACCGGCGGG TGGCCG-3′ (SEQ ID NO : 22) 和 5′ -GAATTCCGGTCGCTCTCCTCGTCCTTTGCC-3′ (SEQ ID NO : 23) 扩增片段 B。
然后, 用 EcoRI 和 XbaI 消化片段 A, 用 XbaI 和 HindIII 消化片段 B, 都连接到早先 用 EcoRI 和 HindIII 消化的 pSET152。在转化大肠杆菌 DH5α 细胞之后, 产生的质粒称为 pDM1, 通过在用 EcoRI 和 HindIII 消化后 4kb 和 1.5kb 的片段的存在来识别。 pDM1 的等份转 移到大肠杆菌 ET12567(pUB307) 细胞中, 产生菌株 DM1。 然后, 来自 LB 中的过夜培养物的约 8 7 10 CFU 的 DM1 细胞与在 Rare3 培养基中生长约 80h 的约 10 CFU 的小双孢菌 PTA 5024 混合。 产生的混合物涂布在 HT 平板上, 其然后在 28℃保温约 20h。在用水柔和洗涤除去过量的大 肠杆菌细胞后, 平板用含有 200μg 萘啶酸和 15μg/ml 安普霉素的 3mL 软琼脂覆盖。 在 28℃ 进一步保温 3-5 周后, 小双孢菌外接合体在含有安普霉素的新鲜培养基上划线。一株这样 的的外接合体, 称为菌株 Mb-DM1, 被进一步处理。菌株 Mb-DM1 然后在没有安普霉素的 HT 培养基中生长几个传代, 合适的稀释物平铺在没有安普霉素的 HT 琼脂上。然后使用寡聚物 5′ -CGCGCTGCTCGGGGCCAAC-3′ (SEQID NO : 24) 和 5′ -AGGAAACGGCCAGCCCGTGG-3′ (SEQ ID NO : 25) 通过 PCR 分析单独的菌落。含有 ORF2 的缺失的等位基因的菌落通过 1.5kb 条 带的存在来识别。 一种这样的菌落, 称为 Mb-DM2, 在 HT 培养基中生长, 通过与可信的标准比较来确认脱羟基 -107891 的形成。
上述实施例用来说明原理和方法, 通过所述原理和方法在 SEQ ID NO : 2 到 18 所指 定的当中选择的 ORF 可以被 107891 生产菌株小双孢菌 PTA5024 中突变的拷贝来置换。本 领域技术人员想得到的是 ORF2(SEQ ID NO : 3) 是在 SEQ ID NO : 1 说明的聚簇中产生符合读 框的缺失的方法的实例。
本领域技术人员还理解的是, 符合读框的缺失仅仅是产生突变的一种方法, 包括 但不限于移码突变、 插入和定点突变的其他方法也可以用于产生 SEQ ID NO : 2 到 18 所指定 的任何 ORF 中的无效突变体。
本领域技术人员还理解, 建立了在 SEQ ID NO : 1 指定的任何 ORF 中产生突变的方 法, 这些相同的方法可以用于改变这些同样的 ORF 的表达水平。如何实现这一点的实例包 括但不限于所述 ORF 的多个拷贝整合到小双孢菌 PTA 5024 基因组的任何地方, 改变控制所 述 ORF 的表达的启动子, 除去干扰它们的表达的反义 RNA 或转录终止子。
最后, 用于将突变的等位基因导入小双孢菌 PTA5024 中的载体、 所述供体和接受 体菌株的接合和培养的条件、 挑选和筛选外接合体和它们的衍生物的方法中的改变都属于 本发明的范围内。
实施例 4- 羊毛硫抗生素的体外卤化
使用实施例 2 中提供的信息, mlb ORF15(SEQ ID NO : 16) 在大肠杆菌中如下过表 达。 通过用寡聚物 5′ -TTTTTCATATGGGTGGGAGTGATCGGCGGCG-3′ (SEQ ID NO : 26) 和 5′ -T TTTTGTCGACCTACTGCTGGCCGCGGTCCGGACT-3′ (SEQ ID NO : 27) 扩增获得的 1.6kb 片段用 NcoI 和 SalI 消化, 连接到预先用 NcoI 和 XhoI 消化的 pET22b。在转化大肠杆菌 DH5α 细胞之 后, 可通过用 NdeI 和 XhoI 消化后 5.5kb 和 1.6kb 片段的存在来识别的、 产生的质粒 pHAL 被导入大肠杆菌 BL21(DE3) 细胞。带有 pHAL 的大肠杆菌 BL21(DE3) 细胞的培养物在 LB 中 在 20℃生长到 0.6 的 OD600。然后, IPTG 添加到 1mM, 细胞进一步生长 6h。收获细胞, 通过 超声处理破裂, 从 Ni- 琼脂糖柱回收 His 标签标记的 ORF15 多肽。进行底物例如乳链球菌 素 481 或 97518 的卤化, 通过 MS 分析确定羊毛硫抗生素的氯衍生物的形成。
以上实施例用来说明原理和方法, 通过所述原理和方法在 SEQ ID NO : 2 到 18 指定 的那些中选择的任何 ORF 可以在方便的宿主中过表达, 产生过量生产的酶并用于将羊毛硫 抗生素天然产物转化成不同的化合物。 本领域技术人员将想到的是, ORF15(SEQ ID NO : 16) 仅仅是用作过量生产 SEQID NO : 1 编码的任何多肽的方法的实例。本领域技术人员还理解 的是, 过量生产蛋白质的其他方法包括但不限于利用不同的亲和标签、 利用不同的载体、 不 同的宿主菌株和诱导方法也可以用于过量产生 ORF 1 到 17(SEQ IDNO : 2 到 18) 指定的多 肽。
本领域技术人员将想到的是, 含有或没有色氨酸残基的其他羊毛硫抗生素底物可 以用于通过 ORF15(SEQ ID NO : 16) 添加氯原子。本领域技术人员还将想到的是, mlb 聚簇 (SEQ ID NO : 1) 指定的其他 ORF 多肽可以用于其他羊毛硫抗生素前原肽的翻译后修饰。可 以用于这个目的的 ORF 多肽包括但不限于 ORF2(SEQ ID NO : 3)。特别地, ORF 7 和 8(SEQ IDNO : 8 和 9) 可用于在其他羊毛硫抗生素前原肽中脱水和引入硫醚键 ; ORF9 和 16(SEQ ID NO : 10 和 17) 可以用于使其他含有 C- 末端 Cys 残基的羊毛硫抗生素脱羧基 ; ORF 2(SEQ ID NO : 3) 可以用于羟化其他含有脯氨酸的羊毛硫抗生素。实施例 5-mlb 聚簇在异源宿主中的表达
使用实施例 1 和 2 中提供的信息, 含有所有 mlb 聚簇 (SEQ ID NO : 1) 的粘粒 1G6( 附 图 1) 通过如 Kieser et al., 2000 所描述的接合来导入白色链霉菌 (Streptomyces albus) 中。安普霉素抗性接合后体在合适的条件下生长, 如所述纯化 107891。
本领域技术人员还理解白色链霉菌仅是一种生产者菌株, 其他菌株也可以用于导 入全部 mlb 聚簇 (SEQ ID NO : 1) 和用于 107891 的生产。优选的宿主细胞是可以有效地表 达放线菌基因的那些物种或菌株。这样的宿主包括但不限于放线菌目, 链孢囊菌科、 小单 孢菌科、 假诺卡氏菌科和链霉菌科, 小双孢菌属、 游动放线菌属、 游动单胞菌属、 链霉菌属等 等。本领域技术人员理解只要适合的启动子置于 mlb 操纵子前, 生产宿主不必限于可有效 地表达放线菌基因的那些细胞。 这后一类别的适合的生产宿主可以在易于遗传学操作的那 些、 或天然地生产其他羊毛硫抗生素的那些中找到。这样的生产宿主的实例包括但不限于 大肠杆菌和相关物种, 芽胞杆菌、 链球菌、 乳杆菌、 葡萄球菌等等。
本领域技术人员还理解, 使用在该实施例中描述的方法, mlb 聚簇可以作为第二拷 贝被导入原始的 107891 生产者菌株小双孢菌 PTA 5024, 其中 mlb 基因的第二拷贝将提高 107891 的产量。
本领域技术人员还理解不同的载体、 导入 mlb 聚簇的不同方法、 选择带有 mlb 聚簇 的重组克隆的不同的方法、 生长所述重组克隆的不同方法和条件、 检测 107891 生产的不同 方法对于 mlb 聚簇在异源宿主中的表达是有效的。
实施例 6-107891 变体文库的产生
使 用 实 施 例 2、 3 和 5 中 提 供 的 信 息, 如 下 修 饰 mlb ORF 6(SEQ ID NO : 7) 来 产 生 107891 的 变 体。 首 先, 利 用 片 段 A 的 寡 聚 物 5 ′ -GCAGCCAGGCTCGCACCGGC-3 ′ 和 CGCCCGTAACGAGCGA(SEQ ID NO 28 和 29) 和片段 B 的寡聚物 5′ -GCAGCTTCTGCTGCTGA-3′ 和 5 ′ -TCCCGGCCAGCCACTT-3 ′ (SEQ ID NO 30 和 31) 根 据 实 施 例 3 的 方 法 扩 增 ORF6 来构建在 ORF 6(SEQ ID NO : 7) 中带有符合读框的缺失的载体。产生的构建体用于根 据 实 施 例 3 的 方 法 置 换 如 实 施 例 5 中 所 描 述 获 得 的 白 色 链 霉 菌 菌 株 中 的 ORF6, 产生 SA-D6 菌株。然后, 通过用寡聚物 5 ′ -CCGGAAAGGAGCGAGCATATG-3 ′ (SEQ ID NO : 32) 和 5′ -CAGATCTGCCAATACAGT-3′ (SEQ ID NO : 33) 扩增获得的 mlb ORF6(SEQ ID NO : 7) 的 前肽部分用 NdeI 和 BglII 消化并连接到用 NdeI 和 BglII 预先消化的 pIJ8600(Kieser et al., 2000) 产生质粒 pPREl。在平行的实验中, 寡聚物 A 5′ -C GGT GTC GAG GAG ATC ACCGCC GGG CCG GCG NNN NNN AGC NNN NNN NNN TGC ACC NNNNNN TGC NNN AGC NNN NNN NNN NNN AGC NNN TGC AGC NNNTGC TGC TGA AGA TCT-3′和寡聚物 B 5′ -T TCA GCA GCA NNN GCT GCANNN GCT NNN NNN NNN NNN GCT NNN GCA NNN NNN GGT GCANNN NNN NNN GCT NNN NNN CGC CGG CCC GGC GGT GAT CTC CTCGAC ACC GAT CGA-3′ (SEQ ID 34 和 35) 被变 性和退火来产生 DNA 片段 (SEQ ID NO : 36) 的混合物, 其编码多肽, 所述多肽具有在预计涉 及硫醚形成的 ORF6 多肽的原肽区域 ( 特别是氨基酸 3、 7、 8、 11、 13、 18、 20、 21、 23 和 24) 的 氨基酸序列中所有可能的改变。这种 DNA 片段的混合物连接到预先用 BSA OI 和 BglII 消 化的质粒 pPREl, 来产生质粒的文库, 所述质粒的文库带有融合到编码前导肽的 ORF6 片段 的、 编码原肽的 ORF6 片段的所有可能的变体形式 ( 预期 ( 甲基 ) 羊毛硫氨酸桥 )。该质粒 文库被导入 SA-D6 菌株中, 在存在 μg/ml 硫链丝菌肽的情况下生长产生的接合外体通过生物学分析或 HPLC 分析来筛选 107891 变体的产生。通过测序 ORF6 变体的原肽部分和通过 结构推测来进一步表征感兴趣的变体。
本领域技术人员理解 ORF6 多肽的前导肽部分也可以被修饰, 只要在翻译后修饰 中涉及的酶 (SEQ ID NO : 8 和 9) 可以识别所述不同的前导肽。在 ORF6 多肽的前导肽部分 中的改变属于本发明的范围。
本领域技术人员将想到的是其他方法可以用于构建 ORF 6 变体的文库, 包括但不 限于使用不同的寡聚物、 载体、 诱导系统和宿主菌株。此外, 本领域技术人员理解甲基羊毛 硫氨酸残基可以被羊毛硫氨酸残基置换, 反之亦然, 产生另外的 ORF 6 变体。本领域技术人 员还理解的是定点诱变可以用于产生导致指定的 107891 衍生物的生产的 ORF 6 的选定的 变体。20101939328 A CN 101939331序列 序列表表1/39 页<110> 森蒂内拉制药公司 <120> 用于羊毛硫抗生素 107891 的生物合成的基因和蛋白质 <130>07636M35 <160>36 <170>PatentIn version 3.5 <210>1 <211>20000 <212>DNA <213>Microbispora sp.PTA-5024 <400>1 actcgtcgtg ttaccggtga gagaggccgg ggggccaacg gacggaggcc gtcaagcgcg cgggagttcc gaccagatcg ggcggttact ccggagctga ttccgctcct atcctcgacg gcctaccagg ccgcccggag gggacgcgct acgctcgaag cggccatgat gggacgaggc aggacgtgct cgagttcggc agaccgccgcctggcgtgca acaccagcat ccctgaacgg gcgccggcaa gcgtggtggt tcctgggcta tcgactacat agcagatgct ccggcgggat tcgtcgtgga tgctggccgg acgccgcgca gcagcaccgc cgcaggcgcc atcgcgtgat acggatacgc cttcggaccg gccgtgccac ggccgcgctc ggcgggcgcg ggaggggccgcgctggtgct cagcatcacc ggtgagcctg gacgaccctc gggcggccac cctgccgcag cgccctgctg cgagctgacc gaagcggcgg cgagcccacg cctcggcggg gacctgcccc cgggctcgcc gcccgaggcc cagcgcgcga ggcactgtta gacttccacc cacgagccgg aggcagccgg gggccgtacc gcgcggtcgcgctggccgtg gacctgacga accgtggacg atgcgcatct gacctcggta gagctgtcca aagggcgtcg ggcctgtccg ctgggaatcg gccgggctgg gcgcggcgta aacaccatcg gcggtcgccg gtggtcgtga ccgccgatcg cagctcggcg gggaccccta ccctcgggct cggtgttctc gcggagcgga tgctcttcct21gctcggatct agcgttaccg gcgggatgac gcgtgggcgt cggcggccgg tgtacgacga acgacaagcg agcatgcggg cccaggcgct acccctccga ccgtggtgct tgctgcacca agggccgcac acgcggcggc gcggcaccct aaccctcccc tccggtctac ctacgccctg ctcggccgcc taccgcgtcg ggacccgccgggacggagcg gcgcggcggc cgcgctgctc cctgcggccg ccggagggcg cctgaccggg tgtccgccgc ccggagactg actcgccgag acggatgcgg gtccacccac ggggcgggtc ctacctgctg ggaggtggag catgacgccg cacgggtccg cggcggctga tccaggtacg cgcgctgtgg ccggagcggg gagcaccagg60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260101939328 A CN 101939331序ggcggtgtcg catcgccgcc gttcgccgcc ccgggcacgc gcgctcctac cgacggcgag cgccgacgcg cttctgcgcg tctggtgctg gatccccgcc taccctcacc gctgctgacc catcggcagg gcacttctgc gacgcgtcgc gaacgggttc tacgtacagg gcggccctgc cccgtgccgt tatctgtggc gtcttcgtgg caccccccga gccctgctca aggagacggg atccggctcc aactgccgga agtgcggtgc tgacgggggg ggcaaaggac tcgtcgcatg tggacgtcgg ggctggcctt agcggtgccc atcgggccat gccgcaacct cgctggtcgc cccgtgcgga tcacgctgct aacggtcgat cgggggttca gggctggccg ccgctggcga gtgagcgagt tggctcggcc gaccggggcg tcggcgggcc ctcgtcggcc ttcggccgcc gccttcgagg gccgatgtgc ggatcggcgg ttccaccccg ctgggggcgg ttcccccgtt ggccacagcc gcatgacgaa tgctggccgg tgccgagtcc cgctcacggt cgcccgacgg tcacaccgat gcaccaccct ccgtccggtg tgcgtgaacc ggtaacaggg ggcacaaccg acgaccagcg gaggagagcg cgccagcctg ctgcacgttc gctgcccgtc gggcacgtcg ccagaacggg gctgcgcatg cgagccggcg accgccggcg gtgcgggccg gtaccgtcag列表ggtgctacgg cgaccgcggc cctgcgcctg ctccgccccc gctgcgtggc actcgtccgg cgcacccctg cgagtcggtg gtggcgcacg atattgggcg ccggctgctc gcgcgcctac gagcacagcg gctgcaggcc cgaggagcgg ctccatgtga gcccgcctgt ggcggcagag aagcaggaca acgatcgagt gctctcaacg ggcagcggtg ggaaagggct ccgaaaactt atctcgctac gggggagata aggcgatgtg ggacatcggg ccgccgacgc acgcgccgtt tctattcggc cccaggcgca tcgtcatgga tgctcaacac cggtggtgct gcgcggagcc aggtcgccga ccgagatcgc tgtaccgaag cttgagccgg ggcggcgagt ctcggcgtcc tccggcgccg cgcgaggacg cccgatgccg accgacgagc gcgatggcgt ctgtgcgcga ccgacccagc ccagccggag cccgacccgg ctcgggttcg agggtcgccc accgtgcgat accggcgggt ccggcgccgg ccgatccggc tcagcgaggc gcctgccctc accgcgctga gcggatacat gagaccagat acccgagtgt gtacacctcc cgcgatgccg cgcggcacgg cacaccgggg ccggggccgc ggcggagtgg cgcggagacg gcgcctgggc cgtgaccggc gctgctcccg cgggcccacg gcccacgcgg cgcgcaggag cagacgcttc ttacggagtc2/39 页tgctgcggca ccgtacggga tcgtcaccga ccgaagccga aggccgaact cgggcaaggg gcctgaggga aggtcgccgc tgtcgaacgc ggcccgacgc accagggccg cacacgtgct acgtcttcga gtctcggcgc ttcgagaact cggaggtcat ggccggacgc tctcctcgcc gcacaggtcc gaacctcgcc cgacaacgcc gaaggcgggg cagcctcggc ccgggaccac gggacggaaa gaaagatcga atggtgcgcg acagggcctg gtgcccgacc ggcgaggtcg ctgggagacc tatgacccgc aggctgatgg caccatactc gccgcgtgct gtccccgagc ccgggcgacc gaggaactgc tactgttccgcgccccaggc accggatcgc tcgctgtgat tgctgtccgc tgagcgccct tggtggcgga cggcctgccg aggccggcac accacgacca aggtcctgag gcctgcacgg gcagggacga accggcgacc cgctcgcgcg accggacgga gggtcccgtt cacgaccaga ttgcacgggc cacgagcaac cgaccacggc cacgacctac tcgcgccaag caatctctgc aggcggcggt ttcgtgcgcc acaggtgcac gccggaacgg acaccgggag accgaggggt cgcgacacga tgcggcgacg ctcaccgagg gtgctcggca gcgagctggg gtcattcagg gttccggagg gaggcgcgga gagtccatcg ctacgcgatc221320 1380 1440 1500 1560 1620 1680 1740 1800 1860 1920 1980 2040 2100 2160 2220 2280 2340 2400 2460 2520 2580 2640 2700 2760 2820 2880 2940 3000 3060 3120 3180 3240 3300 3360 3420 3480 3540 3600101939328 A CN 101939331序gggagctccg cccaccttct cacaccgccg cggcagcgcg ccccgctccc gcggccagca ttcgttccgg aggcgggtga cgagccagcc ccgaggcgac acgccgtggc gtgagcacgc gcacgaccgc gagcggtcag tggtcagccg cgatgtccgg gttcctcgtc ccagtccgcc gccatgtgca ggatagggga tccgccaccg gccggctcca cgccgtagcc gcctcgcccc tcctccgcca tggcgttcgt acggcatcct tatgtagcgt ctccgtcctc gaaatgttcg gcaatgcccg gacctctcga tgcacccccg aaccgcagac gccaccggcc agattcgcca tcctactcca agcggagttc gtccgaggcg ccgggagatc cgccccgcct ggctgtggca ccccggacgc gtcagccgtc gtgccagagc tccgcgtacc ccgccagatc ggcgacgacg gaccgagagc gggagagacc cgtgaccgag tcccggggtc cgggccgagc ccacgacgcg caggcggccg ggcttcgcgg cccctttcgg tccggctctt gatcctcggc cggccaccag gatcgggcac ggttgtgcgc ggaaactgcc cctcgcgctg acagcatacg cggacacctc cggctgccgt gtttctgtca actcaatgcg ctgacatcct tcggtgtcga ggtgcaccag gacaggggct ggaacacgag tttcgtgcgt ctgccgaact ccgcctgacg tccgcacgca列表gcgtcacgcg gccggggcgg ccgggttgcg gtcccgcgta agccgcggcc atccaggggt gccagaccac cgcccgcgcc ccgtagtcgc ttcccaggac acagcagctc gcaccaccgt gcgcgagcaa tcagccgtgc ggccggtcac cgtacgccgg tcagggcgtc tttgtcagtg gttggaattc acgagcacct tcggcgcggg ttctccagat gccaccccca cacaccgcca cggcggatga tcctcgccgt tccggttcac ggggatctgc tcattgagcc cttgtccgaa acttccgaga gccgggccgg ggcagcaact cgggccggag cagggcagaa tatggtccgg ttctccggca gtccgatgtc gccgccggcc ccaccaggag tttgtcgtgc gctggcagct gcgggccccc ggcgggccag gcgtgccgga gactcccgcc cgccgccagg accggcggac gagcgcgagt caggcgtgga caccaccgag caccgccgcg ctgcgcccgc gggcgccttc gaccgtgagc ctgatcctcg cctccgtcag caagtattac cgcgcaggtg cgagcacctg ccacgaggac gcagccaggc gccaggactc gccgcagcat cggccacgcg gcaactgctg ggcgtagcgg gttattgaca cgaacaccgg ccgaggacct cggtgacgag gcagcttctg cgcgtcccgc aggaccaggt gcaccggttg tcctcacctg tccggacaca gacgatcatc3/39 页accggacgcc acgctgtcgg tgagggctgg ttggcagagc cgaacccgcc ccagacggcc caccacggcg atcgttccga agggcgcggc acgaggacgc ctggtggcga tcggatcggt ctgaacaact accaggccca acgagaccgg cggtgtccgg ggcccgatca tcatctatca caaccggcgg ggccacctgt ctcgggcagc ctcgtcgacc cggttcggcc tcgcaccggc ctgaaggatc cccggcggcg tctcatgagg cacacgttcg cacgagtgcg ctagtagtcc aaaggagcga gctcgacctc ctggtcgctg ctgctgacat cccggtccgg ggaaaatgac gttatgcata gccttgacga gagccggctcgctcttcgga cggcccgtcc caccacgacg cgggcgcggc cgacccggac gcacgagagc catccgagca gcgaagacgg gcgagcatcc gcgaggtcga ggcatcgccg ccgagcagca ggcgccgtgc gaccgcggta cgaagcgtgg aggagctcgt accgcggccg atttgtcgtt gaccgtgccg gagcacgagc gtcccgccgc gtccgcggcc ctgacgccgt ggccgagcgc ggaggtgagc gagcgccacc cgcggagagc accggttcgg ttcctgccat attccggaat ggagacccgg ggagatcacc ccccggcggc gtagccagcc ccggcgcggg gggatgtctt ccgaattcga cgcccgttct cgtccgggcc233660 3720 3780 3840 3900 3960 4020 4080 4140 4200 4260 4320 4380 4440 4500 4560 4620 4680 4740 4800 4860 4920 4980 5040 5100 5160 5220 5280 5340 5400 5460 5520 5580 5640 5700 5760 5820 5880 5940101939328 A CN 101939331序gcgggcggcg ggccggtctg gcgccgggcc gttcggcctg cgggacgggt ccggctcgaa gaccgtgcgc cggatccacc cgccgcccgg gctgccggtc caccgcgctg ggcgacggcg cctggtggcg cgggcagggg cgacactccg gcgcacggag catgcgggcc ggtgccgctg gtggccgccg cgcccggctg gacgatcgcc gctgggggtg cgtcctggcg tctgctgccc ccaggacgcg cgcgcacacc cgcgcaggaa cgtccacctg cgcgcaggcc ctgggaaccg cggccgtacg cgactccggt cgtcccccgg cgcctggcac gcaggtggcc cctcgccgag catcagggcc caggctgcgg ggtacgggcg tgcgaagacg ctcgccaggg gccctcgcgc ttcgccggcg catcgcacca cgggatcgtg ggcgaccgga cgttcgaccg cgccccgtcc gaccgggtga cggccgccct gaggcgaggg gcgctgcgcg cgccgggagc ctgcacgtcg atcgagcggg ctgcgccgtt ctcgaactcc agcgagacac gtcgccacgg gaactcgtct cacgtggtgg cccgggccgg gatgtggacg gtcgccgccg ccctcgtact ctccccctcg ccgacaggcc ccgaaccccg tgggactggg cttctggccg ccggcggcgg cgggtgctcg cgcgtactgc ggcgacgagg atcgtggttc accgtcggcg gtcccgcgcc gggatcgggc列表ggaggccgtg cgacacgggc cgacatccgg ccggttcgac cgacatggag cggcgtcacg ctgtccttcc gcgctcgccg gctcgcgcag cgcggacatg tgacccgctc cgccgaggcg gcgctgccac gatccaggcc cgacctggag gctgtggcgg gttcctggag gcgcggactc gcaagaggag cggggagcgt ggctccggcc ggacgagctg cgcgggcgcg ggccaggcag cattccgcgg catcagcgtg ggtcgcggcc ccccgcactg gttcgagctg cgagatgcca gcggatggat ggcgctcgac ggaccagcgc actgcgcagg ggaccgcggt ccgtgaccgc gaccggagcg cgacttcctg ccgctggttc gagctggcct gggctcaagg atgcgaaccc acgtccgcga tggctgctgt gtgcaggcgc gctctcggca gtggtcgccg agcgtggcgc gccgcccagg cagcacgtgc atgagctccg gcctacgatc acgcggcggg gtgcgactcc ttgtccccgc aggtacggcg ggcccgcccg cctcgccgca gagatcgtca gatctgccga tccgccggaa acgctcggca gccggccggc tccggccggg gggctcccgg aacctggaac ccgaacatgg ggcctggagg ttcctgcctg cagctccgcg cggtggcggg ctgctcctcg acacccgagc gacgggggct cacgccgccc gggggaccgt cgcgaccagg ttcatccgct4/39 页tctcgctgct cacccagcct acaagcggct ggccgactcc agtggctggc cggcggtgca accagaccct aacccctcaa agatccttgg agcggttcga aactgttgat tcgacgtcgt attcggccgc ggaccgccgt tccacccgca ccgagatcgt cgcggcgtgg cggaccgtgc ccggctacaa gtgcggcgct tcgacgagga actccttgga ccttccgagt ggttcaccgg ccctgcacat cggccaacct acagcggacg gtctctgcct tcagcgcctt ggcagcggct gtgtgcgtta ggccggccgc cggagtggaa acctcggcga tgatcgcgca ttcccgggca ggcctccgca ggctctacct tgcccgtcctggccgctgat tcgcgcgcgg tcctgcgcta tcagcggcgg ggacgcgcgc tgctgctcgc tcgtccttga tctccgcgcg tcgcgggaag cgggcctcct tggacggggg cgggttcgcc aggtggacgc tggccgagct accttcggat cggccgaggc accacgaggc tcgacgacac cggcgggccc cggcccggca acgacgaggc ccccgtcgct gctcgcacca ccgagtcggc atgtcgcctt ccggccggcg acgagctggg gtgaggtggt ctcgcctgtt gggcgctgag ctccgatctg actgggacgc ccgtcagcat tccgcgacga agggctggct cgctggaacg gccgcgagcc ggaaccagga acggcgccga246000 6060 6120 6180 6240 6300 6360 6420 6480 6540 6600 6660 6720 6780 6840 6900 6960 7020 7080 7140 7200 7260 7320 7380 7440 7500 7560 7620 7680 7740 7800 7860 7920 7980 8040 8100 8160 8220 8280101939328 A CN 101939331序cgccggacag gctccccgag cgagctcggc caccgaggcc gcgcgccggg gcacgccttc gtgggctccg ccgcagggaa ccccaccgga cctggaatcc acccacggac caaccggctg cgccgtccag tcgtgcgggg cgggccgcgc gggatcgcgg gccacgctgt gaccccgcct acggcgcctt tgcgcaggcc gctgatcacg accgactacg cgcgatcccg cacctggtgc gtgccgtccc aacctgggat cacggggtgg ggctggacga cagatcgccg cccggagtct gaagtcgcgg gacggctcga gccgagtccg ggcgaggccg gggtggcgca gccggagtcg ccggccccgg ccccgaccca ggcccccgga cacctgcggg atcggcgcgc cagtacgacc gccttccagc ttccgctaca ggtcctcccg gatctgttcg ctaccgcccg ggctggcggg agggatgagg tccccgtcga atcggcggat gacaacctga tgacccctga gcctggtgcg cccgccccgg cgcacggatt ggtcggcgtt cgggcggact cggcggggca ccggacggct acg tcgttca acgacgagac ggctcaccga atctgcagcc tggcccatgg aggtcccggg tgaccgacga ccgtccgccc gcgcggcact tcaccgcgct ccgtctgtca gcgacccgcg acgaatcggc acgccacggg cctgtgcgct agcgtgcgga tcaggagagc gcggctgctg列表cggcgagcgg gtggcagcgg gcgatacggc cgcggccatc ggtgacggcg cgagccggtg ggccgccgcg tgagccggcc ggatgaggac gttcgggact actggtcggc agagcgaagc gcaccgggca gcccggttcc gaacggctcg ccggcgaacg gcggtcttct cacctcaggg ccggcctctc ctgcgacgca cgtgaccggc gggtccaccc gcctccggcg gtggacggac gaccggcgcg ccgctgtcgg gccgtcgcgc tactggccct ttcacccgta ggactggcgc ctgcgccgcg ggcctgctgc ggctgcctgg ttcccccatc ctggacggcg atcccgccgt tgggacaggt cagcgcacag gcggctcggt gagaaactgt caggggctgc ggcgacgcgc tcgctcctgc atctcggccg ccgctggtgg tggatgagca cggtggcaga ggctgtcagg gccttccgcg agcctgcttc gtgctcgggc tgaccacagt tgcgcggcag ccgacccgga ggctgtcgat acgcggagct cgggggccgc tcctggccgc cgctgaccgc ccggccccgg gtctgctgct cggtgaccga acgaggttcc actacccccg tgctggccac ggctggccga gccgggtcag cggcctggtg tcggcgtgac accggtccgc aggtgctgtc acgtcgcgcg tcgtccccga ccggcttgct cgtcgctcgg gcctggccct cgacgcgggc cgccgcgctg5/39 页acagcgacac gggccgggct tggcgggcca tggccgagtt gcctcaccag cggcgctgg c gcggcctcca ccaccggagc agctgatcga tgctggcagc aggcgtccag acatgacctg tcgcccgggg cggtccgaca cgcggcccgc cgaggtcgcc gtggagcccg ggggcgggtc ggctgtggag cgcgcagagc atggctcgcc tgtcgcctgg ggacgccgcg caccctgcgg cggctggtgg gggagacctg ggccaccctt atggctgctg ctgggacgag ctacggggcc ggagtggcgc ctggcgggtg gcgggtcggc catggtcctc ttcgcccgac ggaaggggcg tggaacggac gtgctgacgc ggcgttccgctcaggttccg ggctcgtcga ccgagtacga acgacagcgc cgctcgacga ccccggtcgt acggcgaccc actaccggcg tgctgcgggc ccgtccggcg cgcagc tcag ccgcggaacg accgcaggag ccggcacccg gctggtcgcc caactccgtg tccgggcatc ggcacatcgc gttcgccggt ctaccggggc cgccgccgcg cggactgtcc ggcggcaaag gccgatcaca ggtcgaacag agcggcgggg ccagcgtgag cacgggcgcc ggacacctcc ccaccgggcc gctggacggg cgggtacgcg gctgctggac tccgttcgtc atacctgccg gctctcggtc cctcccgccc cagaccat ga ctcggcgtga258340 8400 8460 8520 8580 8640 8700 8760 8820 8880 8940 9000 9060 9120 9180 9240 9300 9360 9420 9480 9540 9600 9660 9720 9780 9840 9900 9960 10020 10080 10140 10200 10260 10320 10380 10440 10500 10560 10620101939328 A CN 101939331序cctacgtcta cggccgaggg agcacgacca tgcccgcgac cgacagtgct tgtggcgcaa tggtggaccc tgaccatgcc cgtccggtca aggccttggc ggtcacggcg cggacccaac ctcatcgggc taggcggatc gaacctgcgc cctcgtgctg ctccggcggg gctgatcctg cgacctcatc ggacgaggcc cggctcgccc cgacgacgac ggacggcgtc ggcggggccg ggcccacacg acaccggtgg cgggcgaggc tcgtggcgca ccgcgcagat ccgtcggcgg tcatgctggg gcgagatgca gctgcgtgct tgcccctgac ccttcagctt cgaccgtcca acgccgtgcc atctggcgcg gggacctcct cgcgttccgg tttcctgccc gggaaagggg ggcgaacctg gctggcggcc gcccgccgta gctgcctggc tcggccggag ggacggtccg atgacggtcc gtcgacggcg ggtgcgggca acggcgaggg gggctggtct tttcacgcgc ctggaacgct ctggcccgcc gacgagccga cggctgcgct gagctggccg ggccggctga acg gtgctcg gccgtgcgct ctcgtccgcg gccgcgaacc cacggcgggg gaggaggctc ccgcgacgtg cgtctttttc cgtgtcgttc cgtcggcacg ggtcgcgccc gctcaccgcg gcccgcgcga gatcggcctg gctcgcgatg cggctggctg gcacgtgctg ggtgatcgcc列表tcgcccggct tgcgcccgat tgtcccgatg cggcgtcggg tcacgttcgt tcgccaccct aggcggcctc ggttgctggg cggagcacgc gctcagcgac ttcggcgccc gctccgggtg cgacacgcgc cgcgctcgac ggtggggcgg cggccgcggc cgcgcgggcg cgacccggag cgtcacggtg catcctcagc gcgatcgtcg ggaggccggc ggagagccgg gcaccacccc ggcggccgat gcggccccgc ccctgcggtc tgcggcaccc acgccgtggg tctatccggg acgcgatgga tgtgcctgcc tcatgctcct gcgccgcggt tgagcgtccg tgttcctgtc tgcggctcaa ccccgggcgt cggccgcgtc ggccgtcgtc cgtcgacgcc ggcgcagcac gctggcgccg gcccgcgatg ccgcgcggac gcggtcgatc cggcggggac ggagcacgcg ctgacggtcc ggcctcgtca ctgtcgacgg gcggagccgc accgacctgt gcccgggccg cgcgaccggg ctgttgcacc gcgcgccaga ctgtactcca gagggccgcg cgcatcgtgc ttcgacgctg atggcggagg tcgatgaacg ggcactgtca cggaggcggg cggggtccgc gggggtcgtg cttccggtcg gatcatcgcc ccgcgagttc cctcggaaag gcccgccccg ctacctggcc ccggatcgag gggttcggtg cccgatgacg gtcgtacctg ggcggcgctg6/39 页aacctgcccg ctgaccccgg gtccacacgg ctgctcgtcc aacttcctgg aacccggtg a ggtcaccgtg gtcgacggac gacggcagcc gaggccgcgg gctacggccc ccgccctgct tcgcgccgcc tggccgcacg ccgcggagca cggaggacat tcgagaccct ggcccggcct ccgtatggga cgcactacat tcgcggggtt tcgtcaccca tgatcgactc tcatacgggc acgtgttcct gctgtccgtg tcggccggcg ggaacgctcg gtcgcccagg atgatcggat atccaggtcg ggcgtgctgc atccttgcga ctgctcgggc acggcggcgg acgctgcagg ttcaaacccg tacgcggtcg cccgtctggcgccgcgggcg gcgggcgcgc cacgtggcgc ctcggttgcg gactgcccga cggcggaacg gcggtgtacg gcgctggtcc gtcggcaggg cggcgttcga tctcgg ccgg agtccagcct tgttcggcca tccaggaacg ggctgttcgg tcgggctggc ggctggagat ccaacggcct ccgaactcgg accagatcat agagcgagct cccggctcgc gccgcgaacc cggcgtccgt gcgacaggga agtactcccg gtctctgcgg ctgcggcagg gtcctcgtct ggcgcctacg ggcctgacgt gtgccacgca caggccatgc tacgcggcgg ctgctcgcgg tacccgctgc gcggccctca ctgccgtc gg gcgctggtgg2610680 10740 10800 10860 10920 10980 11040 11100 11160 11220 11280 11340 11400 11460 11520 11580 11640 11700 11760 11820 11880 11940 12000 12060 12120 12180 12240 12300 12360 12420 12480 12540 12600 12660 12720 12780 12840 12900 12960101939328 A CN 101939331序tggggaggtg ctgcttgaag tgggcgaggc atctgccgca tcccgcgggt cgtgcgctgg cgcggcgacg ggtccgtcga cgatccggcc ccggcctccg ccggtgcgga tctacctcac tccgcgggct cggccgagct cgtggaaccg ggcaagccgc gctaccacac gacccgttgc gagcgcgccg aggccgggcg cgacctgctc gaccgctttc gcccgcgctg ccgggccggc ccggcccgct tccggacggc ggccgcggtt gaagcctccg gtgatgcaga cgaccggcgg gccggcccga cgttccggct tacctggggt aacgtgacgc ctcgcggtcc tggcgctact atcctggtcg tcgatgatcc gccgtcctcg accggccggt gcgcggtgtc atctgcagcc acctgaactc ccggcgtacg acctggccga ccgccttccc gccgtggcct gggacggccg ccacgggctg cccgctgcac cgacttcggg cgtcgaggtg gctcgcctgc gttgtcggcc gctggaccgg caccctcgcc tgaccggggc cggcggtgct gccgccggcc cacgacgctc ggg gccgtcc ctggccgccg gtcttcctcc cctgcgggcc gggttcgggg cccgggctga gcacggccgc tgaacgacca accccgccgc ccgactcccc tcgtcggctg cgatcttctc tggagttctg gtgccgacac tcaccgcgaa tgatgctggc tcaaagtcgc tctgcaccgt列表acgacgacag gcacgactgc gcgccgagcg cctccgcgcc gcggccggcc ggacggcccg ggctggtcgc agcggatcat ggctggaggc gcgaactggc cggacctcta tctccgcgga gccagctcgc ccggcgccga cggacggctc agaaggccga cggcgacgct gtcgtgccgg cgggcggctc ccggttcccg gcagggcctc cgccgtccgg ggccgacctg gtccgccggc cgccgcgtgg gaccgccgac gcgcgagttc ctccccaccc ggcgtcccgt gcggagacca gccctgatat ctgtcgccga cggtccggcc attccgatga cgtttcctgt ctggccgtcg ctgctgaccg tgggcggcgg ggccccggca ggccgaccgg gctggttcga cgctgctgga cgccggaccc cggccgtcga atttcggcgc gcttctcgcg cgacgcgggc ccgctacgtc cggtcgtacg tgtgatcacg cgaggccgaa ggtcggcgac cgaccggctg ggtgcccagc ggcgtacgcg gacggacggc cgctggagaa tcgacggccc gatcggtgga gccgggcaga gaggtctggg atgaccctgg gacgtgcccg cgcctggcgg tgtggctggg gccgtgcccc gctacgtacg ccggcagccc cagggggccc ccacggagtt tcgtgatcgc gcctctggga cggccggtct tctcgtacgc cccagttgct ggcagctctc ggttggcggc tcgcccttgg7/39 页cggctgcggg ccgcgagacg ccccgagcag actccttatc ggaggacggc actgagcgg g ggccctctac gagggcggcc tgcgccgagc ttcgacctcg gctctgggcc cacatgctct agccggcggg ctcgatctgg tccggctgcg ccgctgttcc ttcggaacct gccgatggct gctggacggc atcgcggccc cccggctttc tcgccgagac agctcgccgt ctccgctcgt agcgggacga cgtggcagcg cgctcgcgga tcccggacgg gcgggaagga ggcccaccac aggcgggacc gctcagactg cattccgctc gaccttcagc gatcgcggcc gatcccacgc gtcggcgacc caacgccgcc gaccgcgctcgaccaccgcg ctggctcgcg gagaggcttc ggtctacggc ggcgacgggt ggaggtcgtg caccacgtgt gccgtcgccc acggcggccc cccgccatgg ctcacc gacg cggcgcccgt ctcctcggcc gcgggcctca gcgcgccgtc ctgagcgggg atggtgctcg cctcgcacgc cctgctgtgc tgaagcgccg ccggaaccgc ggcccgccgc ccgcgcgcag aggcggtctc tgaccacgcg cgccggccgc ccgcctcgca gaaccgccca tgacgcggcc caccctggcc gtcgatggcg gtacatcctg cccggagggc gggcgtactg cgaaccctgg ggtcgccgcg cgggggagcg ctacctgc cg ctggggactg2713020 13080 13140 13200 13260 13320 13380 13440 13500 13560 13620 13680 13740 13800 13860 13920 13980 14040 14100 14160 14220 14280 14340 14400 14460 14520 14580 14640 14700 14760 14820 14880 14940 15000 15060 15120 15180 15240 15300101939328 A CN 101939331序atgatggcag ccgatgcggg agcagcccgc acgatcgtga cgctctcgag gaacctgacc gaccaccctg tttcgggcgg gggcctgtgg cgtgcccgag ccgcaaggtg gctcggccgg catcagggac ctccagtcac cgggcggacc gggcttcttc ggaagggcga gacgtgctcg atcgcctcga gcgatccgca ctcaaggcca atcggcgtcg atcgacccgg gagtggggca ggactggtcg ctgatgaccg aagtacctgc ctggcggctc ggcccggacc tacgtcgact gagagctacg ggccacctca ccgacgcccg gacgcggcgg ttccggtccg tacgcgttcg atcctggtga caggccctgg aacggacggt gcgcgctcat tcatcctccc tccacgacac tcctgctgat atcagggacc gtgccggacg atgaaggcgg ccctacgaac acccagctcg acacggatcg gcgaagtact ccccggctgg atgcgggcga cagctggcgg gcgtacgagg cgcctgctcg tcgggaacat gcgacgacgc acgagaggct cggtgggagt agcgcccctg gcg aggcgac cggagttcta gccggccgga gctcgctgcg aggaccgcgt ccttcgccta ggcgcggcgt acgtcggcgg gcacgggctt cgagcagcct agccgtacac agagcgacca cggagatggc gacggcaccg tggagccgct gtctgcttcc cacaccgctg tggacacccc列表tcgttctggt atccgcccca ccgctggccg cacatggcgc ctacgacgac cggcctgctc gcggcatccg gacccaggtc ccacctgcgc gagcctgatg gcggtggcgt cgagccgatg gctgaccgcc catctgcgat cggcctcgcc ttccgcagtg gaagagagca agggaatggg ccggaagcgc ggcaccgccg gctctcgtcg atggtgatgt cgccccacgt gcgccgttcg aacgtcaacg cggggggagg aacgcgcgcc gacgcgacgg accgacggcc ctgctggaga gccgccgtca acgatgaacg gtgttctcgt ccgggggtca cgcggcaacg ggtctgctga cgggacccgc cgctggttcc gaggccaggg acgccatccc acggcctggc tcgcgctctc ggaaggaggt ttccacgcgc ggcccgaacg acctcgggcc ggcgcgctgc atccacgccc aacctcaccg ctcggcatcg aacggactcg gccgggacca cacgtcggcg gtggacggcg agatgacctg acaccctggc tgaccgagcc cggccgacga gttacctcac agtccgccga tcctgcatca ggaagctcgg actgggggac aggccaccct gcgggcacgt tcgtccgcta tcgccgaggt ggcggctgca aggcgctggg ccggcactct cggggtggtg cggcggcgat ccagggaggc tcatggcggt tgatcgccac tgcccagcga tctcgatcca ccgagaccga8/39 页tgtggccggg gcccgcctgg gctcgacgcg ggccgcggcg ctgacatggc tcgacggcg c gcgcgggcaa acatcagcct tcgagtcgcc ggctgcgcgg aggtcagcac ccatcgccct acccggtcgg ccgtcatggt tgctggtggc acctcgaaca acccacgaac caggctgttc gcaccggctc cgaccccggg cgcgctggca catccccatc ctacctcggc catcaggttc cggctctgtg gcaggccatg ctccttgatg tctcaccgag acggctcgac ctacgacttc catcccgttc cgcgcacggc ctggacgatc cgatcccgac gctcgtccgg cggcaactcc ggcggtgcag cgccgccaac ctaccggttcctccgacaag gctggcggac ctcggtcatc cggcggccgg tgcacaagca gctccctcta tcaccgggct ggcggctgct acgcggtgtc gcgaggtgct ccctcg gcat tcgtgctcga cgctgcgcgc agatcgcgca gcccgctgcc agaaggcggg ggcgaggtcc cgcggcggcg cggcaccgcc gatcggcggc gttggatgtg ggtctcgtac ccagcacgta gggattcgtc cgagacgggg ccccgtctac ccacatggac gcgccatgtg cctgatcacc ccgctccctg gttcaccgac gacggcgacc tctcggctac gcgccgattc ggaggcctgg ggagtccagc ctcctcccgc ggacgcga tc gttctggaag2815360 15420 15480 15540 15600 15660 15720 15780 15840 15900 15960 16020 16080 16140 16200 16260 16320 16380 16440 16500 16560 16620 16680 16740 16800 16860 16920 16980 17040 17100 17160 17220 17280 17340 17400 17460 17520 17580 17640101939328 A CN 101939331序atcgagccgc acccgatacc ctgctgctcg tggagggcac gcgctggacg agctgggcgg tcgcccatgt tggcgatcgt tctgcagtgt ctctcgcggc accccgtcgc ggcggcccac gccggctctc cgatccgcag ggcccgccga ggtcatcgcc gcgatgcggc cctgctgggc gtcgctgtcg ggtcgacctg gctggcggtg ggtcggctcc ctcgatcacc cgcggcggga actggccgcg ctggatgctg tccccttctc gttcgcactg cggcggtctg gctgcggccg gctgtcggcc ggtcgccgcc cgactccggt gatcgtgctc ggtcgtcatg gcgcgaagag gatgtagtcg cgtcgtcttg gaaggcgaag tcctgcggct tcgcggacgg ggcaggaggt gggcggcggc cctacgccgc gcgagcgggt cgtcgaaccg caccgccgcg gaccctgacg cgtcgtctcc ggagctgttc cggtacgggc ggagtccgcc gctgtccgac ccggggaccg gatctcgggg cacccgaccg cggctgcccg gtcctgtccc cggcttctgc cccatgacgc cct ggggggc gccctgccgg accgtggcca gttctggccg gctcttccgg gggtggttga gcgctcggca ctggccgggc atggagcaga gacatatcgg atcgggggca gagtcggccg gatgtggggc gccctgatca cggagacgcg cgcagggcgt cccacgccct gtgacgtgcg列表ggagcgccgc ctgttctacg ctgctgccac ctggcctcgc ctcaacgccg gccggcctga gggcggtcat ggaggccctg tgctggtctg tctcggtgaa cggccgaccg tggccgacga accacatggt tgatgtacgg gggggtgaac cgtgtcggcg gatcgtcgcc cgggtggctg cgtgatcttc ccgcagcgcg ggtcgccgtg gacgttcgtg gatcgtacgg cgggctgatg tgccgatgag gttcgcggtg cggagccatg caccgccgca gcgccgcgac gctcctgccg gggtgggctg cgcctacgcg gctggtgaac cgtcatcgat gaccgcgcca ggccccgctg ggcgcccagg gtgcccgtcg gctgatgatg tgaccggccg gtcttgaggg cccgcgagcc gggggctgcg aactgctcag gatgacgacc ggccaccctt ggggatgacc cctgcggacg cctgctgtgc cttcgaccgg cgcccgtgcc ggtcttcggc ctaccgccgc gccgagcagc ctcttcgggg gggatcgcgc ttccccgccc atgttcgcgg ctctgcgtgg ctgttccgcg ctgttcatgg gagcggggcc gacgtggccg ccgacggtgt gccatgttcc tgggggcggc cttggcctgc ggcgcccccg ctgttcttcg atcctgctgg gcctcccggc acccggggcc gagcggctgt ctgctgaccg tcgagggcga ttcttgatct tcgaactccg gcgaggatct9/39 页catctccggg cgactccttc cgtcgacacg cccggagcag gcagagcgag cgactccga c ggcgccacgg ccggcagccg tgcagttcgg gcgagcccca gcccggtcgt gtccgctggc gtcctcgact gaagtgaggg tacgccccct tcaccggtgt cactggcacg tgggaccgac aggtccggcc tgggttacga cgtcgctgtc aggttttcac ccgtggcgat tcgcgggaac catggaccac cacacgtgcc tggtcgtgcg tgccggcggc acccggtgtt agccggaggt tgatgaccgg cggtgctcct tgaccggtct tcaccgagct tcaccgtcct cgctgagacg cggcctggcg tgacgtgcct ccccccgggcgttcgcggcc ggcggcgccg gccggcccgg ggccagaagc cgacccgtgc cgccgtccgg gacgggttcc gccgcggacg ccgccgaccc ggccgggcgt gcctcg gcgg ggcccccacc gaggtgggag gagccgccgc ggagcggtgg tgatcgtcgt tcatcggcca gcgacccggc agatcgccgt gccggggtgg tcggcgcggc cgggaggccc tgctggcggc cggcggccgc agaccggcga ccctcacggc ccaggaggcc gcgcctgggg tcgtcatgcc ccgccgagtt cgatcgaacc agctcgtgcc tggtcgccgt tgtcggcgca ccacggccat gtcgtcaggc cccggtcgag ccagcagg cc ttttgctgtg2917700 17760 17820 17880 17940 18000 18060 18120 18180 18240 18300 18360 18420 18480 18540 18600 18660 18720 18780 18840 18900 18960 19020 19080 19140 19200 19260 19320 19380 19440 19500 19560 19620 19680 19740 19800 19860 19920 19980101939328 A CN 101939331序列表10/39 页tgtcgccctt ccaggcgggc <210>2 <211>300 <212>PRT <213>Microbispora sp.PTA-5024 <400>2 Val Asn Thr Ser Ile 1 5 Gly Gly Glu Arg Pro 20 Gly Met Thr Ala Leu 35 Met Arg Ile Cys Val 50 Val Gly Gly His Asp 65 Arg Val Leu Gly Tyr 85 Thr Gly Arg Glu Phe 100 Asp Lys Arg Val Arg 115 Gly Leu Ser Glu His 130 Met Lys Arg Arg Leu 145 Leu Ile Val Val Asp 165 Met Arg Phe Arg Ser 180 Val Val Leu Ser Thr 195 Asn Thr Ile Val Leu 210 Ala Gly Leu Ala Ala 225 Ser Ile Thr Asp Leu Thr 10 Ala Leu Asn Gly Val Ser 25 Leu Gly Ala Asn Gly Ala 40 Gly Val Leu Arg Pro Asp 55 Leu Gly Thr Ala Ala Gly 70 75 Leu Pro Gln Glu Leu Ser 90 Leu Asp Tyr Ile Ala Leu 105 Arg Asp Gln Ile Glu Gln 120 Ala Gly Arg Arg Leu Gly 135 Gly Ile Ala Gln Ala Leu 150 155 Glu Pro Thr Ala Gly Leu 170 Leu Leu Ala Gly Leu Gly 185 His Ile Leu Asp Asp Ala 200 His Gln Gly Arg Val Ala 215 Val Ala Glu Gly Arg Thr 230 2353020000Lys Arg Tyr Arg 15 Leu Thr Val Asp 30 Gly Lys Thr Thr 45 Gly Gly Arg Val 60 Arg Arg Ala Val Met Leu MetArg Gly Leu ValGly 140 Leu Ala Glu Pro Glu 160 Asp Pro Ser Glu Arg 175 Gly Ala Arg Arg Thr 190 Ala Gln Thr Cys Pro 205 Tyr Gln Gly Ser Thr 220 Tyr Leu Leu Pro Pro 240Lys 80 Tyr Asp Asp Leu 95 Lys Gly Val Asp 110 Leu Glu Leu Thr 125 Tyr Ser Gly Gly101939328 A CN 101939331序列表Val Asn Ala Ala Ala Glu 255 Ala Arg Pro Pro Ile Gly 270 Gly Tyr Ala Ala Leu Leu 285 Arg Pro 30011/39 页Gly Ala Gln Ala Pro 245 Val Glu Gly Thr Arg 260 Gly Thr Leu Met Thr 275 Gln Leu Gly Glu Pro 290Pro Glu Ala Val Val 250 Tyr Arg Val Ile Ser 265 Pro Thr Leu Glu Asp 280 Ser Pro Thr Gly Pro 295<210>3 <211>414 <212>PRT <213>Microbispora sp.PTA-5024 <400>3 Met Ile Phe Gly Pro 1 5 Arg Leu Arg Asp Glu 20 Tyr Ala Leu Ser Arg 35 Ala Val Phe Ser Ser 50 Ala Gly Pro Tyr Arg 65 Ala Ala Glu Gly Pro 85 His Gln Val Leu Arg 100 Val Leu Arg Leu Glu 115 Asp Arg Ile Ala Asp 130 Ala Pro Leu Ala Ile 145 Ala Asp Arg Ala Arg 165 Gly Ala Glu Ala Glu Asp Phe His Arg Asp 10 Ala Pro Cys His His 25 Tyr Glu Asp Val Leu 40 Ala Ala Arg Ala Val 55 Gly Ala Asp Thr Ala 70 Ala Arg Ser Leu Leu 90 Gln Ala Val Ser Arg 105 Pro Ala Val Arg Asp 120 Arg Gly Gly Gly Glu 135 Ala Val Ile Leu Arg 150 Val Ser Glu Leu Leu 170 Leu Arg Ser Tyr Trp31Pro Tyr Pro Val Tyr 15 Glu Pro Ala Leu Gly 30 Ala Ala Leu Arg Gln 45 Ala Ser Ser Ala Ala 60 Ser Pro Glu Arg Glu 75 Phe Leu Asp Pro Pro 95 Gly Phe Thr Pro Gln 110 Ile Ala Ala Gly Leu 125 Phe Val Thr Glu Phe 140 Leu Leu Gly Val Pro 155 Ser Ala Ser Ala Pro 175 Leu Gly Leu Ser AlaArg Leu Pro Gly Thr 80 Glu Ala Ala Ala Glu 160 Ser Leu101939328 A CN 101939331序列表190 Glu Asp Arg Gly 205 Arg Asp Ala Asp Asp Glu Gln Val 240 Glu Ser Val Ala 255 His His Asp Gln 270 Ala Ala Phe Glu 285 Gly Arg Thr Leu Ala Gly Ala His 320 Arg Ala Tyr Pro 335 Asp Arg Arg Pro 350 Cys Leu Gly Ala 365 Glu Leu Thr Arg Val Arg Ser Glu 400 Ser Met12/39 页180 Leu Arg Gly Arg Glu Asp Ala 195 Val Val Ala Glu Leu Val Arg 210 215 Ala Ser Ala Gly Pro Ala Cys 225 230 Ala Ala Phe Cys Ala Leu Val 245 Met Ala Leu Ser Asn Ala Leu 260 Trp Arg Thr Leu Cys Ala Arg 275 Glu Val Leu Arg Tyr Trp Ala 290 295 Thr Ala Asp Val Arg Leu His 305 310 Val Leu Leu Leu Thr Gly Ser 325 Asp Pro Asp Val Phe Asp Ile 340 Ser Thr Ala Leu Gly Phe Gly 355 Ala Leu Ala Arg Leu Gln Ala 370 375 Arg Phe Pro Arg Tyr Arg Thr 385 390 Val Met Asn Gly Phe Gly His 405185 Gly Lys Gly Asp Gly 200 Pro Asp Ala Gly Leu 220 Arg Ala Pro Leu Thr 235 Gly Gln Ala Gly Thr 250 Val Leu Phe Gly Arg 265 Pro Asp Ala Ile Pro 280 Pro Thr Gln His Gln 300 Gly Arg Leu Leu Pro 315 Ala Gly Arg Asp Glu 330 Gly Arg Phe His Pro 345 Leu Gly Ala His Phe 360 Arg Val Ala Leu Arg 380 Asp Glu Glu Arg Thr 395 Ser Arg Val Pro Phe 410<210>4 <211>260 <212>PRT <213>Microbispora sp.PTA-5024 <400>4 Val Pro Asp Arg Gln Arg Thr Arg Arg Ala Thr Glu Gly Ser Ala Asp 1 5 10 1532101939328 A CN 101939331序列表Ala Cys Ala Ser Leu 30 Gly Asp Leu Asp Val 45 Ala Glu Thr Tyr Asp 60 Ala Gln Ala Gln Arg 75 Ser Val Leu Gly Ile 90 Ala Ile Gln Asn Gly 110 Ala Cys Cys Arg Asn 125 Gly Pro Thr Val Pro 140 Gly Ala Glu Pro Pro 155 Ala Glu Ala Arg Lys 170 Leu Leu Cys Gly Pro 190 Cys Ser Glu Arg Ser 205 Tyr Gly Val Thr Gly 220 Ser Val Thr Arg His 235 Pro Arg Pro Val Arg 250 Arg Asp Gly Cys Pro Arg Leu Gly 80 Val Met 95 Ala Ser Leu Leu Glu Pro Thr Arg 160 Val Ala 175 Glu Ser Met Tyr Arg Arg Gln Glu 240 Arg Gly 25513/39 页Ala Arg Gly Arg 20 Thr Asn Ala Pro 35 Thr Phe Cys Gly 50 Leu Ala Leu Leu 65 Arg Leu Met Glu Asp Val Thr Gly 100 Trp Val Leu Asn 115 Arg Met Val Ile 130 Leu Val Ala Glu 145 Pro Gly Asp Pro Asp Ala Gln Glu 180 Ile Ala Glu Ile 195 Arg Gln Leu Arg 210 Glu Leu Arg Arg 225 Thr Leu Ser Ala Gly Leu Ser Cys 260Gly Glu Val Val Val 25 Leu Ala Glu Trp Leu 40 Asp Val Tyr Ser Ala 55 Pro Val Leu Thr Glu 70 Arg Cys Pro Gly Thr 85 His His Thr His Arg 105 Thr Leu Leu Pro Ala 120 Gln Ala Val Val Leu 135 Pro Ala Val Pro Glu 150 Arg Ala Glu Pro Pro 165 Glu Glu Leu Leu Thr 185 Ala Arg Arg Phe Tyr 200 Asp Leu Tyr Arg Ser 215 Glu Ile Ala Leu Arg 230 His Leu Leu Ala Pro 245<210>5 <211>221 <212>PRT <213>Microbispora sp.PTA-5024 <400>533101939328 A CN 101939331序列表Gly Pro Arg Thr His 15 Pro Lys Ala Gly Asp 30 Ala Arg Arg Ala Arg 45 Val Val Ala Pro Ala 60 Ala Arg Ser Ile Pro 75 Ala Gly Glu Thr Gly 95 Arg Cys Glu His Ala 110 Thr Glu Leu Asn Asn 125 Ala Ser Asn Thr Ala 140 Asp Arg Gly Ile Ser 155 Arg His Asp Ala Arg 175 Pro Ala Met Ser Gly 190 Val Ser Gly Pro Ile 205 Arg Ala Ser 220 Pro Arg Pro Asp Arg 80 Ile Val Cys Ala Arg 160 Ser Arg Ser14/39 页Val Arg Ala Gly His 1 5 Ser Ser Gln Thr Thr 20 Gln Ile Ala Lys Thr 35 Ser Gln Pro Ala Thr 50 Thr Arg Thr Pro Glu 65 Thr Ser Ala Ser Leu 85 Ala Asp Ser Ser Ser 100 Thr Glu Pro Ser Ser 115 Thr Thr Ala Pro Gly 130 Thr Arg Pro Arg Ala 145 Ala Cys Ala Arg Thr 165 Val Gly Pro Val Thr 180 Arg Pro Arg Ser Ser 195 Ser Ser Ser Ala Ser 210His Gly Val Arg Ser 10 Thr Pro Ala Ile Val 25 Ala Pro Ala Pro Ala 40 Thr Ala Ser Ile Pro 55 Ala Thr Thr Glu Ser 70 Val Ala Asn Ala Val 90 Arg Arg Gly Ser Asp 105 Ser Thr Thr Val Thr 120 Val Gly Ala Val Arg 135 Val Ser Gly Pro Ser 150 Arg Pro Val Val Ser 170 Gly Ala Phe Arg Cys 185 Ser Tyr Ala Gly Thr 200 Arg Thr Ala Ala Val 215<210>6 <211>220 <212>PRT <213>Microbispora sp.PTA-5024 <400>6 Val Pro Leu Arg Arg Arg Ser Pro Arg Thr Gly Thr Ala Ala Asp Ala 1 5 10 1534101939328 A CN 101939331序列表Glu Pro Glu Leu Ser 30 Arg Val Ala Asp Gly 45 His Ala Ala Gly Met 60 Glu Val Ala Glu Glu 75 Ser Ala Gly Ser Phe 90 Gly Val Ala Arg Arg 110 Val Leu Val Asp Leu 125 Ala Val Asp Glu Gln 140 Ala Ala Val Ala Glu 155 Val Leu Ala Glu Asp 170 Ile Pro Thr Gly Thr 190 Leu Thr Glu Ala Leu 205 Gly Asp Arg 220 Ala Glu Glu Glu Leu Arg Ile Leu 80 Arg Gly 95 Gln Ala Glu Lys Val Leu Leu Pro 160 Leu Pro 175 Val Lys Thr Lys15/39 页Thr Tyr Glu Arg 20 Val Ser Glu Asp 35 Val Ala Leu Arg 50 Leu Ile Arg Arg 65 Gln Glu Ser Trp Glu Ala Pro Val 100 His Asn Arg Leu 115 Ala Ala Asp Val 130 Ala Arg Ala Glu 145 Glu His Leu Arg Tyr Pro Gln Val 180 Ser Arg Met His 195 Thr Thr Asn Pro 210Val Gln Gln Leu Arg 25 Ala Val Leu Met Arg 40 Met Leu Tyr Glu Arg 55 Leu Thr Ser Gln Arg 70 Leu Ala Val Trp Arg 85 Arg Ala Trp Leu Leu 105 Arg Arg Ala Glu Pro 120 Pro Asp Leu Glu Pro 135 Arg Arg Asp Leu Val 150 Glu Val Leu Val Leu 165 Ala Val Ile Leu Gly 185 Met Ala Arg Arg Leu 200 Lys Gly Gly Arg Thr 215<210>7 <211>57 <212>PRT <213>Microbispora sp.PTA-5024 <400>7 Met Pro Ala Asp 1 Leu Asp Leu Asp 20 Ala Val Thr Ser 35Ile Leu Glu Thr Arg 5 Leu Ser Ile Gly Val 25 Trp Ser Leu Cys Thr 4035Thr Ser Glu Thr Glu 10 Glu Glu Ile Thr Ala 30 Pro Gly Cys Thr Ser 45Asp Leu 15 Gly Pro Pro Gly101939328 A CN 101939331序列表16/39 页Gly Gly Ser Asn Cys Ser Phe Cys Cys 50 55 <210>8 <211>1115 <212>PRT <213>Microbispora sp.PTA-5024 <400>8 Met Thr Asp Ser 1 Pro Val Gly Tyr 20 Ser Pro Ala Ser 35 Ala Pro Val Leu 50 Ala Ser Ala Arg 65 Leu Leu Arg Ala Leu Ala Ser Pro 100 Asp Thr Gly Gly 115 Leu Leu Arg Tyr 130 Leu Phe Ala Gly 145 Leu Ala Gly Thr Leu Leu Ser Ala 180 Gly Val Thr Val 195 Ile Val Leu Asp 210 Thr Arg Ser Thr 225Pro Phe Arg Ala Trp 5 Ala Tyr Pro Thr Pro 25 Ser Pro Gly Leu Asp 40 Ser Asp Val Ser Gly 55 Thr Ser Gly Pro Pro 70 Ala Cys Glu Asp Gly 85 Ser Leu Ala Gly Leu 105 Leu Lys Asp Lys Arg 120 Asp Ile Arg Met Arg 135 Val Ser Gly Gly Arg 150 Gly His Arg Thr Arg 165 Val His Arg Leu Glu 185 Gln Ala His Gln Thr 200 Cys Pro Ser Ala Leu 215 Val Ser Ala Arg Arg 23036Asp Val Phe Met Val 10 Leu Pro Asn Ser Glu 30 Glu Ala Glu Phe Pro 45 His Arg Ala Gly Ser 60 Pro Ala Asp Asp His 75 Pro Leu Met Glu Ala 90 Leu Ala Arg Val Ala 110 Leu Arg Arg Ala Ala 125 Thr Arg Pro Thr Pro 140 Phe Asp Thr Ser Ala 155 Thr Arg Ala Asp Met 170 Arg Asp Arg Val Leu 190 Leu Thr Val Arg Gly 205 Gly Lys Pro Leu Asn 220 Ser Pro Val Val Ala 235Arg Ala 15 Phe Asp Pro Asp Ser Glu Leu Ser 80 Val Glu 95 Arg Gly Leu Ala Phe Gly Lys Trp 160 Glu Trp 175 Leu Ala Asp Arg Gly Ser Glu Ile 240101939328 A CN 101939331序列表Gly Arg Leu Ala Gln 255 Arg Val Thr Gly Leu 270 Thr Ala Leu Arg Pro 285 Leu Asp Val Val Ala 300 Ala Met Ser Ser Asp 315 Asp Ala Arg Cys His 335 Arg Glu Leu Ala Glu 350 Asp Thr Pro Leu His 365 Pro Glu Ile Val Arg 380 Arg Leu Ser Pro Pro 395 Glu Ala Phe Leu Glu 415 Glu Leu Leu Asp Asp 430 Trp Pro Pro Ser Glu 445 Ser Ala Ala Leu Ala 460 Arg Glu Ile Val Ile 475 Glu Ala Ala Pro Ala 495 Val Val Ala Pro Ser 510 Val Leu Ala Pro Gly 525 Arg Phe Thr Gly Leu 540 Gln Ala Gly Arg Pro Ser Leu Pro Thr Ser 320 Ala Leu Val Thr Arg 400 Arg Thr Thr Arg Asp 480 Asp Leu Pro Leu Leu17/39 页Leu Gly Ala Ala Arg 245 Val Ala Gln Arg Phe 260 Ala Asp Met Ala Ala 275 Leu Asp Gly Gly Asp 290 Ala Glu Ala Arg Ala 305 Ala Ala Leu Val Ala 325 Tyr Asp Arg Thr Ala 340 Ile Gln Ala Thr Arg 355 Asp Leu Arg Ile Asp 370 Glu Ile Glu Arg Ala 385 Arg Gly Met Arg Ala 405 Tyr Gly Ala Asp Arg 420 Arg Gly Leu Gly Pro 435 Pro Ala Gly Pro Gln 450 Leu Val Ala Thr Ala 465 Glu Glu Thr Ile Ala 485 Leu Pro Asn Ser Leu 500 Asp Glu Leu Ser Ala 515 Gly Ser His His Ala 530 Pro Asp Val Asp AlaArg Pro Val Leu Ala 250 Glu Leu Pro Val Asp 265 Gln Glu Leu Leu Ile 280 Pro Leu Gln His Val 295 Gly Ser Pro Ala Glu 310 Ala Leu Arg Glu Val 330 Val Gly Gln Gly Arg 345 Arg Val His Pro His 360 Leu Glu Val Arg Leu 375 Ala Glu Ala Leu Trp 390 Leu Arg Arg Tyr His 410 Ala Val Pro Leu Leu 425 Pro Ala Gly Tyr Lys 440 Glu Glu Pro Arg Arg 455 Ala Arg His Gly Glu 470 Glu Leu Val Tyr Asp 490 Glu Leu Gly Val His 505 Gly Thr Phe Arg Val 520 Gly Ala Thr Leu Gly 535 Glu Ser Ala Ala Arg37101939328 A CN 101939331序列表555 Ala Phe Ile Pro Arg 575 Ser Tyr Ser Gly Arg 590 Ala Gln Glu Leu Pro 605 Arg Leu Cys Leu Val 620 Leu Pro Asn Met Val 635 Leu Leu Phe Glu Leu 655 Asp Trp Gly Ala Leu 670 Gly Arg Thr Leu Leu 685 Gly Pro Ala Ala Asp 700 Asp Arg Trp Arg Ala 715 Ser Met Asp Gln Arg 735 Val Leu Leu Arg Asp 750 Gln Val Ala Gly Asp 765 Phe Pro Gly His Leu 780 Arg His Ala Ala Arg 795 Glu Pro Thr Gly Ala 815 Pro Arg Arg Asn Gln 830 Val Arg Ala Gly Ile 845 Tyr Ser Asp Thr Ala 860 560 Ser Arg Leu His Ser 640 Gly Ser Ala Ser Glu 720 Leu Glu Glu Ala Pro 800 Gly Asp Gly Gly18/39 页545 His Ile Gln Asp Ala 565 Gly Arg Ala Ala Asn 580 Ile Ser Val Gly Leu 595 Asp Glu Leu Gly Val 610 Leu Pro Thr Gly Arg 625 Ala Phe Ala Gln Ala 645 Leu Glu Gly Gln Arg 660 Glu Met Pro Phe Leu 675 Ala Pro Ile Trp Arg 690 Gly Pro Ala Ala Asp 705 Trp Asn Val Pro Arg 725 Leu Leu Asp Leu Gly 740 Leu Arg Arg Thr Pro 755 Glu Gly Trp Leu Asp 770 Glu Ile Val Val Pro 785 Pro His Ile Arg Ala 805 Gly Pro Trp Leu Tyr 820 Asp Phe Leu Arg Asp 835 His Gly Ala Asp Arg 850550 Val Ala Ala Asp Val 570 Leu Ala His Thr Pro 585 Pro Asp Ser Gly Arg 600 Ala Ala Asn Leu Glu 615 Glu Val Val Pro Ala 630 Pro Asn Pro Ala Arg 650 Leu Trp Glu Pro Trp 665 Pro Gly Val Arg Tyr 680 Met Asp Gln Leu Arg 695 Trp Asp Ala Ala Leu 710 Arg Val Leu Ala Val 730 Asp Ala Trp His Arg 745 Glu Leu Ile Ala Gln 760 Arg Gly Asp Gly Gly 775 Leu Glu Arg Arg Asp 790 Thr Val Gly Gly Arg 810 Leu Arg Leu Arg Val 825 Gln Val Pro Val Leu 840 Trp Phe Phe Ile Arg 85538101939328 A CN 101939331序列表Arg Glu Lys Leu Trp 875 Val Glu Trp Gln Arg 895 Tyr Asp Pro Glu Tyr 910 Thr Glu Ala Ala Phe 925 Arg Leu Thr Arg Arg 940 Ala Ile Ser Ala Ala 955 Val Val Glu Pro Val 975 Leu Phe Asp Gly Asp 990 Arg Arg Glu Leu Pro 1005 Lys Leu Ile Asp Pro 1020 Glu Asp Gly Cys Gln 1035 Ala Val Arg Arg Phe 1050 Thr Asp Ser Pro Ser 1065 His Met Thr Cys Asn 1080 Arg Ser Val Leu Gly 1095 Asn Arg Arg Arg His 1110 Ala 880 Gln Glu Gln Ala Ala 960 Pro Pro Pro19/39 页Gln His Leu Arg Val 865 Gly Leu Leu Pro Glu 885 Gly Leu Leu Ala Gly 900 Arg Tyr Gly Gly Asp 915 His Asp Ser Ala Ala 930 Gly Phe Arg Tyr Thr 945 Leu Ala His Ala Phe 965 Leu Val Gly Gly Leu 980 Ala Ala Ala Trp Met 995 Asp Tyr Arg Arg Glu 1010 Thr Gly Gly Trp Arg 1025 Val Leu Ala Ala Leu 1040 Gly Thr Ala Phe Arg 1055 Thr Gln Leu Arg Leu 1070 Arg Leu Ile Gly Gly 1085 Leu Ala Arg Gly Ala 1100 Arg Ala 1115Arg Phe Arg Gly Glu 870 Ile Gly Ala Arg Leu 890 His Glu Leu Gly Gln 905 Ala Leu Ala Glu Phe 920 Ala Ile Ser Leu Leu 935 Leu Asp Glu Val Thr 950 Gly Pro Pro Ala Pro 970 Gln Trp Ala Pro Asp 985 Ser Thr Thr Gly Ala 1000 Pro Ala Arg Trp Gln 1015 Val Leu Arg Ala Asp 1030 Glu Ser Arg Asp Glu 1045 Glu Ala Ser Arg Pro 1060 Val Gly Ser Leu Leu 1075 Ser Ala Glu Arg Glu 1090 Val Gln Asp Asn Leu 1105<210>9 <211>475 <212>PRT <213>Microbispora sp.PTA-502439101939328 A CN 101939331序列表20/39 页<400>9 Val Thr Pro Asp Arg His Pro Ala Arg Phe Leu 1 5 10 Arg Arg Ala Ala Arg Leu Val Arg Leu Val Ala 20 25 Pro Asp Glu Val Ala Gly Ile Ala Ala Arg Pro 35 40 Ala Asn Gly Leu Ser Met Trp Ser Pro Ala Thr 50 55 Pro Gly Ile Ala Val Phe Tyr Ala Glu Leu Gly 65 70 75 Trp Ser Ala Leu Ala His Arg His Leu Arg Ala 85 90 Glu Thr Ala Pro Ser Gly Gly Leu Phe Ala Gly 100 105 Ala Ala Ala Gln Ser Cys Ala Gly Pro Ala Gly 115 120 Arg Arg Thr Leu Thr Ala Trp Leu Ala Ala Asp 130 135 Ala Ala Ala Arg Asp Arg Pro Gly Pro Gly Val 145 150 155 Asp Val Val His Gly Leu Ser Gly Ser Thr Arg 165 170 Ala Arg Asp Pro Asp Asp Glu Thr Ala Ala Lys 180 185 Thr Asp Thr Leu Arg His Leu Val Arg Leu Thr 195 200 Asp Gly His Glu Val Pro Gly Trp Trp Val Pro 210 215 Val Glu Gln Asp Arg Arg Asp Tyr Pro Arg Gly 225 230 235 Leu Ala His Gly Ala Ala Gly Pro Leu Ser Val 245 250 Leu His Gly Val Glu Val Pro Gly Gln Arg Glu 260 265 Ala Glu Trp Leu Leu Gly Trp Thr Met ThrAsp 275 28040Ala 80 Gly Ala Ala Ala Val 95 Pro Ala Ser Leu Leu 110 His Tyr Arg Gly Leu 125 His Ala Gly Arg Leu 140 Ala Trp Thr Asp Tyr 160 Leu Leu Leu Asp Ala 175 Ala Ser Gly Ala Val 190 Glu Pro Ile Thr Val 205 Ser His Leu Gln Pro 220 Asp Leu Asn Leu Gly 240 Leu Ala Thr Ala Thr 255 Ala Val Ala Arg Leu 270 Asp Thr Gly Ala Tyr 285Arg Gly Ser Ala 15 Glu Arg Leu Ala 30 Gly Asn Ser Val 45 Leu Ser His Gly 60 Arg Val Asp ProAla Asp Pro Phe101939328 A CN 101939331序列表Ile Ala Ala Val Arg 300 Tyr Gly Ala Pro Gly 315 Leu Gly Val Thr Glu 335 Gly Leu Arg Arg Asp 350 Cys His Gly Tyr Ala 365 Glu Ser Gly Asp Pro 380 Met Val Leu Gly Glu 395 Leu Val Pro Asp Ser 415 Pro Leu Asp Gly Ala 430 Ala Leu Leu Ser Val 445 Ala Pro Glu Arg Ala 460 Cys 475 Pro Val 320 Trp Arg Gly Arg Ala 400 Pro Gly Ile Asp21/39 页Trp Pro Cys Arg Val 290 Asp Thr Ser Phe Thr 305 Cys Ala Ala Leu His 325 Arg Glu Val Ala Val 340 Ser Ala Trp Arg Val 355 Leu Leu Gln Val Leu 370 Leu Leu Asp Gly Cys 385 Asp Glu Ser Ala Pro 405 Asp Gly Trp Arg Asn 420 Leu Leu Glu Gly Ala 435 Pro Pro Ser Ser Leu 450 Leu Pro Pro Trp Asp 465Ser Trp Asp Glu Gln 295 Arg Thr Ala Trp Cys 310 Arg Ala Gly Leu Ala 330 Thr Ala Leu Leu Asp 345 Asp Gly Ser Thr Val 360 Ser Arg Val Gly Ala 375 Leu Asp Val Ala Arg 390 Phe Val Phe Pro His 410 Ala Thr Gly Tyr Leu 425 Ala Gly Val Ala Cys 440 Gly Gly Thr Asp Pro 455 Arg Cys Leu Ala Leu 470<210>10 <211>215 <212>PRT <213>Microbispora sp.PTA-5024 <400>10 Met Thr Ala His Ser 1 5 Leu Leu Leu Gly Val 20 Tyr Val Tyr Ala Phe 35 Leu Thr Pro Ala Ala Asp Ala Gly Gly Val 10 Ser Gly Ser Val Ala 25 Arg Ala Ala Gly Val 40 Glu Gly Phe Leu Pro41Pro Arg Pro Pro Glu 15 Ala Leu Asn Leu Pro 30 Ala Arg Leu Ala Val 45 Ala Gly Ala Leu ArgArg Ala Val Pro101939328 A CN 101939331序列表22/39 页50 Ile Val Asp Ala Val 65 Ala Leu Ser Arg Trp 85 Asn Leu Leu Gly Cys 100 Thr Val Leu Leu Ala 115 Asn Pro Val Met Trp 130 Leu Arg Ala Asp Gly 145 Tyr Glu Ala Ala Ser 165 Pro Glu Ala Leu Val 180 Ser Gly Gln Asp Gly 195 Glu Ala Ala Glu Ala 21055 60 His Thr Glu His Asp Gln Gly Lys Gly His Val 70 75 80 Ala Gln His Leu Leu Val Leu Pro Ala Thr Ala 90 95 Ala Ala Ser Gly Leu Ala Pro Asn Phe Leu Ala 105 110 Ala Asp Cys Pro Ile Thr Phe Val Pro Ala Met 120 125 Arg Lys Pro Ala Val Arg Arg Asn Val Ala Thr 135 140 His Arg Val Val Asp Pro Leu Pro Gly Ala Val 150 155 160 Arg Ser Ile ValAsp Gly Leu Thr Met Pro Arg 170 175 Arg Leu Leu Gly Gly Gly Asp Asp Gly Ser Pro 185 190 Pro ValGly Arg Ala Glu His Ala Glu His Ala 200 205 Leu Ala 215<210>11 <211>316 <212>PRT <213>Microbispora sp.PTA-5024 <400>11 Met Thr Val Pro 1 Pro Val Thr Ala 20 Val Thr Ala Leu 35 Arg Val Leu Ser 50 Phe Gly His Asp 65 Gly Leu Val PheAla Phe Glu Leu Ser 5 Val Asp Gly Val Ser 25 Leu Gly Pro Asn Gly 40 Thr Val Ala Pro Pro 55 Thr Arg Ala Glu Pro 70 Gln Glu Arg Ala Leu42Asp Leu Thr Val Arg 10 Ala Gly Ser Ala Pro 30 Ala Gly Lys Ser Ser 45 Ser Ser Gly Thr Ala 60 Leu Ala Ala Arg Arg 75 Asp Thr Asp Leu SerTyr Gly 15 Gly Leu Leu Leu Arg Val Arg Ile 80 Ala Glu101939328 A CN 101939331序列表95 Arg Ala Arg 110 Leu Ala Gly Ala Arg Arg Leu Ile Leu 160 Thr Val Trp 175 Val Leu Tyr 190 Ile Ile Ile Arg Leu Lys Asp Asp Asp 240 Val Ile Asp 255 Arg Met Ala 270 Ser Val His Ala Asn Arg23/39 页Gln Ala Arg Leu 145 Asp Asp Ser Leu Ser 225 Thr Ser Glu His Asp 30585 Asn Leu Arg Phe His Ala Arg 100 Ala Glu Asp Ile Leu Val Leu 115 120 Gly Arg Asp Arg Val Glu Thr 130 135 Glu Ile Ala Arg Ala Leu Leu 150 Glu Pro Thr Asn Gly Leu Asp 165 Asp Leu Ile Arg Leu Arg Ser 180 Thr His Tyr Met Asp Glu Ala 195 200 Ser Glu Gly Arg Val Ala Gly 210 215 Glu Leu Arg Ser Ser Arg Ile 230 Val Leu Ala Arg Leu Ala Glu 245 Asp Gly Val Ala Val Arg Cys 260 Val Ile Arg Ala Ala Gly Pro 275 280 Pro Ser Met Asn Asp Val Phe 290 295 Arg Glu Ala Ala Asp Gly Thr 31090 Leu Phe Gly Val Gly 105 Leu Glu Arg Phe Gly 125 Leu Ser Gly Gly Leu 140 His Arg Pro Gly Leu 155 Pro Glu Ala Arg Gln 170 Glu Leu Gly Val Thr 185 Glu Leu Ala Asp Gln 205 Phe Gly Ser Pro Gly 220 Val Leu Val Thr His 235 Ala Gly Phe Asp Ala 250 Arg Glu Pro Glu Ser 265 Leu Val Arg Ala Ala 285 Leu Ala His Thr Ala 300 ValSer Cys Pro 315<210>12 <211>242 <212>PRT <213>Microbispora sp.PTA-5024 <400>12 Val Ala His Arg Asp Val Leu Arg Gln Val Arg His Pro Gly Val Val 1 5 10 1543101939328 A CN 101939331序列表Phe Val Leu Val Tyr 30 Gly Gly Val Ser Phe 45 Gln Val Val Met Leu 60 Arg Glu Phe Gly Val 75 Met Cys Leu Pro Leu 90 Ala Gln Ala Met Leu 110 Leu Thr Pro Ala Arg 125 Ala Ala Ala Phe Ser 140 Arg Ile Glu Thr Leu 155 Leu Phe Leu Ser Gly 170 Leu Ala Ala Leu Met 190 Ala Arg His Val Leu 205 Val Trp Arg Asp Leu 220 Ala Ala Leu Arg Leu 235 Ala Val Gly Ala Gly Val Leu Arg 80 Gly Lys 95 Met Leu Tyr Ala Leu Ile Gln Ala 160 Ser Val 175 Arg Leu Leu Pro Leu Val Arg Val 24024/39 页Val Ala Gln Ala 20 Gly Phe Arg Ser 35 Tyr Val Tyr Pro 50 Gly Thr Gly Leu 65 Glu Met Gln Val Ile Leu Ala Ser 100 Leu Pro Ala Pro 115 Ala Gly Ala Ala 130 Gly Leu Leu Leu 145 Thr Val Gln Leu Phe Lys Pro Asp 180 Asn Pro Met Thr 195 Ser Ala Pro Gly 210 Ile Ala Ala Leu 225 Gly ArgAla Gln Ile Val Phe 25 Met Ile Gly Ser Val 40 Gly Ile Ile Ala Ile 55 Thr Tyr Ala Met Asp 70 Ala Pro Val Pro Arg 85 Cys Val Leu Leu Thr 105 Leu Leu Gly Leu Pro 120 Val Tyr Leu Ala Thr 135 Ala Val Ser Val Arg 150 Ala Met Tyr Pro Leu 165 Ala Val Pro Gly Trp 185 Tyr Ala Val Asp Leu 200 Val Ser Tyr Leu Pro 215 Val Ala Ala Ala Ser 230<210>13 <211>211 <212>PRT <213>Microbispora sp.PTA-5024 <400>13 Val Trp Leu Val Ala Leu Leu Ala Glu Gly Gly Arg Ser Val Glu Pro 1 5 10 15 Trp Pro Ala Val Ala Gln Arg Ile Ile Asp Ala Gly Cys Ala Glu Pro44101939328 A CN 101939331序列表30 Ala Arg Tyr Val 45 Met Gly Glu Leu Leu His Leu Thr 80 Tyr Leu Thr Asp 95 Ser Arg Arg Val 110 Ala Val Gly Asp 125 Leu Thr Gly Ala Ser Ala Ala Arg 160 Gln Ala Ala Leu 175 Phe Gly Thr Cys 190 Leu Thr Asp Gly 20525/39 页20 Ile Arg Pro Gly Arg Pro Thr 35 Phe Asp Leu Ala Gly Leu Arg 50 55 Ala Gly Arg Thr Ala Leu Gly 65 70 Asp Ala Asp Leu Tyr Val Ile 85 Phe Gly Arg Arg Pro Phe Ser 100 Arg Gly Leu Val Glu Val Leu 115 Leu Asp Leu Ala Ala Glu Leu 130 135 Asp Asp Arg Leu Ser Gly Cys 145 150 Arg Pro Asp Gly Ser Val Pro 165 Asp Arg Leu Ser Gly Glu Lys 180 Tyr His Thr Thr Leu Ala Met 195 Ala Asp Gly 21025 Ala Ala Arg Leu Glu 40 His Gly Leu Pro Ala 60 Pro Gly Ala Asp Pro 75 Thr His Met Leu Phe 90 Ala Asp Glu Ala Glu 105 Leu Gly Arg Gln Leu 120 Leu Ala Cys Ala Gly 140 Ala Trp Asn Arg Leu 155 Ser Pro Leu Phe Arg 170 Ala Glu Ala Tyr Ala 185 Val Leu Ala Ala Thr 200<210>14 <211>249 <212>PRT <213>Microbispora sp.PTA-5024 <400>14 Met Ala Ala Leu Ile Ser Thr Glu 1 5 Val Gly Trp Tyr Ile Leu Leu Ser 20 Tyr Leu Gly Ser Ile Phe Ser Pro 35 40 Leu Leu Arg Leu Arg 10 Pro Ile Val Ile Ala 25 Glu Gly Arg Ser Gly 4545Ser Gly Phe 15 Ile Pro Leu 30 Arg Leu Trp101939328 A CN 101939331序列表26/39 页Glu Thr Phe Ser Asn Val Thr Leu 50 55 Met Thr Ala Gly Leu Ile Ala Ala 65 70 Pro Trp Arg Phe Leu Phe Ser Tyr 85 Thr Ala Lys Val Ala Ala Leu Ala 100 Ile Leu Val Val Met Leu Ala Gly 115 120 Ser Asn Ala Ala Ser Met Ile Leu 130 135 Ala Gly Leu Ala Ala Thr Ala Leu 145 150 Gly Leu Gly Pro Gly Ile Ala Leu 165 Ala Leu Ile Ser Asp Lys Ser Phe 180 Pro Met Arg Val Ile Leu Pro Leu 195 200 Ala Leu Asp Ala Ser Ser Pro Leu 210 215 Ala Val Ala Leu Ser Ala Ala Ala 225 230 Gly Arg His Met Ala Arg Lys Glu 245 <210>15 <211>236 <212>PRT <213>Microbispora sp.PTA-5024 <400>15 Met Ala Ala Leu Glu 1 5 His Ala Leu Asp Gly 20 Gly Leu Leu Gly Pro 35 Val Thr Gly Leu ArgGlu Phe Trp Gly Val Leu Ile Pro 60 Leu Ala Val Arg Ala Asp Thr Glu 75 80 Ala Ile Pro Arg Trp Arg Tyr Phe 90 95 ValAla Gln Leu Leu Ser Ala Thr 105 110 Gly Ala Leu Leu Thr Gly Gln Leu 125 Lys Val Ala Tyr Leu Pro Trp Ala 140 Ala Val Leu Val Cys Thr Val Trp 155 160 Gly Val Ala Gly Met Met Ala Gly 170 175 Trp Tyr Ala Ile Pro Pro Ala Trp 185 190 Ala Asp Ile Arg Pro Asn Gly Leu 205 His Asp Thr Ser Val Ile Pro Leu 220 Thr Ile Val Ile Leu Leu Ile Gly 235 240 ValIle Arg Asp Leu His 10 Ala Asn Leu Thr Val 25 Asn Gly Ala Gly Lys 40 His Pro Thr Ser Gly46Lys His Tyr Asp Asp 15 Pro Asp Gly Ser Leu 30 Thr Thr Leu Met Lys 45 His Ile Ser Leu PhePhe Tyr Ala Gly101939328 A CN 101939331序列表60 Val Gly Ala Leu Leu 75 Val Ser His Leu Arg 95 Arg Ile Gly Glu Val 110 Arg Lys Val Ala Lys 125 Ala Ile Ala Leu Leu 140 Met Asn Gly Leu Asp 155 Arg Ala Leu Thr Ala 175 Leu Ala Glu Ile Ala 190 Gly Arg Thr Ala Tyr 205 Asp Leu Glu Gln Gly 220 Val Arg 235 Glu 80 Ile Leu Tyr Gly Pro 160 Ala His Glu Phe27/39 页50 Arg Pro Tyr Glu Arg 65 Ser Pro Gly Leu Trp 85 His Ala Arg Leu Arg 100 Ser Leu Met Asn Leu 115 Ser Leu Gly Met Arg 130 Arg Pro Arg Leu Val 145 Val Gly Ile Arg Asp 165 Gly Thr Thr Val Met 180 Ile Cys Asp His Val 195 Gly Pro Leu Pro Gly 210 Phe Arg Leu Leu Glu 22555 Arg Leu Leu Thr Gln 70 Thr Gln Leu Asp Ala 90 Gly Val Pro Glu Thr 105 Thr Glu Val Ser Thr 120 Trp Arg Leu Gly Ile 135 Val Leu Asp Glu Pro 150 Met Arg Ala Thr Leu 170 Val Ser Ser His Gln 185 Gly Val Leu Val Ala 200 Leu Ala Val Asp Gly 215 Lys Ala Gly Ser Ala 230<210>16 <211>541 <212>PRT <213>Microbispora sp.PTA-5024 <400>16 Val Thr Glu Pro His 1 5 Ala Pro Glu Ala Pro 20 Gly Val Ile Gly Gly 35 Lys Ala Lys Arg Pro 50 Arg Leu Ile Ala Ser 10 Ala Asp Asp Asp Pro 25 Gly Thr Ala Gly Tyr 40 Trp Leu Asp Val Ala 5547Asn Glu Arg Leu Gly 15 Gly Ala Ile Arg Thr 30 Leu Thr Ala Leu Ala 45 Leu Val Glu Ser Ala 60Thr Val Leu Asp101939328 A CN 101939331序列表Val Ser Tyr Met Val 75 Ala Glu Phe Tyr Gln 95 Phe Glu Trp Gly Ser 110 Gly Thr Gly Ser Val 125 Val Asn Glu Ala Thr 140 Pro Val Tyr Arg Gly 155 Pro Phe Ala Tyr His 175 Glu Leu Ala Ala Arg 190 Glu Val Arg Leu Asp 205 Asp Gly Arg Arg Leu 220 Arg Ser Leu Leu Leu 235 Ala Ser Ser Leu Phe 255 Gly Gly His Leu Lys 270 Trp Cys Trp Thr Ile 285 Phe Ser Ser Ala Ala 300 Arg Arg Phe Pro Gly 315 Gly Arg His Arg Glu 335 Ser Tyr Ala Phe Val 350 Ala Thr Ala Val Gln 365 Asp Pro Leu Pro Ser Met 80 His Arg Gly Leu Glu 160 Met Arg Gly His Glu 240 Thr Pro Pro Ile Val 320 Ala Glu Ile Asp28/39 页Ile Pro Ile Ile Gly 65 Phe Leu His His Tyr 85 Val Arg Pro Thr Trp 100 Pro Glu Gly Phe Val 115 Leu Val Gly Ser Leu 130 Gln Ala Met Leu Met 145 Gly Gly His Val Ser 165 Asp Asn Ala Arg Leu 180 Gly Val Arg His Val 195 Pro Asp His Val Gly 210 Tyr Asp Phe Tyr Val 225 Lys Ala Leu Gly Ile 245 Asp Ala Ala Val Thr 260 Tyr Thr Thr Ala Thr 275 Thr Pro Glu Ser Asp 290 Asp Pro Asp Asp Ala 305 Thr Arg Glu Ala Leu 325 Trp Arg Gly Asn Val 340 Pro Leu Glu Ser Ser 355 Leu Val Ser Leu LeuVal Gly Glu Ala Thr 70 Leu Gly Ile Asp Pro 90 Lys Leu Gly Ile Arg 105 Ala Pro Phe Asp Trp 120 Arg Glu Thr Gly Asn 135 Thr Glu Asp Arg Val 150 Leu Met Lys Tyr Leu 170 Val Arg Tyr Leu Thr 185 Asp Ala Thr Val Ala 200 Gly Leu Ile Thr Thr 215 Asp Cys Thr Gly Phe 230 Pro Phe Glu Ser Tyr 250 Gly Thr Leu Ala His 265 Thr Met Asn Ala Gly 280 His Leu Gly Tyr Val 295 Ala Ala Glu Met Ala 310 Val Arg Phe Arg Ser 330 Met Ala Val Gly Asn 345 Gly Leu Leu Met Ile 360 Pro Ser Ser Arg Arg48101939328 A CN 101939331序列表380 Asp Ala Ile Arg Trp Phe 395 400 Leu Asp Thr Pro Phe Trp 415 Gly Ile Glu Pro Leu Leu 430 Gly Arg Asp Ser Phe Thr 445 Phe Tyr Gly Leu Glu Gly 460 Pro Ala Arg Leu Leu Pro 475 480 Arg Ala Ala Ala Ala Arg 495 Glu Ala Leu Asp Ala Tyr 510 Leu Ser Asp Ser Asp Ser 525 Gly Leu Arg 54029/39 页370 Ala Ala Ash Gln Ala 385 Leu Ser Ile His Tyr 405 Lys Glu Ala Arg Ala 420 Arg Leu Phe Ala Ala 435 Arg Tyr Leu Ala Asp 450 Val Asp Thr Leu Leu 465 Pro Arg Glu Pro Pro 485 Ser Leu Ala Ser Arg 500 Ala Ala Asp Pro Cys 515 Trp Ala Gly Glu Arg 530375 Leu Ala His Arg Trp 390 Arg Phe Asn Gly Arg 410 Glu Thr Asp Ile Ser 425 Gly Ala Pro Leu Thr 440 Gly Ala Ala Pro Leu 455 Leu Gly Gln Glu Val 470 Glu Gln Trp Arg Ala 490 Gly Leu Arg Gln Ser 505 Leu Asn Ala Glu Leu 520 Val Ala Val Arg Ala 535<210>17 <211>178 <212>PRT <213>Microbispora sp.PTA-5024 <400>17 Met Thr Thr Gly Ala 1 5 Arg Ala Val Met Ala 20 Ala Ala Ala Asp Gly 35 Ser Val Thr Leu Thr 50 Ser Pro Thr Leu Ala 65 Thr Val Ala His Val 10 Thr Leu Pro Ala Ala 25 Arg Pro Trp Gly Met 40 Pro Pro Thr Leu Leu 55 Ala Val Val Ser Gly 7049Val Glu Pro Asp Gly 15 Val Ala Ile Val Thr 30 Thr Cys Ser Ser Val 45 Val Cys Leu Arg Thr 60 Arg Ala Phe Ser Val 75Phe Ala Cys Ala Asn 80101939328 A CN 101939331序列表Glu Leu Phe Ala Ser 95 Arg Arg Pro Thr Gly 110 Ala Val Leu Asp Cys 125 Met Val Val Phe Gly 140 Pro Pro Leu Met Tyr 155 Arg Gly Pro Gly Ala 175 Ala Thr Arg Glu Gly 160 Val30/39 页Leu Leu Cys Ala Arg 85 Ala Ala Asp Arg Phe 100 Gly Gly Pro His Leu 115 Leu Ser Glu Ser Ala 130 Val Arg Ala Ile Arg 145 Tyr Arg Arg Tyr Ala 165 Gly GlySer Tyr Pro Val Ala 90 Asp Arg Val Arg Trp 105 Ala Asp Asp Ala Arg 120 Glu Val Gly Asp His 135 Arg Leu Ser Asp Glu 150 Pro Trp Pro Ala Asp 170<210>18 <211>430 <212>PRT <213>Microbispora sp.PTA-5024 <400>18 Val Asn Ala Glu 1 Ile Val Val Val 20 His Pro Thr Val 35 Thr Leu Leu Gly 50 Ala Gln Val Arg 65 Ile Phe Met Phe Arg Gly Gly Arg 100 Pro Met Thr Leu 115 Thr Val Gly Ser 130 Met Ala Val AlaGln Leu Thr Gly Val 5 Ser Ala Leu Phe Gly 25 Ile Gly Gln Ile Val 40 Arg Leu Pro Gly Asp 55 Pro Ser Leu Ser Val 70 Ala Val Gly Tyr Glu 85 Ser Ala Leu Cys Val 105 Gly Ala Ala Val Ala 120 Pro Gly Gly Pro Gly 135 Ile Ser Ile Thr Ala50Val Ile Ala Asp Leu 10 Ala Leu Ala Arg Arg 30 Ala Gly Ile Ala Leu 45 Pro Ala Gly Trp Leu 60 Leu Ser Gln Ile Ala 75 Val Asp Leu Arg Leu 90 Ala Ser Leu Ser Leu 110 Val Leu Phe Arg Glu 125 Gly Pro Thr Phe Val 140 Leu Pro Val Leu AlaGly Val 15 Cys Gly Gly Pro Phe Pro Val Val 80 Leu Arg 95 Ala Val Val Phe Leu Phe Ala Ile101939328 A CN 101939331序列表155 Ala Gly Thr Val Ala 175 Trp Thr Thr Leu Ala 190 Pro Thr Val Ser His 205 Ala Phe Ala Val Ala 220 Leu Thr Arg Arg Pro 235 Ala Leu Ala Leu Gly 255 Pro Val Phe Gly Gly 270 Gly Ala Pro Glu Pro 285 Leu Leu Leu Pro Leu 300 Ser Ala Ile Glu Pro 315 Ala Ala Ile Gly Gly 335 Thr Gly Leu Asp Ser 350 Thr Arg Gly Leu Thr 365 His Val Ile Asp Glu 380 Ile Thr Thr Ala Met 395 Glu Glu Arg Arg Arg 415 Ala Trp Arg Met 430 160 Thr Ala Val Met Gly 240 Ser Leu Glu Phe Gly 320 Lys Gly Glu Arg Thr 400 Gly31/39 页145 Val Arg Glu Arg Gly 165 Ala Ala Ala Gly Leu 180 Val Leu Ala Glu Thr 195 Pro Trp Met Leu Ala 210 Phe Leu Val Val Arg 225 Ala Met Trp Gly Arg 245 Ala Trp Gly Thr Ala 260 Leu Ala Gly Leu Val 275 Val Leu Arg Pro Met 290 Phe Val Met Thr Gly 305 Gly Leu Ile Leu Leu 325 Leu Val Pro Ala Tyr 340 Glu Ser Ala Val Val 355 Leu Ile Val Leu Asp 370 Leu Phe Thr Val Leu 385 Ala Pro Leu Leu Thr 405 Arg Gln Ala Ala Pro 420 <210>19 <211>68 <212>PRT150 Leu Ala Gly Thr Ala 170 Met Asp Val Ala Ala 185 Gly Asp Ala Asp Glu 200 Leu Pro Ala Leu Thr 215 Pro Leu Leu Gly Trp 230 Leu Pro Ala Ala Phe 250 Ala Leu Gly Leu His 265 Met Pro Arg Arg Asp 280 Glu Gln Thr Ala Glu 295 Leu Ser Ala Asp Ile 310 Ala Val Leu Leu Val 330 Ala Ala Ser Arg Leu 345 Ala Val Leu Val Asn 360 Val Gly Leu Ser Ala 375 Val Val Met Ala Leu 390 Ala Leu Arg Arg Arg 410 Leu Ser Arg Ala Thr 42551101939328 A CN 101939331序列表32/39 页<213>artificial sequence <220> <223>synthetic primer <400>19 Cly Thr Ser Ala Cys Ser Trp 1 5 Thr Ser Trp Ser Ser Ala Cys 20 Cys Ala Cys Ser Trp Ser Ser 35 Trp Ser Ser Ala Ala Cys Trp 50 55 Ser Ser Thr Gly 65 <210>20 <211>27 <212>DNA <213>artificial sequence <220> <223>synthetic primer <400>20 aagcttgcat ctgcgtgggc gtcctgc <210>21 <211>29 <212>DNA <213>artificial sequence <220> <223>synthetic primer <400>21 tctagacggt ccgaagatca tggccgcgg Ser Ser 10 Ser Gly 25 Cys Cys 40 Ser Ser Thr Gly Gly Trp Ser Ser 15 Gly Ser Cys Cys Ser Thr 30 Ser Gly Gly Ser Gly Gly 45 Trp Ser Ser Thr Cys Cys 60 Tyr Gly Ser Trp272952101939328 A CN 101939331序列表33/39 页<210>22 <211>30 <212>DNA <213>artificial sequence <220> <223>synthetic primer <400>22 tctagatcca tgtgaaccgg cgggtggccg <210>23 <211>30 <212>DNA <213>artificial sequence <220> <223>synthetic primer <400>23 gaattccggt cgctctcctc gtcctttgcc <210>24 <211>19 <212>DNA <213>artificial sequence <220> <223>synthetic primer <400>24 cgcgctgctc ggggccaac <210>25 <211>20 <212>DNA <213>artificial sequence30301953101939328 A CN 101939331序列表34/39 页<220> <223>synthetic primer <400>25 aggaaacggc cagcccgtgg <210>26 <211>31 <212>DNA <213>artificial sequence <220> <223>synthetic primer <400>26 tttttcatat gggtgggagt gatcggcggc g <210>27 <211>35 <212>DNA <213>artificial sequence <220> <223>synthetic primer <400>27 tttttgtcga cctactgctg gccgcggtcc ggact <210>28 <211>20 <212>DNA <213>artificial sequence <220> <223>synthetic primer <400>28 gcagccaggc tcgcaccggc <210>295420313520101939328 A CN 101939331序列表35/39 页<211>16 <212>DNA <213>artificial sequence <220> <223>synthetic primer <400>29 cgcccgtaac gagcga <210>30 <211>17 <212>DNA <213>artificial sequence <220> <223>synthetic primer <400>30 gcagcttctg ctgctga <210>31 <211>16 <212>DNA <213>artificial sequencer <220> <223>synthetic primer <400>31 tcccggccag ccactt <210>32 <211>21 <212>DNA <213>artificial sequence <220> <223>synthetic primer55161716101939328 A CN 101939331序列表36/39 页<400>32 ccggaaagga gcgagcatat g <210>33 <211>18 <212>DNA <213>artificial sequence <220> <223>synthetic primer <400>33 cagatctgcc aatacagt <210>34 <211>112 <212>DNA <213>artificial sequence <220> <223>synthetic primer <220> <221>misc_feature <222>(32)..(37) <223>n is a, c, g, or t <220> <221>misc_feature <222>(41)..(49) <223>n is a, c, g, or t <220> <221>misc_feature <222>(56)..(61) <223>n is a, c, g, or t <220> <221>misc_feature562118101939328 A CN 101939331序列表37/39 页<222>(65)..(67) <223>n is a, c, g, or t <220> <221>misc_feature <222>(71)..(82) <223>n is a, c, g, or t <220> <221>misc_feature <222>(86)..(88) <223>n is a, c, g, or t <220> <221>misc_feature <222>(95)..(97) <223>n is a, c, g, or t <400>34 cggtgtcgag gagatcaccg ccgggccggc gnnnnnnagc nnnnnnnnnt gcaccnnnnn ntgcnnnagc nnnnnnnnnn nnagcnnntg cagcnnntgc tgctgaagat ct <210>35 <211>112 <212>DNA <213>artificial sequence <220> <223>synthetic primer <220> <221>misc_feature <222>(11)..(13) <223>n is a, c, g, or t <220> <221>misc_feature <222>(20)..(22) <223>n is a, c, g, or t5760 112101939328 A CN 101939331序列表38/39 页<220> <221>misc_feature <222>(26)..(37) <223>n is a, c, g, or t <220> <221>misc_feature <222>(41)..(43) <223>n is a, c, g, or t <220> <221>misc_feature <222>(47)..(52) <223>n is a, c, g, or t <220> <221>misc_feature <222>(59)..(67) <223>n is a, c, g, or t <220> <221>misc_feature <222>(71)..(76) <223>n is a, c, g, or t <400>35 ttcagcagca nnngctgcan nngctnnnnn nnnnnnngct nnngcannnn nnggtgcann nnnnnnngct nnnnnncgcc ggcccggcgg tgatctcctc gacaccgatc ga <210>36 <211>171 <212>DNA <213>artificial sequence <220> <223>synthetic primer <220>5860 112101939328 A CN 101939331序列表39/39 页<221>misc_feature <222>(100)..(105) <223>n is a, c, g, or t <220> <221>misc_feature <222>(109)..(117) <223>n s a, c, g, or t <220> <221>misc_feature <222>(124)..(129) <223>n is a, c, g, or t <220> <221>misc_feature <222>(133)..(135) <223>n is a, c, g, or t <220> <221>misc_feature <222>(139)..(150) <223>n is a, c, g, or t <220> <221>misc_feature <222>(154)..(156) <223>n is a, c, g, or t <220> <221>misc_feature <222>(163)..(165) <223>n is a, c, g, or t <400>36 atgcccgctg acatcctgga gacccggact tccgagaccg aggacctgct cgacctcgac ctctcgatcg gtgtcgagga gatcaccgcc gggccggcgn nnnnnagcnn nnnnnnntgc accnnnnnnt gcnnnagcnn nnnnnnnnnn agcnnntgca gcnnntgctg c60 120 171