合成的重复蛋白及其生产和用途.pdf

上传人:62****3 文档编号:1663235 上传时间:2018-07-02 格式:PDF 页数:32 大小:1.62MB
返回 下载 相关 举报
摘要
申请专利号:

CN200880020810.6

申请日:

2008.06.16

公开号:

CN101855239A

公开日:

2010.10.06

当前法律状态:

授权

有效性:

有权

法律详情:

授权|||实质审查的生效IPC(主分类):C07K 14/435申请日:20080616|||公开

IPC分类号:

C07K14/435; C12N15/12; A61K8/64

主分类号:

C07K14/435

申请人:

巴斯夫欧洲公司

发明人:

B·利布曼; M·费尔; D·许梅里希

地址:

德国路德维希港

优先权:

2007.06.20 EP 07110696.7

专利代理机构:

北京市中咨律师事务所 11247

代理人:

黄革生;林柏楠

PDF下载: PDF下载
内容摘要

具有重复单元的重复蛋白,包含共有序列(I)X1 X2 X3 X4 S X5 X6 Y G其中X1是G、Y、A或NX2是G、L、QX3是R、K、T或PX4是P、A、T或SX5是D、T或SX6是S、Q或T,和共有序列(II)Z1 Z2(Z3A)nZ4 Z5 Z6其中Z1是S、Q、N、T或GZ2不是氨基酸或为AZ3是A或GZ4为不是氨基酸、为A或SZ5是G、S、Q、N或TZ6是G、P、S、Q、N或Tn是天然的整数,其中2≤n≤12。

权利要求书

1: 具有重复单元的重复蛋白, 包含共有序列 (I) X1X2X3X4S X5X6Y G 其中 X1 是 G、 Y、 A或N X2 是 G、 L、 Q X3 是 R、 K、 T或P X4 是 P、 A、 T或S X5 是 D、 T或S X6 是 S、 Q 或 T, 和 共有序列 (II) Z1Z2(Z3A)nZ4Z5Z6 其中 Z1 是 S、 Q、 N、 T或G Z2 不是氨基酸或为 A Z3 是 A 或 G Z4 为不是氨基酸、 为A或S Z5 是 G、 S、 Q、 N或T Z6 是 G、 P、 S、 Q、 N或T n 是天然的整数, 其中 2 ≤ n ≤ 12。
2: 根据权利要求 1 的重复蛋白, 包含 10-30 个重复单元。
3: 根据权利要求 1 的重复蛋白, 包含重复单元 PGSSAAAAAAAASGPGQGQGQGQGQGGRPSDTY G。
4: 根据权利要求 1 的重复蛋白, 包含重复单元 SAAAAAAAAGPGGGNGGRPSDTYGAPGGGNGGRP SSSYG。
5: 根据权利要求 1 的重复蛋白, 其中所述蛋白质包含氨基酸序列 SEQID NO : 2 或 4。
6: 编码根据权利要求 1-5 的任一项的重复蛋白的核酸序列。
7: 包含权利要求 6 的核酸序列的宿主生物体。
8: 产生根据权利要求 1-5 的任一项的重复蛋白的过程, 其中通过根据权利要求 7 的宿 主生物体产生该蛋白质, 随后分离。
9: 根据权利要求 1-5 的任一项的重复蛋白在化妆品中的用途。
10: 根据权利要求 1-5 的任一项的重复蛋白用于活性物质和效应子配方的用途。
11: 根据权利要求 1-5 的任一项的重复蛋白用于精制纸、 皮革和织物的用途。
12: 根据权利要求 1-5 的任一项的重复蛋白用于表面涂料的用途。
13: 根据权利要求 1-5 的任一项的重复蛋白在人和动物营养中的用途。

说明书


合成的重复蛋白及其生产和用途

     本发明涉及新型合成重复蛋白及其生产和用途。背景技术 WO 2004/104043 描述了衍生自节枝弹性蛋白的重复序列的合成的生物弹性体, 和 其用途。同样的描述了由节枝弹性蛋白序列和来自其它蛋白质, 例如蛛丝的序列组成的杂 种分子。
     在文献中描述了不同重复蛋白的特性。例如, 公知节枝弹性蛋白具有良好的弹性 特性和高比例的弹性储能 ( 回弹力 )(Gosline 等人, Philosophical Transactions of the Royal Society of London SeriesB : Biological Science, 357(1418) : 121 : 32, 2002)。 蛛丝尤其由于其高拉伸强度和韧度而被公知 (Gosline 等人, J Exp Biol. ; 202(Pt 23) : 3295-303(1999))。
     发明描述
     本发明涉及具有重复单元的重复蛋白, 所述重复单元包含
     共有序列 (I)
     X1 X2 X3 X4 S X5 X6 Y G
     其中
     X1 是 G、 Y、 A或N
     X2 是 G、 L、 Q
     X3 是 R、 K、 T或P
     X4 是 P、 A、 T或S
     X5 是 D、 T或S
     X6 是 S、 Q 或 T, 和
     共有序列 (II)
     Z1 Z2(Z3A)nZ4 Z5 Z6
     其中
     Z1 是 S、 Q、 N、 T或G
     Z2 不是氨基酸或为 A
     Z3 是 A 或 G
     Z4 为不是氨基酸、 为A或S
     Z5 是 G、 S、 Q、 N或T
     Z6 是 G、 P、 S、 Q、 N或T
     n 是自然的整数, 其中 2 ≤ n ≤ 12。
     根据本发明的重复蛋白表征为至少 60%, 优选至少 80%的氨基酸序列由重复单 元组成。
     重复单元是长度为 7-100, 优选 12-60, 和特别优选 15-40 个氨基酸的氨基酸序列, 其通过相同的序列或具有 70%, 优选至少 80%, 和特别优选至少 90%同一性的变异而在蛋
     白质中多个存在。 根据本发明的重复蛋白可以包含单个或多个不同氨基酸序列的相同拷贝 或变异。
     可以通过接头连接重复单元, 所述接头包含优选 1-30 个氨基酸, 特别优选 1-20 个 氨基酸。 接头的氨基酸序列可以衍生自其它蛋白质, 优选结构蛋白, 或可以不具有任何天然 模型或是完全不存在的。
     可以将任意数目, 优选 1-100 个, 特别优选 10-65 个, 和最优选 15-35 个的重复单 元连接在一起。
     如本文使用的, 术语共有序列指包含在特定位置频繁出现的氨基酸的氨基酸序 列, 其中其它氨基酸没有任何具体定义, 而是在通常使用氨基酸的单字母密码的位置用占 位符 X 代替。本文使用的氨基酸的单字母密码是本领域技术人员公知的。
     在一个实施方案中, 在重复蛋白质的 60%, 优选至少 80%的重复单元中, 共有序 列 (I) 与共有序列 (II) 的比例是小于 5 且大于 2。
     在一个实施方案中, 在重复蛋白质的 60%, 优选至少 80%的重复单元中, 共有序 列 (I) 与共有序列 (II) 的比例是 2 或小于 2 和大于 1, 优选 2。
     在一个实施方案中, 在重复蛋白质的 60%, 优选至少 80%的重复单元中, 共有序 列 (I) 与共有序列 (II) 的比例是 1 或小于 1 和大于 1, 优选 1。 在一个实施方案中, 重复蛋白质的 60 %, 优选至少 80 %的重复单元包含子序列 GGRPSDTYG 或 GGRPSSSYG。
     在一个实施方案中, 根据本发明的重复蛋白质的 60%, 优选至少 80%的重复单元 包含序列基序 An 或 (GA)m, 其中 A =丙氨酸, G =甘氨酸, n = 2-12, m = 2-10, 优选 n = 5-10, m = 4-8 和特别优选 n = 7-9, m = 6-7。
     在另一个实施方案中, 重复蛋白质包含重复单元 PGSSAAAAAAAASGPGQGQGQGQGQGGR PSDTYG 或 SAAAAAAAAGPGGGNGGRPSDTYGAPGGGNGGRPSSSYG。
     在另一个实施方案中, 根据本发明的重复蛋白质在氨基末端或羧基末端包含长 度为 4-30, 和特别优选 5-15 个氨基酸的肽序列, 其被用于通过免疫印迹检测所述蛋白或 通过亲和色谱用于纯化所述蛋白。这类肽序列的非限制性实例是 6x His 标签 (HHHHHH)、 T7 标 签 (MASMTGGQQMG)、 S 标 签 (KETAAAKFERQHMDS)、 c-Myc 标 签 (EQKLISEEDL)、 Strep 标 签 (WSHPQFEK) 和 HA 标 签 (YPYDVPDYA)(Terpe ; Appl Microbiol Biotechnol ; 60(5) : 523-33(2003))。 可以将氨基酸序列插入在根据本发明的蛋白质和另外的肽序列之间, 其使 所述肽序列能够被化学或酶促移除。
     在另一个实施方案中, 重复蛋白质的氨基酸序列对应于 SEQ ID NO 2 或这一序列 的部分。
     在另一个实施方案中, 重复蛋白的氨基酸序列对应于 SEQ ID NO 4 或这一序列的 部分。
     根据本发明的重复蛋白具有惊人的新特性。 这些新特性涉及, 例如, 蛋白水溶液的 稳定性和组装特性。 此外, 发现新型重复蛋白赋予化妆品或皮肤病学组合物有利的特性, 特 别是能够提高吸水或软化作用。 新型重复蛋白还具有类似良好的膜形成物的作用和特别具 有低的表面密度。
     因此本发明还涉及新型重复蛋白单体或其组装产物在化妆品、 人和动物营养品中
     用于物质配方、 精制纸、 皮革和织物和表面涂料的用途。
     可以通过表达具有分子生物修饰以获得根据本发明的结构的天然基因序列产生 重复蛋白。分离和修饰天然基因序列的方法是本领域技术人员公知的。
     优选通过表达合成产生的基因序列产生重复蛋白。 产生合成基因序列的一个可能 性描述在 Huemmerich 等人, Biochemistry.43(42) : 13604-12, (2004) 中。
     本发明还涉及编码以上所述蛋白质的核酸序列。优选的核酸序列是 SEQ ID NO 1 和 SEQ ID NO 3。
     本发明还涉及包含以上提到的核酸序列的表达载体。 术语表达载体通常指可以被 引入宿主生物体和在那里使期望的核苷酸序列能够被表达的基因元件。 表达载体的实例是 质粒、 噬菌体或病毒。表达载体优选包含调节元件, 例如启动子或增强子, 对应的编码核苷 酸序列、 转录起始子和转录终止子, 和能够使载体被扩增的元件。
     蛋 白 质 的 表 达 系 统 是 众 所 周 知 的, 已 经 被 描 述 于 Sambrook 等 人 : Molecular rd cloning : A Laboratory Manual ; 3 Ed.Cold Spring HarbourLaboratory Press ; Cold Spring Harbour(2001)。
     原 核 表 达 生 物 的 非 限 制 性 实 例 是 大 肠 杆 菌 (Escherichia coli)、 枯草芽孢 杆 菌 (Bacillus subtilis)、 巨 大 芽 孢 杆 菌 (Bacillus megaterium)、 谷氨酸棒状杆菌 (Corynebacterium glutamicum) 和其它。 真核表达生物的非限制性实例是酵母例如酿酒酵 母 (Saccharomyces cerevisiae)、 巴斯德毕赤酵母 (Pichia pastoris) 和其它, 丝状真菌例 如黑曲霉 (Aspergillus niger)、 米曲霉 (Aspergillus oryzae)、 构巢曲霉 (Aspergillus nidulans)、 木霉菌 (Trichoderma reesei)、 顶头孢霉 (Acremonium chrysogenum) 和其它, 哺乳动物细胞例如 HeLa- 细胞、 COS 细胞、 CHO 细胞和其它, 昆虫细胞, 例如 Sf9 细胞、 MEL 细 胞和其它, 植物或植物细胞例如块茎茄属 (Solanum tuberosum)、 烟草属 (Nicotiana) 和其 它。
     本发明还涉及组装重复蛋白质以给出蛋白质微珠 (microbead)、 纳米原纤维 (nanofibril)、 凝胶和膜。
     可以优选的通过以下所述加工产生蛋白质微珠。
     重复蛋白被溶解在第一溶剂中。可以使用的溶剂的实例是水性盐溶液。特别合 适的是高浓缩的盐溶液, 具有超过 2, 特别是超过 4, 和特别优选超过 5 摩尔的浓度, 其离子 比钠离子和氯离子具有更显著的离液序列高的特性。这类盐溶液的实例是 6M 硫氰酸胍或 9M 溴化锂。而且, 可以使用有机溶剂溶解重复蛋白。特别合适的是氟化醇或环烃类。这些 的实例是六氟异丙醇和环己烷。可以在所述溶剂中制备蛋白质微珠。或者, 可以用另一溶 剂, 例如低浓度 (c < 0.5M) 盐溶液通过透析或稀释置换此溶剂。溶解蛋白的最终浓度应 该在 0.1-100mg/ml 之间。在其中进行该过程的温度通常是 0-80, 优选 5-50, 和特别优选 10-40℃。
     当使用含水溶液时, 可以向所述溶液另外加入缓冲液, 优选在 pH 4-10, 特别优选 5-9, 尤其优选 6-8.5 的范围。
     加入添加剂诱导相分离, 产生在溶剂和添加剂的混合物中乳化的富含蛋白质相。 由于表面效应, 乳化的富蛋白微滴呈圆形。由溶剂、 添加剂和蛋白质浓度的选择的结果决 定, 该蛋白质微珠的平均直径可以确定为从 0.1μm 至 50μm 的数值。可以使用的添加物是首先与第一溶剂溶和、 接着诱导富蛋白质相形成的任何物 质。 如果在有机溶剂中形成微珠, 那么具有比该溶剂 ( 例如甲苯 ) 更低极性的有机物质对于 此是合适的。在含水溶液中, 可以使用其离子比钠离子和氯离子具有更显著的稳定氢键能 力 (cosmotropic) 特性的盐 ( 例如, 硫酸铵 ; 磷酸钾 ) 作为添加剂。由添加剂的类型决定, 添加剂的终浓度应该是基于蛋白质溶液以重量计在 1%和 50%之间。
     通过固化 (curing) 固定富蛋白质微滴, 保持其圆形。这里的固定是基于有力的分 子间相互作用的形成。相互作用的类型可以是非共价的 ( 例如, 由于形成分子间 β- 片层 结晶 ), 或共价的 ( 例如, 由于化学交联 )。可以通过添加剂和 / 或加入另一合适物质进行 固化。固化发生在 0 和 80℃之间, 优选在 5 和 60℃之间。
     所述其它物质可以是化学交联剂。 这里的化学交联剂指其中至少两个化学反应基 团经由接头彼此连接的分子。其实例是巯基反应基团 ( 例如, 马来酰亚胺、 吡啶二硫化物、 α- 卤代乙酰、 乙烯基砜、 硫酸根合 (sulfato) 烷基砜 ( 优选硫酸根合乙基砜 )、 胺反应基团 ( 例如, 琥珀酰亚胺酯、 碳化二亚胺、 羟甲基膦、 酰亚胺酯、 PFP 酯、 醛类、 异硫氰酸盐等 )、 羧 基反应基团 ( 例如, 胺等 )、 羟基反应基团 ( 例如, 异氰酸盐等 )、 非选择性基团 ( 例如, 芳基 叠氮化合物等 )、 和光激活基团 ( 例如, 全氟苯基叠氮化物等 )。这些反应基团可以与在蛋 白质中存在的胺、 巯基、 羧基或羟基基团形成共价键。 也可以通过使用在氨基酸残基之间形成共价键的物质固化微珠。 这一实例是过氧 硫酸氢铵和三 (2, 2’ - 双吡啶基 ) 二氯钌 (II) 的组合, 其在可见光影响下介导二酪氨酸的 形成。
     用合适的其它溶剂, 例如水洗涤稳定化的微珠, 然后通过技术人员熟悉的操作, 例 如, 通过冻干或喷雾干燥来干燥。用扫描电子显微镜检查成功的微珠形成。
     产生微珠的操作允许疏水活性的化合物被包封, 由此配制进微珠中。这一操作包 括两个步骤。在第一步骤中, 疏水活性化合物和重复蛋白被溶解在共享的相中。为此目的, 可以通过溶剂或溶剂混合物直接溶解活性物质和重复蛋白。或者, 该活性物质和重复蛋白 可以先被溶解在不同溶剂, 而后溶剂可以彼此混合, 再产生共享的相。 该共享的相可以是分 子分散相或胶体分散相。
     如果疏水活性物质和蛋白质不能在共享的溶剂或溶剂混合物中溶解, 则在不同溶 剂中溶解疏水活性物质和蛋白质, 接着混合两个溶液是特别有利的。 在这一方式中, 也可以 通过此操作将已经溶解在合适溶剂中的活性物质, 稀释进入所述活性物质不可溶的不同溶 剂, 来制备疏水活性物质的胶体分散溶液。
     由于蛋白质通常在水中具有良好的溶解度, 优选用含水溶液、 以及水和易与水混 溶的有机溶剂的混合物操作。 合适的易与水混溶的溶剂的实例是醇类, 例如甲醇、 乙醇和异 丙醇, 氟化醇, 例如六氟异丙醇和三氟乙醇, 链烷酮例如丙酮, 或亚砜类, 例如, 二甲基亚砜, 或甲酰胺类, 例如二甲基甲酰胺, 或其它有机溶剂, 例如, 四氢呋喃和乙腈或 N- 甲基 -2- 吡 咯烷酮。 通常, 可以用其中可以溶解根据本发明的蛋白质的任何溶剂和溶剂混合物操作。 合 适溶剂的实例是氟化醇, 例如, 六氟异丙醇或三氟乙醇, 离子液体, 例如, EMIM 乙酸盐、 离液 序列高的盐的水溶液, 例如, 尿素、 盐酸胍、 硫氰酸胍, 或有机酸, 例如, 甲酸, 还有这些溶剂 与其它有机溶剂的混合物。可以与蛋白质的溶剂混合的溶剂的实例尤其是, 例如, 醇类, 例 如甲醇、 乙醇和异丙醇, 链烷酮, 例如丙酮, 亚砜类例如, 诸如二甲基亚砜, 甲酰胺类例如二
     甲基甲酰胺, 卤代烷例如二氯甲烷, 或其它有机溶剂, 例如诸如四氢呋喃。
     在第二步骤中, 在共享的活性物质 - 蛋白质溶液中诱导相分离随后固化微珠。根 据先前制备纯蛋白质微珠所述的相同原则进行这一操作。在微珠形成期间, 疏水活性物质 与根据本发明的重复蛋白质相互作用。
     尽管也可能涉及氢桥、 离子相互作用和范德瓦耳斯相互作用, 在疏水活性物质和 蛋白质之间的相互作用是基本基于其疏水特性。疏水活性物质可以结合于微珠表面、 包封 在其中, 或同时以两种方式与微珠结合。 可以通过在组装混合物中耗尽溶解的活性物质, 来 测定疏水活性物质与微珠的结合。可以通过其特性的定量分析测量该活性物质的浓度。因 此, 例如, 可以通过光度计方法分析光吸收的活性物质的结合。为此目的, 例如, 通过测量 有色活性物质的光吸收测定微珠的染色、 或该制剂混合物的蛋白质 - 活性物质耗尽相的脱 色。也可以用这些方法测定在微珠中活性物质的比例。
     可以通过解吸进入合适的溶剂、 通过蛋白酶降解微珠、 或通过合适溶剂溶解微珠, 从微珠释放活性物质。 适合解吸的溶剂为活性物质可以溶解于其中的任何溶剂或溶剂混合 物。合适的蛋白酶可以以专门的蛋白酶的形式特异性地加入蛋白质微珠悬浮液, 或合适的 蛋白酶可能在效应分子作用的期望位点天然存在, 例如, 皮肤蛋白酶、 胃肠道蛋白酶, 例如 胃或肠的蛋白酶, 或通过微生物释放的蛋白酶。 能够溶解微珠的溶剂是, 例如, 氟化醇类, 例 如, 六氟异丙醇或三氟乙醇, 离子液体, 例如, EMIM 乙酸盐、 离液序列高的盐的水溶液, 例如, 尿素、 盐酸胍和硫氰酸胍, 或有机酸, 例如, 甲酸, 还有这些溶剂与其它有机溶剂的混合物。 可以例如, 经由用活性物质占据的密度和微珠大小或其体积对面积比率, 来控制效应分子 的释放速率和动力学。 在合适的条件下, 可以从根据本发明的重复蛋白制备纳米原纤维。在等于或高于 1mg/ml 纳米的原纤维浓度下, 通过凝胶样稠化水性蛋白溶液, 纳米原纤维在在宏观水平显 示其自身的形成。
     组 装 蛋 白 质 纳 米 原 纤 维 的 起 点 是 具 有 蛋 白 质 浓 度 为 0.1-400mg/ml, 优选 1-100mg/ml, 和特别优选 5-20mg/ml 的重复蛋白的水溶液。 可以用, 优选范围在 pH 4-10, 特 别优选 5-9, 尤其优选 6-8.5 的缓冲液与水溶液混合。在数周期间内该组装过程自动发生。 其可以通过加入减少溶液极性的水溶的有机溶剂而被加速。这些溶剂的实例是醇类, 例如 乙醇和甲醇。溶剂的终浓度应该在基于蛋白质溶液以重量计 1%和 50%之间。
     用合适溶剂, 例如水, 洗涤组装的蛋白质纳米原纤维, 接着通过技术人员熟悉的操 作, 例如, 通过冻干法、 接触干燥或喷雾干燥进行干燥。在透射电子显微镜或扫描原子力显 微镜帮助下检测纤维的成功形成。
     在合适条件下, 可以从根据本发明的重复蛋白质制备膜。 为此目的, 将重复蛋白质 溶解在第一溶剂中。 可以使用的溶剂的实例是含水盐溶液。 特别合适的是具有超过 2, 特别 是超过 4, 和特别优选超过 5 摩尔浓度的高浓度盐溶液, 其离子比钠离子和氯离子具有更显 著的离液序列高的特性。这类盐溶液的实例是 6M 硫氰酸胍或 9M 溴化锂。还可以使用有机 溶剂溶解重复蛋白。特别合适的是氟化醇或环烃类。其实例是六氟异丙醇和环己烷。只要 其不包含任何非挥发性物质, 可以在所述第一溶剂中制备膜。包含非挥发性成分的溶剂必 须由不包含任何非挥发性物质的另一溶剂置换, 例如通过透析。从其中可以形成膜的优选 的挥发性溶剂是六氟异丙醇、 环己烷、 甲酸和水。溶解的蛋白质的终浓度应该在 1-200mg/
     ml 之间, 优选在 20-150mg/ml 之间, 和特别优选 50-100mg/ml 之间。 进行操作的温度通常是 0-80, 优选 5-50, 和特别优选 10-40℃。
     在挥发性溶剂中溶解的重复蛋白被平铺于光滑表面。溶剂在室温蒸发, 留下蛋白 膜。
     新鲜制备的蛋白膜通常是水溶的。可以通过将其与诱导在膜内形成稳定的二级、 三级和四级结构的物质孵育来稳定膜。这类物质的实例是醇类, 例如, 甲醇和乙醇, 或其离 子比钠离子和氯离子具有更显著的稳定氢键能力特性的盐溶液 ( 例如, 硫酸铵、 磷酸钾 )。 在膜被稳定化之后, 可以用合适溶剂, 例如, 醇类或水洗涤, 然后干燥。
     本发明还涉及由根据本发明的重复蛋白与效应分子偶联组成的分子。效应分 子指具有特定、 可预期作用的分子。他们可以是蛋白质样分子, 例如酶或非产生蛋白质 (non-proteinogenic) 的分子, 例如染料、 光稳定剂、 维生素、 维生素原、 抗氧化剂和脂肪酸、 调节剂或包含金属离子的化合物。
     效应分子被连接于重复蛋白。在效应分子和蛋白质之间的连接可以是共价键, 和 基于离子或范德瓦耳斯相互作用或疏水相互作用或氢键或吸附的连接。
     效应分子可以是经由重复蛋白的多肽序列的侧链, 特别是经由氨基官能团或羟基 官能团或羧基官能团或巯基官能团共价连接。 优选经由一个或多个赖氨酸残基的氨基官能 团, 经由一个或多个谷氨酸或天冬氨酸残基的羧基官能团, 经由一个或多个半胱氨酸残基 的巯基官能团, 或经由重复蛋白的 N- 末端或 C- 末端官能团进行连接。 也可能在除了在氨基 酸序列中存在的氨基酸官能团之外将具有合适官能团的氨基酸 ( 例如, 半胱氨酸、 赖氨酸、 天冬氨酸、 谷氨酸 ) 添加或插入序列, 或用这类氨基酸官能团替代重复蛋白的氨基酸。 效应分子可以被直接连接于重复蛋白, 即, 通过已经存在的两个化学官能团的共 价连接。这涉及连接重复蛋白的上述化学官能团和在效应分子中存在的反应基团。这类反 应基团的实例是巯基 - 反应基团, 例如, 马来酰亚胺、 吡啶二硫化物、 α- 卤代乙酰、 乙烯基 砜、 硫酸根合 (sulfato) 烷基砜 ( 优选硫酸根合乙基砜 )、 胺反应基团 ( 例如, 琥珀酰亚胺 酯、 碳化二亚胺、 羟甲基膦、 酰亚胺酯、 PFP 酯、 醛类、 异硫氰酸盐等 )、 羧基反应基团 ( 例如, 胺等 )、 羟基反应基团 ( 例如, 异氰酸盐等 )、 非选择性基团 ( 例如, 芳基叠氮化物等 )、 和光 激活基团 ( 例如, 全氟苯基叠氮化物等 )。
     如果根据本发明的重复蛋白和效应子的待偶联官能团的反应性对于直接偶联过 低, 则可以通过技术人员熟悉的方法激活所述官能团 ( 例如, 用碳化二亚胺激活羧基官能 团 )。
     然而, 连接也可以经由 “接头” , 即至少双功能分子发生, 其用一个或多个官能团结 合于效应分子和用一个或多个不同的官能团结合于重复蛋白。 使用这类特定的接头使连接 与期望的效应分子精确的匹配。此外, 这使能够在确定的方式中将多个效应分子连接于重 复蛋白。
     使用的接头取决于待偶联的官能度。合适的实例是这样的分子, 其通过以下方式 偶联于重复蛋白, 巯基反应基团例如马来酰亚胺、 吡啶二硫化物、 α- 卤代乙酰、 乙烯基砜、 硫酸根合 (sulfato) 烷基砜 ( 优选硫酸根合乙基砜 )、 胺反应基团 ( 例如, 琥珀酰亚胺酯、 碳 化二亚胺、 羟甲基膦、 酰亚胺酯、 PFP 酯、 醛类、 异硫氰酸盐等 )、 羧基反应基团 ( 例如, 胺等 )、 羟基反应基团 ( 例如, 异氰酸盐等 )、 非选择性基团 ( 例如, 芳基叠氮化物等 )、 和光激活基
     团 ( 例如, 全氟苯基叠氮化物等 ) ; 通过以下方式偶联于效应分子
     - 巯基反应基团例如马来酰亚胺、 吡啶二硫化物、 α- 卤代乙酰、 乙烯基砜、 硫酸根 合 (sulfato) 烷基砜 ( 优选硫酸根合乙基砜 )
     - 胺反应基团 ( 例如, 琥珀酰亚胺酯、 碳化二亚胺、 羟甲基膦、 酰亚胺酯、 PFP 酯、 醛 类、 异硫氰酸盐等 )
     - 糖或氧化的糖反应基团 ( 例如, 酰肼类等 )
     - 羧基反应基团 ( 例如, 胺等 )
     - 羟基反应基团 ( 例如, 异氰酸盐等 )
     - 胸腺嘧啶反应基团 ( 例如, 补骨脂素等 )
     - 非选择性基团 ( 例如, 芳基叠氮化物等 )
     - 光激活基团 ( 例如, 全氟苯基叠氮化物等 )
     - 金属络合基团 ( 例如, EDTA、 6×His、 铁蛋白 )
     - 抗体和抗体片段 ( 例如, 单链抗体、 抗体的 F(ab) 片段、 催化抗体 )。
     接头的化学官能团可以通过间隔基元件被连接。间隔基元件可以由, 例如, 烷基 链、 乙二醇和聚乙烯二醇构成。
     特别优选具有蛋白酶、 酯酶、 脂肪酶、 磷酸酶、 水解酶的潜在切割位点的接头元件 和 / 或间隔基元件, 即, 其为可酶促切割的。
     可 以 在 根 据 本 发 明 的 分 子 中 使 用 的 可 酶 促 切 割 的 接 头 的 实 例 是 在 例 如 WO 98/01406 中提及, 其整体作为参考引入。
     特别优选的接头和间隔基是可热切割或可光切割的。 相应的化学结构是技术人员 公知的, 并整合在分子的效应分子和重复蛋白部分之间。
     如果该效应分子由多肽序列组成, 则效应子和重复蛋白可以通过 “融合” 蛋白而被 连接, 即, 使用连续的多肽序列, 其由效应子子序列和重复蛋白子序列组成。
     也可在效应子和重复蛋白之间并入 “间隔基元件” , 例如具有蛋白酶、 脂肪酶、 酯 酶、 磷酸酶、 水解酶的潜在切割位点的多肽序列, 或能够使融合蛋白被容易的纯化的寡肽和 多肽序列, 例如, “His” 标签, 即, 寡聚组氨酸残基。
     共价或非共价偶联于重复蛋白的效应分子在其结合形式可以是有活性的。但是, 或者, 偶联于重复蛋白的效应分子也可以从所述重复蛋白被释放。
     可以通过切割特异性引入的可切割间隔基或偶联的接头从重复蛋白释放共价偶 联的效应分子, 可切割间隔基或偶联的接头可以是, 例如, 可以热切割的、 光切割的或酶促 切割的, 或通过蛋白水解降解 ( 例如通过蛋白酶 ) 的。 实施例 实施例 1
     产生重复蛋白 R16(SEQ ID NO : 2)
     根据在 Huemmerich 等人 ; Biochemistry 43(42) : 13604-12, (2004) 中所述方法通 过以下的合成寡核苷酸 R 的多聚化来多聚化编码重复蛋白 R16 的合成基因 : ggcccgggttcta gcgcggctgcagccgcggcagctgcgtccggcccgggtcagggccagggtcagggtcaaggccagggtggccgtcct tctgacacctac
     以 产 生 16mer, 克 隆 进 入 表 达 载 体 pET21a(Novagen)。 在 大 肠 杆 菌 BLR[DE3] (Novagen) 菌株中进行表达。
     在 pO2 > 20%和 pH = 6.8 下分批补料发酵 (fed batch) 进行生长和蛋白质合成。
     培养基
     8升 水
     230g 酵母提取物
     150g 细菌胰蛋白胨
     30g 甘油 (99% )
     20g 磷酸二氢钾 (KH2PO4)
     50g 硫酸铵 ((NH4)2SO4)
     10.5g 硫酸镁七水合物 (MgSO4*7 H2O)
     1.0g 二水氯化钙 (CaCl2*2 H2O)
     100ml 微量盐溶液 (Trace salt solution)
     用水填充至 9.7 升
     用 25%强度的 NaOH 调节 pH 至 6.8
     3ml Tego KS 911( 止泡剂 ; Goldschmidt 产品 )
     1g 氨苄西林
     微量盐溶液 :
     5升 水
     200.00g 一水柠檬酸
     55.00g ZnSO4*7 H2O
     42.50g (NH4)2Fe(SO4)2*6 H2O
     15.00g MnSO4*H2O
     4.00g CuSO4*5 H2O
     1.25g CoSO4*7 H2O
     补料溶液
     800g 水
     30g 一水柠檬酸
     60g 硫酸钠 (Na2SO4)
     4.5g (NH4)2Fe(SO4)2*6 H2O
     3400g 甘油 99.5%
     在基础培养基中的甘油用尽之后, 以 100ml/h 速率开始持续的补料。
     在细菌培养物已经达到光密度 OD600 = 40 之后, 通过加入 1mM 异丙基 β-D- 半乳 糖硫吡喃糖苷诱导蛋白质合成。此时, 培养温度从 37℃降低至 32℃。在诱导 7 小时后收集 细胞。
     根据下列操作方法纯化蛋白质 :
     在 5ml 的每克湿生物质 20mM MOPS(3-(N- 吗啉代 ) 丙磺酸 )pH 7.0 中重悬浮细胞 沉淀
     在 1400 巴高压匀浆器中裂解细胞在 5000×g 离心 30 分钟
     用 5ml 的每克湿生物质 50mM Tris/HCl pH 8.0 ; 100mM NaCl, 0.5mM 乙二胺四乙酸 盐 (EDTA), 0.1% Triton X-100 的溶液洗涤沉淀
     用 5ml 的每克湿生物质 50mM Tris/HCl pH 8.0 ; 100mM NaCl, 0.5mM 乙二胺四乙酸 盐 (EDTA) 洗涤沉淀物
     通过加入每克沉淀 1.6g 的硫氰酸胍 (GdmSCN)( 终浓度 : 6 M GdmSCN) 溶解沉淀
     在 5000×g 离心 60 分钟
     对 5mM 磷酸钾 pH 7.0 透析上清液
     在 5000×g 离心 30 分钟
     在室温通过加入 1/4 体积的 4M 硫酸铵从上清液沉淀蛋白质 1 小时
     用 8M 尿素洗涤沉淀
     用水 2 次洗涤沉淀
     冻干
     冻干蛋白可以被贮存在 -20℃
     为了使用蛋白质, 在 6M GdmSCN 中重构冻干的蛋白质和对 5mM 磷酸钾 pH 7.0 透析
     光度计测定溶液中的蛋白质含量 (E(280 ; 1mg/ml = 0.42)
     通过聚丙烯酰胺凝胶 (SDS PAGE) 和蛋白印迹分析 ( 图 1) 和通过荧光光谱法 ( 图 2) 检测蛋白质的纯度
     从 10 升发酵液中回收 20g 的纯 R16 蛋白, 纯度> 95%。
     实施例 2
     生产重复蛋白 S16(SEQ ID NO : 4)
     根据在 Huemmerich 等人 ; Biochemistry 43(42) : 13604-12, (2004) 中所述方法通 过以下的合成寡核苷酸 S 的多聚化来多聚化编码重复蛋白 S16 的合成基因 : ggttctgcggctg cagccgcggcagctgcgggtccgggcggtggcaacggtggccgtccgtctgacacctacggtgcgccgggtggcggt aacggtggccgtccttcttcctcttac
     以 产 生 16mer, 克 隆 进 入 表 达 载 体 pET21a(Novagen)。 在 大 肠 杆 菌 BLR[DE3] (Novagen) 菌株中进行表达。
     在 pO2 > 20%和 pH = 6.8 下分批补料发酵进行生长和蛋白质合成。
     培养基
     8升 水
     230g 酵母提取物
     150g 细菌胰蛋白胨
     30g 甘油 (99% )
     20g 磷酸二氢钾 (KH2PO4)
     50g 硫酸铵 ((NH4)2SO4)
     10.5g 硫酸镁七水合物 (MgSO4*7 H2O)
     1.0g 二水氯化钙 (CaCl2*2 H2O)
     100ml 微量盐溶液
     用水填充至 9.7 升用 25%强度的 NaOH 调节 pH 强度至 6.8 3ml Tego KS 911( 止泡剂 ; Goldschmidt 产品 ) 1g 氨苄西林 微量盐溶液 : 5升 水 200.00g 一水柠檬酸 55.00g ZnSO4*7 H2O 42.50g (NH4)2Fe(SO4)2*6 H2O 15.00g MnSO4*H2O 4.00g CuSO4*5 H2O 1.25g CoSO4*7 H2O 补料溶液 800g 水 30g 一水柠檬酸 60g 硫酸钠 (Na2SO4)4.5g (NH4)2Fe(SO4)2*6 H2O
     3400g 甘油 99.5%
     在基础培养基中的甘油用尽之后, 以 100ml/h 速率开始持续的补料。
     在细菌培养物已经达到光密度 OD600 = 40 之后, 通过加入 1mM 异丙基 β-D- 半乳 糖硫吡喃糖苷诱导蛋白质合成。此时, 培养温度从 37℃降低至 25℃。在诱导 4 小时后收集 细胞。
     根据下列操作方法纯化蛋白质 :
     在 5ml 的每克湿生物质 20mM MOPS(3-(N- 吗啉代 ) 丙磺酸 )pH 7.0 中重悬浮细胞 沉淀
     在 1400 巴高压匀浆器中裂解细胞
     在 5000×g 离心 30 分钟
     在 80℃孵育上清液 20 分钟
     在 5000×g 离心 30 分钟
     在室温通过加入 1 体积的 4M 硫酸铵从上清液沉淀蛋白质 1 小时
     用 8M 尿素洗涤沉淀
     用水 2 次洗涤沉淀
     冻干
     冻干蛋白可以被贮存在 -20℃
     为了使用蛋白质, 在 6M GdmSCN 中重构硫酸铵沉淀和对 5mM 磷酸钾 pH 7.0 透析
     光度计测定溶液中的蛋白质含量 (E(280 ; 1mg/ml) = 0.76)
     通过聚丙烯酰胺凝胶 (SDS PAGE) 和蛋白印迹分析 ( 图 1) 和通过荧光光谱法 ( 图 2) 检测蛋白质的纯度
     从 10 升发酵液中回收 1.4g 的纯 S16 蛋白。
     实施例 3从重复蛋白 R16 和 S16 形成蛋白质微珠
     操作方案
     以 10mg/ml 的终浓度在 6M 硫氰酸胍中溶解冻干的 R16 或 S16
     在室温对 1M 磷酸钾 pH 7.0 透析
     用水洗涤
     冻干。
     用有稳定氢键能力的 (cosmotropic) 磷酸钾代替离液序列高的 (chaotropic) 硫 氰酸胍来诱导 R16 或 S16 微粒的形成。或者, 可以通过对 5mM 磷酸钾透析除去硫氰酸胍。通 过加入 1/4 体积的 4M 硫酸铵或 1/2 体积的磷酸钾诱导微粒形成。
     操作方案
     以 15mg/ml 的终浓度在 6M 硫氰酸胍中溶解冻干的 R16 或 S16
     在 4℃对 5mM 磷酸钾 pH 7.0 透析
     在 10 000×g 离心 30 分钟除去沉淀
     调节蛋白质浓度至 10mg/ml
     加入 1/4 体积的 4M 硫酸铵或 1/2 体积的 1M 磷酸钾
     在室温孵育 1 小时
     用水洗涤
     冻干。
     在扫描电子显微镜帮助下检测成功的微粒形成 ( 图 3+4)。
     实施例 4
     S16 微粒的稳定化
     S16 微粒形成的操作包括由磷酸钾或硫酸铵诱导的相分离, 和继之通过形成稳定的 二级结构稳定富蛋白质相。尚未固化的富蛋白质微滴可以通过其在 4M 尿素中不同的稳定 性实验性的与稳定的微粒相区分。检测稳定化的动力学。
     操作方案
     在 5mM 磷酸钾 pH 7.0 中制备含水的 10mg/ml S16- 溶液
     在时刻 0 用 1/4 体积的 4M 硫酸铵沉淀 S16 蛋白质
     在时刻 t 除去蛋白质悬浮物沉淀的部分, 将其与相同体积的 8M 尿素混合
     在 600nm 来测量样品的消光值作为散射的定量测量。
     通过沉淀产生的样品的混浊可以通过确立 4M 浓度的尿素在 30 分钟内被反转。40 分钟之后, 经此处理的混浊仍存在。因此可以推断在此期间在富蛋白质相中已经形成这样 的结构, 其在 4M 尿素中是稳定的 ( 图 5)。
     实施例 5
     在 R16 和 S16 微粒中包封 β- 胡萝卜素
     为了证明 R16 和 S16 微粒是活性物质的合适的载体和制剂辅药, 通过例如将 β- 胡 萝卜素作为低水溶性活性物质包封入 R16 和 S16 微粒中。
     为此目的, 在 10%四氢呋喃 (THF) 和 90% N- 甲基 -2- 吡咯烷酮 (NMP) 中用 50μl 的 0.9mg/ml β- 胡萝卜素溶液与在 5mM 磷酸钾 (pH 8.0) 中的 500μl 的 10mg/ml R16 或 S16 溶液混合。此后, 通过加入 275μl 的 4M 硫酸铵溶液诱导微粒的形成。在 R16 和 S16 微粒形成期间, 从溶液中移去 β- 胡萝卜素。已经通过离心除去的微 粒呈现黄 - 橙黄色。用水洗涤微粒, 在此操作期间 β- 胡萝卜素保持与微粒结合, 然后冻 干。冻干之后, 通过扫描电子显微镜分析负载的 R16 或 S16 微粒 ( 图 6+7)。在电子显微镜图 像中, 负载的微粒 ( 图 6+7) 显示与未负载微粒 ( 图 3+4) 非常相似的形态, 由此清楚可见微 粒和 β- 胡萝卜素形成共享的固相。
     实施例 6
     R16 微粒的水吸收
     重复蛋白的微粒可以从空气吸收水并释放水, 因此可以例如在化妆品应用中作为 水分调节物质。
     为了证明, 将事先已经贮存在 -20℃的 0.4g 的 R16 微粒在真空下干燥 16 小时和测 定干燥重量。继之在室温和 100%湿度贮存导致在 66 天内重量缓慢增加 44% ( 图 8)。在 真空中的除去干燥重现了初始的干重量。
     实施例 7
     R16 和 S16 的凝胶形成
     操作方案 :
     以 20mg/ml 的终浓度在 6M 硫氰酸胍中溶解冻干的 R16 或 S16
     在 4℃对 5mM 磷酸钾 pH 7.0 透析
     在 10 000×g 离心 30 分钟除去沉淀
     制备含有 2.5mM 磷酸钾 pH 7.0, 10mg/ml R16 或 S16 蛋白质和 40%体积比乙醇的溶 液
     在室温孵育。
     该溶液在 4-5 天内得到凝胶样、 混浊态。
     实施例 8
     R16 和 S16 的膜形成
     操作方案 :
     以 100mg/ml 的终浓度在六氟异丙醇中溶解冻干的 R16 或 S16
     在光滑的聚苯乙烯表面上平铺 300μl
     在室温蒸发六氟异丙醇
     用 1M 磷酸钾 pH 7.0 覆盖蛋白质膜 5 分钟
     用水 2 次洗涤
     在空气中干燥。
     这一处理导致透明的、 水不溶的蛋白质膜。R16 的干膜是脆的, 而 S16 的膜具有软质 (flexible) 特性。
     图例
     图 1. 纯化的蛋白质 R16 和 S16 的分析。制备蛋白质的水溶液和在聚丙烯酰胺凝胶 上电泳分离。通过用染料考马斯亮蓝 (C) 染色或通过用特异性结合 T7 肽标签 ( 其与两个 蛋白质氨基末端连接 ) 免疫印迹法 (WB) 检测该蛋白质。
     图 2. 通过荧光光谱法对纯化的 R16 和 S16 的纯化分析。R16 和 S16 不包含氨基酸色 氨酸, 而存在酪氨酸。相反, 色氨酸在大肠杆菌蛋白质中以平均 1.5%的频率存在。荧光光谱法可以选择性的检测蛋白质样品中色氨酸的存在, 因而检测在 R16 或 S16 制品中的污染。 尽管酪氨酸和色氨酸都被 280nm 波长的光 ( 蓝色 ) 激发, 但 295nm 的光 ( 洋红色 ) 只激发 色氨酸。R16 和 S16 样品呈现典型的酪氨酸荧光, 而没有表明可检测的色氨酸存在, 说明蛋白 质样品的高纯度。
     图 3.R16 微粒。通过在 6M GdmSCN 中 10mg/ml R16 溶液对 1M 磷酸钾溶液 pH 7.0 透 析获得微粒, 通过扫描电子显微镜分析。
     图 4.S16 微粒。通过在 6M GdmSCN 中 10mg/ml S16 溶液对 1M 磷酸钾溶液 pH 7.0 透 析获得微粒, 通过扫描电子显微镜分析。
     图 5.S16 微粒的稳定化。通过在时刻 t = 0 加入 1/4 体积的硫酸铵沉淀含水的 10mg/ml S16 溶液。在确定的时间点, 取出部分, 确立 4M 尿素的浓度, 在 600nm 测量消光度 作为散射的定性测量, 从而测量存在的稳定蛋白质颗粒。
     图 6. 具有 0.8% β- 胡萝卜素的 R16 微粒。通过加入 4M 硫酸铵溶液至 6M GdmSCN 中的 10mg/ml R16 和 0.08mg/ml β- 胡萝卜素获得微粒, 通过扫描电子显微镜分析。
     图 7. 具有 0.8% β- 胡萝卜素的 S16 微粒。通过加入 4M 硫酸铵溶液至 6M GdmSCN 中的 10mg/ml R16 和 0.08mg/ml β- 胡萝卜素获得微粒, 通过扫描电子显微镜分析。
     图 8.R16 微粒的吸湿性。通过在 R16 微粒在 100%湿度重量的增加测量水的吸收。15101855239 A CN 101855241序列 序列表表1/12 页<110> 巴斯夫欧洲公司 <120> 合成的重复蛋白及其生产和用途 <130>PF59335 <160>4 <170>PatentIn version 3.1 <210>1 <211>1680 <212>DNA <213> 人工序列 <220> <223>″ R16 重复蛋白的基因″ <220> <221>CDS <222>(1)..(1680) <223> <400>1 atg gct agc atg act ggt gga cag caa atg ggt cgc gga tcc atg ggc Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg Gly Ser Met Gly 1 5 10 15 ccg ggt tct agc gcg gct gca gcc gcg gca gct gcg tcc ggc ccg ggt Pro Gly Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly Pro Gly164896101855239 A CN 101855241序列表30 cgt cct tct gac acc Arg Pro Ser Asp Thr 45 gca gct gcg tcc ggc Ala Ala Ala Ser Gly 60 ggt ggc cgt cct tct Gly Gly Arg Pro Ser 80 gcc gcg gca gct gcg Ala Ala Ala Ala Ala 95 ggc cag ggt ggc cgt Gly Gln Gly Gly Arg 110 gct gca gcc gcg gca Ala Ala Ala Ala Ala 125 ggt caa ggc cag ggt Gly Gln Gly Gln Gly 140 agc gcg gct gca gcc Ser Ala Ala Ala Ala 160 ggt cag ggt caa ggc Gly Gln Gly Gln Gly 175 ggt tct agc gcg gct Gly Ser Ser Ala Ala 190 ggc cag ggt cag ggt Gly Gln Gly Gln Gly 205 ggc ccg ggt tct agc Gly Pro Gly Ser Ser 220 ggt cag ggc cag ggt Gly Gln Gly Gln Gly2/12 页cag Gln tac Tyr ccg Pro 65 gac Asp tcc Ser cct Pro gct Ala ggc Gly 145 gcg Ala cag Gln gca Ala caa Gln gcg Ala20 ggc cag ggt cag ggt Gly Gln Gly Gln Gly 35 ggc ccg ggt tct agc Gly Pro Gly Ser Ser 50 ggt cag ggc cag ggt Gly Gln Gly Gln Gly 70 acc tac ggc ccg ggt Thr Tyr Gly Pro Gly 85 ggc ccg ggt cag ggc Gly Pro Gly Gln Gly 100 tct gac acc tac ggc Ser Asp Thr Tyr Gly 115 gcg tcc ggc ccg ggt Ala Ser Gly Pro Gly 130 cgt cct tct gac acc Arg Pro Ser Asp Thr 150 gca gct gcg tcc ggc Ala Ala Ala Ser Gly 165 ggt ggc cgt cct tct Gly Gly Arg Pro Ser 180 gcc gcg gca gct gcg Ala Ala Ala Ala Ala 195 ggc cag ggt ggc cgt Gly Gln Gly Gly Arg 210 gct gca gcc gcg gca Ala Ala Ala Ala Ala25 caa ggc cag ggt ggc Gln Gly Gln Gly Gly 40 gcg gct gca gcc gcg Ala Ala Ala Ala Ala 55 cag ggt caa ggc cag Gln Gly Gln Gly Gln 75 tct agc gcg gct gca Ser Ser Ala Ala Ala 90 cag ggt cag ggt caa Gln Gly Gln Gly Gln 105 ccg ggt tct agc gcg Pro Gly Ser Ser Ala 120 cag ggc cag ggt cag Gln Gly Gln Gly Gln 135 tac ggc ccg ggt tct Tyr Gly Pro Gly Ser 155 ccg ggt cag ggc cag Pro Gly Gln Gly Gln 170 gac acc tac ggc ccg Asp Thr Tyr Gly Pro 185 tcc ggc ccg ggt cag Ser Gly Pro Gly Gln 200 cct tct gac acc tac Pro Ser Asp Thr Tyr 215 gct gcg tcc ggc ccg Ala Ala Ser Gly Pro17144192240288336384432480528576624672720101855239 A CN 101855241序列表235 gac acc tac ggc ccg Asp Thr Tyr Gly Pro 255 tcc ggc ccg ggt cag Ser Gly Pro Gly Gln 270 cct tct gac acc tac Pro Ser Asp Thr Tyr 285 gct gcg tcc ggc ccg Ala Ala Ser Gly Pro 300 ggc cgt cct tct gac Gly Arg Pro Ser Asp 315 gcg gca gct gcg tcc Ala Ala Ala Ala Ser 335 cag ggt ggc cgt cct Gln Gly Gly Arg Pro 350 gca gcc gcg gca gct Ala Ala Ala Ala Ala 365 caa ggc cag ggt ggc Gln Gly Gln Gly Gly 380 gcg gct gca gcc gcg Ala Ala Ala Ala Ala 395 cag ggt caa ggc cag Gln Gly Gln Gly Gln 415 tct agc gcg gct gca Ser Ser Ala Ala Ala 430 cag ggt cag ggt caa Gln Gly Gln Gly Gln 240 ggt Gly ggc Gly ggc Gly ggt Gly acc Thr 320 ggc Gly tct Ser gcg Ala cgt Arg gca Ala 400 ggt Gly gcc Ala ggc Gly3/12 页225 cag ggt caa ggc cag Gln Gly Gln Gly Gln 245 tct agc gcg gct gca Ser Ser Ala Ala Ala 260 cag ggt cag ggt caa Gln Gly Gln Gly Gln 275 ccg ggt tct agc gcg Pro Gly Ser Ser Ala 290 cag ggc cag ggt cag Gln Gly Gln Gly Gln 305 tac ggc ccg ggt tct Tyr Gly Pro Gly Ser 325 ccg ggt cag ggc cag Pro Gly Gln Gly Gln 340 gac acc tac ggc ccg Asp Thr Tyr Gly Pro 355 tcc ggc ccg ggt cag Ser Gly Pro Gly Gln 370 cct tct gac acc tac Pro Ser Asp Thr Tyr 385 gct gcg tcc ggc ccg Ala Ala Ser Gly Pro 405 ggc cgt cct tct gac Gly Arg Pro Ser Asp 420 gcg gca gct gcg tcc Ala Ala Ala Ala Ser230 ggt ggc cgt cct tct Gly Gly Arg Pro Ser 250 gcc gcg gca gct gcg Ala Ala Ala Ala Ala 265 ggc cag ggt ggc cgt Gly Gln Gly Gly Arg 280 gct gca gcc gcg gca Ala Ala Ala Ala Ala 295 ggt caa ggc cag ggt Gly Gln Gly Gln Gly 310 agc gcg gct gca gcc Ser Ala Ala Ala Ala 330 ggt cag ggt caa ggc Gly Gln Gly Gln Gly 345 ggt tct agc gcg gct Gly Ser Ser Ala Ala 360 ggc cag ggt cag ggt Gly Gln Gly Gln Gly 375 ggc ccg ggt tct agc Gly Pro Gly Ser Ser 390 ggt cag ggc cag ggt Gly Gln Gly Gln Gly 410 acc tac ggc ccg ggt Thr Tyr Gly Pro Gly 425 ggc ccg ggt cag ggc Gly Pro Gly Gln Gly1876881686491296010081056110411521200124812961344101855239 A CN 101855241序列表445 ccg ggt tct agc gcg Pro Gly Ser Ser Ala 460 cag ggc cag ggt cag Gln Gly Gln Gly Gln 475 tac ggc ccg ggt tct Tyr Gly Pro Gly Ser 495 ccg ggt cag ggc cag Pro Gly Gln Gly Gln 510 gac acc tac ggc ccg Asp Thr Tyr Gly Pro 525 tcc ggc ccg ggt cag Ser Gly Pro Gly Gln 540 cct tct gac acc tac Pro Ser Asp Thr Tyr 555 gct Ala ggt Gly 480 agc Ser ggt Gly ggt Gly ggc Gly ggc Gly 5604/12 页435 cag ggt ggc cgt cct Gln Gly Gly Arg Pro 450 gca gcc gcg gca gct Ala Ala Ala Ala Ala 465 caa ggc cag ggt ggc Gln Gly Gln Gly Gly 485 gcg gct gca gcc gcg Ala Ala Ala Ala Ala 500 cag ggt caa ggc cag Gln Gly Gln Gly Gln 515 tct agc gcg gct gca Ser Ser Ala Ala Ala 530 cag ggt cag ggt caa Gln Gly Gln Gly Gln 545 <210>2 <211>560 <212>PRT <213> 人工序列 <220>440 tct gac acc tac ggc Ser Asp Thr Tyr Gly 455 gcg tcc ggc ccg ggt Ala Ser Gly Pro Gly 470 cgt cct tct gac acc Arg Pro Ser Asp Thr 490 gca gct gcg tcc ggc Ala Ala Ala Ser Gly 505 ggt ggc cgt cct tct Gly Gly Arg Pro Ser 520 gcc gcg gca gct gcg Ala Ala Ala Ala Ala 535 ggc cag ggt ggc cgt Gly Gln Gly Gly Arg 5501392144014881536158416321680<223>″ R16 重复蛋白的基因″ <400>2 Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg Gly Ser Met Gly 1 5 10 15 Pro Gly Ser Ser Ala Ala Ala Ala Ala Ala Ala Ala Ser Gly Pro Gly19101855239 A CN 101855241序列表30 Pro Ser Asp Thr 45 Ala Ala Ser Gly Gly Arg Pro Ser 80 Ala Ala Ala Ala 95 Gln Gly Gly Arg 110 Ala Ala Ala Ala 125 Gln Gly Gln Gly Ala Ala Ala Ala 160 Gln Gly Gln Gly 175 Ser Ser Ala Ala 190 Gln Gly Gln Gly 205 Pro Gly Ser Ser Gln Gly Gln Gly 240 Tyr Gly Pro Gly 255 Pro Gly Gln Gly 270 Asp Thr Tyr Gly 285 Ser Gly Pro Gly Pro Ser Asp Thr 320 Ala Ala Ser Gly 3355/12 页20 Gln Gly Gln Gly Gln Gly Gln 35 Tyr Gly Pro Gly Ser Ser Ala 50 55 Pro Gly Gln Gly Gln Gly Gln 65 70 Asp Thr Tyr Gly Pro Gly Ser 85 Ser Gly Pro Gly Gln Gly Gln 100 Pro Ser Asp Thr Tyr Gly Pro 115 Ala Ala Ser Gly Pro Gly Gln 130 135 Gly Arg Pro Ser Asp Thr Tyr 145 150 Ala Ala Ala Ala Ser Gly Pro 165 Gln Gly Gly Arg Pro Ser Asp 180 Ala Ala Ala Ala Ala Ala Ser 195 Gln Gly Gln Gly Gly Arg Pro 210 215 Ala Ala Ala Ala Ala Ala Ala 225 230 Gln Gly Gln Gly Gln Gly Gly 245 Ser Ser Ala Ala Ala Ala Ala 260 Gln Gly Gln Gly Gln Gly Gln 275 Pro Gly Ser Ser Ala Ala Ala 290 295 Gln Gly Gln Gly Gln Gly Gln 305 310 Tyr Gly Pro Gly Ser Ser Ala 32525 Gly Gln Gly Gly Arg 40 Ala Ala Ala Ala Ala 60 Gly Gln Gly Gln Gly 75 Ser Ala Ala Ala Ala 90 Gly Gln Gly Gln Gly 105 Gly Ser Ser Ala Ala 120 Gly Gln Gly Gln Gly 140 Gly Pro Gly Ser Ser 155 Gly Gln Gly Gln Gly 170 Thr Tyr Gly Pro Gly 185 Gly Pro Gly Gln Gly 200 Ser Asp Thr Tyr Gly 220 Ala Ser Gly Pro Gly 235 Arg Pro Ser Asp Thr 250 Ala Ala Ala Ser Gly 265 Gly Gly Arg Pro Ser 280 Ala Ala Ala Ala Ala 300 Gly Gln Gly Gly Arg 315 Ala Ala Ala Ala Ala 33020101855239 A CN 101855241序列表Gly Gln Gly Gly Arg 350 Ala Ala Ala Ala Ala 365 Gly Gln Gly Gln Gly 380 Ser Ala Ala Ala Ala 395 Gly Gln Gly Gln Gly 410 Gly Ser Ser Ala Ala 430 Gly Gln Gly Gln Gly 445 Gly Pro Gly Ser Ser 460 Gly Gln Gly Gln Gly 475 Thr Tyr Gly Pro Gly 490 Gly Pro Gly Gln Gly 510 Ser Asp Thr Tyr Gly 525 Ala Ser Gly Pro Gly 540 Arg Pro Ser Asp Thr 555 Pro Ser Ala Ala Gly Arg Ala Ala 400 Gln Gly 415 Ala Ala Gln Gly Ala Ala Gln Gly 480 Ser Ser 495 Gln Gly Pro Gly Gln Gly Tyr Gly 5606/12 页Pro Gly Gln Gly 340 Asp Thr Tyr Gly 355 Ser Gly Pro Gly 370 Pro Ser Asp Thr 385 Ala Ala Ser Gly Gly Arg Pro Ser 420 Ala Ala Ala Ala 435 Gln Gly Gly Arg 450 Ala Ala Ala Ala 465 Gln Gly Gln Gly Ala Ala Ala Ala 500 Gln Gly Gln Gly 515 Ser Ser Ala Ala 530 Gln Gly Gln Gly 545 <210>3 <211>1920 <212>DNA <213> 人工序列 <220>Gln Gly Gln Gly Gln 345 Pro Gly Ser Ser Ala 360 Gln Gly Gln Gly Gln 375 Tyr Gly Pro Gly Ser 390 Pro Gly Gln Gly Gln 405 Asp Thr Tyr Gly Pro 425 Ser Gly Pro Gly Gln 440 Pro Ser Asp Thr Tyr 455 Ala Ala Ser Gly Pro 470 Gly Arg Pro Ser Asp 485 Ala Ala Ala Ala Ser 505 Gln Gly Gly Arg Pro 520 Ala Ala Ala Ala Ala 535 Gln Gly Gln Gly Gly 55021101855239 A CN 101855241序列表7/12 页<223>″ S16 重复蛋白的基因″ <220> <221>CDS <222>(1)..(1920) <223> <400>3 atg gct Met Ala 1 tct gcg Ser Ala ggc cgt Gly Arg cgt cct Arg Pro 50 ggt Gly 65 ccg Proagc atg act Ser Met Thr 5 gct gca gcc Ala Ala Ala 20 ccg tct gac Pro Ser Asp 35 tct tcc tct Ser Ser Serggt gga cag caa atg Gly Gly Gln Gln Met 10 gcg gca gct gcg ggt Ala Ala Ala Ala Gly 25 acc tac ggt gcg ccg Thr Tyr Gly Ala Pro 40 tac ggt tct gcg gct Tyr Gly Ser Ala Alaggt cgc gga tcc atg Gly Arg Gly Ser Met 15 ccg ggc ggt ggc aac Pro Gly Gly Gly Asn 30 ggt ggc ggt aac ggt Gly Gly Gly Asn Gly 45 gca gcc gcg gca gct Ala Ala Ala Ala Alaggt Gly ggt Gly ggc Gly gcg Ala4896144192ccg ggc ggt Pro Gly Gly ggt ggc ggt Gly Gly Glygct gca gcc gcg Ala Ala Ala Ala 100 ccg tct gac acc Pro Ser Asp Thr 115 tct tcc tct tac Ser Ser Ser Tyr 130 ggc ggt ggc aac Gly Gly Gly Asn55 ggc aac ggt ggc cgt Gly Asn Gly Gly Arg 70 aac ggt ggc cgt cct Asn Gly Gly Arg Pro 85 gca gct gcg ggt ccg Ala Ala Ala Gly Pro 105 tac ggt gcg ccg ggt Tyr Gly Ala Pro Gly 120 ggt tct gcg gct gca Gly Ser Ala Ala Ala 135 ggt ggc cgt ccg tct Gly Gly Arg Pro Ser2260 ccg tct gac acc tac Pro Ser Asp Thr Tyr 75 tct tcc tct tac ggt Ser Ser Ser Tyr Gly 90 ggc ggt ggc aac ggt Gly Gly Gly Asn Gly 110 ggc ggt aac ggt ggc Gly Gly Asn Gly Gly 125 gcc gcg gca gct gcg Ala Ala Ala Ala Ala 140 gac acc tac ggt gcg Asp Thr Tyr Gly Alaggt gcg Gly Ala 80 tct gcg Ser Ala 95 ggc cgt Gly Arg cgt cct Arg Pro ggt ccg Gly Pro ccg ggt Pro Gly240288336384432480101855239 A CN 101855241序cgt cct tct Arg Pro Ser ggt ccg ggc Gly Pro Gly ccg ggt ggc Pro Gly Gly 200 gct gca gcc Ala Ala Ala 215 ccg tct gac Pro Ser Asp 230 tct tcc tct Ser Ser Ser ggc ggt ggc Gly Gly Gly ggc ggt aac Gly Gly Asn 280 gcc gcg gca Ala Ala Ala 295 gac acc tac Asp Thr Tyr 310 tct tac ggt Ser Tyr Gly ggc aac ggt Gly Asn Gly aac ggt ggc Asn Gly Gly列表160 gcg gct gca Ala Ala Ala 175 cgt ccg tct Arg Pro Ser 190 cct tct tcc Pro Ser Ser ccg ggc ggt Pro Gly Gly ggt ggc ggt Gly Gly Gly 240 gca gcc gcg Ala Ala Ala 255 tct gac acc Ser Asp Thr 270 tcc tct tac Ser Ser Tyr ggt ggc aac Gly Gly Asn ggt aac ggt Gly Asn Gly 320 gcg gca gct Ala Ala Ala 335 acc tac ggt Thr Tyr Gly 350 tac ggt tct Tyr Gly Ser8/12 页145 150 ggc ggt aac ggt ggc Gly Gly Asn Gly Gly 165 gcc gcg gca gct gcg Ala Ala Ala Ala Ala 180 gac acc tac ggt gcg Asp Thr Tyr Gly Ala 195 tct tac ggt tct gcg Ser Tyr Gly Ser Ala 210 ggc aac ggt ggc cgt Gly Asn Gly Gly Arg 225 aac ggt ggc cgt cct Asn Gly Gly Arg Pro 245 gca gct gcg ggt ccg Ala Ala Ala Gly Pro 260 tac ggt gcg ccg ggt Tyr Gly Ala Pro Gly 275 ggt tct gcg gct gca Gly Ser Ala Ala Ala 290 ggt ggc cgt ccg tct Gly Gly Arg Pro Ser 305 ggc cgt cct tct tcc Gly Arg Pro Ser Ser 325 gcg ggt ccg ggc ggt Ala Gly Pro Gly Gly 340 gcg ccg ggt ggc ggt Ala Pro Gly Gly Gly155 tcc tct tac ggt tct Ser Ser Tyr Gly Ser 170 ggt ggc aac ggt ggc Gly Gly Asn Gly Gly 185 ggt aac ggt ggc cgt Gly Asn Gly Gly Arg 205 gcg gca gct gcg ggt Ala Ala Ala Ala Gly 220 acc tac ggt gcg ccg Thr Tyr Gly Ala Pro 235 tac ggt tct gcg gct Tyr Gly Ser Ala Ala 250 aac ggt ggc cgt ccg Asn Gly Gly Arg Pro 265 ggt ggc cgt cct tct Gly Gly Arg Pro Ser 285 gct gcg ggt ccg ggc Ala Ala Gly Pro Gly 300 ggt gcg ccg ggt ggc Gly Ala Pro Gly Gly 315 tct gcg gct gca gcc Ser Ala Ala Ala Ala 330 ggc cgt ccg tct gac Gly Arg Pro Ser Asp 345 cgt cct tct tcc tct Arg Pro Ser Ser Ser23528576624672720768816864912960100810561104101855239 A CN 101855241序列表365 ggc ggt ggc aac ggt Gly Gly Gly Asn Gly 380 ggc ggt aac ggt ggc Gly Gly Asn Gly Gly 395 gcc gcg gca gct gcg Ala Ala Ala Ala Ala 415 gac acc tac ggt gcg Asp Thr Tyr Gly Ala 430 tct tac ggt tct gcg Ser Tyr Gly Ser Ala 445 ggc aac ggt ggc cgt Gly Asn Gly Gly Arg 460 aac ggt ggc cgt cct Asn Gly Gly Arg Pro 475 gca gct gcg ggt ccg Ala Ala Ala Gly Pro 495 tac ggt gcg ccg ggt Tyr Gly Ala Pro Gly 510 ggt tct gcg gct gca Gly Ser Ala Ala Ala 525 ggt ggc cgt ccg tct Gly Gly Arg Pro Ser 540 ggc cgt cct tct tcc Gly Arg Pro Ser Ser 555 gcg ggt ccg ggc ggt Ala Gly Pro Gly Gly ggc Gly cgt Arg 400 ggt Gly ccg Pro gct Ala ccg Pro tct Ser 480 ggc Gly ggc Gly gcc Ala gac Asp tct Ser 560 ggc Gly9/12 页355 gcg gct gca gcc gcg Ala Ala Ala Ala Ala 370 cgt ccg tct gac acc Arg Pro Ser Asp Thr 385 cct tct tcc tct tac Pro Ser Ser Ser Tyr 405 ccg ggc ggt ggc aac Pro Gly Gly Gly Asn 420 ggt ggc ggt aac ggt Gly Gly Gly Asn Gly 435 gca gcc gcg gca gct Ala Ala Ala Ala Ala 450 tct gac acc tac ggt Ser Asp Thr Tyr Gly 465 tcc tct tac ggt tct Ser Ser Tyr Gly Ser 485 ggt ggc aac ggt ggc Gly Gly Asn Gly Gly 500 ggt aac ggt ggc cgt Gly Asn Gly Gly Arg 515 gcg gca gct gcg ggt Ala Ala Ala Ala Gly 530 acc tac ggt gcg ccg Thr Tyr Gly Ala Pro 545 tac ggt tct gcg gct Tyr Gly Ser Ala Ala360 gca gct gcg ggt ccg Ala Ala Ala Gly Pro 375 tac ggt gcg ccg ggt Tyr Gly Ala Pro Gly 390 ggt tct gcg gct gca Gly Ser Ala Ala Ala 410 ggt ggc cgt ccg tct Gly Gly Arg Pro Ser 425 ggc cgt cct tct tcc Gly Arg Pro Ser Ser 440 gcg ggt ccg ggc ggt Ala Gly Pro Gly Gly 455 gcg ccg ggt ggc ggt Ala Pro Gly Gly Gly 470 gcg gct gca gcc gcg Ala Ala Ala Ala Ala 490 cgt ccg tct gac acc Arg Pro Ser Asp Thr 505 cct tct tcc tct tac Pro Ser Ser Ser Tyr 520 ccg ggc ggt ggc aac Pro Gly Gly Gly Asn 535 ggt ggc ggt aac ggt Gly Gly Gly Asn Gly 550 gca gcc gcg gca gct Ala Ala Ala Ala Ala241152120012481296134413921440148815361584163216801728101855239 A CN 101855241序列表575 ggt ggc ggt aac Gly Gly Gly Asn 590 gca gcc gcg gca Ala Ala Ala Ala 605 tct gac acc tac Ser Asp Thr Tyr tcc tct tac ggc Ser Ser Tyr Gly 64010/12 页aac ggt Asn Gly ggt ggc Gly Gly gct gcg Ala Ala 610 ggt gcg Gly Ala 625 <210>4 <211>640 <212>PRT565 ggc cgt ccg tct gac Gly Arg Pro Ser Asp 580 cgt cct tct tcc tct Arg Pro Ser Ser Ser 595 ggt ccg ggc ggt ggc Gly Pro Gly Gly Gly 615 ccg ggt ggc ggt aac Pro Gly Gly Gly Asn 630570 acc tac ggt gcg ccg Thr Tyr Gly Ala Pro 585 tac ggt tct gcg gct Tyr Gly Ser Ala Ala 600 aac ggt ggc cgt ccg Asn Gly Gly Arg Pro 620 ggt ggc cgt cct tct Gly Gly Arg Pro Ser 6351776182418721920<213> 人工序列 <220> <223>″ S16 重复蛋白的基因″ <400>4 Met Ala Ser Met Thr 1 5 Ser Ala Ala Ala Ala 20 Gly Arg Pro Ser Asp 35 Arg Pro Ser Ser Ser 50 Gly Pro Gly Gly Gly 65 Pro Gly Gly Gly Asn 85 Gly Gly Gln Gln Met 10 Ala Ala Ala Ala Gly 25 Thr Tyr Gly Ala Pro 40 Tyr Gly Ser Ala Ala 55 Asn Gly Gly Arg Pro 70 Gly Gly Arg Pro Ser 9025Gly Arg Gly Ser Met 15 Pro Gly Gly Gly Asn 30 Gly Gly Gly Asn Gly 45 Ala Ala Ala Ala Ala 60 Ser Asp Thr Tyr Gly 75 Ser Ser Tyr Gly Ser 95Gly Gly Gly Ala Ala 80 Ala101855239 A CN 101855241序列表Gly Gly Gly Asn Gly 110 Gly Gly Asn Gly Gly 125 Ala Ala Ala Ala Ala 140 Asp Thr Tyr Gly Ala 155 Ser Tyr Gly Ser Ala 170 Gly Asn Gly Gly Arg 190 Asn Gly Gly Arg Pro 205 Ala Ala Ala Gly Pro 220 Tyr Gly Ala Pro Gly 235 Gly Ser Ala Ala Ala 250 Gly Gly Arg Pro Ser 270 Gly Arg Pro Ser Ser 285 Ala Gly Pro Gly Gly 300 Ala Pro Gly Gly Gly 315 Ala Ala Ala Ala Ala 335 Arg Pro Ser Asp Thr 350 Pro Ser Ser Ser Tyr 365 Pro Gly Gly Gly Asn 380 Gly Gly Gly Asn Gly 395 Ala Ala Ala Ala Ala Gly Arg Arg Pro Gly Pro Pro Gly 160 Ala Ala 175 Pro Ser Ser Ser Gly Gly Gly Gly 240 Ala Ala 255 Asp Thr Ser Tyr Gly Asn Asn Gly 320 Ala Ala Tyr Gly Gly Ser Gly Gly Gly Arg 400 Ala Gly11/12 页Ala Ala Ala Ala 100 Pro Ser Asp Thr 115 Ser Ser Ser Tyr 130 Gly Gly Gly Asn 145 Gly Gly Asn Gly Ala Ala Ala Ala 180 Asp Thr Tyr Gly 195 Ser Tyr Gly Ser 210 Gly Asn Gly Gly 225 Asn Gly Gly Arg Ala Ala Ala Gly 260 Tyr Gly Ala Pro 275 Gly Ser Ala Ala 290 Gly Gly Arg Pro 305 Gly Arg Pro Ser 325 Ala Gly Pro Gly 340 Ala Pro Gly Gly 355 Ala Ala Ala Ala 370 Arg Pro Ser Asp 385 Pro Ser Ser SerAla Ala Ala Gly Pro 105 Tyr Gly Ala Pro Gly 120 Gly Ser Ala Ala Ala 135 Gly Gly Arg Pro Ser 150 Gly Arg Pro Ser Ser 165 Ala Gly Pro Gly Gly 185 Ala Pro Gly Gly Gly 200 Ala Ala Ala Ala Ala 215 Arg Pro Ser Asp Thr 230 Pro Ser Ser Ser Tyr 245 Pro Gly Gly Gly Asn 265 Gly Gly Gly Asn Gly 280 Ala Ala Ala Ala Ala 295 Ser Asp Thr Tyr Gly 310 Ser Ser Tyr Gly Ser 330 Gly Gly Asn Gly Gly 345 Gly Asn Gly Gly Arg 360 Ala Ala Ala Ala Gly 375 Thr Tyr Gly Ala Pro 390 Tyr Gly Ser Ala Ala26101855239 A CN 101855241序列表415 Gly Ala Pro 430 Ser Ala Ala Gly Arg Pro 460 Arg Pro Ser 480 Gly Pro Gly 495 Pro Gly Gly 510 Ala Ala Ala Pro Ser Asp Ser Ser Ser 56012/12 页Pro Gly Ala Ser 465 Ser Gly Gly Ala Thr 545 Tyr Asn Gly Ala Gly 625405 Gly Gly Gly Asn Gly Gly Arg 420 Gly Gly Asn Gly Gly Arg Pro 435 440 Ala Ala Ala Ala Ala Gly Pro 450 Asp Thr Tyr Gly Ala Pro Gly 470 Ser Tyr Gly Ser Ala Ala Ala 485 Gly Asn Gly Gly Arg Pro Ser 500 Asn Gly Gly Arg Pro Ser Ser 515 520 Ala Ala Ala Gly Pro Gly Gly 530 535 Tyr Gly Ala Pro Gly Gly Gly 550 Gly Ser Ala Ala Ala Ala Ala 565 Gly Gly Arg Pro Ser Asp Thr 580 Gly Arg Pro Ser Ser Ser Tyr 595 600 Ala Gly Pro Gly Gly Gly Asn 610 615 Ala Pro Gly Gly Gly Asn Gly 630410 Pro Ser Asp Thr Tyr 425 Ser Ser Ser Tyr Gly 445 Gly Gly Gly Asn Gly 455 Gly Gly Asn Gly Gly 475 Ala Ala Ala Ala Ala 490 Asp Thr Tyr Gly Ala 505 Ser Tyr Gly Ser Ala 525 Gly Asn Gly Gly Arg 540 Asn Gly Gly Arg Pro 555 Ala Ala Ala Gly Pro 570 Tyr Gly Ala 585 Gly Ser Ala Gly Gly Arg Gly Arg Pro 635Gly Gly Gly 575 Pro Gly Gly Gly Asn 590 Ala Ala Ala Ala Ala 605 Pro Ser Asp Thr Tyr 620 Ser Ser Ser Tyr Gly 640

合成的重复蛋白及其生产和用途.pdf_第1页
第1页 / 共32页
合成的重复蛋白及其生产和用途.pdf_第2页
第2页 / 共32页
合成的重复蛋白及其生产和用途.pdf_第3页
第3页 / 共32页
点击查看更多>>
资源描述

《合成的重复蛋白及其生产和用途.pdf》由会员分享,可在线阅读,更多相关《合成的重复蛋白及其生产和用途.pdf(32页珍藏版)》请在专利查询网上搜索。

具有重复单元的重复蛋白,包含共有序列(I)X1X2X3X4SX5X6YG其中X1是G、Y、A或NX2是G、L、QX3是R、K、T或PX4是P、A、T或SX5是D、T或SX6是S、Q或T,和共有序列(II)Z1Z2(Z3A)nZ4Z5Z6其中Z1是S、Q、N、T或GZ2不是氨基酸或为AZ3是A或GZ4为不是氨基酸、为A或SZ5是G、S、Q、N或TZ6是G、P、S、Q、N或Tn是天然的整数,其中2n1。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 化学;冶金 > 有机化学〔2〕


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1