流感病毒神经氨酸酶晶体结构和其用途.pdf

摘要
申请专利号：	CN200780025141.7	申请日：	2007.06.06
公开号：	CN101496014A	公开日：	2009.07.29
当前法律状态：	撤回	有效性：	无权
法律详情：	发明专利申请公布后的视为撤回IPC(主分类):G06F 19/00公开日:20090729\|\|\|实质审查的生效\|\|\|公开
IPC分类号：	G06F19/00; C07K14/11; C12N9/36	主分类号：	G06F19/00
申请人：	医疗研究局
发明人：	史蒂文·约翰·甘姆波林; 艾伦·詹姆士·海; 约翰·詹姆士·斯格海尔; 莱斯利·芬德利·海瑞; 大卫·约翰·史蒂文斯; 鲁珀特·拉塞尔; 帕特里克·詹姆士·柯林斯; 林一普; 乔治·迈克尔·布莱克伯恩
地址：	英国伦敦
优先权：	2006.6.6 GB 0611136.3
专利代理机构：	北京英赛嘉华知识产权代理有限责任公司	代理人：	王达佐;韩克飞
PDF下载：	PDF下载

内容摘要

本发明涉及流感病毒神经氨酸酶蛋白晶体及其结构和其用途。

权利要求书

1.  用于分析分子结构与N1组神经氨酸酶结构的相互作用的基于计算机的方法，所述方法包括：
提供来自表1至3中的任一表的N1组神经氨酸酶结构或其选择的坐标，任选地在不超过的Cα原子的均方根偏差内变化；
提供欲与所述N1组神经氨酸酶结构或其选择的坐标匹配的分子结构；以及
将所述分子结构与所述N1组神经氨酸酶结构匹配。

2.  如权利要求1所述的方法，其中所述选择的坐标包括来自如下一个或多个残基的原子：Glu-119、Val-149、Asp-151、Arg-156、Arg-224、Tyr-252、His-274、GIu-276、Arg-292、Tyr-347和Arg-371。

3.  如权利要求1或2所述的方法，其还包括下述步骤：
获得或合成具有所述分子结构的化合物；以及
将所述化合物与N1组神经氨酸酶蛋白接触以确定所述化合物与N1组神经氨酸酶相互作用的能力。

4.  如权利要求1或2所述的方法，其还包括下述步骤：
获得或合成具有所述分子结构的化合物；
形成N1组神经氨酸酶蛋白与所述化合物的复合物；以及
通过X-射线晶体学分析所述复合物以确定所述化合物与N1组神经氨酸酶相互作用的能力。

5.  如权利要求1所述的方法，其还包括下述步骤：
获得或合成具有分子结构的化合物；以及
确定或预测所述化合物如何与所述N1组神经氨酸酶结构相互作用；以及
修饰所述化合物结构以改变它与N1组神经氨酸酶间的相互作用。

6.  化合物，其具有使用权利要求6所述的方法鉴定的修饰的结构。

7.  如前述权利要求中的任一项所述的方法，其中所选择的坐标是至少5、10、50、100、500或1000个原子。

8.  如前述权利要求中的任一项所述的方法，其中表1至3中任一表中所述选择的坐标代表残基147-152的每一个的至少一个侧链原子。

9.  如权利要求8所述的方法，其中所述选择的坐标还包括选自Glu-119、Glu-276和Tyr-347的氨基酸的至少一个侧链残基。

10.  确定结合到N1组神经氨酸酶蛋白的化合物的结构的方法，所述方法包括：
提供所述N1组神经氨酸蛋白的晶体；
将所述晶体与所述化合物浸泡以形成复合物；以及
通过应用来自表1至3中任一表的数据或其选择的坐标来确定所述复合物的结构，所述数据任选地在不超过的Cα原子的均方根偏差内变化。

11.  确定结合到N1组神经氨酸酶蛋白的化合物的结构的方法，所述方法包括：
将N1组神经氨酸酶蛋白与所述化合物混合；
结晶蛋白-化合物复合物；以及
通过应用来自表1至3中任一表的数据或其选择的坐标来确定所述复合物的结构，所述数据任选地在不超过的Cα原子的均方根偏差内变化。

12.  提供数据的方法，所述数据用于产生结构和/或进行与N1组神经氨酸酶蛋白相互作用的化合物的最优化，所述方法包括：
(i)建立与远程装置的通信，所述远程装置包含：
(a)计算机可读的数据，其包括来自表1至3中任一表的N1组神经氨酸酶结构或其选择的坐标，任选地在不超过的Cα原子的均方根偏差内变化；以及
(ii)从所述远程装置接受所述计算机可读的数据。

13.  如权利要求12所述的方法，其还包括用所述数据实施权利要求1至11中的任一项的方法。

14.  N1组神经氨酸酶蛋白的晶体。

15.  N1组神经氨酸酶蛋白和配体的共晶体。

16.  如权利要求15所述的共晶体，其中所述配体选自奥塞米韦、扎那米韦、DANA和帕拉米韦，或者其衍生物。

17.  如权利要求14至16中的任一项所述的晶体或共晶体，其中所述N1组神经氨酸酶蛋白选自N1、N4和N8。

18.  如权利要求14至17中的任一项所述的晶体或共晶体，其中所述神经氨酸酶N1组蛋白是SEQ ID NO：1的残基62-449的N1蛋白或是其具有1至10个氨基酸替换、删除或插入的变异体。

19.  如权利要求14至18中的任一项所述的晶体或共晶体，其中所述神经氨酸酶N1组蛋白是具有C-正交空间群C222₁的N1蛋白。

20.  如权利要求19所述的晶体或共晶体，其晶胞大小为α＝90β＝90γ＝90，所有尺度的晶胞变异率为5％。

21.  如权利要求14至17中的任一项所述的晶体或共晶体，其中所述神经氨酸酶N1组蛋白是SEQ ID NO：2的残基79-470的N4蛋白或是其具有1至10个氨基酸替换、删除或插入的变异体。

22.  如权利要求14至17中的任一项或权利要求21所述的晶体或共晶体，其中所述神经氨酸酶N1组蛋白是具有立方空间群P432或I432的N4蛋白。

23.  如权利要求22所述的晶体或共晶体，其晶胞大小为所有尺度的晶胞变异率为5％。

24.  如权利要求14至17中的任一项所述的晶体或共晶体，其中所述神经氨酸酶N1组蛋白是SEQ ID NO：3的残基73-470的N8蛋白，或是其具有1至10个氨基酸替换、删除或插入的变异体。

25.  如权利要求14至17中的任一项或权利要求23所述的晶体或共晶体，其中所述神经氨酸酶N1组蛋白是具有四方空间群I4的N8蛋白。

26.  如权利要求25所述的晶体或共晶体，其晶胞大小为α＝90β＝90γ＝90，且所有尺度的晶胞变异率为5％。

27.  N8与帕拉米韦的共晶体，其具有四方空间群I4，晶胞大小为a＝b＝89.78，c＝93.23，且所有尺度的晶胞变异率为5％。

说明书

流感病毒神经氨酸酶晶体结构和其用途
发明领域
本发明涉及流感病毒神经氨酸酶蛋白晶体及其结构和其用途。
发明背景
流感病毒
A型流感病毒是毒力能够变化的RNA病毒。流感病毒的两种主要表面糖蛋白是血凝素(HA)和神经氨酸酶(NA)。HA介导细胞表面的唾液酸受体结合以启动病毒感染。病毒复制后，NA移除病毒和细胞糖蛋白上的唾液酸以促进病毒释放以及促进感染向新细胞的传播。使用不同的HA和NA分子的独特的抗原性将A型流感病毒分为如下亚型：根据HA分为16种亚型(H1-H16)，根据NA分为9种亚型(N1-N9)。在禽类发现了HA和NA亚型的不同组合，二十世纪发生在人类的三次大范围的流行在1918年由含有H1N1的病毒、在1957年由含有H2N2的病毒以及在1968年由含有H3N2的病毒导致。N1和N2 NAs属于系统发育明显不同的组，组-1包含N1、N4、N5和N8亚型，而组-2包含N2、N3、N6、N7和N9。
NA已经在基于结构的酶抑制剂设计程序中被作为靶点，并已经产生了两种药物：Relenza(扎那米韦(zanamivir))和达菲(Tamiflu)(奥塞米韦(oseltamivir))。这些开发的成功部分归因于酶的催化部位是可以被用于独立于亚型的治疗的不变特征的提议，以及它们是相对刚性的，在抑制剂结合部位只有较小的构象变化的观测。支持这些结论的X-射线晶体学结构信息仅可用于组-2 NA的N2和N9，但组-1酶的活性部位会是相似的这一概念受到更远关系的B型流感NA的结构与组-2酶的结构相似的观测支持。然而，用达菲治疗感染包含不同NA亚型的病毒的人类后，产生了不同的耐药NA突变病毒。也有抑制剂结构/活性关系不适用于跨亚型的指征。
禽流感病毒的高致病形式，H5N1，在二十世纪末出现在远东地区，且其在全球范围内的持续传播已引起恐慌，该病毒可能获得了其在人类之间有效传播所需的遗传改变，引发新的大范围流行。在有效的疫苗开发之前，缓解这种爆发的影响的主要希望寄于NA的抑制剂。
发明公开
本发明涉及三种N1组NA，即N1、N4和N8的晶体和晶体结构。已经发现，尽管这三种蛋白的活性部位彼此基本相似，但在这些活性部位和N2组的NA成员的活性部位之间存在显著的构象差异。这些差异导致N1组的神经氨酸酶的结合袋的变化，从基于目前可用的组-2NA结构的同源建模(homology modelling)(或使用相似的技术)来看，这些变化并不明显。
更具体地，本发明人已经获得了N1、N4和N8的脱辅基晶体，以及这些蛋白与一个或多个NA抑制剂的共结晶体。因而，一方面，本发明提供了表1至4中任一表中列出的N1组神经氨酸酶的三维结构和其用途，本文下面还描述了表1至3中任一表中列出的N1组神经氨酸酶的三维结构。
因而，本文提及的表1至3的结构或表1至3中的任一表中的结构包括独立的表1、2和3。
在总的方面，本发明与N1组神经氨酸酶结构的提供及其在建模分子结构的相互作用中的用途有关，例如，具有该结构的潜在和已存在的药学上的化合物(包括前药、抑制剂或底物)，或这样的化合物的片段。
下文讨论了本发明的这些和其它方面及实施方案。
附表简述
表1(图1)列出了神经氨酸酶N1的结构的坐标数据。
表2(图2)列出了神经氨酸酶N4的结构的坐标数据。
表3(图3)列出了神经氨酸酶N8的结构的坐标数据。
附图简述
图1如表1所示。
图2如表2所示。
图3如表3所示。
图4是图1-3的N1、N4和N8蛋白的比对，根据表1-3使用的共有编号系统编号。该共有编号包括命名为A、B等的残基169、330、342和412后的插入，以使在插入后连续的编号(170，331，343，413)继续。其共有编号是10的倍数的残基由比对上方的星号指示。本文提及的氨基酸数目是比对的编号，而不是个别序列SEQ ID NO：1、2和3的数目，除非有明确相反的说明。
图5显示了N1(深灰)和N9(浅灰)NA的活性部位的重叠。诸如Glu-276，Glu-119，Asp-151的残基以及采用组1和组2之间的不同构象的149位的疏水残基以棒状表示法显示。
序列简述
SEQ ID NO：1是用于产生晶体的N1神经氨酸酶的序列。所述蛋白从61位后裂解，以使所述晶体的第一个氨基酸是SEQ ID NO：1的Ser62。
SEQ ID NO：2是用于产生晶体的N4神经氨酸酶的序列。所述蛋白从78位后裂解，以使所述晶体的第一个氨基酸是SEQ ID NO：2的Ser79。
SEQ ID NO：3是用于产生晶体的N8神经氨酸酶。该蛋白从72位后裂解，以使所述晶体的第一个氨基酸是SEQ ID NO：3的Tyr73。
发明详述
A.蛋白晶体
本发明提供了N1组神经氨酸酶蛋白的晶体。所用“N1组神经氨酸酶蛋白”是指A型流感病毒神经氨酸酶蛋白的N1组成员。这些是N1、N4、N5和N8蛋白。
来自三种野生型病毒的N1、N4和N8蛋白的序列分别如SEQ IDNOs：1-3所示。
为了产生晶体，通过本领域已知的手段分离所述蛋白，所述手段包括如附随的实施例描述的那样将该蛋白从实验室生长的病毒表面裂解。这导致了所述蛋白在N-末端区的裂解，以使被结晶的SEQ ID NOs：1-3的实际部分如上面“序列简述”部分所说明的那样。
可选择地，所述蛋白可以被重组产生并以类似的方式加工以提供相同体积和形式的晶体。
A型流感病毒具有RNA基因组，且已知自然界存在N1至N4蛋白的变异体。可以修饰SEQ ID NO：1-3的序列以反映在自然界发现的该型的变异体，所述变异体的晶体也在本发明的范围之内。已知对于许多蛋白，可以对一级氨基酸序列进行限定数量的变化，而基本上不改变蛋白结晶的能力。因此，例如1至10个，诸如1至7个，例如多达1、2、3、4、5或6个氨基酸可以被替换、删除或插入以形成SEQID NOs：1-3序列的晶体形成部分，而不改变晶体大小或晶型，或基本上不改变晶体形成的条件。
其中所述替换、删除或插入发生在如在图4的比对中所示的N1、N4和N8蛋白所有三者之间非保守的(也就是三个序列中的至少一个是不同的)位置尤其如此。因此，本发明的一个方面扩展到晶体，其中一个或多个(优选如上所说明的)替换、删除或插入发生在N1组蛋白的非保守位置。因而提及的N1组神经氨酸酶蛋白(且特别是N1、N4或N8蛋白)应被理解为包括这种变异。
本发明的晶体可以是脱辅基晶体或如上所说明的N1组神经氨酸酶蛋白与配体的共晶体。因此在另一方面，本发明提供了N1组神经氨酸酶蛋白与配体的共晶体，所述配体诸如选自奥塞米韦、扎那米韦、DANA(2-脱氧-2，3-双脱氢-N-乙酰神经氨酸)和帕拉米韦(peramivir)或其衍生物的化合物。
可选择地，所述配体可以是与N1组神经氨酸酶蛋白的相互作用未知的化合物。
这种共晶体可以由共结晶或浸泡获得。产生晶体或共晶体的方法在附随的实施例中进一步被说明。
本文描述的方法学可以被广泛用于提供在至少且优选至少约2.2至的分辨率时可分辨的N1组神经氨酸酶蛋白晶体。
因此，本发明还提供了具有至少优选至少的分辨率的N1组神经氨酸酶蛋白晶体。
在更为具体的实施方案中，本发明提供了具有C-正交空间群C222₁和晶胞大小为a＝201.74，b＝201.51，c＝212.43，且在所有方位的晶胞变异率为5％的N1晶体。
在另一个实施方案中，本发明涉及具有上述提及的空间群和晶胞大小的N1与配体的共晶体。这种共晶体的特定实施方案是具有C-正交空间群C222₁和晶胞大小为a＝200.62，b＝200.70，c＝210.48的N1与奥塞米韦的共晶体。
N1蛋白优选是SEQ ID NO：1的62-449残基或其具有1至10个氨基酸替换、删除或插入的变异体。
在另一实施方案中，本发明提供了具有立方空间群P432和晶胞大小为且在所有方位的晶胞的变异率为5％的N4晶体。
在另外的实施方案中，本发明提供了具有立方空间群I432及晶胞大小为且在所有方位的晶胞变异率为5％的N4与配体的共晶体。特定的配体是DANA。
N4蛋白可以是SEQ ID NO：2的79-470残基的蛋白或其具有1至10个氨基酸替换、删除或插入的变异体。
在另一方面，本发明提供了具有四方空间群I4的N8晶体，其晶胞大小为α＝90β＝90γ＝90，且在所有尺度的晶胞变异率为5％。
在另一实施方案中，本发明涉及具有上述提及的空间群及晶胞大小的N8和配体的共晶体。这种共晶体的实施方案是具有四方空间群I4及具有晶胞大小a＝b＝90.38，c＝111.49的N8与DANA的共晶体；具有四方空间群I4及具有晶胞大小a＝b＝90.58，c＝110.78或a＝b＝90.42，c＝109.71的N8与奥塞米韦的共晶体；以及具有四方空间群I4及具有晶胞大小a＝b＝90.41，c＝109.30的N8与扎那米韦的共晶体。所有所述的共晶体在所有尺度都具有5％的晶胞变异率。
本发明也提供了N8与帕拉米韦的共晶体，其具有四方空间群I4及具有晶胞大小a＝b＝89.78，c＝93.23，且在所有尺度的晶胞变异率为5％。
N8蛋白可以是SEQ ID NO：3的残基73-470或其具有1至10个氨基酸替换、删除或插入的变异体。
B.晶体坐标
在另一方面，本发明也提供了N1组神经氨酸酶蛋白的晶体，其具有表1至3的任一表中的三维原子坐标。
由表1和表1至3的原子坐标确定的结构的有利特征是它们具有高于约的分辨率。
表1至3的N1组神经氨酸酶蛋白结构的另外优点是它们是未结合配体的脱辅基结构。这使它们尤其适合浸泡于配体，并因此确定共复合物结构，因为没有来自配体的构象偏差，这对于建模目的也是理想的。
表1至3分别给出了N1组神经氨酸酶蛋白N1、N4和N8的原子坐标数据。在这些表中，第3列代表原子的名称，第4列是残基类型，第5列是链的标识，第6列是残基的数目(与图4比对有关的原子编号)，第7、8和9列分别是正在谈论的原子的X、Y、Z坐标，第10列代表原子的占位，第11列是原子的温度因子，第12列是链的标识符。
每一表还包括命名为″TIP″的众多水分子；命名为″NAG 146x″的通过N-连接与146位天冬酰胺连接的N-乙酰D-葡糖胺簇，其中x是对应于与其连接的蛋白链标识符的字母；以及与每一条链结合的钙离子。
表1至3以内部一致的格式显示。例如(除了表1和2的第一个残基)，这样列出了每一个氨基酸残基的原子坐标：骨架氮原子是第一个，随后是C-α骨架碳原子，命名为CA，接着是侧链残基(根据一个标准惯例命名)，最后是蛋白骨架的碳和氧。可选择的文件格式(例如，诸如与EBI大分子结构数据库(Hinxton，UK)的格式一致的格式)可以由本领域其他技术人员使用或优选，所述文件格式可以包括这些原子不同的排序，或侧链残基不同的命名。然而显而易见的是，使用不同文件格式呈现或处理表的坐标在本发明的范围之内。
表1包括N1蛋白的8个蛋白单位，表2包括2个N4蛋白单位。在本文描述的使用本发明的晶体结构的本发明的实施方案中，应该明白提及的“N1组神经氨酸酶结构”应该被解释为任一独立蛋白链的结构。多于两个单位的使用(或在N1的情况下)并不被排除，但对于实践本发明不是必需的。同样，提及的“N1组神经氨酸酶结构”不包括溶剂、糖或钙离子坐标，尽管如果这些坐标对本发明的特定申请是有益的或必需的，并不排除其使用。
蛋白结构相似性通常通过均方根偏差(r.m.s.d.)表达或测量，其测量两套原子空间定位差异。r.m.s.d.测量等价原子最佳重叠后，它们的间距。可以计算所有原子、残基骨架原子(即蛋白氨基酸残基的氮-碳-碳骨架原子)、仅主链原子(即蛋白氨基酸残基的氮-碳-氧-碳骨架原子)、仅侧链原子或更通常仅C-α原子的r.m.s.d.。为了实现本发明的目的，使用下面所列的任一种方法，可以计算这些中的任一种的r.m.s.d.。
优选地，可以通过参照C-α原子计算rmsd，前提是如果使用了选择的坐标，且这些坐标包括至少约5％，优选至少约10％的这种原子。如果所选择的坐标不包括所述的至少约5％C-α原子，可以通过参照所有四个骨架原子计算rmsd，前提是这些包括至少约10％，优选至少约20％且更优选至少约30％的所选择的坐标。如果所选择的坐标包括90％或更多的侧链原子，可以通过参照所有选择的坐标来计算rmsd。
因此，表1至3的坐标提供了原子位置的量度，以给出3个小数位的埃表示。所述坐标是一套确定三维形状的相对位置，但技术人员会理解，具有不同原点和/或轴的完全不同套的坐标能够确定相似或相同的形状。此外，技术人员会理解，当表1至3中提供的残基骨架原子坐标重叠时，改变所述结构的原子的相对原子位置使残基骨架原子(即，蛋白氨基酸残基的氮-碳-碳骨架原子)的均方根偏差小于优选小于更优选小于更优选小于诸如小于或小于且最优选小于通常会导致在其结构的特征和N1组神经氨酸酶蛋白的基于结构的分析的有效性以及其与分子结构的相互作用方面与表1至3的结构基本相同的结构。
同样，技术人员会理解，改变表中水分子的数目和/或位置通常不会影响用于N1组神经氨酸酶蛋白相互作用结构的基于结构分析的结构的有效性。因此对于本文描述的作为本发明方面的目的，下述在本发明的范围之内：如果表1至3的任一表中的坐标调换到不同的原点和/或轴；当表1至3中的任一表提供的残基骨架原子坐标重叠时，改变该结构的原子的相对原子位置以使残基骨架原子的均方根偏差低于优选低于更优选低于更优选低于诸如低于或低于且最优选低于和/或改变水分子的数目和/或位置。
就表1和表2而言，如果所述晶体形式分别包括8个N1和N4的拷贝，可以仅使用该蛋白的任一拷贝进行rmsd的计算。
因而本文提及的表1至3中的或来自表1至3的坐标数据、其用途等等包括坐标数据，其中表中的一个或多个单独的值以该方式变化，且将被理解为表示同样的意义，除非有相反的明确规定。
确定rmsd的程序包括MNYFIT(称为COMPOSER的程序库的部分，Sutcliffe，M.J.，Haneef，I.，Carney，D.和Blundell，T.L.(1987)，ProteinEngineering(蛋白质工程)，1，377-384)，MAPS(Lu，G.An Approach forMultiple Alignment of Protein Structures(蛋白结构多重比对的方法)(1998，以原稿形式在http://bioinfol.mbfys.lu.se/TOP/maps.html))。
通常考虑C-α原子，然后使用诸如LSQKAB(CollaborativeComputational Project 4(协作计算计划4).The CCP4 Suite：Programsfor Protein Crystallography(CCP4套件：用于蛋白晶体学的程序)，ActaCrystallographies，D50，(1994)，760-763)、QUANTA(Jones et al.，ActaCrystallography A47(1991)，110-119，且可从Accelerys，San Diego，CA商购)、Insight(可从Accelerys，San Diego，CA商购)、(可从Tripos，Inc.，St Louis商购)、O(Jones et al.，Acta Crystallographica，A47，(1991)，110-119)以及其它坐标适宜程序来计算rmsd。
在例如程序LSQKAB和O中，使用者可以确定两个蛋白中的残基，其将被配对用于计算目的。可选择地，可以通过产生两个蛋白的序列比对来确定残基的配对，在本文下面更为详细地讨论了用于序列比对的程序。然后可以根据该比对和计算的r.m.s.d.值将原子坐标重叠。程序Sequoia(C.M.Bruns，I.Hubatsch，M.B.Mannervik，和J.A.Tainer(1999)Human Glutathione Transferase A4-4 CrystalStructures and Mutagenesis Reveal the Basis of High Catalytic Efficiencywith Toxic Lipid Peroxidation Products(人类谷胱甘肽转移酶A4-4晶体结构和诱变揭示与毒性脂过氧化作用产物有关的高催化效率的基础)，Journal of Molecular Biology 288(3)：427-439)进行同源蛋白序列的比对以及同源蛋白原子坐标的重叠。一旦比对，可以使用上面详述的程序来计算r.m.s.d.。对于相同或高度相同的序列，蛋白的结构比对可以手工完成或如上面所述的自动完成。另一方法会产生蛋白原子坐标的重叠，而不考虑序列。
它在比较明显不同套的坐标以计算只基于C-α原子的rmsd值时更为标准。在分析侧链移动以计算所有原子的rmsd时尤其有用，可以使用LSQKAB和其它的程序完成计算。
因而，例如，改变表1的结构的原子的原子位置直到任一方位约为优选直到约为会在其结构特征和例如用于基于分子结构的分析的效用方面产生基本上与表1的结构相同的结构。这同样可应用于表2和3。
本领域的技术人员会明白，在本发明的许多应用中，并不是必须利用表1至3的所有坐标，而仅是它们的一部分。例如，如下文所描述的，在建模N1组神经氨酸酶蛋白的分子结构方法中，可以使用本文涉及到的选择的坐标。
所用“选择的坐标”是指例如至少5个，优选至少10个，更优选至少50个，更优选至少100个，例如至少500个或至少1000个N1组神经氨酸酶蛋白结构的原子。同样，本文描述的本发明的其它应用，包括同源建模和结构解析，以及数据存储和计算机辅助的坐标处理，也可以利用表1至3的全部或部分坐标(即，选择的坐标)。所述选择的坐标可以包括或可以由如本文下面所述的在结合环中发现的原子或如本文下面所述的与配体相互作用的那些原子组成。
与配体结合有关的N1组神经氨酸酶蛋白的残基包括Glu-119，Val-149，Asp-151，Arg-156，Arg-224，Tyr-252，His-274，Glu-276，Arg-292，Tyr-347和Arg-371。在本发明的优选方面，如果使用本发明的结构所选择的坐标，这些包括一个或多个这些残基中的一个或多个原子。
优选地，所述选择的坐标包括来自至少两个，例如至少3、4、5、6、7、8或9个上述残基的原子。在一个实施方案中，可以使用这些残基中的每一个的至少一个原子。
可选择地或另外地，可以使用结合环149-153中的一个或多个残基的一个或多个原子。因此选择的坐标可以包括来自该环至少2个例如至少3、4或所有5个残基的至少一个原子。
在一个实施方案中，所述选择的坐标可以包括来自上述环的至少一个原子(如上述的原子的优选数目)以及来自选自Glu-119、Glu-276和Tyr-347的残基的至少一个原子。
C.同源建模
本发明也提供了其它蛋白(下面称为靶神经氨酸酶蛋白)同源建模的方法。所用“同源建模”是指相关神经氨酸酶蛋白结构的预测，其基于X-线晶体学数据或计算机辅助的结构的从头预测、基于从表1至3中的任一表或其选择的部分导出的坐标数据的处理。
术语“同源区”描述相同的或具有相似的侧链化学基团(例如脂肪族的、芳香族的、极性的、负电荷的或正电荷的)的两序列中的氨基酸残基。同源区相同的和相似的残基有时被本领域的技术人员分别描述为“不变的”和“保守的”。
通常，所述方法包括通过比对氨基酸序列将SEQ ID NOs：1至3的任一个的N1组神经氨酸酶蛋白的氨基酸序列与靶神经氨酸酶蛋白比较。然后比较序列中的氨基酸，并将同源的氨基酸簇(通常称为“对应区”)集合在一起。该方法识别多肽的保守区并说明了氨基酸的插入或删除。
氨基酸序列间的同源性可以使用商购的算法确定。程序BLAST、空位BLAST、BLASTN、PSI-BLAST和BLAST 2(由国立生物技术信息中心提供)被广泛用于本领域的该目的，且能够比对两个氨基酸序列的同源区。这些可以用缺省参数使用以确定SEQ ID NOs：1-3蛋白和欲被建模的其它靶神经氨酸酶蛋白之间的同源度。
靶蛋白包括N1组蛋白的其它成员，例如N5，以及N1、N4或N8蛋白的突变体或等位体。在后者的情况下，所述方法可以用于追踪发生在与增加的致病性有关的流感病毒隔离群的神经氨酸酶蛋白的变化或病毒感染的宿主种类的变化。
一旦具有已知和未知结构的多肽的氨基酸序列被比对，在计算机表示的具有已知结构的多肽中，保守氨基酸的结构被转移到其结构未知的多肽的对应氨基酸。例如，已知结构的氨基酸序列中的酪氨酸可以被未知结构的氨基酸序列中对应的同源氨基酸苯丙氨酸取代。
可以通过使用标准的肽几何学或通过诸如分子动力学的分子模拟技术手动设置位于非保守区的氨基酸的结构。该过程的最后步骤通过使用分子动力学和/或能量最低化精化整个结构来完成。
同源建模本身是本领域的技术人员公知的技术(参见，例如Greer，Science，Vol.228，(1985)，1055，和Blundell et al.，Eur.J.Biochem，Vol.172，(1988)，513)。这些参考文献中描述的技术，以及通常本领域可用到的其它同源建模技术可以用于完成本发明。
因此，本发明提供了同源建模方法，其包括下述步骤：
(a)将未知三维结构的靶神经氨酸酶蛋白的代表性氨基酸序列与SEQ ID NOs：1-3中的任一个的神经氨酸酶蛋白的氨基酸序列进行比对以匹配所述氨基酸序列的同源区。
(b)在来自表1至3的任一表的神经氨酸酶蛋白结构或其选择的坐标的对应区上建模所述未知结构的靶蛋白的匹配同源区的结构；以及
(c)确定基本上保存了所述匹配同源区结构的所述未知结构的靶蛋白的构象(例如，以便在未知结构的靶蛋白内形成良好的相互作用和/或以便形成低能构象)。
优选地，步骤(a)至(c)的一个或全部由计算机建模完成。
本文描述了本发明利用借助计算机(in silico)的N1组神经氨酸酶蛋白结构的方面，该方面同样可以用于通过本发明的上述方面获得的同源物模型，且这种应用形成了本发明的另外方面。因此，已经通过上述方法确定了靶神经氨酸酶蛋白的构象，这种构象可以用于基于计算机的方法，例如本文所述的合理药物设计的方法。
D.结构解析
N1组神经氨酸酶的原子坐标数据也可以用于解析其它靶神经氨酸酶蛋白的晶体结构，包括N1组神经氨酸酶蛋白的其它晶体形式，N1组神经氨酸酶蛋白的共复合物，其中已经产生了这些靶N1组神经氨酸酶蛋白的X-射线衍射数据或核磁共振光谱数据，并需要解释以提供结构。
例如，N1组神经氨酸酶蛋白可以以多种晶型结晶。由本发明所提供的表1至3的数据，或其选择的坐标对于解析那些其它晶型的结构尤其有用。这些数据也可以用于解析N1组神经氨酸酶蛋白共复合物的结构。
因此，如果提供了未知三维结构的靶N1组神经氨酸酶蛋白的X-射线晶体学或核磁共振光谱数据，来自表1至3的任一表的原子坐标数据可以用于解释那些数据以通过本领域已知的技术提供靶标可能的结构，所述技术例如，X-射线晶体学中的定相以及核磁共振(NMR)光谱中的辅助峰归属。
可以用于这些目的的一个方法是分子取代。在该方法中，无论未知的晶体结构是N1组神经氨酸酶蛋白的另一种晶型或其共复合体，可以使用本发明的表1至3的任一表中的全部或部分的结构坐标来确定。该方法会提供未知晶体的精确的结构形式，比试图从头开始确定这种信息更为迅速和有效。
用于完成分子取代的本领域已知的计算机程序的实例是CNX(Brunger AT.；Adams P.D.；Rice L.M.，Current Opinion in StructuralBiology(现代结构生物学评论)，Volume 8，Issue 5，October 1998，Pages606-611(也可从Accelrys San Diego，CA商购)、MOLREP(A.Vagin，A.Teplyakov，MOLREP：an automated program for molecular replacement(MOLREP：用于分子取代的自动化程序)，J.Appl.Cryst.(1997)30，1022-1025，CCP4套件的部分)或AMoRe(Navaza，J.(1994).AMoRe：anautomated package for molecular replacement(AMoRe：用于分子取代的自动化程序包).Acta Cryst.A50，157-163)。
因此，本发明的另一方面提供了用于确定蛋白结构的方法，所述方法包括：
提供表1至3中的任一表的N1组神经氨酸酶蛋白结构的坐标(或其选择的坐标)，
定位所述蛋白的晶体晶胞的坐标以提供所述蛋白的结构。
通过处理表1至3的任一表的数据，本发明也可以用于归属这种蛋白的核磁共振光谱峰。
E.计算机系统
在另一方面，本发明提供了系统，特别是计算机系统，所述系统包含下述中的一个：(a)表1至3的任一表的坐标数据，所述数据确定了N1组神经氨酸酶蛋白的三维结构或至少其选择的坐标；(b)基于来自表1至3的任一表的坐标数据，通过靶标的同源建模产生的靶神经氨酸酶蛋白的原子坐标数据，或(c)参照来自表1至3的任一表的坐标数据，通过解释X-射线晶体学数据或核磁共振数据产生的靶神经氨酸酶蛋白的原子坐标数据。
例如，所述计算机系统可以包括：(i)包含由计算机可读数据编码的数据存储物质的计算机可读的数据存储介质；(ii)用于存储处理所述计算机可读数据的指令的工作存储器；以及(iii)与所述工作存储器以及与用于处理所述计算机可读数据的计算机可读数据存储介质偶联的中央处理器，并由此产生结构和/或进行合理药物设计。所述计算机系统还可以包括与所述中央处理器偶联的显示器以显示所述结构。
本发明还提供了包含上文提及的靶蛋白的原子坐标数据，其中这些数据已经依据本文描述的本发明的方法，基于起始数据提供的表1至3的任一表或其选择的坐标的数据被产生。
这些数据可以用于许多目的，包括产生结构以分析神经氨酸酶蛋白的作用机制和/或进行化合物的合理药物设计，所述化合物与N1组神经氨酸酶蛋白相互作用，例如是N1组神经氨酸酶蛋白抑制剂或潜在抑制剂的化合物。
在另一方面，本发明提供了计算机可读的介质，带有下述数据中的至少一种：(a)表1至3的任一表的坐标数据，所述数据确定了N1组神经氨酸酶蛋白的三维结构或至少其选择的坐标；(b)基于来自表1至3的任一表的坐标数据，通过靶标的同源建模产生的靶神经氨酸酶蛋白的原子坐标数据，或(c)参照来自表1至3的任一表的坐标数据，通过解释X-射线晶体学数据或NMR数据产生的靶N1组神经氨酸酶蛋白的原子坐标数据。
如本文所使用的，“计算机可读的介质”指任何一种或多种介质，其可以通过计算机被直接读取和获得。这样的介质包括，但不限于：诸如软盘、硬盘存储介质和磁带的磁存储介质；诸如光盘或只读光盘(CD-ROM)的光存储介质；诸如RAM和ROM的电存储介质；以及诸如磁/光存储介质的这些种类的混合。
通过提供这样的计算机可读介质，本发明的原子坐标数据可以被常规使用以建模N1组神经氨酸酶蛋白或其选择的坐标。例如，RASMOL(Sayle et al.，TIBS，Vol.20，(1995)，374)是可被公共利用的计算机软件包，其允许获得和分析原子坐标数据用于确定结构和/或合理药物设计。
如本文所使用的，“计算机系统”指用于分析本发明的原子坐标数据的硬件装置、软件装置和数据存储装置。本发明的基于计算机系统的最小硬件装置包括中央处理器(CPU)、输入装置、输出装置和数据存储装置。理想地，提供监视器以使结构数据可视化。所述数据存储装置可以是RAM或用于访问本发明的计算机可读介质的装置。所述系统的实例是可从硅谷图形公司(Silicon Graphics Incorporated)得到的微型计算机工作站和基于Unix运行的太阳微系统(Sun Microsystems)、Windows NT或IBM OS/2操作系统。
本发明的另外方面提供了方法，所述方法提供用于生成结构和/或进行化合物最优化的数据，所述化合物与N1组神经氨酸酶蛋白相互作用，所述方法包括：
(i)建立与远程装置通信，所述远程装置包含：
(a)计算机可读的数据，其包含来自表1至3的任一表的N1组神经氨酸酶结构或其选择的坐标，任选地在不超过的Cα原子的均方根偏差内变化。
(ii)从所述远程装置接收所述计算机可读的数据。
因此，所述远程装置可以包括例如本发明的一个前述方面的计算机系统或计算机可读的介质。所述装置可以在接收到计算机可读数据的不同国家或管辖区。
通信可以借助广域网、局域网、电子邮件等，通过电线或通过诸如地面无线电或卫星等无线装置传送。通常，所述通信其本质是电子的，但通信通路的一些或全部可以是光学的，例如，通过光缆。
一旦从所述装置接收到数据，本发明可以包括使用在本文描述的本发明的建模系统中的数据的另外步骤。
F.本发明结构的用途
依照本发明获得的晶体结构以及依照本文描述的方法获得的靶神经氨酸酶蛋白的结构，可以以几种方式用于药物设计。例如，为了更充分地理解流感病毒对目前抗病毒药物产生抗性的机制，本发明的结构可以用于分析抗病毒药物与突变酶的相互作用，以及被修饰为靶向针对N1组蛋白的变化的药物的结构。
关于这种药物或潜在药物的结合的信息可以通过共结晶、浸泡或将药物通过计算对接在结合袋中来获得。这会指导对化学结构的特定修饰，所述化学结构被设计为介导或调控药物与蛋白的相互作用。可以设计这种修饰以提高其治疗和/或预防的作用。
本文描述的有和没有结合抑制剂的组-1 NA晶体结构，揭示了形成所述酶活性部位的一角的150-环能够在至少两个稳定的构象中存在。组-1 NA结合如奥塞米韦的与组-2酶有相似亲和力的药物，这一事实表明这两个构象之间的能量差异不是很大。流感病毒神经氨酸酶的或至少组-2酶的活性部位的结构具有可塑度，该观念有些意想不到。尽管我们没有直接的证据，但从序列的观点来看，如果组-2 NA的150-环也具有相似的灵活度是不会令人惊讶的。显然，在现有抑制剂缺乏和存在两种情况下，“闭合的”构象在组-2 NA都是能量优选的，但是考虑到抑制剂与“开放的”构象而不是与“闭合的”构象在能量上有利的相互作用，有充分的理由得到更高能量的“开放的”构象。
例如，基于我们结构的观测，我们建议可以通过向已存在的抑制剂骨架添加额外的取代部分来设计新药。在第一个实例中，可以进行针对组-1 NA的这些分子的设计和精化，如本文下面进一步讨论的。尽管制备针对所有病毒亚型起作用的流感药物看上去是理想的，但有效的组-1特异性抑制剂在现在或将来不会有重要的价值，这对我们来说不是显而易见的。在任一情况下，被设计为开发与组-1 NA的150-环的开放形式的其它相互作用的新抑制剂能够选择组-2 NA中在该环的相似构象是很有可能的。
依然可能的情况是任何新药的临床应用最终都会导致抵抗突变的出现。来自治疗逆转录病毒的教训表明克服该问题的一个策略是应用联合药物疗法。
(i)获得和分析晶体复合物。
在一种方法中，结合到N1组神经氨酸酶蛋白的化合物的结构可以通过试验确定。这会提供分析结合到N1组神经氨酸酶蛋白的化合物的起点，因此使本领域的技术人员对于该特定的化合物如何与N1组神经氨酸酶蛋白相互作用以及其起作用的机制有了详细的了解。
上文描述的基于结构的药物设计的许多技术和方法在一定程度上都依赖于X-射线分析来确定配体在配体-蛋白复合物中的结合位置。X-射线分析的通常方式是对复合物进行X-射线晶体分析，产生差异傅里叶(Fourier)电子密度图，并将特定模式的电子密度与所述配体结合。然而，为了产生所述图谱(例如由Blundell et al.，in ProteinCrystallography(蛋白晶体学)，Academic Press，New York，London and SanFrancisco，(1976)所解释的)，必须事先已知所述蛋白的3D结构(或至少所述蛋白结构因子)。因此，N1组神经氨酸酶蛋白结构的确定也能够产生蛋白-化合物复合物的差异傅里叶电子密度图，确定药物的结合部位并由此可以大大加速合理药物设计的过程。
因此，本发明提供了确定结合到N1组神经氨酸酶蛋白的化合物的结构的方法，所述方法包括：
提供本发明的N1组神经氨酸酶蛋白的晶体；
将该晶体与所述化合物浸泡；以及
通过应用表1至3的任一表的坐标数据或其选择的坐标确定所述N1组神经氨酸酶蛋白化合物复合物的结构。
可选择地，N1组神经氨酸酶蛋白和化合物可以共结晶。因此，本发明提供了确定结合到N1组神经氨酸酶蛋白的化合物的结构的方法，所述方法包括：将蛋白与化合物混合，结晶蛋白-化合物复合物；以及通过参照表1至3的任一表中的坐标数据或其选择的坐标确定所述蛋白-化合物复合物的结构。
分析所述结构可以利用(i)来自复合物的X-射线晶体衍射数据以及(ii)N1组神经氨酸酶蛋白的三维结构，或至少其选择的坐标，来产生所述复合物的差异傅里叶电子密度图，所述三维结构由表1至3的任一表中的原子坐标数据或其选择的坐标确定。然后可以分析差异傅里叶电子密度图。
因此，所述复合物可以使用X-射线衍射方法来结晶和分析，例如，依据由Greer et al J.of Medicinal Chemistry，Vol.37，(1994)，1035-1054描述的方法，且差异傅里叶电子密度图可以基于浸泡的或共结晶的蛋白的X-射线衍射模式以及非复合蛋白的解析结构来计算。然后可以分析这些图谱，例如，以确定特定化合物是否以及在何处与N1组神经氨酸酶蛋白结合和/或改变所述蛋白的构象。
使用诸如来自CCP4计算包的程序的程序可以计算电子密度图谱(Collaborative Computational Project 4(协作计算计划4).The CCP4Suite：Programs for Protein Crystallography(CCP4套件：用于蛋白晶体学的程序)，Acta Crystallographica，D50，(1994)，760-763.)。对于图谱可视化和建模，可以使用诸如″O″(Jones et al.，Acta Crystallographica，A47，(1991)，110-119)的程序。
上文提及的所有复合物都可以使用已知的X-射线衍射技术来研究，并可以使用诸如CNX(Brunger et al.，Current Opinion in StructuralBiology，Vol.8，Issue 5，October 1998，606-611，且可从Accelrys，SanDiego，CA商购)的计算机软件将1.5至分辨率的X-射线数据精化到R值为约0.30或更小，正如由Blundell et al，(1976)和Methods inEnzymology(酶学方法)，vol.114 & 115，H.W.Wyckoff et al.，eds.，Academic Press(1985)所描述的。
(ii)计算机(In silico)分析和设计
尽管本发明会促进包含N1组神经氨酸酶蛋白和与所述蛋白相互作用的化合物的实际晶体结构的确定，目前的计算技术对产生所述晶体以及产生和分析衍射数据的需要提供了有力的选择。因此，本发明的特定优选方面涉及针对与本发明的N1组神经氨酸酶蛋白结构相互作用的化合物的分析和开发的计算机方法。
N1组神经氨酸酶蛋白的三维结构的确定提供了关于该蛋白的结合部位的重要信息，特别是当与相似蛋白进行比较时。如附随的实施例显示的，我们已经在149-150环中的N1蛋白的结合袋内鉴定出令人惊讶和显著的差异，导致了该口袋中的一些残基与N2组的神经氨酸酶蛋白比较发生了明显的替代。另外，N1组中的347位向酪氨酸的改变导致了N2组中没有发现的另外配体的相互作用。因此，在下一代神经氨酸酶抑制剂的设计中，注意力应该集中到这些新鉴定的差异以提供改善的化合物，其可以克服观察到的对目前可利用的药物的抗性。
然后可以将该信息用于合理设计以及神经氨酸酶抑制剂的修饰，例如，通过鉴定结合部位的可能的结合配体的计算技术，通过使连接的片段方法用于药物设计，以及通过使用X-线晶体分析使结合配体(例如，包括本文上述的那些配体)的鉴定和定位成为可能。在下文更为详细地讨论了这些技术。
因此，作为N1组神经氨酸酶蛋白的三维结构的测定结果，用于合理药物设计的更为纯粹的计算技术也可以用于设计其与蛋白的这些组的相互作用被更好地理解的结构(对于这些技术的概述参见，例如，Walters et al(Drug Discovery Today(今日药物发现)，Vol.3，No.4，(1998)，160-178；Abagyan，R.；Totrov，M.Curr.Opin.Chem.Biol.2001，5，375-382)。例如，可以使用自动化的配体-受体对接程序(例如由Jones et al.在Current Opinion in Biotechnology(现代结构生物学评论)，Vol.6，(1995)，652-656和Halperin，I.；Ma，B.；Wolfson，H.；Nussinov，R.Proteins 2002，47，409-443中所讨论的)，其需要关于原子坐标的精确信息。
本文描述了利用借助计算机的N1组神经氨酸酶蛋白结构的本发明的方面，该方面同样可以应用于表1至3的任一表中的结构或其选择的坐标，以及通过本发明的其它方面获得的靶神经氨酸酶蛋白的模型。因此通过上文描述的方法已经确定了神经氨酸酶蛋白的构象，在本文描述的基于计算机的合理药物设计的方法中可以使用这种构象。此外，N1组神经氨酸酶蛋白的结构的可用性允许了高预测性的药效团模型的产生以用于病毒库筛选或化合物设计。
因此，本发明提供了基于计算机的方法用于分析分子结构与N1组神经氨酸酶蛋白结构的相互作用，其包括：
提供来自表1至3中任一表的N1组神经氨酸酶蛋白结构或其选择的坐标，任选地在不超过的Cα原子的均方根偏差内变化；
提供将与所述N1组神经氨酸酶结构或其选择的坐标匹配的分子结构；以及
将该分子结构与所述N1组神经氨酸酶结构匹配(fitting)。
实际上，建模由表1至3的任一表的坐标或其选择的坐标确定的N1组神经氨酸酶结构的足够数量的原子是理想的，其代表结合袋，例如，原子的数目或来自上文B部分确定的优选残基的原子。因此，在本发明的一个方面，所述选择的坐标可以包括上述残基的一些或全部的坐标。
将分子结构匹配后，本领域的技术人员可以寻求使用分子建模以确定所述结构彼此相互作用的程度(例如，通过氢键合、其它非共价相互作用、或通过反应以提供所述结构部分之间的共价键)。
本领域的技术人员可以使用计算机建模方法来改变所述结构的一个或多个，以设计以不同方式与N1组神经氨酸酶结构相互作用的新结构。
可以合成新设计的结构，且可以确定它们与N1组神经氨酸酶的相互作用或预测该新设计的结构如何被所述N1组神经氨酸酶结构结合。该过程可以被重复以进一步改变它与N1组神经氨酸酶结构之间的相互作用。
所用“匹配”是指通过自动化或半自动化的装置确定分子结构的至少一个原子和本发明的N1组神经氨酸酶结构的至少一个原子之间的至少一种相互作用，并且计算这种相互作用稳定的程度。相互作用包括由电荷、空间因素等引起的吸引力和排斥力。本文还描述了各种用于匹配的基于计算机的方法。
更具体地，一种化合物或多种化合物与N1组神经氨酸酶结构的相互作用可以通过使用诸如GOLD(Jones et al.，J.MoI.Biol.，245，43-53(1995)，Jones et al.，J.MoI.Biol.，267，727-748(1997))、GRAMM(Vakser，I.A.，Proteins，Suppl.，1：226-230(1997))、DOCK(Kuntz et al，J.Mol.Biol.1982，161，269-288，Makino et al，J.Comput.Chem.1997，18，1812-1825)、AUTODOCK(Goodsell et al，Proteins 1990，8，195-202，Morris et al，J.Comput.Chem.1998，19，1639-1662.)、FlexX、(Rarey et al，J.Mol.Biol.1996，261，470-489)或ICM(Abagyan et al，J.Comput.Chem.1994，15，488-506)的对接程序应用计算机建模来检测。该步骤可以包括化合物与N1组神经氨酸酶结构的计算机匹配以确定所述化合物的形状和化学结构如何很好地与N1组神经氨酸酶结构结合。
同样，可以进行N1组神经氨酸酶的活性部位结构的计算机辅助的人工检测。诸如GRID(Goodford，J.Med.Chem.，28，(1985)，849-857)(一种确定具有各种功能基团的分子与酶表面之间可能的相互作用部位的程序)的程序也可以用于分析所述活性部位，例如，来预测改变化合物代谢率的修饰类型。
可以应用计算机程序来评估两个结合伴侣的吸引力、排斥力和位阻。
随后可以获得关于化合物与N1组神经氨酸酶结构结合的详细的结构信息，并且可以根据该信息，对所述化合物的结构或功能作出调整，例如，改变其与N1组神经氨酸酶结构的相互作用。如果需要，可以重复再重复上述步骤。
可以用于本发明的分子结构通常会是开发中的用于药物用途的化合物。通常，所述化合物会是有机分子，通常分子量是从约100至2000Da，更优选是从约100至1000Da。这种化合物包括肽和其衍生物，以及包括奥塞米韦、扎那米韦、DANA和帕拉米韦衍生物的唾液酸衍生物。原则上，为了促进药学领域中处于开发中的任何化合物的开发或为了提供另外的合理药物设计以改善其特性，所述化合物可以用于本发明。
在另一个实施方案中，本发明提供了修饰化合物结构的方法，以改变其与N1组神经氨酸酶的相互作用，所述方法包括：
将起始化合物与本发明的N1组神经氨酸酶结构的配体结合区的至少一个氨基酸残基的一个或多个坐标匹配；
修饰所述起始化合物结构以增加或减少其与配体结合区的相互作用；
其中所述配体结合区被定义为包括Glu-119，Val-149，Asp-151，Arg-156，Arg-224，Tyr-252，His-274，Glu-276，Arg-292，Tyr-347以及Arg-371中的至少一个、优选多个和/或氨基酸149-152。本文上面描述了残基的优选数目和组合。
为了避免疑义，术语“修饰”如在前述部分中所定义的被使用，且一旦开发出这种化合物，它也可以如上所述地被合成和检测。
(iii)片段连接和延长(growing)
本发明的晶体结构的提供也允许根据片段连接或片段延长方法，开发与N1组神经氨酸酶的结合袋区相互作用的化合物(例如，作为该蛋白的抑制剂)。
例如，通过X-射线晶体分析可以确定蛋白结合袋内的一个或多个分子片段的结合。分子片段通常是具有100至200Da的分子量的化合物(Carr et al，2002)。这可以使用基于结构的方法提供药物化学的起点以最优化相互作用。所述片段可以被合并在模板上或用作“延长出”进入该蛋白的其它口袋的抑制剂的起点(Blundell et al，2002)。所述片段可以被定位于N1组神经氨酸酶结构的结合袋内，且随后“延长”以填充可利用的空间，探测与分子识别相关的静电的、范德华(van der Waals)或氢键的相互作用。因此使用基于结构的迭代化学合成可以迅速改善初始弱结合片段的效力。
在片段延长方法中的一个或多个阶段，可以在生物系统内合成所述化合物并检测其活性。这可以用于指导所述片段的另外的延长。
如果两个片段结合区被鉴定，为了获得可能具有理想特性的更大的连接的结构，可以根据连接的片段方法努力将所述两个片段直接相连、或以上述的方式延长一个或两个片段。
如果两个或多个配体的结合部位被确定，使用例如Greer等的迭代技巧，可以将它们连接以形成可以被进一步改善的潜在先导化合物。对于虚拟的连接片段法，参见Verlinde et al.，J.of Computer-AidedMolecular Design，6，(1992)，131-147，对于NMR和X-射线法，参见Shuker et al.，Science，274，(1996)，1531-1534和Stout et al.，Structure，6，(1998)，839-848。通过确定神经氨酸酶的结构，使用这些方法以设计神经氨酸酶抑制剂是可能的。
(iv)本发明的化合物。
如果通过匹配起始化合物与本发明的N1组神经氨酸酶结构以及从中预测具有改变的作用率(包括较慢的、较快的或零速率)已经开发出潜在的修饰的化合物，本发明还包括如下步骤：合成所述修饰的化合物，且在体内或体外生物系统中检测所述修饰的化合物，以确定其活性和/或其发挥作用(例如抑制病毒生长或扩散)的速率。
在另一方面，本发明包括化合物，其通过本发明上述的方法被鉴定。
这种化合物被鉴定后，可以被生产和/或在诸如药剂、药物组合物或药品的组合物的制备，即生产或配制中使用。这些可以给予个体。
因此，本发明括延到各方面，不仅括延到由本发明提供的化合物物，也括延到药物组合物、药剂、药品或包含所述化合物的其他组合物。所述组合物可以用于治疗(可以包括预防性治疗)疾病，特别是A或B型流感。这种治疗可以包括：将所述组合物向患者的给药，例如用于治疗疾病；这种抑制剂在生产用于给药的组合物中的用途，例如用于治疗疾病；以及制备药物组合物的方法，包括将这种抑制剂与药学上可接受的赋形剂、媒介或载体以及任选的其它成分混合。
因此，本发明的另外方面提供了制备药剂、药物组合物或药品的方法，所述方法包括(a)通过本文公开的本发明的其它方面的任一方面的方法鉴定或修饰化合物；(b)最优化所述分子的结构；以及(c)制备包含最优化的化合物的药剂、药物组合物或药品。
本发明的上述过程可以迭代，因为修饰的化合物本身可以作为另外的化合物设计的基础。
我们用“最优化结构”意指例如添加分子骨架，添加或改变功能基团，或将所述分子与其它分子连接(例如，使用片段连接法)以使所述调节分子的化学结构被改变，而其初始调节功能被保持或增强。在药物开发程序中经常进行这种最优化以，例如，增加先导化合物的效力、促进其药理学上的可接受性、增加其化学稳定性等。
修饰是熟练的药剂师已知的本领域常规的那些修饰，且包括，例如，包含与本发明的N1组神经氨酸酶结构的氨基酸侧链基团相互作用的残基的基团的替换或去除。例如，为了减少或增加测试化合物中的基团的电荷，取代可以包括基团的添加或去除，用带相反电荷的基团取代带电基团，或者用亲水基团取代疏水基团或者反之。应该理解这些仅是在新的药物化合物开发中由药剂师考虑的替换类型的实例，依赖于起始化合物的性质及其活性，可以作出其它的修饰。
可以配制用于任何适合的给药途径和方法的组合物。药学上可接受的载体或稀释剂包括那些在制剂中使用的、适用于口服、直肠、鼻腔、局部(包括颊的和舌下的)、阴道或肠胃外(包括皮下的、肌内的、静脉内的、真皮内的、硬膜内的和硬膜外的)给药的载体或稀释剂。通常所述制剂可以以单位剂型存在，且可以由药学领域已知的任何方法来制备。
对于固体组合物，常规的无毒固体载体包括，例如，药用级别的甘露醇、乳糖、纤维素、纤维素衍生物、淀粉、硬脂酸镁、糖精钠、滑石粉、葡萄糖、蔗糖、碳酸镁，且可以使用其类似物。可给予的液体药学上的组合物能够，例如，通过在诸如例如水、葡萄糖盐水、甘油、乙醇等载体内溶解、分散等上述确定的活性化合物以及任选的药物佐剂来制备，以由此形成溶液或悬液。如果需要，欲给药的药物组合物还可以包含诸如湿润剂或乳化剂、pH缓冲剂及其类似物的少量无毒辅助物质，例如乙酸钠、月桂山梨坦、三乙醇胺乙酸钠、月桂山梨坦、三乙醇胺油酸盐等。对本领域的技术人员而言，制备这些剂型的实际方法是已知的，或者是显而易见的。例如，参见Remington′sPharmaceutical Sciences(雷明顿药物科学)，Mack Publishing Company，Easton，Pennsylvania，第15版，1975。
本发明可由下述的实施例来阐释：
实施例
N1组神经氨酸酶的结晶
从生长于鸡卵中的A/越南/1203/04病毒来制备SEQ ID NO：1的N1蛋白。通过菠萝蛋白酶消化从所述病毒中释放出NA，并如以前所述将其进一步纯化(Ha Y，Stevens DJ，Skehel JJ & Wiley DC(2001)ProcNatl Acad Sci Sep 25；98(20)11181-6)以制备SEQ ID NO：1的残基62-449的可结晶蛋白。
蛋白在三种条件下结晶：(1)20％ PEG 3350，0.2M乙酸铵，0.1MMES pH 6.0；(2)20％ PEG 3350，0.2M乙酸铵，0.1M PIPES pH 6.8；(3)20％ PEG 3350，0.2M 硫酸锂，0.1M TrisCl pH 8.5。
因此，本发明在一方面提供了在条件(1)至(3)的任一条件下结晶本发明的N1蛋白的方法，其中每种试剂的浓度、pH或分子量(就PEG而言)可以独立变化高达5％。
来自条件1的结晶被衍射，这些条件用于随后的大范围的优化。使用1μl N1蛋白(9A₂₈₀/ml)加上1μl用18-23％ PEG 3350、0.2M乙酸铵、0.1M MES pH 6.0平衡的适宜溶液建立悬滴。来自包含20％或21％PEG的滴剂的晶体被用于收集天然数据且用20μM或0.5mM达菲(奥塞米韦)浸泡。
用于晶体的抗冻剂溶液是21％ PEG 3500，0.2M乙酸铵，0.1MMES pH 6.0，15％乙二醇。
N4和N8神经氨酸酶的结晶
方法
从生长于鸡卵中的A/貂/瑞典/E12665/84(H10N4)和A/鸭/乌克兰/1/63(H3N8)病毒中制备N4(SEQ ID NO：2)和N8(SEQ ID NO：3)NA通过菠萝蛋白酶消化从所述病毒中释放出NA以提供N4 79-470和N873-470，并如前所述将其进一步纯化。回收的蛋白浓度为10mg/ml，溶于10mM Tris-HCl，pH 8.0。
通过蒸汽扩散，N4 NA晶体生长于由2μl的储存液(0.1M Hepes，pH 7.5，5mM氯化钴，5mM氯化镍，5mM氯化镉，5mM氯化镁以及12％ w/v PEG 3350)和2μl的浓缩蛋白溶液组成的悬滴中。
因此，本发明在一方面提供了在上述条件下结晶本发明的N4蛋白的方法，其中每种试剂的浓度、pH或分子量(就PEG而言)可以独立变化高达5％。
通过蒸汽扩散，N8 NA晶体生长于由2μl的储存液(0.1M咪唑，pH8.0和35％ MPD)和2μl的浓缩蛋白溶液(10mg/ml，溶于10mMTris-HCl，pH 8.0)组成的悬滴中。
因此，本发明在一方面提供了在上述条件下结晶本发明的N8蛋白的方法，其中每种试剂的浓度、pH或分子量(就PEG而言)可以独立变化高达5％。
晶体在配制于结晶缓冲液中的20mM抑制剂中浸泡30分钟(就N4而言，增加20％的甘油用于防冻保护)。此外，N8 NA晶体浸泡于20mM奥塞米韦三天。在与Raxisllc探测器偶联的实验室Rigaku-MSCRU200旋转阳极上的100K处收集数据。衍射数据使用Denzo来整合并用Scalepack来测量。使用相位器(Phaser)，用N9 NA作为检索模型通过分子取代来解析N4和N8 NA结构。进行使用CNS的标准精化以及使用O的手动建模。表4中给出了结晶的统计数据，所有的图用Pymol产生。
N1、N4和N8的晶体结构通过分子取代来解析，相关的晶体数据在表4中显示。表5显示了获得的晶体的形式、大小和分辨率。在表1至3中分别列出了未与配体结合的N1、N4和N8的结构。
表4

表4：晶体学统计。
R_work＝∑||Fo|-|Fc||/∑|Fo|。
R_free＝∑_T||Fo|-|Fc||/∑_T|Fo|，其中T是随机选择的总反射的5％的测试数据集且精化前被预留出。
表5

活性部位比较
N1、N4和N8组-1NA的结构的重叠揭示了它们的活性部位实质上是相同的。然而，组1和组2之间重要的构象差异集中在毗邻所述活性部位的150环(147-152残基)和150-腔上。所述环的构象使组-1特异性Val-149的C-α位置距离组-2中的等价的异亮氨酸残基约而且，149位的疏水侧链伸向远离组1的活性部位，但朝向组2中的活性部位。在150环最靠近所述活性部位的点，组1和组2在151位具有催化重要性的天冬氨酸残基的侧链位置有的差异。150环中的氨基酸残基的比较为组1和组2内而不是组1和组2之间的环结构的强保守没有提供明显的解释。
显而易见，该环构象是组1的固有特征，而不是偶然的晶格接触，因为本文中本发明的所有三种在不同条件下结晶，且处于不同空间群的组-1的酶结构，显示了相似的结构。
这些结构上的不同的主要结果是在毗邻组1而不是组2的活性部位存在大的腔。因为在上述的Asp-151和Glu-119位置的差异，该腔接近所述活性部位。这两个酸性残基位置的差异的结合效应是增加了所述活性部位腔约的宽度。其侧链大约位于所述两个酸性残基中间位置的保守的Arg-156，在组1和组2结构中采用了大致相同的位置，并确定了从所述活性部位进入150-腔的入口。然后通过150-环的构象差异以及Gln-136的位置确定150-腔的宽度。在组-2蛋白中，该残基氢与该环150残基的主链羰基键合。在组1结构中，可能作为不同环结构的结果，不能形成该氢键的Gln-136采用导致其侧链位于低于所述腔底部约的构象。因此，150-腔约长以及宽和深。该腔及它与所述活性部位的可接近性对于开发对组-1蛋白更特异的药物具有重要意义。
这种不同的存在从基于目前可得到的组-2 NA结构的同源建模或相似技术来看不是显而易见的。
在组1和组2未与配体结合的结构之间的另外两个显著差异包括Glu-276和Glu-119的侧链构象。Glu-276的构象特别受到关注，因为它在药物结合到来自B型流感和组2的NA时经历了最显著的重排。例如，在未与配体结合的组-2(N9)中，Glu-276的羧基朝入所述活性部位，但在奥塞米韦结合时，它采取远离所述活性部位的构象，以使此时的羧基与Arg-224的胍基形成二齿状的相互作用。与此同时，Glu-276疏水的CB和CG移向C6连接的奥塞米韦的疏水取代基。在未与配体结合的组-1 NA中，Glu-276的构象更像在组2中观察到的配体结合构象。因此，尽管未与配体结合的N1中的Glu-276的CD原子距离结合奥塞米韦的N9中的等价原子的位置约其羧基仍然能够与Arg-224形成相同的二齿状的相互作用。Glu-119采用组1中的构象，以致它的羧基指向其在组2中指向的大致相反方向。
抑制剂结合
我们已经确定了与表4中总结的组1的N1、N1和N8结合的各种抗神经氨酸酶抑制剂的晶体结构。值得注意地，我们发现依赖于浸泡条件，组-1 NA能够在150-环的“开放的”或“闭合的”构象中结合奥塞米韦。因此，由将抑制剂浸泡入预成形的晶体30分钟而形成的与奥塞米韦络合的N8 NA的结构揭示出没有发生大范围的构象变化，150-环仍保持与其在未结合配体的结构中的构象相同的构象。作为150-环的构象的大概结果，酸性残基Asp-151和Glu-119距离结合到所述抑制剂的C4的氮比它们在N9的复合物中更远。奥塞米韦和N8 NA之间的其它相互作用与在N9中观察到的相似，除了C1羧基与Arg-371的通常的二齿状相互作用外，另外的例外是Tyr-347与奥塞米韦的C1羧基形成氢键相互作用。在组2中，347位残基是谷氨酰胺，而不是不能形成这种氢键的酪氨酸。
奥塞米韦可以与带有开放构象的150环的N8结合的观察看起来是重要的。如果配体在晶体中有低的占位，获得这种结果是可能的。然而，X-射线数据和模型精化的质量使我们确信这不是实情。相反，看起来可能奥塞米韦与N8的结合，至少在晶体状态下是两步过程。首先，抑制剂结合到N8的“开放”形式，然后发生缓慢的构象变化，形成所述酶的“闭合”形式，实现了更多的与配体相互作用的能量。我们对结构的观察表明这种类型的抑制剂能够结合到组1 NA的“开放”构象。
当N8晶体在奥塞米韦中孵育3天时，或N1晶体在更高浓度的抑制剂中孵育时，150-环改变其构象以使它与在抑制剂存在和不存在时观察到N2组中的构象及其相似。这种构象的变化有两种主要结果。其一是Glu-119和Asp-151都朝向了结合的奥塞米韦，其二是结合药物的组1中的活性部位腔的大小与组2 NA中的腔的大小基本相同。
我们也已经确定了三种其它的神经氨酸酶抑制剂的结构：结合到组1的DANA、扎那米韦和帕拉米韦。总体来说，这些结构表明药物结合的组1的复合物与观察到的组2的那些复合物非常相似。在所有三种情形下，组1的150环在药物结合时改变了它的构象，使Asp-151与所述抑制剂更接近，且在该过程中，靠近所述150-腔。
组1结构中的150环的“开放”构象的发现表明，对于这些酶，该构象比这种环的“闭合”构象本质上能量更低。组1(N8)最初与“开放”构象中的奥塞米韦结合，但最终采用所述闭合构象。因此，看起来，结合到组1的奥塞米韦顺从更高的能量或可能通过相对慢的构象变化得到的150环的“闭合”构象异构体。因此，设计组1的新型抑制剂是可能的，所述抑制剂选择性针对“开放”150-环构象的并会由此具有比奥塞米韦或扎那米韦更强的结合能力。
我们对结构的检测表明，例如，从奥塞米韦的4-氨基团或扎那米韦相应的胍盐阳离子将侧链开发为150-腔，并由此增强新型抑制剂与组1神经氨酸酶(相对于组2神经氨酸酶)的结合，这是可能的。所述腔在奥塞米韦或扎那米韦的C-4附近打开并且在它的底部包含保守的Arg-156的突出的胍盐侧链，所述侧链是新抑制剂的内部盐桥或氢键对的预期伴侣。
抑制剂结合
组1和组2突变的NAs的差异奥塞米韦抗性
从达菲治疗流感感染的人类后分离的A型流感病毒中已经表征三种抗奥塞米韦和/或扎那米韦的突变NAs。来自H5N1感染的一种包含氨基酸替换His-274-＞Tyr。另两种来自感染H3N2病毒的患者，且包含Glu-119-＞Val或Arg-292-＞Lys替换。组1和组2 NAs的结构的比较揭示了活性部位内的组特异性差异，所述差异可能解释了为什么这些突变引起了抑制剂抗性。
His-274-＞Tyr
His-274-＞Tyr的突变引起了组1 NA对奥塞米韦的高抵抗性，但对组2 NA几乎没有影响。组1 NA与奥塞米韦络合的结构的检测以及与等价的组2复合物的比较提出了这种组特异性行为的理由并指示了抗性如何可能由突变体Tyr-224对Glu-276的定位的影响来介导。Glu-276的构象对组2 NA的奥塞米韦结合的重要性已经被牢固确立。看起来，至少有两种因素促成了组1 NA不能适应所述的His-274 Tyr替换。首先，组1 NA中接近273位残基的270-环与组2中的等价的环相比形成了更为紧密的转角。其次，在组1中，而不是在组2中，在252位存在保守的酪氨酸残基，其与273位的主链羰基、与250位的肽酰胺以及与274位的组氨酸侧链形成了氢键。His-274也通过它的其它侧链氮与Glu-276形成氢键。看起来，在组1酶的274位引入较庞大的酪氨酸残基只能被朝Glu-276移动并部分取代Glu-276的新侧链适应。相反，在组2酶中，252位较小的残基为在不扰乱Glu-276的前提下引入274位酪氨酸留出了空间。这种突变的组特异性效应的解释与先前报道的来自突变研究的观测是一致的。
Arg-292-＞Lys
Arg-292-＞Lys突变在抗奥塞米韦的组-2 NAs中是最常见的替换。在N9 NA中，显示抗性部分来自氢键从奥塞米韦的Arg-292至羧基的缺失，这已经是详细的晶体学分析的主题。替换的Lys-292也与Glu-276相互作用，阻碍其适应连接到奥塞米韦的C6的疏水取代基的运动。组1 NAs的结构以及它们与奥塞米韦的复合物，揭示了所述突变对组1酶有较小影响的可能理由。组1的347位保守的酪氨酸残基与所述抑制剂的羧基形成了额外的氢键，所述氢键不能由组2中的等价残基形成。这样，看起来，Tyr-347和所述抑制剂的羧基之间的额外氢键相互作用补偿了所述羧基与292位替换的赖氨酸残基之间的较弱的、水介导的相互作用。
上述说明书中提及的所有的公开出版物和专利都通过引用的方式并入本文。对本领域技术人员显而易见的是，所述发明的各种修饰和变化都不背离本发明的范围和精神。尽管结合特定的优选实施方案描述了本发明，但应当理解所要求保护的本发明不应不恰当地受到这些特定实施方案的限制。
序列表
<110>医疗研究局
     史蒂文·约翰·甘姆波林
     艾伦·詹姆士·海
     约翰·詹姆士·斯格海尔
<120>流感病毒神经氨酸酶晶体结构和其用途
<130>AHB/CP6469472
<150>GB 0611136.3
<151>2006-06-06
<160>6
<170>PatentIn 3.3版
<210>1
<211>449
<212>PRT
<213>A型流感病毒
<400>1
Met Asn Pro Asn Gln Lys Ile Ile Thr Ile Gly Ser Ile Cys Met Val
1               5                   10                  15
Thr Gly Ile Val Ser Leu Met Leu Gln Ile Gly Asn Met Ile Ser Ile
            20                  25                  30
Trp Val Ser His Ser Ile His Thr Gly Asn Gln His Gln Ser Glu Pro
        35                  40                  45
Ile Ser Asn Thr Asn Phe Leu Thr Glu Lys Ala Val Ala Ser Val Lys
    50                  55                  60
Leu Ala Gly Asn Ser Ser Leu Cys Pro Ile Asn Gly Trp Ala Val Tyr
65                  70                  75                  80
Ser Lys Asp Asn Ser Ile Arg Ile Gly Ser Lys Gly Asp Val Phe Val
                85                  90                  95
Ile Arg Glu Pro Phe Ile Ser Cys Ser His Leu Glu Cys Arg Thr Phe
            100                 105                 110
Phe Leu Thr Gln Gly Ala Leu Leu Asn Asp Lys His Ser Asn Gly Thr
        115                 120                 125
Val Lys Asp Arg Ser Pro His Arg Thr Leu Met Ser Cys Pro Val Gly
    130                 135                 140
Glu Ala Pro Ser Pro Tyr Asn Ser Arg Phe Glu Ser Val Ala Trp Ser
145                 150                 155                 160
Ala Ser Ala Cys His Asp Gly Thr Ser Trp Leu Thr Ile Gly Ile Ser
                165                 170                 175
Gly Pro Asp Asn Gly Ala Val Ala Val Leu Lys Tyr Asn Gly Ile Ile
            180                 185                 190
Thr Asp Thr Ile Lys Ser Trp Arg Asn Asn Ile Leu Arg Thr Gln Glu
        195                 200                 205
Ser Glu Cys Ala Cys Val Asn Gly Ser Cys Phe Thr Val Met Thr Asp
    210                 215                 220
Gly Pro Ser Asn Gly Gln Ala Ser Tyr Lys Ile Phe Lys Met Glu Lys
225                 230                 235                 240
Gly Lys Val Val Lys Ser Val Glu Leu Asp Ala Pro Asn Tyr His Tyr
                245                 250                 255
Glu Glu Cys Ser Cys Tyr Pro Asn Ala Gly Glu Ile Thr Cys Val Cys
            260                 265                 270
Arg Asp Asn Trp His Gly Ser Asn Arg Pro Trp Val Ser Phe Asn Gln
        275                 280                 285
Asn Leu Glu Tyr Gln Ile Gly Tyr Ile Cys Ser Gly Val Phe Gly Asp
    290                 295                 300
Asn Pro Arg Pro Asn Asp Gly Thr Gly Ser Cys Gly Pro Val Ser Ser
305                 310                 315                 320
Asn Gly Ala Tyr Gly Val Lys Gly Phe Ser Phe Lys Tyr Gly Asn Gly
                325                 330                 335
Val Trp Ile Gly Arg Thr Lys Ser Thr Asn Ser Arg Ser Gly Phe Glu
            340                 345                 350
Met Ile Trp Asp Pro Asn Gly Trp Thr Glu Thr Asp Ser Ser Phe Ser
        355                 360                 365
Val Lys Gln Asp Ile Val Ala Ile Thr Asp Trp Ser Gly Tyr Ser Gly
    370                 375                 380
Ser Phe Val Gln His Pro Glu Leu Thr Gly Leu Asp Cys Ile Arg Pro
385                 390                 395                 400
Cys Phe Trp Val Glu Leu Ile Arg Gly Arg Pro Lys Glu Ser Thr Ile
                405                 410                 415
Trp Thr Ser Gly Ser Ser Ile Ser Phe Cys Gly Val Asn Ser Asp Thr
            420                 425                 430
Val Gly Trp Ser Trp Pro Asp Gly Ala Glu Leu Pro Phe Thr Ile Asp
        435                 440                 445
Lys
<210>2
<211>470
<212>PRT
<213>A型流感病毒
<400>2
Met Asn Pro Asn Gln Lys Ile Ile Thr Ile Gly Ser Val Ser Ile Val
1               5                   10                  15
Leu Thr Thr Ile Gly Leu Leu Leu Gln Ile Thr Ser Leu Cys Ser Ile
            20                  25                  30
Trp Phe Ser His Tyr Asn Gln Val Thr Gln Thr Asn Glu Gln Pro Cys
        35                40                45
Ser Asn Asn Thr Thr Asn Tyr Tyr Asn Glu Thr Phe Val Asn Val Thr
    50                  55                  60
Asn Val Gln Asn Asn Tyr Thr Thr Ile Thr Asp Pro Ser Thr Ser Gln
65                  70                  75                  80
Val Ile His Tyr Ser Ser Gly Lys Asp Leu Cys Pro Val Lys Gly Trp
                85                  90                  95
Ala Pro Leu Ser Lys Asp Asn Gly Ile Arg Ile Gly Ser Arg Gly Glu
            100                 105                 110
Val Phe Val Ile Arg Glu Pro Phe Ile Ser Cys Ser Ile Asn Glu Cys
        115                 120                 125
Arg Thr Phe Phe Leu Thr Gln Gly Ala Leu Leu Asn Asp Lys His Ser
    130                 135                 140
Asn Gly Thr Val Lys Asp Arg Ser Pro Phe Arg Thr Leu Met Ser Cys
145                 150                 155                 160
Pro Ile Gly Val Ala Pro Ser Pro Ser Asn Ser Arg Phe Glu Ser Val
                165                 170                 175
Ala Trp Ser Ala Thr Ala Cys Ser Asp Gly Pro Gly Trp Leu Thr Ile
            180                 185                 190
Gly Ile Thr Gly Pro Asp Ala Thr Ala Val Ala Val Leu Lys Tyr Asn
        195                 200                 205
Gly Ile Ile Thr Asp Thr Leu Lys Ser Trp Lys Gly Asn Ile Met Arg
    210                 215                 220
Thr Gln Glu Ser Glu Cys Val Cys Gln Asp Glu Phe Cys Tyr Thr Leu
225                 230                 235                 240
Ile Thr Asp Gly Pro Ser Asp Ala Gln Ala Phe Tyr Lys Ile Leu Lys
                245                 250                 255
Ile Lys Lys Gly Lys Ile Val Ser Val Lys Asp Val Asp Ala Pro Gly
            260                 265                 270
Phe His Phe Glu Glu Cys Ser Cys Tyr Pro Ser Gly Glu Asn Val Glu
        275                 280                 285
Cys Val Cys Arg Asp Asn Trp Arg Gly Ser Asn Arg Pro Trp Ile Arg
    290                 295                 300
Phe Asn Ser Asp Leu Asp Tyr Gln Ile Gly Tyr Val Cys Ser Gly Val
305                 310                 315                 320
Phe Gly Asp Asn Pro Arg Pro Met Asp Ser Thr Gly Ser Cys Asn Ser
                325                 330                 335
Pro Ile Asn Asn Gly Lys Gly Arg Tyr Gly Val Lys Gly Phe Ser Phe
            340                 345                 350
Arg Tyr Gly Asp Gly Val Trp Ile Gly Arg Thr Lys Ser Leu Glu Ser
        355                 360                 365
Arg Ser Gly Phe Glu Met Val Trp Asp Ala Asn Gly Trp Val Ser Thr
    370                 375                 380
Asp Lys Asp Ser Asn Gly Val Gln Asp Ile Ile Asp Asn Asp Asn Trp
385                 390                 395                 400
Ser Gly Tyr Ser Gly Ser Phe Ser Ile Arg Gly Glu Thr Thr Gly Arg
                405                 410                 415
Asn Cys Thr Val Pro Cys Phe Trp Val Glu Met Ile Arg Gly Gln Pro
            420                 425                 430
Lys Glu Lys Thr Ile Trp Thr Ser Gly Ser Ser Ile Ala Phe Cys Gly
        435                 440                 445
Val Asn Ser Asp Thr Thr Gly Trp Ser Trp Pro Asp Gly Ala Leu Leu
    450                 455                 460
Pro Phe Asp Ile Asp Lys
465                 470
<210>3
<211>470
<212>PRT
<213>A型流感病毒
<400>3
Met Asn Pro Asn Gln Lys Ile Ile Thr Ile Gly Ser Ile Ser Leu Gly
1               5                   10                  15
Leu Val Val Phe Asn Val Leu Leu His Val Val Ser Ile Ile Val Thr
            20                  25                  30
Val Leu Val Leu Gly Lys Gly Gly Asn Asn Gly Ile Cys Asn Glu Thr
        35                  40                  45
Val Val Arg Glu Tyr Asn Glu Thr Val Arg Ile Glu Lys Val Thr Gln
    50                  55                  60
Trp His Asn Thr Asn Val Val Glu Tyr Val Pro Tyr Trp Asn Gly Gly
65                  70                  75                  80
Thr Tyr Met Asn Asn Thr Glu Ala Ile Cys Asp Ala Lys Gly Phe Ala
                85                  90                  95
Pro Phe Ser Lys Asp Asn Gly Ile Arg Ile Gly Ser Arg Gly His Ile
            100                 105                 110
Phe Val Ile Arg Glu Pro Phe Val Ser Cys Ser Pro Ile Glu Cys Arg
        115                 120                 125
Thr Phe Phe Leu Thr Gln Gly Ser Leu Leu Asn Asp Lys His Ser Asn
    130                 135                 140
Gly Thr Val Lys Asp Arg Ser Pro Phe Arg Thr Leu Met Ser Val Glu
145                 150                 155                 160
Val Gly Gln Ser Pro Asn Val Tyr Gln Ala Arg Phe Glu Ala Val Ala
                165                 170                 175
Trp Ser Ala Thr Ala Cys His Asp Gly Lys Lys Trp Met Thr Val Gly
            180                 185                 190
Val Thr Gly Pro Asp Ser Lys Ala Val Ala Val Ile His Tyr Gly Gly
        195                 200                 205
Val Pro Thr Asp Val Val Asn Ser Trp Ala Gly Asp Ile Leu Arg Thr
    210                 215                 220
Gln Glu Ser Ser Cys Thr Cys Ile Gln Gly Asp Cys Tyr Trp Val Met
225                 230                 235                 240
Thr Asp Gly Pro Ala Asn Arg Gln Ala Gln Tyr Arg Ile Tyr Lys Ala
                245                 250                 255
Asn Gln Gly Arg Ile Ile  Gly Gln Thr Asp Ile Ser Phe Asn Gly Gly
            260                 265                 270
His Ile Glu Glu Cys Ser Cys Tyr Pro Asn Asp Gly Lys Val Glu Cys
        275                 280                 285
Val Cys Arg Asp Gly Trp Thr Gly Thr Asn Arg Pro Val Leu Val Ile
    290                 295                 300
Ser Pro Asp Leu Ser Tyr Arg Val Gly Tyr Leu Cys Ala Gly Ile Pro
305                 310                 315                 320
Ser Asp Thr Pro Arg Gly Glu Asp Thr Gln Phe Thr Gly Ser Cys Thr
                325                 330                 335
Ser Pro Met Gly Asn Gln Gly Tyr Gly Val Lys Gly Phe Gly Phe Arg
            340                 345                 350
Gln Gly Thr Asp Val Trp Met Gly Arg Thr Ile Ser Arg Thr Ser Arg
        355                 360                 365
Ser Gly Phe Glu Ile Leu Arg Ile Lys Asn Gly Trp Thr Gln Thr Ser
    370                 375                 380
Lys Glu Gln Ile Arg Lys Gln Val Val Val Asp Asn Leu Asn Trp Ser
385                 390                 395                 400
Gly Tyr Ser Gly Ser Phe Thr Leu Pro Val Glu Leu Ser Gly Lys Asp
                405                 410                 415
Cys Leu Val Pro Cys Phe Trp Val Glu Met Ile Arg Gly Lys Pro Glu
            420                 425                 430
Glu Lys Thr Ile Trp Thr Ser Ser Ser Ser Ile Val Met Cys Gly Val
        435                 440                 445
Asp Tyr Glu Val Ala Asp Trp Ser Trp His Asp Gly Ala Ile Leu Pro
    450                 455                 460
Phe Asp Ile Asp Lys Met
465                 470
<210>4
<211>385
<212>PRT
<213>A型流感病毒
<400>4
Val Lys Leu Ala Gly Asn Ser Ser Leu Cys Pro Ile Asn Gly Trp Ala
1               5                   10                  15
Val Tyr Ser Lys Asp Asn Ser Ile Arg Ile Gly Ser Lys Gly Asp Val
            20                  25                  30
Phe Val Ile Arg Glu Pro Phe Ile Ser Cys Ser His Leu Glu Cys Arg
        35                  40                  45
Thr Phe Phe Leu Thr Gln Gly Ala Leu Leu Asn Asp Lys His Ser Asn
    50                  55                  60
Gly Thr Val Lys Asp Arg Ser Pro His Arg Thr Leu Met Ser Cys Pro
65                  70                  75                  80
Val Gly Glu Ala Pro Ser Pro Tyr Asn Ser Arg Phe Glu Ser Val Ala
                85                  90                  95
Trp Ser Ala Ser Ala Cys His Asp Gly Thr Ser Trp Leu Thr Ile Gly
            100                 105                 110
Ile Ser Gly Pro Asp Asn Gly Ala Val Ala Val Leu Lys Tyr Asn Gly
        115                 120                 125
Ile Ile Thr Asp Thr Ile Lys Ser Trp Arg Asn Asn Ile Leu Arg Thr
    130                 135                 140
Gln Glu Ser Glu Cys Ala Cys Val Asn Gly Ser Cys Phe Thr Val Met
145                 150                 155                 160
Thr Asp Gly Pro Ser Asn Gly Gln Ala Ser Tyr Lys Ile Phe Lys Met
                165                 170                 175
Glu Lys Gly Lys Val Val Lys Ser Val Glu Leu Asp Ala Pro Asn Tyr
            180                 185                 190
His Tyr Glu Glu Cys Ser Cys Tyr Pro Asn Ala Gly Glu Ile Thr Cys
        195                 200                 205
Val Cys Arg Asp Asn Trp His Gly Ser Asn Arg Pro Trp Val Ser Phe
    210                 215                 220
Asn Gln Asn Leu Glu Tyr Gln Ile Gly Tyr Ile Cys Ser Gly Val Phe
225                 230                 235                 240
Gly Asp Asn Pro Arg Pro Asn Asp Gly Thr Gly Ser Cys Gly Pro Val
                245                 250                 255
Ser Ser Asn Gly Ala Tyr Gly Val Lys Gly Phe Ser Phe Lys Tyr Gly
            260                 265                 270
Asn Gly Val Trp Ile Gly Arg Thr Lys Ser Thr Asn Ser Arg Ser Gly
        275                 280                 285
Phe Glu Met Ile Trp Asp Pro Asn Gly Trp Thr Glu Thr Asp Ser Ser
    290                 295                 300
Phe Ser Val Lys Gln Asp Ile Val Ala Ile Thr Asp Trp Ser Gly Tyr
305                 310                 315                 320
Ser Gly Ser Phe Val Gln His Pro Glu Leu Thr Gly Leu Asp Cys Ile
                325                 330                 335
Arg Pro Cys Phe Trp Val Glu Leu Ile Arg Gly Arg Pro Lys Glu Ser
            340                 345                 350
Thr Ile Trp Thr Ser Gly Ser Ser Ile Ser Phe Cys Gly Val Asn Ser
        355                 360                 365
Asp Thr Val Gly Trp Ser Trp Pro Asp Gly Ala Glu Leu Pro Phe Thr
    370                 375                 380
Ile
385
<210>5
<211>388
<212>PRT
<213>A型流感病毒
<400>5
Val Ile His Tyr Ser Ser Gly Lys Asp Leu Cys Pro Val Lys Gly Trp
1               5                   10                  15
Ala Pro Leu Ser Lys Asp Asn Gly Ile Arg Ile Gly Ser Arg Gly Glu
            20                  25                  30
Val Phe Val Ile Arg Glu Pro Phe Ile Ser Cys Ser Ile Asn Glu Cys
        35                  40                  45
Arg Thr Phe Phe Leu Thr Gln Gly Ala Leu Leu Asn Asp Lys His Ser
    50                  55                  60
Asn Gly Thr Val Lys Asp Arg Ser Pro Phe Arg Thr Leu Met Ser Cys
65                  70                  75                  80
Pro Ile Gly Val Ala Pro Ser Pro Ser Asn Ser Arg Phe Glu Ser Val
                85                  90                  95
Ala Trp Ser Ala Thr Ala Cys Ser Asp Gly Pro Gly Trp Leu Thr Ile
            100                 105                 110
Gly Ile Thr Gly Pro Asp Ala Thr Ala Val Ala Val Leu Lys Tyr Asn
        115                 120                 125
Gly Ile Ile Thr Asp Thr Leu Lys Ser Trp Lys Gly Asn Ile Met Arg
    130                 135                 140
Thr Gln Glu Ser Glu Cys Val Cys Gln Asp Glu Phe Cys Tyr Thr Leu
145                 150                 155                 160
Ile Thr Asp Gly Pro Ser Asp Ala Gln Ala Phe Tyr Lys Ile Leu Lys
                165                 170                 175
Ile Lys Lys Gly Lys Ile Val Ser Val Lys Asp Val Asp Ala Pro Gly
            180                 185                 190
Phe His Phe Glu Glu Cys Ser Cys Tyr Pro Ser Gly Glu Asn Val Glu
        195                 200                 205
Cys Val Cys Arg Asp Asn Trp Arg Gly Ser Asn Arg Pro Trp Ile Arg
    210                 215                 220
Phe Asn Ser Asp Leu Asp Tyr Gln Ile Gly Tyr Val Cys Ser Gly Val
225                 230                 235                 240
Phe Gly Asp Asn Pro Arg Pro Met Asp Ser Thr Gly Ser Cys Asn Ser
                245                 250                 255
Pro Ile Asn Asn Gly Lys Gly Arg Tyr Gly Val Lys Gly Phe Ser Phe
            260                 265                 270
Arg Tyr Gly Asp Gly Val Trp Ile Gly Arg Thr Lys Ser Leu Glu Ser
        275                 280                 285
Arg Ser Gly Phe Glu Met Val Trp Asp Ala Asn Gly Trp Val Ser Thr
    290                 295                 300
Asp Lys Asp Ser Asn Gly Val Gln Asp Ile Ile Asp Asn Asp Asn Trp
305                 310                 315                 320
Ser Gly Tyr Ser Gly Ser Phe Ser Ile Arg Gly Glu Thr Thr Gly Arg
                325                 330                 335
Asn Cys Thr Val Pro Cys Phe Trp Val Glu Met Ile Arg Gly Gln Pro
            340                 345                 350
Lys Glu Lys Thr Ile Trp Thr Ser Gly Ser Ser Ile Ala Phe Cys Gly
        355                 360                 365
Val Asn Ser Asp Thr Thr Gly Trp Ser Trp Pro Asp Gly Ala Leu Leu
    370                 375                 380
Pro Phe Asp Ile
385
<210>6
<211>387
<212>PRT
<213>A型流感病毒
<400>6
Thr Tyr Met Asn Asn Thr Glu Ala Ile Cys Asp Ala Lys Gly Phe Ala
1               5                   10                  15
Pro Phe Ser Lys Asp Asn Gly Ile Arg Ile Gly Ser Arg Gly His Ile
            20                  25                  30
Phe Val Ile Arg Glu Pro Phe Val Ser Cys Ser Pro Ile Glu Cys Arg
        35                  40                  45
Thr Phe Phe Leu Thr Gln Gly Ser Leu Leu Asn Asp Lys His Ser Asn
    50                  55                  60
Gly Thr Val Lys Asp Arg Ser Pro Phe Arg Thr Leu Met Ser Val Glu
65                  70                  75                  80
Val Gly Gln Ser Pro Asn Val Tyr Gln Ala Arg Phe Glu Ala Val Ala
                85                  90                  95
Trp Ser Ala Thr Ala Cys His Asp Gly Lys Lys Trp Met Thr Val Gly
            100                 105                 110
Val Thr Gly Pro Asp Ser Lys Ala Val Ala Val Ile His Tyr Gly Gly
        115                 120                 125
Val Pro Thr Asp Val Val Asn Ser Trp Ala Gly Asp Ile Leu Arg Thr
    130                 135                 140
Gln Glu Ser Ser Cys Thr Cys Ile Gln Gly Asp Cys Tyr Trp Val Met
145                 150                 155                 160
Thr Asp Gly Pro Ala Asn Arg Gln Ala Gln Tyr Arg Ile Tyr Lys Ala
                165                 170                 175
Asn Gln Gly Arg Ile Ile Gly Gln Thr Asp Ile Ser Phe Asn Gly Gly
            180                 185                 190
His Ile Glu Glu Cys Ser Cys Tyr Pro Asn Asp Gly Lys Val Glu Cys
        195                 200                 205
Val Cys Arg Asp Gly Trp Thr Gly Thr Asn Arg Pro Val Leu Val Ile
    210                 215                 220
Ser Pro Asp Leu Ser Tyr Arg Val Gly Tyr Leu Cys Ala Gly Ile Pro
225                 230                 235                 240
Ser Asp Thr Pro Arg Gly Glu Asp Thr Gln Phe Thr Gly Ser Cys Thr
                245                 250                 255
Ser Pro Met Gly Asn Gln Gly Tyr Gly Val Lys Gly Phe Gly Phe Arg
            260                 265                 270
Gln Gly Thr Asp Val Trp Met Gly Arg Thr Ile Ser Arg Thr Ser Arg
        275                 280                 285
Ser Gly Phe Glu Ile Leu Arg Ile Lys Asn Gly Trp Thr Gln Thr Ser
    290                 295                 300
Lys Glu Gln Ile Arg Lys Gln Val Val Val Asp Asn Leu Asn Trp Ser
305                 310                 315                 320
Gly Tyr Ser Gly Ser Phe Thr Leu Pro Val Glu Leu Ser Gly Lys Asp
                325                 330                 335
Cys Leu Val Pro Cys Phe Trp Val Glu Met Ile Arg Gly Lys Pro Glu
            340                 345                 350
Glu Lys Thr Ile Trp Thr Ser Ser Ser Ser Ile Val Met Cys Gly Val
        355                 360                 365
Asp Tyr Glu Val Ala Asp Trp Ser Trp His Asp Gly Ala Ile Leu Pro
    370                 375                 380
Phe Asp Ile
385