《用于表征拓扑网络扰动的系统和方法.pdf》由会员分享,可在线阅读,更多相关《用于表征拓扑网络扰动的系统和方法.pdf(50页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 103843000 A (43)申请公布日 2014.06.04 CN 103843000 A (21)申请号 201280041314.5 (22)申请日 2012.08.24 61/527,946 2011.08.26 US G06F 19/00(2011.01) G06F 19/12(2011.01) (71)申请人 菲利普莫里斯生产公司 地址 瑞士纳沙泰尔 (72)发明人 F马丁 A塞沃尔 (74)专利代理机构 中国国际贸易促进委员会专 利商标事务所 11038 代理人 李玲 (54) 发明名称 用于表征拓扑网络扰动的系统和方法 (57) 摘要 这里公开用于确。
2、定生物系统的网络模型中的 节点的度量的系统、 计算机化方法和产品。 这些系 统和计算机化方法可被用于基于生物系统中的实 体的子集的测量的活动数据量化生物系统对一个 或更多个扰动的响应。基于活动数据和生物系统 的网络模型, 导出代表节点在网络中的相对重要 性的中心度值。中心度值被用于表征网络中的拓 扑扰动, 这些拓扑扰动诸如用于执行敏感度分析、 可视化生物系统中的扰动的拓扑影响或导出对生 物系统对诸如暴露给化学媒介的扰动的响应进行 量化的分数。 (30)优先权数据 (85)PCT国际申请进入国家阶段日 2014.02.25 (86)PCT国际申请的申请数据 PCT/EP2012/066557 2。
3、012.08.24 (87)PCT国际申请的公布数据 WO2013/030137 EN 2013.03.07 (51)Int.Cl. 权利要求书 2 页 说明书 28 页 附图 19 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书2页 说明书28页 附图19页 (10)申请公布号 CN 103843000 A CN 103843000 A 1/2 页 2 1. 一种用于确定生物系统的网络模型中的节点的度量的计算机化方法, 包括 : 在第一处理器处接收与生物系统对媒介的响应对应的一组处理数据, 其中, 生物系统 包含多个生物实体, 各生物实体与所述多个生物实体中的至少。
4、一个其他生物实体相互作 用 ; 在第二处理器处接收与不暴露于媒介的生物系统对应的一组控制数据 ; 在第三处理器处提供代表生物系统的计算因果网络模型, 所述网络模型包括 : 代表生物实体的节点 ; 代表生物实体之间的关系的边, 其中, 边将相应的第一节点连接到相应的第二节点 ; 和 通过第四处理器至少部分地基于所述网络模型来计算节点的子集的扰动指数, 其中, 扰动指数代表相应节点处的处理数据与控制数据之间的差异和扰动对所述相应节点的活 动的影响程度 ; 通过第五处理器至少部分地基于扰动指数计算边的转移概率, 其中, 边的转移概率代 表从相应的第一节点转移到相应的第二节点的可能性 ; 和 通过第六。
5、处理器至少部分地基于所述转移概率生成节点的中心度值, 其中, 中心度值 代表相应节点在所述网络模型中的相对重要性。 2. 根据权利要求 1 的计算机化方法, 其中, 扰动指数是相应节点的下游节点的活动测 量的线性组合。 3.根据权利要求1或2的计算机化方法, 其中, 边的转移概率是第二节点的扰动指数的 线性函数。 4. 根据前面的权利要求中的任一项的计算机化方法, 还包括通过第七处理器计算代表 随机行走在稳定的状态中访问节点的概率的节点的均衡概率。 5. 根据前面的权利要求中的任一项的计算机化方法, 其中, 第六处理器至少部分地基 于均衡概率生成中心度值。 6. 根据前面的权利要求中的任一项的。
6、计算机化方法, 其中, 第六处理器至少部分地基 于随机行走在对其它节点的连续访问之间对相应节点的期望访问次数来生成所述相应节 点的中心度值。 7. 根据前面的权利要求中的任一项的计算机化方法, 其中, 扰动指数进一步基于代表 相应节点处的处理数据与控制数据之间的差异的倍数变化值。 8. 一种计算机化方法, 包括 : 在第一处理器处接收一组第一处理数据 ; 在第二处理器处接收一组第二处理数据 ; 在第三处理器处提供计算因果网络模型, 所述网络模型包括 : 代表生物实体的节点 ; 和 代表生物实体之间的关系的边 ; 通过第四处理器至少部分地基于所述网络模型计算节点的子集的扰动指数, 其中, 扰 动。
7、指数代表相应节点处的第一和第二处理数据之间的差异 ; 通过第五处理器至少部分地基于扰动指数生成相应节点的中心度值, 其中, 中心度值 代表相应节点在网络模型中的相对重要性 ; 通过第六处理器计算第一节点的中心度值关于第二节点的扰动指数的偏导数, 其中, 权 利 要 求 书 CN 103843000 A 2 2/2 页 3 偏导数代表网络模型的拓扑敏感度测量。 9. 根据权利要求 8 的计算机化方法, 其中, 计算偏导数包含确定第二节点的扰动指数 的变化对第一节点的中心度值的变化的影响。 10. 一种计算机化方法, 包括 : 在第一处理器处提供计算网络模型, 所述网络模型包括 : 代表生物实体的。
8、节点 ; 和 代表生物实体之间的关系的边 ; 通过第二处理器至少部分地基于网络模型生成相应节点的中心度值, 其中, 中心度值 代表相应节点在网络模型中的相对重要性 ; 通过第三处理器计算中心度值在代表扰动在网络模型上的影响的谱变换矢量上的投 影。 11. 根据权利要求 10 的计算机化方法, 其中, 计算中心度值的投影包含对中心度值进 行滤波。 12. 一种用于量化生物系统的扰动的计算机化方法, 包括 : 在第一处理器处提供计算因果网络模型, 所述网络模型包括 : 代表生物实体的节点 ; 和 代表生物实体之间的关系的边 ; 通过第二处理器至少部分地基于网络模型生成相应节点的中心度值, 其中, 。
9、中心度值 代表相应节点在网络模型中的相对重要性 ; 和 通过第三处理器聚合中心度值以生成代表生物系统的扰动的网络模型的分数。 13. 根据权利要求 12 的计算机化方法, 其中, 所述分数是标量值。 14. 根据权利要求 12 或 13 的计算机化方法, 其中, 聚合中心度值包含计算中心度值的 线性组合。 15. 根据权利要求 12 或 13 的计算机化方法, 其中, 聚合中心度值包含计算中心度值的 谱变换的线性组合。 权 利 要 求 书 CN 103843000 A 3 1/28 页 4 用于表征拓扑网络扰动的系统和方法 背景技术 0001 人体经常由于曝露于可能有害的媒介而受到扰动, 这在。
10、长期可能形成严重的健康 风险。曝露于这些媒介可损伤人体内部的生物机制的正常功能。为了理解并量化这些扰动 对人体的影响, 研究人员研究了生物系统对曝露于媒介的响应机制。一些研究组广泛利用 体内动物测试方法, 但在从动物测试获得的响应是否可外推到人体上存在疑问。其它方法 包括通过志愿人员的临床研究评价风险。 但这些风险评价的执行是后验的, 并且, 由于疾病 显露会花费几十年, 因此, 这些评价不足以阐明关联有害的物质与疾病的机制。 另一些方法 包括体外实验。 虽然体外细胞和基于组织的方法作为它们的基于动物的对应方法的全部或 部分替代方法被一般地接受, 但这些方法具有有限的价值。由于体外方法关注细胞。
11、与组织 机构的特定方面, 因此它们不总是考虑在整个生物系统中出现的复杂的相互作用。 0002 在过去的十年, 作为用于阐明许多生物过程的作用机制的手段, 出现了结合常规 的依赖剂量的效力和毒性化验的核酸、 蛋白质和代谢物水平的高产量测量。研究人员尝试 将来自这些互异测量的信息与来自科学文献的关于生物途径的知识相结合, 以组建有意义 的生物模型。 为此, 研究人员开始使用可采集大量的数据的数学和计算技术, 诸如聚类和统 计方法, 以识别可能的生物作用机制。 0003 以前的工作探索以下的可能性 : 发现源自对于生物过程的一个或更多个扰动的基 因表达变化的特性签名并随后在附加的数据集中评分签名的有。
12、无。 这方面的大多数工作包 括识别并评分与疾病显型相关的签名。这些显型导出的签名提供显著的分类能力, 但缺少 单个特定扰动与签名之间的必然或因果关系。因此, 这些签名可代表多个相异的未知的扰 动, 这些扰动通过经常未知的机制导致或者源自同一疾病显型。 0004 一种挑战是理解生物系统中的各种单个生物实体的活动如何使得能够激活或抑 制不同的生物机制。 由于诸如基因的单个实体可能被包含在多个生物过程 (例如, 炎症和细 胞增殖) 中, 因此基因活动的测量不足以识别触发该活动的根本的生物过程。 0005 随机行走方法已被用于网络分析中以表征网络拓扑, 例如, Komurov 等 (PLoS Comp。
13、utational Biology,August2010, 6(8) :e1000889) 描述了数据偏置随机行走被定义 并与单个随机行走相比较的方法。但是 Komurov 方法假定各节点具有相关的数据并且网络 是缺乏方向的, 但不提供概率结果, 并且敏感性分析不可用。 另外, 当使用因果网络模型时, 不是所有实体 (表示为模型中的节点) 都可与实验证据关联。并且, 当收集特定的实验数据 时, 网络可能由于通过实验激活的特定机制而被不平等地扰动。 鉴于以上情况, 在本计算生 物领域中不断需要用于在生物分子网络模型中分析高产量数据集的进一步发展且更好的 方法。 发明内容 0006 这里描述用于基。
14、于从生物系统中的实体的子集测量的活动数据来量化生物系统 对一个或更多个扰动的响应的系统、 方法和产品。这里描述用于基于活动数据和生物系统 的网络模型导出中心度值的系统和方法。 当前可用的技术不基于识别负责生物实体在微尺 说 明 书 CN 103843000 A 4 2/28 页 5 寸上的活动的基础机制, 它们也不提供对这些实体起作用的不同的生物机制响应于潜在有 害的媒介和实验条件的激活的定量评价。因此, 特别需要用于鉴于生物机制来分析系统范 围的生物数据、 并量化生物系统响应于媒介或环境变化的变化的改进的系统和方法。 0007 在一个方面中, 这里描述的系统和方法针对用于量化生物系统的扰动 。
15、(例如, 响应 诸如媒介暴露的处理条件或者响应多种处理条件) 的计算机化方法和一个或更多个计算机 处理器。 计算机化方法可包括在第一处理器处接收与生物系统对媒介的响应对应的一组处 理数据。生物系统包含多个生物实体, 各生物实体与生物实体中的至少一个其他生物实体 相互作用。 该计算机化方法还可包括在第二处理器处接收与不暴露于媒介的生物系统对应 的一组控制数据。 该计算机化方法还可包括在第三处理器处提供代表生物系统的计算因果 网络模型。计算因果网络模型包括代表生物实体的节点和代表生物实体之间的关系的边。 边连接相应的第一节点与相应的第二节点。在一些实现中, 边代表节点之间的因果激活关 系。 000。
16、8 计算机化方法还可包括通过第四处理器计算节点的子集的扰动指数。 可至少部分 地基于网络模型计算扰动指数。 扰动指数代表相应节点处的处理数据与控制数据之间的差 异和扰动影响相应节点的活动的程度。 0009 计算机化方法还可包括通过第五处理器计算边的转移概率。 可至少部分地基于扰 动指数计算边的转移概率。 边的转移概率代表从相应的第一节点转移到相应的第二节点的 可能性。这种转移概率可限定 Markov 链。 0010 最后, 计算机化方法还可包括通过第六处理器生成节点的中心度值。可至少部分 地基于转移概率生成节点的中心度值, 并且, 中心度值代表相应节点在网络模型中的相对 重要性。 0011 在。
17、某些实现中, 扰动指数是相应节点的下游节点的活动测量的线性组合。在某些 实现中, 边的转移概率至少部分地基于相应的第二节点的扰动指数。 在这种实现中, 边的转 移概率可以是第二节点的扰动指数的线性函数。 0012 在某些实现中, 计算机化方法还包括通过第七处理器计算代表随机行走在稳定的 状态中访问节点的概率的节点的均衡概率。在这种实现中, 第六处理器可至少部分地基于 均衡概率生成中心度值。 0013 在某些实现中, 第六处理器至少部分地基于随机行走在对其它节点的连续访问之 间对相应节点的期望访问次数生成相应节点的中心度值。在这种实现中, 中心度值可以是 对网络中的所有节点的期望访问次数的线性组。
18、合。 0014 在某些实现中, 通过至少部分地基于不基于扰动指数的简单的转移概率生成的简 单中心度值来归一化中心度值。 0015 在某些实现中, 第一到第六处理器中的每一个包括在单个处理器或单个计算装置 内。在其它实现中, 第一到第六处理器中的一个或多个分布在多个处理器或计算装置上。 0016 在某些实现中, 计算因果网络模型包含存在于代表潜在因果的节点与代表一个或 更多个测量量的节点之间的一组因果关系。 在这些实现中, 活动测量可包含倍数变化 (fold change) 。倍数变化可以是描述节点测量在控制数据与处理数据之间或者在代表不同的处 理条件的两组数据之间从初始值到最终值变化了多少的数。
19、量。 倍数变化数量可代表两种条 件之间的生物实体的活动的倍数变化的对数。 各节点的活动测量可包含由各节点代表的生 说 明 书 CN 103843000 A 5 3/28 页 6 物实体的处理数据与控制数据之间的差异的对数。在某些实现中, 计算机化方法包括通过 处理器生成生成的分数中的每一个的置信区间。 0017 在某些实现中, 生物系统的子集包含但不限于细胞增殖机制、 细胞应力机制、 细胞 炎症机制、 细胞凋亡机制、 衰老、 自我吞噬或坏死和 DNA 修复机制中的至少一种。媒介可包 含但不限于异质物质, 包含不存在于生物系统中或从生物系统中导出的分子或实体。媒介 还可包含但不限于毒素、 治疗性。
20、化合物、 刺激物、 弛缓剂、 天然产品、 制造产品和食品物质。 媒介可包含但不限于通过加热烟草生成的悬浮微粒、 通过燃烧烟草生成的悬浮微粒、 烟草 烟和雪茄烟中的至少一种。 媒介可包含但不限于镉、 汞、 铬、 尼古丁、 烟草特有亚硝胺和它们 的代谢物 (4-( 甲基亚硝胺 )-1-(3- 吡啶 )-1- 丁酮 (NNK) 、 N - 亚硝基降烟碱 (NNN) 、 N- 亚 硝基新烟碱 (NAT) 、 N- 亚硝基新烟草碱 (NAB) 和 4-( 甲基亚硝胺 )-1-(3- 吡啶 )-1- 丁醇 (NNAL) ) 。在某些实现中, 媒介包含用于尼古丁替代疗法的产品。 0018 在另一方面中, 在。
21、这里描述的系统和方法针对用于量化生物系统的扰动的计算机 化方法和一个或更多个计算机处理。 计算机化方法可包括在第一处理器上接收一组第一处 理数据和在第二处理器上接收一组第二处理数据。 计算机化方法还可包括在第三处理器上 提供计算因果网络模型。 网络模型包含代表生物实体的节点和代表生物实体之间的关系的 边。计算机化方法还可包括通过第四处理器计算节点的子集的扰动指数。可至少部分地基 于网络模型计算扰动指数, 并且扰动指数代表相应节点上的第一和第二处理数据之间的差 异。计算机化方法还可包括通过第五处理器生成相应节点的中心度值。可至少部分地基于 扰动指数生成中心度值, 并且, 中心度值代表相应节点在网。
22、络模型中的相对重要性。 计算机 化方法还可包括通过第六处理器计算第一节点的中心度值关于第二节点的扰动指数的偏 导数。偏导数代表网络模型的拓扑敏感度测量。在某些实现中, 计算偏导数包含确定第二 节点的扰动指数的变化对第一节点的中心度值的变化的影响。 0019 在另一方面中, 在这里描述的系统和方法针对用于可视化生物系统上的扰动影响 的计算机化方法和一个或更多个计算机处理。 计算机化方法可包括在第一处理器上提供计 算因果网络模型。网络模型包括代表生物实体的节点和代表生物实体之间的关系的边。计 算机化方法还可包括通过第二处理器生成相应节点的中心度值, 可至少部分地基于网络模 型生成中心度值, 并且中。
23、心度值代表相应节点在网络模型中的相对重要性。计算机化方法 还可包括通过第三处理器生成中心度值在代表扰动在网络模型上的影响的谱变换矢量上 的投影。在某些实现中, 计算中心度值的投影包含对中心度值进行滤波。在某些实现中, 计 算机化方法还包括显示网络模型并显示中心度值在显示的网络模型上的投影的一个或更 多个分量。在某些实现中, 网络模型中的边是非定向的。 0020 在另一方面中, 在这里描述的系统和方法针对用于量化生物系统的扰动的计算机 化方法和一个或更多个计算机处理。 计算机化方法可包括在第一处理器上接收计算因果网 络模型。网络模型包含代表生物实体的节点和代表生物实体之间的关系的边。计算机化方 。
24、法还可包含通过第二处理器生成相应节点的中心度值。 可至少部分地基于网络模型生成中 心度值, 并且中心度值代表相应节点在网络模型中的相对重要程度。计算机化方法还可包 含通过第三处理器聚合中心度值以生成代表生物系统的扰动的网络模型的分数。 在某些实 现中, 分数是标量值。在某些实现中, 聚合中心度值包含计算中心度值的线性组合。在某些 实现中, 聚合中心度值包含计算中心度值的谱变换的线性组合。 说 明 书 CN 103843000 A 6 4/28 页 7 0021 可在具有分别包含一个或更多个处理器的一个或更多个计算装置的计算机化系 统中实现在这里描述的计算机化方法。一般地, 在这里描述的计算机化。
25、系统可包括包含处 理装置的一个或更多个引擎, 处理装置诸如配有硬件、 固件和软件以实施在这里描述的计 算机化方法中的一个或更多个的计算机、 微处理器、 逻辑器件或其它装置或处理器。 在某些 实现中, 计算化系统包含系统响应轮廓引擎、 网络建模引擎和网络评分引擎。 引擎可偶尔被 互连, 并且, 进一步偶尔与包含扰动数据库、 可测量量数据库、 实验数据数据库和文献数据 库的一个或更多个数据库连接。 在这里描述的计算机化系统可包含具有通过网络接口通信 的一个或更多个处理器和引擎的分布式计算系统。 这种实现可适于在多个计算系统上的分 布计算。 附图说明 0022 结合附图考虑以下的详细的描述, 本公开。
26、的其它特征、 其性质和各种优点将十分 明显, 在这些附图中, 相同的附图标记始终指的是相同的部分。 0023 图 1 是用于量化生物网络对扰动的响应的解释性的计算机化系统的框图。 0024 图 2 是用于通过计算网络扰动振幅 (NPA) 分数量化生物网络对扰动的响应的解释 性的处理的流程图。 0025 图 3 是以包含用于两种媒介、 两个参数和 N 个生物实体的数据的系统响应轮廓为 基础的数据的图示。 0026 图 4A 和图 4B 是具有几个生物实体的和它们的关系的生物网络计算模型的示图。 0027 图 5 是用于生成生物网络中的节点的中心度值的解释性的处理的流程图。 0028 图 6 是图。
27、 5 的一部分的更详细的流程图, 表示用于生成一组节点的扰动指数的解 释性的处理。 0029 图 7 是图 5 的一部分的更详细的流程图, 表示用于限定网络上的增强随机行走的 解释性的处理。 0030 图 8 是图 5 的一部分的更详细的流程图, 表示用于计算一组节点的中心度值的解 释性的处理。 0031 图 9 是用于量化生物扰动的影响的示例性分布计算机化系统的框图。 0032 图 10 是可用于实现在这里描述的任意计算机化系统中的任意部件的示例性计算 装置的框图。 0033 图 11 是因果网络模型的简化示图。 0034 图 12 是因果网络的简化示图。 0035 图 13 和图 14 是。
28、网络中的中心度值的投影的谱分量的简化示图。 0036 图 15 是用于细胞增殖的关注肺部的因果网络的例子的示图。 0037 图 16 是节点细胞增殖的中心度值的实验结果的示图。 具体实施方式 0038 一般赋予在本申请的范围内使用的技术术语和表达在相关领域中通常向它们施 加的意思。词语 “包括” 不排除其它的元素或步骤, 不定冠词 “一种” 或 “一个” 不排除多个。 特别关于属性或值的术语 “基本上” 、“大约” 和 “大致” 等也分别确切地限定属性或确切地 说 明 书 CN 103843000 A 7 5/28 页 8 限定值。这里描述定量评价在通过媒介扰动时的生物系统内的变化的大小的计算。
29、系统、 计 算机化的方法和产品。 某些实现包含用于计算表达生物系统的一部分内的变化的大小的数 值的方法。 计算使用从其中通过媒介扰动生物系统的一组控制实验获得的一组数据作为输 入。数据然后被施加到生物系统的特征的网络模型。网络模型被用作模拟和分析的基础, 并代表实现生物系统中的关注的特征的生物机制和路径。 其机制和路径的特征或一些可有 助于生物系统的疾病和不利影响的病理学研究。 使用在数据库中代表的生物系统的现有知 识, 以建构包含在包括正常条件和媒介扰动的各种条件下关于大量的生物实体的状态的数 据的网络模型。使用的网络模型是动态的, 原因是它代表各种生物实体的状态响应扰动的 变化, 并且可生。
30、成媒介对生物系统的影响的定量和客观评价。也提供用于操作这些计算机 化方法的计算机系统和产品。 0039 由本公开的计算机化方法生成的数值可用于确定由制造的产品 (用于安全评价或 比较) 、 包含营养供给的治疗化合物 (用于确定效力或健康益处) 和环境活性物质 (用于预测 长期暴露的风险和与不利影响和发病的关系) 等中的一个或更多个导致的希望的或不利的 生物效果的大小。 0040 在一个方面中, 这里描述的系统和方法基于扰动的生物机制的网络模型提供代表 扰动的生物系统的变化的大小的计算数值。这里称为网络扰动振幅 (NPA) 分数的数值可被 用于概略地代表限定的生物机制中的各种实体的状态变化。 针。
31、对不同媒介或不同类型的扰 动获得的数值可被用于相对比较不同的媒介或扰动对本身实现或显示为生物系统的特征 的生物机制的影响。因此, NPA 分数可被用于测量生物机制对不同的扰动的响应。这里一 般使用术语 “分数” 以表示提供生物系统中的变化的大小的定量测量的值或一组值。通过 使用从样本或被检体获得的一个或更多个数据集, 通过在本领域中任何已知的各种数学和 计算算法并根据这里公开的方法计算这种分数。 0041 NPA 分数可帮助研究人员和临床医生改善诊断、 实验设计、 治疗决定和风险评价。 例如, NPA 分数可用于在毒理分析中筛查一组候选生物机制, 以识别最可能被暴露给潜在有 害媒介所影响的那些。
32、。通过提供响应于扰动的网络测量, 这些 NPA 分数可允许将分子事件 (通过实验数据测量) 与在细胞、 组织、 器官或有机体水平上出现的显型或生物结果相关联。 临床医生可使用 NPA 值以比较受媒介影响的生物机制与患者的生理状况, 以确定当暴露于 媒介时患者最可能经历什么健康风险或益处 (例如, 免疫受损的患者可能特别易受到导致 强烈的免疫抑制响应的媒介的伤害) 。 0042 图 1 是用于量化网络模型对扰动的响应的计算机化系统 100 的框图。特别地, 系 统 100 包含系统响应轮廓引擎 110、 网络建模引擎 112 和网络评分引擎 114。引擎 110、 112 和114时而被互连, 。
33、并进一步时而与包含扰动数据库102、 可测量数据库104、 实验数据数据 库 106 和文献数据库 108 的一个或更多个数据库连接。如这里使用的那样, 引擎包含配有 硬件、 固件和软件以实施一个或更多个计算操作的处理装置, 诸如计算机、 微处理器、 逻辑 器件或参照图 10 描述的其它器件。 0043 图 2 是根据一个实现的用于通过计算网络扰动振幅 (NPA) 分数量化生物网络对扰 动的响应的处理 200 的流程图。处理 200 的步骤被描述为由图 1 的系统 100 的各种部件实 施, 但可通过局域或远程的任何适当的硬件或软件部件执行或者可按任何适当的次序安排 或并行执行这些步骤中的任意。
34、步骤。在步骤 210 中, 系统响应轮廓 (SRP) 引擎 110 从各种 说 明 书 CN 103843000 A 8 6/28 页 9 不同的来源接收生物数据, 并且数据自身可以是各种不同的类型。数据包含来自其中生物 系统被扰动的实验的数据以及控制数据。在步骤 212 中, SRP 引擎 110 生成代表响应于向 生物系统呈现媒介的、 生物系统内的一个或更多个实体改变的程度的系统响应轮廓 (SRP) 。 在步骤214中, 网络建模引擎112提供包含多个网络模型的一个或更多个数据库, 其中的一 个被选择为与关注的媒介或特征相关。 可基于以系统的生物功能为基础的机制的现有知识 进行选择。在某些。
35、实现中, 网络建模引擎 112 可通过使用系统响应轮廓、 数据库中的网络和 前面在文献中描述的网络来提取系统内的实体之间的因果关系, 由此生成、 提炼或扩展网 络模型。在步骤 216 中, 网络评分引擎 114 通过使用网络建模引擎 112 在步骤 214 中识别 的网络和 SRP 引擎 110 在步骤 212 中生成的 SRP 生成各扰动的 NPA 分数。在生物实体之间 的基础关系 (由网络代表) 的背景中, NPA 分数对扰动或处理的生物响应 (由 SRP 代表) 进行 了量化。 0044 本公开的背景中的生物系统包含有机体或有机体的一部分, 包含功能部分, 有机 体在这里被称为被检体。被。
36、检体一般是哺乳动物, 包括人。被检体可以是人口中的单个的 人。这里使用的术语 “哺乳动物” 包含但不限于人、 非人类的灵长目动物、 老鼠、 黑鼠、 狗、 猫、 母牛、 绵羊、 马和猪。人以外的哺乳动物可有利地用作可用于提供人类疾病的模型的被 检体。 非人类的被检体可以是未改性的或一般改性的动物 (例如, 转基因动物或承载一个或 更多个基因变异或沉默基因的动物) 。被检体可以是雄性或雌性。根据操作的目标, 被检体 可以是已暴露于关注的媒介的。 被检体可以是在长时间段上暴露于媒介的, 可选的, 包括研 究之前的时间段。被检体可以是已经暴露于媒介一段时间, 但在不再与媒介接触的。被检 体可以是已被诊。
37、断或识别为具有疾病。 被检体可以是已经历或正在经历疾病或不利的健康 状况的治疗的。 被检体也可以是表现特定的健康状况或疾病的一种或更种症状或风险因素 的。被检体可以是易患疾病的, 并且可以是有症状和没有症状的。在某些实现中, 讨论中的 疾病或健康状况与长时间段地暴露于媒介或媒介使用相关。根据一些实现, 系统 100(图 1) 包含或生成与关注的扰动或结果的类型相关的一个或更多个生物系统及其功能的机制 的计算机化模型 (统称为 “生物网络” 或 “网络模型” ) 。 0045 根据操作背景, 生物系统可限定于不同的水平, 原因是它涉及群体中的单个有机 体、 一般的有机体、 器官、 组织、 细胞类。
38、型、 细胞器、 细胞成分或特定的个体的细胞的功能。 各 生物系统包含一个或更多个生物机制或路径, 其操作显现为系统的功能特征。再现人健康 状况的限定的特征并适于暴露于关注的媒介的动物系统是优选的生物系统。 反映细胞类型 和包含于疾病病因或病理中的组织的、 细胞和器官系统也是优选的生物系统。可给予尽可 能多地概括了体内人体生物学的原生细胞或器官培养以优先权。将体外人细胞培养与从 体内动物模型导出的最等同的培养进行匹配也是十分重要的。这使得能够通过使用体外 的匹配系统作为基准系统来生成从动物模型到体内人体生物学的翻译连续体。因此, 设想 的与在这里描述的系统和方法一起使用的生物系统可由 (但不限于。
39、) 功能特征 (例如, 生物 功能、 生理功能或细胞功能) 、 细胞器、 细胞类型、 组织类型、 器官、 发育阶段或以上的组合限 定。生物系统的例子包含但不限于肺、 外皮、 骨骼、 肌肉、 神经 (例如, 中枢或周围) 、 内分泌、 心血管、 免疫、 循环系统、 呼吸系统、 泌尿、 肾脏、 肠胃、 结肠直肠、 肝和生殖系统。 生物系统的 其它例子包含但不限于上皮细胞、 神经细胞、 血液细胞、 连接组织细胞、 平滑肌细胞、 骨骼肌 细胞、 脂肪细胞、 卵细胞、 精细胞、 干细胞、 肺细胞、 脑细胞、 心脏细胞、 喉细胞、 咽细胞、 食管 说 明 书 CN 103843000 A 9 7/28 页。
40、 10 细胞、 胃细胞、 肾细胞、 肝脏细胞、 乳房细胞、 前列腺细胞、 胰腺细胞、 胰岛细胞、 睾丸细胞、 膀 胱细胞、 子宫颈细胞、 子宫细胞、 结肠细胞和直肠细胞中的各种细胞功能。细胞中的一些可 以是在适当的培养条件下无限期地体外培养或者体外保持的细胞系的细胞。 细胞功能的例 子包含但不限于细胞增殖 (例如, 细胞分裂) 、 退化、 再生、 衰老、 由细胞核进行的细胞活动的 控制、 细胞对细胞信号传输、 细胞变异、 细胞去变异、 分泌、 迁移、 吞噬、 修复、 细胞凋亡和发 育编程。可视为生物系统的细胞成分的例子包含但不限于细胞质、 细胞骨架、 细胞膜、 核糖 体、 线粒体、 细胞核、 。
41、内质网 (ER) 、 Golgi 体、 溶酶体、 DNA、 RNA、 蛋白质、 肽和抗体。 0046 生物系统中的扰动可由一种或更多种媒介在一段时间上通过暴露于或接触生物 系统的一个或更多个部分而导致。 媒介可以是单一物质或混合物或多种 (例如, 一种或更多 种) 物质, 包括不是所有的成分都被识别或表征的混合物。媒介或其成分的化学和物理性 能可能不被完全表征。媒介可由其结构、 其成分或在某些条件下生成媒介的来源限定。媒 介的例子是异质物质 (即, 不存在于生物系统内或者不从生物系统导出的分子或实体) , 以 及在与生物系统接触之后从中生成的任何中间体或代谢物。媒介可以是碳水化合物、 蛋白 质。
42、、 脂质、 核酸、 生物碱、 维生素、 金属、 重金属、 矿物质、 氧、 离子、 酶、 荷尔蒙、 神经传递素、 无 机化学化合物、 有机化学化合物、 环境媒介、 微生物、 粒子、 环境条件、 环境力或物理力中的 一种或更多种。 媒介的非限制性例子包含但不限于营养物、 新陈代谢废物、 毒物、 麻醉毒品、 毒素、 治疗化合物、 刺激物、 弛缓物、 天然产品、 制造产品、 食品物质、 病菌 (感染性蛋白质、 病 毒、 细菌、 真菌、 原生动物) 、 尺寸处于或低于微米范围的粒子或实体、 以上的副产品或以上 的混合物。物理媒介的非限制性例子包含放射线、 电磁波 (包含太阳光) 、 温度上升或降低、 剪。
43、应力、 流体压力、 放电或它们的序列或创伤。 0047 至少一些媒介或所有媒介, 除非以阈值浓度存在或者与生物系统接触一段时间或 者两者的组合, 否则不会扰动生物系统。 导致扰动的媒介的暴露或接触可在剂量上被量化。 因此, 扰动可源自长期暴露给媒介。暴露时间段可由单位时间、 暴露频率或被检体的实际 或估计寿命跨度内的时间百分比来表达。例如, 扰动也可由从生物系统的一个或更多个部 分扣减媒介 (如上所述) 或者限制向其供给媒介导致。例如, 扰动可由减少供给或缺少一种 或更多种营养物、 水、 碳水化合物、 蛋白质、 脂质、 生物碱、 维生素、 矿物质、 氧、 离子、 酶、 荷尔 蒙、 神经传递素、。
44、 抗体、 细胞活素、 光导致, 或者由限制有机体的某部分的移动或者由约束或 要求锻炼导致。可以考虑它们的组合。 0048 至少一些媒介或所有的媒介可根据生物系统的哪个 (哪些) 部分被暴露以及暴露 条件导致不同的扰动。媒介的非限制性例子可包含通过加热烟草生成的悬浮微粒、 通过 燃烧烟草生成的悬浮微粒、 烟草烟、 雪茄烟和任意的它们的气体成分或微粒成分。媒介的 其它非限制性例子包含镉、 汞、 铬、 尼古丁、 烟草特有亚硝胺和它们的代谢物 (4-( 甲基亚硝 胺 )-1-(3- 吡啶 )-1- 丁酮 (NNK) 、 N - 亚硝基降烟碱 (NNN) 、 N- 亚硝基新烟碱 (NAT) 、 N- 亚。
45、 硝基新烟草碱 (NAB) 、 4-(甲基亚硝胺)-1-(3-吡啶)-1-丁醇 (NNAL) ) 和用于尼古丁替代疗 法的任何产品。媒介或复合刺激物的暴露方案应反映每天设置中的暴露的范围和环境。一 组标准暴露方案可被设计为被系统性地应用于等同地很好地限定的实验系统。 各化验可被 设计为收集依赖于时间和剂量的数据以捕获早期和晚期事件并确保覆盖代表性的剂量范 围。 但是, 本领域技术人员可以理解, 在这里描述的系统和方法可被调整和修改以适于针对 的应用, 并且, 可在其它适当的应用中使用在这里设计的系统和方法, 并且, 这种其它的添 说 明 书 CN 103843000 A 10 8/28 页 1。
46、1 加和修改不背离其范围。 0049 在各种实现中, 在包含各种控制的各种条件下生成针对基因表达、 蛋白质表达或 转换、 microRNA 表达或转换、 翻译后修改、 蛋白质修改、 迁移、 抗体生成代谢物轮廓或以上的 两种或更多种的组合的、 高产量系统范围的测量。功能性结果测量是在这里描述的方法所 希望的, 原因是它们一般可用作评价的基准并表示病因中的清楚的步骤。 0050 这里使用的 “样本” 指的是与被检体或实验系统 (例如, 细胞、 组织、 器官或整个动 物) 隔离的任何生物样本。样本可包含但不限于单个细胞或多个细胞、 部分细胞、 组织切片、 切割组织、 组织提取、 组织、 组织培养提取。
47、、 组织培养介质、 呼出气体、 全血液、 血小板、 血清、 血浆、 红细胞、 白细胞、 淋巴细胞、 嗜中性粒细胞、 巨噬细胞、 B 细胞或它们的子集、 T 细胞或 它们的子集、 造血细胞的子集、 内皮细胞、 滑液、 淋巴液、 腹水、 细胞间液、 骨髓、 脑脊髓液、 胸 腔积液、 肿瘤浸润液、 唾液、 黏液、 痰、 精液、 汗、 尿或任何其它体液。可通过包含但不限于静 脉穿刺、 排泄、 活组织检查、 针吸气、 灌洗、 刮擦、 手术切除的手段或在本领域中已知的其它 手段从被检体获得样品。 0051 在操作中, 对给定的生物机制、 结果、 扰动或以上的组合, 系统 100 可生成网络扰 动振幅 (N。
48、PA) 值, 该网络扰动振幅值是网络中的生物实体的状态响应处理条件的变化的定 量测量。 0052 系统 100(图 1) 包含与关注的健康状况、 疾病或生物结果相关的一个或更多个计 算机化的网络模型。这些网络模型中的一个或更多个基于现有生物知识, 并且可从外部来 源上载并在系统 100 内被管理。也可基于测量在系统 100 内重新生成模型。可测量的元素 通过使用现有知识有因果关系地被集成到生物网络模型中。 以下描述的是代表可用于生成 或精炼网络模型的关注的生物系统的变化或代表对扰动的响应的数据的类型。 0053 参照图 2, 在步骤 210 中, 系统响应轮廓 (SRP) 引擎 110 接收生。
49、物数据。SRP 引擎 110 可从各种不同的来源接收该数据, 并且数据自身可具有各种不同的类型。可从文献、 数 据库 (包含来自药物产品或医疗装置的临床前、 临床和临床后测试的数据) 、 基因组数据库 (基因序列和表达数据, 例如, National Center for Biotechnology Information 的 Gene Expression Omnibus或European Bioinformatics Institute的ArrayExpress (Parkinson 等 .2010,Nucl.Acids Res.,doi:10.1093/nar/gkq1040.Pubmed ID21071405) ) 、 商业可用 数据库 (例如, Gene Logic,Gaithersbug,MD,USA) 或实验工作提取SRP引擎110使用的生物 数据。数据可包含来自诸如利用一种或更多种物种的体外、 先体外后体内或体内实验等一 个或更多个不同来源的原始数据, 这些物种是为研究特定的处理条件或暴露给特定媒介的 影响专门设计的。体外实验系统可包含代表人疾病的关。