《生物信息处理方法和装置、记录介质及程序.pdf》由会员分享,可在线阅读,更多相关《生物信息处理方法和装置、记录介质及程序.pdf(39页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 102959081 A (43)申请公布日 2013.03.06 CN 102959081 A *CN102959081A* (21)申请号 201180032593.4 (22)申请日 2011.06.28 2010-153388 2010.07.05 JP 2011-019632 2011.02.01 JP C12N 15/09(2006.01) A61B 5/00(2006.01) A61B 5/145(2006.01) C12M 1/00(2006.01) (71)申请人 索尼公司 地址 日本东京 (72)发明人 樱田一洋 (74)专利代理机构 北京康信知识产。
2、权代理有限 责任公司 11240 代理人 余刚 吴孟秋 (54) 发明名称 生物信息处理方法和装置、 记录介质及程序 (57) 摘要 本发明提供了一种能够预测和控制生物体的 状态变化的生物信息处理方法和装置、 存储介质 和程序。在特定时间间隔内测量生物体中的分子 的表达水平 ; 将所测量的时间序列数据分为周期 分量、 环境刺激响应分量和基线分量 ; 根据基线 分量的变化或根据周期分量的振幅或周期变化识 别时间序列数据的恒定区, 并识别所识别出的恒 定区之间的因果关系。识别外部环境和内部环境 的变化之间的关系, 并根据所识别出的恒定区间 的因果关系推定生物体的状态变化。 此外, 根据外 部环境和。
3、内部环境的变化之间的关系, 能够推定 生物体内的疾病发作。分子可为血液中的分子或 培养基中的分子。 (30)优先权数据 (85)PCT申请进入国家阶段日 2012.12.28 (86)PCT申请的申请数据 PCT/JP2011/064743 2011.06.28 (87)PCT申请的公布数据 WO2012/005138 JA 2012.01.12 (51)Int.Cl. 权利要求书 2 页 说明书 24 页 附图 12 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书 2 页 说明书 24 页 附图 12 页 1/2 页 2 1. 一种生物信息处理方法, 包括以下步骤。
4、 : 在特定时间间隔内测量生物体中的分子的表达水平 ; 将测量出的时间序列数据分为周期分量、 环境刺激响应分量和基线分量 ; 根据所述基线分量的变化或根据所述周期分量的振幅或周期变化识别所述时间序列 数据的恒定区, 并识别所识别的所述恒定区之间的因果关系 ; 以及 根据所识别出的所述恒定区之间的因果关系推定所述生物体的状态变化。 2. 根据权利要求 1 所述的生物信息处理方法, 其中, 所述识别步骤包括进一步识别所述生物体的状态变化和外部环境之间的关系, 以及 所述推定步骤包括根据所识别出的所述生物体的状态变化和所述外部环境之间的关 系进一步推定所述生物体的疾病发作。 3. 根据权利要求 1 。
5、所述的生物信息处理方法, 其中, 所述测量步骤包括测量代表全身 状态、 局部状态和染色体状态的分子。 4. 根据权利要求 1 所述的生物信息处理方法, 其中, 所述分子是所述生物体的血液分 子。 5. 根据权利要求 1 所述的生物信息处理方法, 其中, 所述分子是与代谢综合症相关联 的分子。 6. 根据权利要求 1 所述的生物信息处理方法, 其中, 所述分子是培养基中的分子。 7. 一种生物信息处理装置, 包括 : 测量单元, 在特定时间间隔内测量生物体中的分子的表达水平 ; 分割单元, 将测量出的时间序列数据分为周期分量、 环境刺激响应分量和基线分量 ; 识别单元, 根据所述基线分量的变化或。
6、根据所述周期分量的振幅或周期变化识别所述 时间序列数据的恒定区, 并识别所识别出的所述恒定区之间的因果关系 ; 推定单元, 根据所识别出的所述恒定区之间的因果关系推定所述生物体的状态变化。 8. 一种记录介质, 所述记录介质中记录有使计算机执行以下步骤的程序 : 在特定时间间隔内测量生物体中的分子的表达水平 ; 将测量出的时间序列数据分为周期分量、 环境刺激响应分量和基线分量 ; 根据所述基线分量的变化或根据所述周期分量的振幅或周期变化识别所述时间序列 数据的恒定区, 并识别所识别出的所述恒定区之间的因果关系 ; 以及 根据所识别出的所述恒定区之间的因果关系推定所述生物体的状态变化。 9. 一。
7、种程序, 所述程序使计算机执行以下步骤 : 在特定时间间隔内测量生物体中的分子的表达水平 ; 将测量出的时间序列数据分为周期分量、 环境刺激响应分量和基线分量 ; 根据所述基线分量的变化或根据所述周期分量的振幅或周期性变化识别所述时间序 列数据的恒定区, 并识别所识别出的所述恒定区之间的因果关系 ; 以及 根据所识别出的所述恒定区之间的因果关系推定所述生物体的状态变化。 10. 一种生物信息处理方法, 包括以下步骤 : 获取受试者的生物体的生物分子的细胞记忆信息 ; 获取与所述受试者的生物体的环境条件相关联的环境信息 ; 权 利 要 求 书 CN 102959081 A 2 2/2 页 3 获。
8、取与包含在所述受试者的生物体中的基因序列相关联的基因信息 ; 搜索所述受试者之外的人的生物体的与所获取的所述细胞记忆信息、 所述环境信息和 所述基因信息相关联的类似信息。 11. 根据权利要求 10 所述的生物信息处理方法, 其中, 所述基因信息是单核苷酸多态 性和结构多态性。 12. 根据权利要求 11 所述的生物信息处理方法, 其中, 基于所述细胞存储信息、 所述环 境信息和所述基因信息间的相关关系的相似度进行搜索。 13. 根据权利要求 12 所述的生物信息处理方法, 其中, 所述获取细胞记忆信息的步骤 包括以下步骤 : 在特定时间间隔内测量所述受试者的生物体中的分子的表达水平 ; 将所。
9、测量出的时间序列数据分为周期分量、 环境刺激响应分量和基线分量 ; 以及 根据所述基线分量的变化或根据所述周期分量的振幅或周期变化识别所述时间序列 数据的恒定区, 并识别所识别出的所述恒定区之间的因果关系。 14. 一种生物信息处理装置, 包括 : 细胞记忆信息获取单元, 获取受试者的生物体的生物分子的细胞记忆信息 ; 环境信息获取单元, 获取与所述受试者的生物体的环境条件相关联的环境信息 ; 基因信息获取单元, 获取与包含在所述受试者的生物体中的基因序列相关联的基因信 息 ; 以及 搜索单元, 搜索另一生物体的与所获取的所述细胞存储信息、 所述环境信息和所述基 因信息相关联的类似信息。 15。
10、. 一种记录介质, 所述记录介质中记录有使计算机执行以下步骤的程序 : 获取受试者的生物体的生物分子的细胞记忆信息 ; 获取与所述受试者的生物体的环境条件相关联的环境信息 ; 获取与包含在所述受试者的生物体中的基因序列相关联的基因信息 ; 搜索另一生物体的与所获取的所述细胞记忆信息、 所述环境信息和所述基因信息相关 联的类似信息。 16. 一种程序, 所述程序使计算机执行以下步骤 : 获取受试者的生物体的生物分子的细胞记忆信息 ; 获取与所述受试者的生物体的环境条件相关联的环境信息 ; 获取与包含在所述受试者的生物体中的基因序列相关联的基因信息 ; 搜索另一生物体的与所获取的所述细胞记忆信息、。
11、 所述环境信息和所述基因信息相关 联的类似信息。 权 利 要 求 书 CN 102959081 A 3 1/24 页 4 生物信息处理方法和装置、 记录介质及程序 技术领域 0001 本技术涉及一种生物信息处理方法和装置、 记录介质和程序, 具体地涉及一种预 测和控制人类生物体状态的未来变化的生物信息处理方法和装置、 记录介质和程序。 背景技术 0002 新的治疗方案、 诊断方案和预防方案的开发的生产性低下一直是解决与健康相关 的社会问题的重要问题。 由于基础生物学中获得的巨大感知不能有效地用于解决临床实践 中的问题 (非专利文献 1) , 所以造成生产性低下。根据最新的国际调查, 目前患有糖。
12、尿病的 世界人口已增加至 2 亿 8500 万。患有糖尿病的人口预计到 2030 年将超过 4 亿 3500 万, 超 过北美人口。这表明世界上的成人糖尿病的患病率接近 7%。 0003 人体包含 60 万亿个细胞, 具有存储每个细胞包含 6 亿个碱基对的 DNA(脱氧核糖 核酸) 信息的复杂性, 并且是在人的一生中进行细胞分裂 1016次的动态系统。除了数以百万 计的碱基置换之外, 在两个个体之间还可观察到 DNA 结构的多样性, 诸如 DNA 序列的损失、 重复和倒位。 0004 生物学的特性之一是级别性。人体以包括诸如 DNA 或蛋白质的分子的 “细胞” 为 基础, 且特征在于包括各种细。
13、胞的子系统、 组织和器官。 级别性对来自环境的刺激响应的反 应时间尺度多样化。细胞内的信息传播以毫秒或秒为单位进行, 细胞之间的信息传播以分 钟或小时的尺度为单位进行, 以及细胞增殖或分化的过程以天或小时为单位进行。时间尺 度的多样性造成生物体的时间延迟。 0005 在复杂多样的生命现象中, 基础生物学已经阐述了包含在生物体中的分子之间的 因果关系以将生物体表象为机械系统。 这是通过从多个参数中选择特定的分子参数并变化 特定分子参数的方案来实施的。 0006 在临床科学中, 通过强调减轻相关症状来治疗疾病。 0007 此外, 为了获得临床效果, 根据指定时间内生物学的指标推定诸如给药量的介入 。
14、与临床结果之间的诸如关系式和规则的实验规则。 0008 现代医学的重要课题是提供适合于每个人的健康管理或治疗。 当其安全性和有效 性已被统计验证的治疗方案或药物治疗被投入市场并被大规模的集团所使用时, 对一部分 患者观察到副作用或没有疗效。其原因之一是接收治疗的病人的基因多样性。关于由于基 因多样性引起的疾病发作的差异, 最近 “ (全基因组关联研究 ; GWAS) ” (非专利文献 2) 一直 在进行分析。 0009 现有技术文献 0010 非专利文献 0011 非专利文献 1 : Nature453 ; 840-9,2008 0012 非专利文献 2 : J.Hum.Genet.Doi:1。
15、0.1038/jhg.2010.19 发明内容 说 明 书 CN 102959081 A 4 2/24 页 5 0013 本发明所要解决的问题 0014 然而, 在目前的临床实践中, 为了仅在有限的时间内测量有限的生物学的指标, 并 统计地平均指标, 因此抽取对群组中所包含的不同人随着时间所获取的各种特性。 此外, 与 强调微观尺度问题的基础生物学相比, 临床研究处理个体级别的宏观尺度问题, 诸如身体 障碍、 生理功能的丧失以及特定疾病或身体状况, 作为临床结果。 在基础生物学和临床研究 中, 在级别间存在差别。 0015 此外, 目前的治疗策略被迫使通过提取随着时间所获取的多样化来构建疾病,。
16、 因 此, 每个治疗策略是对症治疗。 然而, 通过减轻症状, 使得无法从疾病恢复到原始健康状态。 0016 这些问题表明, 当前的基础生物学和临床实践的概念无法预测和控制人类生物体 状态的未来变化, 因此很难开发有效的预防方案和治疗方案。 0017 鉴于上述情况, 本发明技术被构思出并可预测和控制人类生物体状态的未来变 化。 0018 问题的解决方案 0019 本技术的一个方面是生物信息处理方法, 包括以下步骤 : 在特定时间间隔内测量 生物体中的分子的表达水平 ; 将所测量的时间序列数据分为周期分量、 环境刺激响应分量 和基线分量 ; 根据基线分量的变化或根据周期分量的振幅或周期变化识别时间。
17、序列数据的 恒定区, 并识别所识别的恒定区之间的因果关系 ; 以及根据所识别出的恒定区之间的因果 关系推定生物体状态变化。 0020 识别步骤可进一步识别生物体状态变化和外部环境之间的关系, 且推理步骤可进 一步根据所识别出的生物体状态变化和外部环境之间的关系推定生物体的疾病发作。 0021 测量步骤可测量代表全身状态、 局部状态和染色体状态的分子。 0022 分子可以是生物体的血液分子。 0023 分子可以是与代谢综合症相关的分子。 0024 分子可以是培养基中的分子。 0025 根据本技术的一个方面, 在特定时间间隔内测量生物体中的分子的表达水平, 所 测量的时间序列数据被分为周期分量、 。
18、环境刺激响应分量和基线分量, 根据基线分量的变 化或根据周期分量的振幅或周期变化识别时间序列数据的恒定区, 并识别所识别出的恒定 区之间的因果关系。根据所识别出的恒定区之间的因果关系推定生物体状态变化。 0026 本技术的方面的生物信息处理装置、 记录介质和程序是与上面描述的技术的方面 的生物信息处理方法对应的生物信息处理装置、 记录介质和程序。 0027 本技术的另一个方面是一种生物信息处理方法, 包括以下步骤 : 获取受试者的生 物体的生物分子的细胞记忆信息 ; 获取与受试者的生物体的环境条件相关的环境信息 ; 获 取与包含在受试者的生物体中的基因序列相关联的基因信息 ; 以及搜索所述受试。
19、者之外的 人的生物体的、 与所获取的所述细胞记忆信息、 所述环境信息和所述基因信息相关联的类 似信息。 0028 基因信息可以是单核苷酸多态性和结构多态性。 0029 可基于所述细胞记忆信息、 所述环境信息和所述基因信息间的相关关系的相似度 进行搜索。 0030 获取细胞记忆信息的步骤包括以下步骤 : 在特定时间间隔内测量受试者的生物体 说 明 书 CN 102959081 A 5 3/24 页 6 中的分子的表达水平 ; 将所测量的时间序列数据分为周期分量、 环境刺激响应分量和基线 分量 ; 以及根据基线分量的变化或根据周期分量的振幅或周期变化识别时间序列数据的恒 定区, 并识别所识别出的恒。
20、定区之间的因果关系。 0031 根据该本技术的另一方面, 获取受试者的生物体的生物分子的细胞记忆信息 ; 获 取与受试者的生物体的环境条件相关联的环境信息, 获取与包含在受试者的生物体中的基 因序列相关联的基因信息 ; 并搜索所述受试者之外的人的生物体的、 与所获取的所述细胞 记忆信息、 所述环境信息和所述基因信息相关联的类似信息。 0032 本技术的另一方面的生物信息处理装置、 记录介质和程序是与上面描述的技术的 另一方面的生物信息处理方法相对应的生物信息处理装置、 记录介质和程序。 0033 本发明的效果 0034 如上所述, 根据本技术的一个方面和另一个方面, 能够预测和控制人类生物体状。
21、 态的未来变化。 附图说明 0035 图 1 是示出生物信息处理装置的实施方式的构造的框图。 0036 图 2 是示出健康状态预测和控制处理的流程图。 0037 图 3 是示出与使用恒定区作为节点的因果关系相关的模型图。 0038 图 4 是示出生物信息处理装置的另一实施方式的构造的框图。 0039 图 5 是示出培养细胞的细胞状态的预测和控制处理的流程图。 0040 图 6 是示出细胞模型的构造的示图。 0041 图 7 是示出细胞状态的变化的示图。 0042 图 8 是示出信息的因果关系的示图。 0043 图 9 是示出生物信息处理装置的另一实施方式的构造的框图。 0044 图 10 是示。
22、出另一个健康状态预测和控制处理的流程图。 0045 图 11 是示出与生活习惯的因果关系相关的模型的示图。 0046 图 12 是示出表示细胞记忆的历史的矩阵的示图。 具体实施方式 0047 下文中, 将描述用于实施本技术的方式 (在下文中, 被称为实施方式) 。将以下列顺 序进行描述。 0048 1. 过程 0049 2. 定义 0050 3. 第一实施方式 0051 4. 第二实施方式 0052 5. 第三实施方式 0053 6. 第四实施方式 0054 7. 第五实施方式 0055 8. 第六实施方式 0056 9. 第七实施方式 说 明 书 CN 102959081 A 6 4/24 。
23、页 7 0057 10. 第八实施方式 0058 11. 第九实施方式 0059 0060 首先, 将在下面描述本技术的过程。 0061 本技术的开发者严密地研究了代表人类生物体的时间演化以及预测和控制未来 变化的方向的方法。 结果是, 除了通常用于公式化生命的遗传型、 表现型和外部环境的三个 参数之外, 通过引入被称为 “经历时间演化的细胞记忆” 的新参数, 发现可以解决经历时间 演化的人类生物体的问题。此外, 为了使 “经历时间演化的细胞记忆” 公式化, 本技术的开 发者指出, 由于表观遗传修饰和基因修饰, 具有在各细胞中表达的双稳态开关的特性的转 录因子的细胞记忆会随着时间变化。表观遗传。
24、修饰包括 DNA 甲基化或组蛋白修饰, 且基因 修饰包括 DNA 突变或结构变化。 0062 本技术的开发者已经构建了 “经历时间演化的细胞记忆模型” , 这表明通过改变由 双稳态开关控制的目标基因产物的表达水平来使基因修饰和表观遗传修饰改变细胞状态。 此外, 根据 “经历时间演化的细胞记忆模型” , 本技术的开发者已构建了被称为 “染色体状 态” 的概念, 包括作用在染色体上的转录因子、 基因修饰和表观遗传修饰。 0063 接下来, 为了根据所观察到的全身状态或局部状态的值, 推定 “染色体状态” , 本技 术的开发者将作为构成人生物体系统的三个不同级别的全身状态、 局部状态和 “染色体状 。
25、态” 彼此链接起来。为此, 本技术的开发者已构建了对应于全身状态、 局部状态和 “染色体 状态” 的各个级别的宏观模型、 中观模型和微观模型。 此外, 使用该 “生物体级别链接模型” , 本技术的开发者提出以细胞为单位链接和公式化宏观模型、 中观模型和微观模型的方法。 0064 接下来, 为了观察操纵人类生物体的时间演化的 “染色体状态” , 本技术的开发者 研究了将 “生物体级别链接模型” 整合入时间序列模型的方法的开发, 并发现了使用 “生物 状态空间模型” 的新整合方法。于是, 本技术的开发者提出一种通过将使用 “生物状态空间 模型” 反映全身状态的分子标记的时间序列数据分割为周期分量、。
26、 环境刺激响应分量和基 线分量来提取 “染色体状态” 的方法。 0065 于是, 本技术的开发者严密地研究了首次使用由本技术表示的人类生物体的时间 演化变化的数据的控制模型的开发。然后, 本技术的开发者发现表示最初外部环境的输入 响应于随后外部环境的输入而变化的 “构建变化” 的概念, 并提出其中 “经历时间演化的细 胞记忆” 由 “构建变化” 控制的 “动态构建模型” 。 0066 此外, 本技术的开发者进行了严密地研究来对临床实践中的问题应用 “动态构造 模型” , 并提出一种使用 “生物状态空间模型” 识别与生物体中产生的分子的表达水平相关 的时间序列的恒定区的 “生物体局部恒定区模型”。
27、 的方法。此外, 本技术的开发者提出一种 使用在生物体中产生的分子的表达水平的时间序列变化期间发现的生物体局部恒定区作 为节点来分析因果结构和生物体状态跟踪的方法。 0067 0068 接下来, 将描述在本技术的实施方式的描述中使用的术语的定义。 0069 人类生物体的时间演化表示其中人类生物体的状态或功能随时间不可逆地变化 的过程。人在经历了从受精的瞬间的诸如繁殖、 出生、 生长和变老的不可逆变化之后死亡。 疾病的发病经历接收潜在变化的发病的前阶段、 发病、 特定生理功能障碍、 特定生理功能丧 说 明 书 CN 102959081 A 7 5/24 页 8 失、 身体残疾和死亡。这表明人类生。
28、物体的瞬间和另一瞬间在时间上是不同质的。 0070 “经历时间演化的细胞记忆” 表明由转录因子构建的细胞记忆可因基因修饰和被 引入作为输入至细胞的环境或偶然的结果的表观遗传修饰而变化。 细胞记忆按常规可被定 义为, 即使在来自外部环境的刺激消失之后, 仍然保持着通过来自外部环境的刺激所获取 的细胞状态的变化 (Cell140:13-18,2010) 的现象。由细胞表达的分子的类型、 量和修饰特 性表示细胞状态, 且由转录因子控制细胞状态的保持和变化。 0071 即, 常规细胞记忆提供了细胞的状态提供了利用包括在转录因子中的双稳态开关 的特性的特定均衡状态的概念。然而, 仅可提供开关的开 (ON。
29、) 和关 (OFF) 的均一时间。然 而, 实际上, 随着时间引入的基因修饰和表观遗传修饰会随着时间改变由转录因子提供的 细胞状态, 从而进一步与仅由转录因子表现的细胞状态相比时, 使细胞的状态多样化。 0072 即, 在 “经历时间演化的细胞记忆” 中, 可通过可被继承的历史 (诸如基因修饰和表 观遗传修饰) 来公式化细胞状态的多样性, 且 “经历时间演化的细胞记忆” 与常规细胞记忆 的本质不同之处在于可应付时间不均一性。 0073 转录因子形成常规细胞记忆的分子基础。当转录因子的电路是非线性的, 并表示 双稳态特性时, 分子的状态处于开 (ON) 或关 (OFF) 的均衡状态, 且即使在细。
30、胞分裂之后, 记 忆也可被继承。在转录因子和启动子的结合部分之间形成的亲和力, 多个转录因子之间的 协调性或多聚化向转录因子提供非线性的特性。 0074 通过对转录因子的响应提供阈值样的特性, 非线性抵抗瞬时干扰并使表达水平被 继承。此外, 通过正反馈或正双反馈或负双反馈获取足够大的希尔系数的转录因子获取双 稳态开关的特性, 且即使在原始输入消失之后, 状态变化也会被锁定。即, 在细胞中表达的 转录因子的类型、 量和后转译修饰形成常规细胞记忆的骨架。 0075 基因修饰 (诸如在人类基因组中观察到的单核苷酸多态性、 DNA 序列一部分的缺 陷、 重复和复制数的变化) 以及表观遗传修饰 (诸如 。
31、DNA 甲基化、 组蛋白修饰和蛋白质的变 性) 担当 “经历时间演化的细胞记忆” 的分子基础 (Nature Review Genetics7:85-97,2006 ,Cell128:655-658,2007) 。 0076 每个基因修饰和表观遗传修饰直接或间接地改变与转录因子的非线性或双稳态 开关的特性相关的参数, 从而修饰常规细胞记忆的功能。 0077 关于基因修饰, 通过全基因组连锁分析方案分析单核苷酸多态性和疾病发作率之 间的关系。使用分析方案, 十九个基因已被识别为 2 型糖尿病的关联基因。然而, 仅总数 的 1% 是具有突变的糖尿病患者 (Nature462:307-314,200。
32、9) 。同样, 在全部乳腺癌患者的 仅 3% 中观察到 BRCA1/2 基因突变。在对同卵双胞胎的寿命与非同卵双胞胎的寿命进行 比较的实验中, 流行病学调查表明基因序列对寿命的贡献的百分比是约 15% 至 25%(Hum. Genet97:319-323,1996) 。 0078 表观遗传修饰被定义为可在不伴随有 DNA 序列的变化的情况下可继承的基因功 能的改变。DNA 甲基化和染色质蛋白的化学修饰是表观遗传的分子物质。此外, 由于蛋白 质 (诸如朊病毒蛋白和淀粉状蛋白) 的变性而引起的细胞功能的改变在广义上被归类为表 观遗传学。 由沃丁顿提出的表观遗传学的概念用于描述其中在繁殖过程中基因信。
33、息被改变 为表现型的机制。 0079 然而, 表观遗传学的功能影响组织或细胞特定基因表达的确立和维持。 除此之外, 说 明 书 CN 102959081 A 8 6/24 页 9 由于营养状态、 社会压力和化学物质引起的刺激引入表观遗传修饰。人类流行病学的研究 已经报道了, 由于表观遗传学的介入, 胎儿或新生儿阶段期间接收的来自环境的刺激会影 响成年后的慢性疾病的发病率 (Stem Cell Res.4 ; 157-164,2010) 。 0080 上述表观遗传修饰被称为环境表观遗传, 以区别于与细胞分化相关联的发生型表 观遗传。 本技术的开发者已发现, 环境表观遗传的功能被视为 “基于外部环。
34、境信息的改变来 更新 DNA 信息的功能” 。 0081 在影响转录因子的功能变化的基因修饰和表观遗传修饰之间, 继承的时间尺度是 不同的。基因修饰是从父母遗传给孩子的细胞记忆的主要原因。另一方面, 表观遗传修饰 在时代中获得的细胞记忆中起主要作用。 0082 然而, 跨代表观遗传的发现表明在生殖细胞系中引入的环境表观遗传抵抗繁殖的 初期化, 并从父母遗传给孩子 (Stem Cell Res.4 ; 157-164,2010) 。此外, 新基因修饰 (诸如 引入体细胞的 DNA 突变或错位) 被视为致癌的主要原因。 0083 “经历时间演化的细胞记忆的模型” 是被引入来将由于基因修饰和表观遗传。
35、修饰 而随时间变化的 “经历时间演化的细胞记忆” 公式化的概念。随时间变化的转录因子的表 达特性、 基因修饰和表观遗传修饰被整合到 “染色体状态” 中。 0084 这不同于常规细胞记忆, 其相对于转录因子仅定义开 (ON) 和关 (OFF) 两种状态。 在本技术的染色体状态下, 相对于利用转录因子产生的目标基因产物, 抑制作用和诱导离 散地变化。通过引入染色体状态的概念, 细胞状态被公式化为染色体状态和细胞的外部环 境状态的两个时间序列变化的连接。此外,“经历时间演化的细胞记忆” 被公式化为 “染色 体状态” 的时间序列变化的函数。 0085 “生物体级别链接模型” 是新模型, 其被提议用于使。
36、用 “经历时间演化的细胞记忆” 来预测个人级别的健康或疾病时所请求的 “染色体状态” 和 “个人状态” 的连接。人类个体 是按级别顺序建立的连续体。细胞由分子形成, 且其它复杂实体 (诸如组织和器官) 被构建 于细胞上。 人体的状态可基于上述级别结构被分类为全身状态、 局部状态和染色体状态, 且 响应于每个状态, 可构建宏观、 中观和微观三个不同尺度的模型。 0086 宏观模型是将整个身体视为一种状态的模型。因此, 该状态可由在整个身体中扩 散的分子的表达特性定义。 在整个身体中扩散的分子的代表性示例包括内分泌系统或免疫 系统的激素、 生长因子和细胞因子。 此外, 影响自律神经系统的控制的肾上。
37、腺素和去甲肾上 腺素定义整个身体的状态。 0087 中观模型是一种发现生物体内同质局部空间的状态的模型。 每个器官或组织将同 质状态形成为一体。通常, 炎症等的症状尤其发生在局部部位。这包括形成炎症部位的多 个细胞。另一方面, 组织的细胞新生由少数的组织干细胞的繁殖和分化控制。因此, 中观模 型包括不同数量或类型的细胞, 诸如一个细胞、 炎症组织、 组织和器官。除了在局部环境中 表达的自分泌和旁分泌分子团之外, 局部状态还由全身性分子定义。 0088 微观模型是一种发现包含在每个细胞中的染色体的状态的模型。 微观模型没有处 于细胞状态下的原因是, 细胞状态仅表示由转录因子驱动的外显的细胞记忆,。
38、 并且包括基 因修饰或表观遗传修饰的潜在变化被抽象化。染色体状态由基因修饰、 表观遗传修饰特性 和转录因子的表达特性定义。 0089 染色体状态下的表观遗传修饰和转录因子的表达特性由具有染色体的细胞的局 说 明 书 CN 102959081 A 9 7/24 页 10 部环境和全身性环境控制。除了基因状态之外, 产生全身性分子的细胞还由细胞的局部状 态和染色体状态控制, 且产生作为局部环境的分子的自分泌和旁分泌因子的细胞由全身状 态、 细胞的局部环境和染色体状态控制。即, 这通过公式化为 “染色体状态” 、 局部状态和全 身状态同时决定彼此的变化、 被同时被赋予方向并同时经历时间演化的分析是明。
39、显的。公 式化被称为 “生物体级别链接模型” 。 0090 人接收来自依赖于社会环境、 人类的行为特性等的各种不同环境的刺激。来自外 部环境的刺激由体细胞的各种系统认出, 并且被转译为人体的内部环境变化。 因此, 由于接 收刺激的体细胞系统的个体差异, 来自相同环境的刺激可能不一定会引起内部环境的相同 变化。这表明环境因素的定量测量可能无法单独准确地预测人体的状态变化。来自环境的 刺激可根据特性归类为物理压力 (温度、 氧气、 紫外线等) 、 化学压力 (内分泌干扰物、 致癌物 质等) 、 社会心理压力、 运动压力、 营养压力 (过量进食和饥饿) 、 感染压力、 伤害压力等。 0091 来自环。
40、境的刺激由接收系统检测, 然后被转译成具有不同时间延迟的全身状态、 局部状态和 “染色体状态” 的变化。因此, 为了将 “经历时间演化的细胞记忆” 扩展到全身 体级别的记忆, 时间需要被视为离散分布而不是连续分布。时间延迟的不稳定性由生物体 内的反馈系统控制。因此, 当以发现从反馈系统到新的反馈系统的变化的时间单位发现状 态变化时, 时间延迟的问题会被抽象化。 0092 “生物状态空间模型” 是一种被提出用于将 “生物体级别链接模型” 应用于时间序 列模型的新模型。用于时间序列模型的各种模型一般由状态空间模型以统一方式利用 (时 间序列分析入门, 北川源四朗, 岩波书店, 第 9 章、 11 。
41、章和 12 章) 。此外, 时间序列分析的大 量问题被公式化为状态空间模型的状态推定的问题。 0093 状态空间模型包括两个子模型 : 系统模型 (x) 和观察模型 (y) , 且两种解释是可行 的。当观察模型被视为表达其中观察时间序列数据 yn 被观察的结构的回归模型, 系统模型 (x) 的状态 xn 是回归常数。在这种情况下, 系统模型是一种表达回归系数的时间变化的状 态的模型。另一方面, 当状态 xn 被视为要推定的信号时, 系统模型表示指出信号的产生机 制的模型, 且观察模型表示当实际观察到信号时信号被转换并且添加噪声的状态。 0094 在 “动态构建模型” 中, xn 表达实际的人体。
42、状态, yn 被假定为与细胞外因子群的可 测量表达水平相关联的多变量时间序列矢量, 且状态 xn 被视为要推定的信号。当 “生物体 级别链接模型” 被应用于临床预测时, 测量所有的 “染色体状态” 和局部状态是不现实的。 然 而, 在整个身体中循环的细胞外因子 (诸如激素、 生长因子和细胞因子) 是可以被测量出的。 0095 “生物体级别链接模型” 阐明了 “染色体状态” 、 局部状态和全身状态同时决定彼此 的变化, 被同时指向并实质上经历同时演化。这表明在整个身体内循环的细胞外因子的时 间序列变化的数据包含 “染色体态” 和局部状态的变化。即, 局部状态和 “染色体状态” 的 分量直接或间接。
43、地反映在 yn 上, yn 是包括人体状态 xn 的全身性血液因子的多变量时间序 列数据。该公式化方案被称为 “生物状态空间模型” 。 0096 在整个身体内循环的细胞外因子的时间序列数据 yn 可被分解成分别为使用季节 性调整模型的周期分量、 使用多线性模型的环境刺激响应分量和使用多项式平滑样条模型 的基线分量。 细胞记忆可反映在与生物体中产生的分子的表达相关联的周期分量的振幅和 频率、 刺激响应分量的最高表达水平和长期基线的变化上。因此, 通过组合 “生物体级别链 接模型” 与 “生物状态空间模型” , 能够具体地并按时间顺序表示 “经历时间演化的细胞记 说 明 书 CN 10295908。
44、1 A 10 8/24 页 11 忆” 。 0097 “动态构建模型” 是对经历时间演化的人类生物体的控制理论。生物体的时间演化 的一个功能是来自环境的最初刺激改变对随后相似类型的刺激的响应。 响应改变的分子实 体在本说明书中被称为 “构建的变化” 。经历时间演化的人类生物体可由该公式化控制。 0098 在 “构建的变化”中,“当施加对于生物体不是致命的压力时, 改善对随 后的强压力的响应”的表示通常被称为毒物兴奋效应 (Toxicology and Applied Pharmacology222:122-128,2007) 。到现在为止, 毒物兴奋效应的分子机制尚不清楚。在本 技术的 “经历。
45、时间演化的细胞记忆模型” 中, 包括毒物兴奋效应的 “构建的变化” 阐明了经 过基因修饰和表观遗传修饰的动态细胞记忆担当分子基础。 以此方式, 可以理解到, 慢性疾 病的发作是由本技术的 “经历时间演化的细胞记忆” 和随后压力之间的不匹配所造成的。 0099 “构建的变化” 不同于传统的控制模型, 诸如动态平衡模型和动态非平衡模型, 其 基于基因决定论的固定遗传算法的前提。即,“构建的变化” 假设基因的功能由于来自环境 的输入或偶然因素而变化, 且基因定义的算法在变化的部分被未来继承时变化。 因此, 需要 新的控制理论用于 “构建的变化” 。 0100 在基因决定论中, 表现型 (P(t) 的。
46、时间变化由给定的基因型 (Gx) 和随着时间变 化的环境因素 (E(t) 的乘积表达为如下。 0101 P(t)=GxE(t) (1) 0102 对于一个 “构建的变化” , 表现型 (P(t) 的时间变化由随着时间变化并结合本技 术的 “经历时间演化的细胞记忆” 的染色体状态(C(t)和随时间变化的环境因素(E(t)的 乘积表达为如下。 0103 P(t)=C(t)E(t) (2) 0104 由式子 (2) 表示的生物体模型被称为 “动态构建模型” 。 0105 “生物体局部恒定模型” 是一种使用本技术的 “动态构建模型” 控制健康和疾病 的新的数据处理方案。与在生物体中产生的分子的表达水平。
47、相关的时间序列数据一般是 非恒定的。然而, 甚至非恒定的数据可通过将时间间隔分割为适当的短时间间隔而被假设 为在各个短时间间隔内为恒定的数据。时间序列模型一般被称为局部恒定模型, 在该模型 中, 时间间隔被独立于上述系统功能的算法分割为适当的短间隔, 且各个短时间间隔可被 假设为恒定的 (时间系列分析入门, 北川源四朗, 岩波书店 (Iwanami bookstore,Kitagawa Genshiro,Introduction to time series analysis), 第 8 章) 。 0106 在 “生物体局部恒定模型” 中, 为了将细胞记忆状态的变化分割为各个不同的恒定 状态,。
48、 在生物体中的细胞或培养细胞中表达的分子的表达水平变化的时间序列数据首先通 过使用 “生物状态空间模型” 被分解成周期分量、 环境刺激响应分量和基线的趋势分量, 然 后识别局部恒定区。细胞记忆影响基线分量、 周期分量的振幅和频率以及环境刺激响应分 量的最高表达水平和最低表达水平的变化。其中, 可独立于来自环境的输入强度识别三类 变化 - 基线分量和周期分量的振幅和频率的变化。 0107 在 “生物体局部恒定模型” 中, 局部恒定区由该三类别识别。通常, 局部恒定区被 分为三种状态 : 原始稳定状态、 新的稳定状态和从原始稳定状态至新的稳定状态的变化。 本 技术的 “生物体局部恒定模型” 与常规。
49、的局部恒定模型的根本不同之处在于, 基于生物体的 特性而不是简单地和机械地将时间序列变化分解成恒定区来指定恒定区。 说 明 书 CN 102959081 A 11 9/24 页 12 0108 “使用局部恒定区作为节点来分析因果结构和进行生物状态跟踪的方案” 是一种 通过识别诱导人类生物体的状态经历时间演化而变化的内在原因来预测和控制健康保持 和疾病发作的方案。疾病从获取潜在变化的无症状期开始, 经历急性症状、 慢性、 部分生理 功能紊乱、 部分生理功能损失、 身体残疾、 长期卧床和死亡的非稳定时间演化。 即, 疾病的时 间演化可近似于被视为定常状态的时间分割的连续演化。 0109 为了预测和控制健康状态或疾病的状态变化, 需要使用由细胞产生的分子作为代 理指标, 来对指示全身性复杂方面的疾病的局部恒定状态区进行编码。 这表明, 由疾病。