一种空间生物学中细胞生长的数值模拟方法 技术领域 本发明涉及一种空间生物学中细胞生长的数值模拟方法, 特别涉及一种基于灰色 系统和支持向量回归的空间环境中细胞生长的建模方法, 属于空间生物学领域。
背景技术 近年来, 随着科技发展和社会需求的增加, 空间资源正在逐渐被开发利用。 由于细 胞、 生物分子水平的研究对组织工程学和临床应用等领域都有重要的意义, 空间生物学逐 渐成为生物等相关领域许多国家研究的热点问题之一。 空间生物学的研究成果可以促进载 人航天, 推动空间资源开发, 实现作物育种, 从而解决人类的生产、 生活等相关问题。
在空间生物学领域中, 采用数学模型的方法是十分必要的。 首先, 在真实的航天环 境中进行相关研究的代价很高, 而且受实验条件的限制, 很多实验不能在航天环境中进行。 同时, 被试者的数目很少, 如何从有限的实验数据中得到更多的信息, 就需要数学模型来解 决此问题 ; 其次, 除了空间搭载, 在地基模拟的实验中, 尽管试验机会大大增多, 但是相对于 正常的地面上的生物学实验, 空间生物学实验中微重力等空间因素产生环境和实验操作等 方面没有建立起一定的标准性、 规范性的内容, 而且空间环境中的因素影响细胞等的作用 机理尚不清楚, 这给相关的实验人员带来了很大的困惑。其中比较典型的是他们无法检验 特定时间点上或时间段内实验结论的正确性, 从而阻碍了实验的进展。第三, 数学建模等 建模方法可以促进传统实验难以实现的细胞等生物结构的网络组成、 复杂动力学行为的研 究, 并获得对它们与环境间相互作用和未来发展的有根据预测。
基于以上存在的问题以及数学模型在空间生物学研究领域中的重要性, 有必要建 立空间生物学相关数学模型。数学建模将会为空间生物学领域相关研究提供一种新的方 法。它通过根据已获得的知识和实验数据构造相应的数学模型, 从而能够实现模拟和预测 相关的信息, 并力求用数学模型的方法分析空间生物学相关现象的作用机理, 对真实的实 验进行指导或验证, 推进研究进展, 从而确保为这一领域的相关研究人员提供一定的帮助。
灰色系统理论的研究对象是 “部分信息已知、 部分信息未知” 的 “小样本” 、 “贫信 息” 不确定性系统, 它通过对 “部分” 已知信息的生成, 开发实现对研究对象较为确切的描述 和认识。Verhulst 模型是灰色系统模型的主要内容之一, 主要用于描述具有饱和状态的过 程, 即 “S” 形过程, 常用于人口预测、 生物生长、 繁殖预测和产品经济寿命预测等。利用该模 型进行灰色系统预测的实质是一次累加生成, 其基本原理是将原始数列一次累加后, 形成 明显的指数规律, 然后用一条曲线去拟和累加生成, 再累减还原即可得到预测值。
支持向量回归基于结构风险最小化的原理, 将实际问题通过非线性映射, 将数据 集映射到高维特征空间, 在高维空间中进行线性回归, 实现原低维空间中的非线性回归, 得 到已有信息下的全局最优解。 这种方法的优点是保证了支持向量回归算法有限样本情况下 模型的较好的泛化能力, 最佳推广能力, 输出函数的平滑性和更为可靠的结果。 这将保证采 用支持向量机建立预测模型能够实现对小样本信息高精度的模拟和预测。
发明内容 本发明的目的是为空间生物学中相关研究提供了一种新的途径, 即提供一种基于 灰色系统和支持向量回归的空间生物学中细胞生长的数值模拟方法。 本发明依据灰色系统 和支持向量回归理论, 根据获得的有限的实验数据, 建立一种高精度、 适合于空间生物学相 关实验的数学模型, 可以较高精度的实现相关实验数据的模拟和预测, 从而对真实的实验 进行指导和验证, 推进研究进展。
本技术方案是通过以下途径来实现的 :
步骤一、 对当前重力参数条件下待研究细胞生长的原始样本序列 X(0) = {x(0)(1), x(0)(2), ......, x(0)(n)} 进行一次累加生成, 其中 x(0)(1), x(0)(2), ......, x(0)(n) 分别代表 第 1, 2, ......, n 天细胞的增殖数据, 增殖数据通过亚甲蓝方法获得, 并通过酶标仪用所吸 (0) 收的光度值表示, 对应细胞个数 ; 并且 x (i) > 0, i = 1, 2, ......, n; 累加生成后得到的 (1) (1) (1) (1) 生成序列为 X = {x (1), x (2), ......, x (n)}, 其中
对生成序列 X(1) = {x(1)(1), x(1)(2), ......, x(1)(n)} 做紧邻均值生成处理, 得到序列 Z(1) = [z(1)(2), z(1)(3), z(1)(4), ......, z(1)(n)], 其中
步骤二、 建立离散时间微分方程模型 : (0)
x (k)+a·z(1)(k) = b(z(1)(k))2
此方程即为灰色系统 Verhulst 模型 ; 其中, a 为发展系数, b 为灰作用量 ;
对灰色系统 Verhulst 模型的白化方程的参数 a 和 b 进行最小二乘估计, 所述灰色 系统 Verhulst 模型的白化方程为 :
并且灰色系统 Verhulst 模型的参数 a 和 b 的最小二乘估计应满足由此得出参数 a 和 b 的值 ; 其中为灰色系统 Verhulst 模型中参数 a 和b 组成的参数列, 且
步骤三、 利用参数 a 和 b 的值确定灰色系统 Verhulst 模型的白化方程的时间响应 函数 x (t) :(1)步骤四、 将白化方程的时间响应函数转化为灰色系统 Verhulst 模型的时间响应序列
其中 k = 1, 2, ......, n。 步 骤 五、 按 照 下 式 进 行 累 减 得 到“ 还 原 值 ”:也就是样本序列 X(0) = {x(0)(1), x(0) (2), ......, x(0)(n)} 的模拟值, 实现该细胞生长初步的模拟和预测, 其中 :
k = 1, 2, ......, n; (1) (0) 且 x (0) = x (1), 由于此模型以原始数据序列中 x(0)(1) 为基础, 所以当 k = 1 时 等于 x(0)(1) ; 步 骤 六、 对 原 始 样 本 序 列 X(0) = {x(0)(1), x(0)(2), ..., x(0)(k), ..., x(0)(n)} 相减, 获得相应的误差序列 E = k = 1, 2, ......,和模拟值 {ε(1), ε(2), ..., ε(k), ..., ε(n)}, 其中 n;
步 骤 七、 对 误 差 序 列 E 进 行 归 一 化 处 理, 得 E ′ = {ε ′ (1), ε ′ (2), ..., ε′ (i), ..., ε′ (n)}, 作为支持向量回归模型的训练样本数据 ; 给定训练集 T = {(x1, m l m y1), ......., (xl, yl)} ∈ (R ×R) , 其中 xi ∈ R , yi ∈ R, i = 1, ......., l, Rm 为 m 维欧氏空 间, R 为一维欧氏空间, l 为训练点的个数 ; 对于 m 维输入值 xi, 第一维是 E′中的 ε′ (i), 其余各维补零 ; 例如选择 m 为 3, 对于输入 xi, 第一维是 E′中的 ε′ (i), 其余二维补零 ; n 输出 yi 为 E′中的 ε′ (i+1), 据此寻找 R 上的一个实值函数 g(x), 使每个 yi 等于对应的 g(xi), 用于推断并获得任一输入 xi 所对应的输出值 yi ;
步骤八、 为了利用归一化后的误差序列 E′的前 n-2 个序列值建立相关的支持向 量回归模型从而实现模拟, 首先选择核函数 : 常用的核函数有线性核函数、 多项式核函数、 高斯径向基核函数等形式, 本实施例选用较常用的以 σ 为参数的高斯径向基核函数 :
步骤九、 利用交叉检验生成最优的模型参数。
① . 首先随机地将步骤七中的训练集 T = {(x1, y1), ......., (xl, yl)} ∈ (Rm×R) l 剖分为 β 份训练模型, β 可根据实际需要选取 ; 利用交叉检验搜索最优参数 : 即每次利用 β-1 份训练模型, 用剩余 1 份验证模型性能。
② . 最后以训练模型在 β 次验证数据上的性能平均值, 即均方误差 (MSE) 作为模
型参数选取的标准, 选取模型参数, 包括惩罚因子 C, 核函数 K(x, xi) 的参数 σ, 损失函数 ω 的范围和步长。
步骤十、 根据步骤九获得的模型参数, 构造并求解凸二次规划问题, 得到的解为 所述凸二次规划问题为 :
满足0 ≤ αi,i = 1, ..., l, 此即为原始最优化问题的对偶问题。
其中, αi, 为 Lagrange 乘子向量, 请参考 《支持向量机——理论、 算法与拓展》 一 步骤十一、 计算偏差 B : 选取位于开区间 (0, C) 中的 α(*) 的分量 αj, 若选到的书, yi 为步骤七给定训练集中对应于输入 xi 的输出。上标 T 表示向量的转置。
则 是 αj,
若选到的是则步骤十二、 利用步骤九生成的最优的模型参数和步骤十一获得的偏差 B, 训练生成 支持向量回归模型 :
其中, g(xi), i = 1, 2, ..., n 即为支持向量回归模型所得的对应归一化后的误差 序列 E′的模拟值。
步骤十三、 由步骤十二中的回归模型计算得出 g(xi), i = n+1, L L, 此即为对应归 一化后的误差序列 E′的预测值。
对原始样本序列前 n-2 项按照步骤一~十三得到细胞生长的第 n-1 项的预测值 ; 然后剔除原始样本序列中第 1 项, 增添预测所得第 n-1 项, 以第 2 至 n-1 项建立序列, 以此 作为 “原始样本序列” , 重复步骤一~十二, 建立新陈代谢组合模型, 得到细胞生长的第 n 项 预测值。
本发明的有益效果是 : 针对空间生物学中细胞生长相关实验的机会少, 作用机理 尚不清楚等原因导致实验数据的准确性难以确定等问题, 提出一种基于灰色系统和支持向 量回归组合数学模型的建模方法, 算法采用灰色系统对小样本数据建立初始 Verhulst 模 运用灰 型, 寻求其现实的内涵规律。 并选用支持向量回归对灰色系统模型的误差进行修正, 色系统和支持向量回归组合模型来达到对数据更高的模拟和预测精度。 该模型综合利用灰 色系统中样本数据少, 原理简单和支持向量回归中精度高, 泛化能力强等优点, 可实现相关
实验数据的模拟和预测。本技术方案提出的算法以中国航天员科研训练中心航天医学与 细胞分子生物学实验室的大鼠骨髓间质干细胞的增殖数据为例对该模型进行研究。 结果表 明, 该模型在模拟微重力、 正常重力和超重三种重力参数条件下均能有效的实现细胞生长 的模拟和预测, 为空间生物学相关领域的研究人员提供一种新方法来指导或验证实验。 附图说明
图 1- 本发明所述一种空间生物学中细胞生长的数值模拟方法流程图 ;
图 2- 不同模型对模拟微重力条件下细胞增殖建模结果的相对误差的比较 ;
图 3- 组合模型对模拟微重力条件下细胞增殖建模结果与原始数据比较 ;
图 4- 组合模型对正常重力条件下细胞增殖建模结果与原始数据比较 ;
图 5- 组合模型对超重条件下细胞增殖建模结果与原始数据比较 ;
图 6- 组合模型对三种重力条件下细胞增殖建模结果的相对误差显示。 具体实施方式
本发明所述的一种空间生物学中细胞生长的数值模拟方法, 实施流程如图 1 所 示。下面结合附图和实施例对本技术方案进行解释。
由于空间环境中细胞生长数据通常小于或等于 7 天, 本实施例实验通过建立模型 预测第 n-1 和第 n 项两项数据来验证模型的精度。先对原始样本序列前 n-2 项按照步骤 一~十三建立灰色系统和支持向量回归模型, 整合灰色系统和支持向量回归各模型产生的 数据, 即累加灰色系统的初始模拟值和支持向量回归对误差的模拟值, 从而得到组合模型 对细胞生长的第 n-1 项的预测值。
然后剔除原始样本序列中第 1 项, 增添预测所得第 n-1 项, 以第 2 至 n-1 项建立序 列, 以此作为 “原始样本序列” , 重复步骤一~十二, 建立新陈代谢组合模型, 得到细胞生长 的第 n 项预测值。
下面进行本发明所述方法的实验验证与应用说明。
应用基于灰色系统和支持向量回归的组合模型对空间生物学中细胞生长相关数 据进行模拟和预测。 实施例实验所用数据为中国航天员科研训练中心航天医学与细胞分子 生物学实验室提供的大鼠骨髓间质干细胞在模拟微重力、 正常重力和超重三种重力参数条 件下的 1 ~ 7 天增殖数据, 相对细胞密度采用亚甲蓝法进行测量, 相应的细胞数量通过酶标 仪用所吸收的光密度值来表示, 对应细胞个数。 原始数据的格式为均值加标准偏差, 这里省 略标准偏差, 只给出均值, 如表 1 所示。
表 1 大鼠骨髓间质干细胞在不同重力条件下的增殖
为验证组合模型的效果, 针对模拟微重力条件下大鼠骨髓间质干细胞的增殖情况 分别建立灰色系统 Verhulst 模型、 支持向量回归模型以及灰色系统和支持向量回归组合
模型。利用各模型建模所得模拟和预测的结果如表 2 所示。不同模型效果的比较采用相对 误差的对比来表示, 如附图 2 所示。对比 1 ~ 7 天细胞增殖建模所得数据的相对误差, 组合 模型均小于灰色 Verhulst 模型和支持向量回归模型。而且对 1 ~ 5 天数据进行模拟, 对 6、 7 天数据进行预测,
表 2 不同模型对模拟微重力条件下细胞增殖建模结果的比较
基于以上所证实的复合模型建模效果的有效性, 对模拟微重力、 正常重力和超重 三种条件下的大鼠骨髓间质干细胞的增殖情况分别建立灰色系统 Verhulst 和支持向量回 归的组合模型, 对序列前 5 项数据进行模拟, 对序列的后 2 项数据进行预测, 建模实验结果 如表 3 所示。模拟和预测的效果分别如图 3、 图 4 和图 5 所示, 各图中两曲线偏差较小, 逼近 程度较好。 经初步判断, 组合模型在模拟微重力、 正常重力和超重三种重力条件下均能够较 高精度的反映细胞的生长趋势。
表 3 组合模型对三种重力条件下细胞增殖模拟及预测结果
用此组合模型对大鼠骨髓间质干细胞在模拟微重力、 正常重力和超重三种条件下 的增殖情况建立模型的精度检验用表 3 中的相对误差来表示, 如图 6 所示。由图中显而易 见, 各个时间点上的相对误差均小于 5%, 此组合模型在三种重力参数条件下建立的模型模 拟结果均较好。
可见, 本技术方案实施例通过对空间生物学中模拟微重力、 正常重力和超重三种 重力参数条件下大鼠骨髓间质干细胞增殖的三组典型的实验数据进行模拟和预测, 证实了 该模型在空间生物学实验中应用的有效性和可行性。 这将能够实现根据实验中的小样本的 实验数据, 预测出下一步可能的实验现象, 从而为空间生物学相关研究人员提供一种新方
法来指导或验证实验。尤其是针对于不同重力条件, 可以根据已有的相关实验数据利用此 建模方法进行定量分析预测, 有利于推进研究进展。
以上所述的具体描述, 对发明的目的、 技术方案和有益效果进行了进一步详细说 明, 所应理解的是, 以上所述仅为本发明的具体实施例而已, 并不用于限定本发明的保护范 围, 凡在本发明的精神和原则之内, 所做的任何修改、 等同替换、 改进等, 均应包含在本发明 的保护范围之内。