《基于平衡板使用者健康状态动态监测方法.pdf》由会员分享,可在线阅读,更多相关《基于平衡板使用者健康状态动态监测方法.pdf(16页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 103077302 A (43)申请公布日 2013.05.01 CN 103077302 A *CN103077302A* (21)申请号 201210574024.9 (22)申请日 2012.12.25 G06F 19/00(2006.01) A61B 5/00(2006.01) (71)申请人 杭州电子科技大学 地址 310018 浙江省杭州市下沙高教园区 2 号大街 (72)发明人 郭春生 岳猛 胡典荣 徐俊 董秀青 (74)专利代理机构 杭州求是专利事务所有限公 司 33200 代理人 杜军 (54) 发明名称 基于平衡板使用者健康状态动态监测方法 (57。
2、) 摘要 本发明公开了一种基于平衡板使用者健康状 态动态监测方法。现有的方法不能够及时有效的 解决使用者健康状态监测问题且处理程序繁琐。 本发明首先采集 wii 平衡板使用者的训练数据, 接着对数据进行预处理, 然后提取处理后的数据 的语义特征, 接着用此语义特征作为观测量进行 正常状态知识的累积即 HMM 的训练, 最后利用获 取的模型和语义特征进行健康状态变化的判断。 本发明利用基于平衡板使用者健康状态动态监测 算法, 实现快速精确监测, 边监测边训练边累积正 常状态知识的目的, 并较好地解决了使用者健康 状态未知情况下的监测问题, 从而将使监测更加 智能。 (51)Int.Cl. 权利要。
3、求书 5 页 说明书 9 页 附图 1 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书5页 说明书9页 附图1页 (10)申请公布号 CN 103077302 A CN 103077302 A *CN103077302A* 1/5 页 2 1. 基于平衡板使用者健康状态动态监测方法, 其特征在于该方法的具体步骤是 : 步骤一 : 平衡数据采集, 具体是 : 平衡板四个角的压力传感器感受到压力的作用, 产生四路电压信号, 将这四路电 压信号经过计算可得出使用者压力重心在平衡板的投影位置, 四个传感器的位置坐标 为 , 为了得到大量的训练数据, 将相邻两个传感器产生数据。
4、进行差分处理, 得到 AB 两个位置坐 标的差分数据, AC位置坐标的差分数据, CD 位置坐标的差分 数据, AD 位置坐标的差分数据 ,表示 A 位置的 x 减去 B 位置 的 x 的差值,表示 A 位置的 y 减去 B 位置的 y 的差值,表示 B 位置的 x 减去 C 位置 的 x 的差值,表示 B 位置的 y 减去 C 位置的 y 的差值,表示 C 位置的 x 减去 D 位置 的 x 的差值,表示 C 位置的 y 减去 D 位置的 y 的差值,表示 A 位置的 x 减去 D 位置 的 x 的差值,表示 A 位置的 y 减去 D 位置的 y 的差值 ; 同时将获取的差分数据进行均方 差。
5、处理 : 其中表示四个坐标位置的 x 值的均值,表示四个坐标位置的 y 值的均值, 表示四个坐标位置的 x 值的均方差,表示四个坐标位置的 y 值的均方差, 表示均方差位置坐标 ; 将上述获取的 9 组数据, ,组成 9 维的训练数据 data : 步骤二 : 数据的预处理, 具体是 : 将得到训练数据 data, 通过数据清洗去掉噪声和无关的数据, 通过数据变换将数据转 化成为适合信息处理的形式, 即处理为 LDA 可以使用的文档形式 ; 步骤三 : LDA 提取数据语义特征 , 具体是 : LDA 将每个文档表示为一个主题混合, 每个主题是固定词表上的一个多项式分布 ; LDA 假设文档由。
6、一个主题混合产生, 同时每个主题是在固定词表上的一个多项式分布 ; 这些主 权 利 要 求 书 CN 103077302 A 2 2/5 页 3 题被集合中的所有文档共享 ; 每个文档有一个特定的主题混合比例, 其从 Dirichlet 分布 中抽样产生 ; 作为一种生成式文档模型, 用 LDA 提取文档的隐含语义结构和文档表征已经 成功地应用到很多文本相关的领域 ; 具体来说生成 LDA 生成过程如下 : 1) 选择 N, N 服从分布, N 表示每篇文档的词汇量 ; 2) 选择, 服从分布, 是主题先验参数, 是的先验分布 ; 3) 选择主题参数,服从分布 ; 4) 选择词汇参数,服从分布。
7、, 其中是主题词项分布矩阵 ; 主题模型的推理是生成文档的逆向过程, 已知和先验分布, 根据文档生成过程可 以写出各种随机变量、 和的联合概率, 其中, 表示文档集合, 表 示主题,表示各个词汇, 其下标表示此词汇是第多少个词汇 ; 其中 M 表示文档数目,是第 m 篇文档的主题分布 ; 对主题先验参数进行积分得到, 则根据贝叶斯公式, 其中, 表示除第篇文档中第篇词汇所对应的主题词,表示除第篇文档中 第篇词汇所对应的主题词以外, 其它所有的已知文档中的词汇所对应的主题词, 表示 文档词汇 ; 上式可用来完成主题参数的估计, 即确定其对应的具有语义特征的关键词 ; 给定和情况下, 主题先验参数。
8、、 主题以及每篇文档词汇的联合分布可以表 示为 : 其中, 整合 和, 得到一个词汇的边缘分布 : 依据上面的边缘分布, 得到 M 篇文档概率分布为 : 其中, D 代表 M 篇文档集合, 表示第篇文档标签序号 ; 然后计算给定一篇文档条件下隐藏变量的后验分布, 公式如下所述 : 权 利 要 求 书 CN 103077302 A 3 3/5 页 4 此后验分布采用变分 EM 算法进行推理可得到, 取 Q 分布的函数去逼近 , 其中 Q 分布的形式如下 : 其中 表示狄利克雷参数, 表示多项式参数, 表示多项式的第 n 个参数 ; 为了得到最佳的变分参数将变分分布和真实分布之间的 KL 散度最小。
9、化, 最小值可以通过迭代的方法获得 ; 通过推导可得到和的迭代公式 : 其中 :, 表示在条件下的条件概率期望值, 是对数伽玛函数,是条件多项式参数, 表示第 i 次迭代时的狄利克雷参数 ; 更新 Dirichlet 参数用的是 Newton-Raphson 方法 ; 通过上述的推理, 得到新参数的估计值, 其中携带了是每次使用者产生平衡数据组 成文档的语义特征 ; 这样就完成了 LDA 提取数据的语义特征的过程 ; 步骤四 : 正常状态知识的训练, 具体是 : HMM 异常检测包含两个部分, 前一个部分是对事件的评估, 后一部分是参数的学习, 参 数学习就是模型参数未知, 求最佳模型参数的问。
10、题 ; 将使用者产生的数据组成的数据文 档的语义特征视为 HMM 模型的观测量; 隐马尔可夫模型的第三个问题是如何根据观察序列, 求得模型参数或 调整模型参数, 使得最大 ; 而第三个问题是通过前向 - 后向算法解决的 ; 前向 - 后向算法 首先定义两个变量, 给定观察序列O和隐马尔可夫模型, 定义t时刻位于隐藏状态 的概率变量为 :; 根据前向变量和后向变量的定义, 将上式子用前向, 后向变量表示 : 其中分母是保证 :; 后向变量为 :; 权 利 要 求 书 CN 103077302 A 4 4/5 页 5 给定观察序列 O 和隐马尔可夫模型, 定义 t 时刻位于隐藏状态及 t+1 时刻。
11、位于隐 藏状态的概率变量为 : 同时该变量可有前向 - 后向变量表示 : 上述定义的两个变量也存在着如下关系 : 而且表示观察序列 O 中从状态出发的转移期望概率,表示观察序 列中从状态转移到状态的转移期望概率, 定义了两个变量及相应的转移期望, 一种合 理的重新估计隐马尔可夫模型 (HMM) 的参数, A 和 B 方法如下 : 在 t=1 时处在状态 的期望概率 ; 从状态 到状态的转移期望概率除以从状态 转移出去的期望概 率 ; 在状态观察到的期望概率除以处在状态的期望概 率 ; 其中, 表示初始状态概率, A 表示状态转移矩阵, B 表示混淆矩阵, 表示训练后更新 的初始状态概率,表示训。
12、练后更新的由状态 i 转移到状态 j 的概率,表示训练后更 新的在状态 j 下观察到 k 的概率 ; 通过上述的训练可以得到描述本次训练状态的模型的参 数; 步骤五 : 健康状态监测, 具体是 : 此过程主要涉及到 HMM 三个问题中的评估问题, 采取前向算法则可以解决这一问题 ; 前向算法 定义 t 时刻状态 j 的局部概率为=Pr(观察状态 | 隐藏状态 j) Pr(t 时刻所有 指向状态 j 的路径 ), 对于最后的状态, 其局部概率包括了通过所有可能的路径到达这些状 态的概率 ; 权 利 要 求 书 CN 103077302 A 5 5/5 页 6 特别当t=1时, 没有任何指向当前状。
13、态的路径 ; 故t=1时位于当前状态的概率是初始概 率, 即 Pr(state|t=1)=P(state), 因此, t=1 时的局部概率等于当前状态的初始概率乘 以相关的观察概率 : 计算 t1 时的局部概率; t-1 时刻给出了所有到达此 t 时刻状态的前一路径概率, 因此, 可以通过 t-1 时刻 的局部概率定义 t 时刻的: 可以递归地计算给定隐马尔科夫模型后一个观察序列的概率, 即通过 t=1 时刻的局部 概率计算 t=2 时刻的, 通过 t=2 时刻的计算 t=3 时刻的等等直到 t=T ; 给 定隐马尔科夫模型的观察序列的概率就等于 t=T 时刻的局部概率之和 ; 使用前向算法计。
14、算 T 时长的观察序列的概率 : 已知 T 时长观察序列 : 1) t=1 时刻所有状态的局部概率: 2) 在 t=2,T 时, 对于每个状态的局部概率, 由下式计算 : 3) 最后, 给定 HMM, 观察序列的概率等于 T 时刻所有局部概率之和 : ; 使用者每次使用 Wii 平衡板都将产生训练数据, 同时使用此数据训练出一个 HMM 模 型, 并计算此数据在上次获取的 HMM 模型下产生的概率, 如果前后两次的数据产生概率值 小于动态的更新因子, 则保留此数据产生概率值和此次的 HMM 模型, 不断的重复这个过程, 将会获取更加精细的变化范围, 缩小的变化范围将能更加准确的去判断每次使用平。
15、衡板产 生数据的异常状态, 同时将获取逐渐趋近于正常事件先验知识的 HMM 模型, 反之, 则代表着 使用者的健康状态发生了变化, 可以记录本次异常, 同时舍弃本次的数据产生概率值和 HMM 模型 ; 不断的重复这个过程, 就到达了边训练边监测, 边训练边优化的目的。 权 利 要 求 书 CN 103077302 A 6 1/9 页 7 基于平衡板使用者健康状态动态监测方法 技术领域 0001 本发明属于数据异常检测技术领域, 具体涉及一种基于平衡板使用者健康状态动 态监测方法 背景技术 0002 国内外学者一直在探索各种人体平衡功能障碍的检测手段 , 发展了多种对人 体平衡功能障碍进行检测的。
16、方法。传统的平衡功能检测方法是观察法 : 临床最早建立的 Romberg 实验法, 又名闭目站立试验法, 他是用肉眼观察受检者在两足并拢直立情况下, 睁 眼、 闭眼时身体摇晃情况。1966 年, Graybie 改进了 Romberg 试验中单纯的双足并拢直立试 验, 他在临床上开始使用单腿直立实验法及强化的 Romberg 试验法, 具体方法就是前者要 求受检者在 30s 内单腿直立, 先睁眼, 后闭眼 ; 后者则是在 60s 内使受检者两足一前一后, 足尖接足跟的直立方式, 因前者负重面积及支撑面小, 其难度大于后者, 而后者所需的技巧 比原有的 Romberg 试验法高。以上这些目测法只。
17、能定性地进行评定, 难作定量分析。后来 逐渐改善了这种检测方法, 进一步的引入了量表评定法 : 在大多目前国外临床上常用的平 衡表主要有 Berg 平衡表、 Tinetti 量表、“站起一走” 测试、 功能性前伸及跌倒危险指数等。 这些检测尽管带有定量性质, 但仍属功能的综合评估, 带有主观性, 缺乏对平衡障碍的摇摆 特点深入细致的分析, 所以其应用价值有限。平衡功能测试仪检查法 : 继 Romberg 试验后, Balser 在 1929 年用天平的指针摆动表示人体重心移动情况。Thomas 改弹簧秤测量为电 应力刻度传感器测量 ; 1939 年 Hellebrandt 使用一种活动平台研究。
18、了站立时身体重心的动 摇 ; 1976 年 Terekhov 首先应用压力平板即固定平板评定平衡功能, 记录了人体重心在平 面的连续变化图形及轨迹平衡功能重心摆动检查, 为我们研究平衡功能提供了一个新的手 段。它可以检查中枢神经系统的功能, 可以减刑眩晕、 平衡功能障碍疾病的诊断, 随着计算 机技术的发展, 实现平衡功能监测的方法多种多样, 平衡功能监测也逐渐转向了用于医疗 和保健, 而同时随着 Wii 平衡板的问世, 使平衡功能监测用作日常保健成为了现实, 不再使 平衡功能单一的成为医疗诊断的一种方式。通过 Wii 平衡板使用者可以在日常的玩游戏过 程中同时监测自己的健康状态, 完全不必刻意。
19、的去进行健康状态的监测, 减轻了使用者的 经济和心里双重负担, 基于此, 这种健康监测方式在未来应有更为广阔的使用空间。 发明内容 0003 为了能更加智能, 快速, 准确的监测出使用者健康状态的变化, 即使操作方法更为 简单同时又能更加快速准确的监测, 本发明提出了基于 Wii 平衡板使用者健康状态监测方 法。 该方法具体思路如下:首先每次采集使用者使用Wii平衡板产生的训练数据 ; 然后对数 据进行预处理得到更加准确且能够进行 LDA 处理的数据形式, 然后通过 LDA 提取数据的语 义特征, 将得到的语义特征视为 HMM 的观测量, 然后训练出数据的先验知识库即 HMM 模型, 同时计算。
20、该观测量在上次保留的 HMM 监测模型下的数据产生概率值, 并计算该概率值与前 一次获取的数据产生概率值之差, 若差值的绝对值小于更新因子的绝对值, 则视为使用者 说 明 书 CN 103077302 A 7 2/9 页 8 的健康未发生变化, 并将该数据产生概率值与前面保留的数据产生概率值进行相加, 以便 用来更新更新因子, 同时将本次数据训练出的 HMM 模型作为下次使用者产生数据的监测模 型和训练的基础模型。反之, 则代表着使用者的健康状态发生了变化, 可以记录本次异常, 同时舍弃本次的数据产生概率值和 HMM 模型。不断的重复这个过程, 就会将使用者的健康 信息进行累记积, 若某天使用。
21、者产生数据的概率值减去上一次所获的数据产生概率值之差 的严重偏离了更新因子的绝对值, 则表明该使用者的健康发生了变化, 这时可以提醒使用 者进一步到医院进行专门的检查。 0004 为了方便描述本发明的内容, 首先作以下术语定义 : 0005 定义 1 词汇 0006 词汇一般定义是一篇文档或者语言里所有的词和固定短语的总和, 本发明定义是 将使用者产生的平衡数据经过处理后得到的数据形式视为词汇。 0007 定义 2 语义特征 0008 语义特征是一篇文档中能够描述这篇文档主题分布的参数。 本发明定义为能够最 佳代表每个使用者平衡能力信息数据的量。 0009 定义 3 数据产生概率值 0010 。
22、假设使用者第 n-1 天产生的数据经过 LDA 提取出语义特征为 On-1且由它训练出的 HMM 模型为 n-1, 同时上次获取的 HMM 模型 n-2被保留下来, 那么使用者第 n-1 天产生的 训练数据经过 LDA 提取语义特征 On-1在 n-2下产生的概率 P(On-1|n-2) 被定义为语义特征 On-1在模型 n-2下的数据产生概率值, 并规定第一次使用者产生数据提取的语义特征训练 出的模型下该语义特征产生的概率 P(O0|0) 为初始数据产生概率值。 0011 定义 4 更新因子 0012 假设使用者 N 天的使用中, 有 m 项数据产生概率值被保留了下来, 设这 m 项数据产 。
23、生概率值为 :P(O1|0),P(O4|3),P(On|n-1), 相加后取 m 项数据产生概率值的均值为 : 0013 0014 设更新因子为 L, 则 L mean-P(O0|0)。 0015 定义 5 前向算法 0016 前向算法是用来计算给定隐马尔可夫模型 (HMM) 后一个观察序列的概率, 给定这 种算法, 可以直接用来确定对于已知的一个观察序列, 在一些隐马尔科夫模型 (HMMs) 中哪 一个 HMM 最好的描述了它先用前向算法评估每一个 (HMM) , 再选取其中概率最高的一 个。 0017 定义 6 前向 - 后向算法 0018 前向 - 后向算法又称之为 Baum-Welch。
24、 算法, 是 EM 算法的一个特例。由前向算法 和后向算法组合而成, 是解决 HMM 三个基本问题中的学习问题, 给定一系列的观察序列, 通 过不断迭代寻求最佳的 HMM 参数 。 0019 本发明提出了基于平衡板使用者健康状态动态监测方法, 该方法在 Wii 平衡板的 基础上进行健康状况监测, 包括基于 LDA 的数据语义特征提取和 HMM 的动态评估和学习两 项关键技术。具体处理步骤如下 : 0020 步骤一 : 平衡数据采集 说 明 书 CN 103077302 A 8 3/9 页 9 0021 平衡板四个角的压力传感器感受到压力的作用, 产生四路电压信号, 将这四路电 压信号经过计算可。
25、得出使用者压力重心在平衡板的投影位置, 四个传感器的位置坐标为 A (x1,y1),B(x2,y2),C(x3,y3),D(x4,y4), 为了得到大量的训练数据, 将相邻两个传感器产生数 据进行差分处理, 得到 AB 两个位置坐标的差分数据 Dab(x12,y12), AC 位置坐标的差分 数据 Dac(x13, y13), CD 位置坐标的差分数据 Dcd(x34,y34), AD 位置坐标的差分数据 Dad(x14,y14), x12表示 A 位置的 x 减去 B 位置的 x 的差值, y12表示 A 位置的 y 减去 B 位置的 y 的差值, x23表示 B 位置的 x 减去 C 位置。
26、的 x 的差值, y23表示 B 位置的 y 减 去 C 位置的 y 的差值, x34表示 C 位置的 x 减去 D 位置的 x 的差值, y34表示 C 位置的 y 减去 D 位置的 y 的差值, x14表示 A 位置的 x 减去 D 位置的 x 的差值, y14表示 A 位置的 y 减去 D 位置的 y 的差值。同时将获取的差分数据进行均方差处理 : 0022 0023 0024 0025 0026 Var(x,y) (var(x),var(y) 0027 其中 x表示四个坐标位置的 x 值的均值, y表示四个坐标位置的 y 值的均 值, var(x) 表示四个坐标位置的 x 值的均方差,。
27、 var(y) 表示四个坐标位置的 y 值的均 方差, Var(x,y) 表示均方差位置坐标。 0028 将上述获取的 9 组数据 A(x1,y1), B(x2,y2), B(x2,y2), D(x4,y4), Dab(x12,y12), Dcd(x34,y34), Dad(x14,y14), Dad(x14,y14), Var(x,y) 组成 9 维的训练数据 data : 0029 data (A(x1,y1),B(x2,y2),C(x3,y3),D(x4,y4),Dab(x12,y12), 0030 Dac(x23,y23),Dcd(x34,y34),Dad(x14,y14),Var(x。
28、,y) 0031 步骤二 : 数据的预处理 0032 将得到训练数据 data, 通过数据清洗去掉噪声和无关的数据, 通过数据变换将数 据转化成为适合信息处理的形式, 即处理为 LDA 可以使用的文档形式。 0033 步骤三 : LDA 提取数据语义特征 0034 LDA 将每个文档表示为一个主题混合, 每个主题是固定词表上的一个多项式分布。 LDA 假设文档由一个主题混合产生, 同时每个主题是在固定词表上的一个多项式分布 ; 这 些主题被集合中的所有文档共享 ; 每个文档有一个特定的主题混合比例, 其从 Dirichlet 分布中抽样产生。作为一种生成式文档模型, 用 LDA 提取文档的隐含。
29、语义结构和文档表征 已经成功地应用到很多文本相关的领域。 0035 具体来说生成 LDA 生成过程如下 : 0036 1) 选择 N, N 服从 Poisson() 分布, N 表示每篇文档的词汇量 ; 0037 2) 选择 , 服从 Dirichlet(a) 分布, 是主题先验参数, 是 的先验分 布 ; 0038 3) 选择主题参数 zmn, zmn服从 Multinomial() 分布 ; 说 明 书 CN 103077302 A 9 4/9 页 10 0039 4) 选择词汇参数 wmn, wmn服从分布, 其中是主题 0040 词项分布矩阵。 0041 主题模型的推理是生成文档的逆向。
30、过程, 已知 和先验分布 , 根据文档生成过 程可以写出各种随机变量 D、 z 和 的联合概率, 其中 D w1,w2,wM, 表示文档集合, z 表示主题, w1,w2,.,wM表示各个词汇, 其下标表示此词汇是第多少个词汇。 0042 0043 其中 M 表示文档数目, m是第 m 篇文档的主题分布。 0044 对主题先验参数 进行积分得到 p(z,w|,), 则根据贝叶斯公式, 0045 0046 其中, zn表示除第 m 篇文档中第 n 篇词汇所对应的主题词, z-n表示除第 m 篇文档 中第 n 篇词汇所对应的主题词以外, 其它所有的已知文档中的词汇所对应的主题词, w 表示 文档词。
31、汇。上式可用来完成主题参数的估计, 即确定其对应的具有语义特征的关键词。 0047 给定和情况下, 主题先验参数、 主题z以及每篇文档词汇w的联合分布可 以表示为 : 0048 0049 其中, 整合 和 z, 得到一个词汇的边缘分布 : 0050 0051 依据上面的边缘分布, 得到 M 篇文档概率分布为 : 0052 0053 其中, D 代表 M 篇文档集合, m 表示第 m 篇文档标签序号。 0054 然后计算给定一篇文档条件下隐藏变量的后验分布, 公式如下所述 : 0055 0056 此后验分布采用变分 EM 算法进行推理可得到, 取 Q 分布的函数去逼近 p(,z|w,), 其中 。
32、Q 分布的形式如下 : 0057 0058 其中 表示狄利克雷参数,表示多项式参数, 表示多项式的第 n 个参数。 0059 为了得到最佳的变分参数将变分分布和真实分布 p(,z|w,) 之 间的 KL 散度最小化, 最小值可以通过迭代的方法获得。通过推导可得到 和 的迭代公 式 : 0060 说 明 书 CN 103077302 A 10 5/9 页 11 0061 0062 其中 :表示在条件下i的条件概率期望值, 是对数伽玛函数,是条件多项式参数, i表示第 i 次迭代时的狄利克雷参数。更新 Dirichlet 参数 用的是 Newton-Raphson 方法。 0063 通过上述的推理。
33、, 得到新参数 的估计值, 其中携带了是每次使用者产生平衡数 据组成文档的语义特征。这样就完成了 LDA 提取数据的语义特征的过程。 0064 步骤四 : 正常状态知识的训练 0065 HMM 异常检测包含两个部分, 前一个部分是对事件的评估, 后一部分是参数的学 习, 参数学习就是模型参数未知, 求最佳模型参数 的问题。将使用者产生的数据组成的 数据文档的语义特征视为 HMM 模型的观测量 O O1,O2,.OT。 0066 隐马尔可夫模型的第三个问题是如何根据观察序列 O O1,O2, .OT, 求得模型参 数或调整模型参数 , 使得 P(o|) 最大。而第三个问题是通过前向 - 后向算法。
34、解决的。 0067 前向 - 后向算法 0068 首先定义两个变量, 给定观察序列O和隐马尔可夫模型, 定义t时刻位于隐藏状 态 Si的概率变量为 : t(i) P(qt si|O,) 0069 根据前向变量 t(i) 和后向变量 t(i) 的定义, 将上式子用前向, 后向变量表 示 : 0070 0071 0072 给定观察序列 O 和隐马尔可夫模型 , 定义 t 时刻位于隐藏状态 Si及 t+1 时刻位 于隐藏状态 Sj的概率变量为 : 0073 t(i,j)=P(qt=si,qt+1=sj|O,) 0074 同时该变量可有前向 - 后向变量表示 : 0075 0076 上述定义的两个变量。
35、也存在着如下关系 : 0077 0078 而且表示观察序列 O 中从状态 Si出发的转移期望概率,表示观察 序列中从状态 Si转移到状态 Sj的转移期望概率, 定义了两个变量及相应的转移期望, 一种 合理的重新估计隐马尔可夫模型 (HMM) 的参数 , A 和 B 方法如下 : 说 明 书 CN 103077302 A 11 6/9 页 12 0079 在 t=1 时处在状态 i 的期望概率。 0080 从状态 i 到状态 j 的转移期望概率除以从状态 i 转移出去的期望概 率。 0081 在状态 j 观察到 vk的期望概率除以处在状态 j 的期望概 率。其中, 表示初始状态概率, A 表示状。
36、态转移矩阵, B 表示混淆矩阵, 表示训练后更新 的初始状态概率, 表示训练后更新的由状态i转移到状态j的概率,表示训练后更新 的在状态 j 下观察到 k 的概率。通过上述的训练可以得到描述本次训练状态的模型的参数 0082 步骤五 : 健康状态监测 0083 此过程主要涉及到 HMM 三个问题中的评估问题, 采取前向算法则可以解决这一问 题。 0084 前向算法 0085 定义 t 时刻状态 j 的局部概率为 t(j)=Pr(观察状态隐藏状态 j) Pr(t 时刻所 有指向状态 j 的路径 ), 对于最后的状态, 其局部概率包括了通过所有可能的路径到达这些 状态的概率。 0086 特别当 t。
37、=1 时, 没有任何指向当前状态的路径。故 t=1 时位于当前状态的概率是 初始概率, 即 Pr(state|t=1)=P(state), 因此, t=1 时的局部概率 1(i) 等于当前状态的初 始概率乘以相关的观察概率 : 0087 1(i)=(i)bi(o1) 0088 计算 t1 时的局部概率 s 0089 t-1 时刻 s 给出了所有到达此 t 时刻状态的前一路径概率, 因此, 我们可以通 过 t-1 时刻的局部概率定义 t 时刻的 s: 0090 0091 可以递归地计算给定隐马尔科夫模型后一个观察序列的概率, 即通过 t=1 时刻的 局部概率 s 计算 t=2 时刻的 s, 通过。
38、 t=2 时刻的 s 计算 t=3 时刻的 s 等 等直到 t=T。给定隐马尔科夫模型的观察序列的概率就等于 t=T 时刻的局部概率之和。 0092 使用前向算法计算 T 时长的观察序列的概率 : 0093 已知 T 时长观察序列 : O=O1O2OT 0094 1) t=1 时刻所有状态的局部概率 : 0095 1(j)=(j)bj(o1) 0096 2) 在 t=2,T 时, 对于每个状态的局部概率, 由下式计算 : 说 明 书 CN 103077302 A 12 7/9 页 13 0097 0098 3) 最后, 给定 HMM, 观察序列的概率等于 T 时刻所有局部概率之和 : 0099。
39、 0100 使用者每次使用 Wii 的平衡板都将产生训练数据, 同时使用此数据训练出一个 HMM 模型, 并计算此数据在上次获取的 HMM 模型下产生的概率, 如果前后两次的数据产生概 率值小于动态的更新因子, 则保留此数据产生概率值和此次的 HMM 模型, 不断的重复这个 过程, 将会获取更加精细的变化范围, 缩小的变化范围将能更加准确的去判断每次使用平 衡板产生数据的异常状态, 同时将获取逐渐趋近于正常事件先验知识的 HMM 模型, 反之, 则 代表着使用者的健康状态发生了变化, 可以记录本次异常, 同时舍弃本次的数据产生概率 值和 HMM 模型。不断的重复这个过程, 就到达了边训练边监测。
40、, 边训练边优化的目的。 0101 本发明的有益效果在于针对传统的平衡功能健康监测方法对于使用者无法进行 动态, 快速有效的检测的困难, 提供了一种基于 LDA 和 HMM 的动态平衡功能异常监测方法, 该方法在 LDA 的语义特征提取的基础上, 利用基于 HMM 动态评估和建模的算法作为平衡功 能异常检测的方法, 实现动态积累正常状态信息和动态监测健康状态的监测, 并较好的解 决了健康状态未知人群的监测问题。 附图说明 0102 图 1 为本发明的流程图 ; 0103 图 2 为 LDA 生成模型图, 其中途中 是观测量, 其他元素表示隐藏量。 具体实施方式 0104 本发明的实施流程图如图。
41、 1 所示, 具体实施步骤如下 : 0105 步骤一 : 使用者通过 Wii Fit 平衡板, 完成指定的形体动作, 由于平衡板的四个角 安装有传感器, 人在上面完成指定动作后将会产生各种压力, 四个角的压力传感器感受到 压力的作用, 产生四路电压信号, 将这四路电压信号经过计算可得出使用者压力重心在平 衡板的投影位置, 然后将四个角的位置坐标 A(x1,y1),B(x2,y2),C(x3,y3),D(x4,y4), 及其差 分构成的数据 Dab(x12,y12), Dac(x13, y13), Dcd(x34,y34), Dad(x14,y14) 和它们 的均方差数据 Var(x,y) 组成。
42、训练数据 data, 通过无线网络传给主机。 0106 步骤二 : 将主机上的训练数据 data 进行预处理, 使其成为更为优化的数据源, 首 先对数据进行数据的清洗, 这一步主要是消除噪声和无关数据, 通过填补遗漏数据, 消除异 常数据, 平滑噪声数据, 以及纠正不一致的数据, 去掉数据中的噪声, 填充空值, 丢失值和处 理不一致数据, 由于原始数据的形式不适合 LDA 算法处理需要, 还要对数据进行数据变换, 将数据变换成文档形式, 该文档内容代表着处理过的平衡功能数据。 0107 步骤三 : 将经过上一步处理得到的文档形式的数据, 通过 LDA 进行语义特征提取, 主题模型的推理生成文档。
43、的逆向过程, 已知参数 和 , 根据文档生成过程可写出各种随 机变量 z 和 的联合概率, 其中 D (w1,w2,.wM), 代表着 M 篇文档集合 : 说 明 书 CN 103077302 A 13 8/9 页 14 0108 0109 进一步处理上式可以得到 M 篇文档概率分布为 : 0110 0111 LDA 关键的推理问题是计算给定一篇文档条件下隐藏变量的后验分布, 公式如 下 : 0112 0113 通过变分推理算法, 我们可以得到代表每个文档语义特征的参数估计式 : 0114 0115 这也就是要提取的每个文档的语义特征。 0116 步骤四 : 前一次使用 Wii Fit 的平衡。
44、板产生的数据训练且被保留的 HMM 模型被用 来定义为当前的 HMM 模型 =(,A,B) (基础模型) , 利用该模型和本次使用者产生的数据, 重新估计的 HMM 模型为 0117 0118 0119 0120 利用上述结论, 即可进行模型估计, 假设前一次使用Wii Fit的平衡板产生的数据 训练的并同时被保留的 HMM 模型被用来定义为当前的 HMM 模型 =(,A,B)(基础模型) , 利用该模型计算上面三个式子的右端, 再定义重新估计的 HMM 模型为那么上面 三个式子的左端就是重估的 HMM 参数, 亦即本次使用者产生数据训练出的 HMM, 通过不断的 选取上次训练且被保留 HMM。
45、 模型作为下次训练的基础模型用于计算上面三个式子, 由此可 不断的重新估计 HMM 参数, 由于每次基础模型的选取都是基于上次趋近于正常事件的数据 训练出来的, 那么在多次迭代后 HMM 模型将越来越趋近于正常事件的先验知识库并且随着 迭代次数的增加将与正常事件的知识库到达无限接近的程度。 为下一步数据的监测提供了 无限接近于正常事件先验知识库的模型, 将使下一步的监测更加准确有效。 0121 步骤五 : 使用者每次使用 Wii Fit 的平衡板都将产生训练数据, 经过一系列图像 预处理和LDA提取数据的语义特征, 同时使用此语义特征训练出一HMM模型, 并计算此语义 特征在步骤四获取的 HM。
46、M 模型下产生的概率, 如果前后两次的语义特征产生概率值小于动 态的更新因子, 则保留此数据产生概率值和此次的HMM模型, 并将此次获取的HMM模型为下 次训练数据的评估模型 (监测模型) 和基础模型, 同时视为使用者的健康状态与之前的状况 说 明 书 CN 103077302 A 14 9/9 页 15 未发生变化, 反之, 则代表着使用者的健康状态发生了变化, 可以记录本次异常并通知使用 者, 同时舍弃本次的数据产生概率值和 HMM 模型。不断的重复这个过程将不断的获取相对 更加小的更新因子, 亦即会获取更加小的变化范围, 缩小的变化范围将能更加准确的去判 断每次使用平衡板产生数据的异常状态, 同时将获取逐渐趋近于正常事件先验知识的 HMM 模型, 不断的重复这个过程, 就可以边训练边监测, 边训练边优化。 说 明 书 CN 103077302 A 15 1/1 页 16 图 1 图 2 说 明 书 附 图 CN 103077302 A 16 。