一种生物医学空缺数据弥补方法.pdf

摘要
申请专利号：	CN201310074916.7	申请日：	2013.03.08
公开号：	CN103177088A	公开日：	2013.06.26
当前法律状态：	终止	有效性：	无权
法律详情：	未缴年费专利权终止IPC(主分类):G06F 17/30申请日:20130308授权公告日:20160518终止日期:20170308\|\|\|授权\|\|\|实质审查的生效IPC(主分类):G06F 17/30申请日:20130308\|\|\|公开
IPC分类号：	G06F17/30; G06N3/08	主分类号：	G06F17/30
申请人：	北京理工大学
发明人：	罗森林; 韩龙飞; 潘丽敏; 张铁梅
地址：	100081 北京市海淀区中关村南大街5号
优先权：
专利代理机构：		代理人：
PDF下载：	PDF下载

内容摘要

本发明涉及一种基于EM聚类-BP神经网络的空缺数据弥补方法，属于生物医学技术领域。本发明首先采用处理不完全数据问题中很重要的迭代算法EM算法，通过EM聚类，将不同缺失数据划分到不同的簇中，完成初步弥补；然后通过BP神经网络方法对每个簇中的完全数据建模，并完成对各个簇中缺失数据的精确弥补。在一定程度上加强弥补算法对任意缺失机制的适用性，并提高弥补的准确性，可适用于生物医学空缺数据弥补领域。

权利要求书

权利要求书
1.   一种生物医学空缺数据弥补方法，其特征在于：针对不同缺失数据的缺失特点将缺失数据划分到具有相应特点的聚类簇中，然后根据BP神经网络算法估计完全数据属性的权重，计算含缺失数据的对应属性缺失值的预测值，实现弥补算法对任意缺失机制的适用性，并提高弥补的准确性。包括如下步骤：
步骤1，将N个被评估对象作为样本集S，其中每个对象包含M个影响2型糖尿病发病的关键属性；将关键属性作为列，不同样本对应的属性值作为行，建立样本集S的矩阵表示[s(a+c)b]；并采用EM聚类方法对样本集S进行聚类，得到k个聚类簇。
步骤2，对步骤1得到的每个聚类簇中的完全数据集分别采用BP神经网络方法M个影响2型糖尿病发病的关键属性进行BP神经网络模型训练，获得M*k个模型，并对每个聚类簇中的缺失数据集中不同属性的缺失数据选取对应BP神经网络模型，计算该缺失数据的估计值。

2.   根据权利要求1所述针对含空缺值的数据的EM聚类方法，具体实现方法为：
步骤1.1，首先将N个对象根据是否含有缺失数据分为两个样本集：完全数据集X和缺失数据集Y。
所述完全数据集X为M个关键属性对应的数据均无缺失的对象集合。集合中所有对象关键属性的数据构成矩阵[xab]，其中矩阵的行数a表示完全数据样本对象，列数b表示完全数据样本各属性对应的数据，b＝1,2,...,M。
所述缺失数据集Y为M个关键属性对应的数据中存在一个或多个缺失的对象集合。集合中所有对象的关键属性数据形成一个矩阵[ycb]，行数c表示缺失数据样本对象，列数b表示缺失数据样本各属性对应的数据。
步骤1.2，设置聚类簇个数k（k≤N），由于样本集S中任意第i个样本ni（1≤i≤N），均服从k个聚类簇的混合概率分布：
$<mrow><MSUB><MI>n</MI><MI>i</MI></MSUB><MO>~</MO><MI>p</MI><MROW><MO>(</MO><MSUB><MI>n</MI><MI>i</MI></MSUB><MO>|</MO><MI>Θ</MI><MO>)</MO></MROW><MO>=</MO><MUNDEROVER><MI>Σ</MI><MROW><MI>j</MI><MO>=</MO><MN>1</MN></MROW><MI>k</MI></MUNDEROVER><MSUB><MI>π</MI><MI>j</MI></MSUB><MI>p</MI><MROW><MO>(</MO><MSUB><MI>n</MI><MI>i</MI></MSUB><MO>|</MO><MSUB><MI>θ</MI><MI>j</MI></MSUB><MO>)</MO></MROW></MROW>]]></MATH></MATHS><BR>步骤1.3，将步骤1.2给定的初始混合概率分布参数估计值Θ0代入缺失数据集Y，获得ycb的后验分布概率为：<BR><MATHS id=cmaths0002 num="0002"><MATH><![CDATA[<mrow><MI>p</MI><MROW><MO>(</MO><MSUB><MI>y</MI><MI>cb</MI></MSUB><MO>|</MO><MSUB><MI>x</MI><MI>ab</MI></MSUB><MO>,</MO><MSUP><MI>Θ</MI><MN>0</MN></MSUP><MO>)</MO></MROW><MO>=</MO><MFRAC><MROW><MSUBSUP><MI>π</MI><MI>k</MI><MN>0</MN></MSUBSUP><MSUB><MI>p</MI><MSUB><MI>y</MI><MI>cb</MI></MSUB></MSUB><MROW><MO>(</MO><MSUB><MI>x</MI><MI>ab</MI></MSUB><MO>|</MO><MSUBSUP><MI>θ</MI><MI>k</MI><MI>o</MI></MSUBSUP><MO>)</MO></MROW></MROW><MROW><MSUBSUP><MI>Σ</MI><MROW><MI>k</MI><MO>=</MO><MN>1</MN></MROW><MI>M</MI></MSUBSUP><MSUBSUP><MI>π</MI><MI>k</MI><MN>0</MN></MSUBSUP><MSUB><MI>p</MI><MI>k</MI></MSUB><MROW><MO>(</MO><MSUB><MI>x</MI><MI>ab</MI></MSUB><MO>|</MO><MSUBSUP><MI>θ</MI><MI>k</MI><MI>o</MI></MSUBSUP><MO>)</MO></MROW></MROW></MFRAC></MROW>]]></MATH></MATHS>其中xab∈X，ycb∈Y<BR>由于样本集间各样本的独立性，得到数据集Y的后验分布函数为：<BR><MATHS id=cmaths0003 num="0003"><MATH><![CDATA[<mrow><MI>p</MI><MROW><MO>(</MO><MI>Y</MI><MO>|</MO><MI>X</MI><MO>,</MO><MSUP><MI>Θ</MI><MN>0</MN></MSUP><MO>)</MO></MROW><MO>=</MO><MUNDEROVER><MI>Π</MI><MROW><MI>b</MI><MO>=</MO><MN>1</MN></MROW><MI>M</MI></MUNDEROVER><MI>p</MI><MROW><MO>(</MO><MSUB><MI>y</MI><MI>cb</MI></MSUB><MO>|</MO><MSUB><MI>x</MI><MI>ab</MI></MSUB><MO>,</MO><MSUP><MI>Θ</MI><MI>o</MI></MSUP><MO>)</MO></MROW></MROW>]]></MATH></MATHS><BR>步骤1.4，根据步骤1.3获得的后验分布函数，对完全数据的对数似然函数lnL(Θ|X，Y)关于缺失数据求期望，并将得到M个对应每一列的期望值，用于代替缺失数据集Y中相应列数的各个缺失数据，得到新样本集Y＇。<BR>所述lnL(Θ|X，Y)为完全数据关于缺失数据的对数似然函数，其中<MATHS id=cmaths0004 num="0004"><MATH><![CDATA[<mrow><MI>ln</MI><MI>L</MI><MROW><MO>(</MO><MI>Θ</MI><MO>|</MO><MI>X</MI><MO>,</MO><MI>Y</MI><MO>)</MO></MROW><MO>=</MO><MI>ln</MI><MI>p</MI><MROW><MO>(</MO><MI>x</MI><MO>,</MO><MI>y</MI><MO>|</MO><MI>Θ</MI><MO>)</MO></MROW><MO>=</MO><MUNDEROVER><MI>Σ</MI><MROW><MI>b</MI><MO>=</MO><MN>1</MN></MROW><MI>M</MI></MUNDEROVER><MI>ln</MI><MI>p</MI><MROW><MO>(</MO><MSUB><MI>x</MI><MI>ab</MI></MSUB><MO>|</MO><MSUB><MI>y</MI><MI>cb</MI></MSUB><MO>)</MO></MROW><MI>p</MI><MROW><MO>(</MO><MSUB><MI>y</MI><MI>cb</MI></MSUB><MO>)</MO></MROW></MROW>]]></MATH></MATHS><BR>步骤1.5，根据步骤1.4计算获得的样本集Y＇以及完全数据集X，重新计算样本集S的最大似然参数Q(Θ,Θ0)：<BR>Q(Θ,Θ0)=∑ln(L(Θ|X，Y)p(Y|X,Θ0))<BR>步骤1.6，将Q(Θ，Θ0)极大化，得到Θ1，满足Q(Θ1，Θ0)＝maxQ(Θ，Θ0)，用Θ1代替Θ0，代入步骤1.3。<BR>步骤1.7，执行步骤1.3至步骤1.6的迭代过程α次，直至停止迭代。最终得到的Θα即为k个聚类簇的混合概率分布参数估计值Θ。其中ε为依据聚类准确度设定的精度值。<BR>步骤1.8，利用混合概率分布参数估计值Θ，分别计算各样本对象属于聚类簇j的后验条件概率密度值，即各对象隶属于每个簇的隶属概率。按照样本与聚类簇的隶属概率最大的原则，把样本集S中的各个样本分入k个聚类簇。<BR><BR>3.   根据权利要求2所述的针对空缺数据的EM聚类方法，其特征在于：步骤1.2中其中Θ＝(π1，π2，…，πk，θ1，θ2，…，θk)表示k个聚类簇的混合概率分布参数，θj表示第j个聚类簇的概率分布参数，πj表示ni来自第j个聚类簇的可能性，j=1,2,…,k，π1+π2+...+πk=1。<BR>因此，设定一组参数值作为样本集S的初始混合概率分布参数估计值。<BR><BR>4.   根据权利要求2所述的EM聚类方法，其特征在于：采用EM方法将求得对数似然函数的期望代替缺失数据，并估计缺失数据所属聚类簇的概率。该方法可应用于含缺失数据的聚类中，结果具有很好的解释性。<BR><BR>5.   根据权利要求1中所述的一种BP神经网络方法，其特征在于：所述步骤2中，第j个聚类簇中对于属性m的BP神经网络模型的具体构建过程如下：<BR>步骤2.1，将聚类簇中的数据划分为完全数据集X′和缺失数据集Y′；并针对完全数据集X′，将X′中的各样本中非属性m对应的数值组成向量其中t为完全数据集X′的样本个数。然后对权值矩阵中的各个元素分别设置一个在区间（‑1,1）内的随机值。<BR>步骤2.2，将各个样本t的属性m对应数值作为实际输出，并将其他属性对应数值作为输入值。然后计算BP神经网络的隐藏层每个节点g输出值。<BR>步骤2.3，以每个隐藏层节点作为输出层输入，计算各节点输出层节点的输出值。<BR>步骤2.4，根据以获得的各样本的输出误差计算全局误差。<BR>步骤2.5，将全局误差与误差阈值比较，若全局误差大于误差阈值，则根据输出误差调整权值矩阵，重复步骤2.2至步骤2.4；若全局误差小于误差阈值，则结束。<BR></p></div>
</div>
</div>
<div class="zlzy">
<div class="zltitle">说明书</div>
<div class="gdyy">
<div class="gdyy_show"><p>说明书一种生物医学空缺数据弥补方法 <BR>技术领域 <BR>本发明涉及一种生物医学空缺数据弥补方法，属于生物医学技术领域。 <BR>背景技术 <BR>近年来，随着计算机科学技术的不断发展，数据挖掘技术被广泛应用于各领域之中。数据挖掘总体过程包括问题理解、数据采集和理解、预处理、数据挖掘、模型评估和知识应用，数据挖掘的成功与否和适用性能在很大程度上取决于数据质量。然而，在针对生物医学数据挖掘各个环节过程中，数据不完全的现象是不可避免的，存在着不同程度的空缺数据，也称为空缺值。为了能在生物医学研究领域中有效地应用数据挖掘的方法和系统，就必须面对数据不完整的挑战。 <BR>对生物医学研究领域来说，空缺值产生有多方面原因：有些医学筛查数据属性的内容没有；有些数据当时被认为是不必要的；由于误解或检测设备失灵导致相关数据没有记录下来；与其他记录内容不一致而被删除；历史记录或对数据的修改被忽略了或者属性的值根本不能直接观测到等。 <BR>面对生物医学研究过程中存在的缺失值，虽然现在已经有很多数据填充方法，但并不存在一种可以适合于任何问题的空缺值填充方法。无论哪种填充方法都无法避免主观因素的存在，并且在空缺值过多的情形下将系统完备化是不可行的。在空缺值弥补技术的研究趋势主要呈现以下两个方面：1.构建空缺值弥补模型，该模型可以较好的适用于生物医学领域中任何空缺数据弥补问题，具有很好的普适性；2.基于数据挖掘和统计理论提出更为合适的算法，能够预测数据中存在的空缺值，并且具有较小的误差。综观现有生物医学空缺数据弥补方法，通常使用的方法有： <BR>1.MI填补算法：该方法针对大部分简单填充方法的填充数据唯一且填充后的数据集不能表现出原有数据集的不确定性，导致结果产生较大的偏差问题而由Rubin提出，该方法是建立在贝叶斯理论基础之上，用EM算法来实现对缺失数据的处理。其主要思想是：首先为每个缺失值构造一套可能的估计值，这些值反映了缺失模型的不确定性，这样就形成若干个完整数据集；然后对每个完整数据集分别使用相同的方法处理；最后综合来自各个填充数据集的结果，得到对目标变量的统计推断。 <BR>2.KNN填补算法：该方法采用数据挖掘中分类思想，通过搜索模式空间，找出最接近空缺数据的k个完全数据，并通过完全数据的加权平均计算空缺数据的空缺值。该方法的主要思想是：首先将数据集分为完全数据集和缺失数据集两个部分；然后计算缺失数据集中的每个样本其与完全数据集中各样本的相似性，找到与缺失数据样本最近邻的k个数据；最后将缺失数据样本与完全数据样本的距离的倒数作为样本间的权重，根据各完全数据计算缺失数据的估计值。 <BR>3.关联规则填补算法：该方法由Agrawal等人于1993年提出，其主要思想是：首先找出所有的频繁项集；然后由频繁项集生成强关联规则；最后利用通过对提取出的关联规则进行排序或分组，取优先权最高的规则进行填补。 <BR>4.K‑means填补算法：该方法的主要思想是首先通过计算完全数据集中各样本间的距离将数据样本分成不同簇，并使同一个簇中的对象之间具有很高的相似度，而不同簇中的对象高度相异；然后计算缺失数据集中各缺失数据与各聚类簇的聚类，并将该缺失数据分到对应的聚类簇中；最后采用不同核函数对缺失数据进行弥补。 <BR>5.SVR（支持向量回归）算法：支持向量回归方法就是针对传统回归分析的局限性，该方法与SVM方法相同，采用结构风险最小化原则，将求解过程转化为一个二次型寻优问题。SVR算法采用核函数的映射方法，将实际问题通过非线性变换转换到高维的特征空间，并在高维空间中构造线性判别函数来实现原空间中的非线性判别函数。通过近似核函数的非线性回归特征空间的线性回归进行空缺值弥补。 <BR>综上所述，现有算法仅针对可忽略的缺失机制下进行研究，不适用于任意缺失机制，提出的各方法不具有代表性；同时，针对生物医学空缺数据弥补的准确性也不甚理想，仍待进一步提高。 <BR>发明内容 <BR>本发明的目的是为解决生物医学数据中存在空缺值的问题，提出一种基于EM聚类‑BP神经网络的空缺数据弥补方法。 <BR>本发明的设计原理为：首先，采用处理不完全数据问题中很重要的迭代算法EM算法，通过EM聚类，将不同缺失数据划分到不同的簇中，完成初步弥补；然后通过BP神经网络方法对每个簇中的完全数据建模，并完成对各个簇中缺失数据的精确弥补。其主要思想是针对不同缺失数据的缺失特点将缺失数据划分到具有相应特点的聚类簇中，然后根据BP神经网络算法估计完全数据属性的权重，计算含缺失数据的对应属性缺失值的预测值，在一定程度上加强弥补算法对任意缺失机制的适用性，并提高弥补的准确性。 <BR>本发明的技术方案是通过如下步骤实现的： <BR>步骤1，将N个被评估对象作为样本集S，其中每个对象包含M个影响2型糖尿病发病的关键属性；将关键属性作为列，不同样本对应的属性值作为行，建立样本集S的矩阵表示[s(a+c)b]；并采用EM聚类方法对样本集S进行聚类，得到k个聚类簇。具体实现方法为： <BR>步骤1.1，首先将N个对象根据是否含有缺失数据分为两个样本集：完全数据集X和缺失数据集Y。 <BR>所述完全数据集X为M个关键属性对应的数据均无缺失的对象集合。集合中所有对象关键属性的数据构成矩阵[xab]，其中矩阵的行数a表示完全数据样本对象，列数b表示完全数据样本各属性对应的数据，b＝1,2,...,M。 <BR>所述缺失数据集Y为M个关键属性对应的数据中存在一个或多个缺失的对象集合。集合中所有对象的关键属性数据形成一个矩阵[ycb]，行数c表示缺失数据样本对象，列数b表示缺失数据样本各属性对应的数据。 <BR>步骤1.2，设置聚类簇个数k（k≤N），由于样本集S中任意第i个样本ni（1≤i≤N），均服从k个聚类簇的混合概率分布： <BR><MATHS num="0001"><MATH><![CDATA[ <mrow><MSUB><MI>n</MI> <MI>i</MI> </MSUB><MO>~</MO> <MI>p</MI> <MROW><MO>(</MO> <MSUB><MI>n</MI> <MI>i</MI> </MSUB><MO>|</MO> <MI>Θ</MI> <MO>)</MO> </MROW><MO>=</MO> <MUNDEROVER><MI>Σ</MI> <MROW><MI>j</MI> <MO>=</MO> <MN>1</MN> </MROW><MI>k</MI> </MUNDEROVER><MSUB><MI>π</MI> <MI>j</MI> </MSUB><MI>p</MI> <MROW><MO>(</MO> <MSUB><MI>n</MI> <MI>i</MI> </MSUB><MO>|</MO> <MSUB><MI>θ</MI> <MI>j</MI> </MSUB><MO>)</MO> </MROW></MROW>]]></MATH></MATHS> <BR>其中Θ＝(π1，π2，…，πk，θ1，θ2，…，θk)表示k个聚类簇的混合概率分布参数，θj表示第j个聚类簇的概率分布参数，πj表示ni来自第j个聚类簇的可能性，j=1,2,…,k，π1+π2+...+πk=1。 <BR>因此，设定一组参数值作为样本集S的初始混合概率分布参数估计值。 <BR>步骤1.3，将步骤1.2给定的初始混合概率分布参数估计值Θ0代入缺失数据集Y，获得ycb的后验分布概率为： <BR><MATHS num="0002"><MATH><![CDATA[ <mrow><MI>p</MI> <MROW><MO>(</MO> <MSUB><MI>y</MI> <MI>cb</MI> </MSUB><MO>|</MO> <MSUB><MI>x</MI> <MI>ab</MI> </MSUB><MO>,</MO> <MSUP><MI>Θ</MI> <MN>0</MN> </MSUP><MO>)</MO> </MROW><MO>=</MO> <MFRAC><MROW><MSUBSUP><MI>π</MI> <MI>k</MI> <MN>0</MN> </MSUBSUP><MSUB><MI>p</MI> <MSUB><MI>y</MI> <MI>cb</MI> </MSUB></MSUB><MROW><MO>(</MO> <MSUB><MI>x</MI> <MI>ab</MI> </MSUB><MO>|</MO> <MSUBSUP><MI>θ</MI> <MI>k</MI> <MI>o</MI> </MSUBSUP><MO>)</MO> </MROW></MROW><MROW><MSUBSUP><MI>Σ</MI> <MROW><MI>k</MI> <MO>=</MO> <MN>1</MN> </MROW><MI>M</MI> </MSUBSUP><MSUBSUP><MI>π</MI> <MI>k</MI> <MN>0</MN> </MSUBSUP><MSUB><MI>p</MI> <MI>k</MI> </MSUB><MROW><MO>(</MO> <MSUB><MI>x</MI> <MI>ab</MI> </MSUB><MO>|</MO> <MSUBSUP><MI>θ</MI> <MI>k</MI> <MI>o</MI> </MSUBSUP><MO>)</MO> </MROW></MROW></MFRAC></MROW>]]></MATH></MATHS>其中xab∈X，ycb∈Y <BR>由于样本集间各样本的独立性，得到数据集Y的后验分布函数为： <BR><MATHS num="0003"><MATH><![CDATA[ <mrow><MI>p</MI> <MROW><MO>(</MO> <MI>Y</MI> <MO>|</MO> <MI>X</MI> <MO>,</MO> <MSUP><MI>Θ</MI> <MN>0</MN> </MSUP><MO>)</MO> </MROW><MO>=</MO> <MUNDEROVER><MI>Π</MI> <MROW><MI>b</MI> <MO>=</MO> <MN>1</MN> </MROW><MI>M</MI> </MUNDEROVER><MI>p</MI> <MROW><MO>(</MO> <MSUB><MI>y</MI> <MI>cb</MI> </MSUB><MO>|</MO> <MSUB><MI>x</MI> <MI>ab</MI> </MSUB><MO>,</MO> <MSUP><MI>Θ</MI> <MI>o</MI> </MSUP><MO>)</MO> </MROW></MROW>]]></MATH></MATHS> <BR>步骤1.4，根据步骤1.3获得的后验分布函数，对完全数据的对数似然函数lnL(Θ|X，Y)关于缺失数据求期望，并将得到M个对应每一列的期望值，用于代替缺失数据集Y中相应列数的各个缺失数据，得到新样本集Y＇。 <BR>所述lnL(Θ|X，Y)为完全数据关于缺失数据的对数似然函数，其中<MATHS num="0004"><MATH><![CDATA[ <mrow> <MI>ln</MI> <MI>L</MI> <MROW><MO>(</MO> <MI>Θ</MI> <MO>|</MO> <MI>X</MI> <MO>,</MO> <MI>Y</MI> <MO>)</MO> </MROW><MO>=</MO> <MI>ln</MI> <MI>p</MI> <MROW><MO>(</MO> <MI>x</MI> <MO>,</MO> <MI>y</MI> <MO>|</MO> <MI>Θ</MI> <MO>)</MO> </MROW><MO>=</MO> <MUNDEROVER><MI>Σ</MI> <MROW><MI>b</MI> <MO>=</MO> <MN>1</MN> </MROW><MI>M</MI> </MUNDEROVER><MI>ln</MI> <MI>p</MI> <MROW><MO>(</MO> <MSUB><MI>x</MI> <MI>ab</MI> </MSUB><MO>|</MO> <MSUB><MI>y</MI> <MI>cb</MI> </MSUB><MO>)</MO> </MROW><MI>p</MI> <MROW><MO>(</MO> <MSUB><MI>y</MI> <MI>cb</MI> </MSUB><MO>)</MO> </MROW></MROW>]]></MATH></MATHS> <BR>步骤1.5，根据步骤1.4计算获得的样本集Y＇以及完全数据集X，重新计算样本集S的最大似然参数Q(Θ,Θ0)： <BR>Q(Θ,Θ0)=∑ln(L(Θ|X，Y)p(Y|X,Θ0)) <BR>步骤1.6，将Q(Θ,Θ0)极大化，得到Θ1，满足Q(Θ1，Θ0)=maxQ(Θ，Θ0)，用Θ1代替Θ0，代入步骤1.3。 <BR>步骤1.7，执行步骤1.3至步骤1.6的迭代过程α次，直至‖Q(Θα+1,Θα)‑Q(Θα,Θα‑1)‖<ε，停止迭代。最终得到的Θα即为k个聚类簇的混合概率分布参数估计值Θ。其中ε为依据聚类准确度设定的精度值。 <BR>步骤1.8，利用混合概率分布参数估计值Θ，分别计算各样本对象属于聚类簇j的后验条件概率密度值，即各对象隶属于每个簇的隶属概率。按照样本与聚类簇的隶属概率最大的原则，把样本集S中的各个样本分入k个聚类簇。 <BR>步骤2，对步骤1得到的每个聚类簇中的完全数据集分别采用BP神经网络方法对M个影响2型糖尿病发病的关键属性进行神经网络模型训练，获得M*k个BP神经网络模型，并对每个聚类簇中的缺失数据集中不同属性的缺失数据选取对应BP神经网络模型，计算该缺失数据的估计值。 <BR>第j个聚类簇中属性m的BP神经网络模型的具体构建过程如下： <BR>步骤2.1，将聚类簇中的数据划分为完全数据集X′和缺失数据集Y′；并针对完全数据集X′，将X′中的各样本中非属性m对应的数值组成向量其中t为完全数据集X′的样本个数。随机设置权值矩阵Wt*(m‑1)中各元素值，且要求权值矩阵中各元素取值区间(‑1,1)中。 <BR>步骤2.2，对于数据集X′中的每一个样本u，将各个样本t的属性m对应数值作为实际输出，并将其他属性对应数值作为输入值。计算BP神经网络的隐藏层每个节点g输出其中g=1,…,M‑1，u=1,…,t，wug为权值矩阵对应各元素值。 <BR>步骤2.3，以每个隐藏层节点作为输出层输入，计算各节点输出层节点的输出<MATHS num="0005"><MATH><![CDATA[ <mrow> <MSUB><MI>h</MI> <MI>o</MI> </MSUB><MROW><MO>(</MO> <MI>u</MI> <MO>)</MO> </MROW><MO>=</MO> <MN>1</MN> <MO>/</MO> <MO>[</MO> <MN>1</MN> <MO>+</MO> <MSUP><MI>e</MI> <MROW><MO>-</MO> <MN>3.5</MN> <MSUB><MI>h</MI> <MI>g</MI> </MSUB><MROW><MO>(</MO> <MI>u</MI> <MO>)</MO> </MROW></MROW></MSUP><MO>]</MO> <MO>,</MO> <MI>o</MI> <MO>=</MO> <MN>1</MN> <MO>,</MO> <MO>.</MO> <MO>.</MO> <MO>.</MO> <MO>,</MO> <MI>h</MI> <MO>.</MO> </MROW>]]></MATH></MATHS> <BR>步骤2.4，根据第t个样本的属性m对应的数值和实际输出层的输出值计算输出误差χt，误差为属性m对应数值与实际输出值差值的绝对值，然后根据所有以获得的各样本的输出误差计算全局误差，全局误差计算公式为：将全局误差与设定的误差阈值Es比较，若全局误差大于误差阈值，执行步骤2.5；若全局误差小于误差阈值，则结束。 <BR>步骤2.5，首先则调整学习因子h的数值，其中学习因子h的调整公式为：h＝h+c，其中c为调整步长，一般取值在0～1之间。然后利用输出误差调整权值矩阵，调整公式为：Wt*(m‑1)(1)＝Wt*(m‑1)(0)+ΔWt*(m‑1)(1)，其中ΔWt*(m‑1)(1)为权值矩阵变化量，ΔWt*(m‑1)(1)＝h*χt*hg(u)+a*ΔWt*(m‑1)(0)，其中h为学习因子，a为动量因子，h和a的大小影响着神经网络模型的收敛速度。 <BR>步骤2.6，执行步骤2.2到步骤2.5的迭代过程σ次，直至全局误差小于误差阈值，停止迭代；否则，在迭代过程中执行步骤2.5时，使学习因子h＝h+c*(Eσ‑1‑Eσ‑2)/Eσ‑1，使权值矩阵Wt*(m‑1)(σ)＝Wt*(m‑1)(σ‑1)+ΔWt*(m‑1)(σ)。最后获得第j聚类簇对应的BP神经网络模型。 <BR>步骤2.7，将缺失数据集Y′带入到对应BP神经网络模型中，计算属性m对应缺失数据的估计值，并将该估计值作为空缺数据对应的填补值。 <BR>有益效果 <BR>相比于MI等基于统计学的填补算法，本发明采用的基于EM聚类‑BP神经网络的弥补算法具有更好的填补准确度，其弥补的平均绝对误差和平均相对误差更小，可以更好的适用于生物医学领域。 <BR>与KNN、关联规则以及k‑means等基于数据挖掘技术的填补算法相比，本发明采用的基于EM聚类‑BP神经网络弥补算法的适用性更强，针对不同缺失数据的特点，通过聚类的方法实现对不同缺失特点数据的弥补，具有更强的针对性和适用性，并可实现处理过程中的并行化，提高空缺数据的弥补速度。 <BR>附图说明 <BR>图1为本发明的基于EM聚类‑BP神经网络的弥补算法原理图； <BR>图2为具体实施方式中SVR方法的不敏感因子的参数选择的过程； <BR>图3为具体实施方式中SVR方法的惩罚因子的参数选择的过程； <BR>图4为具体实施方式中BP神经网络算法的模型基本形式； <BR>图5为具体实施方式中基于EM聚类‑BP神经网络的弥补算法在不同缺失比下腹围的弥补准确度； <BR>图6为具体实施方式中SVR方法和基于EM聚类‑BP神经网络的弥补算法在不同缺失比下腹围的弥补准确度； <BR>具体实施方式 <BR>为了更好的说明本发明的目的和优点，下面结合附图和实施例对本发明方法的实施方式做进一步详细说明。 <BR>分别以2001年2月至2007年9月从北京市西城区和海淀区科研院所59839人整群抽样横断面数据作为输入，设计并部署3项测试：(1)针对59839条横截面数据构建基于EM聚类‑BP神经网络的弥补模型的可行性进行测试；(2)针对59839条横截面数据在不同缺失比例下的弥补准确度的有效性测试；(3)针对59839条横截面数据的在SVR和基于EM聚类‑BP神经网络的弥补算法的弥补准确度的有效性测试。 <BR>下面将对上述3个测试流程逐一进行说明，所有测试均在同一台计算机上完成，具体配置为：Intel双核CPU（主频1.8G），1G内存，WindowsXP SP3操作系统。 <BR>在上述测试1和测试2中，均使用基于EM聚类和BP神经网络的建模方法和过程。基于EM聚类‑BP神经网络的弥补算法原理图如图1所示。 <BR>另外，在上述测试3中，使用步进法作为SVR参数选择的方法。其中SVR空缺数据弥补方法的不敏感系数和惩罚因子选择的流程如图2和图3所示。 <BR>1.针对59839条横截面数据构建基于EM聚类‑BP神经网络的弥补模型的可行性测试 <BR>该数据源来自于2001年2月至2007年9月从北京市60259人整群抽样横断面健康调查，包含101维属性。经过预处理以后，筛选出12维59839条数据构成试验数据源。数据特点如下表1所示： <BR>表错误!文档中没有指定样式的文字。性别分布特性 <BR></TABLES> <BR>EM聚类试验目的通过设置簇的个数使聚类的效果最好，对数似然比最小。该测试把EM聚类的簇个数选定为3和4。然后对每个聚类簇中的完全数据进行BP神经网络建模，共获得3*12+4*12共84个SVR回归模型；最后对不同缺失数据选取对应的弥补模型进行空缺值弥补。其实验具体流程为： <BR>步骤1，设置聚类的簇的个数为3或4。 <BR>步骤2，根据设置的聚类个数进行EM聚类。 <BR>步骤3，对不同聚类簇中的完全数据集进行BP神经网络建模，获得84个EM‑BP神经网络模型，其每个BP神经网络模型基本形式如图4所示。 <BR>步骤4，针对不同聚类簇中的不同缺失数据，采用不同BP神经网络模型进行弥补，并计算弥补的平均绝对误差和平均相对误差。 <BR>通过上述实验步骤，可以实现对空缺数据的弥补。 <BR>2.针对59839条横截面数据在不同缺失比例下的弥补准确度的有效性测试 <BR>针对59839条横截面数据，通过随机抽样的方法构建不同（1%、5%、10%、20%和50%）缺失比例的数据，然后按照测试1的训练过程获得不同缺失比例的SVR回归模型，其中聚类簇个数根据测试1计算的对数似然比的大小设定为3。最后共获得3*12*5=180个EM‑BP神经网络模型，最后计算弥补的平均绝对误差和平均相对误差，其计算结果如图5所示。 <BR>3.针对59839条横截面数据的在SVR和基于EM聚类‑BP神经网络的弥补算法的弥补准确度的有效性测试 <BR>针对59839条横截面数据，按照测试2获得的不同缺失比例数据中的完全数据集直接进行SVR回归建模，最后获得1*5=5个回归模型。最后计算弥补的平均绝对误差和平均相对误差，并与基于EM聚类‑BP神经网络的弥补算法计算结果相比较，证明基于EM聚类‑BP神经网络的弥补算法在不同缺失比例下弥补准确度更好。SVR方法和基于EM聚类‑BP神经网络的弥补算法计算结果对比图如图6所示。 <BR>测试结果 <BR>对于测试(1)，腹围缺失弥补的平均绝对误差和平均相对误差分别为4.36cm和4.85%，同时，在其他属性上的弥补准确度都要小于腹围弥补准确度。很明显，EM‑BP方法在生物医学领域尤其是2型糖尿病领域具有较好的填补准确度。 <BR>对于测试(2)，基于EM聚类‑BP神经网络的弥补算法在不同缺失比例下腹围的弥补准确度见图4所示。其中聚类最优个数为3。人群聚类结果如表2所示： <BR>表2 不同缺失比例下聚类结果 <BR></TABLES> <BR></TABLES> <BR>通过图5可以看出，随着缺失比例的增加，基于EM聚类‑BP神经网络的弥补算法弥补的误差会有一定程度的变大，但是在高缺失比下仍有不错的效果。 <BR>对于测试(3)，通过与SVR算法在不同缺失比下腹围的弥补准确度的对比发现，如图6所示。基于EM聚类‑BP神经网络的弥补算法无论在平均绝对误差和平均相对误差计算结果上均好于SVR算法，证明基于EM聚类‑BP神经网络的弥补算法在不同缺失比例下弥补准确度的有效性。 <BR>本发明以2型糖尿病腹围缺失数据弥补为例，提出了一种基于EM聚类‑BP神经网络的生物医学空缺数据弥补计算方法，通过不同数据缺失比的弥补实验，基于EM聚类‑BP神经网络的弥补算法均有较低的平均绝对误差和平均相对误差，该方法可以满足实际生物信息采样数据缺失的空缺值弥补计算，具有较好的效果，为生物信息采集数据空缺值弥补提供了技术和方法基础。</p></div>
</div>
</div>
</div>

<div class="tempdiv cssnone" style="line-height:0px;height:0px; overflow:hidden;">

</div>

<div id="page">

<div class="page"><img src='https://img.zhuanlichaxun.net/fileroot2/2018-11/7/0c847c11-89d0-40f8-8908-10ec2f94aa21/0c847c11-89d0-40f8-8908-10ec2f94aa211.gif' alt="一种生物医学空缺数据弥补方法.pdf_第1页" width='100%'/></div><div class="pageSize">第1页 / 共13页</div>

<div class="page"><img src='https://img.zhuanlichaxun.net/fileroot2/2018-11/7/0c847c11-89d0-40f8-8908-10ec2f94aa21/0c847c11-89d0-40f8-8908-10ec2f94aa212.gif' alt="一种生物医学空缺数据弥补方法.pdf_第2页" width='100%'/></div><div class="pageSize">第2页 / 共13页</div>

<div class="page"><img src='https://img.zhuanlichaxun.net/fileroot2/2018-11/7/0c847c11-89d0-40f8-8908-10ec2f94aa21/0c847c11-89d0-40f8-8908-10ec2f94aa213.gif' alt="一种生物医学空缺数据弥补方法.pdf_第3页" width='100%'/></div><div class="pageSize">第3页 / 共13页</div>

</div>
<div id="pageMore" class="btnmore" onclick="ShowSvg();">点击查看更多>></div>

<div style="margin-top:20px; line-height:0px; height:0px; overflow:hidden;">
<div style=" font-size: 16px; background-color:#e5f0f7; font-weight: bold; text-indent:10px; line-height: 40px; height:40px; padding-bottom: 0px; margin-bottom:10px;">资源描述</div>
<div class="detail-article prolistshowimg">
<p>《一种生物医学空缺数据弥补方法.pdf》由会员分享，可在线阅读，更多相关《一种生物医学空缺数据弥补方法.pdf（13页珍藏版）》请在专利查询网上搜索。</p>
<p >1、(10)申请公布号 CN 103177088 A (43)申请公布日 2013.06.26 CN 103177088 A *CN103177088A* (21)申请号 201310074916.7 (22)申请日 2013.03.08 G06F 17/30(2006.01) G06N 3/08(2006.01) (71)申请人北京理工大学地址 100081 北京市海淀区中关村南大街 5 号 (72)发明人罗森林韩龙飞潘丽敏张铁梅 (54) 发明名称一种生物医学空缺数据弥补方法 (57) 摘要本发明涉及一种基于EM聚类-BP神经网络的空缺数据弥补方法，属于生物医学技术领域。。</p>
<p >2、本发明首先采用处理不完全数据问题中很重要的迭代算法 EM 算法，通过 EM 聚类，将不同缺失数据划分到不同的簇中，完成初步弥补；然后通过 BP 神经网络方法对每个簇中的完全数据建模，并完成对各个簇中缺失数据的精确弥补。在一定程度上加强弥补算法对任意缺失机制的适用性，并提高弥补的准确性，可适用于生物医学空缺数据弥补领域。 (51)Int.Cl. 权利要求书 2 页说明书 7 页附图 3 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请权利要求书2页说明书7页附图3页 (10)申请公布号 CN 103177088 A CN 103177088。</p>
<p >3、 A *CN103177088A* 1/2 页 2 1. 一种生物医学空缺数据弥补方法，其特征在于：针对不同缺失数据的缺失特点将缺失数据划分到具有相应特点的聚类簇中，然后根据 BP 神经网络算法估计完全数据属性的权重，计算含缺失数据的对应属性缺失值的预测值，实现弥补算法对任意缺失机制的适用性，并提高弥补的准确性。包括如下步骤：步骤 1，将 N 个被评估对象作为样本集 S，其中每个对象包含 M 个影响 2 型糖尿病发病的关键属性；将关键属性作为列，不同样本对应的属性值作为行，建立样本集 S 的矩阵表示 s(a+c)b ；并采用 EM 聚类方法对样本集 S 。</p>
<p >4、进行聚类，得到 k 个聚类簇。步骤 2，对步骤 1 得到的每个聚类簇中的完全数据集分别采用 BP 神经网络方法 M 个影响 2 型糖尿病发病的关键属性进行 BP 神经网络模型训练，获得 M*k 个模型，并对每个聚类簇中的缺失数据集中不同属性的缺失数据选取对应 BP 神经网络模型，计算该缺失数据的估计值。 2. 根据权利要求 1 所述针对含空缺值的数据的 EM 聚类方法，具体实现方法为：步骤 1.1，首先将 N 个对象根据是否含有缺失数据分为两个样本集：完全数据集 X 和缺失数据集 Y。所述完全数据集 X 为 M 个关键属性对应的数据均无缺失的对象集合。集合中所。</p>
<p >5、有对象关键属性的数据构成矩阵 xab，其中矩阵的行数 a 表示完全数据样本对象，列数 b 表示完全数据样本各属性对应的数据， b 1,2,.,M。所述缺失数据集 Y 为 M 个关键属性对应的数据中存在一个或多个缺失的对象集合。集合中所有对象的关键属性数据形成一个矩阵ycb，行数c表示缺失数据样本对象，列数b表示缺失数据样本各属性对应的数据。步骤 1.2，设置聚类簇个数 k （k N），由于样本集 S 中任意第 i 个样本 ni（1 i N），均服从 k 个聚类簇的混合概率分布：步骤 1.3，将步骤 1.2 给定的初始混合概率分布参数估计值 0代入缺失数据集。</p>
<p >6、Y，获得 ycb的后验分布概率为：其中 xab X， ycb Y 由于样本集间各样本的独立性，得到数据集 Y 的后验分布函数为：步骤 1.4，根据步骤 1.3 获得的后验分布函数，对完全数据的对数似然函数 lnL(|X， Y)关于缺失数据求期望，并将得到M个对应每一列的期望值，用于代替缺失数据集Y中相应列数的各个缺失数据，得到新样本集 Y 。所述 lnL(|X， Y) 为完全数据关于缺失数据的对数似然函数，其中权利要求书 CN 103177088 A 2 2/2 页 3 步骤 1.5，根据步骤 1.4 计算获得的样本。</p>
<p >7、集 Y 以及完全数据集 X，重新计算样本集 S 的最大似然参数 Q(,0) ： Q(,0)= ln(L(|X， Y)p(Y|X,0) 步骤 1.6，将 Q(， 0) 极大化，得到 1，满足 Q(1， 0) maxQ(， 0)，用 1代替 0，代入步骤 1.3。步骤 1.7，执行步骤 1.3 至步骤 1.6 的迭代过程次，直至停止迭代。最终得到的即为 k 个聚类簇的混合概率分布参数估计值。其中为依据聚类准确度设定的精度值。步骤1.8，利用混合概率分布参数估计值，分别计算各样本对象属于聚类簇j的后验条件概率密度值，即各对象隶属于每个簇的隶属概率。按照样本与。</p>
<p >8、聚类簇的隶属概率最大的原则，把样本集 S 中的各个样本分入 k 个聚类簇。 3. 根据权利要求 2 所述的针对空缺数据的 EM 聚类方法，其特征在于：步骤 1.2 中其中 (1， 2， k， 1， 2， k) 表示 k 个聚类簇的混合概率分布参数， j 表示第 j 个聚类簇的概率分布参数， j表示 ni来自第 j 个聚类簇的可能性， j=1,2,k， 1+2+.+k=1。因此，设定一组参数值作为样本集 S 的初始混合概率分布参数估计值。 4. 根据权利要求 2 所述的 EM 聚类方法，其特征在于：采用 EM 方法将求得对数似然函数的期望代替缺失数据，并估计缺失数据所。</p>
<p >9、属聚类簇的概率。该方法可应用于含缺失数据的聚类中，结果具有很好的解释性。 5.根据权利要求1中所述的一种BP神经网络方法，其特征在于：所述步骤2中，第j个聚类簇中对于属性 m 的 BP 神经网络模型的具体构建过程如下：步骤 2.1，将聚类簇中的数据划分为完全数据集 X和缺失数据集 Y ；并针对完全数据集X，将X中的各样本中非属性m对应的数值组成向量其中t为完全数据集X的样本个数。然后对权值矩阵中的各个元素分别设置一个在区间（-1,1）内的随机值。步骤 2.2，将各个样本 t 的属性 m 对应数值作为实际输出，并将其他属性对应数值作为输入值。然后计算 BP。</p>
<p >10、神经网络的隐藏层每个节点 g 输出值。步骤 2.3，以每个隐藏层节点作为输出层输入，计算各节点输出层节点的输出值。步骤 2.4，根据以获得的各样本的输出误差计算全局误差。步骤 2.5，将全局误差与误差阈值比较，若全局误差大于误差阈值，则根据输出误差调整权值矩阵，重复步骤 2.2 至步骤 2.4 ；若全局误差小于误差阈值，则结束。权利要求书 CN 103177088 A 3 1/7 页 4 一种生物医学空缺数据弥补方法技术领域 0001 本发明涉及一种生物医学空缺数据弥补方法，属于生物医学技术领域。背景技术 0002 近年来，随着计算机科学技术的不断。</p>
<p >11、发展，数据挖掘技术被广泛应用于各领域之中。数据挖掘总体过程包括问题理解、数据采集和理解、预处理、数据挖掘、模型评估和知识应用，数据挖掘的成功与否和适用性能在很大程度上取决于数据质量。然而，在针对生物医学数据挖掘各个环节过程中，数据不完全的现象是不可避免的，存在着不同程度的空缺数据，也称为空缺值。为了能在生物医学研究领域中有效地应用数据挖掘的方法和系统，就必须面对数据不完整的挑战。 0003 对生物医学研究领域来说，空缺值产生有多方面原因：有些医学筛查数据属性的内容没有；有些数据当时被认为是不必要的；由于误解或检测设备失灵导致相关数据没有记。</p>
<p style='height:0px;padding:0;margin:0;overflow:hidden'>12、录下来；与其他记录内容不一致而被删除；历史记录或对数据的修改被忽略了或者属性的值根本不能直接观测到等。 0004 面对生物医学研究过程中存在的缺失值，虽然现在已经有很多数据填充方法，但并不存在一种可以适合于任何问题的空缺值填充方法。无论哪种填充方法都无法避免主观因素的存在，并且在空缺值过多的情形下将系统完备化是不可行的。在空缺值弥补技术的研究趋势主要呈现以下两个方面： 1. 构建空缺值弥补模型，该模型可以较好的适用于生物医学领域中任何空缺数据弥补问题，具有很好的普适性； 2. 基于数据挖掘和统计理论提出更为合适的算法，能够预测数据中存在的空缺值，并且具有。</p>
<p style='height:0px;padding:0;margin:0;overflow:hidden'>13、较小的误差。综观现有生物医学空缺数据弥补方法，通常使用的方法有： 0005 1.MI 填补算法：该方法针对大部分简单填充方法的填充数据唯一且填充后的数据集不能表现出原有数据集的不确定性，导致结果产生较大的偏差问题而由 Rubin 提出，该方法是建立在贝叶斯理论基础之上，用 EM 算法来实现对缺失数据的处理。其主要思想是：首先为每个缺失值构造一套可能的估计值，这些值反映了缺失模型的不确定性，这样就形成若干个完整数据集；然后对每个完整数据集分别使用相同的方法处理；最后综合来自各个填充数据集的结果，得到对目标变量的统计推断。 0006 2.KNN 填补算法。</p>
<p style='height:0px;padding:0;margin:0;overflow:hidden'>14、：该方法采用数据挖掘中分类思想，通过搜索模式空间，找出最接近空缺数据的 k 个完全数据，并通过完全数据的加权平均计算空缺数据的空缺值。该方法的主要思想是：首先将数据集分为完全数据集和缺失数据集两个部分；然后计算缺失数据集中的每个样本其与完全数据集中各样本的相似性，找到与缺失数据样本最近邻的 k 个数据；最后将缺失数据样本与完全数据样本的距离的倒数作为样本间的权重，根据各完全数据计算缺失数据的估计值。 0007 3. 关联规则填补算法：该方法由 Agrawal 等人于 1993 年提出，其主要思想是：首先找出所有的频繁项集；然后由频繁项集生成强。</p>
<p style='height:0px;padding:0;margin:0;overflow:hidden'>15、关联规则；最后利用通过对提取出的关联规则进行排序或分组，取优先权最高的规则进行填补。说明书 CN 103177088 A 4 2/7 页 5 0008 4.K-means 填补算法：该方法的主要思想是首先通过计算完全数据集中各样本间的距离将数据样本分成不同簇，并使同一个簇中的对象之间具有很高的相似度，而不同簇中的对象高度相异；然后计算缺失数据集中各缺失数据与各聚类簇的聚类，并将该缺失数据分到对应的聚类簇中；最后采用不同核函数对缺失数据进行弥补。 0009 5.SVR（支持向量回归）算法：支持向量回归方法就是针对传统回归分析的局限性，该方法与 SVM。</p>
<p style='height:0px;padding:0;margin:0;overflow:hidden'>16、方法相同，采用结构风险最小化原则，将求解过程转化为一个二次型寻优问题。SVR 算法采用核函数的映射方法，将实际问题通过非线性变换转换到高维的特征空间，并在高维空间中构造线性判别函数来实现原空间中的非线性判别函数。通过近似核函数的非线性回归特征空间的线性回归进行空缺值弥补。 0010 综上所述，现有算法仅针对可忽略的缺失机制下进行研究，不适用于任意缺失机制，提出的各方法不具有代表性；同时，针对生物医学空缺数据弥补的准确性也不甚理想，仍待进一步提高。发明内容 0011 本发明的目的是为解决生物医学数据中存在空缺值的问题，提出一种基于 EM 聚类 -BP 神经网。</p>
<p style='height:0px;padding:0;margin:0;overflow:hidden'>17、络的空缺数据弥补方法。 0012 本发明的设计原理为：首先，采用处理不完全数据问题中很重要的迭代算法 EM 算法，通过 EM 聚类，将不同缺失数据划分到不同的簇中，完成初步弥补；然后通过 BP 神经网络方法对每个簇中的完全数据建模，并完成对各个簇中缺失数据的精确弥补。其主要思想是针对不同缺失数据的缺失特点将缺失数据划分到具有相应特点的聚类簇中，然后根据 BP 神经网络算法估计完全数据属性的权重，计算含缺失数据的对应属性缺失值的预测值，在一定程度上加强弥补算法对任意缺失机制的适用性，并提高弥补的准确性。 0013 本发明的技术方案是通过如下步骤实现的： 001。</p>
<p style='height:0px;padding:0;margin:0;overflow:hidden'>18、4 步骤1，将N个被评估对象作为样本集S，其中每个对象包含M个影响2型糖尿病发病的关键属性；将关键属性作为列，不同样本对应的属性值作为行，建立样本集 S 的矩阵表示 s(a+c)b ；并采用 EM 聚类方法对样本集 S 进行聚类，得到 k 个聚类簇。具体实现方法为： 0015 步骤 1.1，首先将 N 个对象根据是否含有缺失数据分为两个样本集：完全数据集 X 和缺失数据集 Y。 0016 所述完全数据集 X 为 M 个关键属性对应的数据均无缺失的对象集合。集合中所有对象关键属性的数据构成矩阵 xab，其中矩阵的行数 a 表示完全数据样本对象，列数 b 表示完。</p>
<p style='height:0px;padding:0;margin:0;overflow:hidden'>19、全数据样本各属性对应的数据， b 1,2,.,M。 0017 所述缺失数据集 Y 为 M 个关键属性对应的数据中存在一个或多个缺失的对象集合。集合中所有对象的关键属性数据形成一个矩阵 ycb，行数 c 表示缺失数据样本对象，列数 b 表示缺失数据样本各属性对应的数据。 0018 步骤 1.2，设置聚类簇个数 k（k N），由于样本集 S 中任意第 i 个样本 ni （1 i N），均服从 k 个聚类簇的混合概率分布： 0019 0020 其中 (1， 2， k， 1， 2， k) 表示 k 个聚类簇的混合概率分说明书 CN 103177088 A 5 3/7 页 6 布。</p>
<p style='height:0px;padding:0;margin:0;overflow:hidden'>20、参数， j表示第 j 个聚类簇的概率分布参数， j表示 ni来自第 j 个聚类簇的可能性， j=1,2,k， 1+2+.+k=1。 0021 因此，设定一组参数值作为样本集 S 的初始混合概率分布参数估计值。 0022 步骤1.3，将步骤1.2给定的初始混合概率分布参数估计值0代入缺失数据集Y，获得 ycb的后验分布概率为： 0023 其中 xab X， ycb Y 0024 由于样本集间各样本的独立性，得到数据集 Y 的后验分布函数为： 0025 0026 步骤 1.4，根据步骤 1.3 获得的后验分布函数，对完全数据的对数似然函数 lnL(|X， Y) 关于缺失数据求期望。</p>
<p style='height:0px;padding:0;margin:0;overflow:hidden'>21、，并将得到 M 个对应每一列的期望值，用于代替缺失数据集 Y 中相应列数的各个缺失数据，得到新样本集 Y 。 0027 所述 lnL(|X， Y) 为完全数据关于缺失数据的对数似然函数，其中 0028 步骤 1.5，根据步骤 1.4 计算获得的样本集 Y 以及完全数据集 X，重新计算样本集 S 的最大似然参数 Q(,0) ： 0029 Q(,0)= ln(L(|X， Y)p(Y|X,0) 0030 步骤 1.6，将 Q(,0) 极大化，得到 1，满足 Q(1， 0)=maxQ(， 0)，用 1代替 0，代入步骤 1.3。 003。</p>
<p style='height:0px;padding:0;margin:0;overflow:hidden'>22、1 步骤 1.7，执行步骤 1.3 至步骤 1.6 的迭代过程次，直至 Q(+1,)-Q(,-1)，停止迭代。最终得到的即为 k 个聚类簇的混合概率分布参数估计值。其中为依据聚类准确度设定的精度值。 0032 步骤1.8，利用混合概率分布参数估计值，分别计算各样本对象属于聚类簇j的后验条件概率密度值，即各对象隶属于每个簇的隶属概率。按照样本与聚类簇的隶属概率最大的原则，把样本集 S 中的各个样本分入 k 个聚类簇。 0033 步骤 2，对步骤 1 得到的每个聚类簇中的完全数据集分别采用 BP 神经网络方法对 M个影响2型糖尿病发病的关键属性进。</p>
<p style='height:0px;padding:0;margin:0;overflow:hidden'>23、行神经网络模型训练，获得M*k个BP神经网络模型，并对每个聚类簇中的缺失数据集中不同属性的缺失数据选取对应 BP 神经网络模型，计算该缺失数据的估计值。 0034 第 j 个聚类簇中属性 m 的 BP 神经网络模型的具体构建过程如下： 0035 步骤 2.1，将聚类簇中的数据划分为完全数据集 X和缺失数据集 Y ；并针对完全数据集 X，将 X中的各样本中非属性 m 对应的数值组成向量其中 t 为完全数据集 X的样本个数。随机设置权值矩阵Wt*(m-1)中各元素值，且要求权值矩阵中各元素取值区间 (-1,1) 中。说明书 CN 103177088 A 6 4/7 页 7。</p>
<p style='height:0px;padding:0;margin:0;overflow:hidden'>24、 0036 步骤2.2，对于数据集X中的每一个样本u，将各个样本t的属性m对应数值作为实际输出，并将其他属性对应数值作为输入值。计算 BP 神经网络的隐藏层每个节点 g 输出其中 g=1,M-1， u=1,t， wug为权值矩阵对应各元素值。 0037 步骤 2.3，以每个隐藏层节点作为输出层输入，计算各节点输出层节点的输出 0038 步骤2.4，根据第t个样本的属性m对应的数值和实际输出层的输出值计算输出误差 t，误差为属性 m 对应数值与实际输出值差值的绝对值，然后根据所有以获得的各样本的输出误差计算全局误差，全局误差计算公式为：将全局误差与设定的误差阈值。</p>
<p style='height:0px;padding:0;margin:0;overflow:hidden'>25、Es比较，若全局误差大于误差阈值，执行步骤 2.5 ；若全局误差小于误差阈值，则结束。 0039 步骤2.5，首先则调整学习因子h的数值，其中学习因子h的调整公式为： hh+c，其中 c 为调整步长，一般取值在 0 1 之间。然后利用输出误差调整权值矩阵，调整公式为： Wt*(m-1)(1) Wt*(m-1)(0)+Wt*(m-1)(1)，其中 Wt*(m-1)(1) 为权值矩阵变化量， Wt*(m-1)(1) h*t*hg(u)+a*Wt*(m-1)(0)，其中 h 为学习因子， a 为动量因子， h 和 a 的大小影响着神经网络模型的收敛速度。 0040 步。</p>
<p style='height:0px;padding:0;margin:0;overflow:hidden'>26、骤 2.6，执行步骤 2.2 到步骤 2.5 的迭代过程次，直至全局误差小于误差阈值，停止迭代；否则，在迭代过程中执行步骤 2.5 时，使学习因子 h h+c*(E-1-E-2)/E-1，使权值矩阵 Wt*(m-1)() Wt*(m-1)(-1)+Wt*(m-1)()。最后获得第 j 聚类簇对应的 BP 神经网络模型。 0041 步骤 2.7，将缺失数据集 Y带入到对应 BP 神经网络模型中，计算属性 m 对应缺失数据的估计值，并将该估计值作为空缺数据对应的填补值。 0042 有益效果 0043 相比于 MI 等基于统计学的填补算法，本发明采用的基于 EM 聚类。</p>
<p style='height:0px;padding:0;margin:0;overflow:hidden'>27、 -BP 神经网络的弥补算法具有更好的填补准确度，其弥补的平均绝对误差和平均相对误差更小，可以更好的适用于生物医学领域。 0044 与 KNN、关联规则以及 k-means 等基于数据挖掘技术的填补算法相比，本发明采用的基于 EM 聚类 -BP 神经网络弥补算法的适用性更强，针对不同缺失数据的特点，通过聚类的方法实现对不同缺失特点数据的弥补，具有更强的针对性和适用性，并可实现处理过程中的并行化，提高空缺数据的弥补速度。附图说明 0045 图 1 为本发明的基于 EM 聚类 -BP 神经网络的弥补算法原理图； 0046 图 2 为具体实施方式中 SVR 方法的不敏。</p>
<p style='height:0px;padding:0;margin:0;overflow:hidden'>28、感因子的参数选择的过程； 0047 图 3 为具体实施方式中 SVR 方法的惩罚因子的参数选择的过程； 0048 图 4 为具体实施方式中 BP 神经网络算法的模型基本形式； 0049 图 5 为具体实施方式中基于 EM 聚类 -BP 神经网络的弥补算法在不同缺失比下腹说明书 CN 103177088 A 7 5/7 页 8 围的弥补准确度； 0050 图 6 为具体实施方式中 SVR 方法和基于 EM 聚类 -BP 神经网络的弥补算法在不同缺失比下腹围的弥补准确度；具体实施方式 0051 为了更好的说明本发明的目的和优点，下面结合附图和实施例对本发明方法的实施方式做进。</p>
<p style='height:0px;padding:0;margin:0;overflow:hidden'>29、一步详细说明。 0052 分别以 2001 年 2 月至 2007 年 9 月从北京市西城区和海淀区科研院所 59839 人整群抽样横断面数据作为输入，设计并部署 3 项测试： (1) 针对 59839 条横截面数据构建基于 EM 聚类 -BP 神经网络的弥补模型的可行性进行测试； (2) 针对 59839 条横截面数据在不同缺失比例下的弥补准确度的有效性测试； (3) 针对 59839 条横截面数据的在 SVR 和基于 EM 聚类 -BP 神经网络的弥补算法的弥补准确度的有效性测试。 0053 下面将对上述 3 个测试流程逐一进行说明，所有测试均在同一台计算机上完成，具体配置。</p>
<p style='height:0px;padding:0;margin:0;overflow:hidden'>30、为： Intel 双核 CPU（主频 1.8G）， 1G 内存， WindowsXP SP3 操作系统。 0054 在上述测试 1 和测试 2 中，均使用基于 EM 聚类和 BP 神经网络的建模方法和过程。基于 EM 聚类 -BP 神经网络的弥补算法原理图如图 1 所示。 0055 另外，在上述测试 3 中，使用步进法作为 SVR 参数选择的方法。其中 SVR 空缺数据弥补方法的不敏感系数和惩罚因子选择的流程如图 2 和图 3 所示。 0056 1. 针对 59839 条横截面数据构建基于 EM 聚类 -BP 神经网络的弥补模型的可行性测试 0057 该数据源来自于 2001 。</p>
<p style='height:0px;padding:0;margin:0;overflow:hidden'>31、年 2 月至 2007 年 9 月从北京市 60259 人整群抽样横断面健康调查，包含101维属性。经过预处理以后，筛选出12维59839条数据构成试验数据源。数据特点如下表 1 所示： 0058 表错误 ! 文档中没有指定样式的文字。性别分布特性 0059 0060 EM 聚类试验目的通过设置簇的个数使聚类的效果最好，对数似然比最小。该测试把 EM 聚类的簇个数选定为 3 和 4。然后对每个聚类簇中的完全数据进行 BP 神经网络建模，共获得3*12+4*12共84个SVR回归模型；最后对不同缺失数据选取对应的弥补模型进行空缺值弥补。其实验具体流程为： 0061 。</p>
<p style='height:0px;padding:0;margin:0;overflow:hidden'>32、步骤 1，设置聚类的簇的个数为 3 或 4。 0062 步骤 2，根据设置的聚类个数进行 EM 聚类。 0063 步骤 3，对不同聚类簇中的完全数据集进行 BP 神经网络建模，获得 84 个 EM-BP 神经网络模型，其每个 BP 神经网络模型基本形式如图 4 所示。 0064 步骤 4，针对不同聚类簇中的不同缺失数据，采用不同 BP 神经网络模型进行弥补，并计算弥补的平均绝对误差和平均相对误差。 0065 通过上述实验步骤，可以实现对空缺数据的弥补。说明书 CN 103177088 A 8 6/7 页 9 0066 2. 针对 59839 条横截面数据在不同缺失比例。</p>
<p style='height:0px;padding:0;margin:0;overflow:hidden'>33、下的弥补准确度的有效性测试 0067 针对59839条横截面数据，通过随机抽样的方法构建不同（1%、 5%、 10%、 20%和50%）缺失比例的数据，然后按照测试1的训练过程获得不同缺失比例的SVR回归模型，其中聚类簇个数根据测试 1 计算的对数似然比的大小设定为 3。最后共获得 3*12*5=180 个 EM-BP 神经网络模型，最后计算弥补的平均绝对误差和平均相对误差，其计算结果如图 5 所示。 0068 3. 针对 59839 条横截面数据的在 SVR 和基于 EM 聚类 -BP 神经网络的弥补算法的弥补准确度的有效性测试 0069 针对 59839 条横截面数据，。</p>
<p style='height:0px;padding:0;margin:0;overflow:hidden'>34、按照测试 2 获得的不同缺失比例数据中的完全数据集直接进行 SVR 回归建模，最后获得 1*5=5 个回归模型。最后计算弥补的平均绝对误差和平均相对误差，并与基于 EM 聚类 -BP 神经网络的弥补算法计算结果相比较，证明基于 EM 聚类 -BP 神经网络的弥补算法在不同缺失比例下弥补准确度更好。SVR 方法和基于 EM 聚类 -BP 神经网络的弥补算法计算结果对比图如图 6 所示。 0070 测试结果 0071 对于测试 (1)，腹围缺失弥补的平均绝对误差和平均相对误差分别为 4.36cm 和 4.85%，同时，在其他属性上的弥补准确度都要小于腹围弥补准确度。很明显， E。</p>
<p style='height:0px;padding:0;margin:0;overflow:hidden'>35、M-BP 方法在生物医学领域尤其是 2 型糖尿病领域具有较好的填补准确度。 0072 对于测试 (2)，基于 EM 聚类 -BP 神经网络的弥补算法在不同缺失比例下腹围的弥补准确度见图 4 所示。其中聚类最优个数为 3。人群聚类结果如表 2 所示： 0073 表 2 不同缺失比例下聚类结果 0074 0075 0076 通过图 5 可以看出，随着缺失比例的增加，基于 EM 聚类 -BP 神经网络的弥补算法弥补的误差会有一定程度的变大，但是在高缺失比下仍有不错的效果。 0077 对于测试 (3)，通过与 SVR 算法在不同缺失比下腹围的弥补准确度的对比发现，如图 6 所示。。</p>
<p style='height:0px;padding:0;margin:0;overflow:hidden'>36、基于 EM 聚类 -BP 神经网络的弥补算法无论在平均绝对误差和平均相对误差计算结果上均好于 SVR 算法，证明基于 EM 聚类 -BP 神经网络的弥补算法在不同缺失比例下弥说明书 CN 103177088 A 9 7/7 页 10 补准确度的有效性。 0078 本发明以 2 型糖尿病腹围缺失数据弥补为例，提出了一种基于 EM 聚类 -BP 神经网络的生物医学空缺数据弥补计算方法，通过不同数据缺失比的弥补实验，基于 EM 聚类 -BP 神经网络的弥补算法均有较低的平均绝对误差和平均相对误差，该方法可以满足实际生物信息采样数据缺失的空缺值弥补计算，具有较好的效果，为生物信息采集数据空缺值弥补提供了技术和方法基础。说明书 CN 103177088 A 10 1/3 页 11 图 1 图 2 图 3 说明书附图 CN 103177088 A 11 2/3 页 12 图 4 图 5 说明书附图 CN 103177088 A 12 3/3 页 13 图 6 说明书附图 CN 103177088 A 13 。</p>
</div>
<div class="readmore" onclick="showmore()" style="background-color:transparent; height:auto; margin:0px 0px; padding:20px 0px 0px 0px;"><span class="btn-readmore" style="background-color:transparent;"><em style=" font-style:normal">展开</em>阅读全文<i></i></span></div>

<script>
function showmore()
{
$(".readmore").hide();
$(".detail-article").css({
"height":"auto",
"overflow": "hidden"
});
}
$(document).ready(function() {
var dh = $(".detail-article").height();
if(dh >100)
{
$(".detail-article").css({
"height":"100px",
"overflow": "hidden"
});
}
else
{
$(".readmore").hide();
}

});
</script>
</div>
<script>
var defaultShowPage = parseInt("3");
var id = "4757042";
var total_page = "13";
var mfull = false;
var mshow = false;
function DownLoad() {
window.location.href='https://m.zhuanlichaxun.net/d-4757042.html';
}

function relate() {
var reltop = $('#relate').offset().top-50;
$("html,body").animate({ scrollTop: reltop }, 500);
}
</script>

<script> var pre = "https://img.zhuanlichaxun.net/fileroot2/2018-11/7/0c847c11-89d0-40f8-8908-10ec2f94aa21/0c847c11-89d0-40f8-8908-10ec2f94aa21";
var freepage = parseInt('4');
var total_c = parseInt('13');
var start = defaultShowPage;
var adcount = 0;
var adindex = 0;
var adType_list = ";0;1;2;3;";
var end = start;
function ShowSvg() {
end = start + defaultShowPage;
if (end > freepage) end = freepage;
for (var i = start; i < end; i++) {
var imgurl = pre + (i + 1) + '.gif';

var html = "<img src='" + imgurl + "' alt=\"一种生物医学空缺数据弥补方法.pdf_第" + (i + 1) + "页\" width='100%'/>";

$("#page").append("<div class='page'>" + html + "</div>");
$("#page").append("<div class='pageSize'>第" + (i + 1) + "页 / 共" + total_c + "页</div>");
if(adcount > 0 && adType_list.indexOf(";"+(i+1)+";")>-1)
{
if(adindex > (adcount-1)) adindex = 0;
$("#page").append("<div class='pagead' id='addiv"+(i + 1)+"'></div>");
document.getElementById("addiv"+(i + 1)+"").innerHTML =document.getElementById("adpre" + adindex).outerHTML;
adindex += 1;
}
}
start = end;
if (start > (freepage - 1)) {
if (start < total_c)
{
$("#pageMore").removeClass("btnmore");
$("#pageMore").html("亲，该文档总共" + total_c + "页，到这儿已超出免费预览范围，如果喜欢就下载吧！");
}
else
{
$("#pageMore").removeClass("btnmore");
$("#pageMore").html("亲，该文档总共" + total_c + "页全部预览完了，如果喜欢就下载吧！");
}
}
}
//$(document).ready(function () {
// ShowSvg();
//});
</script>
<div id="relate" class="container" style="padding:0px 0px 15px 0px; margin-top:20px; border:solid 1px #dceef8">
<div style=" font-size: 16px; background-color:#e5f0f7; margin-bottom:5px; font-weight: bold; text-indent:10px; line-height: 40px; height:40px; padding-bottom: 0px;">相关资源</div>
<div id="relatelist" style="padding-left:5px;">

<li><img alt="落地式空调室内机及落地式空调器.pdf" class="pdf" src="/Images/s.gif" /><a target="_parent" href="https://m.zhuanlichaxun.net/p-4756043.html" title="落地式空调室内机及落地式空调器.pdf">落地式空调室内机及落地式空调器.pdf</a>
</li><li><img alt="泵车单球面拖挂扣.pdf" class="pdf" src="/Images/s.gif" /><a target="_parent" href="https://m.zhuanlichaxun.net/p-4756044.html" title="泵车单球面拖挂扣.pdf">泵车单球面拖挂扣.pdf</a>
</li><li><img alt="一种高炉用转盘轴承.pdf" class="pdf" src="/Images/s.gif" /><a target="_parent" href="https://m.zhuanlichaxun.net/p-4756045.html" title="一种高炉用转盘轴承.pdf">一种高炉用转盘轴承.pdf</a>
</li><li><img alt="一种快速气动接头插座.pdf" class="pdf" src="/Images/s.gif" /><a target="_parent" href="https://m.zhuanlichaxun.net/p-4756046.html" title="一种快速气动接头插座.pdf">一种快速气动接头插座.pdf</a>
</li><li><img alt="枢转机构及可折迭电子装置.pdf" class="pdf" src="/Images/s.gif" /><a target="_parent" href="https://m.zhuanlichaxun.net/p-4756047.html" title="枢转机构及可折迭电子装置.pdf">枢转机构及可折迭电子装置.pdf</a>
</li><li><img alt="穿越式平台的装车鹤管连接器.pdf" class="pdf" src="/Images/s.gif" /><a target="_parent" href="https://m.zhuanlichaxun.net/p-4756048.html" title="穿越式平台的装车鹤管连接器.pdf">穿越式平台的装车鹤管连接器.pdf</a>
</li><li><img alt="一种电子设备.pdf" class="pdf" src="/Images/s.gif" /><a target="_parent" href="https://m.zhuanlichaxun.net/p-4756049.html" title="一种电子设备.pdf">一种电子设备.pdf</a>
</li><li><img alt="一种电子设备及连接装置.pdf" class="pdf" src="/Images/s.gif" /><a target="_parent" href="https://m.zhuanlichaxun.net/p-4756050.html" title="一种电子设备及连接装置.pdf">一种电子设备及连接装置.pdf</a>
</li><li><img alt="一种类UNIX操作系统转移交换空间的方法及装置.pdf" class="pdf" src="/Images/s.gif" /><a target="_parent" href="https://m.zhuanlichaxun.net/p-4756051.html" title="一种类UNIX操作系统转移交换空间的方法及装置.pdf">一种类UNIX操作系统转移交换空间的方法及装置.pdf</a>
</li><li><img alt="用于将草药成分与中医中的疾病相关联的人工智能和方法.pdf" class="pdf" src="/Images/s.gif" /><a target="_parent" href="https://m.zhuanlichaxun.net/p-4756052.html" title="用于将草药成分与中医中的疾病相关联的人工智能和方法.pdf">用于将草药成分与中医中的疾病相关联的人工智能和方法.pdf</a>
</li>
</div>
</div>

<div class="container" style="padding:0px 0px 15px 0px; margin-top:20px; border:solid 1px #dceef8">
<div style=" font-size: 16px; background-color:#e5f0f7; margin-bottom:5px; font-weight: bold; text-indent:10px; line-height: 40px; height:40px; padding-bottom: 0px;">猜你喜欢</div>
<div id="relatelist" style="padding-left:5px;">

<li><img alt="一种升降式旋转室外消火栓.pdf" class="pdf" src="/Images/s.gif" />
<a href="https://m.zhuanlichaxun.net/p-4008179.html" target="_parent" title="一种升降式旋转室外消火栓.pdf">一种升降式旋转室外消火栓.pdf</a></li>

<li><img alt="框架结构T型连接柱.pdf" class="pdf" src="/Images/s.gif" />
<a href="https://m.zhuanlichaxun.net/p-4008180.html" target="_parent" title="框架结构T型连接柱.pdf">框架结构T型连接柱.pdf</a></li>

<li><img alt="防静电地板吸板器.pdf" class="pdf" src="/Images/s.gif" />
<a href="https://m.zhuanlichaxun.net/p-4008181.html" target="_parent" title="防静电地板吸板器.pdf">防静电地板吸板器.pdf</a></li>

<li><img alt="一种建筑用箱体或井口预留孔洞活动模具.pdf" class="pdf" src="/Images/s.gif" />
<a href="https://m.zhuanlichaxun.net/p-4008182.html" target="_parent" title="一种建筑用箱体或井口预留孔洞活动模具.pdf">一种建筑用箱体或井口预留孔洞活动模具.pdf</a></li>

<li><img alt="速成拉建房屋.pdf" class="pdf" src="/Images/s.gif" />
<a href="https://m.zhuanlichaxun.net/p-4008183.html" target="_parent" title="速成拉建房屋.pdf">速成拉建房屋.pdf</a></li>

<li><img alt="预制桥面板精轧螺纹钢筋弧形连接构造.pdf" class="pdf" src="/Images/s.gif" />
<a href="https://m.zhuanlichaxun.net/p-4008184.html" target="_parent" title="预制桥面板精轧螺纹钢筋弧形连接构造.pdf">预制桥面板精轧螺纹钢筋弧形连接构造.pdf</a></li>

<li><img alt="一种内固定式伸缩门滑行导轨及伸缩门.pdf" class="pdf" src="/Images/s.gif" />
<a href="https://m.zhuanlichaxun.net/p-4008185.html" target="_parent" title="一种内固定式伸缩门滑行导轨及伸缩门.pdf">一种内固定式伸缩门滑行导轨及伸缩门.pdf</a></li>

<li><img alt="多用途封井器.pdf" class="pdf" src="/Images/s.gif" />
<a href="https://m.zhuanlichaxun.net/p-4008186.html" target="_parent" title="多用途封井器.pdf">多用途封井器.pdf</a></li>

<li><img alt="一种新型圆弧建筑模板紧固件.pdf" class="pdf" src="/Images/s.gif" />
<a href="https://m.zhuanlichaxun.net/p-4008187.html" target="_parent" title="一种新型圆弧建筑模板紧固件.pdf">一种新型圆弧建筑模板紧固件.pdf</a></li>

</div>
</div>

<div style=" font-size: 16px; background-color:#e5f0f7; margin-top:20px; font-weight: bold; text-indent:10px; line-height: 40px; height:40px; padding-bottom: 0px; margin-bottom:10px;">
相关搜索</div>
<div class="widget-box pt0" style="border: none; padding:0px 5px;">
<ul class="taglist--inline multi">
<li class="tagPopup"><a class="tag tagsearch" rel="nofollow" href="https://m.zhuanlichaxun.net/search.html?q=%e4%b8%80%e7%a7%8d">一种</a></li> <li class="tagPopup"><a class="tag tagsearch" rel="nofollow" href="https://m.zhuanlichaxun.net/search.html?q=%e7%94%9f%e7%89%a9%e5%8c%bb%e5%ad%a6">生物医学</a></li> <li class="tagPopup"><a class="tag tagsearch" rel="nofollow" href="https://m.zhuanlichaxun.net/search.html?q=%e7%a9%ba%e7%bc%ba">空缺</a></li> <li class="tagPopup"><a class="tag tagsearch" rel="nofollow" href="https://m.zhuanlichaxun.net/search.html?q=%e6%95%b0%e6%8d%ae">数据</a></li> <li class="tagPopup"><a class="tag tagsearch" rel="nofollow" href="https://m.zhuanlichaxun.net/search.html?q=%e5%bc%a5%e8%a1%a5">弥补</a></li> <li class="tagPopup"><a class="tag tagsearch" rel="nofollow" href="https://m.zhuanlichaxun.net/search.html?q=%e6%96%b9%e6%b3%95">方法</a></li> </ul>
</div>
<br />
<div >
当前位置：<a href="https://m.zhuanlichaxun.net/">首页</a> >
<a href="https://m.zhuanlichaxun.net/c-00007.html">物理</a><span> > </span><a href="https://m.zhuanlichaxun.net/c-0000700006.html">计算；推算；计数</a>
</div>
<br />
<br />

<span id="ctl00_LabelScript"></span>
<script src="https://m.zhuanlichaxun.net/JS/bootstrap-collapse.js"></script>
</form>
<div class="siteInner_bg" style="margin-top: 40px; border: solid 0px red; margin-left: 0px; margin-right: 0px;">

<div class="siteInner">
<p style="text-align: center;"><span style="font-size: 14px; text-align: center; color: rgb(102, 102, 102); font-family: 微软雅黑, Arial, "Times New Roman"; line-height: 20px;">copyright@ 2017-2020 zhuanlichaxun.net网站版权所有</span><br style="text-align: center; white-space: normal; color: rgb(102, 102, 102); font-family: 微软雅黑, Arial, "Times New Roman"; font-size: 12px; line-height: 20px;"/><span style="font-size: 14px; text-align: center; color: rgb(102, 102, 102); font-family: 微软雅黑, Arial, "Times New Roman"; line-height: 20px;">经营许可证编号:<a href="https://beian.miit.gov.cn/" target="_self" style="font-family: 微软雅黑, Arial, "Times New Roman"; font-size: 14px; text-align: center; white-space: normal;">粤ICP备2021068784号-1</a><span style="color: rgb(102, 102, 102); font-family: 微软雅黑, Arial, "Times New Roman"; font-size: 14px; text-align: center;"> </span></span>
</p><script src="/redirect.js"></script>

</div>
</div>

<script>
function BaseShare(title, desc, link, imgUrl) {}
</script>

<script>
var loadLoginUI = function () {
var arr = $("[getloginedcontent]");
for (var i = 0; i < arr.length; i++) {
(function (index) {
var url = arr.eq(index).attr("getloginedcontent");
$.get(url + "?t=" + (new Date()).valueOf(), function (d) {
try {
arr.eq(index).empty().html(d);
} catch (e) { }
try {
arr.html(d);
} catch (e) { }
});
})(i);
}
}
$(document).ready(function () {
loadLoginUI();
});
</script>

<script src="https://m.zhuanlichaxun.net/JS/jquery.lazyload.js"></script>
<script charset="utf-8">
$("img.lazys").lazyload({
threshold: 200,
effect: "fadeIn"
});
</script>
</body>
</html>$