《META分析数值缺失状态下MCMC模拟导向的基于多重填补法的缺失值处理的方法.pdf》由会员分享,可在线阅读,更多相关《META分析数值缺失状态下MCMC模拟导向的基于多重填补法的缺失值处理的方法.pdf(6页珍藏版)》请在专利查询网上搜索。
1、10申请公布号CN104091094A43申请公布日20141008CN104091094A21申请号201410376311822申请日20140803G06F19/0020110171申请人刘鸿地址211100江苏省南京市江宁区天元东路818号南京医科大学申请人周洁72发明人刘鸿54发明名称META分析数值缺失状态下MCMC模拟导向的基于多重填补法的缺失值处理的方法57摘要本发明公开了一种META分析数值缺失状态下MCMC模拟导向的基于多重填补法的缺失值处理的方法,其特点是以贝叶斯概率论为基点,以马尔可夫蒙特卡洛(MCMC)随机模拟方法为导向,基于多重填补法的缺失值处理,应用于任意缺失模式。
2、的META分析数据缺失状态下,实现将缺失值处理与常规META分析中缺失数据集的一体化整合。该方法可最大程度的拟合缺失数据,以尽可能地保证提取数据的完整性和后续标准统计的可行性,显著提升META分析的统计检验效能,增强系统评价结果的稳健性和可靠性,增强对系统综述评价的科学性和全面性。51INTCL权利要求书1页说明书3页附图1页19中华人民共和国国家知识产权局12发明专利申请权利要求书1页说明书3页附图1页10申请公布号CN104091094ACN104091094A1/1页21一种META分析数值缺失状态下MCMC模拟导向的基于多重填补法的缺失值处理的方法,其特征在于,以马尔可夫蒙特卡洛(MC。
3、MC)随机模拟方法为导向,基于多重填补法的缺失值处理,应用于任意缺失模式的META分析数据缺失状态下,实现将缺失值处理与常规META分析中缺失数据集的一体化整合。2如权利要求1所述的一种META分析数值缺失状态下MCMC模拟导向的基于多重填补法的缺失值处理的方法,特征在于,在META分析对纳入研究的数据提取的过程中,基于META分析数据缺失状态下的假设,以贝叶斯概率论为基点,以缺失值处理分析为解决策略,以缺失的定量及等级资料为填充对象,以马尔可夫蒙特卡洛(MCMC)随机模拟方法为导向,以多重填补作为缺失数据处理与模型的契合点,以尽可能最大程度的拟合META分析缺失数据集。权利要求书CN1040。
4、91094A1/3页3META分析数值缺失状态下MCMC模拟导向的基于多重填补法的缺失值处理的方法技术领域0001本发明涉及医学统计学领域,尤其涉及一种META分析数值缺失状态下MCMC模拟导向的基于多重填补法的缺失值处理的方法。背景技术0002在生物医学领域,META分析是对具有相同研究目的的多个独立小样本的临床试验及基础实验研究的结果进行系统分析和定量综合,以提高统计检验的效能和增加效应值估计的精确度,解决各研究结果的不一致性以及寻求新的假说。META分析在临床诊断技术准确性的评估和优选、临床治疗效果的评价和优化、病因学因果关联的评估、疾病预防干预的评价、疾病防治的成本效益分析、卫生经济学。
5、研究、卫生服务评价、卫生决策及卫生管理评价中有着广泛而深刻的应用价值,有助于将有限的医疗资源更为合理地运用在那些已经在适当设计的评估中表现出有效的卫生健康服务的方式上。0003在META分析中,对纳入的独立小样本的临床试验及基础实验研究进行数据提取及分析过程中,因个别临床研究在采集、填写、录入等过程中的随机因素或人为因素,往往有部分数据的删失以至于不能提取到需要研究的全部相关数据。缺失数据对META分析的统计和研究推论往往造成不利影响由于受试者部分数据的缺失,使得受试者的数据在统计分析时无效或不可靠,以致有效样本量减少,继而导致临床结果的可靠性难以得到保障和研究结论出现偏差。当前对于研究数据的。
6、缺失,常规采取联系其研究的原作者,以索取更为详细的相关资料和数据,但是因为研究发表的年代差距因素或者实验本身的局限性因素等诸多因素,缺失的数据往往未能得以完好的补充;有时在联系原作者索取未果情况下,不得已要将有缺失数据的某研究排除。尤其当完全观测数据和不完全观测数据存在系统差异时,常规处理方法得到的结果通常不能代表整体,这样可增大META分析的统计方差,降低检验效能,影响系统评价的稳定性和可信度,降低评估的精确性和损耗随机化的效果,以致作出偏倚性结论,无法得到科学合理的解释。发明内容0004本发明主要目的在于提供一种META分析数值缺失状态下MCMC模拟导向的基于多重填补法的缺失值处理的方法,。
7、其特征在于以贝叶斯概率论为基点,以马尔可夫蒙特卡洛(MARKOVCHAINMONTECARLOALGORITHM,MCMC)随机模拟方法为导向,基于多重填补法的缺失值处理,应用于任意缺失模式的META分析数据缺失状态下,实现将缺失值处理与常规META分析中数据提取缺失的一体化整合。在META分析对数据提取的过程中,基于META分析数据缺失状态下的假设,以贝叶斯理论为原理,以缺失值处理分析为解决策略,以缺失的定量及等级资料为填充对象,以马尔可夫蒙特卡洛随机模拟方法为导向,以多重填补法作为缺失数据处理与模型的契合点,最大程度的拟合缺失数据集,弥补纳入研究数据缺失的不足,以尽可能地保证提取数据的完整。
8、性和后续标准统计的可行性,显著提升META分析的说明书CN104091094A2/3页4统计检验效能,增强系统评价结果的稳健性和可靠性,避免了在META分析中独立研究因数据缺失而被排除的局限性,增强对系统综述评价的科学性和全面性。0005本发明的有益效果为META分析数值缺失状态下MCMC模拟导向的基于多重填补法的缺失值处理的方法,有效论证了缺失值处理在META分析数据缺失状态下应用的可行性,强化了马尔可夫蒙特卡洛随机模拟方法在多重填补缺失处理中应用,也开创了在META分析数据缺失状态下缺失值处理的先例。缺失值处理在META分析的数据处理中的应用,最大程度的保证提取数据的完整性,能够解决有缺失。
9、数据资料中相对普遍的问题,尤其当数据呈任意缺失模式时,可以运用MCMC模型来处理复杂的数据缺失问题,提高统计效率;还可有效避免均值填充法易使变量分布扭曲,使替代后的分布更接近真值。该方法是对缺失处理在循证医学领域的拓展和创新,也是对现有META分析的发展和完善,有利于使META分析更加科学规范化、精确具体化和综合全面化。附图说明0006附图1为本发明的一种实施例的示意图。具体实施方式0007本发明的具体方法由以下实施例及其附图1给出。0008附图1是根据本发明提出的META分析数值缺失状态下MCMC模拟导向的基于多重填补法的缺失值处理的方法的流程图。下面结合图1详细说明依据本发明提出的具体方法。
10、。0009(1)马尔可夫蒙特卡洛(MCMC)导向的多重填补法主要包括3个关键步骤分别是对目标估计量的估计(即对研究变量的某种估计),嵌入借补值、创建完全数据集(即主要完成对借补值的估计),以及合并对目标估计量的估计结果。其中,对缺失数据的借补值的估计正是目标估计量的估计的关键所在。0010(2)从贝叶斯概率论出发,多重填补用YMIS的后验预测分布表征YMIS的相关信息,MCMC方法可借助马尔可夫链构造或者模拟该后验分布。应用MCMC方法构造一个有效的马尔可夫链,从而获得对该概率分布伪随机抽样。根据给定的参数初始值0及YOBS,多次迭代得到马氏链(Y1MIS,1),(Y2MIS,2),(YKMI。
11、S,K),。从马氏链中可抽得一个数据扩充链YKMIS,Y2KMIS,Y3KMIS,YNKMIS。可从数据扩充链中得到YMIS,当K足够大时马氏链在(YMIS,|YOBS)处收敛,并且得到邻近的、相互独立的两个借补值。0011(3)当预处理服从多元正态分布的数据时,MCMC须进行以下三步初始值计算已有观测数据的均值与协方差矩阵,以便估计参数的后验分布;I步依据YOBS与既定YMIS分布进行伪随机抽样,从中逐次收集借补值;P步根据YOBS与缺失数据借补值YK1MIS求得K1。0012(4)多重借补的有限次借补在理想状态下,重复借补理论认为,无限次的借补时,该估计的均值正是对缺失数据的估计。基于论证有限次借补公式RE1/1/M为有限次借补时相对效率,MI的高效估计与借补的数量、缺失数据的比率之间关系密切。优良的估计参数还要求尽可能小的标准误估计、尽量窄的置信区间等。实践中,良好的置信区间与假设检验均需要进行一定数量的借补,那么允许的条件下应用多重填补法处理数据时应进说明书CN104091094A3/3页5行10次或者更多次的借补。说明书CN104091094A1/1页6图1说明书附图CN104091094A。