期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
成组删除法和多重填补法对随机缺失的二分类变量资料处理效果的比较 被引量:5
1
作者 王曼 施念 +1 位作者 花琳琳 杨永利 《郑州大学学报(医学版)》 CAS 北大核心 2012年第5期642-645,共4页
目的:评价两种随机缺失的二分类变量资料处理方法。方法:以艾滋病中医症候的调查资料为数据来源,利用SAS9.2对完整数据集随机模拟,构建不同比例的随机缺失数据集,对缺失数据集采用多重填补法中的lo-gistic回归法(MI/logistic)进行填充处... 目的:评价两种随机缺失的二分类变量资料处理方法。方法:以艾滋病中医症候的调查资料为数据来源,利用SAS9.2对完整数据集随机模拟,构建不同比例的随机缺失数据集,对缺失数据集采用多重填补法中的lo-gistic回归法(MI/logistic)进行填充处理;同时对缺失数据集采用成组删除法进行处理;根据各个数据集建立logis-tic回归模型,与完整数据集进行比较。结果:缺失10%时,成组删除法处理结果与完整数据集更接近;缺失20%~40%时,MI/logistic填补后常数项和x的回归系数明显偏离完整数据集;缺失50%时,MI/logistic填充2次时x的回归系数和标准误更接近于完整数据集;缺失60%时,MI/logistic填充后x的回归系数严重偏离完整数据集,成组删除后x回归系数的标准误明显偏离完整数据集。结论:缺失较少(缺失率<40%)时,成组删除法处理效果较好;缺失50%时,采用MI/logistic回归法填充效果更好;缺失60%以上时,两处理方法均不理想。 展开更多
关键词 二分类变量 缺失值 成组删除 多重填补法
在线阅读 下载PDF
运用多重填补方法分析世界健康调查数据(英文)
2
作者 曹阳 RITU Sadana AJAY Tandon 《第二军医大学学报》 CAS CSCD 北大核心 2004年第2期195-199,共5页
目的 :解决世界健康调查 (World Health Survey,WHS)数据中的数据缺失问题 ,进行更加有效的统计推断。 方法 :根据多重填补 (multiple imputation,MI)的原理 ,运用 Am elia软件和 Stata○R中的综合统计推断程序对 WHS数据集进行处理。结... 目的 :解决世界健康调查 (World Health Survey,WHS)数据中的数据缺失问题 ,进行更加有效的统计推断。 方法 :根据多重填补 (multiple imputation,MI)的原理 ,运用 Am elia软件和 Stata○R中的综合统计推断程序对 WHS数据集进行处理。结果 :由缺失数据造成的信息缺失得到了弥补 ,综合评价结果的质量得到了提高。 结论 :MI具有良好的特性 ,和针对特定问题但操作复杂的方法相比 ,MI是一种解决数据缺失问题的简单和近似的方法。 展开更多
关键词 多重填补法 世界健康调查 数据缺失 卫生统计
在线阅读 下载PDF
三种块缺失数据处理方法的比较 被引量:6
3
作者 林丽娟 董学思 +3 位作者 赵杨 魏永越 戴俊程 陈峰 《中国卫生统计》 CSCD 北大核心 2017年第3期523-525,527,共4页
跨平台组学数据(cross-platform-omics data)研究中,一组样本往往只在某些平台(例如蛋白组学、代谢组学等)上进行了测序分析,而另外一些样本在其他平台(例如,基因组学、蛋白组学等)上进行了测序,欲将不同平台的数据进行整合分析,... 跨平台组学数据(cross-platform-omics data)研究中,一组样本往往只在某些平台(例如蛋白组学、代谢组学等)上进行了测序分析,而另外一些样本在其他平台(例如,基因组学、蛋白组学等)上进行了测序,欲将不同平台的数据进行整合分析,则块缺失(block missing)是不可避免的。由于块缺失的缺失比例比较高,如果将含有缺失的观测全部剔除,仅对完整数据进行分析,则会损失大量信息,甚至无信息可用。 展开更多
关键词 缺失数据 缺失率 蛋白组学 代谢组学 基因组学 处理方 平台组 MISSING 回归系数 多重填补法
在线阅读 下载PDF
工业过程数据中缺失值处理方法的研究 被引量:14
4
作者 郭超 陆新建 《计算机工程与设计》 CSCD 北大核心 2010年第6期1351-1354,共4页
针对工业生产中过程数据的缺失问题,首次提出了运用多重填补方法处理工业过程的缺失数据。阐述了常用的缺失数据处理方法,指出各方法的优缺点。在此基础上,通过建立回归模型,针对多变量工业数据中缺失值较少和较多时的两种情况,分别用... 针对工业生产中过程数据的缺失问题,首次提出了运用多重填补方法处理工业过程的缺失数据。阐述了常用的缺失数据处理方法,指出各方法的优缺点。在此基础上,通过建立回归模型,针对多变量工业数据中缺失值较少和较多时的两种情况,分别用删除含缺失值的个案、简单填补和多重填补(MI)3种方法对数据进行处理,利用处理后的新数据集进行数据挖掘,预测目标变量的值,并对预测结果进行分析比较。实验结果表明,多重填补方法的处理效果最好,为工业数据的缺失值处理提供了有用的策略。 展开更多
关键词 缺失值 多重填补法 工业过程数据 数据挖掘 回归预测
在线阅读 下载PDF
SAS中处理数据集缺失值方法的对比研究 被引量:9
5
作者 殷杰 石锐 《计算机应用》 CSCD 北大核心 2007年第B06期438-439,共2页
采用SAS软件中的多重填补法(MI),期望最大化算法(EM)和Ad Hoc法分别对医疗费用集的缺失值进行处理,比较三种方法的优劣并探讨其在医疗费用缺失值处理中的适用性。运用SAS9.10,采用数据模拟技术,分别模拟真实医疗数据集的各种缺失率的随... 采用SAS软件中的多重填补法(MI),期望最大化算法(EM)和Ad Hoc法分别对医疗费用集的缺失值进行处理,比较三种方法的优劣并探讨其在医疗费用缺失值处理中的适用性。运用SAS9.10,采用数据模拟技术,分别模拟真实医疗数据集的各种缺失率的随机缺失数据集,分别用MI、EM和Ad Hoc对各缺失数据集进行处理,对结果进行比较和分析。结果:数据缺失率≤10%时,Ad Hoc更优;数据缺失率在15%~30%时,经MI处理后的分析结果更接近“真实”;数据缺失率≥35%时,三种方法均无效。结论:对不同缺失率的费用科目缺失数据集,MI和Ad Hoc对缺失值的处理各有优劣,EM效果略差于MI,没有明显优势。 展开更多
关键词 缺失值填补 多重填补法 期望最大化算 AD Hoc
在线阅读 下载PDF
基于Monte Carlo模拟的完全随机缺失数据处理方法效果比较 被引量:5
6
作者 王可 杨弘 +3 位作者 田晶 李晨昊 韩清华 张岩波 《中国卫生统计》 CSCD 北大核心 2020年第2期298-301,共4页
目的探讨不同缺失比率下几种缺失处理方法的优劣,为缺失数据的处理提供参考。方法以慢性心力衰竭的部分患者电子病历资料为数据基础,运用R软件,采用Monte Carlo模拟完全随机、任意缺失的数据集,并采用成组删除法、均值填补法、期望最大... 目的探讨不同缺失比率下几种缺失处理方法的优劣,为缺失数据的处理提供参考。方法以慢性心力衰竭的部分患者电子病历资料为数据基础,运用R软件,采用Monte Carlo模拟完全随机、任意缺失的数据集,并采用成组删除法、均值填补法、期望最大化填补法、缺失森林填补法和多重填补法分别对模拟的不同缺失比率数据集进行缺失处理,并对所得"完整数据集"拟合多元线性回归模型,得到的参数估计结果与完整数据集参数估计进行比较。结果在不同的缺失比率下不同缺失处理的效果存在差别,在5%和10%缺失比率下,链式方程填补法(multivariate imputation by chained equations,MICE)和期望最大化法(expectation maximization,EM)最优,缺失森林填补法(miss forest,MF)、均值填补法(mean completer,MC)和成组删除法(complete case method,CCM)效果接近;在20%缺失比率下,MICE最优,EM次之,CCM和MF近似,MC最差;在30%缺失比率下,MICE和MF最优,EM和CCM次之,MC最差;在50%缺失比率下,MICE最优,EM和CCM次之,CCM和MF最差。结论对于不同缺失比率的数据,研究人员应综合考虑缺失处理方法的准确度和精确度以及操作难易程度,必须根据实际数据加以调整,采用不同的方法进行处理。 展开更多
关键词 缺失处理 期望最大化 缺失森林填补 多重填补法
在线阅读 下载PDF
基于Monte Carlo模拟的四种完全随机双变量缺失数据处理方法的比较 被引量:7
7
作者 朱高培 朱乐乐 +1 位作者 孟马承 吴学森 《中国卫生统计》 CSCD 北大核心 2018年第5期707-709,共3页
目的探讨完全随机缺失机制下,成组删除法、均值填补法、回归填补法和多重填补法处理缺失数据的效果及趋势。方法运用R语言,采用Monte Carlo技术模拟完整数据集、不同缺失比例和相关系数条件下的数据集,比较各种方法处理缺失值的效果。... 目的探讨完全随机缺失机制下,成组删除法、均值填补法、回归填补法和多重填补法处理缺失数据的效果及趋势。方法运用R语言,采用Monte Carlo技术模拟完整数据集、不同缺失比例和相关系数条件下的数据集,比较各种方法处理缺失值的效果。结果当缺失比例为10%时,4种方法处理效果一致。随着缺失比例增加,4种方法处理后均值变化不大;均值填补法处理后相关系数小于其他方法,多重填补法和标准一致,回归填补法填补后相关系数比其他方法偏高而且呈增加趋势。随着回归系数的增加,回归填补法的相关系数准确性增加。结论 4种方法处理完全随机缺失机制下两个相关变量的效果不同,当缺失比例较低时,建议采用成组删除法或回归填补法。当缺失比例较大时,建议使用多重填补法。 展开更多
关键词 缺失值 相关变量 多重填补法 MONTE CARLO模拟
在线阅读 下载PDF
基本风速预测中缺失历史数据的修订方法
8
作者 项程 陈艾荣 +1 位作者 李其恒 马如进 《南京工业大学学报(自然科学版)》 CAS 北大核心 2019年第6期800-806,共7页
基本风速预测及制定中,经常会碰到历史数据的缺失现象,从而带来有效数据量少、风速预测效率不高的问题。为了尽可能避免这一现象带来的影响,对缺失历史数据进行修订是一个十分重要的环节。提出了基本风速预测中缺失数据的修订方法。统... 基本风速预测及制定中,经常会碰到历史数据的缺失现象,从而带来有效数据量少、风速预测效率不高的问题。为了尽可能避免这一现象带来的影响,对缺失历史数据进行修订是一个十分重要的环节。提出了基本风速预测中缺失数据的修订方法。统计了各气象台站的最大风速数据缺失率,介绍了目前采用的数据修订方法。根据数据缺失的特点及关注的对象,选用多重填补法对缺失的数据进行修订,并详细介绍了该方法的填补步骤。选用两个具体填补算例对日最大风速值数据修订进行说明,并用极值Ⅰ型概率模型对比了填补前后数据预测百年一遇风速的效果。结果表明,利用经缺失数据填补后的风速数据文件得到的历年最大风速序列,可以有效改善由于数据记录缺失造成的年最大风速值的遗漏,更好地预测基本风速。 展开更多
关键词 基本风速 缺失数据修订 多重填补法
在线阅读 下载PDF
代际收入流动、阶层地位与初婚居住安排 被引量:2
9
作者 金卉 范晓光 《浙江学刊》 CSSCI 北大核心 2014年第2期214-218,共5页
初婚居住安排是理解家庭形态与结构发展的重要事件,既有的资源决定论视角主要探究的是个体绝对资源对居住安排的影响,但对资源效力的代际差异缺乏系统研究。本文通过对上海家庭调查(SHFS2010)数据的分析,发现中国城市家庭的初婚居住安... 初婚居住安排是理解家庭形态与结构发展的重要事件,既有的资源决定论视角主要探究的是个体绝对资源对居住安排的影响,但对资源效力的代际差异缺乏系统研究。本文通过对上海家庭调查(SHFS2010)数据的分析,发现中国城市家庭的初婚居住安排并不完全由夫妻阶层地位左右,而更多的受制于原生家庭的社会经济地位。经过贝叶斯多重填补法对资料进行处理后,结果进一步支持代际收入流动对初婚居住安排具有决定作用。 展开更多
关键词 代际 阶层地位 居住安排 多重填补法
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部