期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于链式方程的收入变量缺失值的多重插补 被引量:8
1
作者 刘凤芹 《统计研究》 CSSCI 北大核心 2009年第1期71-77,共7页
在经济计量分析中收入变量的缺失值是一个普遍而又较难处理的问题。传统的处理方法往往导致分析结果具有系统偏差。本文提出利用基于链式方程的多重插补方法来处理收入变量的缺失值问题。文章将此方法应用到一个实际数据集,然后通过分... 在经济计量分析中收入变量的缺失值是一个普遍而又较难处理的问题。传统的处理方法往往导致分析结果具有系统偏差。本文提出利用基于链式方程的多重插补方法来处理收入变量的缺失值问题。文章将此方法应用到一个实际数据集,然后通过分析插补后的数据集讨论了此方法的性质,并和其他多重插补方法进行了比较。结果表明:基于链式方程的多重插补能在一定程度上纠正推断结果的系统偏差,并且给出恰当的标准差估计。 展开更多
关键词 基于方程多重 缺失值 收入变量
在线阅读 下载PDF
基于信息融合的软件工作量缺失数据插补方法
2
作者 李婧 鲁艳丽 孙胜祥 《海军工程大学学报》 北大核心 2025年第5期65-72,共8页
为解决软件成本预测中软件工作量数据缺失严重的问题,提出了一种基于信息融合的缺失数据插补方法。首先,基于链式方程多重插补法,采用极端随机树、支持向量回归和极端梯度提升树作为插补器,分别生成3个插补数据集,针对每个含缺失值的样... 为解决软件成本预测中软件工作量数据缺失严重的问题,提出了一种基于信息融合的缺失数据插补方法。首先,基于链式方程多重插补法,采用极端随机树、支持向量回归和极端梯度提升树作为插补器,分别生成3个插补数据集,针对每个含缺失值的样本,从这3个数据集中提取对应的插补值,形成3个插补向量;然后,融合这3个插补向量的信息,选择夹角最大的2个向量,计算其均值向量,作为该样本的最终插补结果;最后,处理所有含缺失值的样本,最终生成完整的软件工作量数据集。实验结果表明:所提出的基于信息融合的缺失数据插补方法能有效利用多种模型的互补优势,展现出更高的精度和稳健性,可为软件工作量数据的缺失插补及后续的软件成本预测提供可靠支持。 展开更多
关键词 信息融合 链式方程多重插补 软件工作量缺失数据 数据
在线阅读 下载PDF
矿井通风参数缺失数据插补方法 被引量:4
3
作者 倪景峰 刘雪峰 邓立军 《煤炭学报》 EI CAS CSCD 北大核心 2024年第5期2315-2323,共9页
矿井智能通风系统对矿山智能化建设至关重要。为解决矿井通风参数在实际测量时,因为巷道不具备测试条件、仪器信号受到干扰、巷道断面风速不均一、人工操作不当等制约性因素,造成的矿井通风参数数据缺失问题,提出了1种基于随机森林−链... 矿井智能通风系统对矿山智能化建设至关重要。为解决矿井通风参数在实际测量时,因为巷道不具备测试条件、仪器信号受到干扰、巷道断面风速不均一、人工操作不当等制约性因素,造成的矿井通风参数数据缺失问题,提出了1种基于随机森林−链式方程多重插补法的矿井通风参数缺失数据插补方法。采用链式方程多重插补法,通过迭代对每个缺失的属性值产生n个插补值,从而产生n个完整数据集,对n个完整数据集进行分析优化得到1个最终的完整数据集。为了提高缺失值插补精度,合理考虑了矿井通风参数缺失数据的不确定性对分析过程的影响,在随机森林的预测任务中,结合预测均值匹配模型对缺失数据进行插补。以潞新二矿为实验对象,利用智能矿井通风仿真系统IMVS对潞新二矿矿井通风参数原始数据集进行数据预处理,得到完整、准确的矿井通风参数完整数据集,对完整数据集分别进行了不同缺失属性、不同数据缺失率、不同迭代次数的对比试验。以多种模型评价指标对模型有效性进行评估。结果表明:基于随机森林的链式方程多重插补模型插补形成的完整数据集与原始数据集具有很好的相似性;对不同缺失列进行插补实验的结果显示插补模型可以轻松处理混合类型的数据,自主学习参数之间的相关性从而降低了插补复杂性;迭代后形成的n个数据集通过分析合并成一个最终数据集,提高了插补准确率;对初始插补后的完整数据集进行不同迭代次数的试验,发现迭代超过一定次数后,数据相关性一定会收敛。 展开更多
关键词 矿井通风 随机森林 链式方程多重插补 缺失数据 数据
在线阅读 下载PDF
中国工业企业数据库(1999~2013)的使用研究:基于插值处理方法的比较分析 被引量:10
4
作者 张少华 李苏苏 《贵州财经大学学报》 CSSCI 北大核心 2021年第5期20-29,共10页
中国工业企业数据库已经成为研究中国微观企业活动的首选数据库,但是数据库中关键指标的缺失严重影响了数据库的更新和使用。本文在借鉴主要文献处理方法的基础上,先后采用单值移动时序平滑法、MICE1、MICE2、MMICE1和MMICE2五种插补方... 中国工业企业数据库已经成为研究中国微观企业活动的首选数据库,但是数据库中关键指标的缺失严重影响了数据库的更新和使用。本文在借鉴主要文献处理方法的基础上,先后采用单值移动时序平滑法、MICE1、MICE2、MMICE1和MMICE2五种插补方法对数据库进行完善,从而将中国工业企业数据库延伸至2013年,并通过计算企业全要素生产率来评估各种插补方法的相对有效性。研究表明:在这五种插值方法中,单值移动时序平滑法和MMICE1是两种最为有效的插值方法,不仅可以实现插值前后的数据库特征一致,而且能够实现所计算的全要素生产率的数据结构特征一致。值得强调的是,在完善数据库和计算全要素生产率方面,前者因为处理过程简单因而是一种相对经济的方法,而后者因为能够保留更多样本信息因而是一种相对有效的方法。本文研究价值体现在对使用中国工业企业数据库提供了基础性研究工作。 展开更多
关键词 中国工业企业数据库 单值移动时序平滑法 多重方程 混合 全要素生产率
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部