期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
运用SAS对不完整数据集进行多重填补——SAS 9中的多重填补及其统计分析过程(一) 被引量:17
1
作者 曹阳 张罗漫 《中国卫生统计》 CSCD 北大核心 2004年第1期56-58,63,共4页
关键词 SAS 不完整数据集 多重填补 SAS9 多重填补 统计分析 实验研究
在线阅读 下载PDF
不完整数据集的MFR辐射源识别方法研究 被引量:2
2
作者 陈维高 朱卫纲 +1 位作者 唐晓婧 贾鑫 《电子科技大学学报》 EI CAS CSCD 北大核心 2019年第1期39-45,共7页
该文提出一种基于随机森林的不完整数据集的多功能雷达(MFR)辐射源识别方法,该方法在MFR辐射源波形单元识别框架基础上,首先对参数缺失的先验知识集进行多重划分,得到多个不含缺失参数的样本子集,然后删减冗余子集并利用随机森林算法对... 该文提出一种基于随机森林的不完整数据集的多功能雷达(MFR)辐射源识别方法,该方法在MFR辐射源波形单元识别框架基础上,首先对参数缺失的先验知识集进行多重划分,得到多个不含缺失参数的样本子集,然后删减冗余子集并利用随机森林算法对各个子集构建弱分类器,最后根据弱分类器对识别结果贡献率的不同,进行权值设定,得到最终的识别模型。仿真实验证实了提出的MDRF-WA方法能够提高少量先验知识条件下波形单元识别的准确率和鲁棒性,降低计算成本。 展开更多
关键词 不完整数据集 多功能雷达 多重划分 随机森林 波形单元
在线阅读 下载PDF
一种基于Bernoulli混合模型的不完整数据文本分类方法
3
作者 蔡崇超 王士同 《计算机应用》 CSCD 北大核心 2007年第5期1235-1237,1250,共4页
在Bernoulli混合模型和期望最大化(EM)算法的基础上给出了一种基于不完整数据的改进方法。首先在已标记数据的基础上通过Bernoulli混合模型和朴素贝叶斯算法得到似然函数参数估计初始值,然后利用含有权值的EM算法对分类器的先验概率模... 在Bernoulli混合模型和期望最大化(EM)算法的基础上给出了一种基于不完整数据的改进方法。首先在已标记数据的基础上通过Bernoulli混合模型和朴素贝叶斯算法得到似然函数参数估计初始值,然后利用含有权值的EM算法对分类器的先验概率模型进行参数估计,得到最终的分类器。实验结果表明,该方法在准确率和查全率方面要优于朴素贝叶斯文本分类。 展开更多
关键词 不完整数据集 文本分类 朴素贝叶斯分类 Bernoulli混合模型 期望最大化算法
在线阅读 下载PDF
基于缺失率的不完整数据填补算法 被引量:25
4
作者 刘佳星 张宏烈 +1 位作者 刘艳菊 刘彦忠 《统计与决策》 CSSCI 北大核心 2021年第2期39-41,共3页
机器学习和数据挖掘已经应用于诸多领域。然而由于各种原因,真实数据集通常包含缺失值。为了提高填补缺失值的准确率,文章基于不完整数据的不同缺失率,在R平台上对7种插补方法进行评估。实验结果表明,缺失森林和马尔科夫链蒙特卡洛方法... 机器学习和数据挖掘已经应用于诸多领域。然而由于各种原因,真实数据集通常包含缺失值。为了提高填补缺失值的准确率,文章基于不完整数据的不同缺失率,在R平台上对7种插补方法进行评估。实验结果表明,缺失森林和马尔科夫链蒙特卡洛方法的平均绝对百分误和误分类比率优于其他填补方法。基于验证结果,提出了一种混合插补方法,即在计算数据集的缺失率之后,使用缺失森林估算缺失率小于等于5%的缺失值,然后使用马尔科夫链蒙特卡洛填补缺失率为5%到10%的缺失值。 展开更多
关键词 不完整数据集 缺失率 缺失森林 多重插补
在线阅读 下载PDF
基于缺失率的不完整就业预测数据填充算法 被引量:4
5
作者 熊露露 年梅 张俊 《现代电子技术》 2022年第15期104-108,共5页
目前变量缺失率相同的填充算法用于多变量缺失率不同的不完整数据集填充效果有限,为了提高对多变量缺失率不同数据集的预测准确率,创新性地提出RXGRegressor集成模型。首先,在BostonHousing数据集上得出RandomForestRegressor、XGBRegre... 目前变量缺失率相同的填充算法用于多变量缺失率不同的不完整数据集填充效果有限,为了提高对多变量缺失率不同数据集的预测准确率,创新性地提出RXGRegressor集成模型。首先,在BostonHousing数据集上得出RandomForestRegressor、XGBRegressor、GradientBoostingRegressor三种算法填充效果最佳的单变量缺失率范围,对多变量缺失率不同的数据集依据各变量缺失率值选择合适的填充算法;然后,为了验证RXGRegressor模型在实际数据集中的可用性,将其应用于多变量缺失率不同的就业预测数据集上;最后,使用随机森林分类器分别对RXGRegressor模型、均值和单一的回归模型填充后的完整数据集进行就业预测,用分类的ACCURACY得分衡量填充性能。实验结果表明,单一回归模型的ACCURACY得分高于均值,RXGRegressor集成模型的ACCURACY得分最高,由此验证了所提模型对多变量缺失率不同数据集缺失值填充的可行性和实用性。 展开更多
关键词 缺失率 填充算法 不完整数据集 RXGRegressor 回归模型 就业预测 特征矩阵
在线阅读 下载PDF
铅锌密闭鼓风炉故障诊断知识获取的粗糙集方法 被引量:3
6
作者 唐朝晖 桂卫华 +1 位作者 胡志坤 刘晓颖 《小型微型计算机系统》 CSCD 北大核心 2006年第12期2280-2285,共6页
从粗糙集等价类概念出发,提出从不完整数据集中获取故障诊断知识的密闭鼓风炉故障诊断方法.将不完整数据集的训练事例划分为下近似和上近似两类,首先假设属性的未知特征值为任意可能值,然后根据从训练事例中得到的上下近似进行提炼,最... 从粗糙集等价类概念出发,提出从不完整数据集中获取故障诊断知识的密闭鼓风炉故障诊断方法.将不完整数据集的训练事例划分为下近似和上近似两类,首先假设属性的未知特征值为任意可能值,然后根据从训练事例中得到的上下近似进行提炼,最后从事例与近似互相作用以推导出确定的和可能的规则,得出规则概率,并估计出合适的属性的未知特征值.结合密闭鼓风炉悬料规则库的知识获取及其在故障诊断中的应用过程说明了该方法的有效性和实用性. 展开更多
关键词 知识获取技术 不完整数据集 密闭鼓风炉 粗糙
在线阅读 下载PDF
基于辅助变量近端梯度算法的特征选择
7
作者 王永昌 董必成 《计算机应用与软件》 北大核心 2025年第8期306-316,366,共12页
为了解决传统不完整数据特征选择方法的局限性,提出一种基于辅助变量近端梯度算法的特征选择方法。通过在特征选择过程中使用指标矩阵过滤掉缺失信息,并通过使用辅助变量近端梯度算法来自动分配权重较小甚至为零的异常值和权重较大的重... 为了解决传统不完整数据特征选择方法的局限性,提出一种基于辅助变量近端梯度算法的特征选择方法。通过在特征选择过程中使用指标矩阵过滤掉缺失信息,并通过使用辅助变量近端梯度算法来自动分配权重较小甚至为零的异常值和权重较大的重要样本,从而减少异常值的影响;设计一种优化策略来优化所提出的目标函数,并从理论和实验上证明所提出的优化策略的收敛性;在真实数据集和合成不完全数据集上的实验结果验证了该方法高维数据降维处理后在低维空间上的聚类性能。 展开更多
关键词 不完整数据集 特征选择 辅助变量 近端梯度
在线阅读 下载PDF
数据缺失的扩展置信规则库推理方法 被引量:1
8
作者 刘永裕 巩晓婷 +1 位作者 方炜杰 傅仰耿 《计算机研究与发展》 EI CSCD 北大核心 2022年第3期661-673,共13页
数据驱动的扩展置信规则库专家系统能够处理含有定量数据或定性知识的不确定性问题.该方法已被广泛地研究和应用,但仍缺乏在不完整数据问题上的研究.鉴于此,针对不完整数据集上的问题,提出一种新的扩展置信规则库专家系统推理方法.首先... 数据驱动的扩展置信规则库专家系统能够处理含有定量数据或定性知识的不确定性问题.该方法已被广泛地研究和应用,但仍缺乏在不完整数据问题上的研究.鉴于此,针对不完整数据集上的问题,提出一种新的扩展置信规则库专家系统推理方法.首先提出基于析取范式的扩展规则结构,并通过实验讨论了在新的规则结构下,置信规则前提属性参考值个数对推理方法的影响;然后提出通过不完整数据生成具有不完整置信规则,并构成析取范式置信规则库的方法,同时引入衰减因子修正不完整规则权重,使不完整规则可以更合理地参与信息融合过程;最后,选取若干个公共数据集对所提方法进行验证.与其他方法的实验对比显示,新方法在完整数据集上有良好表现的同时,对具有不同缺失程度和缺失模式的数据集表现出更好更稳定的推理效果. 展开更多
关键词 置信规则库 证据推理 数据驱动 数据缺失 不完整数据集
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部