-
题名缺失数据的混合式重建方法
- 1
-
-
作者
于本成
丁世飞
-
机构
中国矿业大学计算机科学与技术学院
徐州工业职业技术学院信息与电气工程学院
-
出处
《智能系统学报》
CSCD
北大核心
2019年第5期947-952,共6页
-
基金
国家自然科学基金项目(61379101)
江苏省高等职业院校教师专业带头人高端研修项目(2017TDFX003)
-
文摘
缺失数据的问题在各领域中是不可避免的,而传统的数据挖掘算法在处理不完整的数据集时表现不佳。本文将协方差矩阵及协方差矩阵的行列式应用于粒子群优化算法的适应度函数中,并以迭代的方式得出最佳阈值,再使用最佳阈值进行基于进化聚类算法的缺失值重建,解决了阈值的选取困难及其对数据重建结果的影响问题。然后,在自联想极限学习机中调用具有最佳阈值的进化聚类算法,解决了自联想极限学习机输入权值选择的随机性。最后,选取6个UCI标准数据集及9个激活函数来进行验证。实验结果表明,相对于现有的大多数数据重建方法,所提的混合式重建方法可以更有效地完成缺失数据的重建。
-
关键词
数据挖掘
协方差矩阵
适应度函数
粒子群优化
最佳阈值
进化聚类算法
数据重建
自联想的极限学习机
-
Keywords
data mining
covariance matrix
fitness function
particle swarm optimization
optimal threshold
evolvingclustering method
data reconstruction
auto-associative extreme learning machine
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-