-
题名高维相关性缺失数据的分块填补算法研究
被引量:6
- 1
-
-
作者
杨杰
杨虎
王鲁滨
金鑫
郭华
于亮亮
-
机构
中央财经大学信息学院
国网荆州供电公司信通分公司
国网辽宁省电力有限公司信息通信分公司
-
出处
《计算机科学与探索》
CSCD
北大核心
2017年第10期1557-1569,共13页
-
基金
中央财经大学青年教师发展基金No.QJJ1510
国家电网科技部项目No.SGTYHT/14-JS-188~~
-
文摘
研究了高维相关性缺失数据的填补方法,提出了分块填补算法。该算法核心思想是:在填补数据的过程中会考虑变量之间的相互关系,仅利用与待填补数据有相关性的数据进行填补,从而降低不相关数据对缺失数据填补的影响,提高数据填补的准确度。同时,该算法能够并行处理缺失数据,从而提高数据填补效率,对于高维缺失数据的填补有重要意义。为了对分块情况未知的缺失数据进行分块,提出了基于k-means聚类的分块算法。大量的仿真实验和基于真实数据集的实验表明,对于相关性数据,分块填补算法能够有效地利用相关信息进行填补,从而提高数据填补准确度。
-
关键词
高维相关性数据
缺失数据
分块填补算法
-
Keywords
high dimensional correlation data
missing data
block imputation algorithm
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-