期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于信息熵的高维稀疏大数据降维算法研究 被引量:20
1
作者 何兴高 李蝉娟 +2 位作者 王瑞锦 邓伏虎 刘行 《电子科技大学学报》 EI CAS CSCD 北大核心 2018年第2期235-241,共7页
数据降维是从高维数据中挖掘有效信息的必要步骤。传统的主成分分析(PCA)算法应用于超高维稀疏数据降维时,存在着无法将所有数据特征一次性读入内存以进行分析计算的问题,而之后提出的分块处理PCA算法由于耗时太长,并不能满足实际需求... 数据降维是从高维数据中挖掘有效信息的必要步骤。传统的主成分分析(PCA)算法应用于超高维稀疏数据降维时,存在着无法将所有数据特征一次性读入内存以进行分析计算的问题,而之后提出的分块处理PCA算法由于耗时太长,并不能满足实际需求。本文引入信息熵的思想对PCA算法进行改进,提出E-PCA算法,先利用信息熵对数据进行特征筛选,剔除大部分无用特征,再使用PCA算法对处理后的超高维稀疏数据进行降维。通过实验结果表明,在保留相同比例原数据信息的情况下,本文提出的基于信息熵的E-PCA算法在内存占用、运行时间以及降维结果都优于分块处理PCA算法。 展开更多
关键词 分块处理 降维处理 高维稀疏大数据 信息熵 主成分分析
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部