期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于信息熵的高维稀疏大数据降维算法研究
被引量:
20
1
作者
何兴高
李蝉娟
+2 位作者
王瑞锦
邓伏虎
刘行
《电子科技大学学报》
EI
CAS
CSCD
北大核心
2018年第2期235-241,共7页
数据降维是从高维数据中挖掘有效信息的必要步骤。传统的主成分分析(PCA)算法应用于超高维稀疏数据降维时,存在着无法将所有数据特征一次性读入内存以进行分析计算的问题,而之后提出的分块处理PCA算法由于耗时太长,并不能满足实际需求...
数据降维是从高维数据中挖掘有效信息的必要步骤。传统的主成分分析(PCA)算法应用于超高维稀疏数据降维时,存在着无法将所有数据特征一次性读入内存以进行分析计算的问题,而之后提出的分块处理PCA算法由于耗时太长,并不能满足实际需求。本文引入信息熵的思想对PCA算法进行改进,提出E-PCA算法,先利用信息熵对数据进行特征筛选,剔除大部分无用特征,再使用PCA算法对处理后的超高维稀疏数据进行降维。通过实验结果表明,在保留相同比例原数据信息的情况下,本文提出的基于信息熵的E-PCA算法在内存占用、运行时间以及降维结果都优于分块处理PCA算法。
展开更多
关键词
分块处理
降维处理
高维稀疏大数据
信息熵
主成分分析
在线阅读
下载PDF
职称材料
题名
基于信息熵的高维稀疏大数据降维算法研究
被引量:
20
1
作者
何兴高
李蝉娟
王瑞锦
邓伏虎
刘行
机构
电子科技大学信息与软件工程学院
出处
《电子科技大学学报》
EI
CAS
CSCD
北大核心
2018年第2期235-241,共7页
基金
国家自然科学基金(61472064
61602096)
+6 种基金
四川省科技计划项目(2016FZ0002
2015JY0178
2016ZC2575)
四川省教育厅重点项目(17ZA0322)
中央高校基本科研基金(ZYGX2014J051
ZYGX2014J066)
网络与数据安全四川省重点实验室开放课题(NDSMS201606)
文摘
数据降维是从高维数据中挖掘有效信息的必要步骤。传统的主成分分析(PCA)算法应用于超高维稀疏数据降维时,存在着无法将所有数据特征一次性读入内存以进行分析计算的问题,而之后提出的分块处理PCA算法由于耗时太长,并不能满足实际需求。本文引入信息熵的思想对PCA算法进行改进,提出E-PCA算法,先利用信息熵对数据进行特征筛选,剔除大部分无用特征,再使用PCA算法对处理后的超高维稀疏数据进行降维。通过实验结果表明,在保留相同比例原数据信息的情况下,本文提出的基于信息熵的E-PCA算法在内存占用、运行时间以及降维结果都优于分块处理PCA算法。
关键词
分块处理
降维处理
高维稀疏大数据
信息熵
主成分分析
Keywords
block processing
dimensionality reduction
high-dimensional sparse data
informationentropy
principal component analysis
分类号
TP309 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于信息熵的高维稀疏大数据降维算法研究
何兴高
李蝉娟
王瑞锦
邓伏虎
刘行
《电子科技大学学报》
EI
CAS
CSCD
北大核心
2018
20
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部