期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
结合增益率与堆叠自编码器的并行随机森林算法
1
作者 刘卫明 陈伟达 +1 位作者 毛伊敏 陈志刚 《计算机应用研究》 CSCD 北大核心 2023年第3期750-759,765,共11页
针对大数据环境下随机森林算法存在冗余与不相关特征过多、特征子空间信息含量不足以及并行化效率低等问题,提出了结合增益率与堆叠自编码器的并行随机森林算法PRFGRSAE(parallel random forest algorithm combining gain ratio and sta... 针对大数据环境下随机森林算法存在冗余与不相关特征过多、特征子空间信息含量不足以及并行化效率低等问题,提出了结合增益率与堆叠自编码器的并行随机森林算法PRFGRSAE(parallel random forest algorithm combining gain ratio and stacked auto encoders)。首先,提出了结合非线性归一化增益率和堆叠自编码器的降维策略DRNGRSAE(dimension reduction combining nonlinear normalization gain ratio and stacked auto encoders),通过过滤特征集中的冗余和不相关特征,并利用堆叠自编码器提取特征,有效减少了冗余以及不相关特征数;其次,提出了结合拉丁超立方抽样与归一化相关度的子空间选择策略SSLF(subspace selection strategy combining Latin hypercube sampling and feature class correlation),通过对特征集进行多层划分抽样,形成空间表达度较高的特征子空间,有效保证了特征子空间的信息含量;最后,提出结合可变动作学习自动机的reducer分配策略DSVLA(distribution strategy based on variable-action learning automata),使每个数据簇均匀分配到reducer进行处理,有效提高了并行化效率。实验结果表明,PRFGRSAE算法的加速比与准确度较IMRF、KSMRF和GAPRF算法都有显著提升,因此该算法应用于大数据处理,特别对包含较多特征的数据集有更高的精准度和并行效率。 展开更多
关键词 大数据 MAPREDUCE 并行随机森林 增益率 堆叠自编码器
在线阅读 下载PDF
学习云空间中基于大数据分析的学情预测研究 被引量:13
2
作者 王希哲 黄昌勤 +1 位作者 朱佳 徐小琪 《电化教育研究》 CSSCI 北大核心 2018年第10期60-67,共8页
随着学习云空间应用的不断深入,海量过程性数据与富媒体资源使其呈现为典型大数据特征环境。文章对学习云空间的大数据特征、分析方法及其带来的机遇进行了深入的分析,并依据学习云空间传统数据及其过程性数据提出一种学情预测模型及其... 随着学习云空间应用的不断深入,海量过程性数据与富媒体资源使其呈现为典型大数据特征环境。文章对学习云空间的大数据特征、分析方法及其带来的机遇进行了深入的分析,并依据学习云空间传统数据及其过程性数据提出一种学情预测模型及其实现方法。在模型构建过程中,通过计算各学情因素的Gini增益,实现学习效果影响程度的判别,并提出改进的并行随机森林算法,以世界大学城系统平台为支撑进行学习预测与效果检验。结果表明,该方法较为有效地实现了大数据环境下学习云空间的学情预测,并为学习云空间中基于大数据技术的智能服务提供了一种可行的参考方案。 展开更多
关键词 网络学习空间 学习云空间 教育大数据 关联性判别 学情预测 并行随机森林
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部