期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于Map/Reduce的朴素贝叶斯数据分类算法研究 被引量:12
1
作者 崔良中 郭福亮 宋建新 《海军工程大学学报》 CAS 北大核心 2019年第4期7-10,共4页
针对目前机器学习研究领域中的数据分类问题,选择朴素贝叶斯算法作为研究对象。首先,通过对样本数据特征属性的权重进行加权调整,提高算法处理的准确率;然后,改进朴素贝叶斯算法分类器模型,使其能够利用Map/Reduce并行编程模型,采用多... 针对目前机器学习研究领域中的数据分类问题,选择朴素贝叶斯算法作为研究对象。首先,通过对样本数据特征属性的权重进行加权调整,提高算法处理的准确率;然后,改进朴素贝叶斯算法分类器模型,使其能够利用Map/Reduce并行编程模型,采用多计算资源节点并行处理,进一步提高处理速度。最后,对UCI dataset数据库进行实验验证,结果表明:改进后的算法在海量数据分类处理中具有更好的性能表现。 展开更多
关键词 Map/Reduce并行编程模型 数据分类算法 贝叶斯算法 海量数据处理
在线阅读 下载PDF
利用最近邻信息快速分类多标签数据 被引量:3
2
作者 乔健 田庆 《计算机工程与应用》 CSCD 北大核心 2011年第32期138-140,190,共4页
为克服ML-KNN在分类效率方面的局限性,提出了一种基于KNN的快速多标签数据分类算法FKMC,利用待分类实例的k个最近邻的局部信息进行排序分类。从已分类数据实例集中选择待分类数据实例的k个最近邻;根据每个最近邻拥有的标签数和每个标签... 为克服ML-KNN在分类效率方面的局限性,提出了一种基于KNN的快速多标签数据分类算法FKMC,利用待分类实例的k个最近邻的局部信息进行排序分类。从已分类数据实例集中选择待分类数据实例的k个最近邻;根据每个最近邻拥有的标签数和每个标签归属的最近邻数对待分类实例进行排序分类。仿真结果表明,最近邻的选择方法对分类器性能有显著的影响;在分类效果上FKMC与ML-KNN相当,有时甚至优于后者;而在分类效率上FKMC则显著优于ML-KNN。 展开更多
关键词 最近邻 快速分类 多标签数据 快速多标签数据分类算法(FKMC)
在线阅读 下载PDF
面向大数据的数据处理与分析算法综述 被引量:30
3
作者 周宇 曹英楠 王永超 《南京航空航天大学学报》 CAS CSCD 北大核心 2021年第5期664-676,共13页
大数据处理是近年来广受关注和研究的技术领域,数据挖掘作为从大量数据中挖掘隐藏价值信息的技术,是处理大数据的有效工具。本文主要从数据挖掘的角度对大数据处理算法的研究现状进行分类总结。首先介绍了大数据中针对流式数据分类的方... 大数据处理是近年来广受关注和研究的技术领域,数据挖掘作为从大量数据中挖掘隐藏价值信息的技术,是处理大数据的有效工具。本文主要从数据挖掘的角度对大数据处理算法的研究现状进行分类总结。首先介绍了大数据中针对流式数据分类的方法,包括单模型算法和集成分类算法;其次分别从单机算法和基于分布式并行平台的多机算法两个角度概括介绍了大数据聚类方法以及大数据关联规则挖掘方法;最后总结了现有面向大数据的数据挖掘算法的研究进展并展望未来的发展趋势。 展开更多
关键词 数据分类算法 数据聚类算法 数据关联规则挖掘
在线阅读 下载PDF
一种处理较大规模数据分类的支持向量机
4
作者 徐健 陈光喜 《计算机工程与应用》 CSCD 北大核心 2007年第6期165-167,共3页
对支持向量分类机中的一些基本方法作出详细地介绍,并进一步研究了方法的求解与改进。并通过对标准支持向量机的改造考虑了一种改进的方法,并进行相关的理论分析,通过数据实验验证了这种方法比传统的分类机在运算速度上有提高,特别是在... 对支持向量分类机中的一些基本方法作出详细地介绍,并进一步研究了方法的求解与改进。并通过对标准支持向量机的改造考虑了一种改进的方法,并进行相关的理论分析,通过数据实验验证了这种方法比传统的分类机在运算速度上有提高,特别是在处理较大规模的数据集时运算时间的效果更明显。 展开更多
关键词 支持向量机 数据分类算法 大规模数据 运算速度
在线阅读 下载PDF
不平衡数据分类研究综述 被引量:51
5
作者 赵楠 张小芳 张利军 《计算机科学》 CSCD 北大核心 2018年第B06期22-27,57,共7页
在很多应用领域中,数据的类别分布不平衡,如何对其正确分类是数据挖掘和机器学习领域中的研究热点。经典的数据分类算法未考虑数据类别的不平衡性,认为类别之间的误分类代价相同,导致不平衡数据分类的效果不理想。针对数据分类的各个步... 在很多应用领域中,数据的类别分布不平衡,如何对其正确分类是数据挖掘和机器学习领域中的研究热点。经典的数据分类算法未考虑数据类别的不平衡性,认为类别之间的误分类代价相同,导致不平衡数据分类的效果不理想。针对数据分类的各个步骤,相继提出了不同的不平衡数据分类处理方法。对多年来的相关研究成果进行归类分析,从特征选择、数据分布调整、分类算法、分类结果评估等几个方面系统地介绍了相关方法,并探讨了进一步的探索方向。 展开更多
关键词 不平衡数据分类 不平衡数据的特征选择 不平衡分类评估 数据分布调整 不平衡数据分类算法
在线阅读 下载PDF
应用潜在分类泊松回归模型及EM算法研究网络购物使用次数 被引量:5
6
作者 王芯 吕晓玲 《统计与决策》 CSSCI 北大核心 2011年第1期7-9,共3页
随着网络的兴起,网上购物在人们的生活中发挥着越来越重要的作用。网上购物以其方便快捷等特点吸引了很多购物者,但是也有一些人质疑网上购物安全性、不可触摸性等问题。什么因素影响人们对网络购物的选择?人们由于对网络购物的态度取... 随着网络的兴起,网上购物在人们的生活中发挥着越来越重要的作用。网上购物以其方便快捷等特点吸引了很多购物者,但是也有一些人质疑网上购物安全性、不可触摸性等问题。什么因素影响人们对网络购物的选择?人们由于对网络购物的态度取向不同可分为多少潜在的类别?文章应用潜在分类泊松回归模型及EM算法分析大学生网上购物的陈述偏好数据,回答了以上两个问题,得到了十分有意义的结果。 展开更多
关键词 网上购物 影响因素 潜在分类泊松回归模型EM算法陈述偏好数据
在线阅读 下载PDF
应用于不平衡多分类问题的损失平衡函数 被引量:13
7
作者 黄庆康 宋恺涛 陆建峰 《智能系统学报》 CSCD 北大核心 2019年第5期953-958,共6页
传统分类算法一般要求数据集类别分布平衡,然而在实际情况中往往面临的是不平衡的类别分布。目前存在的数据层面和模型层面算法试图从不同角度解决该问题,但面临着参数选择以及重复采样产生的额外计算等问题。针对此问题,提出了一种在... 传统分类算法一般要求数据集类别分布平衡,然而在实际情况中往往面临的是不平衡的类别分布。目前存在的数据层面和模型层面算法试图从不同角度解决该问题,但面临着参数选择以及重复采样产生的额外计算等问题。针对此问题,提出了一种在小批量内样本损失自适应均衡化的方法。该算法采用了一种动态学习损失函数的方式,根据小批量内样本标签信息调整各样本损失权重,从而实现在小批量内各类别样本总损失的平衡性。通过在caltech101和ILSVRC2014数据集上的实验表明,该算法能够有效地减少计算成本并提高分类精度,且一定程度上避免了过采样方法所带来的模型过拟合风险。 展开更多
关键词 不平衡学习 不平衡数据分类 分类不平衡 损失平衡 不平衡数据分类算法 不平衡数据 F1调和平均 卷积神经网络 深度学习
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部