期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于Hadoop的Dirichlet朴素贝叶斯文本分类算法
被引量:
3
1
作者
孟海东
肖银龙
宋宇辰
《现代电子技术》
北大核心
2016年第4期29-33,共5页
针对当前大数据环境下朴素贝叶斯文本分类算法在处理文本分类任务时存在的数据稀疏以及效率低的问题,提出了一种基于Hadoop的Dirichlet朴素贝叶斯文本分类算法。该算法引入统计语言建模技术中的Dirichlet数据平滑方法,采用Map Reduce编...
针对当前大数据环境下朴素贝叶斯文本分类算法在处理文本分类任务时存在的数据稀疏以及效率低的问题,提出了一种基于Hadoop的Dirichlet朴素贝叶斯文本分类算法。该算法引入统计语言建模技术中的Dirichlet数据平滑方法,采用Map Reduce编程模型,在Hadoop云计算平台上实现了算法的并行化。通过实验对比分析了该算法与传统朴素贝叶斯文本分类算法对大规模文本数据的分类效果。结果表明,该算法显著提高了传统朴素贝叶斯文本分类算法的准确率、召回率,且具有高效性和易扩展性。
展开更多
关键词
文本
分类
云计算
MAPREDUCE
朴素
贝
叶
斯文本
数据平滑
在线阅读
下载PDF
职称材料
基于特征相关的改进加权朴素贝叶斯分类算法
被引量:
30
2
作者
饶丽丽
刘雄辉
张东站
《厦门大学学报(自然科学版)》
CAS
CSCD
北大核心
2012年第4期682-685,共4页
朴素贝叶斯分类算法的特征项间强独立性的假设在现实中是很难满足的.为了在一定程度上放松这一假设,提出了基于特征相关的改进加权朴素贝叶斯分类算法,该算法采用一种新的权重计算方法,这种权重计算方法是在传统词频-反文档频率(TF-IDF...
朴素贝叶斯分类算法的特征项间强独立性的假设在现实中是很难满足的.为了在一定程度上放松这一假设,提出了基于特征相关的改进加权朴素贝叶斯分类算法,该算法采用一种新的权重计算方法,这种权重计算方法是在传统词频-反文档频率(TF-IDF)权重计算基础上,考虑到特征项在类内和类间的分布情况,另外还结合特征项间的相关度,调整权重计算值,加大最能代表所属类的特征项的权重,将它称之为TF-IDF-FC权重计算.与基于传统TF-IDF权重的加权朴素贝叶斯分类算法和其他常用加权朴素贝叶斯分类算法比较,如基于属性加权的朴素贝叶斯分类算法,这种算法的分类效果均有一定的提高.
展开更多
关键词
朴素
贝
叶
斯文本
分类
器
加权朴素贝叶斯文本分类算法
TF—IDF权重
特征项间的相关度
在线阅读
下载PDF
职称材料
题名
基于Hadoop的Dirichlet朴素贝叶斯文本分类算法
被引量:
3
1
作者
孟海东
肖银龙
宋宇辰
机构
内蒙古科技大学信息工程学院
内蒙古科技大学经济与管理学院
出处
《现代电子技术》
北大核心
2016年第4期29-33,共5页
基金
国家自然科学基金项目(71363040)
文摘
针对当前大数据环境下朴素贝叶斯文本分类算法在处理文本分类任务时存在的数据稀疏以及效率低的问题,提出了一种基于Hadoop的Dirichlet朴素贝叶斯文本分类算法。该算法引入统计语言建模技术中的Dirichlet数据平滑方法,采用Map Reduce编程模型,在Hadoop云计算平台上实现了算法的并行化。通过实验对比分析了该算法与传统朴素贝叶斯文本分类算法对大规模文本数据的分类效果。结果表明,该算法显著提高了传统朴素贝叶斯文本分类算法的准确率、召回率,且具有高效性和易扩展性。
关键词
文本
分类
云计算
MAPREDUCE
朴素
贝
叶
斯文本
数据平滑
Keywords
text classification
cloud computing
MapReduce
Naive Bayes text
data smoothing
分类号
TN911-34 [电子电信—通信与信息系统]
TP311 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
基于特征相关的改进加权朴素贝叶斯分类算法
被引量:
30
2
作者
饶丽丽
刘雄辉
张东站
机构
厦门大学信息科学与技术学院
龙岩烟草工业有限责任公司信息技术部
出处
《厦门大学学报(自然科学版)》
CAS
CSCD
北大核心
2012年第4期682-685,共4页
文摘
朴素贝叶斯分类算法的特征项间强独立性的假设在现实中是很难满足的.为了在一定程度上放松这一假设,提出了基于特征相关的改进加权朴素贝叶斯分类算法,该算法采用一种新的权重计算方法,这种权重计算方法是在传统词频-反文档频率(TF-IDF)权重计算基础上,考虑到特征项在类内和类间的分布情况,另外还结合特征项间的相关度,调整权重计算值,加大最能代表所属类的特征项的权重,将它称之为TF-IDF-FC权重计算.与基于传统TF-IDF权重的加权朴素贝叶斯分类算法和其他常用加权朴素贝叶斯分类算法比较,如基于属性加权的朴素贝叶斯分类算法,这种算法的分类效果均有一定的提高.
关键词
朴素
贝
叶
斯文本
分类
器
加权朴素贝叶斯文本分类算法
TF—IDF权重
特征项间的相关度
Keywords
naive Bayes text classification
weighted naive Bayes text classification
TF-IDF weight
feature correlation
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于Hadoop的Dirichlet朴素贝叶斯文本分类算法
孟海东
肖银龙
宋宇辰
《现代电子技术》
北大核心
2016
3
在线阅读
下载PDF
职称材料
2
基于特征相关的改进加权朴素贝叶斯分类算法
饶丽丽
刘雄辉
张东站
《厦门大学学报(自然科学版)》
CAS
CSCD
北大核心
2012
30
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部