期刊文献+
共找到70篇文章
< 1 2 4 >
每页显示 20 50 100
Naive Bayesian Classifier在遥感影像分类中的应用研究 被引量:4
1
作者 陶建斌 舒宁 沈照庆 《遥感信息》 CSCD 2009年第2期52-56,共5页
将Naive Bayesian Classifier(简单贝叶斯网络分类器)用于遥感影像的分类,并对其主要问题如特征选择和后验概率推理等展开研究。使用K2结构学习算法选出具有类别可分性的波段,进一步利用互信息测试对遥感波段之间的相关性做分析,去除冗... 将Naive Bayesian Classifier(简单贝叶斯网络分类器)用于遥感影像的分类,并对其主要问题如特征选择和后验概率推理等展开研究。使用K2结构学习算法选出具有类别可分性的波段,进一步利用互信息测试对遥感波段之间的相关性做分析,去除冗余信息。特征(波段)的条件独立性假设简化了联合概率的计算,以较小的计算代价获得后验概率。在此基础上,将Naive Bayesian Classifier用于多光谱和高光谱影像的分类,获得很好的性能和相当高的稳健性。 展开更多
关键词 贝叶斯网络 简单贝叶斯网络分类器 互信息 条件独立性假设 遥感影像 分类
在线阅读 下载PDF
基于Naive Bayesian算法的客户端邮件过滤器的实现 被引量:2
2
作者 左瑞欣 徐惠民 吴聪聪 《计算机工程与设计》 CSCD 北大核心 2006年第7期1161-1163,共3页
“垃圾”邮件是Internet上面临急待解决的问题。Naive Bayesian过滤器由于其简单高效性在文本分类中应用较广,重点研究了Naive Bayesian算法,给出了一个“垃圾”邮件过滤器,依据邮件的内容而不是通过设置规则来过滤邮件,并通过实验论证... “垃圾”邮件是Internet上面临急待解决的问题。Naive Bayesian过滤器由于其简单高效性在文本分类中应用较广,重点研究了Naive Bayesian算法,给出了一个“垃圾”邮件过滤器,依据邮件的内容而不是通过设置规则来过滤邮件,并通过实验论证了它在客户端过滤邮件的可行性和有效性。 展开更多
关键词 “垃圾”邮件 特征抽取 向量空间模型 文本分类 naive bayesian过滤器
在线阅读 下载PDF
基于Naive Bayes的中文人名识别研究 被引量:2
3
作者 曾辉 王俊 熊李艳 《科学技术与工程》 北大核心 2015年第6期83-86,98,共5页
在传统的只统计人名用字的Naive Bayes分类算法的基础上,将人名上下文边界融入其中,并利用从大规模语料库中统计的人名用字、边界模板频率对人名定界,再通过扩散操作召回遗漏人名。该方法简单易行,并能取得很好的效果。实验结果表明,其... 在传统的只统计人名用字的Naive Bayes分类算法的基础上,将人名上下文边界融入其中,并利用从大规模语料库中统计的人名用字、边界模板频率对人名定界,再通过扩散操作召回遗漏人名。该方法简单易行,并能取得很好的效果。实验结果表明,其F值达到了93.28%。 展开更多
关键词 naive BAYES 分类算法 边界模板 人名识别
在线阅读 下载PDF
Spark框架下利用分布式NBC的大数据文本分类方法 被引量:6
4
作者 臧艳辉 赵雪章 席运江 《计算机应用研究》 CSCD 北大核心 2019年第12期3705-3708,3712,共5页
针对现有面向大数据的计算框架在可扩展性机器学习研究中面临的挑战,提出了基于MapReduce和Apache Spark框架的分布式朴素贝叶斯文本分类方法。通过研究MapReduce和Apache Spark框架的适应性来探索朴素贝叶斯分类器(NBC),并研究了现有... 针对现有面向大数据的计算框架在可扩展性机器学习研究中面临的挑战,提出了基于MapReduce和Apache Spark框架的分布式朴素贝叶斯文本分类方法。通过研究MapReduce和Apache Spark框架的适应性来探索朴素贝叶斯分类器(NBC),并研究了现有面向大数据的计算框架。首先,基于朴素贝叶斯文本分类模型将训练样本数据集分为m类;进一步在训练阶段中,将前一个MapReduce的输出作为后一个MapReduce的输入,采用四个MapReduce作业得出模型。该设计过程充分利用了MapReduce的并行优势,最后在分类器测试时取出最大值所属的类标签值。在Newgroups数据集进行实验,在所有五类新闻数据组上的分类都取得了99%以上的结果,并且均高于对比算法,证明了提出方法的准确性。 展开更多
关键词 文本分类 MAPREDUCE Spark框架 分布式 朴素贝叶斯分类器 机器学习
在线阅读 下载PDF
融合NBC与PNN的网络异常分类
5
作者 周明伟 刘渊 《计算机工程与应用》 CSCD 2013年第17期89-93,共5页
对网络异常进行分类有利于管理员更好地管理网络,然而单一的分类器存在对各类异常的分类效果不均衡,不够全面等问题。鉴于此在研究了常用于分类的概率神经网络(Probability Neural Network,PNN)算法和朴素贝叶斯分类器(Naive Bayes Clas... 对网络异常进行分类有利于管理员更好地管理网络,然而单一的分类器存在对各类异常的分类效果不均衡,不够全面等问题。鉴于此在研究了常用于分类的概率神经网络(Probability Neural Network,PNN)算法和朴素贝叶斯分类器(Naive Bayes Classifier,NBC)算法的基础上提出了一种融合NBC与PNN的网络异常分类模型。该模型将PNN与NBC对各类网络异常的分类精度作为权值,通过计算得出未知流量所属各类别的概率,最大值为预测结果,通过KDD99数据集对该模型进行测试,实验结果表明,提出的新模型相对于仅使用PNN或者NBC的单分类器,其对各类异常的分类效果具有更好的均衡性和更高的分类精度。 展开更多
关键词 网络异常 概率神经网络 朴素贝叶斯分类器 融合 异常分类
在线阅读 下载PDF
红外光谱结合统计学方法对纸质包装盒的检验研究 被引量:7
6
作者 汪子拓 姜红 +2 位作者 谢皓东 杨棋驭 徐沐暄 《包装工程》 CAS 北大核心 2024年第9期178-184,共7页
目的建立一种高效准确的红外光谱检验纸质包装盒的研究方法。方法利用傅里叶变换红外光谱仪测得了56个不同类型不同来源的纸质包装盒的红外光谱数据;根据纸盒主要填料的不同,将样品初步分为三大类;利用主成分分析对初步分类后的数据降维... 目的建立一种高效准确的红外光谱检验纸质包装盒的研究方法。方法利用傅里叶变换红外光谱仪测得了56个不同类型不同来源的纸质包装盒的红外光谱数据;根据纸盒主要填料的不同,将样品初步分为三大类;利用主成分分析对初步分类后的数据降维,提取出4个主成分,再利用系统聚类将样品最终分为6组,使用K-means聚类算法结合Pearson卡方检验进行验证,与最终分类的结果基本吻合。基于该分组,训练朴素贝叶斯分类、随机森林模型、XGBoost分类3种判别模型,实现对新样品组别的分类预测。结果56个快递包装纸盒样品被分为3类,而后进一步细分为6组,3种判别预测模型均有较高的准确率,其中随机森林模型的准确率最高。结论该方法快速方便地实现了对样品的区分,并且可以实现无损检验,为犯罪现场纸质包装盒的鉴别提供依据,从而为公安侦查工作的开展提供帮助。 展开更多
关键词 纸质包装盒 傅里叶变换红外光谱法 Pearson卡方检验 朴素贝叶斯分类 随机森林模型 XGBoost分类
在线阅读 下载PDF
基于统计学习算法的学生就业服务平台数据分类方法 被引量:4
7
作者 蒋大锐 徐胜超 《现代电子技术》 北大核心 2024年第2期49-54,共6页
学生就业是高等教育质量管理工作的核心,学生就业服务平台是解决学生就业困难的新方法。为了更好地为学生提供就业服务,提出一种基于统计学习算法的学生就业服务平台数据分类方法。采用信息熵和信息增益指标选择学生就业服务平台数据样... 学生就业是高等教育质量管理工作的核心,学生就业服务平台是解决学生就业困难的新方法。为了更好地为学生提供就业服务,提出一种基于统计学习算法的学生就业服务平台数据分类方法。采用信息熵和信息增益指标选择学生就业服务平台数据样本特征属性,利用主成分分析法融合学生就业服务平台样本数据特征信息。在此基础上,基于统计学习算法中的朴素贝叶斯算法,将融合后的学生就业服务平台样本数据特征信息输入到朴素贝叶斯分类器模型中,结合先验概率和后验概率,实现学生就业服务平台数据分类。实验结果表明,所提方法的ROC曲线面积达到整体有效面积的98%以上,分类准确率高达95.8%,分类时间仅为5.38 ms,具有较好的学生就业服务平台数据分类效果,可以提高分类精度,有效缩短分类时间。 展开更多
关键词 统计学习算法 学生就业 服务平台 数据分类 朴素贝叶斯算法 信息熵
在线阅读 下载PDF
量子模糊朴素贝叶斯分类算法 被引量:1
8
作者 侯敏 张仕斌 黄曦 《电子科技大学学报》 EI CAS CSCD 北大核心 2024年第1期149-154,共6页
以传统朴素贝叶斯算法为基础,研究并提出一种高效、准确的量子模糊贝叶斯分类算法。首先将“模糊集合理论+朴素贝叶斯理论”交叉融合,定义模糊先验概率、模糊条件概率,将朴素贝叶斯推广至模糊朴素贝叶斯,构建模糊贝叶斯模型;其次,将“... 以传统朴素贝叶斯算法为基础,研究并提出一种高效、准确的量子模糊贝叶斯分类算法。首先将“模糊集合理论+朴素贝叶斯理论”交叉融合,定义模糊先验概率、模糊条件概率,将朴素贝叶斯推广至模糊朴素贝叶斯,构建模糊贝叶斯模型;其次,将“模糊贝叶斯模型+量子计算”交叉融合,将模糊数据集量子化(编码到量子态上)并设计量子线路,提出一种量子模糊朴素贝叶斯分类算法;最后,将该算法应用到鸢尾花数据集。仿真实验表明,与传统朴素贝叶斯分类算法相比,该算法具有较高的分类效率和准确率。 展开更多
关键词 模糊集合理论 朴素贝叶斯分类 量子计算 量子机器学习
在线阅读 下载PDF
基于朴素贝叶斯分类器的棉花盲椿象危害等级识别 被引量:24
9
作者 翟治芬 徐哲 +2 位作者 周新群 王丽丽 张建华 《农业工程学报》 EI CAS CSCD 北大核心 2015年第1期204-211,共8页
针对自然条件下棉花盲椿象危害区域提取和危害等级识别难的问题,提出了棉花盲椿象危害等级自动识别方法。该方法以自然条件下采集的不同盲椿象危害等级棉叶图像为对象,利用最大类间方差阈值分割和多颜色分量组合方法进行作物与土壤分离... 针对自然条件下棉花盲椿象危害区域提取和危害等级识别难的问题,提出了棉花盲椿象危害等级自动识别方法。该方法以自然条件下采集的不同盲椿象危害等级棉叶图像为对象,利用最大类间方差阈值分割和多颜色分量组合方法进行作物与土壤分离和病斑分割,并利用分水岭分割方法对粘连棉叶进行分离并提取盲椿象危害棉叶区域,提取图像的颜色、纹理和形状特征,结合朴素贝叶斯分类器,依据划分的棉花盲椿象危害等级标准,对盲椿象危害等级进行识别。不同盲椿象危害等级识别试验结果表明:该模型平均识别正确率达90.0%,通过比较试验表明,该模型在识别精度比BP神经网络高2.5%,运行速度比支持向量机高11.7%,可较好的对棉花盲椿象危害等级进行识别,可为棉花盲椿象的防治提供技术支持。 展开更多
关键词 棉花 分类 模型 盲椿象 危害等级识别 朴素贝叶斯分类器
在线阅读 下载PDF
一种基于朴素贝叶斯的微博情感分类 被引量:44
10
作者 林江豪 阳爱民 +2 位作者 周咏梅 陈锦 蔡泽键 《计算机工程与科学》 CSCD 北大核心 2012年第9期160-165,共6页
本文基于二次情感特征提取算法,利用句法依存关系进行一次文本情感特征提取,在此基础上,利用情感词典,进行二次情感特征提取。构建朴素贝叶斯分类器,对采集的热门话题微博和酒店评论进行文本情感倾向性分类。主要比较了表情符号、标点符... 本文基于二次情感特征提取算法,利用句法依存关系进行一次文本情感特征提取,在此基础上,利用情感词典,进行二次情感特征提取。构建朴素贝叶斯分类器,对采集的热门话题微博和酒店评论进行文本情感倾向性分类。主要比较了表情符号、标点符号,基于情感词典的特征提取和基于二次情感特征提取方法,在不同的组合下的分类性能,寻找更佳的微博文本情感分类预处理方法。并与酒店评论情感分类结果对比、分析,发现影响微博情感分类性能的原因。实验结果表明,二次特征提取方法在分类上取得更高的F1。实验最佳的分类预处理方式是"表情符号+标点符号+二次情感特征提取+BOOL值"。同时发现,朴素贝叶斯在酒店评论情感分类取得更高的分类性能,主要是微博评价对象多样化造成的。 展开更多
关键词 微博 文本情感分类 二次情感特征提取 朴素贝叶斯
在线阅读 下载PDF
基于知识语义权重特征的朴素贝叶斯情感分类算法 被引量:11
11
作者 冀俊忠 张玲玲 +1 位作者 吴晨生 吴金源 《北京工业大学学报》 CAS CSCD 北大核心 2014年第12期1884-1890,共7页
针对文档级情感分类的准确率低于普通文本分类的问题,提出一种基于知识语义权重特征的朴素贝叶斯情感分类算法.首先,通过特征选择的方法,对情感词典中的词进行重要度评分并赋予不同权重.然后,基于词典极性的分布信息与文档情感分类的相... 针对文档级情感分类的准确率低于普通文本分类的问题,提出一种基于知识语义权重特征的朴素贝叶斯情感分类算法.首先,通过特征选择的方法,对情感词典中的词进行重要度评分并赋予不同权重.然后,基于词典极性的分布信息与文档情感分类的相关性,将情感词的语义权重特征融合到朴素贝叶斯分类中,实现了新算法.在标准中文数据集上的实验结果表明,提出的算法在准确率、召回率和F1测度值上都优于已有的一些算法. 展开更多
关键词 语义权重特征 朴素贝叶斯 文本情感分类 信息增益
在线阅读 下载PDF
基于内容的垃圾短信过滤 被引量:17
12
作者 李辉 张琦 卢湖川 《计算机工程》 CAS CSCD 北大核心 2008年第12期154-156,共3页
研究一种基于最小风险贝叶斯决策的垃圾短信过滤方法。对于以文本信息为主的短信,采用信息增益的方法进行特征选择,使用基于最小风险贝叶斯决策方法进行分类。通过自建短信语料库对该方法进行了实验。实验结果表明,该方法能够准确地对... 研究一种基于最小风险贝叶斯决策的垃圾短信过滤方法。对于以文本信息为主的短信,采用信息增益的方法进行特征选择,使用基于最小风险贝叶斯决策方法进行分类。通过自建短信语料库对该方法进行了实验。实验结果表明,该方法能够准确地对短信进行分类,降低合法短信的分类错误率,分类正确率达到99.3%,符合了短信分类要求。 展开更多
关键词 垃圾短信 短信过滤 文本分类 朴素贝叶斯
在线阅读 下载PDF
基于频繁项集挖掘的贝叶斯分类算法 被引量:12
13
作者 眭俊明 姜远 周志华 《计算机研究与发展》 EI CSCD 北大核心 2007年第8期1293-1300,共8页
朴素贝叶斯分类器是一种简单而且高效的分类学习算法,但是它所要求的属性独立性假设在真实世界应用中经常难以满足.为了放松属性独立性约束以提高朴素贝叶斯分类器的泛化能力,研究人员进行了大量的工作.提出了一种基于频繁项集挖掘技术... 朴素贝叶斯分类器是一种简单而且高效的分类学习算法,但是它所要求的属性独立性假设在真实世界应用中经常难以满足.为了放松属性独立性约束以提高朴素贝叶斯分类器的泛化能力,研究人员进行了大量的工作.提出了一种基于频繁项集挖掘技术的贝叶斯分类学习算法FISC(frequent item sets classifier).在训练阶段,FISC找到所有频繁项集并计算可能用到的概率估值.在测试阶段,FISC对于测试样本包含的每个项集构造一个分类器,通过集成这些分类器来给出预测结果.实验结果验证了FISC的有效性. 展开更多
关键词 机器学习 贝叶斯分类 半朴素贝叶斯分类 频繁项集挖掘 集成学习
在线阅读 下载PDF
一种基于情感词典和朴素贝叶斯的中文文本情感分类方法 被引量:44
14
作者 杨鼎 阳爱民 《计算机应用研究》 CSCD 北大核心 2010年第10期3737-3739,3743,共4页
基于朴素贝叶斯理论提出了一种新的中文文本情感分类方法。这种方法利用情感词典对文本进行处理和表示,基于朴素贝叶斯理论构建文本情感分类器,并以互联网上宾馆中文评论作为分类研究的对象。实验表明,使用提出的方法构成的分类器具有... 基于朴素贝叶斯理论提出了一种新的中文文本情感分类方法。这种方法利用情感词典对文本进行处理和表示,基于朴素贝叶斯理论构建文本情感分类器,并以互联网上宾馆中文评论作为分类研究的对象。实验表明,使用提出的方法构成的分类器具有分类速度快、分类准确度高、鲁棒性强等特点,并且适合于大量中文文本情感分类应用系统。 展开更多
关键词 文本情感分类 朴素贝叶斯 情感词典
在线阅读 下载PDF
改进的精英遗传算法及其在特征选择中的应用 被引量:7
15
作者 王利琴 董永峰 顾军华 《计算机工程与设计》 CSCD 北大核心 2014年第5期1792-1796,共5页
结合精英遗传算法"优胜"和稳态遗传算法"劣汰"的优点,提出一种先全局大范围搜索后局部重点搜索的分级遗传算法并用于心电信号的特征选择。针对传统遗传算法易陷入局部极小的问题,提出新的存优去劣扩空间选择算子,... 结合精英遗传算法"优胜"和稳态遗传算法"劣汰"的优点,提出一种先全局大范围搜索后局部重点搜索的分级遗传算法并用于心电信号的特征选择。针对传统遗传算法易陷入局部极小的问题,提出新的存优去劣扩空间选择算子,使种群中的优良个体保持到下一代,且能淘汰劣质个体,加入新的个体,保证算法可以在全空间搜索;引入拼接算子和切断算子在局部空间搜索,解决了遗传算法收敛速度慢的问题。以朴素贝叶斯分类器分类性能作为特征子集评价标准,在MIT-BIH数据库上的实验结果表明,算法得到的特征子集具有良好的分类性能。 展开更多
关键词 精英策略 遗传算法 特征选择 心电信号 朴素贝叶斯分类器
在线阅读 下载PDF
一种采用LLE降维和贝叶斯分类的多类标学习算法 被引量:4
16
作者 李宏 谢政 +1 位作者 向遥 吴敏 《系统工程与电子技术》 EI CSCD 北大核心 2009年第6期1467-1472,共6页
多类标数据中的样本可能属于一个或多个类标,因此其分类问题较单类标分类更为复杂。提出一种新的多类标学习算法,首先针对多类标数据的特征属性维数高的特点,采用LLE算法对多类标数据的特征属性进行降维,提取能较完整描述数据的一组低... 多类标数据中的样本可能属于一个或多个类标,因此其分类问题较单类标分类更为复杂。提出一种新的多类标学习算法,首先针对多类标数据的特征属性维数高的特点,采用LLE算法对多类标数据的特征属性进行降维,提取能较完整描述数据的一组低维特征属性集;然后将多类标样本集按所属的类标进行划分,并采用贝叶斯分类模型来学习各组样本集的分类特性;根据各个分类模型的判定类标,综合得到多类标样本的最终类标集。将该算法分别应用到自然场景图像和基因数据的多类标分类学习中,实验结果表明,该算法针对不同的多类标数据集均能取得很好的分类效果,且相比于其他多类标算法有更高的性能。 展开更多
关键词 多类标学习 朴素贝叶斯分类 自然场景图像分类 基因数据集分类
在线阅读 下载PDF
基于高斯密度的一阶贝叶斯衍生分类器 被引量:2
17
作者 杜瑞杰 王双成 高瑞 《计算机应用研究》 CSCD 北大核心 2015年第11期3242-3246,共5页
针对连续属性朴素贝叶斯分类器不能有效利用属性之间的条件依赖信息,而目前所进行的依赖扩展更关注效率,这使得扩展后分类器的分类准确性还有待提高等问题,使用高斯密度估计属性密度,将属性排序、分类准确性标准与属性父节点的贪婪选择... 针对连续属性朴素贝叶斯分类器不能有效利用属性之间的条件依赖信息,而目前所进行的依赖扩展更关注效率,这使得扩展后分类器的分类准确性还有待提高等问题,使用高斯密度估计属性密度,将属性排序、分类准确性标准与属性父节点的贪婪选择结合,综合考虑效率和分类准确性,对朴素贝叶斯分类器进行依赖扩展,建立一阶贝叶斯衍生分类器,并对属性分类提供的信息进行分析。实验结果显示,基于高斯密度的一阶贝叶斯衍生分类器具有良好的分类准确性。 展开更多
关键词 朴素贝叶斯分类器 高斯函数 贝叶斯网络 依赖扩展 分类准确性
在线阅读 下载PDF
朴素贝叶斯分类器的独立性假设研究 被引量:10
18
作者 范金金 刘鹏 《计算机工程与应用》 CSCD 北大核心 2008年第34期139-141,共3页
朴素贝叶斯分类器(NBC)是一种简洁而有效的分类模型。介绍了NBC模型的基本原理,并着重分析了该模型的独立性假设条件。在总结现有独立性假设研究的基础上,通过例子和实验分析得出结论:NBC模型的表现和独立性假设是否满足没有必然联系。
关键词 数据挖掘 朴素贝叶斯分类器 独立性假设
在线阅读 下载PDF
基于改进属性加权的朴素贝叶斯分类模型 被引量:12
19
作者 李方 刘琼荪 《计算机工程与应用》 CSCD 北大核心 2010年第4期132-133,141,共3页
构造了一种新的属性间相关性度量方法,提出了改进属性加权的朴素贝叶斯分类模型。经实验证明,提出的朴素贝叶斯分类模型明显优于张舜仲等人提出的分类模型。
关键词 属性加权 朴素贝叶斯 分类模型 相关性度量
在线阅读 下载PDF
一种新的微博短文本特征词选择算法 被引量:17
20
作者 黄贤英 陈红阳 +1 位作者 刘英涛 熊李媛 《计算机工程与科学》 CSCD 北大核心 2015年第9期1761-1767,共7页
针对微博短文本有效特征较稀疏且难以提取,从而影响微博文本表示、分类与聚类准确性的问题,提出一种基于统计与语义信息相结合的微博短文本特征词选择算法。该算法基于词性组合匹配规则,根据词项的TF-IDF、词性与词长因子构造综合评估函... 针对微博短文本有效特征较稀疏且难以提取,从而影响微博文本表示、分类与聚类准确性的问题,提出一种基于统计与语义信息相结合的微博短文本特征词选择算法。该算法基于词性组合匹配规则,根据词项的TF-IDF、词性与词长因子构造综合评估函数,结合词项与文本内容的语义相关度,对微博短文本进行特征词选择,以使挑选出来的特征词能准确表示微博短文本内容主题。将新的特征词选择算法与朴素贝叶斯分类算法相结合,对微博分类语料集进行实验,结果表明,相比其它的传统算法,新算法使得微博短文本分类准确率更高,表明该算法选取出来的特征词能够更准确地表示微博短文本内容主题。 展开更多
关键词 微博短文本 特征词选择 统计与语义信息 词性组合 朴素贝叶斯分类算法
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部