期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于知识语义权重特征的朴素贝叶斯情感分类算法 被引量:11
1
作者 冀俊忠 张玲玲 +1 位作者 吴晨生 吴金源 《北京工业大学学报》 CAS CSCD 北大核心 2014年第12期1884-1890,共7页
针对文档级情感分类的准确率低于普通文本分类的问题,提出一种基于知识语义权重特征的朴素贝叶斯情感分类算法.首先,通过特征选择的方法,对情感词典中的词进行重要度评分并赋予不同权重.然后,基于词典极性的分布信息与文档情感分类的相... 针对文档级情感分类的准确率低于普通文本分类的问题,提出一种基于知识语义权重特征的朴素贝叶斯情感分类算法.首先,通过特征选择的方法,对情感词典中的词进行重要度评分并赋予不同权重.然后,基于词典极性的分布信息与文档情感分类的相关性,将情感词的语义权重特征融合到朴素贝叶斯分类中,实现了新算法.在标准中文数据集上的实验结果表明,提出的算法在准确率、召回率和F1测度值上都优于已有的一些算法. 展开更多
关键词 语义特征 朴素贝叶斯 文本情感分类 信息增益
在线阅读 下载PDF
基于泊松分布的加权朴素贝叶斯文本分类算法 被引量:13
2
作者 赵博文 王灵矫 郭华 《计算机工程》 CAS CSCD 北大核心 2020年第4期91-96,共6页
朴素贝叶斯(NB)算法应用于文本分类时具有简单性和高效性,但算法中属性独立性与重要性一致的假设,使其在精确度方面存在瓶颈.针对该问题,提出一种基于泊松分布的特征加权NB文本分类算法.结合泊松分布模型和NB算法,将泊松随机变量引入特... 朴素贝叶斯(NB)算法应用于文本分类时具有简单性和高效性,但算法中属性独立性与重要性一致的假设,使其在精确度方面存在瓶颈.针对该问题,提出一种基于泊松分布的特征加权NB文本分类算法.结合泊松分布模型和NB算法,将泊松随机变量引入特征词权重,在此基础上定义信息增益率对文本特征词加权,削弱传统算法属性独立性假设造成的影响.在20-newsgroups数据集上的实验结果表明,与传统NB算法及其改进算法RwC-MNB和CFSNB相比,该算法可使文本分类的准确率、召回率和F1值得到提升,并且执行效率高于K-最近邻算法和支持向量机算法. 展开更多
关键词 文本分类 朴素贝叶斯算法 泊松分布 信息增益率 特征词
在线阅读 下载PDF
基于改进朴素贝叶斯算法的文本分类研究 被引量:14
3
作者 辛梓铭 王芳 《燕山大学学报》 CAS 北大核心 2023年第1期82-88,共7页
朴素贝叶斯算法在给定输出类别的情况下,需假设属性之间相互独立,然而现实中这个假设一般不成立,导致在属性个数较多或者属性之间相关性较大时,分类效果不是很理想。为了解决这个问题,本文采用优化的模糊C均值聚类及权重计算方法改进朴... 朴素贝叶斯算法在给定输出类别的情况下,需假设属性之间相互独立,然而现实中这个假设一般不成立,导致在属性个数较多或者属性之间相关性较大时,分类效果不是很理想。为了解决这个问题,本文采用优化的模糊C均值聚类及权重计算方法改进朴素贝叶斯算法。首先,基于JS散度构造类别个数的自适应函数优化模糊聚类算法,利用优化后的算法将文本分类整理。然后,采用词频因子优化的TF-IDF算法计算分类后各样本的特征权重,结合样本权重与贝叶斯公式,进行分类计算。最后,为了体现改进的朴素贝叶斯算法的有效性和优越性,将其与原始朴素贝叶斯算法以及其他改进算法进行对比实验。实验结果表明,改进后的算法有效地降低了朴素贝叶斯模型对特征项独立性的要求,提高了分类决策的准确率,且在分类性能和效率上具有一定的优越性。 展开更多
关键词 朴素贝叶斯 文本分类 模糊聚类 特征 独立性假设
在线阅读 下载PDF
基于属性加权朴素贝叶斯的冠心病辨证模型 被引量:5
4
作者 刘智 桑国明 鲁明羽 《广西师范大学学报(自然科学版)》 CAS 北大核心 2008年第4期67-70,共4页
在原有中医药冠心病临床治疗数据采集系统的基础上,使用中医证型的辨证相关因素,提出属性加权朴素贝叶斯算法,并应用到冠心病中医证型的分类模型之中。实验结果显示,对于冠心病4种证型的分类,运用属性加权朴素贝叶斯分类算法都略高于朴... 在原有中医药冠心病临床治疗数据采集系统的基础上,使用中医证型的辨证相关因素,提出属性加权朴素贝叶斯算法,并应用到冠心病中医证型的分类模型之中。实验结果显示,对于冠心病4种证型的分类,运用属性加权朴素贝叶斯分类算法都略高于朴素贝叶斯分类算法。实验结果表明属性加权朴素贝叶斯分类算法在中医冠心病临床诊断中具有良好的分类性能。 展开更多
关键词 属性加朴素贝叶斯 冠心病 属性 分类模型
在线阅读 下载PDF
基于贝叶斯模型的专利分类 被引量:13
5
作者 郭炜强 文军 文贵华 《计算机工程与设计》 CSCD 北大核心 2005年第8期1986-1987,1996,共3页
朴素贝叶斯分类器理论基础好,分类精度高。利用特征词权重函数修改朴素贝叶斯分类器,进而利用它实现专利文本的自动分类,不仅减少了专利人工分类的工作量和分类错误,而且为技术跟踪、竞争分析等提供了有效支持。实验与应用表明改进的朴... 朴素贝叶斯分类器理论基础好,分类精度高。利用特征词权重函数修改朴素贝叶斯分类器,进而利用它实现专利文本的自动分类,不仅减少了专利人工分类的工作量和分类错误,而且为技术跟踪、竞争分析等提供了有效支持。实验与应用表明改进的朴素贝叶斯分类器用来解决专利分类是有效的。 展开更多
关键词 专利 朴素贝叶斯分类 专利分类 特征词 文本挖掘
在线阅读 下载PDF
安全攻击追踪分析中短文本分类研究 被引量:1
6
作者 黄克敏 方勇 《信息安全研究》 2015年第3期272-277,共6页
近年来,伴随着大数据时代信息技术的飞速发展,信息安全研究领域也得到快速发展,越来越多的网络信息安全攻击事件不断发生和被报道.为进一步保障网络信息安全,建立基于大数据平台下的网络信息安全攻击追踪分析系统显得尤为重要.大数据下... 近年来,伴随着大数据时代信息技术的飞速发展,信息安全研究领域也得到快速发展,越来越多的网络信息安全攻击事件不断发生和被报道.为进一步保障网络信息安全,建立基于大数据平台下的网络信息安全攻击追踪分析系统显得尤为重要.大数据下的网络信息安全攻击追踪分析系统是基于网络攻击事件的发生总会在信息安全相关的论坛、问答社区、贴吧或微博等交流讨论网络攻击技术的平台上留下大量的网络攻击痕迹这一事实,借助大数据分析平台对多源海量数据快速分析处理的优势,对在社交网络平台上留下的讨论信息安全短文本数据进行多维度、多角度的关联分析和深度挖掘,对可能发生的网络信息安全攻击事件进行预测和已经发生的网络信息安全攻击事件进行追踪及分析.其中基于大数据平台下的网络信息安全攻击追踪分析系统中涉及到很重要的一项技术:文本的分类技术.主要研究系统中的文本分类技术,选择朴素贝叶斯作为文本分类算法,由于朴素贝叶斯分类算法的特征项间独立性假设在现实中一般很难满足,为了在一定程度上放宽这一假设,提出了一种基于特征项改进权重朴素贝叶斯的分类方法,此分类方法基于改进卡方统计特征项选择方法和加权朴素贝叶斯分类算法相结合,充分考虑特征项对分类作用的大小和各特征项之间的依赖关系,并用语料库样本进行相应的实验.实验结果表明,基于特征项改进权重朴素贝叶斯分类方法比改进前的分类效果有一定的提高. 展开更多
关键词 大数据 网络信息安全 网络攻击 文本分类 朴素贝叶斯分类 改进权重朴素贝叶斯分类方法
在线阅读 下载PDF
基于特征多视图提升Naive Bayesian的Boosting改进算法 被引量:1
7
作者 林正奎 唐焕玲 +1 位作者 鲁明羽 王敬东 《北京交通大学学报》 CAS CSCD 北大核心 2009年第6期70-75,共6页
AdaBoost作为一种有效的集成学习方法,能够明显提高不稳定学习算法的分类正确率,但对稳定的Naive Bayesian分类算法的提升效果却不明显.为此,利用多种特征评估函数建立不同的特征视图,生成多个有差异的加权朴素贝叶斯(WNB)基分类器;尝... AdaBoost作为一种有效的集成学习方法,能够明显提高不稳定学习算法的分类正确率,但对稳定的Naive Bayesian分类算法的提升效果却不明显.为此,利用多种特征评估函数建立不同的特征视图,生成多个有差异的加权朴素贝叶斯(WNB)基分类器;尝试使用几种不同的方式将样本权重嵌入WNB基分类器的参数中,对WNB产生扰动,进一步增加基分类器的不稳定性.实验结果表明,对比AdaBoost所提算法,Boost MV-WNB能够明显提升WNB文本分类器的性能. 展开更多
关键词 ADABOOST 朴素贝叶斯 文本分类 特征多视图 样本
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部