-
题名量子遗传算法优化加权朴素贝叶斯复合语言文本分类
被引量:5
- 1
-
-
作者
隆峻
神显豪
丁小军
郭先春
-
机构
玉林师范学院计算机科学与工程学院
桂林理工大学广西嵌入式技术与智能系统重点实验室
东华理工大学测绘工程学院
-
出处
《济南大学学报(自然科学版)》
CAS
北大核心
2022年第2期136-141,共6页
-
基金
国家自然科学基金项目(61662028)
江西省科技厅科技计划项目(GJJ170447)。
-
文摘
为了提高朴素贝叶斯算法的复合语言文本分类准确度和效率,将加权朴素贝叶斯算法用于复合语言文本分类,采用量子遗传算法对权重参数进行优化;根据贝叶斯定理建立语言文本分类模型,考查样本属性之间的差异对分类结果的影响;然后引入属性权重,形成加权朴素贝叶斯文本分类模型;利用遗传算法对权重参数进行优化,借助量子比特运算提高遗传优化效率,最终得到稳定的复合语言文本分类模型。结果表明,通过合理设置权重个数,量子遗传算法改善了加权朴素贝叶斯算法的文本分类性能,与常用语言文本分类算法对比,该算法具有较高的分类精度和分类效率,在复合语言文本分类中的适用性好。
-
关键词
量子遗传算法
加权朴素贝叶斯算法
复合语言文本
分类
量子比特
-
Keywords
quantum genetic algorithm
weighted naive Bayes algorithm
compound language text
classification
qubit
-
分类号
TP391.12
[自动化与计算机技术—计算机应用技术]
-
-
题名基于IMI-WNB算法的垃圾邮件过滤技术研究
被引量:3
- 2
-
-
作者
刘洁
王铮
王辉
-
机构
河南理工大学计算机科学与技术学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2020年第12期299-304,312,共7页
-
基金
国家自然科学基金(61300216)。
-
文摘
互信息和朴素贝叶斯算法应用于垃圾邮件过滤时,存在特征冗余和独立性假设不成立的问题。为此,提出一种改进互信息的加权朴素贝叶斯算法。针对互信息效率较低的问题,通过引入词频因子与类间差异因子,提出一种改进的互信息特征选择算法,从而实现更高效的特征降维。针对朴素贝叶斯分类算法的独立性假设问题,在朴素贝叶斯分类时使用改进互信息值进行特征加权,消除部分朴素贝叶斯条件独立性假设对邮件分类的不利影响。实验结果表明,相比传统朴素贝叶斯算法,该算法提高了垃圾邮件过滤的精确度、召回率与稳定性。
-
关键词
互信息
垃圾邮件过滤
加权朴素贝叶斯算法
特征选择
词频
-
Keywords
Mutual Information(MI)
spam filtering
Weighted Naive Bayes(WNB)algorithm
feature selection
word frequency
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-