-
题名改进的朴素贝叶斯垃圾邮件过滤算法
被引量:11
- 1
-
-
作者
翟军昌
秦玉平
王春立
-
机构
渤海大学公共计算机教研部
渤海大学信息科学与工程学院
大连海事大学计算机科学与技术学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2009年第14期145-148,共4页
-
基金
国家自然科学基金No.60603023
辽宁省教育厅资助科研课题No.2006A025~~
-
文摘
介绍了朴素贝叶斯垃圾邮件过滤算法,对于朴素贝叶斯算法中条件概率的计算,选用了多变量贝努里事件模型的计算方法,在多变量贝努里事件模型的基础上进行了改进,并在Ling-Spam语料库上进行实验,实验结果表明改进后的算法有效地提高了过滤器的召回率和精确率,并且降低了过滤器的错误率。
-
关键词
垃圾邮件
朴素贝叶斯
信息增益
多变量贝努里事件模型
-
Keywords
spam email
Nave Bayes
information gain
multi-variable model of Bernoulli events
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名面向不均衡类别朴素贝叶斯犯罪案件文本分类
被引量:6
- 2
-
-
作者
程春惠
何钦铭
-
机构
浙江大学计算机科学与技术学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2009年第35期126-128,131,共4页
-
基金
浙江省重大科技攻关项目
No.2006C13109~~
-
文摘
针对案件文本的特点,提出了具有针对性的特殊文本预处理方法,并比较了两种有效的特征选择方法。针对案件类别分布不均衡的特点,提出了改进的多变量贝努里模型。实验结果表明,改进的多变量贝努里模型有效地提高了案件文本分类的准确率。
-
关键词
文本分类
朴素贝叶斯
犯罪挖掘
多变量贝努里模型
多项式模型
-
Keywords
text classification
Naive Bayes
criminal mining
multi-variate Bernoulli model
multinomial mode
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-