题名 一种基于机器学习的垃圾邮件智能过滤方法
被引量:6
1
作者
周威成
马素霞
齐林海
机构
华北电力大学(北京)计算机科学与技术系
出处
《现代电力》
2003年第1期65-67,共3页
文摘
为了更好的进行垃圾邮件过滤 ,介绍了NaiveBayes (N B )算法 ,并结合N B 算法和垃圾邮件过滤对N B 算法作了一些改进。之后 ,详细介绍了N B 算法在垃圾邮件智能过滤中的应用和实现 ,同时给出了应用的评估算法和评估结果。实验结果显示 ,把N B
关键词
垃圾邮件智能过滤方法
机器学习
电子邮件
人工智能
计算机模拟
计算机网络
Keywords
Nave Bayes(N B ) algorithm
Machine Learning
junk mail filtering
分类号
TP393.098
[自动化与计算机技术—计算机应用技术]
TP18
[自动化与计算机技术—控制理论与控制工程]
题名 基于贝叶斯公式的垃圾邮件过滤方法
被引量:11
2
作者
詹川
卢显良
周旭
侯孟书
袁连海
机构
电子科技大学计算机科学与工程学院
出处
《计算机科学》
CSCD
北大核心
2005年第2期73-75,共3页
基金
信息产业部电工业生产发展基金
编号:[2002]11006
文摘
伴随着电子邮件的广泛使用,垃圾邮件泛滥成灾,严重影响了人们正常的学习、工作和生活。本文提出了一种改进的基于贝叶斯公式垃圾邮件过滤技术。我们采用了基于词熵的特征项提取方法,并且使用特征项单词出现频率来表示向量,推导出相应的贝叶斯计算公式。实验表明,我们的方法使垃圾邮件过滤的整体性能都有明显提高。
关键词
垃圾邮件 过滤
特征项
电子邮件
表示
整体性能
使用
提取方法
正常
泛滥
实验
Keywords
Bayesian
Anti-spam e-mail filtering
Attribute selection
Vector
分类号
TP393.098
[自动化与计算机技术—计算机应用技术]
TP311.56
[自动化与计算机技术—计算机软件与理论]
题名 垃圾邮件的综合过滤方法
被引量:11
3
作者
徐激
龚俭
机构
东南大学计算机系
出处
《计算机科学》
CSCD
北大核心
2005年第2期69-72,86,共5页
基金
国家自然科学基金(90104031)
文摘
本文研究了几种常用的垃圾邮件过滤算法,分析了它们在中文邮件环境中存在的问题。本文根据各算法的优缺点,将它们进行改进、叠加和相互结合,并通过查看发出的邮件内容进行辅助学习,从而建立一个垃圾邮件的综合过滤方法。文章最后对该综合方法的效率做了分析和比较。
关键词
垃圾邮件 过滤
过滤 方法
查看
算法
中文
综合方法
叠加
辅助
相互结合
分析
Keywords
Spam mail
Ham mail
White and black lists
Rule
Bayesian filtering
分类号
TP393.098
[自动化与计算机技术—计算机应用技术]
题名 基于多Bayes网的垃圾邮件智能过滤研究
被引量:2
4
作者
欧阳
韩逢庆
机构
重庆工学院网络信息中心
出处
《计算机科学》
CSCD
北大核心
2004年第8期61-63,共3页
基金
重庆市教委科技基金资助(030601)
文摘
在分析朴素 Bayes 方法用于垃圾邮件自动过滤中存在的一些问题基础上,提出了一种新的基于多 Bayes 网的垃圾邮件自动过滤方法。该方法利用多个 Bayes 网构成的多个分类器同时对邮件进行分类,当前邮件被认定是垃圾邮件当且仅当全部分类器都判断它为垃圾邮件。这种多个分类器同时工作及分类临界值的使用在一定程度上减少了将有用邮件误判为垃圾邮件的可能性。该方法还引入动态学习机制,在邮件分类过程中能够补充训练样本,满足不同用户的邮件分类标准。
关键词
多Bayes网
垃圾邮件
智能 过滤
分类标准
动态学习机制
电子邮件
Keywords
E-mail
Spam
Multi-Bayesian networks
分类号
TP393.098
[自动化与计算机技术—计算机应用技术]
题名 一种基于学习向量量化网络的垃圾邮件过滤方法
被引量:1
5
作者
詹川
卢显良
周旭
侯孟书
机构
电子科技大学计算机科学与工程学院
出处
《计算机科学》
CSCD
北大核心
2005年第3期66-68,87,共4页
基金
信息产业部电子工业生产发展基金
编号
[2002]11006
文摘
伴随着电子邮件的广泛使用,垃圾邮件泛滥成灾,严重影响了人们正常的学习、工作和生活。本文针对目前的垃圾邮件主要是由多种商业或政治性类别的垃圾邮件组成的特点,利用学习向量量化网络能把多个子类合并成一个复杂大类的特性,构建了一个反垃圾邮件的LVQ神经网络模型,我们对该LVQ网络模型进行了与其他算法的对比试验,试验表明它比基于贝叶斯公式算法和基于神经网络BP算法的过滤器有更好的性能。
关键词
学习向量量化网络
垃圾邮件
过滤 方法
互信息
向量空间模型
Keywords
LVQ
Anti-spam E-mail filtering
Mutual information
Vector space model
分类号
TP393.098
[自动化与计算机技术—计算机应用技术]
题名 双层垃圾邮件过滤模型研究
被引量:1
6
作者
王志波
机构
东华理工大学软件学院
出处
《郑州轻工业学院学报(自然科学版)》
CAS
2010年第3期22-25,共4页
基金
江西省教育厅科技项目(GJJ08308)
文摘
设计了基于白名单技术与贝叶斯垃圾邮件过滤技术相结合的双层垃圾邮件过滤模型:利用实时白名单技术直接接收信任地址发来的邮件,对不在白名单中的地址发来的邮件,通过贝叶斯过滤技术进行邮件的正常性判断.该双层垃圾邮件过滤模型可以有效提高垃圾邮件的过滤精度.
关键词
垃圾邮件
双层过滤
白名单
贝叶斯方法
Keywords
spam
two-tier filtering
white list
Bayes method
分类号
O572.11
[理学—粒子物理与原子核物理]
TM26
[一般工业技术—材料科学与工程]
题名 垃圾邮件过滤系统的评估模型研究
7
作者
项涛
龚俭
丁伟
机构
东南大学计算机科学与工程学院
出处
《计算机工程与设计》
CSCD
北大核心
2007年第18期4487-4490,共4页
文摘
在分析现有垃圾邮件过滤系统评估存在各指标值不一致的情况的基础上,提出一个综合评估垃圾邮件过滤系统过滤效果的评估模型。依据该评估模型,设计和实现了一个评估系统;并使用该评估系统评估了多个开源的垃圾邮件过滤系统。实验结果表明,提出的评估模型能够有效的综合评估垃圾邮件过滤系统的过滤效果。
关键词
评估
垃圾邮件 过滤 系统
评估模型
评估指标
评估方法
Keywords
ev.aluation
anti-spam filtering
evaluation model
evaluation index
evaluation method
分类号
TP393
[自动化与计算机技术—计算机应用技术]
题名 基于用户反馈的反垃圾邮件技术
被引量:9
8
作者
李洋
方滨兴
王申
机构
中国科学院计算技术研究所
出处
《计算机工程》
CAS
CSCD
北大核心
2007年第8期130-132,共3页
基金
国家"973"计划基金资助项目(2004CB318109)
国家"242"信息安全计划基金资助项目(2005C36)
文摘
在分析传统垃圾邮件过滤技术的基础上,提出了一种基于用户反馈的反垃圾邮件技术。该技术通过引入用户反馈机制,使用改进的朴素贝叶斯方法,构建面向特定用户的过滤器,从而进行垃圾邮件过滤。邮件语料库实验和原型系统的测试证明,该方法能够有效地降低误报率,提高反垃圾邮件系统的可用性,具有较好的实用效果。
关键词
垃圾邮件 过滤
机器学习
朴素贝叶斯方法
用户反馈
Keywords
Spam filtering
Machine learning
Naive Bayesian approach
Users feedback
分类号
TP302
[自动化与计算机技术—计算机系统结构]
题名 协同分类器及其在邮件过滤中的应用
被引量:1
9
作者
路梅
叶澄清
机构
徐州师范大学计算机科学与技术学院
浙江大学计算机科学与技术学院
出处
《计算机工程与应用》
CSCD
北大核心
2008年第4期135-137,168,共4页
文摘
提出了一种基于支持向量机的改进分类方法.该方法将特征空间分类超平面附近的样本分类,交由特征空间和样本空间中的K-近邻集体投票表决。方法应用于垃圾邮件的过滤之中,邮件合法性误判发生的概率可被有效降低。最后通过垃圾邮件过滤实例验证了该方法的有效性。
关键词
垃圾邮件
智能 过滤
支持向量机
Keywords
spare
intelligent filtering
Support Vector Machine
分类号
TP393
[自动化与计算机技术—计算机应用技术]
题名 智能决策支持的E-mail过滤模型
10
作者
龚伟
瞿堃
李柳柏
机构
长江师范学院计算机科学系
西南大学计算机与信息科学学院
出处
《计算机工程与设计》
CSCD
北大核心
2008年第4期852-854,共3页
基金
国家教育部“春晖”计划基金项目(Z2005-1-55003)
文摘
垃圾邮件的日益泛滥,严重制约了E-mail的应用,尤其是在大规模客服中心及重要商业核心机构中的应用。通过对智能决策支持系统结构的分析,提出了一种新的智能决策支持的E-mail过滤模型。采用一种规则与统计相结合的分词方法来完成中文分词,开发了智能邮件过滤系统(IEFS)。由于用户决策的引入,以及垃圾邮件特征知识库的不断更新,使垃圾邮件误判率得到了一定程度的控制。
关键词
智能 决策支持
垃圾邮件
过滤
知识库
词频
Keywords
intelligent decision support
junk mail
filter
knowledge base
word frequency
分类号
TP393.098
[自动化与计算机技术—计算机应用技术]
题名 针对基于内容邮件过滤器的攻击及过滤改进
被引量:2
11
作者
李永亮
刘海燕
陈军
机构
装甲兵工程学院信息工程系
出处
《计算机工程与设计》
CSCD
北大核心
2006年第19期3693-3696,共4页
文摘
基于内容的过滤技术是反垃圾邮件技术中最有效的方法,但是垃圾邮件发送者千方百计利用各种方法对基于内容的垃圾邮件过滤器进行攻击,严重影响了过滤器的正确率和健壮性。在介绍主要基于内容的垃圾邮件过滤技术基础上,分析了针对基于内容垃圾邮件过滤器的常用攻击方法,并提出了相应的过滤改进技术。同时,针对单词沙拉攻击,在几种过滤器上进行了模拟攻击实验。最后分析了垃圾邮件技术的发展趋势和未来反垃圾邮件技术的主要改进方法。
关键词
垃圾邮件
过滤 器
过滤 技术
攻击方法
过滤 改进
Keywords
spam
filter
filtering technologies
attack means
filtering improvement
分类号
TP393.098
[自动化与计算机技术—计算机应用技术]
题名 一种实时监控最近邻的近似算法
12
作者
金澈清
崇志宏
周傲英
机构
华东理工大学计算机科学与工程系
东南大学计算机科学与工程学院
复旦大学计算机科学与工程系
出处
《计算机科学与探索》
CSCD
2007年第2期146-159,共14页
基金
the Key Project of National Natural Science Foundation of China under Grant No.6049325
6049327(国家自然科学基金重大项目).
文摘
处理分布式环境下高速数据的最大挑战在于如何利用少量网络资源输出高质量的查询结果。对面向分布式环境的最近邻查询问题进行了研究,提出了一种基于过滤器的新方法,不仅能计算精确查询结果,还能够处理五类近似查询。该方法在各个远程站点均安装了智能过滤器,并通过合理设置过滤器的范围来降低数据传输量。理论分析及基于模拟数据集合和真实数据集合的实验报告均表明新方法具有较高的性能。
关键词
实时监控
最近邻查询
近似算法
分布式环境
过滤 器
数据集合
查询结果
新方法
网络资源
数据传输
实验报告
理论分析
近似查询
合理设置
高速数据
处理
远程站
智能
质量
性能
Keywords
nearest neighbors query
distributed environment
approximate algorithm
data stream
分类号
TP
[自动化与计算机技术]