期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
一种改进TF-IDF的中文邮件识别算法研究 被引量:9
1
作者 吴小晴 万国金 +2 位作者 李程文 林梦思 曹书强 《现代电子技术》 北大核心 2020年第12期83-86,共4页
传统的TF-IDF算法没有很好地分配分词的权重,对一些能代表邮件类别出现频率较大的词语计算的IDF值反而较小,IDF值小说明单词的区分能力弱而不符合实际情况。为了提升垃圾邮件识别的准确率,提出一种改进TF-IDF算法和类中心向量的中文垃... 传统的TF-IDF算法没有很好地分配分词的权重,对一些能代表邮件类别出现频率较大的词语计算的IDF值反而较小,IDF值小说明单词的区分能力弱而不符合实际情况。为了提升垃圾邮件识别的准确率,提出一种改进TF-IDF算法和类中心向量的中文垃圾邮件识别方法。通过改进传统的TF-IDF计算方式,在传统的TF-IDF算法里面加入卡方统计量CHI和位置影响因子能够很好地改善一些重要词汇的权重问题,并结合逆向最大匹配算法的邮件文本分词和类中心向量算法的特征选择进行垃圾邮件分类。实验结果表明,所提算法相较于传统的TF-IDF算法对垃圾邮件识别的准确率提升了约3.6%,具有一定的实际应用价值。 展开更多
关键词 TF-IDF算法 邮件识别 卡方统计量 权重分配 邮件分类 仿真分析
在线阅读 下载PDF
用于垃圾邮件识别的“词频-筛”混合特征选择方法
2
作者 陈俊颖 周顺风 闵华清 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2017年第3期82-88,共7页
文中针对当下愈发泛滥的垃圾邮件,分别使用朴素贝叶斯分类和支持向量机分类法对当前日益泛滥的垃圾邮件进行识别、分类,将"词频-筛"混合特征选择方法应用于分类器模型中,以提高分类器的识别性能.同时,通过考虑更全面的分类概... 文中针对当下愈发泛滥的垃圾邮件,分别使用朴素贝叶斯分类和支持向量机分类法对当前日益泛滥的垃圾邮件进行识别、分类,将"词频-筛"混合特征选择方法应用于分类器模型中,以提高分类器的识别性能.同时,通过考虑更全面的分类概率情况,改进朴素贝叶斯分类模型,进一步提升朴素贝叶斯分类器的识别性能.最后通过实验得到了该垃圾邮件识别系统的准确率、召回率和F1值等分类识别性能指标.实验结果表明,"词频-筛"混合特征选择方法能有效提高垃圾邮件分类器的识别性能,而且使用成本敏感方法的分类输出调节模块也能大大降低分类器将正常邮件误判为垃圾邮件的概率,因此,文中设计的垃圾邮件识别系统具有较强的实用性,可以在实际工作、生活中使用. 展开更多
关键词 垃圾邮件识别 混合特征选择方法 朴素贝叶斯 支持向量机
在线阅读 下载PDF
三记重拳打击垃圾邮件
3
作者 李军胜 《IT时代周刊》 2003年第09X期38-38,共1页
当全球7亿网民在享受电子邮件方便、快捷的同时,也深受无数垃圾邮件的困扰。垃圾邮件的泛滥成灾,已经成为全球互联网服务面临的一个共同问题(见本刊第038期《垃圾邮件背后的较量》)。为解决这一问题,需要通过多种手段同时进行,以... 当全球7亿网民在享受电子邮件方便、快捷的同时,也深受无数垃圾邮件的困扰。垃圾邮件的泛滥成灾,已经成为全球互联网服务面临的一个共同问题(见本刊第038期《垃圾邮件背后的较量》)。为解决这一问题,需要通过多种手段同时进行,以抵制垃圾邮件的盛行。以下打击垃圾邮件的三记重拳,已经或将要奏效。 展开更多
关键词 垃圾邮件 电子邮件 互联网服务 邮件识别 邮件过滤 法律手段
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部