期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
一种改进TF-IDF的中文邮件识别算法研究
被引量:
9
1
作者
吴小晴
万国金
+2 位作者
李程文
林梦思
曹书强
《现代电子技术》
北大核心
2020年第12期83-86,共4页
传统的TF-IDF算法没有很好地分配分词的权重,对一些能代表邮件类别出现频率较大的词语计算的IDF值反而较小,IDF值小说明单词的区分能力弱而不符合实际情况。为了提升垃圾邮件识别的准确率,提出一种改进TF-IDF算法和类中心向量的中文垃...
传统的TF-IDF算法没有很好地分配分词的权重,对一些能代表邮件类别出现频率较大的词语计算的IDF值反而较小,IDF值小说明单词的区分能力弱而不符合实际情况。为了提升垃圾邮件识别的准确率,提出一种改进TF-IDF算法和类中心向量的中文垃圾邮件识别方法。通过改进传统的TF-IDF计算方式,在传统的TF-IDF算法里面加入卡方统计量CHI和位置影响因子能够很好地改善一些重要词汇的权重问题,并结合逆向最大匹配算法的邮件文本分词和类中心向量算法的特征选择进行垃圾邮件分类。实验结果表明,所提算法相较于传统的TF-IDF算法对垃圾邮件识别的准确率提升了约3.6%,具有一定的实际应用价值。
展开更多
关键词
TF-IDF算法
邮件识别
卡方统计量
权重分配
邮件
分类
仿真分析
在线阅读
下载PDF
职称材料
用于垃圾邮件识别的“词频-筛”混合特征选择方法
2
作者
陈俊颖
周顺风
闵华清
《华南理工大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2017年第3期82-88,共7页
文中针对当下愈发泛滥的垃圾邮件,分别使用朴素贝叶斯分类和支持向量机分类法对当前日益泛滥的垃圾邮件进行识别、分类,将"词频-筛"混合特征选择方法应用于分类器模型中,以提高分类器的识别性能.同时,通过考虑更全面的分类概...
文中针对当下愈发泛滥的垃圾邮件,分别使用朴素贝叶斯分类和支持向量机分类法对当前日益泛滥的垃圾邮件进行识别、分类,将"词频-筛"混合特征选择方法应用于分类器模型中,以提高分类器的识别性能.同时,通过考虑更全面的分类概率情况,改进朴素贝叶斯分类模型,进一步提升朴素贝叶斯分类器的识别性能.最后通过实验得到了该垃圾邮件识别系统的准确率、召回率和F1值等分类识别性能指标.实验结果表明,"词频-筛"混合特征选择方法能有效提高垃圾邮件分类器的识别性能,而且使用成本敏感方法的分类输出调节模块也能大大降低分类器将正常邮件误判为垃圾邮件的概率,因此,文中设计的垃圾邮件识别系统具有较强的实用性,可以在实际工作、生活中使用.
展开更多
关键词
垃圾
邮件识别
混合特征选择方法
朴素贝叶斯
支持向量机
在线阅读
下载PDF
职称材料
三记重拳打击垃圾邮件
3
作者
李军胜
《IT时代周刊》
2003年第09X期38-38,共1页
当全球7亿网民在享受电子邮件方便、快捷的同时,也深受无数垃圾邮件的困扰。垃圾邮件的泛滥成灾,已经成为全球互联网服务面临的一个共同问题(见本刊第038期《垃圾邮件背后的较量》)。为解决这一问题,需要通过多种手段同时进行,以...
当全球7亿网民在享受电子邮件方便、快捷的同时,也深受无数垃圾邮件的困扰。垃圾邮件的泛滥成灾,已经成为全球互联网服务面临的一个共同问题(见本刊第038期《垃圾邮件背后的较量》)。为解决这一问题,需要通过多种手段同时进行,以抵制垃圾邮件的盛行。以下打击垃圾邮件的三记重拳,已经或将要奏效。
展开更多
关键词
垃圾
邮件
电子
邮件
互联网服务
邮件识别
邮件
过滤
法律手段
在线阅读
下载PDF
职称材料
题名
一种改进TF-IDF的中文邮件识别算法研究
被引量:
9
1
作者
吴小晴
万国金
李程文
林梦思
曹书强
机构
南昌大学信息工程学院
出处
《现代电子技术》
北大核心
2020年第12期83-86,共4页
基金
国家自然科学基金项目(61661030)。
文摘
传统的TF-IDF算法没有很好地分配分词的权重,对一些能代表邮件类别出现频率较大的词语计算的IDF值反而较小,IDF值小说明单词的区分能力弱而不符合实际情况。为了提升垃圾邮件识别的准确率,提出一种改进TF-IDF算法和类中心向量的中文垃圾邮件识别方法。通过改进传统的TF-IDF计算方式,在传统的TF-IDF算法里面加入卡方统计量CHI和位置影响因子能够很好地改善一些重要词汇的权重问题,并结合逆向最大匹配算法的邮件文本分词和类中心向量算法的特征选择进行垃圾邮件分类。实验结果表明,所提算法相较于传统的TF-IDF算法对垃圾邮件识别的准确率提升了约3.6%,具有一定的实际应用价值。
关键词
TF-IDF算法
邮件识别
卡方统计量
权重分配
邮件
分类
仿真分析
Keywords
TF-IDF algorithm
mail recognition
CHI
weight allocation
mail classification
simulation analysis
分类号
TN911.23-34 [电子电信—通信与信息系统]
TP181 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
用于垃圾邮件识别的“词频-筛”混合特征选择方法
2
作者
陈俊颖
周顺风
闵华清
机构
华南理工大学软件学院∥广州市机器人软件及复杂信息处理重点实验室
出处
《华南理工大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2017年第3期82-88,共7页
基金
广东省自然科学基金资助项目(2016A030310412)
广东高校省级重点平台及科研项目-青年创新人才类项目(2015KQNCX003)
+1 种基金
广州市科技计划重点实验室项目(15180007)
广州市科技计划项目(201707010223)~~
文摘
文中针对当下愈发泛滥的垃圾邮件,分别使用朴素贝叶斯分类和支持向量机分类法对当前日益泛滥的垃圾邮件进行识别、分类,将"词频-筛"混合特征选择方法应用于分类器模型中,以提高分类器的识别性能.同时,通过考虑更全面的分类概率情况,改进朴素贝叶斯分类模型,进一步提升朴素贝叶斯分类器的识别性能.最后通过实验得到了该垃圾邮件识别系统的准确率、召回率和F1值等分类识别性能指标.实验结果表明,"词频-筛"混合特征选择方法能有效提高垃圾邮件分类器的识别性能,而且使用成本敏感方法的分类输出调节模块也能大大降低分类器将正常邮件误判为垃圾邮件的概率,因此,文中设计的垃圾邮件识别系统具有较强的实用性,可以在实际工作、生活中使用.
关键词
垃圾
邮件识别
混合特征选择方法
朴素贝叶斯
支持向量机
Keywords
spam identification
hybrid feature selection method
naive Bayes
support vector machine
分类号
TP391.43 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
三记重拳打击垃圾邮件
3
作者
李军胜
机构
<时代周刊>
出处
《IT时代周刊》
2003年第09X期38-38,共1页
文摘
当全球7亿网民在享受电子邮件方便、快捷的同时,也深受无数垃圾邮件的困扰。垃圾邮件的泛滥成灾,已经成为全球互联网服务面临的一个共同问题(见本刊第038期《垃圾邮件背后的较量》)。为解决这一问题,需要通过多种手段同时进行,以抵制垃圾邮件的盛行。以下打击垃圾邮件的三记重拳,已经或将要奏效。
关键词
垃圾
邮件
电子
邮件
互联网服务
邮件识别
邮件
过滤
法律手段
分类号
TP393.098 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
一种改进TF-IDF的中文邮件识别算法研究
吴小晴
万国金
李程文
林梦思
曹书强
《现代电子技术》
北大核心
2020
9
在线阅读
下载PDF
职称材料
2
用于垃圾邮件识别的“词频-筛”混合特征选择方法
陈俊颖
周顺风
闵华清
《华南理工大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2017
0
在线阅读
下载PDF
职称材料
3
三记重拳打击垃圾邮件
李军胜
《IT时代周刊》
2003
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部