期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
朴素Bayes分类器文本特征向量的参数优化 被引量:4
1
作者 方秋莲 王培锦 +3 位作者 隋阳 郑涵颖 吕春玥 王艳彤 《吉林大学学报(理学版)》 CAS 北大核心 2019年第6期1479-1484,共6页
采用朴素Bayes算法建立中文文本自动分类器,并研究相关参数的选择问题,以实现中文文本的高效分类.首先在模型训练阶段,采用N-gram模型处理训练数据集提取特征向量;然后使用朴素Bayes算法建立文本分类器;最后在模型测试阶段,为提高分类... 采用朴素Bayes算法建立中文文本自动分类器,并研究相关参数的选择问题,以实现中文文本的高效分类.首先在模型训练阶段,采用N-gram模型处理训练数据集提取特征向量;然后使用朴素Bayes算法建立文本分类器;最后在模型测试阶段,为提高分类准确率,使用词频-反文档频率算法对测试样本进行特征向量提取.实例分析结果表明,在提取训练集特征向量时,2-gram模型和4-gram模型的特征提取效果最佳;在选取特征向量长度时,长度为25000的特征向量可使分类准确率出现最大增幅并保证较高准确率;在确定特征项词性方面,同时选取动词和名词可使分类器准确率达到最高,仅选取动词时准确率最低. 展开更多
关键词 朴素bayes分类器 特征选择 tfidf算法 N-GRAM模型
在线阅读 下载PDF
基于IMI-WNB算法的垃圾邮件过滤技术研究 被引量:3
2
作者 刘洁 王铮 王辉 《计算机工程》 CAS CSCD 北大核心 2020年第12期299-304,312,共7页
互信息和朴素贝叶斯算法应用于垃圾邮件过滤时,存在特征冗余和独立性假设不成立的问题。为此,提出一种改进互信息的加权朴素贝叶斯算法。针对互信息效率较低的问题,通过引入词频因子与类间差异因子,提出一种改进的互信息特征选择算法,... 互信息和朴素贝叶斯算法应用于垃圾邮件过滤时,存在特征冗余和独立性假设不成立的问题。为此,提出一种改进互信息的加权朴素贝叶斯算法。针对互信息效率较低的问题,通过引入词频因子与类间差异因子,提出一种改进的互信息特征选择算法,从而实现更高效的特征降维。针对朴素贝叶斯分类算法的独立性假设问题,在朴素贝叶斯分类时使用改进互信息值进行特征加权,消除部分朴素贝叶斯条件独立性假设对邮件分类的不利影响。实验结果表明,相比传统朴素贝叶斯算法,该算法提高了垃圾邮件过滤的精确度、召回率与稳定性。 展开更多
关键词 互信息 垃圾邮件过滤 加权朴素贝叶斯算法 特征选择 词频
在线阅读 下载PDF
一种基于朴素贝叶斯分类的特征选择方法 被引量:24
3
作者 余芳 姜云飞 《中山大学学报(自然科学版)》 CAS CSCD 北大核心 2004年第5期118-120,共3页
由于朴素贝叶斯文本分类中的独立假设前提,使得在特征选择步骤能否准确有效地选出能代表文本的特征显得尤为重要,而特征选择标准中的MI标准与TFIDF标准其优缺正好互补,因此在用朴素贝叶斯文本分类方法中的多项式模型实现了一个web页面... 由于朴素贝叶斯文本分类中的独立假设前提,使得在特征选择步骤能否准确有效地选出能代表文本的特征显得尤为重要,而特征选择标准中的MI标准与TFIDF标准其优缺正好互补,因此在用朴素贝叶斯文本分类方法中的多项式模型实现了一个web页面分类系统———WEBCAT的基础上,提出将MI标准与TFIDF标准结合进行特征选择。实验显示:用改进的方法可以更准确地选出能代表文本的特征,文本分类结果也比单独使用TFIDF标准或单独使用MI标准进行特征选择的分类结果更加精确。 展开更多
关键词 朴素贝叶斯分类 特征选择 mi标准 tfidf标准
在线阅读 下载PDF
一个基于朴素贝叶斯方法的web文本分类系统:WebCAT 被引量:9
4
作者 余芳 《计算机工程与应用》 CSCD 北大核心 2004年第13期195-197,共3页
如果缺乏好的对文本自动进行索引及摘要的工具,要从Internet浩瀚的文本中检索有用信息是很困难的。因此,文本分类成为信息检索(InformationRetrieval)的重要组成部分。朴素贝叶斯分类是应用统计理论进行文本分类的有效方法之一。该文结... 如果缺乏好的对文本自动进行索引及摘要的工具,要从Internet浩瀚的文本中检索有用信息是很困难的。因此,文本分类成为信息检索(InformationRetrieval)的重要组成部分。朴素贝叶斯分类是应用统计理论进行文本分类的有效方法之一。该文结合web文本的特点使用朴素贝叶斯分类器实现了一个web文本分类系统WebCAT,并获得了很好的分类结果。 展开更多
关键词 朴素贝叶斯分类 特征选择 互信息 tfidf
在线阅读 下载PDF
使用贝叶斯学习算法分类网络流量 被引量:6
5
作者 邱密 阳爱民 +1 位作者 刘永定 何震凯 《计算机工程与应用》 CSCD 北大核心 2010年第25期78-81,96,共5页
随着网络应用(如P2P)的快速增长,使得传统的基于端口与有效载荷的网络流量分类方法效率大大降低。基于FCBF特征选择方法选择最优特征子集,研究使用贝叶斯学习方法对网络流量进行分类;实验结果显示提出的方法取得了较好的分类准确率。
关键词 网络流量 特征选择 朴素贝叶斯学习器
在线阅读 下载PDF
用于阿尔茨海默症分类的模糊逻辑特征选择和异质集成学习方法 被引量:2
6
作者 韩亮 杨婷 +1 位作者 蒲秀娟 黄谦 《电子与信息学报》 EI CSCD 北大核心 2021年第11期3319-3326,共8页
阿尔茨海默症(AD)分类有助于在AD早期阶段及时采取针对性的治疗和干预措施,对降低老年群体的AD发病率和延缓AD疾病进展具有重要意义。该文提出一种改进的高斯模糊逻辑特征选择方法,首先采用互信息量和方差齐性分析两种方法给出特征重要... 阿尔茨海默症(AD)分类有助于在AD早期阶段及时采取针对性的治疗和干预措施,对降低老年群体的AD发病率和延缓AD疾病进展具有重要意义。该文提出一种改进的高斯模糊逻辑特征选择方法,首先采用互信息量和方差齐性分析两种方法给出特征重要性评分并分别进行归一化,然后使用改进的高斯模糊逻辑方法对其加权得到最终的特征重要性评分,最后依据特征重要性评分选取特征。该文还使用逻辑回归、随机森林、LightGBM、支持向量机和深度前馈网络作为初级分类器,多项式朴素贝叶斯分类器作为次级分类器,构建异质集成分类器,利用选取的特征进行AD分类。在TADPOLE数据集上进行实验,实验结果证实了所提特征选择方法是有效的,且采用所提特征选择方法,基于多项式朴素贝叶斯的异质集成分类器在AD分类上的性能要优于传统分类器。 展开更多
关键词 阿尔茨海默症 模糊逻辑 特征选择 多项式朴素贝叶斯 异质集成分类器
在线阅读 下载PDF
基于多种特征选择的NB组合文本分类器设计
7
作者 樊康新 《计算机工程》 CAS CSCD 北大核心 2009年第24期191-193,共3页
针对朴素贝叶斯(NB)分类器在分类过程中存在诸如分类模型对样本具有敏感性、分类精度难以提高等缺陷,提出一种基于多种特征选择方法的NB组合文本分类器方法。依据Boosting分类算法,采用多种不同的特征选择方法建立文本的特征词集,训练N... 针对朴素贝叶斯(NB)分类器在分类过程中存在诸如分类模型对样本具有敏感性、分类精度难以提高等缺陷,提出一种基于多种特征选择方法的NB组合文本分类器方法。依据Boosting分类算法,采用多种不同的特征选择方法建立文本的特征词集,训练NB分类器作为Boosting迭代过程的基分类器,通过对基分类器的加权投票生成最终的NB组合文本分类器。实验结果表明,该组合分类器较单NB文本分类器具有更好的分类性能。 展开更多
关键词 特征选择 朴素贝叶斯 组合文本分类器 BOOSTING算法
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部