期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于朴素贝叶斯的渔业文本分类器研究 被引量:2
1
作者 邵乐 于红 +2 位作者 刘溪婧 綦孝姬 梁晓娜 《大连水产学院学报》 CSCD 北大核心 2010年第1期45-48,共4页
通过阐述朴素贝叶斯文本分类器的算法原理及其用于建立渔业文本分类器的优点,给出了基于朴素贝叶斯的渔业文本分类器的基本结构,并用实验验证了该结构的性能。结果表明,基于渔业词库的朴素贝叶斯渔业文本分类器具有比普通文本分类器更... 通过阐述朴素贝叶斯文本分类器的算法原理及其用于建立渔业文本分类器的优点,给出了基于朴素贝叶斯的渔业文本分类器的基本结构,并用实验验证了该结构的性能。结果表明,基于渔业词库的朴素贝叶斯渔业文本分类器具有比普通文本分类器更好的性能。 展开更多
关键词 渔业 文本分类器 朴素贝叶斯
在线阅读 下载PDF
基于大数据挖掘技术的文本分类研究 被引量:6
2
作者 孟鑫淼 《现代电子技术》 北大核心 2020年第17期126-129,共4页
文本数据具有规模大、特征维数高等特点,当前文本分类方法无法刻画文本变化特点,使得文本分类正确率低、误差大、分类时间长,为了获得理想的文本分类效果,设计基于大数据挖掘技术的文本分类方法。首先对当前文本分类的研究进展进行分析... 文本数据具有规模大、特征维数高等特点,当前文本分类方法无法刻画文本变化特点,使得文本分类正确率低、误差大、分类时间长,为了获得理想的文本分类效果,设计基于大数据挖掘技术的文本分类方法。首先对当前文本分类的研究进展进行分析,找出导致当前文本分类效果差的原因;然后,提取文本分类原始特征,并引入核主成分分析算法对原始特征进行处理,降低特征维数,简化文本分类器的结构;最后,采用大数据挖掘技术构建文本分类器,并与其他文本分类方法进行对比测试。测试结果表明,所提方法可以更好地描述文本变化特点,能够对各种类型文本进行准确识别和分类,文本分类精度超过95%,明显高于当前其他文本分类方法,并且所提方法的文本分类时间显著减少,具有更好的文本分类效果。 展开更多
关键词 大规模文本数据 高维特征 大数据挖掘技术 文本分类器 分类精度 分类时间
在线阅读 下载PDF
基于语义的文本信息安全过滤平台 被引量:2
3
作者 李新 《信息化研究》 2009年第6期15-20,23,共7页
信息安全是人们关注的焦点,从传统的基于行为的安全向基于内容本身的安全不断发展,信息安全的外延在不断扩大。Internet提供的海量、庞杂的信息中,不良信息以不同的表现形式,从不同的角度对不同人群造成毒害或干扰。因此,对网络访问进... 信息安全是人们关注的焦点,从传统的基于行为的安全向基于内容本身的安全不断发展,信息安全的外延在不断扩大。Internet提供的海量、庞杂的信息中,不良信息以不同的表现形式,从不同的角度对不同人群造成毒害或干扰。因此,对网络访问进行必要的、有效的内容过滤是营造健康安全网络环境的重要环节。但是,传统的文本信息过滤算法仅能实现结构对应层次上的判断,无法体现文本的语义,过滤效果难以满足智能化的要求。文中结合计算机语言学知识,提出并实现了一种语义分析的过滤方法,对于那些冗长文本中因为分散存在的关键字而造成的假匹配,通过语义分析,可以很好地甄别处理,从而提高系统的召回率。 展开更多
关键词 信息安全 语义过滤 分词 文本分类器
在线阅读 下载PDF
A SVM Based Text Steganalysis Algorithm for Spacing Coding 被引量:2
4
作者 YANG Yu 《China Communications》 SCIE CSCD 2014年第A01期108-113,共6页
Group distance coding is suitable for secret communication covered by printed documents. However there is no effective method against it. The study found that the hiding method will make group distances of text lines ... Group distance coding is suitable for secret communication covered by printed documents. However there is no effective method against it. The study found that the hiding method will make group distances of text lines coverage on specified values, and make variances of group distances among N-Window text lines become small. Inspired by the discovery, the research brings out a Support Vector Machine (SVM) based steganalysis algorithm. To avoid the disturbance of large difference among words length from same line, the research only reserves samples whose occurrence-frequencies are ± 10dB of the maximum frequency. The results show that the correct rate of the SVM classifier is higher than 90%. 展开更多
关键词 text steganalysis SVM steganalysis space-coding detecting
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部