期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于宏特征融合的文本分类 被引量:2
1
作者 王丹丹 陈清财 +1 位作者 王晓龙 汤步洲 《中文信息学报》 CSCD 北大核心 2017年第2期92-98,共7页
宏特征(即文档级特征)抽取方法是文本分类中一类典型的特征抽取方法,可以分为有监督宏特征抽取和无监督宏特征抽取。这两类宏特征抽取方法均能提高文本分类的性能。但是,同时使用两类宏特征的情况还没有被研究。该文研究了有监督宏特征... 宏特征(即文档级特征)抽取方法是文本分类中一类典型的特征抽取方法,可以分为有监督宏特征抽取和无监督宏特征抽取。这两类宏特征抽取方法均能提高文本分类的性能。但是,同时使用两类宏特征的情况还没有被研究。该文研究了有监督宏特征和无监督宏特征融合对文本分类性能的影响。具体来讲,研究了两种有监督宏特征抽取方法,与三种无监督宏特征抽取方法,即K-means、LDA和DBN,相互融合的情况。在两个公开语料库Reuters-21578和20-Newsgroup以及一个自动构建的语料库上的对比实验表明,有监督和无监督宏特征之间的融合比单独使用有监督或者无监督宏特征的方式对文本分类更加有效。 展开更多
关键词 文本分类 监督特征抽取 无监督宏特征抽取 特征融合
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部