期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于堆叠降噪自编码机的广告博文识别方法
1
作者 赵晓乐 栾杰 +2 位作者 冯旭鹏 刘利军 黄青松 《小型微型计算机系统》 CSCD 北大核心 2018年第9期1921-1926,共6页
在针对广告博文进行识别过程中,首先构建文本特征向量和人工定义的特征向量,使用堆叠降噪自编码机对这两种特征向量进行处理,获得处理后的两种特征向量,然后将得到的这两种特征向量进行组合得到第三种特征向量.最后将这三种特征向量用... 在针对广告博文进行识别过程中,首先构建文本特征向量和人工定义的特征向量,使用堆叠降噪自编码机对这两种特征向量进行处理,获得处理后的两种特征向量,然后将得到的这两种特征向量进行组合得到第三种特征向量.最后将这三种特征向量用于最大熵分类模型的训练,依据实验结果找出分类效果最好的模型,使用该模型对博文进行处理过滤掉其中的广告博文,实验证明得到的最大熵分类模型的P、R、F可达到65.58%、87.9%、75.12%,能有效识别绝大多数的广告博文. 展开更多
关键词 广告博文 特征向量 堆叠降噪自编码机 最大熵 分类 过滤
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部