期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于全切分获取网络流行语方法研究 被引量:2
1
作者 吴保珍 何婷婷 +2 位作者 李立 张勇 陈龙 《计算机应用研究》 CSCD 北大核心 2009年第4期1260-1262,1285,共4页
利用统计和规则相结合的算法从互联网的动态信息流中提取网络流行语。在利用全切分算法获取候选词集的基础上,依次对候选词集进行三次过滤:首先基于向量空间模型的权重过滤,运用语言模型进行过滤;然后利用垃圾串过滤规则获取网络流行词... 利用统计和规则相结合的算法从互联网的动态信息流中提取网络流行语。在利用全切分算法获取候选词集的基础上,依次对候选词集进行三次过滤:首先基于向量空间模型的权重过滤,运用语言模型进行过滤;然后利用垃圾串过滤规则获取网络流行词语候选词集;最后利用提出的流行词语评分模型进行筛选得到网络流行词语。实验表明,在不影响流行词语准确率的前提下,利用该方法自动获取网络流行词语的速度明显提高。 展开更多
关键词 网络流行词语 中文信息处理 全切分
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部