期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于加权频繁子树相似度的网页评论信息抽取 被引量:3
1
作者 郝志峰 袁琴 +2 位作者 蔡瑞初 温雯 骆魁永 《计算机应用研究》 CSCD 北大核心 2017年第6期1636-1639,1658,共5页
针对现有网页信息抽取方法普遍存在人工耗时大、抽取准确率低等问题,提出了一种基于加权频繁子树相似度的网页评论信息抽取方法 WTS。首先通过视觉特征对网页进行剪枝处理;然后,通过深度加权的相似度度量方法抽取最佳频繁子树;最后,通... 针对现有网页信息抽取方法普遍存在人工耗时大、抽取准确率低等问题,提出了一种基于加权频繁子树相似度的网页评论信息抽取方法 WTS。首先通过视觉特征对网页进行剪枝处理;然后,通过深度加权的相似度度量方法抽取最佳频繁子树;最后,通过子树对齐方法抽取评论路径并解析评论内容。通过对京东、苏宁等网站的评论内容抽取实验,验证了WTS方法比D-EEM、POL等方法在抽取产品评论信息上具有一定的优势。 展开更多
关键词 产品评论 抽取 加权频繁子树
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部