期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于加权频繁子树相似度的网页评论信息抽取
被引量:
3
1
作者
郝志峰
袁琴
+2 位作者
蔡瑞初
温雯
骆魁永
《计算机应用研究》
CSCD
北大核心
2017年第6期1636-1639,1658,共5页
针对现有网页信息抽取方法普遍存在人工耗时大、抽取准确率低等问题,提出了一种基于加权频繁子树相似度的网页评论信息抽取方法 WTS。首先通过视觉特征对网页进行剪枝处理;然后,通过深度加权的相似度度量方法抽取最佳频繁子树;最后,通...
针对现有网页信息抽取方法普遍存在人工耗时大、抽取准确率低等问题,提出了一种基于加权频繁子树相似度的网页评论信息抽取方法 WTS。首先通过视觉特征对网页进行剪枝处理;然后,通过深度加权的相似度度量方法抽取最佳频繁子树;最后,通过子树对齐方法抽取评论路径并解析评论内容。通过对京东、苏宁等网站的评论内容抽取实验,验证了WTS方法比D-EEM、POL等方法在抽取产品评论信息上具有一定的优势。
展开更多
关键词
产品评论
抽取
加权频繁子树
在线阅读
下载PDF
职称材料
题名
基于加权频繁子树相似度的网页评论信息抽取
被引量:
3
1
作者
郝志峰
袁琴
蔡瑞初
温雯
骆魁永
机构
广东工业大学计算机学院
佛山科学技术学院
出处
《计算机应用研究》
CSCD
北大核心
2017年第6期1636-1639,1658,共5页
基金
NSFC-广东联合基金资助项目(U1501254)
广东省自然科学基金资助项目(2014A030306004
+13 种基金
2014A030308008)
广东省科技计划资助项目(2012B01010029
2013B051000076
2015B010108006
2015B010131015)
广州市科技计划资助项目(2014Y2-00027)
国家自然科学基金资助项目(61202269
61472089
61572143
61502108
61502109)
广东特支计划资助项目(2015TQ01X140)
广州市珠江科技新星资助项目(201610010101)
广东省哲学社科项目(GD14XYJ24)
文摘
针对现有网页信息抽取方法普遍存在人工耗时大、抽取准确率低等问题,提出了一种基于加权频繁子树相似度的网页评论信息抽取方法 WTS。首先通过视觉特征对网页进行剪枝处理;然后,通过深度加权的相似度度量方法抽取最佳频繁子树;最后,通过子树对齐方法抽取评论路径并解析评论内容。通过对京东、苏宁等网站的评论内容抽取实验,验证了WTS方法比D-EEM、POL等方法在抽取产品评论信息上具有一定的优势。
关键词
产品评论
抽取
加权频繁子树
Keywords
product comments
extraction
weighted frequent sub-tree
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于加权频繁子树相似度的网页评论信息抽取
郝志峰
袁琴
蔡瑞初
温雯
骆魁永
《计算机应用研究》
CSCD
北大核心
2017
3
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部