-
题名中文产品评论中属性词抽取方法研究
被引量:12
- 1
-
-
作者
栗春亮
朱艳辉
徐叶强
-
机构
湖南工业大学计算机与通信学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2011年第12期26-28,32,共4页
-
基金
教育部人文社会科学研究青年基金资助项目(09YJCZH019)
湖南省自然科学基金资助项目(10JJ3002)
中国包装总公司科研基金资助项目(2008-XK13)
-
文摘
针对现有属性词抽取方法的准确率和覆盖率偏低问题,利用百度百科和分词后相邻词语同现比例识别专业领域生词,降低分词错误对属性词识别的影响,在中文产品评论语料中通过设计词性序列模板获得候选属性词集,该词性序列模板包含名词和名词短语模板、动词和动词短语模板,采用统计技术和自然语言处理技术筛选候选属性词。实验结果表明,对于3 623篇手机评论文章,利用该方法可获得1 732个属性词,准确率为0.565、召回率为0.726、调和平均值为0.636,具有较好的抽取性能。
-
关键词
产品评论
生词识别
序列模板
属性词
-
Keywords
product comment
new word recognition
sequence template
attribute word
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-