-
题名观点句中评价对象/属性的缺省项识别方法研究
被引量:2
- 1
-
-
作者
刘慧慧
王素格
赵策力
-
机构
山西大学计算机与信息技术学院
山西大学计算智能与中文信息处理教育部重点实验室
山西大学数学科学学院
-
出处
《中文信息学报》
CSCD
北大核心
2014年第6期175-182,共8页
-
基金
国家自然科学基金(61175067
61272095)
+1 种基金
山西省科技攻关项目(20110321027-02)
山西省回国留学人员科研项目(2013-014)
-
文摘
在多对象、多属性的评论文本中,评价对象和评价属性的缺省识别对于观点挖掘有着重要的作用。针对情感观点句中评价对象和评价属性的缺省问题,该文提出一种有效的缺省项识别方法。首先构造缺省项识别规则集,用于获取待识别的缺省项侯选集;将缺省项识别问题看作一个二元分类问题,选用词法和依存句法作为特征,使用决策树分类算法C4.5训练分类器模型,在测试集上对待识别的缺省项进行判别。实验结果表明,使用依存句法特征集分类的F值优于词法特征集约2%。将词法和依存句法两类特征融合与单类特征相比,分类精确率和F值分别提高了10%和5%左右,说明词法特征和依存句法特征的融合有利于缺省项识别。
-
关键词
缺省项
识别规则
词法特征
依存句法
C4.5算法
-
Keywords
default item
identification rule
lexical feature
dependency syntactic
C4.5 algorithm
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-