-
题名融合语素特征的中文褒贬词典构建
被引量:7
- 1
-
-
作者
常晓龙
张晖
-
机构
西南科技大学计算机科学与技术学院
-
出处
《计算机应用》
CSCD
北大核心
2012年第7期2033-2037,共5页
-
文摘
针对传统语素方法对于种子词语数量的依赖和传统图方法召回率较低的问题,提出一种将词语间语素关系融入到图模型中,并结合词语同义关系进行中文褒贬词典半监督构建的方法。首先利用语素模型计算词语间语素相似度;然后利用同义词林和双语词典资源,构建词语间同义关系;最后将二种关系结合,并利用标签传播(LP)算法进行词语的褒贬分类。实验结果表明,所提方法具有较高的准确率和召回率,微平均F1值最高可达92.8%;并降低了对种子词语数量的依赖,当种子词语数量仅为100时,微平均F1值依然可达到84.1%。除此之外,所提方法还具有快速收敛的特性。
-
关键词
极性词典
语素模型
同义关系
图模型
标签传播
-
Keywords
polarity lexicon
morpheme model
synonymy relation
graph model
Label Propagation(LP)
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-