-
题名中文微博情感分析研究与实现
被引量:29
- 1
-
-
作者
李勇敢
周学广
孙艳
张焕国
-
机构
武汉大学计算机学院
海军工程大学信息安全系
中国人民解放军
-
出处
《软件学报》
EI
CSCD
北大核心
2017年第12期3183-3205,共23页
-
基金
国家重点基础研究发展计划(973)(2014CB340600)
国家自然科学基金(61332019
+1 种基金
61672531)
国家社会科学基金(14GJ003-152)~~
-
文摘
中文微博的大数据、指数传播和跨媒体等特性,决定了依托人工方式监控和处理中文微博是不现实的,迫切需要依托计算机开展中文微博情感自动分析研究.该项研究可分为3个任务:中文微博观点句识别、情感倾向性分类和情感要素抽取.为完成上述任务,研制了一个评测系统:通过构建多级词库、制定成词规则、开展串频统计等给出一种基于规则和统计的新词识别方法,在情感词和评价对象的依存模式的基础上给出基于词语特征的观点句识别算法;以词序流表示文本的LDA-Collocation模型,采用吉布斯抽样法推导了算法,实现中文微博情感倾向性自动分类;针对中文微博情感要素抽取召回率较低的问题,利用依存关系分析理论,按主语类和宾语类把依存模式分为两类,建立了6个优先级的评价对象和情感词汇的依存模式,通过评价对象归并算法实现计算机自动抽取情感要素.实验包括两个部分:一是参加NLP&CC2012的公开评测,所提方法在微博观点句识别任务中的准确率为第2,在中文微博情感要素抽取任务中的准确率和F值均为第2,验证了该算法的实用性;二是在分析公开评测结果的基础上,分别比较了参加公开评测的各类算法在处理中文微博情感分析时的效率,给出了相关结论.
-
关键词
中文微博
情感分析
依存分析
情感倾向性分类
情感要素抽取
无监督主题情感模型
-
Keywords
Chinese Microblog
sentiment analysis
dependency parsing
emotion tendency classification
emotion expression extraction
unsupervised topic sentiment model
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-