基于卷积神经网络的微博情感倾向性分析被引量：98

Convolutional Neural Networks for Chinese Micro-blog Sentiment Analysis

在线阅读下载PDF

导出

摘要微博情感倾向性分析旨在发现用户对热点事件的观点态度。由于微博噪声大、新词多、缩写频繁、有自己的固定搭配、上下文信息有限等原因,微博情感倾向性分析是一项有挑战性的工作。该文主要探讨利用卷积神经网络进行微博情感倾向性分析的可行性,分别将字级别词向量和词级别词向量作为原始特征,采用卷积神经网络来发现任务中的特征,在COAE2014任务4的语料上进行了实验。实验结果表明,利用字级别词向量及词级别词向量的卷积神经网络分别取得了95.42%的准确率和94.65%的准确率。由此可见对于中文微博语料而言,利用卷积神经网络进行微博情感倾向性分析是有效的,且使用字级别的词向量作为原始特征会好于使用词级别的词向量作为原始特征。 Chinese micro-blog sentiment analysis aims to discover the user attitude towards hot events. This task is challenged by immense noises, rich new words, numerous abbreviations, vigorous collocation, together with the limited contextual information provided in the short texts. This paper explores the feasibility of performing Chinese micro-blog sentiment analysis by convolutional neural networks. To avoid task-specific features, character level cmbedding and word level embedding are adopted for convolutional neural networks（CNN）. On the COAE 4th task corpus, the character level CNN achieves a sentiment prediction （in both binary positive/negative classification） accuracy of 95.42 %, slightly better than the word level CNN yielding 94. 65 % accuracy. The results show that the convolutional neural networks model is promising in Chinese micro-blog sentiment analysis.

作者刘龙飞杨亮张绍武林鸿飞

机构地区大连理工大学信息检索实验室

出处《中文信息学报》 CSCD 北大核心 2015年第6期159-165,共7页 Journal of Chinese Information Processing

基金国家自然科学基金(61277370 61402075) 国家863高科技计划资助项目(2006AA01Z151) 辽宁省自然科学基金(201202031 2014020003) 教育部留学回国人员科研启动基金高等学校博士学科点专项科研基金(20090041110002) 中央高校基本科研业务费专项资金资助

关键词深度学习情感倾向性分析卷积神经网络词向量 deep learning sentiment analysis convolutional neural networks word embeddilig

分类号 TP391 [自动化与计算机技术—计算机应用技术]

作者简介刘龙飞（1989-），硕士研究生，主要研究领域为机器学习、情感计算。E—mail：liudragonfly@mail．dlut．edu．cn 杨亮（1986-），博士研究生，主要研究领域为情感分析、自然语言理解。E—mail：yangliang@mail．dlut．edu．cn 张绍武（1967-），博士，副教授，主要研究领域为情感计算和搜索引擎。E—mail：zhangsw@dlut．edu．cn

引文网络
相关文献

参考文献19

1Pang B, Lee L. Seeing stars: Exploiting class relation- ships for sentiment categorization with respect to rating scales[C]//Proceedings o~ the 43rd Annual Meeting on Association for Computational Linguistics. Association for Computational Linguistics, 2005: 115-124.
2梁军,柴玉梅,原慧斌,昝红英,刘铭.基于深度学习的微博情感分析[J].中文信息学报,2014,28(5):155-161. 被引量：110
3罗毅,李利,谭松波,程学旗.基于中文微博语料的情感倾向性分析[J].山东大学学报（理学版）,2014,49(11):1-7. 被引量：11
4LeCun Y, Bottou L, Bengio Y, et al. Gradient-based learning applied to document recognition [C]//Pro- ceedings of the IEEE, 1998, 86(11) : 2278-2324.
5Yih W, He X, Meek C. Semantic parsing for single-rela- tion question answering[C]//Proceedings of ACL 2014.
6Shen Y, He X, Gao J, et al. Learning semantic repre- sentations using convolutional neural networks for web search[C]//Proceedings of the companion publication of the 23rd international conference on World wide web companion. International World Wide Web Confer- ences Steering Committee, 2014: 373-374.
7Blunsom P, Grefenstette E, Kalehbrenner N. A conv- olutional neural network for modelling sentences[C]// Proceedings of the 52nd Annual Meeting of the Associ- ation for Computational Linguistics. 2014.
8Collobert R, Weston J, Bottou L, et al. Natural language processing (almost) from scratch[J].The Journal of Ma- chine Learning Research, 2011, 12: 2493-2537.
9dos Santos C N, Gatti M. Deep convolutional neural networks for sentiment analysis of short texts[C]// Proceedings of the 25th International Conference on Computational Linguistics (COLING). Dublin, Ire-land. 2014.
10Kim Y. Convolutional neural networks for sentence classification[C]//Proceedings of the EMNLP,2014.

二级参考文献25

1朱嫣岚,闵锦,周雅倩,黄萱菁,吴立德.基于HowNet的词汇语义倾向计算[J].中文信息学报,2006,20(1):14-20. 被引量：327
2王根,赵军.基于多重标记CRF句子情感分析的研究[C]//全国第九届计算机语言学学术会议论文集.大连:[出版者不详],2007.
3唐慧丰,谭松波,程学旗.基于监督学习的中文情感分类技术比较研究[J].中文信息学报,2007,21(6):88-94. 被引量：137
4B.Pang,L.Lee.Seeing stars:Exploiting class relationships for sentiment categorization with respect to rating scales[C]Proceedings of the ACL,2005:115-124.
5Y.Bengio,R.Ducharme,P.Vincent,et al.A neural probabilistic language model[J].Journal of Machine Learning Research,2003,3:1137-1155.
6Collobert R,Weston J.A unified architecture for natural language processing:Deep neural networks with multitask learning[C]//Proceedings of the 25th international conference on Machine learning.ACM,2008:160-167.
7Mnih A,Hinton G E.A Scalable Hierarchical Distributed Language Model[C]//Proceedings of NIPS.2008::1081-1088.
8Mikolov T,Karafiát M,Burget L,et al.Recurrent neural network based language model[C]//Proceedingsof INTERSPEECH.2010:1045-1048.
9Mikolov T,Kombrink S,Burget L,et al.Extensions of recurrent neural network language model[C]//Proceedings of Acoustics,Speech and Signal Processing(ICASSP),2011 IEEE International Conference on.IEEE,2011:5528-5531.
10Kombrink S,Mikolov T,Karafiát M,et al.Recurrent Neural Network Based Language Modeling in Meeting Recognition[C]//Proceedings of INTERSPEECH.2011:2877-2880.

共引文献113

1王曰芬,吴鹏,丁晟春,陈芬.社会舆情分析研究与进展综述[J].情报学进展,2016(1):132-185. 被引量：1
2热孜瓦姑丽·吾斯曼,艾孜尔古丽·玉素甫.论现代的维吾尔语情感分析方法进展[J].电脑知识与技术,2020,0(4):178-179.
3王文,王树锋,李洪华.基于文本语义和表情倾向的微博情感分析方法[J].南京理工大学学报,2014,38(6):733-738. 被引量：23
4苏小英,孟环建.基于神经网络的微博情感分析[J].计算机技术与发展,2015,25(12):161-164. 被引量：14
5梁军,柴玉梅,原慧斌,高明磊,昝红英.基于极性转移和LSTM递归网络的情感分析[J].中文信息学报,2015,29(5):152-159. 被引量：91
6蔡国永,夏彬彬.基于卷积神经网络的图文融合媒体情感预测[J].计算机应用,2016,36(2):428-431. 被引量：27
7王科,夏睿.情感词典自动构建方法综述[J].自动化学报,2016,42(4):495-511. 被引量：76
8李冬白,田生伟,禹龙,艾斯卡尔.艾木都拉,吐尔根.依布拉音.深度学习的维吾尔语语句隐式情感分类[J].计算机工程与设计,2016,37(9):2577-2580. 被引量：5
9王兆凯,李亚星,冯旭鹏,刘利军,黄青松,刘晓梅.基于深度信念网络的个性化信息推荐[J].计算机工程,2016,42(10):201-206. 被引量：5
10寇凯,陈芳,李云鹏,王明明.基于深度学习与集成方法的情感分析研究[J].电脑编程技巧与维护,2016(21):37-37.

同被引文献564

1胡云青,邱清盈,余秀,武建伟.基于改进三体训练法的半监督专利文本分类方法[J].浙江大学学报（工学版）,2020,54(2):331-339. 被引量：10
2余本功,曹雨蒙,陈杨楠,杨颖.基于nLD-SVM-RF的短文本分类研究[J].数据分析与知识发现,2020,4(1):111-120. 被引量：11
3余本功,许庆堂,张培行.基于MAC-LSTM的问题分类研究[J].计算机应用研究,2020,37(1):40-43. 被引量：15
4丁俊良.英汉语言幽默表达的类似特点[J].河南大学学报（社会科学版）,1995,35(1):77-81. 被引量：2
5张珊,于留宝,胡长军.基于表情图片与情感词的中文微博情感分析[J].计算机科学,2012,39(S3):146-148. 被引量：55
6黄晓斌,邱明辉.网络信息过滤系统研究[J].情报学报,2004,23(3):326-332. 被引量：24
7孙茂松,邹嘉彦.汉语自动分词研究评述[J].当代语言学,2001,3(1):22-32. 被引量：102
8胡于进,周小玲,凌玲,王学林.基于向量空间模型的贝叶斯文本分类方法[J].计算机与数字工程,2004,32(6):28-30. 被引量：7
9吴勇.试析幽默语言的模糊性[J].西南民族大学学报（人文社会科学版）,2004,25(12):484-487. 被引量：8
10寇莎莎,魏振军.K-最近邻的改进及其在文本分类中的应用[J].河南师范大学学报（自然科学版）,2005,33(3):134-136. 被引量：7

引证文献98

1刘建友.基于神经网络的搜索引擎模型构建研究[J].网络安全技术与应用,2020,0(2):39-40.
2卢辉鸿,马平,王肖.基于BERT-CLS-ATT模型的虚拟主播评论情感分类算法[J].中国人民公安大学学报（自然科学版）,2024,30(1):74-80.
3欧阳焱,刘光大,杨昌智.空调水泵节能运行设计探讨[J].工程设计与研究（长沙）,2000(1):25-28. 被引量：1
4闫龙川,白东霞,刘万涛,刘殷,李莉敏.人工智能技术在云计算数据中心能量管理中的应用与展望[J].中国电机工程学报,2019,39(1):31-42. 被引量：38
5王林,李昀泽.情感倾向分析在舆情监控方面的研究[J].微型机与应用,2017,36(5):11-13. 被引量：3
6黄发良,冯时,王大玲,于戈.基于多特征融合的微博主题情感挖掘[J].计算机学报,2017,40(4):872-888. 被引量：63
7顾斌,彭涛,车伟.基于词典扩充的电力客服工单情感倾向性分析[J].现代电子技术,2017,40(11):163-166. 被引量：6
8安璐,吴林.融合主题与情感特征的突发事件微博舆情演化分析[J].图书情报工作,2017,61(15):120-129. 被引量：116
9朱岩,刘扬,李丹丹,时鹏.面向舆情的社交媒体文本倾向性分析[J].信息安全研究,2017,3(9):781-794.
10奠雨洁,金琴,吴慧敏.基于多文本特征融合的中文微博的立场检测[J].计算机工程与应用,2017,53(21):77-84. 被引量：25

二级引证文献1062

1陈欣,杨小兵,姚雨虹.基于BLSTM算法和字词融合的文本情感分类方法[J].中国计量大学学报,2020(2):225-232. 被引量：3
2师庆科,郑涛.大型三甲医院患者智能随访语音平台设计与应用[J].中国数字医学,2021,16(8):22-27. 被引量：16
3李静.中国突发事件中网民群体情绪研究的知识图谱分析[J].新媒体与社会,2022(1):329-346.
4王姝雅,张博.基于生命周期理论的舆情演化研究综述[J].新媒体研究,2022,8(23):6-10. 被引量：1
5王璐瑶,曾平飞,康春花.基于微博平台的突发公共卫生事件下公众应激反应探究[J].心理月刊,2024(21):64-67.
6朱琳,马佳良.小镇青年的网络舆情生成及演化路径研究——基于微博数据的主题建模与情感分析[J].信息技术与管理应用,2023(4):105-119.
7王君泽,詹若贤,李怡,杜洪涛.融合主题与细粒度情感特征的气候变化微博舆情分析研究[J].信息技术与管理应用,2023(4):87-104. 被引量：1
8梁艳平,安璐,刘静.同类突发公共卫生事件微博话题共振研究[J].数据分析与知识发现,2020,4(2):122-133. 被引量：14
9余本功,曹雨蒙,陈杨楠,杨颖.基于nLD-SVM-RF的短文本分类研究[J].数据分析与知识发现,2020,4(1):111-120. 被引量：11
10唐红涛,余佳鹏,陈捷.文本分析视角下数字乡村政策量化研究——基于FastText和文本挖掘方法[J].知识管理论坛,2024(3):237-252. 被引量：1

1梁军,柴玉梅,原慧斌,昝红英,刘铭.基于深度学习的微博情感分析[J].中文信息学报,2014,28(5):155-161. 被引量：110
2何爱香.小“case”并非“小case”[J].考试周刊,2015,0(24):87-88.
3李毅,胡金凤,王正友.一种面向中文依赖语法的观点挖掘模型[J].河北省科学院学报,2014,31(2):11-17.
4赵新辉,郭瑞.基于数据挖掘技术的网络舆情智能监测与引导平台设计研究[J].电脑知识与技术,2012,8(1):1-2. 被引量：7
5刘小明,张英,郑秋生.基于卷积神经网络模型的互联网短文本情感分类[J].计算机与现代化,2017(4):73-77. 被引量：9
6王祖辉,姜维,李一军.在线评论情感分析中固定搭配特征提取方法研究[J].管理工程学报,2014,28(4):180-186. 被引量：26
7刘惠臻.评价文本的主要观点和基本倾向[J].中学生阅读（高中读写）,2012(3):53-56.
8中英文成语查询实用工具：英语成语速查手册[J].大众电脑,2004(11):97-97.
9谢军,刘群.依存树到串模型中引入双语短语的三种方法[J].中文信息学报,2014,28(2):44-50.
10王文林,席临平,高进龙,彭小梅.计算机应用于词频统计的算法研究[J].现代电子技术,2007,30(22):64-66. 被引量：2

中文信息学报

2015年第6期

浏览历史

内容加载中请稍等...

基于卷积神经网络的微博情感倾向性分析被引量：98

参考文献19

二级参考文献25

共引文献113

同被引文献564

引证文献98

二级引证文献1062

相关作者

相关机构

相关主题

浏览历史

基于卷积神经网络的微博情感倾向性分析 被引量：98

参考文献19

二级参考文献25

共引文献113

同被引文献564

引证文献98

二级引证文献1062

相关作者

相关机构

相关主题

浏览历史

基于卷积神经网络的微博情感倾向性分析被引量：98