基于句法依赖规则和词性特征的情感词识别研究被引量：7

Research on Sentiment Words Recognition Based on Syntactic Dependency Rules and POS Characteristics

在线阅读下载PDF

导出

摘要 [目的/意义]针对传统的情感词词典构造方法对新词判断准确率不够理想,领域拓展性较差等问题,提出基于句法依赖规则和词性特征的情感词识别模型。[方法/过程]以京东商城iPhone 6s的商品评论为语料,通过使用Stanford Parser句法分析工具、情感种子词典、基于评论语料的人工标注情感词典、手机对象词典等外部数据,构建基于句法依赖规则以及词性特征的情感词识别模型。[结果/结论]实验表明,该模型能有效识别手机领域中的情感词,准确率达到84.89%,且无需人工干预。[局限]情感词识别匹配模型规模偏小,模型召回率仍有进一步提升的空间。此外实验只在手机领域下进行探究,并未涉及其他领域。 [Purpose/significance] Aiming at the problems that the traditional method for constructing the sentiment words dictionary has poor performances in new words recognition and field expansion,this paper proposes a sentiment words recognition model based on the syntactic dependence rules and part of speech（ POS） features. [Method/process] Using the product reviews of iPhone 6s in Jingdong Mall as the corpus,the paper constructs sentiment words recognition model based on syntactic dependency rules and POS characteristics through Stanford Parser parsing tools,sentiment seed dictionaries,artificial annotation sentiment dictionaries based on comment corpus,mobile object dictionaries and other external data. [Result/conclusion]Experiments show that the model can effectively identify the sentiment words in mobile phone,with an accuracy rate of 84.89% without any human intervention. [Limitations] Sentiment words recognition matching model is small in scale,and recall rate of the model still has room for further improvement. In addition,the experiment is conducted only on mobile phones and does not cover other fields.

作者邓淑卿李玩伟徐健

机构地区中山大学资讯管理学院北京京东尚科信息技术有限公司

出处《情报理论与实践》 CSSCI 北大核心 2018年第5期137-142,共6页 Information Studies:Theory & Application

基金国家社会科学基金项目"用户评论情感分析及其在竞争情报服务中的应用研究"的成果之一项目编号:11CTQ022

关键词句法依赖关系句法分析词性标注情感词识别 syntactic dependency rules syntactic analysis POS tag sentiment words recognition

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

作者简介邓淑卿（ORCID：0000-0003—2820-6898），女，1994年生，硕士生。研究方向：网络用户情感分析等。;李玩伟，男，1994年生。研究方向：电商搜索引擎优化，搜索意图识别等。;徐健（ORCID：0000-0003-4886-4708，通讯作者），男，1977年生，博士，副教授。研究方向：网络用户情感分析，数据驱动的知识发现等。

引文网络
相关文献

参考文献12

1杨立公,朱俭,汤世平.文本情感分析综述[J].计算机应用,2013,33(6):1574-1578. 被引量：133
2王科,夏睿.情感词典自动构建方法综述[J].自动化学报,2016,42(4):495-511. 被引量：80
3郗亚辉.产品评论中领域情感词典的构建[J].中文信息学报,2016,30(5):136-144. 被引量：24
4杨小平,张中夏,王良,张永俊,马奇凤,吴佳楠,张悦.基于Word2Vec的情感词典自动构建与优化[J].计算机科学,2017,44(1):42-47. 被引量：43
5张清亮,徐健.网络情感词自动识别方法研究[J].现代图书情报技术,2011(10):24-28. 被引量：12
6郭顺利,张向先.面向中文图书评论的情感词典构建方法研究[J].现代图书情报技术,2016(2):67-74. 被引量：24
7杨春明,张晖,何天翔,李波,赵旭剑.具有共现关系的中文褒贬词典构建[J].计算机工程与应用,2016,52(9):164-169. 被引量：3
8朱嫣岚,闵锦,周雅倩,黄萱菁,吴立德.基于HowNet的词汇语义倾向计算[J].中文信息学报,2006,20(1):14-20. 被引量：328
9杜丽萍,李晓戈,于根,刘春丽,刘睿.基于互信息改进算法的新词发现对中文分词系统改进[J].北京大学学报（自然科学版）,2016,52(1):35-40. 被引量：46
10陈小荷.自动分词中未登录词问题的一揽子解决方案[J].语言文字应用,1999(3):103-109. 被引量：26

二级参考文献227

1孙茂松,黄昌宁,高海燕,方捷.中文姓名的自动辨识[J].中文信息学报,1995,9(2):16-27. 被引量：88
2朱嫣岚,闵锦,周雅倩,黄萱菁,吴立德.基于HowNet的词汇语义倾向计算[J].中文信息学报,2006,20(1):14-20. 被引量：328
3刘华.一种快速获取领域新词语的新方法[J].中文信息学报,2006,20(5):17-23. 被引量：14
4何婷婷,张勇.基于质子串分解的中文术语自动抽取[J].计算机工程,2006,32(23):188-190. 被引量：21
5黄昌宁,赵海.中文分词十年回顾[J].中文信息学报,2007,21(3):8-19. 被引量：251
6Vasileios Hatzivassiloglou, Kathleen R. McKeown. Predicting the semantic orientation of adjectives[A]. In: Proceedings of the 35th Annual Meeting of the Association for Computational Linguistics and the 8th Conference of the European Chapter of the ACL[C], 1997:174- 181.
7Turney, Peter, Littman Michael. Measuring praise and criticism: Inference of semantic orientation from association[J]. ACM Transactions on Information Systems, 2003, 21(4): 315- 346.
8Turney ,Peter. Thumbs Up or Thumbs Down? Semantic Orientation Applied to Unsupervised Classification of Reviews[A]. In: Proceedings of the 40th Annual Meeting of the Association for Computational Linguistics[C]. 2002:417 -424.
9Bo Pang,Lillian Lee, Shivanathan Vaithyanathan. Thumbs up? Sentiment classification using machine learning techniques[A]. In Proceedings of the 2002 Conference on Empirical Methods in Natural Language Processing[C]. 2002:79 - 86.
10Bo Pang,Lillian Lee. Seeing Stars: Exploiting Class Relationships for Sentiment Categorizalion with respect to Rating Seales[A]. ACL2005, 115-124.

共引文献693

1孙星恺,王晓,陆浩.面向活动的网络媒体监测与建模分析:IVFC案例解析[J].智能科学与技术学报,2019,1(4):352-368. 被引量：1
2杜家驹,岂凡超,孙茂松,刘知远.基于局部语义相关性的定义文本义原预测[J].中文信息学报,2020(5):1-9. 被引量：4
3袁婷婷,杨文忠,仲丽君,张志豪,向进勇.基于性格的微博情感分析模型PLSTM[J].计算机应用研究,2020,37(2):342-346. 被引量：7
4那勇,李明全.基于深度学习的中文自动分词研究[J].吉林广播电视大学学报,2019(12):58-59.
5卢辉鸿,马平,王肖.基于BERT-CLS-ATT模型的虚拟主播评论情感分类算法[J].中国人民公安大学学报（自然科学版）,2024,30(1):74-80. 被引量：1
6周蕾,朱巧明,李培峰.一种基于统计和规则的未登录词识别方法[J].南京大学学报（自然科学版）,2005,41(z1):819-825. 被引量：1
7杨频,李涛,赵奎.一种网络舆情的定量分析方法[J].计算机应用研究,2009,26(3):1066-1068. 被引量：19
8申晓晔,封化民,毋非.基于语义的Web新闻内容倾向性分析框架[J].郑州大学学报（理学版）,2009,41(1):33-35.
9罗安,王勇,张福浩,刘纪平.基于角色标注的中文POI名称语义分类方法[J].测绘通报,2012(S1):521-524. 被引量：4
10李国林,万常选,边海容,杨莉,钟敏娟.基于语素的金融证劵域文本情感探测[J].计算机研究与发展,2011,48(S3):54-59. 被引量：8

同被引文献91

1白妙青,郑家恒.动词与动词搭配方法的研究[J].计算机工程与应用,2004,40(27):70-72. 被引量：3
2刘怀军,车万翔,刘挺.中文语义角色标注的特征工程[J].中文信息学报,2007,21(1):79-84. 被引量：39
3胡文敏,何婷婷,张勇.基于卡方检验的汉语术语抽取[J].计算机应用,2007,27(12):3019-3020. 被引量：14
4徐琳宏,林鸿飞,潘宇,任惠,陈建美.情感词汇本体的构造[J].情报学报,2008,27(2):180-185. 被引量：427
5王慧泽,龚声蓉,刘纯平.融合全局和局部特征的Fisherfaces方法[J].计算机工程与应用,2008,44(24):194-196. 被引量：3
6柳位平,朱艳辉,栗春亮,向华政,文志强.中文基础情感词词典构建方法研究[J].计算机应用,2009,29(10):2875-2877. 被引量：86
7韦小丽,孙涌,张书奎,苗艳军.基于最大熵模型的本体概念获取方法[J].计算机工程,2009,35(24):114-116. 被引量：17
8周浪,史树敏,冯冲,黄河燕.基于多策略融合的中文术语抽取方法[J].情报学报,2010,29(3):460-467. 被引量：28
9林自芳,蒋秀凤.基于词内部模式的新词识别[J].计算机与现代化,2010(11):162-164. 被引量：17
10吕耀怀,熊节春.信息隐私界定的BIT模式[J].图书馆理论与实践,2011(6):35-39. 被引量：2

引证文献7

1张志武,陈国兰.基于网络语料的特定领域情感词典生成方法研究[J].情报探索,2019(4):1-6.
2俞琰,陈磊,姜金德,赵乃瑄.基于依存句法分析的中文专利候选术语选取研究[J].图书情报工作,2019,63(18):109-118. 被引量：12
3王佳,张子杰,罗海吉,刘英豪,陈炜.基于泛在网络的大学生情绪语料库的构建[J].大学教育,2020,0(1):189-191. 被引量：1
4赵文宇,徐健.不同网络平台用户情感表达特征对比分析[J].情报理论与实践,2020,43(1):163-168. 被引量：6
5李长荣,纪雪梅.面向突发公共事件网络舆情分析的领域情感词典构建研究[J].数字图书馆论坛,2020(9):32-40. 被引量：19
6谭芳,杨阳,卓伊玲,徐健,肖卓.网络隐私争议事件中用户隐私关注及情感对比研究[J].图书情报工作,2021,65(2):87-97. 被引量：9
7郭羽婷,姚宣合.基于主题挖掘和情感分析的在线健康社区用户评论研究[J].现代情报,2025,45(8):135-145.

二级引证文献46

1李卫东,孙柯柯.智能终端操作系统的隐私关注边界研究[J].信息技术与管理应用,2023(2):53-73.
2余传明,王曼怡,安璐.跨语言情境下基于对抗的实体关系抽取模型研究[J].图书情报工作,2020,64(17):131-144. 被引量：1
3鲍阳,杨志斌,杨永强,谢健,周勇,岳涛,黄志球,郭鹏.基于限定中文自然语言需求的SysML模型自动生成方法[J].计算机研究与发展,2021,58(4):706-730. 被引量：3
4杨志斌,杨永强,袁胜浩,周勇,薛垒,程高辉.安全关键软件术语推荐和需求分类方法[J].计算机科学,2021,48(5):32-44. 被引量：3
5徐海燕,姜瑛.针对复杂用户评论的代码质量属性判断[J].软件学报,2021,32(7):2183-2203. 被引量：3
6贾若男,王晰巍,范晓春.社交网络用户个人信息安全隐私保护行为影响因素研究[J].现代情报,2021,41(9):105-114. 被引量：38
7罗俊杰,雷泽鑫,胡一可,王苗,曹磊.基于深度学习的城市公园游客情感倾向分析——以天津水上公园为例[J].中国园林,2021,37(9):65-70. 被引量：20
8杨晓琛.社交媒体的“隐私悖论”问题研究--以微信传播为例[J].新闻文化建设,2021(15):149-150. 被引量：4
9钟莉,郭艳平.我国突发公共事件研究(2003—2020年):热点与趋势——基于citespace知识图谱可视化分析[J].云南行政学院学报,2021,23(5):119-131. 被引量：6
10李丹.2020年我国图书馆学研究热点评述[J].山东图书馆学刊,2021(6):6-16. 被引量：1

1兰义湧,龙从军,赵小兵.基于条件随机场的藏文人名识别研究[J].中央民族大学学报（自然科学版）,2018,27(1):34-40. 被引量：2
2Sunghun Jo,Yuna Jeong,Sungkil Lee.GPU-Driven Scalable Parser for OBJ Models[J].Journal of Computer Science & Technology,2018,33(2):417-428. 被引量：1
3吴东明,王丽娟.基于MySQL的中文全文搜索研究[J].电脑知识与技术（过刊）,2017,23(11X):7-8. 被引量：1
4姜月,张高远.基于隐喻认知角度的“牛”的文化根源与词性演变初探[J].牡丹江大学学报,2018,27(5):19-21. 被引量：2
5罗玉萍,潘庆先,刘丽娜,张鲁华.基于情感挖掘的学生评教系统设计及其应用[J].中国电化教育,2018(4):91-95. 被引量：21
6贺国秀,张晓娟.查询意图自动分类的方法改进探讨[J].数字图书馆论坛,2018(1):53-60. 被引量：8
7何金金,郭振波,王开西.基于TextRank的网评产品特征提取方法[J].青岛大学学报（自然科学版）,2018,31(1):109-114. 被引量：4
8马慧杰.D-二聚体在急性主动脉夹层与急性心肌梗死早期鉴别中的应用[J].实用医技杂志,2018,25(4):358-359. 被引量：3
9Mingxin Wang,Ning Wang,Boran Wang,Can Tian,Yanchun Liang,Guozhong Zhao,Xiaosong Han.The BBC News Hunter:A Novel Crawler for BBC News[J].国际计算机前沿大会会议论文集,2016(2):63-64.
10张永祥,梁喜爱.吡多辛在精神发育迟滞中的临床应用[J].现代医学,1987,0(6):356-356.

情报理论与实践

2018年第5期

浏览历史

内容加载中请稍等...

基于句法依赖规则和词性特征的情感词识别研究被引量：7

参考文献12

二级参考文献227

共引文献693

同被引文献91

引证文献7

二级引证文献46

相关作者

相关机构

相关主题

浏览历史

基于句法依赖规则和词性特征的情感词识别研究 被引量：7

参考文献12

二级参考文献227

共引文献693

同被引文献91

引证文献7

二级引证文献46

相关作者

相关机构

相关主题

浏览历史

基于句法依赖规则和词性特征的情感词识别研究被引量：7