基于词嵌入和自注意力机制的方面提取算法被引量：1

Aspect extraction algorithm based on word embedding and self-attention mechanism

在线阅读下载PDF

导出

摘要方面提取是情感分析中的关键步骤,随着互联网的快速发展,短文本数据迅猛增加,对短文本数据加以整理和利用极为重要。本文针对短文本的特殊性,提出了短文本模型WESM。与现有模型不同的是,本文引入了词汇共现网络,丰富了词汇的上下文信息,针对中文数据,引入了cw2vec模型,能够充分利用中文词语的语义信息;为了提高短文本的上下文语义缺失,引入了自注意力机制,能够丰富模型的上下文语义信息,提高方面词汇权重,在词汇聚类过程中,降低了非方面词汇的影响。相较于传统方面提取算法性能有着显著的提升。 Aspect extraction is a key step in sentiment analysis tasks.With the rapid development of the Internet,the data of short has increased rapidly,and it is important to organize and make use of those.The main work of this paper is as follows:For the particularity of short text,this paper proposes a short text model WESM.Different from the existing models,this paper introduces a vocabulary co-occurrence network to enrich the context information of the vocabulary.As for Chinese data,the cw2vec model has been introduced,which will make full use of the context semantic information;in order to improve the lack of contextual semantics of short texts,this paper introduces a self-attention mechanism,which can enrich the contextual semantic information of the model and increase the weight of the terms.In the process of clustering,the influence of non-aspect words is reduced.Compared with the traditional extraction algorithm,the performance has been significantly improved.

作者吴杭鑫张云华 WU Hangxin;ZHANG Yunhua(School of Information,Zhejiang Sci-Tech University,Hangzhou 310018,China)

机构地区浙江理工大学信息学院

出处《智能计算机与应用》 2021年第4期25-29,共5页 Intelligent Computer and Applications

关键词方面提取词嵌入自注意力机制 Aspect extraction Word embedding Self-attention mechanism

分类号 TP391 [自动化与计算机技术—计算机应用技术]

作者简介吴杭鑫(1994-),男,硕士研究生,主要研究方向:智能信息处理;张云华(1965-),男,博士,教授,硕士生导师,主要研究方向:软件架构、软件工厂、智能信息处理

引文网络
相关文献

参考文献3

1刘鸿宇,赵妍妍,秦兵,刘挺.评价对象抽取及其倾向性分析[J].中文信息学报,2010,24(1):84-88. 被引量：101
2郎君,忻舟,秦兵,刘挺,李生.集成多种背景语义知识的共指消解[J].中文信息学报,2009,23(3):3-9. 被引量：8
3徐冰,赵铁军,王山雨,郑德权.基于浅层句法特征的评价对象抽取研究[J].自动化学报,2011,37(10):1241-1247. 被引量：49

二级参考文献20

1张钹.自然语言处理的计算模型[J].中文信息学报,2007,21(3):3-7. 被引量：18
2姚天昉,聂青阳,李建超,李林琳,陈柯,付宁.一个用于汉语汽车评论的意见挖掘系统[C]//中文信息处理前沿进展-中国中文信息学会二十五周年学术会议论文集.北京:清华大学出版社,2006:260-281.
3Jun Lang, Bing Qin, Ting Liu, Sheng Li. 2007. Intra-doeument Coreference Resolution: The state of the art[J]. Journal of Chinese Language and Computing, 17 (4):227-253.
4Ponzetto, Simone Paolo and Michael Strube. 2006. Exploiting Semantic Role Labeling, WordNet and Wikipedia for Coreference Resolution. [C]//Proceedings of the Human Language Technology Conference of the NAACL, Main Conference 2006.
5David L. Bean and Ellen Riloff. 2004. Unsupervised Learning of Contextual Role Knowledge for Coreference Resolution. [C]//Proceedings of HLT-NAACL 2004.
6X. Luo. 2005. On coreference resolution performance metrics.[C]//Proc. of the conference on Human Language Technology and Empirical Methods in Natural Language Processing. Vancouver, British Columbia, Canada: Association for Computational Linguistics, 25-32.
7Xiaofeng Yang and Jian Su. 2007. Coreference Resolution Using Semantic Relatedness Information From Automatically Discovered Patterns. [C]//Proceedings of ACL 2007.
8J. McCarthy and W. Lehnert. 1995. Using decision trees for coreference resolution. In: C.R. Perrault ed. [C]//Proc. of the Fourteenth International Joint Conference on Artificial Intelligence. Ou bec, Canada: Springer, 1050-1055.
9Kohavi, R., G. H. John. 1997. Wrappers for feature subset selection[J]. Artificial Intelligence Journal. 97 (1-2): 273 - 324.
10Soon, W. M., H. T. Ng, D. C. Y. Lim. 2001. A machine learning approach to coreference resolution of noun phrases [J]. Computational Linguistics, 27(4) : 521 -544.

共引文献141

1马建红,杨青云.针对专利背景技术的信息三元组抽取方法[J].计算机应用研究,2020,37(S01):247-249. 被引量：2
2赵妍妍,秦兵,刘挺.文本情感分析[J].软件学报,2010,21(8):1834-1848. 被引量：558
3文能,丁晟春.商品主观评论信息的倾向性分析综述[J].情报杂志,2010,29(12):70-74. 被引量：2
4张牧宇,黎耀炳,秦兵,刘挺.基于中心语匹配的共指消解[J].中文信息学报,2011,25(3):3-8. 被引量：5
5张莉,钱玲飞,许鑫.基于核心句及句法关系的评价对象抽取[J].中文信息学报,2011,25(3):23-29. 被引量：22
6徐冰,赵铁军,王山雨,郑德权.基于浅层句法特征的评价对象抽取研究[J].自动化学报,2011,37(10):1241-1247. 被引量：49
7魏韡,向阳,陈千.中文文本情感分析综述[J].计算机应用,2011,31(12):3321-3323. 被引量：71
8邱云飞,王雪,邵良杉.基于中文网络客户评论的消费者行为分析方法[J].现代情报,2012,32(1):8-11. 被引量：6
9王素格,吴苏红.基于依存关系的旅游景点评论的特征-观点对抽取[J].中文信息学报,2012,26(3):116-121. 被引量：17
10苏艳,居胜峰,王中卿,李寿山,周国栋.基于随机特征子空间的半监督情感分类方法研究[J].中文信息学报,2012,26(4):85-90. 被引量：16

同被引文献4

1陈苹,冯林.情感分析中的方面提取综述[J].计算机应用,2018,38(A02):84-88. 被引量：16
2徐福,黄贤英,蒋兴渝,彭竞瑶.用于方面提取的多元关系协作学习模型[J].计算机应用研究,2021,38(8):2328-2333. 被引量：2
3赵丽华,王春立,初钰凤.基于注意力双层BiReGU模型的方面术语提取方法[J].计算机工程与应用,2021,57(22):160-165. 被引量：3
4汪兰兰,姚春龙,李旭,于晓强.结合依存句法分析与交互注意力机制的隐式方面提取[J].计算机应用研究,2022,39(1):37-42. 被引量：6

引证文献1

1付朝燕,黄贤英,邹世豪.融合句法结构和语义信息增强的方面提取方法[J].中文信息学报,2025,39(4):150-160.

1王婷,吴必虎.基于关键词共现和社会网络分析的北京城市歌曲中地方意象特征研究[J].人文地理,2020,35(6):57-65. 被引量：21
2刘通,杨敬成.基于信号传播算法的在线医疗咨询反馈内容评估方法[J].数据分析与知识发现,2017,1(11):29-36. 被引量：2
3侯婕.清乾隆年間四庫館校勘《禮記注疏》始末探析[J].版本目录学研究,2021(1):235-247.
4刘振华,苏立伟,苏华权.自然语言处理技术下电网敏感客户画像多特征提取方法[J].电网与清洁能源,2021,37(6):60-67. 被引量：8
5李碧秋,王佳斌,刘雪丽.基于语义相似的中文数据清洗方法[J].现代计算机,2021,27(19):58-61. 被引量：2
6陆丁天,张志远.情感子句预测与原因子句提取方法[J].计算机工程与设计,2021,42(8):2381-2386. 被引量：1
7李铮,陈莉,张爽.基于ELMo和Bi-SAN的中文文本情感分析[J].计算机应用研究,2021,38(8):2303-2307. 被引量：12
8黄名选.关联模式挖掘与词向量学习融合的伪相关反馈查询扩展[J].电子学报,2021,49(7):1305-1313. 被引量：5
9周润,滕奇志.基于改进DBSCAN算法的金相图像晶粒聚集检测方法[J].智能计算机与应用,2021,11(4):44-48. 被引量：1
10范九伦,高梦飞,于海燕,陈斌斌.基于半监督信息的截集式可能性C-均值聚类算法[J].电子与信息学报,2021,43(8):2378-2385. 被引量：5

智能计算机与应用

2021年第4期

浏览历史

内容加载中请稍等...

基于词嵌入和自注意力机制的方面提取算法被引量：1

参考文献3

二级参考文献20

共引文献141

同被引文献4

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于词嵌入和自注意力机制的方面提取算法 被引量：1

参考文献3

二级参考文献20

共引文献141

同被引文献4

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于词嵌入和自注意力机制的方面提取算法被引量：1