基于神经网络的中文谓语动词识别研究被引量：8

Research on Chinese Predicate Verb Recognition Based on Neural Network

在线阅读下载PDF

导出

摘要识别谓语动词是理解句子的关键。由于中文谓语动词结构复杂、使用灵活、形式多变,识别谓语动词在中文自然语言处理中是一项具有挑战的任务。本文从信息抽取角度,介绍了与中文谓语动词识别相关的概念,提出了一种针对中文谓语动词标注方法。在此基础上,研究了一种基于Attentional-BiLSTM-CRF神经网络的中文谓语动词识别方法。该方法通过双向递归神经网络获取句子内部的依赖关系,然后用注意力机制建模句子的焦点角色。最后通过条件随机场(Conditional random field,CRF)层返回一条最大化的标注路径。此外,为解决谓语动词输出唯一性的问题,提出了一种基于卷积神经网络的谓语动词唯一性识别模型。通过实验,该算法超出传统的序列标注模型CRF,在本文标注的中文谓语动词数据上到达76.75%的F值。 Recognizing predicate verbs is the key to understanding sentences.Because Chinese predicate verbs are complex in structure,flexible in use,and changeable in form,identifying predicate verbs is a challenging task in Chinese natural language processing.This article introduces the concepts related to the recognition of Chinese predicate verbs from the perspective of information extraction,and proposes a method for marking Chinese predicate verbs.On this basis,a Chinese predicate verb recognition method based on Attentional-BiLSTM-CRF neural network is studied.This method uses the bidirectional recurrent neural network to obtain the dependency relationship within the sentence,and then uses the attention mechanism to model the focus role of the sentence.Finally,a maximized labeling path through the conditional random field(CRF)layer is returned.In addition,in order to solve the problem of the uniqueness of predicate verb output,a unique recognition model of predicate verb based on convolutional neural network is proposed.Through experiments,the algorithm exceeds the traditional sequence labeling model CRF,and reaches an F value of 76.75%on the Chinese predicate verb data labeled in this paper.

作者李婷秦永彬黄瑞章程欣宇陈艳平 LI Ting;QIN Yongbin;HUANG Ruizhang;CHENG Xinyu;CHEN Yanping(College of Computer Science and Technology,Guizhou University,Guiyang,550025,China;Laboratory of Data Fusion and Analysis Application(Guizhou University),Guiyang,550025,China;Guizhou Intelligent Human‐Computer Interaction Engineering Technology Research Center,Guiyang,550025,China)

机构地区贵州大学计算机科学与技术学院数据融合与分析应用实验室(贵州大学) 贵州省智能人机交互工程技术研究中心

出处《数据采集与处理》 CSCD 北大核心 2020年第3期582-590,共9页 Journal of Data Acquisition and Processing

基金国家自然科学基金联合基金重点(U1836205)资助项目国家自然科学基金重大研究计划(91746116)资助项目贵州省科技重大专项计划(黔科合重大专项字[2017]3002)资助项目贵州省科学技术基金重点(黔科合基础[2020]1Z055)资助项目。

关键词谓语动词识别神经网络中文信息抽取 predicate verb recognition neural networks Chinese information extraction

分类号 TP391 [自动化与计算机技术—计算机应用技术]

作者简介李婷(1995‐),女,硕士研究生,研究方向:自然语言处理、数据融合分析,E‐mail:krystal951028@163.com。;秦永彬(1980‐),男,博士,教授,研究方向:大数据治理与应用、多源数据融合与应用和企业信息化与电子政务。;黄瑞章(1979‐),女,博士,副教授,研究方向:数据融合分析、文本挖掘、网络挖掘和知识发现。;程欣宇(1978‐),男,硕士,副教授,研究方向:机器学习、机器视觉、软件工程与网络通信。;陈艳平(1980‐),男,博士,副教授,研究方向:数据融合分析、自然语言处理和知识发现。

引文网络
相关文献

参考文献5

1汪红林,王红玲,周国栋.语义分析中谓词标识的特征工程[J].计算机工程与应用,2010,46(9):134-137. 被引量：7
2李国臣,孟静.利用主语和谓语的句法关系识别谓语中心词[J].中文信息学报,2005,19(1):1-7. 被引量：11
3龚小谨,罗振声,骆卫华.汉语句子谓语中心词的自动识别[J].中文信息学报,2003,17(2):7-13. 被引量：18
4罗振声,郑碧霞.汉语句型自动分析和分布统计算法与策略的研究[J].中文信息学报,1994,8(2):1-19. 被引量：21
5穗志方,俞士汶.面向EBMT的汉语单句谓语中心词识别研究[J].中文信息学报,1998,12(4):39-46. 被引量：18

二级参考文献29

1何一薇.试析汉语动词作谓语应具备的条件[J].浙江师范大学学报（社会科学版）,1997,23(2):40-43. 被引量：2
2罗振声,郑碧霞.汉语句型自动分析和分布统计算法与策略的研究[J].中文信息学报,1994,8(2):1-19. 被引量：21
3罗振声孙长健孙才.汉语句型成分自动分析中谓语识别策略的研究[A]..计算语言学进展与应用[C].清华大学出版社,1995.159-164.
4Lluis X,Marquez LA joint model for parsing syntactic and semantic dependencies[C]//Proceedings of the 12th Conference on Computational Natural Language Learning, Manchester, 2008 :188-192.
5Wang Hong-ling,Wang Hong-lin,Zhou Guo-dong.Dependeucy treebased SRL with proper pruning and extensive feature engineering[C]// Proceedings of the 12th Conference on Computational Natural Language Learuing, Manchester, 2008: 253-257.
6Yuret D,Yatbaz M A,Ural A E.Diseriminative vs generative approaches in semantic role labeling[C]//Proceedings of the 12th Conference on Computational Natural Language Learning,Manchester, 2008 : 223-227.
7Ciaramita M,Attardi G,Dell'Orletta F.DeSRL:A linear-time semantic role labeling system[C]//Proceedings of the 12th Conference on Computational Natural Language Learnlng,Manchester,2008: 258-262.
8Che Wan-xiang,Li Zheng-hua,Hu Yu-xuan,et al.A cascaded syntactic and semantic dependency parsing system[C]//Proceedings of the 12th Conference on Computational Natural Language Learning, Manchester, 2008 : 238-242.
9Morante R,Daelemans W,Van Asch V.A combined memory-based semantic role labeler of English[C]//Proceedings of the 12th Conference on Computational Natural Language Learning,Manchester,2008: 208-212.
10Watanabe Y,Iwatate M,Asahara M,et al.A pipeline approach for syntactic and semantic dependency parsing[C]//Proceedings of the 12th Conference on Computational Natural Language Learning,Manchester, 2008 : 228-232.

共引文献48

1祖漪清.实现语音数据库科学性的重要环节——篇章断句与连续语音的韵律结构[J].语言文字应用,1998(1):95-99. 被引量：6
2林贤明,李堂秋,史晓东.基于模板的机器翻译系统中模板库的自动构建技术[J].计算机应用,2004,24(9):127-128. 被引量：4
3郭艳华,周昌乐.一种汉语语句依存关系网协动生成方法研究[J].杭州电子工业学院学报,2000,20(4):24-32. 被引量：11
4李国臣,孟静.利用主语和谓语的句法关系识别谓语中心词[J].中文信息学报,2005,19(1):1-7. 被引量：11
5李向阳 ,张亚非 .基于语义搭配的汉语短语界定研究[J].情报学报,2005,24(1):100-106. 被引量：1
6詹卫东.80年代以来汉语信息处理研究述评──作为现代汉语语法研究的应用背景之一[J].当代语言学,2000,2(2):63-73. 被引量：13
7薛永增,杨沐昀,赵铁军,韩习武,齐浩亮.面向体育领域的句子主干翻译技术研究[J].中文信息学报,2005,19(5):24-30. 被引量：1
8白菊平.探讨提高中文文献信息检索质量的相关技术[J].农业图书情报学刊,2005,17(12):119-120. 被引量：1
9张建莉.基于特征词驱动的带“的”字名词短语的识别[J].福建电脑,2006,22(5):70-71.
10封春升,郝爱民.基于模式匹配的自然语言识别[J].计算机工程与应用,2006,42(19):144-146. 被引量：8

同被引文献52

1李国臣,孟静.利用主语和谓语的句法关系识别谓语中心词[J].中文信息学报,2005,19(1):1-7. 被引量：11
2罗振声,郑碧霞.汉语句型自动分析和分布统计算法与策略的研究[J].中文信息学报,1994,8(2):1-19. 被引量：21
3谌志群.汉语句子谓词的自动识别方法研究[J].计算机工程与应用,2007,43(17):176-178. 被引量：1
4穗志方,俞士汶.汉语单句谓语中心词识别知识的获取及应用[J].北京大学学报（自然科学版）,1998,34(2):221-230. 被引量：17
5穗志方,俞士汶.面向EBMT的汉语单句谓语中心词识别研究[J].中文信息学报,1998,12(4):39-46. 被引量：18
6汪红林,王红玲,周国栋.语义分析中谓词标识的特征工程[J].计算机工程与应用,2010,46(9):134-137. 被引量：7
7张宜浩,金澎.谓词自动识别中的特征选择度量研究[J].计算机工程与科学,2012,34(9):188-192. 被引量：2
8邓一贵,伍玉英.基于文本内容的敏感词决策树信息过滤算法[J].计算机工程,2014,40(9):300-304. 被引量：33
9韩磊,罗森林,潘丽敏,魏超.融合词法和句法特征的汉语谓词高精度识别方法[J].浙江大学学报（工学版）,2014,48(12):2107-2114. 被引量：5
10王瑞波,李济洪,李国臣,杨耀文.基于Dropout正则化的汉语框架语义角色识别[J].中文信息学报,2017,31(1):147-154. 被引量：17

引证文献8

1黄瑞章,靳文繁,陈艳平,秦永彬,郑庆华.基于Highway-BiLSTM网络的汉语谓语中心词识别研究[J].通信学报,2021,42(1):100-107. 被引量：4
2孙倩,秦永彬,黄瑞章,刘丽娟,陈艳平.结合案件要素序列的罪名预测方法[J].大数据,2021,7(6):30-40. 被引量：5
3贾阵,丁泽华,陈艳平,黄瑞章,秦永彬.面向司法数据的事件抽取方法研究[J].计算机工程与应用,2023,59(6):277-282. 被引量：4
4尚千壹,陈艳平,黄瑞章,秦永彬.基于回归的唯一谓语中心词识别[J].计算机工程与设计,2023,44(4):1213-1219. 被引量：1
5郭晓,陈艳平,唐瑞雪,黄瑞章,秦永彬.边界回归的谓语中心词识别[J].计算机工程与应用,2023,59(22):144-150. 被引量：1
6郭晓,陈艳平,唐瑞雪,黄瑞章,秦永彬.融合行为词的罪名预测多任务学习模型[J].计算机应用,2024,44(1):159-166.
7周军芽,吴进伟,吴广飞,张何为.基于Bi-LSTM神经网络的短文本敏感词识别方法[J].武汉理工大学学报（信息与管理工程版）,2024,46(2):312-316. 被引量：4
8施竣潇,陈艳平,穆肇南.融合多尺度跨度特征的谓语中心词识别模型[J].计算机工程,2024,50(10):137-144.

二级引证文献17

1尚千壹,陈艳平,黄瑞章,秦永彬.基于回归的唯一谓语中心词识别[J].计算机工程与设计,2023,44(4):1213-1219. 被引量：1
2赵伟,王文娟,甘玉芳.基于预训练模型和多视角循环神经网络的电力文本匹配模型[J].重庆邮电大学学报（自然科学版）,2023,35(3):545-553. 被引量：3
3陈彦杰,廖涛.基于图注意力网络的突发事件触发词抽取[J].现代计算机,2023,29(11):33-37.
4陈诺,李旭晖.一种基于模板提示学习的事件抽取方法[J].数据分析与知识发现,2023,7(6):86-98. 被引量：7
5郭晓,陈艳平,唐瑞雪,黄瑞章,秦永彬.边界回归的谓语中心词识别[J].计算机工程与应用,2023,59(22):144-150. 被引量：1
6郭晓,陈艳平,唐瑞雪,黄瑞章,秦永彬.融合行为词的罪名预测多任务学习模型[J].计算机应用,2024,44(1):159-166.
7王之原,张琛,胡叮叮.基于胶囊网络的多标签罪名预测[J].计算机仿真,2024,41(1):457-461.
8华斌,位梦涵.伤害类犯罪案由推理辅助决策方法研究与实践[J].数据分析与知识发现,2023,7(12):142-154.
9张小丽,黄辉,黄瑞章,秦永彬,陈艳平.基于多头指针的司法事件检测方法[J].广西科学,2024,31(2):335-345.
10沈晨晨,岳圣斌,刘书隽,周宇轩,王思远,陈伟,萧尧,李秉轩,宋鋆,沈晓宇,黄萱菁,魏忠钰.面向法律领域的大模型微调与应用[J].大数据,2024,10(5):11-27. 被引量：4

1张璞,陈韬,陈超,王永.基于深度学习的中文微博评价对象抽取方法[J].计算机工程与设计,2018,39(8):2638-2642. 被引量：2
2李京谕,冯洋.基于联合注意力机制的篇章级机器翻译[J].中文信息学报,2019,33(12):45-53. 被引量：6
3陈琳.基于智慧协同网络的多源协作传输控制机制建模及设计[J].自动化技术与应用,2020,39(4):92-94. 被引量：2
4胡晓辉,朱志祥.基于深度学习的中文分词方法研究[J].计算机与数字工程,2020,48(3):627-632. 被引量：8
5李依依,王继龙.自注意力机制的视频摘要模型[J].计算机辅助设计与图形学学报,2020,32(4):652-659. 被引量：7
6吾买尔江·买买提明,古丽尼格尔·阿不都外力,买合木提·买买提,卡哈尔江·阿比的热西提,吐尔根·依布拉音.乌兹别克语词干提取算法的比较研究[J].中文信息学报,2020,34(1):45-50. 被引量：2
7王旭阳,朱鹏飞.融合多类别基分类器的序列标注算法[J].传感器与微系统,2020,39(6):148-150. 被引量：1
8王建成,徐扬,刘启元,吴良庆,李寿山.基于神经主题模型的对话情感分析[J].中文信息学报,2020,34(1):106-112. 被引量：11
9韩雪芹.句型教学策略初探[J].新作文（中小学教学研究）,2020,3(2):121-121.
10沈建新.阿基米德折弦定理的证明、推论及应用[J].中学生数学,2020,0(6):9-11.

数据采集与处理

2020年第3期

浏览历史

内容加载中请稍等...

基于神经网络的中文谓语动词识别研究被引量：8

参考文献5

二级参考文献29

共引文献48

同被引文献52

引证文献8

二级引证文献17

相关作者

相关机构

相关主题

浏览历史

基于神经网络的中文谓语动词识别研究 被引量：8

参考文献5

二级参考文献29

共引文献48

同被引文献52

引证文献8

二级引证文献17

相关作者

相关机构

相关主题

浏览历史

基于神经网络的中文谓语动词识别研究被引量：8