期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
多特征融合的实体及多元关系联合抽取方法
1
作者 姚龙飞 段利国 +2 位作者 张虎 李爱萍 郝晓燕 《中文信息学报》 北大核心 2025年第9期81-90,共10页
从非结构化文本中高效率、高质量地抽取实体及关系,是处理大规模信息资源的关键。近年来的关系抽取主要集中于二元关系,无法抽取多元关系中时间、地点等补充槽属性及对应实体,且输入的特征不够丰富。为了解决上述问题,该文提出一个基于... 从非结构化文本中高效率、高质量地抽取实体及关系,是处理大规模信息资源的关键。近年来的关系抽取主要集中于二元关系,无法抽取多元关系中时间、地点等补充槽属性及对应实体,且输入的特征不够丰富。为了解决上述问题,该文提出一个基于注意力机制的多元关系联合抽取模型,融合字特征、词特征、实体对先验特征、实体类型特征等特征信息,使用改进的非自回归方法并行抽取二元关系,以级联方式抽取补充槽属性及对应实体,通过三元组特征融合加强补充槽实体与其他实体的联系,实现实体与多元关系的有效抽取。在百度DuIE 2.0中文数据集上进行实验,结果表明模型可以有效提升二元关系及多元关系的抽取效果。 展开更多
关键词 关系抽取 联合抽取 多元关系 非自回归
在线阅读 下载PDF
基于双通道胶囊网络特征融合的中文隐式情感分析
2
作者 候晨蕾 段利国 +2 位作者 张虎 李爱萍 郝晓燕 《中文信息学报》 北大核心 2025年第8期117-127,共11页
文本情感分析作为自然语言处理的热门研究方向之一,在显式情感分析方面已取得了很多突破,而隐式情感方面的分析研究则相较缺乏。针对单一词向量输入无法充分表达文本语义的问题,该文采用CNN和BiLSTM混合神经网络提取文本的语义特征,同... 文本情感分析作为自然语言处理的热门研究方向之一,在显式情感分析方面已取得了很多突破,而隐式情感方面的分析研究则相较缺乏。针对单一词向量输入无法充分表达文本语义的问题,该文采用CNN和BiLSTM混合神经网络提取文本的语义特征,同时将字、词、语义不同层级的特征通过双通道胶囊网络(Capsule Network)进行自主学习,随后输入交互注意力层进行融合。由实验结果可知,该文提出的模型在SMP2019_ECISA数据集上的准确率为84.83%,macro-F1值为82.76%,同时在对比实验中也取得了较好的效果,充分体现了该文模型的有效性。 展开更多
关键词 中文隐式情感分析 双通道胶囊网络 多层级特征融合 RoBERTa
在线阅读 下载PDF
基于ID-BOPM的中文成语机器阅读理解
3
作者 乔永禄 段利国 +2 位作者 张虎 李爱萍 郝晓燕 《中文信息学报》 北大核心 2025年第9期116-125,共10页
机器阅读理解要求机器根据给定的上下文回答问题,但中文成语特殊的结构对机器阅读理解提出了独特的挑战。以往的成语语义表示方法不能很好地获取到成语准确的语义表示,该文提出一种基于成语语义释义来构建辅助数据集帮助模型更好地理解... 机器阅读理解要求机器根据给定的上下文回答问题,但中文成语特殊的结构对机器阅读理解提出了独特的挑战。以往的成语语义表示方法不能很好地获取到成语准确的语义表示,该文提出一种基于成语语义释义来构建辅助数据集帮助模型更好地理解成语语义的方法,在此基础上,使用BERT作为预训练模型,结合双向匹配策略建模完形填空题型中填空部分和候选项之间的关系表征,然后再进一步获取其与文档的关系表征。该文模型ID-BOPM(Idiom Dictionary and Blank-Option-Passage Matching)在大规模中文成语完形填空数据集ChID上进行了实验。结果表明,该方法有助于模型更好地理解中文成语语义,取得较好的效果。 展开更多
关键词 机器阅读理解 中文成语语义表示 双向表示
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部