期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于汉字多模信息与象形视觉对齐增强的古籍文本命名实体识别研究
1
作者 郑旭辉 王昊 裘靖文 《情报学报》 北大核心 2025年第4期452-465,共14页
古籍的语义解析与人文计算是建设文化强国的重要组成部分,而古籍文本命名实体识别(named entity recognition,NER)是开展后续古籍知识发现与组织的前提和基础,设计一种适用于简体化文言文特性的命名实体识别模型具有重要的研究意义。汉... 古籍的语义解析与人文计算是建设文化强国的重要组成部分,而古籍文本命名实体识别(named entity recognition,NER)是开展后续古籍知识发现与组织的前提和基础,设计一种适用于简体化文言文特性的命名实体识别模型具有重要的研究意义。汉字本身具有大量象形特征的视觉信息与发音信息,这些更贴合汉字发展历史的知识能够为识别古籍中的实体提供更多的信息以提高模型性能。基于此,本文构建了基于多模态汉字象形表示的GMAE-NER(guwen multi-information alignment enhanced NER)模型,该模型创新性地提出了汉字象形层面里图像与笔画信息的多模态特征处理和对齐方法,实现了将BERT(bidirectional encoder representations from transformers)表征与汉字视觉信息、发音信息相融合,有效增强了古籍文本命名实体识别的效果。本文将模型在纪传体史书《后汉书》上进行了大量的实验与对比,发现相较于基线模型,GMAE-NER在各个类别实体识别的F1指标上均得到了1.32~15.00个百分点的提升,并且能更好地识别出古籍文本中重叠表述的实体,消融分析结果也充分证明了该模型中视觉编码、发音编码与特征融合模块的有效性。 展开更多
关键词 古籍文本 中文命名实体识别 汉字字形 汉字发音 跨模态交互融合
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部