-
题名基于平面化句子表示提升关系抽取性能
- 1
-
-
作者
王昊
陈艳平
黄瑞章
秦永彬
-
机构
贵州大学文本计算与认知智能教育部工程研究中心
贵州大学公共大数据国家重点实验室
贵州大学计算机科学与技术学院
-
出处
《计算机工程与应用》
北大核心
2025年第16期171-178,共8页
-
基金
贵州省科学技术基金重点资助项目([2024]003)
国家自然科学基金(62066007,62066008)
国家重点研发计划(2023YFC3304500)。
-
文摘
关系抽取旨在识别句子中命名实体之间的关系。上下文语境决定了命名实体间的真实关系,因此研究者们期望模型能够正确识别上下文语境中反映的实体语义关系。然而,现有的关系抽取模型在很大程度上倾向于对实体名称模式的记忆,即通过学习和匹配特定实体名称组合来推断关系,而非基于上下文信息进行关系判断。这种对上下文信息的忽视可能导致模型在面对复杂语境、多义实体或罕见关系表达时,其预测性能受到限制,无法达到理想状态下的高精度与强泛化。为了解决这一问题,通过将输入文本转化为抽象的语义平面,并直接基于整个语义平面的信息进行关系判断,从而强制模型在预测实体间关系时考虑上下文信息。实验证明,该方法在中文文学文本语料、ACE05英文和SemEval-2010 Task-8三个数据集上的F1分数分别超过之前的相关研究1.9、1.03和0.39个百分点,有效提高了模型对上下文信息的利用程度和对复杂文本中实体关系的理解深度。
-
关键词
关系抽取
语义平面
实体偏差
平面化句子表示
-
Keywords
relation extraction
semantic plane
entity bias
planarized sentence representation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名结合二维增强融合机制的事件论元抽取方法
- 2
-
-
作者
王潞翔
陈艳平
黄辉
黄瑞章
秦永彬
-
机构
贵州大学计算机科学与技术学院文本计算与认知智能教育部工程研究中心
贵州大学公共大数据国家重点实验室
-
出处
《计算机工程与应用》
北大核心
2025年第10期111-119,共9页
-
基金
国家重点研发计划(2023YFC3304500)
国家自然科学基金(62166007)。
-
文摘
针对现有的事件论元抽取研究中触发词和论元间缺少交互以及通道内部缺少交互的问题,提出结合二维增强融合机制的事件论元抽取模型(two-dimensional enhanced fusion mechanism for event argument extraction,W2-ARG)。在句子中的触发词两边插入标识符,引入事件类型信息的同时增强触发词和论元的交互,并单独编码触发词以突出其在句子中的语义信息。将论元抽取建模为二维化表示的标签预测,通过膨胀卷积捕获不同距离的单词的语义交互。使用通道注意力模块增强通道内部的交互,以强化通道内的信息传递。最后利用拉普拉斯算子来突出事件论元在语义空间中的位置特征,提升模型对事件论元的识别精度。模型在ACE05-EN、ERE-EN数据集上进行了实验,实验结果表明该方法的性能相较其他基于分类的事件论元抽取方法提升明显。
-
关键词
事件论元抽取
句子平面化表示
通道注意力
拉普拉斯算子
BERT
-
Keywords
event argument extraction
sentence planarization representation
channel attention
Laplace operator
BERT
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名多尺度语义收敛差分算子的命名实体识别方法
- 3
-
-
作者
杨采薇
陈艳平
秦永彬
黄瑞章
-
机构
贵州大学文本计算与认知智能教育部工程研究中心
贵州大学公共大数据国家重点实验室
贵州大学计算机科学与技术学院
-
出处
《中文信息学报》
北大核心
2025年第6期99-109,118,共12页
-
基金
国家自然科学基金(62166007)
贵州省科技支撑计划项目(黔科合支撑[2022]一般277)。
-
文摘
平面化句子表示是将传统的一维句子向量映射到二维的语义平面,其中每个单元代表了一个跨度,并与邻近的单元共享上下文语义,这会导致具有真实语义的跨度单元存在语义扩散到相邻单元导致语义混淆的问题。基于此,该文提出多尺度语义收敛差分算子的命名实体识别方法。首先利用预训练模型将句子表示为包含上下文信息的字符嵌入向量;其次通过多头双仿射将字符嵌入向量映射为平面化句子表示,平面化句子表示中的每个单元代表所包含的跨度信息;然后,采用差分信息来表征跨度单元的上下文语义突变及细节特征,从而聚合语义强度和梯度信息;最后,通过解码器识别实体类型。该模型在嵌套实体ACE2005英文、中文数据集和扁平实体CoNLL2003数据集上进行实验,F_(1)值分别达到了86.85%,89.43%和93.05%。实验结果表明,与其他现有主流模型相比,该模型能更好地识别命名实体。
-
关键词
命名实体识别
平面化句子表示
差分卷积
收敛实体语义
-
Keywords
named entity recognition
planarized sentence representation
differential convolution
convergent entity semantics
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-