期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于多层知识感知的地址实体识别方法
1
作者 邵文远 王长征 +4 位作者 苏雪峰 闫智超 张广军 张越 李茹 《中文信息学报》 北大核心 2025年第6期110-118,共9页
地址实体识别旨在基于给定的地址文本识别出地址相关的实体,并判断每个地址实体的类别。现有模型未考虑地址的多义性和歧义性,这会引发实体边界问题和类型问题。因此,该文提出了一种基于多层知识感知的地址实体识别方法。首先,编码层通... 地址实体识别旨在基于给定的地址文本识别出地址相关的实体,并判断每个地址实体的类别。现有模型未考虑地址的多义性和歧义性,这会引发实体边界问题和类型问题。因此,该文提出了一种基于多层知识感知的地址实体识别方法。首先,编码层通过知识嵌入的方法将句子知识融入BERT Transformer的前馈神经网络中,得到融合序列和句子知识的联合特征表示,缓解了类型问题对模型性能的影响;其次,通过词汇知识融合层将词汇知识与联合特征表示融合,增强了地址实体边界的表示能力。此外,通过语义相似度计算和注意力机制避免了引入知识可能带来的噪声问题。在CCKS2021地址要素解析数据集上的实验结果表明,该文模型优于多个基线模型,验证了方法的有效性。 展开更多
关键词 地址实体识别 多层知识感知 双线性注意力
在线阅读 下载PDF
基于标签语义信息感知的少样本命名实体识别方法 被引量:2
2
作者 张越 王长征 +4 位作者 苏雪峰 闫智超 张广军 邵文远 李茹 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第3期413-421,共9页
在少样本命名实体识别方法中,目前广泛应用的方法是基于原型网络的两阶段模型。但是,该方法未充分利用实体标签中的语义信息,且在距离计算中过度依赖实体类型原型向量,导致模型泛化能力差。针对这些问题,提出一种基于标签语义信息感知... 在少样本命名实体识别方法中,目前广泛应用的方法是基于原型网络的两阶段模型。但是,该方法未充分利用实体标签中的语义信息,且在距离计算中过度依赖实体类型原型向量,导致模型泛化能力差。针对这些问题,提出一种基于标签语义信息感知的少样本命名实体识别方法。该方法是一种先进行实体跨度检测,再判断实体类型的两阶段方法。在构建实体类型原型向量时,将对应实体类型包含的语义信息考虑在内,通过维度转换层将其与原型向量相融合。在对新样本进行实体识别时,将实体类型的正负样本与实体类型原型向量组成实体类型三元组,依据样本到三元组的距离对其进行分类。在多个数据集上的实验结果证明,该模型的性能比以往的模型有较大的提升。 展开更多
关键词 少样本命名实体识别 标签语义信息感知 实体类型三元组 原型网络
在线阅读 下载PDF
基于主题多视图表示的零样本实体检索方法
3
作者 齐丹丹 王长征 +6 位作者 郭少茹 闫智超 胡志伟 苏雪峰 马博翔 李时钊 李茹 《广西师范大学学报(自然科学版)》 北大核心 2025年第3期23-34,共12页
零样本实体检索旨在将实体提及(mention)链接到训练阶段未见过的实体,在多种自然语言处理任务中起关键作用。然而现有方法依然存在2个问题:1)仅使用实体描述的前k个句子来构建实体的多视图表示,导致实体多视图语义冗余与缺失,很难充分... 零样本实体检索旨在将实体提及(mention)链接到训练阶段未见过的实体,在多种自然语言处理任务中起关键作用。然而现有方法依然存在2个问题:1)仅使用实体描述的前k个句子来构建实体的多视图表示,导致实体多视图语义冗余与缺失,很难充分学习提及与实体之间的匹配关系;2)仅以提及为中心构造正负例,对提及与实体之间的对比关系覆盖度较低,导致其匹配错误。针对以上2个问题,本文提出基于主题的多视图实体表示(Topic-MVER)方法。该方法基于主题构建实体的多视图表示,并使用对比学习建模提及与实体之间的3种关系,提升提及和实体对表示的匹配性。该方法在ZESHEL和MedMentions数据集上的Recall@1分别达到48.13%和73.86%,较基线模型分别提升2.73和1.21个百分点,验证了本文方法的有效性。 展开更多
关键词 实体检索 零样本 长文本 主题多视图 对比学习
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部