期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于多层知识感知的地址实体识别方法
1
作者
邵文远
王长征
+4 位作者
苏雪峰
闫智超
张广军
张越
李茹
《中文信息学报》
北大核心
2025年第6期110-118,共9页
地址实体识别旨在基于给定的地址文本识别出地址相关的实体,并判断每个地址实体的类别。现有模型未考虑地址的多义性和歧义性,这会引发实体边界问题和类型问题。因此,该文提出了一种基于多层知识感知的地址实体识别方法。首先,编码层通...
地址实体识别旨在基于给定的地址文本识别出地址相关的实体,并判断每个地址实体的类别。现有模型未考虑地址的多义性和歧义性,这会引发实体边界问题和类型问题。因此,该文提出了一种基于多层知识感知的地址实体识别方法。首先,编码层通过知识嵌入的方法将句子知识融入BERT Transformer的前馈神经网络中,得到融合序列和句子知识的联合特征表示,缓解了类型问题对模型性能的影响;其次,通过词汇知识融合层将词汇知识与联合特征表示融合,增强了地址实体边界的表示能力。此外,通过语义相似度计算和注意力机制避免了引入知识可能带来的噪声问题。在CCKS2021地址要素解析数据集上的实验结果表明,该文模型优于多个基线模型,验证了方法的有效性。
展开更多
关键词
地址实体识别
多层知识感知
双线性注意力
在线阅读
下载PDF
职称材料
基于标签语义信息感知的少样本命名实体识别方法
被引量:
2
2
作者
张越
王长征
+4 位作者
苏雪峰
闫智超
张广军
邵文远
李茹
《北京大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2024年第3期413-421,共9页
在少样本命名实体识别方法中,目前广泛应用的方法是基于原型网络的两阶段模型。但是,该方法未充分利用实体标签中的语义信息,且在距离计算中过度依赖实体类型原型向量,导致模型泛化能力差。针对这些问题,提出一种基于标签语义信息感知...
在少样本命名实体识别方法中,目前广泛应用的方法是基于原型网络的两阶段模型。但是,该方法未充分利用实体标签中的语义信息,且在距离计算中过度依赖实体类型原型向量,导致模型泛化能力差。针对这些问题,提出一种基于标签语义信息感知的少样本命名实体识别方法。该方法是一种先进行实体跨度检测,再判断实体类型的两阶段方法。在构建实体类型原型向量时,将对应实体类型包含的语义信息考虑在内,通过维度转换层将其与原型向量相融合。在对新样本进行实体识别时,将实体类型的正负样本与实体类型原型向量组成实体类型三元组,依据样本到三元组的距离对其进行分类。在多个数据集上的实验结果证明,该模型的性能比以往的模型有较大的提升。
展开更多
关键词
少样本命名实体识别
标签语义信息感知
实体类型三元组
原型网络
在线阅读
下载PDF
职称材料
基于主题多视图表示的零样本实体检索方法
3
作者
齐丹丹
王长征
+6 位作者
郭少茹
闫智超
胡志伟
苏雪峰
马博翔
李时钊
李茹
《广西师范大学学报(自然科学版)》
北大核心
2025年第3期23-34,共12页
零样本实体检索旨在将实体提及(mention)链接到训练阶段未见过的实体,在多种自然语言处理任务中起关键作用。然而现有方法依然存在2个问题:1)仅使用实体描述的前k个句子来构建实体的多视图表示,导致实体多视图语义冗余与缺失,很难充分...
零样本实体检索旨在将实体提及(mention)链接到训练阶段未见过的实体,在多种自然语言处理任务中起关键作用。然而现有方法依然存在2个问题:1)仅使用实体描述的前k个句子来构建实体的多视图表示,导致实体多视图语义冗余与缺失,很难充分学习提及与实体之间的匹配关系;2)仅以提及为中心构造正负例,对提及与实体之间的对比关系覆盖度较低,导致其匹配错误。针对以上2个问题,本文提出基于主题的多视图实体表示(Topic-MVER)方法。该方法基于主题构建实体的多视图表示,并使用对比学习建模提及与实体之间的3种关系,提升提及和实体对表示的匹配性。该方法在ZESHEL和MedMentions数据集上的Recall@1分别达到48.13%和73.86%,较基线模型分别提升2.73和1.21个百分点,验证了本文方法的有效性。
展开更多
关键词
实体检索
零样本
长文本
主题多视图
对比学习
在线阅读
下载PDF
职称材料
题名
基于多层知识感知的地址实体识别方法
1
作者
邵文远
王长征
苏雪峰
闫智超
张广军
张越
李茹
机构
山西
大学计算机与信息
技术
学院
山西同方知网数字出版技术有限公司
山西
大学计算智能与中文信息处理教育部重点实验室
山西
工程科技职业大学现代物流学院
出处
《中文信息学报》
北大核心
2025年第6期110-118,共9页
基金
山西省重点研发计划项目(202102020101008)
山西省科技合作交流专项项目(202204041101016)
山西省1331工程项目。
文摘
地址实体识别旨在基于给定的地址文本识别出地址相关的实体,并判断每个地址实体的类别。现有模型未考虑地址的多义性和歧义性,这会引发实体边界问题和类型问题。因此,该文提出了一种基于多层知识感知的地址实体识别方法。首先,编码层通过知识嵌入的方法将句子知识融入BERT Transformer的前馈神经网络中,得到融合序列和句子知识的联合特征表示,缓解了类型问题对模型性能的影响;其次,通过词汇知识融合层将词汇知识与联合特征表示融合,增强了地址实体边界的表示能力。此外,通过语义相似度计算和注意力机制避免了引入知识可能带来的噪声问题。在CCKS2021地址要素解析数据集上的实验结果表明,该文模型优于多个基线模型,验证了方法的有效性。
关键词
地址实体识别
多层知识感知
双线性注意力
Keywords
address entity recognition
Multi-layer knowledge perception
bilinear attention
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于标签语义信息感知的少样本命名实体识别方法
被引量:
2
2
作者
张越
王长征
苏雪峰
闫智超
张广军
邵文远
李茹
机构
山西
大学计算机与信息
技术
学院
山西同方知网数字出版技术有限公司
山西
工程科技职业大学现代物流学院
山西
大学计算智能与中文信息处理教育部重点实验室
出处
《北京大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2024年第3期413-421,共9页
基金
山西省重点研发计划(202102020101008)
山西省科技合作交流专项(202204041101016)
山西省1331工程项目资助。
文摘
在少样本命名实体识别方法中,目前广泛应用的方法是基于原型网络的两阶段模型。但是,该方法未充分利用实体标签中的语义信息,且在距离计算中过度依赖实体类型原型向量,导致模型泛化能力差。针对这些问题,提出一种基于标签语义信息感知的少样本命名实体识别方法。该方法是一种先进行实体跨度检测,再判断实体类型的两阶段方法。在构建实体类型原型向量时,将对应实体类型包含的语义信息考虑在内,通过维度转换层将其与原型向量相融合。在对新样本进行实体识别时,将实体类型的正负样本与实体类型原型向量组成实体类型三元组,依据样本到三元组的距离对其进行分类。在多个数据集上的实验结果证明,该模型的性能比以往的模型有较大的提升。
关键词
少样本命名实体识别
标签语义信息感知
实体类型三元组
原型网络
Keywords
few-shot named entity recognition(NER)
semantic information awareness of labels
entity type triplet
prototypical network
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于主题多视图表示的零样本实体检索方法
3
作者
齐丹丹
王长征
郭少茹
闫智超
胡志伟
苏雪峰
马博翔
李时钊
李茹
机构
山西
大学计算机与信息
技术
学院
山西同方知网数字出版技术有限公司
山西
工程科技职业大学现代物流学院
计算智能与中文信息处理教育部重点实验室(
山西
大学)
出处
《广西师范大学学报(自然科学版)》
北大核心
2025年第3期23-34,共12页
基金
山西省重点研发计划(202102020101008)
山西省科技合作交流专项(202204041101016)
山西省基础研究计划(202203021211286,202403021211092)。
文摘
零样本实体检索旨在将实体提及(mention)链接到训练阶段未见过的实体,在多种自然语言处理任务中起关键作用。然而现有方法依然存在2个问题:1)仅使用实体描述的前k个句子来构建实体的多视图表示,导致实体多视图语义冗余与缺失,很难充分学习提及与实体之间的匹配关系;2)仅以提及为中心构造正负例,对提及与实体之间的对比关系覆盖度较低,导致其匹配错误。针对以上2个问题,本文提出基于主题的多视图实体表示(Topic-MVER)方法。该方法基于主题构建实体的多视图表示,并使用对比学习建模提及与实体之间的3种关系,提升提及和实体对表示的匹配性。该方法在ZESHEL和MedMentions数据集上的Recall@1分别达到48.13%和73.86%,较基线模型分别提升2.73和1.21个百分点,验证了本文方法的有效性。
关键词
实体检索
零样本
长文本
主题多视图
对比学习
Keywords
entity retrieval
zero-shot
long document
topic-based multi-view
contrastive learning
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于多层知识感知的地址实体识别方法
邵文远
王长征
苏雪峰
闫智超
张广军
张越
李茹
《中文信息学报》
北大核心
2025
0
在线阅读
下载PDF
职称材料
2
基于标签语义信息感知的少样本命名实体识别方法
张越
王长征
苏雪峰
闫智超
张广军
邵文远
李茹
《北京大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2024
2
在线阅读
下载PDF
职称材料
3
基于主题多视图表示的零样本实体检索方法
齐丹丹
王长征
郭少茹
闫智超
胡志伟
苏雪峰
马博翔
李时钊
李茹
《广西师范大学学报(自然科学版)》
北大核心
2025
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部