期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于主题多视图表示的零样本实体检索方法
1
作者 齐丹丹 王长征 +6 位作者 郭少茹 闫智超 胡志伟 苏雪峰 马博翔 李时钊 李茹 《广西师范大学学报(自然科学版)》 北大核心 2025年第3期23-34,共12页
零样本实体检索旨在将实体提及(mention)链接到训练阶段未见过的实体,在多种自然语言处理任务中起关键作用。然而现有方法依然存在2个问题:1)仅使用实体描述的前k个句子来构建实体的多视图表示,导致实体多视图语义冗余与缺失,很难充分... 零样本实体检索旨在将实体提及(mention)链接到训练阶段未见过的实体,在多种自然语言处理任务中起关键作用。然而现有方法依然存在2个问题:1)仅使用实体描述的前k个句子来构建实体的多视图表示,导致实体多视图语义冗余与缺失,很难充分学习提及与实体之间的匹配关系;2)仅以提及为中心构造正负例,对提及与实体之间的对比关系覆盖度较低,导致其匹配错误。针对以上2个问题,本文提出基于主题的多视图实体表示(Topic-MVER)方法。该方法基于主题构建实体的多视图表示,并使用对比学习建模提及与实体之间的3种关系,提升提及和实体对表示的匹配性。该方法在ZESHEL和MedMentions数据集上的Recall@1分别达到48.13%和73.86%,较基线模型分别提升2.73和1.21个百分点,验证了本文方法的有效性。 展开更多
关键词 实体检索 零样本 长文本 主题多视图 对比学习
在线阅读 下载PDF
基于多角度关联模型的实体检索方法 被引量:1
2
作者 王东 牛军钰 《计算机工程》 CAS CSCD 2013年第1期71-75,共5页
针对信息检索领域特定类型实体的检索问题,在传统搜索引擎的基础上,提出一种基于多角度关联模型的实体检索方法,综合运用实体名识别(NER)、文本向量、关联规则等技术以及Wikipedia、Stanford NER等工具,并在TREC2010实体检索项目中进行... 针对信息检索领域特定类型实体的检索问题,在传统搜索引擎的基础上,提出一种基于多角度关联模型的实体检索方法,综合运用实体名识别(NER)、文本向量、关联规则等技术以及Wikipedia、Stanford NER等工具,并在TREC2010实体检索项目中进行评测。实验结果表明,与基于BM25和贝叶斯模型的检索方法相比,该方法的nDCG@R值平均提高11.49%和18.09%。 展开更多
关键词 文本挖掘 关联规则 实体检索 实体名识别 词频-逆文档频率 维基百科 搜索引擎
在线阅读 下载PDF
扩展知识图谱上的实体关系检索 被引量:5
3
作者 王秋月 覃雄派 +1 位作者 曹巍 覃飙 《计算机应用》 CSCD 北大核心 2016年第4期985-991,共7页
现有文本数据集上的实体搜索和自然语言查询方法无法处理需要将分散在不同文档中的信息碎片链接起来以满足有复杂实体关系的查询,而知识库上的查询虽然可以表示实体间的复杂关系,但由于知识库的异构性和不完全性,通常查全率较低。针对... 现有文本数据集上的实体搜索和自然语言查询方法无法处理需要将分散在不同文档中的信息碎片链接起来以满足有复杂实体关系的查询,而知识库上的查询虽然可以表示实体间的复杂关系,但由于知识库的异构性和不完全性,通常查全率较低。针对这些问题,提出使用文本数据集对知识库进行扩展,并设计相应的含文本短语的三元组模式查询以支持对知识库和文本数据的统一查询。在此基础上,设计并实现了查询放松机制和对结果元组的评分模型,并给出了高效的查询处理方法。使用YAGO、Clue Web09和其上的FACC1数据集,在三个不同的查询测试集(实体检索、实体关系检索和复杂的实体关系查询)上与两个典型相关工作作了比较。实验结果显示,扩展知识图谱上使用查询放松规则的实体关系检索系统的检索效果大大超出了其他系统,具体地在三个查询测试集上,其平均正确率均值(MAP)比其他系统分别提升了27%、37%和64%以上。 展开更多
关键词 知识图谱 实体关系检索 实体搜索 三元组模式查询 查询放松
在线阅读 下载PDF
双特征空间的实体排序学习
4
作者 赵以昕 牛树梓 +2 位作者 纪春岩 卢菲 徐睿 《中文信息学报》 CSCD 北大核心 2020年第5期91-99,共9页
随着大规模知识图谱的出现以及企业高效管理领域知识图谱的需求,知识图谱中的自组织实体检索成为研究热点。给定知识图谱以及用户查询,实体检索的目标在于从给定的知识图谱中返回实体的排序列表。从匹配的角度来看,传统的实体检索模型... 随着大规模知识图谱的出现以及企业高效管理领域知识图谱的需求,知识图谱中的自组织实体检索成为研究热点。给定知识图谱以及用户查询,实体检索的目标在于从给定的知识图谱中返回实体的排序列表。从匹配的角度来看,传统的实体检索模型大都将用户查询和实体统一映射到词的特征空间。这样做具有明显的缺点,例如,将同属于一个实体的两个词视为独立的。为此,该文提出将用户查询和实体同时映射到实体与词两个特征空间方法,称为双特征空间的排序学习。首先将实体抽象成若干个域。之后从词空间和实体空间两个维度分别抽取排序特征,最终应用于排序学习算法中。实验结果表明,在标准数据集上,双特征空间的实体排序学习模型性能显著优于当前先进的实体检索模型。 展开更多
关键词 知识图谱 实体检索 双特征空间
在线阅读 下载PDF
多源异构土地基础数据一体化管理检索方法研究 被引量:2
5
作者 张书瑜 张定祥 +1 位作者 王荣彬 季宏伟 《浙江大学学报(理学版)》 CAS CSCD 北大核心 2018年第5期589-594,共6页
为了从多源异构的复杂土地基础数据中快速准确地提取用户所需信息,提出了基于元数据的一体化管理检索方法.在元数据信息提取、元数据加权索引、实体同义词扩展检索3个环节中,结合土地领域专业知识和用户实际需求,设计和开发了共享元数... 为了从多源异构的复杂土地基础数据中快速准确地提取用户所需信息,提出了基于元数据的一体化管理检索方法.在元数据信息提取、元数据加权索引、实体同义词扩展检索3个环节中,结合土地领域专业知识和用户实际需求,设计和开发了共享元数据表结构、加权元数据中字段相对重要性和信息熵因子,构建地名实体和专题数据层实体同义词库,并集成到包括中文分词、实体识别、同义词扩展、索引检索和相似度计算的一体化管理检索框架中,解决了多源异构土地基础数据统一管理和精确检索的问题.实践表明,该方法较传统的通用信息检索方法具有更好的适用性和更高的准确率. 展开更多
关键词 多源异构土地基础数据 管理检索一体化 元数据信息提取 元数据加权索引 实体同义词扩展检索
在线阅读 下载PDF
基于话题模型的专家发现方法 被引量:6
6
作者 刘健 李绮 +1 位作者 刘宝宏 张云 《国防科技大学学报》 EI CAS CSCD 北大核心 2013年第2期127-131,共5页
专家发现是实体检索的一个重要方面。经典的专家发现模型建立在专家与词项的条件独立性假设基础上。在实际应用中该假设通常不成立,使得专家发现的效果不够理想。本文提出了一种基于话题模型的专家发现方法,该方法无需依赖候选专家与词... 专家发现是实体检索的一个重要方面。经典的专家发现模型建立在专家与词项的条件独立性假设基础上。在实际应用中该假设通常不成立,使得专家发现的效果不够理想。本文提出了一种基于话题模型的专家发现方法,该方法无需依赖候选专家与词项的条件独立性假设,且其可操作性比经典模型更强。同时,使用了一种排序截断技术,该技术极大地降低了模型的计算复杂度。使用CERC(CSIRO Enterprise Research Collection)数据集对模型的性能进行评估。实验结果表明,基于话题模型的专家发现方法在各个评价指标上均优于经典的专家发现模型,能够有效地提高专家发现的效能。 展开更多
关键词 实体检索 专家发现 基于话题的模型 排序截断
在线阅读 下载PDF
网络搜索引擎知识卡片功能的评价与比较研究 被引量:1
7
作者 赵一鸣 高晓寒 +1 位作者 李倩 梁少博 《图书情报知识》 CSSCI 北大核心 2019年第6期84-92,101,共10页
[目的/意义]知识卡片是网络搜索引擎提供实体检索服务和实现检索结果可视化的重要功能,对其进行评价有利于改善搜索引擎的服务能力。[研究设计/方法]采用分层随机抽样的方法从WikiPedia中选取1200个实体,以Google和Bing为例,开展搜索引... [目的/意义]知识卡片是网络搜索引擎提供实体检索服务和实现检索结果可视化的重要功能,对其进行评价有利于改善搜索引擎的服务能力。[研究设计/方法]采用分层随机抽样的方法从WikiPedia中选取1200个实体,以Google和Bing为例,开展搜索引擎知识卡片功能的评价实验。[结论/发现]搜索引擎整体知识卡片返回率低于35%,Bing的知识卡片返回率高于Google;用户满意度较高,Google在相关性的指标上优于Bing,Bing在丰富性的指标上胜于Google;在内容和结构方面,Bing知识卡片的属性更丰富;仅有Bing提供了知识来源链接,但知识来源相对单一。[创新/价值]为搜索引擎知识卡片功能的评价提出了相应的评价方法和评价指标。 展开更多
关键词 搜索引擎 搜索引擎评价 知识卡片 知识图谱 实体检索 信息检索可视化
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部