知识库问答(knowledge base question answering,KBQA)是一个具有挑战性的热门研究方向,多跳知识库问答主要的挑战是非结构化的自然语言问题与结构化的知识库推理路径存在不一致性,基于图检索的多跳知识库问答模型善于把握图的拓扑结构...知识库问答(knowledge base question answering,KBQA)是一个具有挑战性的热门研究方向,多跳知识库问答主要的挑战是非结构化的自然语言问题与结构化的知识库推理路径存在不一致性,基于图检索的多跳知识库问答模型善于把握图的拓扑结构,但忽略了图中结点和边携带的文本信息。为了充分学习知识库三元组的文本信息,构造了知识库三元组的文本形式,并提出了三个基于非图检索的特征增强模型RBERT、CBERT、GBERT,它们分别使用前馈神经网络、深层金字塔卷积网络、图注意力网络增强特征。三个模型显著提高了特征表示能力和问答准确率,其中RBERT结构最简单,CBERT训练最快,GBERT性能最优。在数据集MetaQA、WebQSP和CWQ上进行实验对比,在Hits@1和F1两个指标上三个模型明显优于目前的主流模型,也明显优于其他BERT的改进模型。展开更多
铁路领域的知识问答具有高度的专业性和复杂性,通用大模型在应对该领域的专业问题时表现出能力不足,因此检索增强生成(RAG)架构逐渐成为应对复杂专业知识查询的主流方法。针对现有RAG方法在引入固定知识段落时常伴随噪声信息导致生成答...铁路领域的知识问答具有高度的专业性和复杂性,通用大模型在应对该领域的专业问题时表现出能力不足,因此检索增强生成(RAG)架构逐渐成为应对复杂专业知识查询的主流方法。针对现有RAG方法在引入固定知识段落时常伴随噪声信息导致生成答案的准确性受限问题,提出1种基于知识过滤的检索增强生成(KFRAG)架构。首先,生成与查询高度相关的上下文信息,为后续的知识筛选提供准确的指导;其次对检索到的知识段落进行句子级别的切分,通过计算每个句子与查询上下文的相关性得分来识别并过滤掉关联度较低的句子,减少无关信息对生成答案的干扰;最后将筛选后的关键句子与原始查询合并输入到生成模型中,以生成更为精确的答案。实验结果表明,与传统RAG方法相比,KFRAG在铁路领域问答任务中的表现更为优异,有效减少了知识噪声干扰,并在Exact Match (EM)指标和F1 Score指标上提高近10%性能,显示出在复杂专业领域中的应用潜力和推广价值。展开更多
面向知识库的问答(Question answering over knowledge base,KBQA)是问答系统的重要组成.近些年,随着以深度学习为代表的表示学习技术在多个领域的成功应用,许多研究者开始着手研究基于表示学习的知识库问答技术.其基本假设是把知识库...面向知识库的问答(Question answering over knowledge base,KBQA)是问答系统的重要组成.近些年,随着以深度学习为代表的表示学习技术在多个领域的成功应用,许多研究者开始着手研究基于表示学习的知识库问答技术.其基本假设是把知识库问答看做是一个语义匹配的过程.通过表示学习知识库以及用户问题的语义表示,将知识库中的实体、关系以及问句文本转换为一个低维语义空间中的数值向量,在此基础上,利用数值计算,直接匹配与用户问句语义最相似的答案.从目前的结果看,基于表示学习的知识库问答系统在性能上已经超过传统知识库问答方法.本文将对现有基于表示学习的知识库问答的研究进展进行综述,包括知识库表示学习和问句(文本)表示学习的代表性工作,同时对于其中存在难点以及仍存在的研究问题进行分析和讨论.展开更多
文摘知识库问答(knowledge base question answering,KBQA)是一个具有挑战性的热门研究方向,多跳知识库问答主要的挑战是非结构化的自然语言问题与结构化的知识库推理路径存在不一致性,基于图检索的多跳知识库问答模型善于把握图的拓扑结构,但忽略了图中结点和边携带的文本信息。为了充分学习知识库三元组的文本信息,构造了知识库三元组的文本形式,并提出了三个基于非图检索的特征增强模型RBERT、CBERT、GBERT,它们分别使用前馈神经网络、深层金字塔卷积网络、图注意力网络增强特征。三个模型显著提高了特征表示能力和问答准确率,其中RBERT结构最简单,CBERT训练最快,GBERT性能最优。在数据集MetaQA、WebQSP和CWQ上进行实验对比,在Hits@1和F1两个指标上三个模型明显优于目前的主流模型,也明显优于其他BERT的改进模型。
文摘铁路领域的知识问答具有高度的专业性和复杂性,通用大模型在应对该领域的专业问题时表现出能力不足,因此检索增强生成(RAG)架构逐渐成为应对复杂专业知识查询的主流方法。针对现有RAG方法在引入固定知识段落时常伴随噪声信息导致生成答案的准确性受限问题,提出1种基于知识过滤的检索增强生成(KFRAG)架构。首先,生成与查询高度相关的上下文信息,为后续的知识筛选提供准确的指导;其次对检索到的知识段落进行句子级别的切分,通过计算每个句子与查询上下文的相关性得分来识别并过滤掉关联度较低的句子,减少无关信息对生成答案的干扰;最后将筛选后的关键句子与原始查询合并输入到生成模型中,以生成更为精确的答案。实验结果表明,与传统RAG方法相比,KFRAG在铁路领域问答任务中的表现更为优异,有效减少了知识噪声干扰,并在Exact Match (EM)指标和F1 Score指标上提高近10%性能,显示出在复杂专业领域中的应用潜力和推广价值。
文摘面向知识库的问答(Question answering over knowledge base,KBQA)是问答系统的重要组成.近些年,随着以深度学习为代表的表示学习技术在多个领域的成功应用,许多研究者开始着手研究基于表示学习的知识库问答技术.其基本假设是把知识库问答看做是一个语义匹配的过程.通过表示学习知识库以及用户问题的语义表示,将知识库中的实体、关系以及问句文本转换为一个低维语义空间中的数值向量,在此基础上,利用数值计算,直接匹配与用户问句语义最相似的答案.从目前的结果看,基于表示学习的知识库问答系统在性能上已经超过传统知识库问答方法.本文将对现有基于表示学习的知识库问答的研究进展进行综述,包括知识库表示学习和问句(文本)表示学习的代表性工作,同时对于其中存在难点以及仍存在的研究问题进行分析和讨论.