题名 基于问题语义表征的中文问答系统相似度计算方法
1
作者
魏楚元
湛强
张大奎
毛煜
樊孝忠
机构
北京建筑大学计算机系
北京理工大学计算机学院
出处
《情报学报》
CSSCI
北大核心
2014年第10期1099-1107,共9页
基金
国家自然科学基金资助项目(61371194)
北京市优秀人才培养资助项目(2013D005017000006).
文摘
问答系统特别是近年来流行的社区问答系统是信息检索与自然语言领域研究的热点。问题与答案句匹配及相似问题检索是中文问答系统研究的关键问题之一,其本质是基于相似度计算方法,从已解决的历史问答对中找出与查询问题相关的问题。本文以含有事件(动作)信息的复杂类问句为研究对象,提出了一种基于问题语义表征的问题相似度计算方法,问题语义表征结构由疑问焦点块、问题主题块和问题事件块组成,将一个查询问题与历史问题之间的相似度分解为三个主要语义组块之间相似度。实验结果表明,该方法具有一定的有效性。
关键词
问题 语义表征
相似 度计算
语义组块
相似 问题 检索
Keywords
question semantic representation
similarity computation
semantic chunk
similar question retrieval
分类号
H314.2
[语言文字—英语]
题名 基于关键信息的问题相似度计算
被引量:4
2
作者
齐乐
张宇
刘挺
机构
哈尔滨工业大学社会计算与信息检索研究中心
出处
《计算机研究与发展》
EI
CSCD
北大核心
2018年第7期1539-1547,共9页
基金
国家"九七三"重点基础研究发展计划基金项目(2014CB340503)
国家自然科学基金项目(61472105
61502120)~~
文摘
判断问题相似是社区问答(community question answer,CQA)中很重要的一个研究方向.社区问答中的问题通常由主题和描述构成.由于社区问答的开放性,用户的提问长短不一,而问题中会包含大量干扰模型判断问题是否相似的背景信息.为了减少上述问题对计算问题相似度的影响,模型将关键词及问题主题视为问题的关键信息,并使用这些信息计算问题相似度.首先,在基于文本间相似及相异信息的CNN模型的基础上引入了关键词抽取技术.同时,为了更好地利用问题主题的信息,模型融合了问题主题相似度的特征.模型在SemEval2017评测的问题相似任务中进行了实验,其平均精度均值(mean average precision,MAP)达到了49.65%,超过了评测中的最佳结果.
关键词
问题 相似
社区问答
关键词
问题 主题
卷积神经网络
Keywords
question similarity
community question answering (CQA)
keywords
question topic
convolutional neural network (CNN)
分类号
TP391
[自动化与计算机技术—计算机应用技术]
TP18
[自动化与计算机技术—控制理论与控制工程]
题名 基于RCNN的问题相似度计算方法
被引量:10
3
作者
杨德志
柯显信
余其超
杨帮华
机构
上海大学机电工程与自动化学院
出处
《计算机工程与科学》
CSCD
北大核心
2021年第6期1076-1080,共5页
基金
国防基础科研计划项目(JCKY2017413C002)。
文摘
在搜索引擎、问答系统中利用深度学习的方法计算问题相似度是NLP领域研究的热点。结合卷积神经网络(CNN)和长短记忆网络(LSTM),提出了递归卷积神经网络(RCNN)问句相似度的计算方法,首先利用双向递归神经网络提取上下文信息,然后采用1D卷积神经网络将词嵌入信息与上下文信息进行融合;再利用全局最大池化提取关键信息来完成问句的语义表示;最后通过匹配层判断问句对的相似度。在Quora Question Pairs数据集上的实验结果表明,该相似度计算方法准确率为83.57%,优于其他方法。
关键词
问题 相似 度
递归卷积神经网络
全局最大池化
孪生网络
Keywords
question similarity
recursive convolutional neural network
global maximum pooling
siamese network
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
题名 煤矿安全知识问答系统的答案生成模型研究
4
作者
于非凡
董立红
秦昳
机构
西安科技大学计算机科学与技术学院
出处
《现代电子技术》
北大核心
2025年第2期61-69,共9页
基金
陕西省自然科学基础研究计划(2020JQ-758)
煤炭行业教育研究课题(2021MXJG020)。
文摘
随着国家和煤矿行业对煤矿应急管理要求的逐步提高,对煤矿安全知识的学习也提出了更高的要求,因此建立一种煤矿安全知识智能问答模型。有效学习煤矿安全知识,对于确保煤矿企业工作人员的人身安全和预防煤矿安全事故的发生至关重要。首先,基于RoBERTa-wwm算法自动生成问答对数据,获取并分析煤矿安全知识原始文本数据,定义问题类型并标注问答对;然后,结合RoBERTa-wwm与UniLM,采用点互信息与邻接熵发现新词扩充领域词典,提出问答对自动生成算法,同时构建煤矿安全培训知识问答对数据集,解决煤矿安全知识系统问答对数据集问题;最后,引入问题相似度机制,针对无法回答问题和无关问题提出答案生成策略,构建基于问题相似度机制的答案生成模型,使其只关注可回答问题,从而提升模型的推理能力。实验结果表明,所提出的煤矿安全知识问答系统答案生成模型可有效识别无法回答和无关的问题,能够为煤矿企业工作人员提供知识支持,最大程度地提升煤矿企业工作人员安全培训学习效果。
关键词
智能问答系统
煤矿安全
答案生成
RoBERTa-wwm
UniLM
点互信息
邻接熵
问题 相似 度
Keywords
intelligent question answering system
coal mine safety
answer generation
RoBERTa-wwm
UniLM
point mutual information
adjacency entropy
problem similarity
分类号
TN929.5-34
[电子电信—通信与信息系统]
TP391
[自动化与计算机技术—计算机应用技术]
题名 面向进化算法的问题相对求解难度降低方法
5
作者
许春蕾
陈昊
易鑫睿
机构
南昌航空大学信息工程学院
南昌航空大学无损检测技术教育部重点实验室
出处
《小型微型计算机系统》
CSCD
北大核心
2018年第11期2451-2456,共6页
基金
国家自然科学基金项目(61440049
61772255)资助
+5 种基金
江西省创新驱动"5511"工程优势学科创新团队项目(20165BCB19007)资助
江西省优势科技创新团队计划项目(20152BCB24004)资助
江西省科技厅科技项目(20161BBG70047)资助
江西省教育厅科技项目(GJJ150716)资助
无损检测技术教育部重点实验室(南昌航空大学)开放基金项目(ZD201529004)资助
江西省研究生创新专项资金项目(YC2016-S349)资助
文摘
以在进化算法求解问题的过程中降低优化问题的相对求解难度为目标,提出一种基于相似性理论的优化问题难度降低方法.以优化问题最优解为特征,对优化问题的弱相似性、最简优化问题、相似性进行定义,并构建基于云模型的相似性理论.在此基础上,将进化算法的搜索目的扩展为寻找优化问题的最简云模型,对原问题与对应最简云模型的相似性进行证明;提出相对求解难度的概念,分析相似性理论对问题求解难度的影响,建立最简云模型的求解方法,并用3个衡量优化问题求解难度的指标对不同问题进行难度测试.通过实验表明,将进化算法与优化问题难度降低方法相结合,可有效降低问题相对求解难度,并能提升进化算法的寻优性能.
关键词
问题 难度
进化算法
问题 相似 性
云模型
Keywords
problem difficulty
evolutionary algorithm
problem similarity
cloud model
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
题名 融合知识图谱和语义匹配的医疗问答系统
被引量:4
6
作者
徐若卿
机构
三峡大学计算机与信息学院
出处
《现代电子技术》
北大核心
2024年第8期49-54,共6页
文摘
问答系统是自然语言处理领域中的一项重要任务,常应用于医疗服务。传统的问答系统通过知识图谱的实体关系匹配返回相应的尾实体作为答案,然而,倘若实体或关系无法识别,又或者在知识图谱中并不存在相应的实体关系,问答将无法继续进行。为了解决这一问题,建立一种融合知识图谱和语义匹配模型的中文医疗问答混合系统。当所提问题无法在知识图谱中进行实体关系匹配时,该模型能继续从问答对数据集中找到最相似的问题,并返回相应结果作为答案。在语义匹配模型方面,结合中文医疗相似问题对,在Sentence-BERT模型上进行微调训练,并引入双曲空间中的距离度量函数对句子对进行相似度度量。结果表明:在整体性能方面,所提模型相较于BERT这类大语言模型精度能提升7.16%;在度量能力方面,双曲度量相较于通用欧氏空间度量,如余弦度量,最高能有2.28%的精度提升和1.58%的F_1值提升。
关键词
医疗问答系统
知识图谱
语义匹配
问答对数据集
相似问题对
双曲距离度量
Keywords
question answering system
knowledge graph
semantic matching
question answering on dataset
similar problem pairs
hyperbolic distance metric
分类号
TN919.5-34
[电子电信—通信与信息系统]