期刊文献+
共找到32篇文章
< 1 2 >
每页显示 20 50 100
基于潜在语义分析的汉语问答系统答案提取 被引量:45
1
作者 余正涛 樊孝忠 +1 位作者 郭剑毅 耿增民 《计算机学报》 EI CSCD 北大核心 2006年第10期1889-1893,共5页
为了解决在汉语问答系统答案提取时,由于词的同义或多义现象而导致的“漏提”或“错提”等问题,提出了一种基于潜在语义分析(LSA)的问题和答案句子相似度计算方法.它利用空间向量模型作为问题和句子的表示方法,借助于潜在语义分析理论,... 为了解决在汉语问答系统答案提取时,由于词的同义或多义现象而导致的“漏提”或“错提”等问题,提出了一种基于潜在语义分析(LSA)的问题和答案句子相似度计算方法.它利用空间向量模型作为问题和句子的表示方法,借助于潜在语义分析理论,对大量问答作句子语料统计分析,构建了一个潜在的词-句子语义空间,从而消除了词之间的相关性,并在语义空间上实现了问题与答案句子相似度计算,有效地解决了词的同义和多义问题.最后结合问题类型和相似度计算结果,对汉语基于事实的简单陈述问题进行了答案句子提取实验.答案提取的MRR值达到了0.47,明显优于空间向量模型.结果说明该方法具有很好的效果. 展开更多
关键词 问答系统 答案提取 相似度 向量空间模型 潜在语义分析
在线阅读 下载PDF
一种基于潜在语义分析的查询扩展算法 被引量:8
2
作者 顾榕 王小平 曹立明 《计算机工程与应用》 CSCD 北大核心 2004年第18期23-25,63,共4页
该文提出一种新的查询扩展算法。通过对文本进行潜在语义分析,引入计算词语间语义相似度的方法,将文本聚类应用到检索的交互过程中,以提高信息检索的质量。实验结果表明该算法对于提高检索的准确率是十分有效的。
关键词 查询扩展 潜在语义分析 语义相似度
在线阅读 下载PDF
基于领域本体和Lucene的语义检索系统研究 被引量:20
3
作者 王欢 孙瑞志 《计算机应用》 CSCD 北大核心 2010年第6期1655-1657,1660,共4页
语义相似度是影响语义检索系统查准率和查全率的重要因素。设计了一种改进的语义相似度模型,用于量化概念间的关联程度,通过对相似度阈值的控制来调整查询扩展时扩展概念集的范围。在Lucene的基础上设计了一个基于领域本体的语义检索系... 语义相似度是影响语义检索系统查准率和查全率的重要因素。设计了一种改进的语义相似度模型,用于量化概念间的关联程度,通过对相似度阈值的控制来调整查询扩展时扩展概念集的范围。在Lucene的基础上设计了一个基于领域本体的语义检索系统,该系统对提交的关键词组进行查询扩展后,将扩展关键词组导入文本检索引擎Lucene中,并把语义相似度作为检索结果排序算法的关键因素。实验结果表明,该语义相似度模型得出的相似度值更加接近专家经验值,系统的查询准确率与未加入查询扩展的Lucene系统相比有较大的提高。 展开更多
关键词 查询扩展 本体 LUCENE 语义相似度 语义检索
在线阅读 下载PDF
跨语言查询扩展优化 被引量:9
4
作者 魏露 李书琴 +1 位作者 李伟男 李新乐 《计算机工程与设计》 CSCD 北大核心 2014年第8期2785-2788,2803,共5页
为提高跨语言查询扩展检索精度,在原有跨语言查询扩展基础上,引入降低噪声和孤立点的k-medoid聚类算法,提出避免语义信息丢失或过拟合的择优模型。构建若干个不同维度值的d维模型,结合奇异值分解和非负矩阵分解法计算文本之间的相似度,... 为提高跨语言查询扩展检索精度,在原有跨语言查询扩展基础上,引入降低噪声和孤立点的k-medoid聚类算法,提出避免语义信息丢失或过拟合的择优模型。构建若干个不同维度值的d维模型,结合奇异值分解和非负矩阵分解法计算文本之间的相似度,选取相似度最大的模型建立双语空间,经过跨语言扩展与权值调整,实现查询扩展优化。实验对比结果表明,该方案有效提高了检索精度,为跨语言查询提供了可参考的模型与算法。 展开更多
关键词 潜在语义 跨语言 查询扩展 k-中心点聚类 非负矩阵分解 择优模型
在线阅读 下载PDF
一种基于语义词典的局部查询扩展方法 被引量:8
5
作者 吴秦 白玉昭 梁久祯 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2014年第4期526-533,共8页
针对基于关键词匹配的搜索引擎存在的问题,提出一种基于语义词典的局部查询扩展方法,首先利用共现分析法和语义相似度选取扩展词,再对原始查询词和扩展词加权,最后计算文档相似度从而获得排序后的扩展查询结果.该方法克服了其它局部扩... 针对基于关键词匹配的搜索引擎存在的问题,提出一种基于语义词典的局部查询扩展方法,首先利用共现分析法和语义相似度选取扩展词,再对原始查询词和扩展词加权,最后计算文档相似度从而获得排序后的扩展查询结果.该方法克服了其它局部扩展方法将大量无关词加入查询的问题.实验表明,该方法有效地提高了查询结果的查准率. 展开更多
关键词 查询扩展 语义词典 共现分析 语义相似度
在线阅读 下载PDF
基于潜语义分析的概念名称相似度算法 被引量:7
6
作者 黄广君 孙建国 罗俊丽 《计算机工程》 CAS CSCD 北大核心 2009年第14期69-71,74,共4页
概念名称是本体映射中的一个重要要素。针对目前概念名称相似度计算中存在的概念名称多义性问题,提出一种改进的算法。该算法结合概念注释和义项解释,利用潜语义分析,明确概念在Wordnet中对应的义项,在一定程度上提高了相似度计算的准... 概念名称是本体映射中的一个重要要素。针对目前概念名称相似度计算中存在的概念名称多义性问题,提出一种改进的算法。该算法结合概念注释和义项解释,利用潜语义分析,明确概念在Wordnet中对应的义项,在一定程度上提高了相似度计算的准确度。实验表明该方法是切实可行的。 展开更多
关键词 相似度 潜语义分析 义项
在线阅读 下载PDF
改进的基于概念相似度的文本检索 被引量:12
7
作者 吕刚 郑诚 《计算机工程》 CAS CSCD 北大核心 2010年第12期55-57,共3页
为提高信息检索的查全率和查准率,提出改进的本体语义相似度计算方法,利用本体中概念语义相似度对检索结果文档的分值进行重新计算,过滤掉与原始查询相关度较小的文档。给出定义查询扩展中的迭代参数,减少进行扩展的次数,提高查询效率... 为提高信息检索的查全率和查准率,提出改进的本体语义相似度计算方法,利用本体中概念语义相似度对检索结果文档的分值进行重新计算,过滤掉与原始查询相关度较小的文档。给出定义查询扩展中的迭代参数,减少进行扩展的次数,提高查询效率。利用开源工具Jena,Lucene进行文本语义检索测试,验证该方法的可行性和有效性。 展开更多
关键词 语义检索 本体 语义相似度 查询扩展 文档分值
在线阅读 下载PDF
基于加权的本体相似度计算方法 被引量:8
8
作者 吕刚 郑诚 《计算机工程与设计》 CSCD 北大核心 2010年第5期1093-1095,1103,共4页
为优化基于本体的语义推理效果,提出了对本体中概念结点赋予权重的相似度计算方法。通过定义本体树中深度因子和密度因子,以解决本体中概念深度与密度对相似度计算的影响。利用JenaA PI、Lucene等开源工具包,提出了查询扩展方法。实验... 为优化基于本体的语义推理效果,提出了对本体中概念结点赋予权重的相似度计算方法。通过定义本体树中深度因子和密度因子,以解决本体中概念深度与密度对相似度计算的影响。利用JenaA PI、Lucene等开源工具包,提出了查询扩展方法。实验结果表明,提出的基于加权语义相似度计算模型与传统的计算法方法以及主观判断的方法相比,提高了相似度计算的准确性,效率有明显提高。 展开更多
关键词 本体 语义距离 语义相似度 语义检索 查询语义扩展
在线阅读 下载PDF
基于潜在语义分析的个性化查询扩展模型 被引量:13
9
作者 王卫国 徐炜民 《计算机工程》 CAS CSCD 北大核心 2010年第21期43-45,共3页
为在信息检索系统中获得更好的查询效果,提出一种混合的个性化查询扩展模型。通过潜在语义分析建立潜在语义空间,并在潜在语义空间中计算得到查询的概念相关扩展词和兴趣相关扩展词,不但有效解决了词典问题,而且满足了不同用户需求多样... 为在信息检索系统中获得更好的查询效果,提出一种混合的个性化查询扩展模型。通过潜在语义分析建立潜在语义空间,并在潜在语义空间中计算得到查询的概念相关扩展词和兴趣相关扩展词,不但有效解决了词典问题,而且满足了不同用户需求多样性和用户多兴趣点的需求。实验表明,该算法能够较好地提高搜索引擎系统的查全率、查准率,以及信息检索效率。 展开更多
关键词 潜在语义分析 用户兴趣 查询扩展 个性化推荐 信息检索
在线阅读 下载PDF
基于潜在语义分析的跨语言查询扩展方法 被引量:13
10
作者 闭剑婷 苏一丹 《计算机工程》 CAS CSCD 北大核心 2009年第10期49-50,53,共3页
针对传统查询扩展方法存在的问题,提出一种基于潜在语义分析的跨语言扩展方法,利用聚类提高扩展文本集合的精度,并用潜在语义分析实现无需翻译的查询扩展,减轻翻译歧义带来的影响。实验结果表明,该方法能够获得较好的性能。
关键词 潜在语义分析 查询扩展 跨语言
在线阅读 下载PDF
基于PLSA模型的文本分割 被引量:25
11
作者 石晶 戴国忠 《计算机研究与发展》 EI CSCD 北大核心 2007年第2期242-248,共7页
文本分割在信息提取、文摘自动生成、语言建模、首语消解等诸多领域都有极为重要的应用·基于PLSA模型的文本分割试图使隐藏于片段内的不同主题与文本表面的词、句对建立联系·实验以汉语的整句作为基本块,尝试了多种相似性度... 文本分割在信息提取、文摘自动生成、语言建模、首语消解等诸多领域都有极为重要的应用·基于PLSA模型的文本分割试图使隐藏于片段内的不同主题与文本表面的词、句对建立联系·实验以汉语的整句作为基本块,尝试了多种相似性度量手段及边界估计策略,同时考虑相邻句重复的未登录词对相似值的影响,其最佳结果表明,片段边界的识别错误率为6·06%,远远低于其他同类算法· 展开更多
关键词 文本分割 概率潜在语义分析 相似性度量 边界识别
在线阅读 下载PDF
基于概念和统计的问答系统实现机制 被引量:4
12
作者 林鸿飞 丁洪文 +1 位作者 杨志豪 赵晶 《大连理工大学学报》 EI CAS CSCD 北大核心 2006年第2期280-285,共6页
问答系统与搜索引擎相比答案精练准确、“噪音”较少.为此给出了基于概念和统计的问答系统实现机制.首先确定焦点类型和答案类型,对于不同类型的焦点实行分级概念扩充;以段落为基本单元,利用潜在语义分析技术获取相关文本段落;给出了问... 问答系统与搜索引擎相比答案精练准确、“噪音”较少.为此给出了基于概念和统计的问答系统实现机制.首先确定焦点类型和答案类型,对于不同类型的焦点实行分级概念扩充;以段落为基本单元,利用潜在语义分析技术获取相关文本段落;给出了问题与句子的匹配算法和基于问题相似度的答案抽取算法;通过对语料进行潜在语义索引和增加FAQ反馈,不断增强系统的回答能力.依此研制的大学概况问答系统获得了较好的效果. 展开更多
关键词 问答系统 概念扩充 潜在语义分析 句子相似性 段落匹配
在线阅读 下载PDF
基于潜在语义分析的Deep Web查询接口聚类研究 被引量:3
13
作者 强保华 李巍 +2 位作者 邹显春 汪天天 吴春明 《计算机科学》 CSCD 北大核心 2013年第11期228-230,247,共4页
集成查询接口的生成是Deep Web数据集成的重要组成环节。如何对不同领域的查询接口进行有效的聚类是生成集成查询接口时需要解决的核心问题之一。针对传统的向量空间模型在Deep Web查询接口聚类时单纯依赖关键词匹配的缺点,引入潜在语... 集成查询接口的生成是Deep Web数据集成的重要组成环节。如何对不同领域的查询接口进行有效的聚类是生成集成查询接口时需要解决的核心问题之一。针对传统的向量空间模型在Deep Web查询接口聚类时单纯依赖关键词匹配的缺点,引入潜在语义分析(LSA)的方法来发掘查询接口之间的语义关系,并给出了基于潜在语义分析的Deep Web查询接口聚类算法,最后采用UIUC的Web集成资源库提供的数据进行了实验。结果表明,潜在语义分析的方法提高了同一领域查询接口之间的相似度,明显改善了Deep Web查询接口聚类的质量。 展开更多
关键词 潜在语义分析 奇异值分解 DEEP Web 查询接口聚类
在线阅读 下载PDF
基于Copulas框架的混合式查询扩展方法 被引量:4
14
作者 张书波 张引 +1 位作者 张斌 孙达明 《计算机科学》 CSCD 北大核心 2016年第S1期485-488 496,共5页
基于语义资料和局部分析的混合式查询扩展可以同时提供具有语义相关性和时效性的扩展结果,但如何有效地混合不同相似度度量指标是尚未解决的问题。提出了一种基于Copulas框架的混合式查询扩展方法,在统一框架内实现了不同类型相似度度... 基于语义资料和局部分析的混合式查询扩展可以同时提供具有语义相关性和时效性的扩展结果,但如何有效地混合不同相似度度量指标是尚未解决的问题。提出了一种基于Copulas框架的混合式查询扩展方法,在统一框架内实现了不同类型相似度度量指标的合并。该方法基于语义分析及词语共现分析方法,分别计算扩展词与用户查询词的语义及统计相似概率,进而在Copulas框架下融合扩展词集,选取最高质量的扩展词形成查询扩展。实验结果表明,该方法充分利用了语义及词语共现分析查询扩展方法的优点,有效地弥补了两者的不足,提高了搜索结果的查准率,具有更优的搜索性能。 展开更多
关键词 信息检索 查询扩展 语义分析 词语共现分析 搜索性能
在线阅读 下载PDF
汉语问答系统概念查询扩展研究 被引量:1
15
作者 张琳 胡杰 +1 位作者 应力 浦丽娜 《郑州大学学报(理学版)》 CAS 北大核心 2009年第1期69-72,共4页
问答系统中查询词扩展是影响检索性能的关键因素之一.给出了领域本体的构建过程,提出了一种结合相似度与相关度的关联度计算方法,利用领域本体构建的概念网络描述的概念及概念间的关系,量化领域概念的关联度,以此进行查询扩展.高校招生... 问答系统中查询词扩展是影响检索性能的关键因素之一.给出了领域本体的构建过程,提出了一种结合相似度与相关度的关联度计算方法,利用领域本体构建的概念网络描述的概念及概念间的关系,量化领域概念的关联度,以此进行查询扩展.高校招生问答系统的实例证明,这一方法是合理有效的. 展开更多
关键词 查询扩展 领域本体 语义相似度 语义相关度
在线阅读 下载PDF
基于本体的语义检索方法 被引量:6
16
作者 王旭阳 尉醒醒 《计算机工程与设计》 北大核心 2016年第9期2538-2542,共5页
为有效解决本体查询扩展的语义边界问题,提出一种基于本体和局部共现的查询扩展方法。计算概念在本体中的语义相似度和局部文档中的相关度,构成概念之间总的关联度来筛选扩展词;在此基础上,设计一个扩展词权重的计算方法,考虑原查询词... 为有效解决本体查询扩展的语义边界问题,提出一种基于本体和局部共现的查询扩展方法。计算概念在本体中的语义相似度和局部文档中的相关度,构成概念之间总的关联度来筛选扩展词;在此基础上,设计一个扩展词权重的计算方法,考虑原查询词的重要程度以及扩展词与原查询词的关系,改进查询与文档相关度的计算方法。实验结果表明,在设计的语义检索系统中,该方法在保证查全率的基础上能有效提高查准率。 展开更多
关键词 本体 查询扩展 语义相似度 查全率 查准率
在线阅读 下载PDF
基于增量协同过滤和潜在语义分析的混合推荐算法 被引量:8
17
作者 刘辉 万程峰 吴晓浩 《计算机工程与科学》 CSCD 北大核心 2019年第11期2033-2039,共7页
为了解决传统新闻推荐系统定期更新推荐算法不能根据用户喜好的变化进而动态地调整推荐列表的问题,提出了一种混合推荐算法(IULSACF)。该算法包含了2个关键部分:基于项目的增量更新协同过滤算法和基于关键词频率的潜在语义分析算法。该... 为了解决传统新闻推荐系统定期更新推荐算法不能根据用户喜好的变化进而动态地调整推荐列表的问题,提出了一种混合推荐算法(IULSACF)。该算法包含了2个关键部分:基于项目的增量更新协同过滤算法和基于关键词频率的潜在语义分析算法。该混合推荐算法在基于项目的增量更新协同过滤模块中,通过对项目相似度列表增量更新来动态地调整推荐列表,并结合潜在语义分析算法来确保所推荐文章的相关性。实验结果表明,所提出的IULSACF算法在各项评价指标上均优于传统的推荐方法。 展开更多
关键词 新闻推荐 增量更新 协同过滤 潜在语义分析 项目相似度
在线阅读 下载PDF
一种基于本体和用户日志的查询扩展方法 被引量:3
18
作者 欧阳柳波 谭睿哲 《计算机工程与应用》 CSCD 北大核心 2015年第1期151-155,217,共6页
为了解决信息检索中存在的用词歧义性问题,提出一种基于本体和用户日志的查询扩展方法。利用领域本体从语义层面扩展用户查询形成初始扩展概念集,结合用户查询日志利用共现度分析对初始扩展概念集进行二次筛选。实验结果表明,与传统的... 为了解决信息检索中存在的用词歧义性问题,提出一种基于本体和用户日志的查询扩展方法。利用领域本体从语义层面扩展用户查询形成初始扩展概念集,结合用户查询日志利用共现度分析对初始扩展概念集进行二次筛选。实验结果表明,与传统的基于局部共现的扩展方法和基于本体的扩展方法相比较,该方法在保障良好鲁棒性的同时,有效地提高了检索准确率。 展开更多
关键词 本体 查询扩展 用户日志 语义相似度 共现度
在线阅读 下载PDF
基于网页概率潜在语义信息的用户兴趣聚类 被引量:2
19
作者 钱雪忠 吴志媛 《计算机工程与科学》 CSCD 北大核心 2014年第4期765-771,共7页
为了能准确挖掘用户兴趣点,首先利用概率潜在语义分析PLSA模型将"网页-词"矩阵向量投影到概率潜在语义向量空间,并提出"自动相似度阈值选择"方法得到网页间的相似度阈值,最后提出将平面划分法与凝聚式层次聚类相结... 为了能准确挖掘用户兴趣点,首先利用概率潜在语义分析PLSA模型将"网页-词"矩阵向量投影到概率潜在语义向量空间,并提出"自动相似度阈值选择"方法得到网页间的相似度阈值,最后提出将平面划分法与凝聚式层次聚类相结合的凝聚式层次k中心点HAK-medoids算法,实现用户兴趣点聚类。实验结果表明,与传统的基于划分的算法相比,HAK-medoids算法聚类效果更好。同时,提出的用户兴趣点聚类技术在个性化服务领域可提高个性化推荐和搜索的效率。 展开更多
关键词 概率潜在语义分析 自动相似度阈值选择 用户兴趣点 凝聚式层次k中心点 个性化服务
在线阅读 下载PDF
基于语义相似度的自动文摘评价方法 被引量:3
20
作者 张培颖 《计算机工程与应用》 CSCD 北大核心 2009年第25期145-147,共3页
针对现有自动文摘内部评价方法存在主观性强,无法体现深层语义的缺陷,提出利用概率潜在语义分析计算原文和待评价摘要在潜在语义上的贡献,通过相似度的比较,得出符合原文语义的文摘。整个评价方法无需人为干预,实验表明,基于语义相似度... 针对现有自动文摘内部评价方法存在主观性强,无法体现深层语义的缺陷,提出利用概率潜在语义分析计算原文和待评价摘要在潜在语义上的贡献,通过相似度的比较,得出符合原文语义的文摘。整个评价方法无需人为干预,实验表明,基于语义相似度的评价方法实现简单、效果稳定,是一种更接近自然模型的评价方法。 展开更多
关键词 自动文摘 评价方法 概率潜在语义分析 相似度
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部