期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
隐含语义索引及其在中文文本处理中的应用研究 被引量:41
1
作者 周水庚 关佶红 胡运发 《小型微型计算机系统》 CSCD 北大核心 2001年第2期239-243,共5页
信息检索本质上是语义检索 ,而传统信息检索系统都是基于独立词索引 ,因此检索效果并不理想 .隐含语义索引是一种新型的信息检索模型 ,它通过奇异值分解 ,将词向量和文档向量投影到一个低维空间 ,消减了词和文档之间的语义模糊度 ,使得... 信息检索本质上是语义检索 ,而传统信息检索系统都是基于独立词索引 ,因此检索效果并不理想 .隐含语义索引是一种新型的信息检索模型 ,它通过奇异值分解 ,将词向量和文档向量投影到一个低维空间 ,消减了词和文档之间的语义模糊度 ,使得文档之间的语义关系更为明晰 .实验和理论结果证实了隐含语义索引能够取得更好的检索效果 .本文论述了隐含语义索引的理论基础 ,研究了隐含语义索引在中文文本处理中的应用 ,包括中文文本检索、中文文本分类和中文文本聚类等 . 展开更多
关键词 信息检索 隐含语义索引 中文文本处理 中文信息处理
在线阅读 下载PDF
基于P2P的隐含语义索引模型的研究 被引量:5
2
作者 郭敏 董健全 宋智 《计算机工程与设计》 CSCD 北大核心 2005年第11期2910-2912,2954,共4页
P2P作为一种新型的网络结构正受到越来越多的关注。目前在大多数P2P网络中的信息检索方法都是依据关键词匹配,通过查询请求与信息标识之间的简单匹配关系来获得查询结果。但是关键词匹配会产生很多用户不需要的结果。隐含语义索引是基... P2P作为一种新型的网络结构正受到越来越多的关注。目前在大多数P2P网络中的信息检索方法都是依据关键词匹配,通过查询请求与信息标识之间的简单匹配关系来获得查询结果。但是关键词匹配会产生很多用户不需要的结果。隐含语义索引是基于文本语义的检索模型。为提高系统的查准率,扩展在P2P下的查询方式,本文提出了在P2P网络中引入隐含语义索引模型进行信息检索,并模拟实现了一个基于P2P网络的隐含语义索引模型的试验平台。 展开更多
关键词 P2P 隐含语义索引模型 检索
在线阅读 下载PDF
隐含语义索引在吉林省农业知识问答系统中的应用
3
作者 肖艳华 王青蓝 +1 位作者 毕业莉 万发仁 《湖北农业科学》 北大核心 2011年第13期2740-2742,共3页
为了解决现有农业知识问答系统功能及业务流程中存在的一些问题,将隐含语义索引技术应用于吉林省农业知识问答系统中。该技术可以增强或消减词语在文档中语义的影响力,使文档之间的语义关系更为明晰,在一定程度上实现了自然语言检索,消... 为了解决现有农业知识问答系统功能及业务流程中存在的一些问题,将隐含语义索引技术应用于吉林省农业知识问答系统中。该技术可以增强或消减词语在文档中语义的影响力,使文档之间的语义关系更为明晰,在一定程度上实现了自然语言检索,消除了词语同义性和多义性所造成的影响,从而取得更好的检索效果。 展开更多
关键词 隐含语义索引 吉林省 农业知识 问答系统
在线阅读 下载PDF
一种扩展的向量空间模型-隐含语义索引模型研究
4
作者 张玉连 张敏 张波 《燕山大学学报》 CAS 2006年第1期87-90,共4页
在深入分析向量空间模型基础上,对其进行扩展,设计了一种隐含语义索引模型LSI。LSI通过奇异值分解,将词向量和文档向量投影到一个低维空间,消减了词和文档之间的语义模糊度。理论分析证明,隐含语义索引模型具有更准确的文档语义内容的... 在深入分析向量空间模型基础上,对其进行扩展,设计了一种隐含语义索引模型LSI。LSI通过奇异值分解,将词向量和文档向量投影到一个低维空间,消减了词和文档之间的语义模糊度。理论分析证明,隐含语义索引模型具有更准确的文档语义内容的表达能力,能够取得更好的检索效果。 展开更多
关键词 向量空间模型 隐含语义索引 信息检索
在线阅读 下载PDF
隐含语义索引技术在供求信息分类中的应用
5
作者 朱学昊 王儒敬 《计算机工程与应用》 CSCD 北大核心 2007年第14期192-194,共3页
介绍了一种信息抽取和自动分类的新应用,分析了传统分类方法的不足,介绍了一种基于隐含语义索引技术的文本分类改进方案。该技术是一新型的检索模型,它通过奇异值分解,或增强或消减词在文档中的语义影响力,使得文档之间的语义关系更为明... 介绍了一种信息抽取和自动分类的新应用,分析了传统分类方法的不足,介绍了一种基于隐含语义索引技术的文本分类改进方案。该技术是一新型的检索模型,它通过奇异值分解,或增强或消减词在文档中的语义影响力,使得文档之间的语义关系更为明晰,从而能容易地剔除掉那些语义关联弱的噪声数据,提高特征值提取精度和最后的分类准确度。 展开更多
关键词 隐含语义索引 奇异值分解 文本分类 信息抽取
在线阅读 下载PDF
归并奇异值分解:一种快速更新隐含语义索引的方法
6
作者 黄明 林家骏 《华东理工大学学报(自然科学版)》 CAS CSCD 北大核心 2018年第3期397-403,共7页
隐含语义索引(LSI)是一种解决信息检索中二义性问题和大规模文档分类的文档索引方法。为了提高LSI效率,应对大数据场景下文档量爆发式增长的问题,提出了一种通过归并奇异值分解来实现LSI快速更新的方法。该方法利用p-边宽单边对角矩阵... 隐含语义索引(LSI)是一种解决信息检索中二义性问题和大规模文档分类的文档索引方法。为了提高LSI效率,应对大数据场景下文档量爆发式增长的问题,提出了一种通过归并奇异值分解来实现LSI快速更新的方法。该方法利用p-边宽单边对角矩阵和箭头矩阵分解技术来加快中间矩阵的奇异值分解过程,并通过将新增文档矩阵的薄奇异值分解(PSVD)归并进主文档矩阵的PSVD以避免重复计算,加快LSI更新速度。通过数学证明论证了该方法的有效性,并讨论了该算法扩展到词条更新场景中的情形。在多个测试数据集上的实验验证了该方法可以在保证检索准确率的前提下有效提高LSI的更新效率。 展开更多
关键词 信息检索 隐含语义索引 奇异值分解 文档聚类 QR分解 箭头型矩阵
在线阅读 下载PDF
基于非负矩阵分解的隐含语义图像检索 被引量:7
7
作者 梁栋 杨杰 +1 位作者 卢进军 常宇畴 《上海交通大学学报》 EI CAS CSCD 北大核心 2006年第5期787-790,共4页
提出了一种基于非负矩阵分解(Non-negative Matrix Factorization,NMF)的隐含语义索引(Latent Semantic Indexing,LSI)模型用于图像检索.应用NMF训练算法构造了一个语义空间,将查询图像和原型图像都投影到该空间以获得语义特征,在此空... 提出了一种基于非负矩阵分解(Non-negative Matrix Factorization,NMF)的隐含语义索引(Latent Semantic Indexing,LSI)模型用于图像检索.应用NMF训练算法构造了一个语义空间,将查询图像和原型图像都投影到该空间以获得语义特征,在此空间中进行相似性的度量并将距离最近的图像返回给用户.与已有两种检索模型的实验结果对比表明,所提出模型是有效的. 展开更多
关键词 图像检索 隐含语义索引 非负矩阵分解 奇异值分解 语义空间
在线阅读 下载PDF
隐含语义检索及中文样本分析实例 被引量:5
8
作者 周文 龚礼明 蒋岚 《计算机应用》 CSCD 北大核心 2004年第S1期273-276,共4页
文中描述分析了一种智能型信息检索方式———隐含语义索引分析法 (LatentSemanticIndexing ,LSI) ,对文本的隐含含义进行挖掘 ,根据词汇、文本、提问式三者在语义上的关联产生检索结果 ,给出一个中文小型样本的隐含语义检索实例 ,进一... 文中描述分析了一种智能型信息检索方式———隐含语义索引分析法 (LatentSemanticIndexing ,LSI) ,对文本的隐含含义进行挖掘 ,根据词汇、文本、提问式三者在语义上的关联产生检索结果 ,给出一个中文小型样本的隐含语义检索实例 ,进一步分析隐含语义检索的原理。 展开更多
关键词 隐含语义索引分析法 奇异值分解 检索 语义 信息
在线阅读 下载PDF
基于核Batch SOM聚类优化的语义Web服务发现机制研究 被引量:6
9
作者 陈蕾 杨庚 +1 位作者 张迎周 陈燕俐 《电子与信息学报》 EI CSCD 北大核心 2011年第6期1307-1313,共7页
如何快速、准确和高效地发现满足用户需求的Web服务已成为制约服务发展的瓶颈之一。该文针对现有Web服务发现机制中存在的效率低下和查准率不高的两个主要问题,提出了一个基于核Batch SOM神经网络聚类优化的语义Web服务发现框架。该框... 如何快速、准确和高效地发现满足用户需求的Web服务已成为制约服务发展的瓶颈之一。该文针对现有Web服务发现机制中存在的效率低下和查准率不高的两个主要问题,提出了一个基于核Batch SOM神经网络聚类优化的语义Web服务发现框架。该框架分别在服务表示阶段引入WordNet和隐含语义索引技术对Web服务进行语义扩展和概念语义空间降维;在服务分类阶段利用核机学习理论改进一类适用于Web服务分类的核Batch SOM神经网络算法;在服务匹配阶段提出一种基于核余弦相似性测度的Web服务匹配算法。最后,真实Web服务数据集上的实验结果验证了所提出方法的可行性。 展开更多
关键词 WEB服务发现 自组织映射神经网络 WORDNET 隐含语义索引 相似性度量
在线阅读 下载PDF
基于LSI的图像语义检索 被引量:1
10
作者 沈玉利 郭雷 任建峰 《计算机工程与应用》 CSCD 北大核心 2005年第22期64-65,69,共3页
图像语义检索是实现图像快速、直观、准确查询的有效办法,针对目前直接采用图像低层特征无法满足图像语义查询的问题,该文提出了一种利用LSI技术,实现图像语义的检索方法。
关键词 隐含语义索引 图像语义 图像检索 奇异值分解
在线阅读 下载PDF
基于语义Web挖掘的宽范围扫描环境弱信号识别 被引量:1
11
作者 顾伟 傅德胜 蔡玮 《科学技术与工程》 北大核心 2013年第29期8791-8797,共7页
针对宽范围扫描环境中传统方法在弱信号探测评估时通常需要过高的人工干预而导致结果质量较低的问题,提出了基于语义Web挖掘的弱信号识别方法。首先借助于网络信息来表示组织环境;然后利用隐含语义索引在不同的语境中识别出相似的文本模... 针对宽范围扫描环境中传统方法在弱信号探测评估时通常需要过高的人工干预而导致结果质量较低的问题,提出了基于语义Web挖掘的弱信号识别方法。首先借助于网络信息来表示组织环境;然后利用隐含语义索引在不同的语境中识别出相似的文本模式;最后采用一种新的弱信号最大化方法计算出相关弱信号的最大数量;并由奇异值分解的维数表示,从而实现弱信号的高效识别。实验结果表明,相比其他最先进的弱信号识别方法,所提方法取得了更好的识别性能。 展开更多
关键词 弱信号 扫描环境 隐含语义索引 组织环境 奇异值分解 WEB挖掘
在线阅读 下载PDF
一种压缩域特征提取与语义图像检索技术 被引量:3
12
作者 曹奎 冯玉才 《小型微型计算机系统》 CSCD 北大核心 2005年第1期151-155,共5页
为了解决“语义鸿沟”问题 ,通过将隐含语义索引 (L SI)技术引入到图像语义提取问题的研究中 ,试图从图像的视觉特征中抽取出“高层概念”.基于 GM(1,1)压缩域中的一种图像特征 ,提出了一种建立“图像视觉特征”与“语义信息”之间映射... 为了解决“语义鸿沟”问题 ,通过将隐含语义索引 (L SI)技术引入到图像语义提取问题的研究中 ,试图从图像的视觉特征中抽取出“高层概念”.基于 GM(1,1)压缩域中的一种图像特征 ,提出了一种建立“图像视觉特征”与“语义信息”之间映射的技术方法 .实验研究表明 ,这种基于压缩域特征和 L SI技术的图像检索方法能显著改善图像检索的性能 。 展开更多
关键词 图像表示 压缩域特征 基于内容的图像检索 语义鸿沟 隐含语义索引
在线阅读 下载PDF
基于LSI和自组织神经网络的高效文本聚类方法 被引量:7
13
作者 徐建锁 王正欧 《天津大学学报(自然科学与工程技术版)》 EI CAS CSCD 北大核心 2004年第11期1026-1030,共5页
根据隐含语义索引(LSI)理论和动态自组织映射神经网络理论,提出了一种文本聚类的新方法.应用动态自组织映射神经网络来实现文本聚类,不必预先给定聚类个数,可以在任意合适的位置生成一个新的类,具有聚类灵活和精度高等特点,对于高维的... 根据隐含语义索引(LSI)理论和动态自组织映射神经网络理论,提出了一种文本聚类的新方法.应用动态自组织映射神经网络来实现文本聚类,不必预先给定聚类个数,可以在任意合适的位置生成一个新的类,具有聚类灵活和精度高等特点,对于高维的文本特征向量来说,聚类速度很低;该方法应用LSI理论来建立文本集的向量空间模型,在词条的权重中引入了语义关系,消减了原词条矩阵中包含的"噪声"因素,从而更加突出了词和文本之间的语义关系.通过奇异值分解(SVD),有效地降低了向量空间的维数,克服了自组织神经网络的聚类缺陷,提高了文本聚类的精度和速度. 展开更多
关键词 文本聚类 隐含语义索引 奇异值分解 自组织神经网络 向量空间模型
在线阅读 下载PDF
基于文档实例的中文信息检索 被引量:2
14
作者 周水庚 关佶红 胡运发 《计算机工程与应用》 CSCD 北大核心 2000年第10期14-16,29,共4页
传统的信息检索系统基于关键词建立索引并进行信息检索.这些系统存在查询返回文档集大、准确率低和普通用户不便于构造查询等不足.为此,该文提出基于文档实例的信息检索,即以已有文档作为样本,在文档库中检索与样本文档相似的所有文档.... 传统的信息检索系统基于关键词建立索引并进行信息检索.这些系统存在查询返回文档集大、准确率低和普通用户不便于构造查询等不足.为此,该文提出基于文档实例的信息检索,即以已有文档作为样本,在文档库中检索与样本文档相似的所有文档.文中给出了基于文档实例的中文信息检索的解决方法和实现技术.初步实验结果表明该方法是行之有效的. 展开更多
关键词 中文信息检索 文本分类 隐含语义索引 文档实例
在线阅读 下载PDF
文本处理中基于随机映射的加速LSI方法 被引量:1
15
作者 钱晓东 王正欧 《天津大学学报(自然科学与工程技术版)》 EI CAS CSCD 北大核心 2005年第4期372-376,共5页
首先针对在文本处理的高维矢量环境中Kohonen自组织映射神经网络的计算瓶颈问题和输入矢量空间中存在的问题进行分析,然后对随机映射(RM)和隐含语义索引(LSI)方法分别进行理论分析,提出用于文本处理的基于随机映射的加速LSI方法.试验结... 首先针对在文本处理的高维矢量环境中Kohonen自组织映射神经网络的计算瓶颈问题和输入矢量空间中存在的问题进行分析,然后对随机映射(RM)和隐含语义索引(LSI)方法分别进行理论分析,提出用于文本处理的基于随机映射的加速LSI方法.试验结果表明,加速LSI方法可以在凸现原有语义联系的基础上,低代价、有效、可控地解决上述问题,极大地降低文本处理环境中Kohonen自组织神经网络的规模和计算代价. 展开更多
关键词 文本处理 隐含语义索引 自组织神经网络 随机映射
在线阅读 下载PDF
适用于P2P的系统查询扩展优化方法 被引量:5
16
作者 曹华梁 朱星 俞勇 《上海交通大学学报》 EI CAS CSCD 北大核心 2005年第10期1706-1710,共5页
P2P系统中,各种文本文档是很重要的共享资源,而传统的信息检索技术无法在此复杂系统中获得良好的效果.通过对隐含语义索引的分析,提出了语义双重查询扩展(SDQE)的方法,它利用各个peer上文档集提供的隐式反馈,通过比较查询的上下文信息,... P2P系统中,各种文本文档是很重要的共享资源,而传统的信息检索技术无法在此复杂系统中获得良好的效果.通过对隐含语义索引的分析,提出了语义双重查询扩展(SDQE)的方法,它利用各个peer上文档集提供的隐式反馈,通过比较查询的上下文信息,发现用户的隐含偏好,从而找出最符合用户查询需求的文档.实验证明,SDQE是可行的,并能有效地提高P2P系统中文本检索性能. 展开更多
关键词 查询优化 语义双重查询扩展 隐含语义索引 P2P系统
在线阅读 下载PDF
基于LSI的代码-文档可追溯关联挖掘研究 被引量:1
17
作者 杨雪敏 张毅坤 +2 位作者 崔颖安 张保卫 夏辉 《计算机工程》 CAS CSCD 北大核心 2011年第8期34-36,共3页
软件过程产品间可追溯关联挖掘对软件维护及需求跟踪等众多领域至关重要。基于此,提出一种基于潜在语义索引提取程序代码和中文文档关联信息的方法,该方法是对向量空间模型的改进,通过分析文本间隐含的语义结构来确定关联度,而不依赖于... 软件过程产品间可追溯关联挖掘对软件维护及需求跟踪等众多领域至关重要。基于此,提出一种基于潜在语义索引提取程序代码和中文文档关联信息的方法,该方法是对向量空间模型的改进,通过分析文本间隐含的语义结构来确定关联度,而不依赖于词项的匹配。实验结果表明,该方法不依赖于代码和文档预先定义的同义词库和知识库,并能一定程度上提高查全率和查准率。 展开更多
关键词 软件维护 可追溯关联挖掘 隐含语义索引 信息检索 跨语言信息检索
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部