期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
55
篇文章
<
1
2
3
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于潜在语义索引的文本摘要方法
被引量:
17
1
作者
林鸿飞
高仁璟
《大连理工大学学报》
CAS
CSCD
北大核心
2001年第6期744-748,共5页
因特网上的在线文本自动编制摘要可以帮助用户有选择地阅读 .给出了基于潜在语义索引的文本摘要方法 .它采用向量空间模型作为文本表示方法 ,利用潜在语义索引来减少词汇间的“斜交”现象 ,在语义空间上进行项、句子、段落与文本之间的...
因特网上的在线文本自动编制摘要可以帮助用户有选择地阅读 .给出了基于潜在语义索引的文本摘要方法 .它采用向量空间模型作为文本表示方法 ,利用潜在语义索引来减少词汇间的“斜交”现象 ,在语义空间上进行项、句子、段落与文本之间的相似度计算 ,而不是单纯地依赖于特征项的频率信息 .依据对于文本主题的表现能力来确定摘要的各个组成部分及其组成方式 .此外 ,给出了文本摘要的评估方法 .
展开更多
关键词
人工智能
语义
信息
文本摘要
潜在语义索引
微量空间模型
特征抽取
摘要评价
因特网
在线阅读
下载PDF
职称材料
基于Rough集潜在语义索引的Web文档分类
被引量:
7
2
作者
何明
冯博琴
傅向华
《计算机工程》
CAS
CSCD
北大核心
2004年第13期3-5,共3页
Rough集(粗糙集)理论是一种处理不确定或模糊知识的数学工具。提出了一种基于Rough集理论的潜在语义索引的Web文档分类 方法。首先应用向量空间模型表示Web文档信息,然后通过矩阵的奇异值分解来进行信息过滤和潜在语义索引;运用属性约...
Rough集(粗糙集)理论是一种处理不确定或模糊知识的数学工具。提出了一种基于Rough集理论的潜在语义索引的Web文档分类 方法。首先应用向量空间模型表示Web文档信息,然后通过矩阵的奇异值分解来进行信息过滤和潜在语义索引;运用属性约简算法生成分类 规则,最后利用多知识库进行文档分类。通过试验比较,该方法具有较好的分类效果。
展开更多
关键词
粗糙集
潜在语义索引
WEB文档分类
信息过滤
信息检索
在线阅读
下载PDF
职称材料
基于潜在语义索引和自组织映射网的检索结果聚类方法
被引量:
4
3
作者
陈毅恒
秦兵
+2 位作者
刘挺
王平
李生
《计算机研究与发展》
EI
CSCD
北大核心
2009年第7期1176-1183,共8页
随着互联网的不断发展和数据量的不断增加,搜索引擎的作用日益明显,用户更多地依靠搜索引擎来查找需要的信息.利用潜在语义索引(LSI)理论和自组织映射神经网络(SOM)理论,提出了一种文本聚类的新方法——LSOM.该方法应用SOM网络来实现检...
随着互联网的不断发展和数据量的不断增加,搜索引擎的作用日益明显,用户更多地依靠搜索引擎来查找需要的信息.利用潜在语义索引(LSI)理论和自组织映射神经网络(SOM)理论,提出了一种文本聚类的新方法——LSOM.该方法应用SOM网络来实现检索结果文本聚类,不必预先给定类别个数,具有聚类灵活和精度高等特点;同时,该方法应用LSI理论来建立向量空间模型,在词条的权重中引入了语义关系,对于高维的文本特征向量,消减原词条矩阵中包含的噪声,提高聚类速度.LSOM使用一种新的类别标签提取方法,并将提取的标签用于解决SOM基本类划分问题,算法在类别标签和聚类效果评价指标上都比已有的算法有所提高.
展开更多
关键词
检索结果聚类
潜在语义索引
自组织映射网
标签
边界划分
在线阅读
下载PDF
职称材料
潜在语义索引方法在信息过滤中的应用
被引量:
16
4
作者
牛伟霞
张永奎
《计算机工程与应用》
CSCD
北大核心
2001年第9期57-60,共4页
信息过滤是一种WEB信息服务的新技术,旨在实现网络服务器向客户端主动的信息推迟,其核心技术之一是用户兴趣主题模型的表示。文章利用潜在语义索引方法构建用户兴趣主题模型,并对网上大量的中文科技文献信息进行过滤。初步实验的...
信息过滤是一种WEB信息服务的新技术,旨在实现网络服务器向客户端主动的信息推迟,其核心技术之一是用户兴趣主题模型的表示。文章利用潜在语义索引方法构建用户兴趣主题模型,并对网上大量的中文科技文献信息进行过滤。初步实验的结果表明,该方法与传统的向量空间方法相比,效率有明显提高。
展开更多
关键词
信息过滤
潜在语义索引
兴趣主题模型
信息检索
WEB
互联网
在线阅读
下载PDF
职称材料
基于潜在语义索引的文本浏览机制
被引量:
29
5
作者
林鸿飞
姚天顺
《中文信息学报》
CSCD
北大核心
2000年第5期49-56,共8页
文本浏览是伴随着因特网上日益增多的在线文本而出现的辅助阅读机制 ,本文给出了基于潜在语义索引的文本浏览机制。它吸取了潜在语义索引和概念标注的优点 ,利用潜在语义索引 ,减少词汇间的“斜交”现象 ,在语义空间上进行项与项、文本...
文本浏览是伴随着因特网上日益增多的在线文本而出现的辅助阅读机制 ,本文给出了基于潜在语义索引的文本浏览机制。它吸取了潜在语义索引和概念标注的优点 ,利用潜在语义索引 ,减少词汇间的“斜交”现象 ,在语义空间上进行项与项、文本与文本、项与文本之间的相似度计算。利用概念词典将文本特征项按语义分类 ,给予层次分类以确定的含义。最后 ,实现以分层概念为基础的信息导航。
展开更多
关键词
文本浏览
潜在语义索引
概念标注
特征抽取
在线阅读
下载PDF
职称材料
潜在语义索引中特征优化技术的研究
被引量:
7
6
作者
季铎
郑伟
蔡东风
《中文信息学报》
CSCD
北大核心
2009年第2期69-76,共8页
潜在语义索引被广泛应用于信息检索、文本分类、自动问答等领域中。潜在语义索引是一种降维方法,它把共现特征映射到同一维空间上,而非共现特征映射到不同的空间上。在潜在语义索引的语义空间中,共现特征通过文档内部以及文档之间的...
潜在语义索引被广泛应用于信息检索、文本分类、自动问答等领域中。潜在语义索引是一种降维方法,它把共现特征映射到同一维空间上,而非共现特征映射到不同的空间上。在潜在语义索引的语义空间中,共现特征通过文档内部以及文档之间的特征传递关系获得。该文认为这种特征传递关系会引入一些不存在的共现特征,从而降低潜在语义索引的性能,应该对这种特征传递关系进行一些选择,削除不存在的共现特征信息。该文采用文档频率对文档集合进行特征选择,用Complete—Link聚类算法在两个公开语料上进行三个实验,实验结果显示,保留文档频度的10%~15%时,其F1值分别提高了6.5770%,1.9928%和3.3614%。
展开更多
关键词
计算机应用
中文信息处理
潜在语义索引
共现特征
奇异值分解
特征选择
在线阅读
下载PDF
职称材料
基于潜在语义索引的文本特征词权重计算方法
被引量:
17
7
作者
李媛媛
马永强
《计算机应用》
CSCD
北大核心
2008年第6期1460-1462,1466,共4页
潜在语义索引具有可计算性强,需要人参与少等优点。对其中重要的优化过程——权重计算,进行了深入分析。针对目前应用最广泛的TF-IDF方法中,采用线性处理的不合理性以及难以突出对文本内容起关键性作用的特征的缺点,提出了一种基于"...
潜在语义索引具有可计算性强,需要人参与少等优点。对其中重要的优化过程——权重计算,进行了深入分析。针对目前应用最广泛的TF-IDF方法中,采用线性处理的不合理性以及难以突出对文本内容起关键性作用的特征的缺点,提出了一种基于"Sigmiod函数"和"位置因子"的新权重方案。突出了文本中不同特征词的重要程度,更有利于潜在语义空间的构造。通过实验平台"中文潜在语义索引分析系统"的测试结果表明,该权重方法更利于基于潜在语义的检索性能的提高。
展开更多
关键词
潜在语义索引
Sigmiod函数
位置因子
权重算法
在线阅读
下载PDF
职称材料
基于潜在语义索引的Web信息预测采集过滤方法
被引量:
9
8
作者
李振星
陆大珏
+2 位作者
任继成
唐卫清
唐荣锡
《计算机辅助设计与图形学学报》
EI
CSCD
北大核心
2004年第1期142-147,共6页
Web信息急速膨胀使有效定向采集特定领域信息成为网上信息检索中一个日益重要的研究方向 提出一种基于潜在语义索引的Web信息预测采集过滤方法 在样本文档集潜在语义索引对文档相似计算的基础上 ,构造出用户兴趣模型 ,判断页面相关性...
Web信息急速膨胀使有效定向采集特定领域信息成为网上信息检索中一个日益重要的研究方向 提出一种基于潜在语义索引的Web信息预测采集过滤方法 在样本文档集潜在语义索引对文档相似计算的基础上 ,构造出用户兴趣模型 ,判断页面相关性进行文本过滤 通过对Web站点结构分析、对未知网页的相关性预测来控制信息采集过程 在保持定向采集精度的同时 ,缩短采集时间、减少存储、加快检索 。
展开更多
关键词
潜在语义索引
信息采集
Web检索系统
网络资源
互联网
在线阅读
下载PDF
职称材料
一种大规模数据的快速潜在语义索引
被引量:
10
9
作者
卫威
王建民
《计算机工程》
CAS
CSCD
北大核心
2009年第15期35-37,40,共4页
潜在语义索引(LSI)已应用到现代信息检索的多个领域,但矩阵奇异值分解的高复杂度阻碍了该技术在大规模数据上的应用。提出一种大规模数据的快速LSI方法。给出一个降维问题的统一框架,LSI作为一种特征提取算法,可以在这个框架下转化为一...
潜在语义索引(LSI)已应用到现代信息检索的多个领域,但矩阵奇异值分解的高复杂度阻碍了该技术在大规模数据上的应用。提出一种大规模数据的快速LSI方法。给出一个降维问题的统一框架,LSI作为一种特征提取算法,可以在这个框架下转化为一个特征选择问题。利用该技术在最大程度保持LSI降维效果的同时,简化LSI的计算,使其能够应用于大规模数据。
展开更多
关键词
潜在语义索引
降维
特征选择
特征提取
在线阅读
下载PDF
职称材料
基于潜在语义索引的SVM文本分类模型
被引量:
3
10
作者
郭武斌
周宽久
张世荣
《情报学报》
CSSCI
北大核心
2009年第6期827-833,共7页
本文将潜在语义索引理论与支持向量机方法相结合,对文本向量各维与文本的语义联系进行特征抽取,建立了完整的基于潜在语义索引的支持向量机文本分类模型,分析了该方法与分词的维数以及SVM惩罚因子选择之间的关系。并在NN-SVM分类算法的...
本文将潜在语义索引理论与支持向量机方法相结合,对文本向量各维与文本的语义联系进行特征抽取,建立了完整的基于潜在语义索引的支持向量机文本分类模型,分析了该方法与分词的维数以及SVM惩罚因子选择之间的关系。并在NN-SVM分类算法的基础上,通过计算样本点与其最近邻点类别的异同以及该点与其k个同类近邻点在核空间的平均距离来修剪混淆点,提出了一种改进的NN-SVM算法:KCNN-SVM算法。利用该算法对降维后的训练集进行修剪。实验表明,用新的模型进行文本分类,与单纯支持向量机相比,受到文本分词维数以及支持向量机惩罚因子的影响更小,其分类正确率更高。
展开更多
关键词
支持向量机
核空间
潜在语义索引
文本分类
在线阅读
下载PDF
职称材料
基于潜在语义索引的科技文献主题挖掘
被引量:
4
11
作者
刘勘
朱芳芳
《计算机工程与应用》
CSCD
2014年第24期113-117,150,共6页
提出了一种基于潜在语义的科技文献主题挖掘方法,描述了科技文献的主题挖掘模型。对科技文献集进行预处理,计算特征词权重,构造出词汇-文献矩阵。用改进的LSI算法对稀疏矩阵进行降维得到固定的主题-文献矩阵。取权重最高的主题作为该文...
提出了一种基于潜在语义的科技文献主题挖掘方法,描述了科技文献的主题挖掘模型。对科技文献集进行预处理,计算特征词权重,构造出词汇-文献矩阵。用改进的LSI算法对稀疏矩阵进行降维得到固定的主题-文献矩阵。取权重最高的主题作为该文献的主题。该方法利用Frobenius范数来规范矩阵,对稀疏矩阵进行降维,可以快速精确地挖掘出科技文献的主题。
展开更多
关键词
(GB7713-8
规定每篇文章应选取
3~8
个关键
潜在语义索引
主题挖掘
科技文献
在线阅读
下载PDF
职称材料
使用基于SVM的局部潜在语义索引进行文本分类
被引量:
4
12
作者
张秋余
刘洋
《计算机应用》
CSCD
北大核心
2007年第6期1382-1384,共3页
潜在语义索引(LSI)通过奇异值分解(SVD)获得原始词—文档矩阵的潜在语义结构,在一定程度上解决了一词多义和多词一义问题。但目前文本分类中使用LSI方法的效果并不理想,这是因为没有充分考虑分类信息。为解决该问题,提出一种改进的局部...
潜在语义索引(LSI)通过奇异值分解(SVD)获得原始词—文档矩阵的潜在语义结构,在一定程度上解决了一词多义和多词一义问题。但目前文本分类中使用LSI方法的效果并不理想,这是因为没有充分考虑分类信息。为解决该问题,提出一种改进的局部潜在语义索引(LLSI)方法,使用支持向量机(SVM)来产生局部区域。实验结果表明,该方法是有效的。
展开更多
关键词
文本分类
潜在语义索引
支持向量机
局部区域
在线阅读
下载PDF
职称材料
基于潜在语义索引的文本结构分析方法的研究
被引量:
4
13
作者
刘军万
刘飞飞
《情报杂志》
CSSCI
北大核心
2004年第1期56-58,共3页
文本结构分析是文本处理领域中的重要内容 ,它可以有效地改进文本检索、文本过滤以及文本摘要的精度。通过描述文本的物理结构和逻辑结构以及文本分析的背景 ,将潜在语义索引引入文本结构分析中 ,提出了基于潜在语义索引的层次分析方法 ...
文本结构分析是文本处理领域中的重要内容 ,它可以有效地改进文本检索、文本过滤以及文本摘要的精度。通过描述文本的物理结构和逻辑结构以及文本分析的背景 ,将潜在语义索引引入文本结构分析中 ,提出了基于潜在语义索引的层次分析方法 ,该方法保证了层次划分的有序性和聚合性 ,可操作性强 ,便于解释 ,并给出了在文本检索、文本过滤和文本摘要中的应用。
展开更多
关键词
潜在语义索引
文本结构
文本分析
文本检索
文本过滤
在线阅读
下载PDF
职称材料
一种基于潜在语义索引的“垃圾”邮件过滤方法
被引量:
17
14
作者
陈华辉
《计算机应用研究》
CSCD
2000年第10期17-18,35,共3页
提出了一种基于潜在语义索引(LSI)的“垃圾”邮件过滤方法,讨论了邮件概念空间的构造,该空间中邮件相似度的计算和“垃圾”邮件的过滤。
关键词
信息检索
电子邮件
潜在语义索引
过滤
垃圾邮件
在线阅读
下载PDF
职称材料
文本检索的潜在语义索引法初探
被引量:
11
15
作者
杨梁彬
《大学图书馆学报》
CSSCI
北大核心
2003年第6期68-72,84,共6页
传统的文本检索方式是基于提问集合和文本集合的单纯语词匹配检索,然而这并不能解决检索实践过程中存在的同义和多义问题。文章阐述了文本检索的潜在语义索引法的原理并通过实验来验证潜在语义索引可以用来解决同义和多义问题,完善检索...
传统的文本检索方式是基于提问集合和文本集合的单纯语词匹配检索,然而这并不能解决检索实践过程中存在的同义和多义问题。文章阐述了文本检索的潜在语义索引法的原理并通过实验来验证潜在语义索引可以用来解决同义和多义问题,完善检索系统的性能。
展开更多
关键词
文本检索
潜在语义索引
法
LSI
奇异值分解
SVD
加权方法
在线阅读
下载PDF
职称材料
基于潜在语义索引的中文文本聚类的研究
被引量:
4
16
作者
马国俊
贠卫国
《现代电子技术》
2005年第10期58-59,共2页
讨论了中文文本聚类的现状以及存在的问题,介绍了向量空间模型,详细阐述了潜在语义索引理论以及采用该模型进行中文文本聚类的主要步骤,最后采用两种模型进行了实验对比,实验表明采用潜在语义索引模型可以取得更好的聚类效果。
关键词
文本聚类
潜在语义索引
向量空间模型
信息检索
在线阅读
下载PDF
职称材料
基于VSM的潜在语义索引
被引量:
1
17
作者
王瑛
《陕西科技大学学报(自然科学版)》
2010年第5期151-154,158,共5页
传统向量空间模型信息检索技术,只是统计关键词在文档中出现的频度,检索结果不能反映出文档的相关性.为了解决关键词检索时潜在语义的挖掘问题,提出了一种基于向量空间模型的潜在语义索引的改进算法.对比实验证明,该算法能够有效提高检...
传统向量空间模型信息检索技术,只是统计关键词在文档中出现的频度,检索结果不能反映出文档的相关性.为了解决关键词检索时潜在语义的挖掘问题,提出了一种基于向量空间模型的潜在语义索引的改进算法.对比实验证明,该算法能够有效提高检索查准率.
展开更多
关键词
向量空间模型
潜在语义索引
信息检索
在线阅读
下载PDF
职称材料
潜在语义索引在FAQ构建中的应用研究
被引量:
3
18
作者
李霞
张太红
李莉
《石河子大学学报(自然科学版)》
CAS
2005年第6期778-781,共4页
研究了潜在语义索引在中文自动问答系统FAQ库构建中的应用,并着重阐述了句子相似度的计算方法以及使用LSI对FAQ库去重的实验选取方法,结果显示LSI方法在一定程度上优于TF×IDF方法。
关键词
自动问答
FAQ
潜在语义索引
句子相似度
在线阅读
下载PDF
职称材料
垃圾邮件过滤中潜在语义索引的应用
19
作者
王鹏鸣
《郑州大学学报(理学版)》
CAS
北大核心
2010年第2期78-82,共5页
将潜在语义索引(LSI)应用于垃圾邮件过滤领域,并将其与向量空间模型(VSM)和经典的邮件过滤器Spa-mAssassin系统进行比较.另外,对基于词提取技术的邮件文本特征集合和SpamAssassin系统提取的邮件"元特征"集合进行了对比.实验...
将潜在语义索引(LSI)应用于垃圾邮件过滤领域,并将其与向量空间模型(VSM)和经典的邮件过滤器Spa-mAssassin系统进行比较.另外,对基于词提取技术的邮件文本特征集合和SpamAssassin系统提取的邮件"元特征"集合进行了对比.实验结果表明,LSI与VSM均取得了较SpamAssassin系统更优的分类效果.
展开更多
关键词
垃圾邮件过滤
潜在语义索引
向量空间模型
在线阅读
下载PDF
职称材料
一种基于潜在语义结构的文本分类模型
被引量:
27
20
作者
曾雪强
王明文
陈素芬
《华南理工大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2004年第z1期99-102,共4页
潜在语义索引(LSI)模型能在一定程度上解决一词多义和多词一义问题,并能过滤一部分文档噪音.然而在LSI模型中,一些对分类贡献大的特征,由于其对应的特征值小而被滤掉.针对这一问题,文中提出了一种扩展LSI模型的文本分类模型.该模型在尽...
潜在语义索引(LSI)模型能在一定程度上解决一词多义和多词一义问题,并能过滤一部分文档噪音.然而在LSI模型中,一些对分类贡献大的特征,由于其对应的特征值小而被滤掉.针对这一问题,文中提出了一种扩展LSI模型的文本分类模型.该模型在尽量保留文档信息的同时,增加考虑了文档的类别信息,从而能比LSI模型更好地表示原始文档空间中的潜在语义结构.
展开更多
关键词
文本分类
潜在语义索引
偏最小二乘法
在线阅读
下载PDF
职称材料
题名
基于潜在语义索引的文本摘要方法
被引量:
17
1
作者
林鸿飞
高仁璟
机构
大连理工大学电子与信息学院
出处
《大连理工大学学报》
CAS
CSCD
北大核心
2001年第6期744-748,共5页
文摘
因特网上的在线文本自动编制摘要可以帮助用户有选择地阅读 .给出了基于潜在语义索引的文本摘要方法 .它采用向量空间模型作为文本表示方法 ,利用潜在语义索引来减少词汇间的“斜交”现象 ,在语义空间上进行项、句子、段落与文本之间的相似度计算 ,而不是单纯地依赖于特征项的频率信息 .依据对于文本主题的表现能力来确定摘要的各个组成部分及其组成方式 .此外 ,给出了文本摘要的评估方法 .
关键词
人工智能
语义
信息
文本摘要
潜在语义索引
微量空间模型
特征抽取
摘要评价
因特网
Keywords
artificial intelligence
semantic information/text summary
latent semantic indexing
vector space model
feature extraction
text summary evaluation
artificial intelligence
分类号
TP393 [自动化与计算机技术—计算机应用技术]
G356.7 [文化科学—情报学]
在线阅读
下载PDF
职称材料
题名
基于Rough集潜在语义索引的Web文档分类
被引量:
7
2
作者
何明
冯博琴
傅向华
机构
西安交通大学计算机科学与技术系
出处
《计算机工程》
CAS
CSCD
北大核心
2004年第13期3-5,共3页
文摘
Rough集(粗糙集)理论是一种处理不确定或模糊知识的数学工具。提出了一种基于Rough集理论的潜在语义索引的Web文档分类 方法。首先应用向量空间模型表示Web文档信息,然后通过矩阵的奇异值分解来进行信息过滤和潜在语义索引;运用属性约简算法生成分类 规则,最后利用多知识库进行文档分类。通过试验比较,该方法具有较好的分类效果。
关键词
粗糙集
潜在语义索引
WEB文档分类
信息过滤
信息检索
Keywords
s Rough set
Latent semantic indexing
Web document classification
Information filtering
Information retrieval
分类号
TP393 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于潜在语义索引和自组织映射网的检索结果聚类方法
被引量:
4
3
作者
陈毅恒
秦兵
刘挺
王平
李生
机构
哈尔滨工业大学计算机学院信息检索研究室
出处
《计算机研究与发展》
EI
CSCD
北大核心
2009年第7期1176-1183,共8页
基金
国家自然科学基金项目(60675034)
国家"八六三"高技术研究发展计划基金项目(2008AA01Z144)~~
文摘
随着互联网的不断发展和数据量的不断增加,搜索引擎的作用日益明显,用户更多地依靠搜索引擎来查找需要的信息.利用潜在语义索引(LSI)理论和自组织映射神经网络(SOM)理论,提出了一种文本聚类的新方法——LSOM.该方法应用SOM网络来实现检索结果文本聚类,不必预先给定类别个数,具有聚类灵活和精度高等特点;同时,该方法应用LSI理论来建立向量空间模型,在词条的权重中引入了语义关系,对于高维的文本特征向量,消减原词条矩阵中包含的噪声,提高聚类速度.LSOM使用一种新的类别标签提取方法,并将提取的标签用于解决SOM基本类划分问题,算法在类别标签和聚类效果评价指标上都比已有的算法有所提高.
关键词
检索结果聚类
潜在语义索引
自组织映射网
标签
边界划分
Keywords
search result clustering
LSI
SOM
label
boundary detection
分类号
TP391.2 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
潜在语义索引方法在信息过滤中的应用
被引量:
16
4
作者
牛伟霞
张永奎
机构
山西大学计算机科学系
出处
《计算机工程与应用》
CSCD
北大核心
2001年第9期57-60,共4页
基金
山西省自然科学基金!(编号:991035)
山西省归国留学基金的资助!(编号:lx976003)
文摘
信息过滤是一种WEB信息服务的新技术,旨在实现网络服务器向客户端主动的信息推迟,其核心技术之一是用户兴趣主题模型的表示。文章利用潜在语义索引方法构建用户兴趣主题模型,并对网上大量的中文科技文献信息进行过滤。初步实验的结果表明,该方法与传统的向量空间方法相比,效率有明显提高。
关键词
信息过滤
潜在语义索引
兴趣主题模型
信息检索
WEB
互联网
Keywords
Information filtering,Latent Semantic Indexing,Topic Profile, Information Retrieval
分类号
G354.4 [文化科学—情报学]
在线阅读
下载PDF
职称材料
题名
基于潜在语义索引的文本浏览机制
被引量:
29
5
作者
林鸿飞
姚天顺
机构
大连理工大学计算机系
东北大学计算机系
出处
《中文信息学报》
CSCD
北大核心
2000年第5期49-56,共8页
基金
国家自然科学基金!资助项目 (编号 :6 96 75 0 19)
国家教委博士点基金
文摘
文本浏览是伴随着因特网上日益增多的在线文本而出现的辅助阅读机制 ,本文给出了基于潜在语义索引的文本浏览机制。它吸取了潜在语义索引和概念标注的优点 ,利用潜在语义索引 ,减少词汇间的“斜交”现象 ,在语义空间上进行项与项、文本与文本、项与文本之间的相似度计算。利用概念词典将文本特征项按语义分类 ,给予层次分类以确定的含义。最后 ,实现以分层概念为基础的信息导航。
关键词
文本浏览
潜在语义索引
概念标注
特征抽取
Keywords
text browsing
latent semantic indexing
concept tagging
text feature extraction
分类号
TP393.092 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
潜在语义索引中特征优化技术的研究
被引量:
7
6
作者
季铎
郑伟
蔡东风
机构
沈阳航空工业学院知识工程中心
出处
《中文信息学报》
CSCD
北大核心
2009年第2期69-76,共8页
基金
国家863计划课题资助项目(2006AA01Z148)
教育部科学技术研究重点项目(207148)
文摘
潜在语义索引被广泛应用于信息检索、文本分类、自动问答等领域中。潜在语义索引是一种降维方法,它把共现特征映射到同一维空间上,而非共现特征映射到不同的空间上。在潜在语义索引的语义空间中,共现特征通过文档内部以及文档之间的特征传递关系获得。该文认为这种特征传递关系会引入一些不存在的共现特征,从而降低潜在语义索引的性能,应该对这种特征传递关系进行一些选择,削除不存在的共现特征信息。该文采用文档频率对文档集合进行特征选择,用Complete—Link聚类算法在两个公开语料上进行三个实验,实验结果显示,保留文档频度的10%~15%时,其F1值分别提高了6.5770%,1.9928%和3.3614%。
关键词
计算机应用
中文信息处理
潜在语义索引
共现特征
奇异值分解
特征选择
Keywords
computer application
Chinese information processing
latent semantic indexing
term co-occurrence
singular value decomposition
feature selection
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于潜在语义索引的文本特征词权重计算方法
被引量:
17
7
作者
李媛媛
马永强
机构
西南交通大学信息科学与技术学院
出处
《计算机应用》
CSCD
北大核心
2008年第6期1460-1462,1466,共4页
文摘
潜在语义索引具有可计算性强,需要人参与少等优点。对其中重要的优化过程——权重计算,进行了深入分析。针对目前应用最广泛的TF-IDF方法中,采用线性处理的不合理性以及难以突出对文本内容起关键性作用的特征的缺点,提出了一种基于"Sigmiod函数"和"位置因子"的新权重方案。突出了文本中不同特征词的重要程度,更有利于潜在语义空间的构造。通过实验平台"中文潜在语义索引分析系统"的测试结果表明,该权重方法更利于基于潜在语义的检索性能的提高。
关键词
潜在语义索引
Sigmiod函数
位置因子
权重算法
Keywords
Latent Semantic Indexing (LSI)
Sigmiod function
location factor
weighting algorithms
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于潜在语义索引的Web信息预测采集过滤方法
被引量:
9
8
作者
李振星
陆大珏
任继成
唐卫清
唐荣锡
机构
北京航空航天大学机械工程及自动化学院
江苏省太仓海关
北京中科辅龙计算机技术有限公司
出处
《计算机辅助设计与图形学学报》
EI
CSCD
北大核心
2004年第1期142-147,共6页
基金
国家经贸委重大技术创新项目资助
文摘
Web信息急速膨胀使有效定向采集特定领域信息成为网上信息检索中一个日益重要的研究方向 提出一种基于潜在语义索引的Web信息预测采集过滤方法 在样本文档集潜在语义索引对文档相似计算的基础上 ,构造出用户兴趣模型 ,判断页面相关性进行文本过滤 通过对Web站点结构分析、对未知网页的相关性预测来控制信息采集过程 在保持定向采集精度的同时 ,缩短采集时间、减少存储、加快检索 。
关键词
潜在语义索引
信息采集
Web检索系统
网络资源
互联网
Keywords
latent semantic indexing
information gathering
text filtering
分类号
G354.4 [文化科学—情报学]
在线阅读
下载PDF
职称材料
题名
一种大规模数据的快速潜在语义索引
被引量:
10
9
作者
卫威
王建民
机构
清华大学计算机科学与技术系
清华大学软件学院
出处
《计算机工程》
CAS
CSCD
北大核心
2009年第15期35-37,40,共4页
文摘
潜在语义索引(LSI)已应用到现代信息检索的多个领域,但矩阵奇异值分解的高复杂度阻碍了该技术在大规模数据上的应用。提出一种大规模数据的快速LSI方法。给出一个降维问题的统一框架,LSI作为一种特征提取算法,可以在这个框架下转化为一个特征选择问题。利用该技术在最大程度保持LSI降维效果的同时,简化LSI的计算,使其能够应用于大规模数据。
关键词
潜在语义索引
降维
特征选择
特征提取
Keywords
Latent Semantic Indexing(LSI)
dimension reduction
feature selection
feature extraction
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
基于潜在语义索引的SVM文本分类模型
被引量:
3
10
作者
郭武斌
周宽久
张世荣
机构
大连理工大学系统工程研究所
大连理工大学软件学院
出处
《情报学报》
CSSCI
北大核心
2009年第6期827-833,共7页
基金
国家自然科学基金重点基金资助项目(70431001).
文摘
本文将潜在语义索引理论与支持向量机方法相结合,对文本向量各维与文本的语义联系进行特征抽取,建立了完整的基于潜在语义索引的支持向量机文本分类模型,分析了该方法与分词的维数以及SVM惩罚因子选择之间的关系。并在NN-SVM分类算法的基础上,通过计算样本点与其最近邻点类别的异同以及该点与其k个同类近邻点在核空间的平均距离来修剪混淆点,提出了一种改进的NN-SVM算法:KCNN-SVM算法。利用该算法对降维后的训练集进行修剪。实验表明,用新的模型进行文本分类,与单纯支持向量机相比,受到文本分词维数以及支持向量机惩罚因子的影响更小,其分类正确率更高。
关键词
支持向量机
核空间
潜在语义索引
文本分类
Keywords
support vector machine
kernel space
latent semantic indexing
text categorization
分类号
TP391 [自动化与计算机技术—计算机应用技术]
G434 [文化科学—教育技术学]
在线阅读
下载PDF
职称材料
题名
基于潜在语义索引的科技文献主题挖掘
被引量:
4
11
作者
刘勘
朱芳芳
机构
中南财经政法大学信息与安全工程学院
出处
《计算机工程与应用》
CSCD
2014年第24期113-117,150,共6页
基金
国家自然科学基金(No.71203164)
文摘
提出了一种基于潜在语义的科技文献主题挖掘方法,描述了科技文献的主题挖掘模型。对科技文献集进行预处理,计算特征词权重,构造出词汇-文献矩阵。用改进的LSI算法对稀疏矩阵进行降维得到固定的主题-文献矩阵。取权重最高的主题作为该文献的主题。该方法利用Frobenius范数来规范矩阵,对稀疏矩阵进行降维,可以快速精确地挖掘出科技文献的主题。
关键词
(GB7713-8
规定每篇文章应选取
3~8
个关键
潜在语义索引
主题挖掘
科技文献
Keywords
latent semantic indexing
topic modeling
scientific documents
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
使用基于SVM的局部潜在语义索引进行文本分类
被引量:
4
12
作者
张秋余
刘洋
机构
兰州理工大学计算机与通信学院
出处
《计算机应用》
CSCD
北大核心
2007年第6期1382-1384,共3页
基金
甘肃省科技攻关计划资助项目(2GS047-A52-002-03)
文摘
潜在语义索引(LSI)通过奇异值分解(SVD)获得原始词—文档矩阵的潜在语义结构,在一定程度上解决了一词多义和多词一义问题。但目前文本分类中使用LSI方法的效果并不理想,这是因为没有充分考虑分类信息。为解决该问题,提出一种改进的局部潜在语义索引(LLSI)方法,使用支持向量机(SVM)来产生局部区域。实验结果表明,该方法是有效的。
关键词
文本分类
潜在语义索引
支持向量机
局部区域
Keywords
text classification
Latent Semantic Indexing (LSI)
Support Vector Machine (SVM)
local region
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
TP181 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
基于潜在语义索引的文本结构分析方法的研究
被引量:
4
13
作者
刘军万
刘飞飞
机构
中南林学院电子信息工程学院
中南林学院图书馆
出处
《情报杂志》
CSSCI
北大核心
2004年第1期56-58,共3页
文摘
文本结构分析是文本处理领域中的重要内容 ,它可以有效地改进文本检索、文本过滤以及文本摘要的精度。通过描述文本的物理结构和逻辑结构以及文本分析的背景 ,将潜在语义索引引入文本结构分析中 ,提出了基于潜在语义索引的层次分析方法 ,该方法保证了层次划分的有序性和聚合性 ,可操作性强 ,便于解释 ,并给出了在文本检索、文本过滤和文本摘要中的应用。
关键词
潜在语义索引
文本结构
文本分析
文本检索
文本过滤
分类号
G252.7 [文化科学—图书馆学]
TP391.1 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
一种基于潜在语义索引的“垃圾”邮件过滤方法
被引量:
17
14
作者
陈华辉
机构
宁波大学计算机与自动化科学工程系
出处
《计算机应用研究》
CSCD
2000年第10期17-18,35,共3页
文摘
提出了一种基于潜在语义索引(LSI)的“垃圾”邮件过滤方法,讨论了邮件概念空间的构造,该空间中邮件相似度的计算和“垃圾”邮件的过滤。
关键词
信息检索
电子邮件
潜在语义索引
过滤
垃圾邮件
分类号
TP393.098 [自动化与计算机技术—计算机应用技术]
G354.4 [文化科学—情报学]
在线阅读
下载PDF
职称材料
题名
文本检索的潜在语义索引法初探
被引量:
11
15
作者
杨梁彬
机构
北京大学信息管理系
出处
《大学图书馆学报》
CSSCI
北大核心
2003年第6期68-72,84,共6页
文摘
传统的文本检索方式是基于提问集合和文本集合的单纯语词匹配检索,然而这并不能解决检索实践过程中存在的同义和多义问题。文章阐述了文本检索的潜在语义索引法的原理并通过实验来验证潜在语义索引可以用来解决同义和多义问题,完善检索系统的性能。
关键词
文本检索
潜在语义索引
法
LSI
奇异值分解
SVD
加权方法
Keywords
Latent Semantic Indexing, Singular Vector Decomposition, Text Retrieval
分类号
G354 [文化科学—情报学]
在线阅读
下载PDF
职称材料
题名
基于潜在语义索引的中文文本聚类的研究
被引量:
4
16
作者
马国俊
贠卫国
机构
西安建筑科技大学信控学院
出处
《现代电子技术》
2005年第10期58-59,共2页
文摘
讨论了中文文本聚类的现状以及存在的问题,介绍了向量空间模型,详细阐述了潜在语义索引理论以及采用该模型进行中文文本聚类的主要步骤,最后采用两种模型进行了实验对比,实验表明采用潜在语义索引模型可以取得更好的聚类效果。
关键词
文本聚类
潜在语义索引
向量空间模型
信息检索
Keywords
text clustering
latent semantic index
vector space model
information index
分类号
TP312 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
基于VSM的潜在语义索引
被引量:
1
17
作者
王瑛
机构
闽江学院教务处
出处
《陕西科技大学学报(自然科学版)》
2010年第5期151-154,158,共5页
文摘
传统向量空间模型信息检索技术,只是统计关键词在文档中出现的频度,检索结果不能反映出文档的相关性.为了解决关键词检索时潜在语义的挖掘问题,提出了一种基于向量空间模型的潜在语义索引的改进算法.对比实验证明,该算法能够有效提高检索查准率.
关键词
向量空间模型
潜在语义索引
信息检索
Keywords
vector space model
latent semantic indexing
information retrieval
分类号
TP274.2 [自动化与计算机技术—检测技术与自动化装置]
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
潜在语义索引在FAQ构建中的应用研究
被引量:
3
18
作者
李霞
张太红
李莉
机构
新疆农业大学计算机与信息工程学院
出处
《石河子大学学报(自然科学版)》
CAS
2005年第6期778-781,共4页
文摘
研究了潜在语义索引在中文自动问答系统FAQ库构建中的应用,并着重阐述了句子相似度的计算方法以及使用LSI对FAQ库去重的实验选取方法,结果显示LSI方法在一定程度上优于TF×IDF方法。
关键词
自动问答
FAQ
潜在语义索引
句子相似度
Keywords
automatic question and answer
frequently-asked question
latent semantic index
sentence similarity
分类号
TP312 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
垃圾邮件过滤中潜在语义索引的应用
19
作者
王鹏鸣
机构
华东交通大学信息工程学院
出处
《郑州大学学报(理学版)》
CAS
北大核心
2010年第2期78-82,共5页
基金
教育部人文社会科学研究规划项目
编号09YJA630036
+1 种基金
教育部人文社会科学研究青年基金项目
编号09YJC740027
文摘
将潜在语义索引(LSI)应用于垃圾邮件过滤领域,并将其与向量空间模型(VSM)和经典的邮件过滤器Spa-mAssassin系统进行比较.另外,对基于词提取技术的邮件文本特征集合和SpamAssassin系统提取的邮件"元特征"集合进行了对比.实验结果表明,LSI与VSM均取得了较SpamAssassin系统更优的分类效果.
关键词
垃圾邮件过滤
潜在语义索引
向量空间模型
Keywords
spam filtering
latent semantic indexing
vector space model
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
一种基于潜在语义结构的文本分类模型
被引量:
27
20
作者
曾雪强
王明文
陈素芬
机构
江西师范大学计算机信息工程学院
出处
《华南理工大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2004年第z1期99-102,共4页
文摘
潜在语义索引(LSI)模型能在一定程度上解决一词多义和多词一义问题,并能过滤一部分文档噪音.然而在LSI模型中,一些对分类贡献大的特征,由于其对应的特征值小而被滤掉.针对这一问题,文中提出了一种扩展LSI模型的文本分类模型.该模型在尽量保留文档信息的同时,增加考虑了文档的类别信息,从而能比LSI模型更好地表示原始文档空间中的潜在语义结构.
关键词
文本分类
潜在语义索引
偏最小二乘法
Keywords
text classification
latent semantic indexing
partial least square analysis
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于潜在语义索引的文本摘要方法
林鸿飞
高仁璟
《大连理工大学学报》
CAS
CSCD
北大核心
2001
17
在线阅读
下载PDF
职称材料
2
基于Rough集潜在语义索引的Web文档分类
何明
冯博琴
傅向华
《计算机工程》
CAS
CSCD
北大核心
2004
7
在线阅读
下载PDF
职称材料
3
基于潜在语义索引和自组织映射网的检索结果聚类方法
陈毅恒
秦兵
刘挺
王平
李生
《计算机研究与发展》
EI
CSCD
北大核心
2009
4
在线阅读
下载PDF
职称材料
4
潜在语义索引方法在信息过滤中的应用
牛伟霞
张永奎
《计算机工程与应用》
CSCD
北大核心
2001
16
在线阅读
下载PDF
职称材料
5
基于潜在语义索引的文本浏览机制
林鸿飞
姚天顺
《中文信息学报》
CSCD
北大核心
2000
29
在线阅读
下载PDF
职称材料
6
潜在语义索引中特征优化技术的研究
季铎
郑伟
蔡东风
《中文信息学报》
CSCD
北大核心
2009
7
在线阅读
下载PDF
职称材料
7
基于潜在语义索引的文本特征词权重计算方法
李媛媛
马永强
《计算机应用》
CSCD
北大核心
2008
17
在线阅读
下载PDF
职称材料
8
基于潜在语义索引的Web信息预测采集过滤方法
李振星
陆大珏
任继成
唐卫清
唐荣锡
《计算机辅助设计与图形学学报》
EI
CSCD
北大核心
2004
9
在线阅读
下载PDF
职称材料
9
一种大规模数据的快速潜在语义索引
卫威
王建民
《计算机工程》
CAS
CSCD
北大核心
2009
10
在线阅读
下载PDF
职称材料
10
基于潜在语义索引的SVM文本分类模型
郭武斌
周宽久
张世荣
《情报学报》
CSSCI
北大核心
2009
3
在线阅读
下载PDF
职称材料
11
基于潜在语义索引的科技文献主题挖掘
刘勘
朱芳芳
《计算机工程与应用》
CSCD
2014
4
在线阅读
下载PDF
职称材料
12
使用基于SVM的局部潜在语义索引进行文本分类
张秋余
刘洋
《计算机应用》
CSCD
北大核心
2007
4
在线阅读
下载PDF
职称材料
13
基于潜在语义索引的文本结构分析方法的研究
刘军万
刘飞飞
《情报杂志》
CSSCI
北大核心
2004
4
在线阅读
下载PDF
职称材料
14
一种基于潜在语义索引的“垃圾”邮件过滤方法
陈华辉
《计算机应用研究》
CSCD
2000
17
在线阅读
下载PDF
职称材料
15
文本检索的潜在语义索引法初探
杨梁彬
《大学图书馆学报》
CSSCI
北大核心
2003
11
在线阅读
下载PDF
职称材料
16
基于潜在语义索引的中文文本聚类的研究
马国俊
贠卫国
《现代电子技术》
2005
4
在线阅读
下载PDF
职称材料
17
基于VSM的潜在语义索引
王瑛
《陕西科技大学学报(自然科学版)》
2010
1
在线阅读
下载PDF
职称材料
18
潜在语义索引在FAQ构建中的应用研究
李霞
张太红
李莉
《石河子大学学报(自然科学版)》
CAS
2005
3
在线阅读
下载PDF
职称材料
19
垃圾邮件过滤中潜在语义索引的应用
王鹏鸣
《郑州大学学报(理学版)》
CAS
北大核心
2010
0
在线阅读
下载PDF
职称材料
20
一种基于潜在语义结构的文本分类模型
曾雪强
王明文
陈素芬
《华南理工大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2004
27
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
2
3
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部