期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
潜语义标引与汉语信息检索研究 被引量:4
1
作者 刘博勤 丁晓明 《计算机科学》 CSCD 北大核心 2000年第3期93-95,共3页
1 引言典型的传统信息检索系统,如布尔逻辑模型、向量空间模型,根据用户提供的查询条件,依据关键词的匹配或向量空间的相似系数,返回相关查询结果。对于相同的概念,使用不同的词汇表示,如同义词或近义词,或同一词汇在不同的语言环境中... 1 引言典型的传统信息检索系统,如布尔逻辑模型、向量空间模型,根据用户提供的查询条件,依据关键词的匹配或向量空间的相似系数,返回相关查询结果。对于相同的概念,使用不同的词汇表示,如同义词或近义词,或同一词汇在不同的语言环境中拥有不同的语义,即一词多义,因此基于语词匹配的查询方法,其准确性和完整性都不够理想。尽管同义词词典的使用,在一定程度上,提高了信息检索的查全率(recall),但却降低了查询的精度,且在实际应用中,需要不断更新同义词库,才能满足系统不断变化的要求。 展开更多
关键词 潜语义标引 汉语信息检索 关键词 查全率
在线阅读 下载PDF
基于潜在语义标引的WEB文档自动分类 被引量:9
2
作者 戚涌 徐永红 刘凤玉 《计算机工程与应用》 CSCD 北大核心 2004年第22期28-31,共4页
Web挖掘技术在商业上有广泛的应用前景,但现有的Web挖掘技术存在计算量大,精度不高等问题。论文提出的LSIWAC算法,首先运用潜在语义标引技术将Web页面词空间压缩到低维的特征空间;然后,在得到的特征空间上运用最优聚类将样本集合分为若... Web挖掘技术在商业上有广泛的应用前景,但现有的Web挖掘技术存在计算量大,精度不高等问题。论文提出的LSIWAC算法,首先运用潜在语义标引技术将Web页面词空间压缩到低维的特征空间;然后,在得到的特征空间上运用最优聚类将样本集合分为若干簇;对得到的每簇鉴别特征再利用最佳鉴别变换进行压缩和特征抽取,并用最终得到的特征矢量进行分类。该方法克服了样本高维效应,有效提高分类准确率,降低计算量。实验结果验证所提方法的有效性。 展开更多
关键词 WEB挖掘 语义标引 最佳鉴别变换 分类
在线阅读 下载PDF
潜在语义标引在中文信息检索中的研究与实现 被引量:16
3
作者 居斌 《计算机工程》 CAS CSCD 北大核心 2007年第5期193-196,共4页
随着网络信息的迅猛发展,信息检索已经成为人们获取信息不可缺少的工具。基于向量空间模型的检索方法是语义检索的重要研究方向,潜在语义标引模型是向量检索方法的一个有力扩展。对LSI中所涉及的关键技术,包括传统的向量空间模型的原理... 随着网络信息的迅猛发展,信息检索已经成为人们获取信息不可缺少的工具。基于向量空间模型的检索方法是语义检索的重要研究方向,潜在语义标引模型是向量检索方法的一个有力扩展。对LSI中所涉及的关键技术,包括传统的向量空间模型的原理,以及潜在语义索引模型的原理、设计、实现,进行了研究和探讨,同时开发了一个适合中文信息检索的系统原型。对系统进行了测试,取得了较好的实验效果。 展开更多
关键词 语义标引 向量空间模型 信息检索 中文
在线阅读 下载PDF
信息过滤技术及Visual J++实现
4
作者 马建国 邢玲 何军 《系统工程与电子技术》 EI CSCD 北大核心 2004年第3期382-385,共4页
信息过滤技术的目的是滤除信息垃圾、建立主动服务机制。论述了信息过滤技术中的原理、关键技术及其实现方法。采用话题为基本单位,分析了信息的特征,建立的用户兴趣模型;根据用户反馈来动态地了解用户的兴趣变化,提出了潜在语义标引的... 信息过滤技术的目的是滤除信息垃圾、建立主动服务机制。论述了信息过滤技术中的原理、关键技术及其实现方法。采用话题为基本单位,分析了信息的特征,建立的用户兴趣模型;根据用户反馈来动态地了解用户的兴趣变化,提出了潜在语义标引的过滤算法,并依据用户设定的不良信息库更有效地过滤出用户所需要的信息。利用VisualJ++(VJ)实现了信息过滤软件基本功能,实验证明上述过滤算法的有效性。最后给出了在信息过滤技术中正在研究的几个问题。 展开更多
关键词 信息过滤 特征提取 兴趣模型 语义标引
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部