期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
基于潜在语义标引的WEB文档自动分类 被引量:9
1
作者 戚涌 徐永红 刘凤玉 《计算机工程与应用》 CSCD 北大核心 2004年第22期28-31,共4页
Web挖掘技术在商业上有广泛的应用前景,但现有的Web挖掘技术存在计算量大,精度不高等问题。论文提出的LSIWAC算法,首先运用潜在语义标引技术将Web页面词空间压缩到低维的特征空间;然后,在得到的特征空间上运用最优聚类将样本集合分为若... Web挖掘技术在商业上有广泛的应用前景,但现有的Web挖掘技术存在计算量大,精度不高等问题。论文提出的LSIWAC算法,首先运用潜在语义标引技术将Web页面词空间压缩到低维的特征空间;然后,在得到的特征空间上运用最优聚类将样本集合分为若干簇;对得到的每簇鉴别特征再利用最佳鉴别变换进行压缩和特征抽取,并用最终得到的特征矢量进行分类。该方法克服了样本高维效应,有效提高分类准确率,降低计算量。实验结果验证所提方法的有效性。 展开更多
关键词 WEB挖掘 潜在语义标引 最佳鉴别变换 分类
在线阅读 下载PDF
基于多层次概念语义网络结构的中文医学信息语义标引体系和语义检索模型研究 被引量:27
2
作者 李毅 庞景安 《情报学报》 CSSCI 北大核心 2003年第4期403-411,共9页
为了提高中文医学信息检索效率,本文应用语义学研究成果,深入剖析统一医学语言系统(UMLS),从理论上对多层次概念语义网络结构进行了探讨,以此设计了适用于中文医学信息特点的三层概念语义网络结构,并分别确定了各个概念语义网络层次的... 为了提高中文医学信息检索效率,本文应用语义学研究成果,深入剖析统一医学语言系统(UMLS),从理论上对多层次概念语义网络结构进行了探讨,以此设计了适用于中文医学信息特点的三层概念语义网络结构,并分别确定了各个概念语义网络层次的语义类型和语义关系,进一步完善了医学信息语义网络.以信息检索的认知理论为依据,建立了基于三层概念语义网络结构的中文医学信息语义标引体系和语义检索模型.对扩展检索和语义检索进行统计学Kappa检验,认为两种检索方法的一致性非常显著(p<0.01);与扩展检索中的任何一种方法相比,语义检索方法具有更高的检索效率. 展开更多
关键词 中文信息 医学信息 信息检索 检索效率 语义 语义检索 语义标引 语义网络 扩展检索 医学语言系统 UMLS
在线阅读 下载PDF
基于本体的语义标引研究与实现 被引量:8
3
作者 张功杰 黄穗 《计算机工程与设计》 CSCD 北大核心 2008年第8期2078-2080,共3页
标引是资源管理与检索的基础。传统的标引方式仅停留在关键字异同的逻辑层面,忽略了文档语义层面上的信息。以本体的知识组织体系为基础,以抽取文档的语义向量为目标,提出了基于本体的语义标引思想,为基于概念匹配的语义检索创造条件。... 标引是资源管理与检索的基础。传统的标引方式仅停留在关键字异同的逻辑层面,忽略了文档语义层面上的信息。以本体的知识组织体系为基础,以抽取文档的语义向量为目标,提出了基于本体的语义标引思想,为基于概念匹配的语义检索创造条件。为了更清晰的描述标引过程,建立了基于本体的语义标引模型,并对模型中各环节进行详细的功能定义。参照具体的实例本体进行实验和分析。 展开更多
关键词 语义标引 本体 语义向量 概念相似度 语义相似度 语义检索
在线阅读 下载PDF
基于隐性语义标引的知识匹配模型及算法分析 被引量:2
4
作者 赵涛 袁兰静 曾金平 《中国地质大学学报(社会科学版)》 2006年第3期54-56,共3页
本文从企业知识共享角度出发,提出通过编写用户简档来映射企业中员工的知识,运用隐性语义标引技术建立了知识文档匹配模型,探讨了知识匹配模型的算法实现,从而使得用户简档准确定位企业的知识源,实现企业知识共享的目的。
关键词 知识共享 隐性语义标引 知识文档向量 企业知识共享
在线阅读 下载PDF
潜在语义标引在中文信息检索中的研究与实现 被引量:16
5
作者 居斌 《计算机工程》 CAS CSCD 北大核心 2007年第5期193-196,共4页
随着网络信息的迅猛发展,信息检索已经成为人们获取信息不可缺少的工具。基于向量空间模型的检索方法是语义检索的重要研究方向,潜在语义标引模型是向量检索方法的一个有力扩展。对LSI中所涉及的关键技术,包括传统的向量空间模型的原理... 随着网络信息的迅猛发展,信息检索已经成为人们获取信息不可缺少的工具。基于向量空间模型的检索方法是语义检索的重要研究方向,潜在语义标引模型是向量检索方法的一个有力扩展。对LSI中所涉及的关键技术,包括传统的向量空间模型的原理,以及潜在语义索引模型的原理、设计、实现,进行了研究和探讨,同时开发了一个适合中文信息检索的系统原型。对系统进行了测试,取得了较好的实验效果。 展开更多
关键词 潜在语义标引 向量空间模型 信息检索 中文
在线阅读 下载PDF
潜语义标引与汉语信息检索研究 被引量:4
6
作者 刘博勤 丁晓明 《计算机科学》 CSCD 北大核心 2000年第3期93-95,共3页
1 引言典型的传统信息检索系统,如布尔逻辑模型、向量空间模型,根据用户提供的查询条件,依据关键词的匹配或向量空间的相似系数,返回相关查询结果。对于相同的概念,使用不同的词汇表示,如同义词或近义词,或同一词汇在不同的语言环境中... 1 引言典型的传统信息检索系统,如布尔逻辑模型、向量空间模型,根据用户提供的查询条件,依据关键词的匹配或向量空间的相似系数,返回相关查询结果。对于相同的概念,使用不同的词汇表示,如同义词或近义词,或同一词汇在不同的语言环境中拥有不同的语义,即一词多义,因此基于语词匹配的查询方法,其准确性和完整性都不够理想。尽管同义词词典的使用,在一定程度上,提高了信息检索的查全率(recall),但却降低了查询的精度,且在实际应用中,需要不断更新同义词库,才能满足系统不断变化的要求。 展开更多
关键词 语义标引 汉语信息检索 关键词 查全率
在线阅读 下载PDF
基于语义网的网络信息检索相关性研究 被引量:20
7
作者 何绍华 宫兆晖 《情报杂志》 CSSCI 北大核心 2007年第12期120-123,共4页
针对传统网络信息检索中出现的查全率和查准率低下的问题,对Mizzaro相关性理论以及语义网理论进行介绍,指出查全率和查准率不高的主要原因在于检索算法采用词型匹配而非词义匹配以及对来源信息的标引缺乏语义描述信息,提出一种语义信息... 针对传统网络信息检索中出现的查全率和查准率低下的问题,对Mizzaro相关性理论以及语义网理论进行介绍,指出查全率和查准率不高的主要原因在于检索算法采用词型匹配而非词义匹配以及对来源信息的标引缺乏语义描述信息,提出一种语义信息标引方法和语义查询扩展方法来改善查全率和查准率,然后通过一个计算机科学领域本体实例详细阐述实现过程。 展开更多
关键词 语义 相关性 查询扩展 语义标引
在线阅读 下载PDF
信息过滤技术及Visual J++实现
8
作者 马建国 邢玲 何军 《系统工程与电子技术》 EI CSCD 北大核心 2004年第3期382-385,共4页
信息过滤技术的目的是滤除信息垃圾、建立主动服务机制。论述了信息过滤技术中的原理、关键技术及其实现方法。采用话题为基本单位,分析了信息的特征,建立的用户兴趣模型;根据用户反馈来动态地了解用户的兴趣变化,提出了潜在语义标引的... 信息过滤技术的目的是滤除信息垃圾、建立主动服务机制。论述了信息过滤技术中的原理、关键技术及其实现方法。采用话题为基本单位,分析了信息的特征,建立的用户兴趣模型;根据用户反馈来动态地了解用户的兴趣变化,提出了潜在语义标引的过滤算法,并依据用户设定的不良信息库更有效地过滤出用户所需要的信息。利用VisualJ++(VJ)实现了信息过滤软件基本功能,实验证明上述过滤算法的有效性。最后给出了在信息过滤技术中正在研究的几个问题。 展开更多
关键词 信息过滤 特征提取 兴趣模型 潜在语义标引
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部