期刊文献+
共找到161篇文章
< 1 2 9 >
每页显示 20 50 100
一种基于潜在语义分析和直推式谱图算法的文本分类方法LSASGT 被引量:7
1
作者 戴新宇 田宝明 +1 位作者 周俊生 陈家骏 《电子学报》 EI CAS CSCD 北大核心 2008年第8期1626-1630,共5页
本文针对训练数据较少以及在基于图的分类算法中的文本表示问题,提出了一种基于潜在语义分析技术和直推式谱图算法的文本分类方法LSASGT,该方法将潜在语义分析技术和直推式谱图算法这两种基于谱分析理论的技术有机地结合在一起,对所有... 本文针对训练数据较少以及在基于图的分类算法中的文本表示问题,提出了一种基于潜在语义分析技术和直推式谱图算法的文本分类方法LSASGT,该方法将潜在语义分析技术和直推式谱图算法这两种基于谱分析理论的技术有机地结合在一起,对所有训练数据和测试数据进行统一建模,挖掘数据中潜在的多种结构信息.LSASGT引入潜在语义分析技术用于构造文本图表示模型,在能够反映人的分类标准的潜在语义特征空间中,描述文本之间的语义相关性;基于这样的文本表示,利用半监督的直推式谱图算法进行文本分类.在基准英文文本分类数据集Reuters21578和中文文本分类数据集Tan-Corp上的实验结果表明,本文给出的LSASGT文本分类方法获得了较好的分类结果. 展开更多
关键词 直推式谱图 在语义分析 文本分类 图构造
在线阅读 下载PDF
概率潜在语义分析(PLSA)在中药新药处方发现中的应用 被引量:3
2
作者 雷蕾 张早华 +3 位作者 温先荣 亢力 张竹绿 刘森 《世界科学技术-中医药现代化》 北大核心 2012年第5期1976-1980,共5页
目的:使用概率潜在语义分析(PLSA)算法研究中药配伍方案,为中药处方发现提供新途径。方法:基于丰富的中医药文献数据,从临床治疗缺血性心脑血管疾病的方剂出发,使用PLSA算法,筛选出治疗缺血性心脑血管疾病的新药候选方,并从药理学的角... 目的:使用概率潜在语义分析(PLSA)算法研究中药配伍方案,为中药处方发现提供新途径。方法:基于丰富的中医药文献数据,从临床治疗缺血性心脑血管疾病的方剂出发,使用PLSA算法,筛选出治疗缺血性心脑血管疾病的新药候选方,并从药理学的角度对候选方进行分析,最后结合专家智慧在候选方的基础上给出具有开发潜力的新药处方。结果:筛选出治疗该病的中药核心组合,并证明了PLSA算法用于中药处方发现具有一定的可靠性和稳定性。同时专家从计算机筛选出的处方中选出有开发前景的两首方。结论:PLSA算法在治疗缺血性心脑血管疾病中药处方发现中有着广阔的应用前景。 展开更多
关键词 概率在语义分析 缺血性心脑血管疾病 中药处方发现
在线阅读 下载PDF
基于稀疏编码多尺度空间潜在语义分析的图像分类 被引量:27
3
作者 赵仲秋 季海峰 +2 位作者 高隽 胡东辉 吴信东 《计算机学报》 EI CSCD 北大核心 2014年第6期1251-1260,共10页
传统潜在语义分析方法无法利用图像中区域语义构成的上下文信息来获得图像目标空间分布信息,因此它丢掉了局部特征之间的空间关系信息.而基于最近邻矢量量化来构造共生矩阵具有较大的量化误差,使得特征描述缺乏鲁棒性,影响后续潜在语义... 传统潜在语义分析方法无法利用图像中区域语义构成的上下文信息来获得图像目标空间分布信息,因此它丢掉了局部特征之间的空间关系信息.而基于最近邻矢量量化来构造共生矩阵具有较大的量化误差,使得特征描述缺乏鲁棒性,影响后续潜在语义分析获得特征的精确性.为了弥补这些不足,文中提出了一种基于稀疏编码的多尺度空间潜在语义分析的图像分类方法.首先通过空间金字塔方法对图像进行空间多尺度划分,然后利用稀疏编码对每个局部块特征进行软量化以形成共生矩阵,之后结合概率潜在语义分析(PLSA)获得每个局部块的潜在语义信息,再利用权值串接每个特定局部块中的语义信息得到图像多尺度空间潜在语义信息,最后用支持向量机(SVM)分类器完成图像的场景分类.在常见图像库上的实验表明,本文提出的基于稀疏编码的多尺度空间潜在语义分析方法平均分类精度比现有诸多方法均有明显提高,验证了其有效性和鲁棒性.实验还表明,空间金字塔匹配、稀疏编码共生矩阵以及PLSA降维这3个模块在该文方法中缺一不可,共同提升图像表征和分类性能. 展开更多
关键词 图像分类 稀疏编码 在语义分析 空间金字塔
在线阅读 下载PDF
基于潜在语义分析的汉语问答系统答案提取 被引量:45
4
作者 余正涛 樊孝忠 +1 位作者 郭剑毅 耿增民 《计算机学报》 EI CSCD 北大核心 2006年第10期1889-1893,共5页
为了解决在汉语问答系统答案提取时,由于词的同义或多义现象而导致的“漏提”或“错提”等问题,提出了一种基于潜在语义分析(LSA)的问题和答案句子相似度计算方法.它利用空间向量模型作为问题和句子的表示方法,借助于潜在语义分析理论,... 为了解决在汉语问答系统答案提取时,由于词的同义或多义现象而导致的“漏提”或“错提”等问题,提出了一种基于潜在语义分析(LSA)的问题和答案句子相似度计算方法.它利用空间向量模型作为问题和句子的表示方法,借助于潜在语义分析理论,对大量问答作句子语料统计分析,构建了一个潜在的词-句子语义空间,从而消除了词之间的相关性,并在语义空间上实现了问题与答案句子相似度计算,有效地解决了词的同义和多义问题.最后结合问题类型和相似度计算结果,对汉语基于事实的简单陈述问题进行了答案句子提取实验.答案提取的MRR值达到了0.47,明显优于空间向量模型.结果说明该方法具有很好的效果. 展开更多
关键词 问答系统 答案提取 相似度 向量空间模型 在语义分析
在线阅读 下载PDF
基于潜在语义分析的信息检索 被引量:29
5
作者 盖杰 王怡 武港山 《计算机工程》 CAS CSCD 北大核心 2004年第2期58-60,共3页
潜在语义分析是一种用于自动实现知识提取和表示的理论和方法,它通过对大量的文本集进行统计分析,从中提取出词语的上下文使用含义。文章介绍了基于潜在语义分析的文本信息检索的基本思想、特点以及实现方法 。
关键词 在语义分析 信息检索 语义 向量空间模型
在线阅读 下载PDF
潜在语义分析理论及其应用 被引量:36
6
作者 盖杰 王怡 武港山 《计算机应用研究》 CSCD 北大核心 2004年第3期9-12,20,共5页
潜在语义分析(LatentSemanticAnalysis,LSA)是一种用于自动地实现知识提取和表示的理论和方法,它通过对大量的文本集进行统计分析,从中提取出词语的上下文使用含义。在技术上,它同向量空间模型类型类似,都是采用空间向量表示文本,但通过... 潜在语义分析(LatentSemanticAnalysis,LSA)是一种用于自动地实现知识提取和表示的理论和方法,它通过对大量的文本集进行统计分析,从中提取出词语的上下文使用含义。在技术上,它同向量空间模型类型类似,都是采用空间向量表示文本,但通过SVD分解等处理,消除了同义词、多义词的影响,提高了后续处理的精度。将着重介绍LSA方法的基本思想、特点、实现方法,以及基于LSA思想的具体应用。 展开更多
关键词 在语义分析 上下文 语义 向量空间模型
在线阅读 下载PDF
改进的概率潜在语义分析下的文本聚类算法 被引量:14
7
作者 张玉芳 朱俊 熊忠阳 《计算机应用》 CSCD 北大核心 2011年第3期674-676,693,共4页
概率潜在语义分析(PLSA)模型用期望最大化(EM)算法进行参数训练,由于算法参数的随机初始化,致使聚类的效果过度拟合且过分依赖于参数初始值。将潜在语义分析(LSA)模型参数概率化,用以初始化概率潜在语义分析模型的参数,得到的改进算法... 概率潜在语义分析(PLSA)模型用期望最大化(EM)算法进行参数训练,由于算法参数的随机初始化,致使聚类的效果过度拟合且过分依赖于参数初始值。将潜在语义分析(LSA)模型参数概率化,用以初始化概率潜在语义分析模型的参数,得到的改进算法有效解决了参数随机初始化问题。经实验验证,所提出的方法对文本聚类的归一化互信息(NM I)和准确度都有明显提高。 展开更多
关键词 文本聚类 概率在语义分析 参数初始化 在语义分析
在线阅读 下载PDF
基于潜在语义分析的BBS文档Bayes鉴别器 被引量:17
8
作者 刘昌钰 唐常杰 +2 位作者 于中华 杜永萍 郭颖 《计算机学报》 EI CSCD 北大核心 2004年第4期566-572,共7页
电子公告栏 (BBS)的滥用是一种以信息污染为特色的社会问题 ,对BBS文档进行鉴别已成为信息安全重要内容之一 .该文融合了数据挖掘技术、数理统计技术和自然语言理解技术 ,提出了基于潜在语义分析与Bayes分类的BBS文档鉴别方法 :利用自... 电子公告栏 (BBS)的滥用是一种以信息污染为特色的社会问题 ,对BBS文档进行鉴别已成为信息安全重要内容之一 .该文融合了数据挖掘技术、数理统计技术和自然语言理解技术 ,提出了基于潜在语义分析与Bayes分类的BBS文档鉴别方法 :利用自然语言处理技术从训练文档中抽取典型短语集 ;通过潜在语义分析进行典型短语同义归约 ,应用关联规则采掘技术提高典型短语间的独立性 ;用Bayes分类器对BBS文档进行鉴别 .该文还对影响系统的关键参数进行了大量的讨论和测试 ,实验表明该方法对于BBS文档的鉴别是可行而有效的 . 展开更多
关键词 数据挖掘 关联规则 BAYES分类 在语义分析 BBS 电子公告栏
在线阅读 下载PDF
基于概率潜在语义分析的词汇情感倾向判别 被引量:15
9
作者 宋晓雷 王素格 +1 位作者 李红霞 李德玉 《中文信息学报》 CSCD 北大核心 2011年第2期89-93,共5页
该文利用概率潜在语义分析,给出了两种用于判别词汇情感倾向的方法。一是使用概率潜在语义分析获得目标词和基准词之间的相似度矩阵,再利用投票法决定其情感倾向;二是利用概率潜在语义分析获取目标词的语义聚类,然后借鉴基于同义词的词... 该文利用概率潜在语义分析,给出了两种用于判别词汇情感倾向的方法。一是使用概率潜在语义分析获得目标词和基准词之间的相似度矩阵,再利用投票法决定其情感倾向;二是利用概率潜在语义分析获取目标词的语义聚类,然后借鉴基于同义词的词汇情感倾向判别方法对目标词的情感倾向做出判别。两种方法的优点是均可在没有外部资源的条件下,实现词汇情感倾向的判别。 展开更多
关键词 概率在语义分析 数据稀疏 语义聚类 情感倾向
在线阅读 下载PDF
潜在语义分析在中文信息处理中的应用 被引量:18
10
作者 刘云峰 齐欢 代建民 《计算机工程与应用》 CSCD 北大核心 2005年第3期91-93,共3页
潜在语义分析是一种关于自然语言信息提取和再现的理论方法,它通过代数的方法提取语义空间中潜在结构。论文叙述了潜在语义分析的基本理论方法,概述了这种方法所建立的潜在语义空间的数学意义;然后通过一个简单示例说明LSA在中文信息处... 潜在语义分析是一种关于自然语言信息提取和再现的理论方法,它通过代数的方法提取语义空间中潜在结构。论文叙述了潜在语义分析的基本理论方法,概述了这种方法所建立的潜在语义空间的数学意义;然后通过一个简单示例说明LSA在中文信息处理中的分析方法,并通过分析结果中文本间、词汇间关联度的变化来说明LSA在中文信息处理中的重要意义。 展开更多
关键词 在语义分析 在语义空间 中文信息处理 奇异值分解
在线阅读 下载PDF
基于潜在语义分析的中文文本层次分类技术 被引量:15
11
作者 王怡 盖杰 +1 位作者 武港山 王继成 《计算机应用研究》 CSCD 北大核心 2004年第8期151-154,165,共5页
从网络文本自动分类的需求出发 ,针对基于VSM模型的分类处理中词条无关假设和词条维度过高等问题 ,对基于类中心向量的分类方法进行了改进。利用LSA分析中的SVD分解获得Web文档的语义特征向量 ,并在此基础上进行分类处理 ,在不损害分类... 从网络文本自动分类的需求出发 ,针对基于VSM模型的分类处理中词条无关假设和词条维度过高等问题 ,对基于类中心向量的分类方法进行了改进。利用LSA分析中的SVD分解获得Web文档的语义特征向量 ,并在此基础上进行分类处理 ,在不损害分类精度的同时提高了分类及其后处理速度 ,并设计实现了一个原型系统。 展开更多
关键词 在语义分析 类重心分类 向量空间模型 文本分类 特征向量
在线阅读 下载PDF
基于潜在语义分析的构件聚类改进方法 被引量:9
12
作者 任姚鹏 陈立潮 +1 位作者 张英俊 谢斌红 《计算机工程》 CAS CSCD 北大核心 2011年第4期67-69,共3页
针对基于向量空间模型的构件聚类方法存在高维稀疏、无法解决同义词等问题,采用基于潜在语义分析模型对构件进行聚类分析。从用户关注点出发,通过引入等级策略提出一种基于潜在语义分析的构件聚类改进算法。实验结果表明,该方法能够提... 针对基于向量空间模型的构件聚类方法存在高维稀疏、无法解决同义词等问题,采用基于潜在语义分析模型对构件进行聚类分析。从用户关注点出发,通过引入等级策略提出一种基于潜在语义分析的构件聚类改进算法。实验结果表明,该方法能够提高构件聚类质量,使构件聚类结果更符合用户需求和更加人性化,提高构件检索效率和准确性。 展开更多
关键词 刻面分类 在语义分析 等级策略 构件聚类
在线阅读 下载PDF
中文信息的潜在语义分析 被引量:5
13
作者 刘云峰 齐欢 +1 位作者 代建民 王小平 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2004年第z1期107-111,共5页
潜在语义分析是一种基于潜概念索引的检索技术.文中首先综述了潜在语义分析的理论及方法,并且解释其数学意义;然后通过一个简单示例中文档间、词语间相关度的变化来说明潜在语义分析的作用;最后引入文档自检索矩阵的概念来检验潜在语义... 潜在语义分析是一种基于潜概念索引的检索技术.文中首先综述了潜在语义分析的理论及方法,并且解释其数学意义;然后通过一个简单示例中文档间、词语间相关度的变化来说明潜在语义分析的作用;最后引入文档自检索矩阵的概念来检验潜在语义分析的检索效果.实验结果进一步说明了潜在语义分析在信息检索领域中有着重要的应用价值. 展开更多
关键词 在语义分析 在语义空间 中文信息处理 奇异值分解
在线阅读 下载PDF
基于概率潜语义分析模型的高光谱影像层次聚类分析 被引量:5
14
作者 易文斌 慎利 +1 位作者 齐银凤 唐宏 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2011年第9期2471-2475,共5页
将概率潜语义分析模型(PLSA)应用于高光谱影像聚类,提出一种基于语义信息的影像聚类方法。首先,利用ISODATA算法获取影像的初次聚类结果,从而形成PLSA模型中的视觉词;其次,利用影像分割算法对高光谱影像进行分割,并将分割体作为PLSA模... 将概率潜语义分析模型(PLSA)应用于高光谱影像聚类,提出一种基于语义信息的影像聚类方法。首先,利用ISODATA算法获取影像的初次聚类结果,从而形成PLSA模型中的视觉词;其次,利用影像分割算法对高光谱影像进行分割,并将分割体作为PLSA模型的文档;再次,利用多种最佳聚类类别数估计方法确定PLSA模型的潜语义主题的个数;进而估计PLSA模型的参数,获得概率主题内视觉词的概率分布和每个分割体中各概率主题的混合比例;最后利用统计模式识别方法获取每个影像文档中各个视觉词对应的潜语义主题的类型,从而实现影像的层次聚类分析。相关实验结果表明,本文的层次聚类结果较K-MEANS算法、ISODATA算法聚类结果的面向对象特性更明显,其与真实地物的空间分布更接近。 展开更多
关键词 概率语义分析模型 高光谱影像 层次聚类 语义信息
在线阅读 下载PDF
基于潜在语义分析的领域知识地图构建技术 被引量:6
15
作者 郝佳 阎艳 +2 位作者 王国新 宫琳 赵博 《北京理工大学学报》 EI CAS CSCD 北大核心 2014年第7期691-694,722,共5页
信息过载现象普遍存在于产品设计过程中,而提升信息和知识检索的准确性是解决该问题的主要手段.领域知识地图能够为知识检索引擎提供领域知识关联信息,以提升知识检索的准确性.针对领域知识地图的构建,提出了一种半自动化的领域知识地... 信息过载现象普遍存在于产品设计过程中,而提升信息和知识检索的准确性是解决该问题的主要手段.领域知识地图能够为知识检索引擎提供领域知识关联信息,以提升知识检索的准确性.针对领域知识地图的构建,提出了一种半自动化的领域知识地图构建过程.该过程采用领域专家定义领域特征集的方法来提升领域特征集的全面性和独立性,进一步采用潜在语义分析技术(LSA)消除领域特征集中存在的语义交叉.通过分析领域知识相似度的分布,采用优先去除中距离的策略构建最终的知识地图.最后给出数控领域知识地图的构建过程,证明了该方法的有效性. 展开更多
关键词 知识地图 领域知识 信息过载 在语义分析技术
在线阅读 下载PDF
基于潜语义分析的概念名称相似度算法 被引量:7
16
作者 黄广君 孙建国 罗俊丽 《计算机工程》 CAS CSCD 北大核心 2009年第14期69-71,74,共4页
概念名称是本体映射中的一个重要要素。针对目前概念名称相似度计算中存在的概念名称多义性问题,提出一种改进的算法。该算法结合概念注释和义项解释,利用潜语义分析,明确概念在Wordnet中对应的义项,在一定程度上提高了相似度计算的准... 概念名称是本体映射中的一个重要要素。针对目前概念名称相似度计算中存在的概念名称多义性问题,提出一种改进的算法。该算法结合概念注释和义项解释,利用潜语义分析,明确概念在Wordnet中对应的义项,在一定程度上提高了相似度计算的准确度。实验表明该方法是切实可行的。 展开更多
关键词 相似度 语义分析 义项
在线阅读 下载PDF
一种基于潜在语义分析的查询扩展算法 被引量:8
17
作者 顾榕 王小平 曹立明 《计算机工程与应用》 CSCD 北大核心 2004年第18期23-25,63,共4页
该文提出一种新的查询扩展算法。通过对文本进行潜在语义分析,引入计算词语间语义相似度的方法,将文本聚类应用到检索的交互过程中,以提高信息检索的质量。实验结果表明该算法对于提高检索的准确率是十分有效的。
关键词 查询扩展 在语义分析 语义相似度
在线阅读 下载PDF
基于专利说明书语义分析的潜在竞争对手识别研究 被引量:21
18
作者 史敏 罗建 蔡丽君 《情报学报》 CSSCI CSCD 北大核心 2020年第11期1171-1181,共11页
基于专利说明书的语义分析开展潜在竞争对手识别研究,不仅能够为企业尽早发现未来可能给自己致命一击的竞争对手,为企业的战略制定提供决策支持,也能够丰富潜在竞争对手研究理论。专利说明书的背景技术和发明内容中蕴含着丰富的市场和... 基于专利说明书的语义分析开展潜在竞争对手识别研究,不仅能够为企业尽早发现未来可能给自己致命一击的竞争对手,为企业的战略制定提供决策支持,也能够丰富潜在竞争对手研究理论。专利说明书的背景技术和发明内容中蕴含着丰富的市场和技术信息,基于专利说明书构建了背景相似性、解决方案相似性和时间轴的三维潜在竞争对手初步识别框架。基于LDA语义分析技术,构建了包括搜集和预处理专利数据、建立语料库、初步识别潜在竞争对手和判别潜在竞争对手四个步骤在内的潜在竞争对手识别流程。以水环境领域为实例,证明了该潜在竞争对手识别方法的可行性和有效性。 展开更多
关键词 专利 潜在竞争对手 识别 语义分析
在线阅读 下载PDF
基于概率潜在语义分析的群体情绪演进分析 被引量:4
19
作者 林江豪 周咏梅 +2 位作者 阳爱民 陈昱宏 陈晓帆 《计算机应用》 CSCD 北大核心 2015年第10期2747-2751,2756,共6页
针对群体情绪演进分析中话题内容挖掘及其对应群体情绪分析两个层面的难题,提出了一种基于概率潜在语义分析(PLSA)模型的群体情绪演进分析方法。该方法首先利用PLSA模型抽取时间序列上的子话题,挖掘话题内容随时间的演进规律;再利用句... 针对群体情绪演进分析中话题内容挖掘及其对应群体情绪分析两个层面的难题,提出了一种基于概率潜在语义分析(PLSA)模型的群体情绪演进分析方法。该方法首先利用PLSA模型抽取时间序列上的子话题,挖掘话题内容随时间的演进规律;再利用句法关系和情感本体库,抽取与话题内容相匹配群体情绪单元,计算情绪单元的强度,形成情绪特征向量;最后,对各子话题下的情绪强度进行求和,细粒度分析子话题和事件的整体群体情绪,深入挖掘群体情绪演进规律,并将群体情绪量化和可视化。在话题情绪单元抽取过程中,引入了句法规则和情感本体库,更细粒度地抽取情绪单元,并提高了话题内容与情绪单元匹配的准确性。实验结果表明,该模型能够实现话题内容及其群体情绪按时序特征的演进分析,验证了所提方法的有效性。 展开更多
关键词 群体情绪 概率在语义分析模型 话题挖掘 情绪演进 情绪分析
在线阅读 下载PDF
一个基于概率潜语义分析的多模态多媒体检索模型 被引量:5
20
作者 张宇 袁野 王国仁 《小型微型计算机系统》 CSCD 北大核心 2015年第8期1665-1670,共6页
互联网上快速增长的多媒体信息往往包含几种不同的模态,并且在同一个多媒体文档中的这些不同形式的模态往往包含相似的含义.因此,最近多模态检索已经变成了多媒体检索领域的热点问题.提出一个基于概率潜语义分析的多模态检索模型用来完... 互联网上快速增长的多媒体信息往往包含几种不同的模态,并且在同一个多媒体文档中的这些不同形式的模态往往包含相似的含义.因此,最近多模态检索已经变成了多媒体检索领域的热点问题.提出一个基于概率潜语义分析的多模态检索模型用来完成多模态的检索.两个假设被提出:(1)同一个多媒体文档的不同模态是这个文档的多种表达方式,因此它们都表示相似的含义;(2)文本单词和图像特性是独立地被生成出来的.利用概率潜语义分析分别模拟训练集中文本和图像的生成过程并且通过期望最大化算法学习获得它们的潜在主题分布.利用多元线性回归方法分析文本表达和图像表达,并利用最小二乘法得到回归矩阵的估计.这个矩阵用于将文本和图像模态互相转换.实验表明了该方法的有效性. 展开更多
关键词 多模态 多媒体 检索 概率语义分析
在线阅读 下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部