期刊文献+
共找到79篇文章
< 1 2 4 >
每页显示 20 50 100
基于混合概率潜在语义分析模型的Web聚类 被引量:2
1
作者 王治和 王凌云 +1 位作者 党辉 潘丽娜 《计算机应用》 CSCD 北大核心 2012年第11期3018-3022,共5页
在电子商务应用中,为了更好地了解用户的内在特征,制定有效的营销策略,提出一种基于混合概率潜在语义分析(H-PLSA)模型的Web聚类算法。利用概率潜在语义分析(PLSA)技术分别对用户浏览数据、页面内容信息及内容增强型用户事务数据建立PLS... 在电子商务应用中,为了更好地了解用户的内在特征,制定有效的营销策略,提出一种基于混合概率潜在语义分析(H-PLSA)模型的Web聚类算法。利用概率潜在语义分析(PLSA)技术分别对用户浏览数据、页面内容信息及内容增强型用户事务数据建立PLSA模型,通过对数—似然函数对三个PLSA模型进行合并得到用户聚类的H-PLSA模型和页面聚类的H-PLSA模型。聚类分析中以潜在主题与用户、页面以及站点之间的条件概率作为相似度计算依据,聚类算法采用基于距离的k-medoids算法。设计并构建了H-PLSA模型,在该模型上对Web聚类算法进行验证,表明该算法是可行的。 展开更多
关键词 WEB聚类 概率在语义分析 潜在主题 k-medoids算法
在线阅读 下载PDF
基于概率潜在语义分析模型的自动答案选择 被引量:5
2
作者 张成 曲明成 +2 位作者 倪宁 仇光 卜佳俊 《计算机工程》 CAS CSCD 北大核心 2011年第14期70-72,共3页
问答社区中候选答案过多会增加提问用户选择最佳答案的负担。为此,提出一种基于概率潜在语义分析(PLSA)模型的自动答案选择方法。在主题建模思想的基础上,利用问答社区中的用户资料,以PLSA模型表达问答社区中的用户兴趣分布,依据答案和... 问答社区中候选答案过多会增加提问用户选择最佳答案的负担。为此,提出一种基于概率潜在语义分析(PLSA)模型的自动答案选择方法。在主题建模思想的基础上,利用问答社区中的用户资料,以PLSA模型表达问答社区中的用户兴趣分布,依据答案和问题之间的主题匹配度对候选答案进行排序。实验结果表明,该方法可有效挖掘用户兴趣,提高答案选择的准确率。 展开更多
关键词 答案选择 问答社区 概率在语义分析 主题建模
在线阅读 下载PDF
基于概率潜语义分析模型的高光谱影像层次聚类分析 被引量:5
3
作者 易文斌 慎利 +1 位作者 齐银凤 唐宏 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2011年第9期2471-2475,共5页
将概率潜语义分析模型(PLSA)应用于高光谱影像聚类,提出一种基于语义信息的影像聚类方法。首先,利用ISODATA算法获取影像的初次聚类结果,从而形成PLSA模型中的视觉词;其次,利用影像分割算法对高光谱影像进行分割,并将分割体作为PLSA模... 将概率潜语义分析模型(PLSA)应用于高光谱影像聚类,提出一种基于语义信息的影像聚类方法。首先,利用ISODATA算法获取影像的初次聚类结果,从而形成PLSA模型中的视觉词;其次,利用影像分割算法对高光谱影像进行分割,并将分割体作为PLSA模型的文档;再次,利用多种最佳聚类类别数估计方法确定PLSA模型的潜语义主题的个数;进而估计PLSA模型的参数,获得概率主题内视觉词的概率分布和每个分割体中各概率主题的混合比例;最后利用统计模式识别方法获取每个影像文档中各个视觉词对应的潜语义主题的类型,从而实现影像的层次聚类分析。相关实验结果表明,本文的层次聚类结果较K-MEANS算法、ISODATA算法聚类结果的面向对象特性更明显,其与真实地物的空间分布更接近。 展开更多
关键词 概率语义分析模型 高光谱影像 层次聚类 语义信息
在线阅读 下载PDF
一个基于概率潜语义分析的多模态多媒体检索模型 被引量:5
4
作者 张宇 袁野 王国仁 《小型微型计算机系统》 CSCD 北大核心 2015年第8期1665-1670,共6页
互联网上快速增长的多媒体信息往往包含几种不同的模态,并且在同一个多媒体文档中的这些不同形式的模态往往包含相似的含义.因此,最近多模态检索已经变成了多媒体检索领域的热点问题.提出一个基于概率潜语义分析的多模态检索模型用来完... 互联网上快速增长的多媒体信息往往包含几种不同的模态,并且在同一个多媒体文档中的这些不同形式的模态往往包含相似的含义.因此,最近多模态检索已经变成了多媒体检索领域的热点问题.提出一个基于概率潜语义分析的多模态检索模型用来完成多模态的检索.两个假设被提出:(1)同一个多媒体文档的不同模态是这个文档的多种表达方式,因此它们都表示相似的含义;(2)文本单词和图像特性是独立地被生成出来的.利用概率潜语义分析分别模拟训练集中文本和图像的生成过程并且通过期望最大化算法学习获得它们的潜在主题分布.利用多元线性回归方法分析文本表达和图像表达,并利用最小二乘法得到回归矩阵的估计.这个矩阵用于将文本和图像模态互相转换.实验表明了该方法的有效性. 展开更多
关键词 多模态 多媒体 检索 概率语义分析
在线阅读 下载PDF
基于概率潜在语义分析的群体情绪演进分析 被引量:4
5
作者 林江豪 周咏梅 +2 位作者 阳爱民 陈昱宏 陈晓帆 《计算机应用》 CSCD 北大核心 2015年第10期2747-2751,2756,共6页
针对群体情绪演进分析中话题内容挖掘及其对应群体情绪分析两个层面的难题,提出了一种基于概率潜在语义分析(PLSA)模型的群体情绪演进分析方法。该方法首先利用PLSA模型抽取时间序列上的子话题,挖掘话题内容随时间的演进规律;再利用句... 针对群体情绪演进分析中话题内容挖掘及其对应群体情绪分析两个层面的难题,提出了一种基于概率潜在语义分析(PLSA)模型的群体情绪演进分析方法。该方法首先利用PLSA模型抽取时间序列上的子话题,挖掘话题内容随时间的演进规律;再利用句法关系和情感本体库,抽取与话题内容相匹配群体情绪单元,计算情绪单元的强度,形成情绪特征向量;最后,对各子话题下的情绪强度进行求和,细粒度分析子话题和事件的整体群体情绪,深入挖掘群体情绪演进规律,并将群体情绪量化和可视化。在话题情绪单元抽取过程中,引入了句法规则和情感本体库,更细粒度地抽取情绪单元,并提高了话题内容与情绪单元匹配的准确性。实验结果表明,该模型能够实现话题内容及其群体情绪按时序特征的演进分析,验证了所提方法的有效性。 展开更多
关键词 群体情绪 概率潜在语义分析模型 话题挖掘 情绪演进 情绪分析
在线阅读 下载PDF
基于概率潜在语义分析的词汇情感倾向判别 被引量:15
6
作者 宋晓雷 王素格 +1 位作者 李红霞 李德玉 《中文信息学报》 CSCD 北大核心 2011年第2期89-93,共5页
该文利用概率潜在语义分析,给出了两种用于判别词汇情感倾向的方法。一是使用概率潜在语义分析获得目标词和基准词之间的相似度矩阵,再利用投票法决定其情感倾向;二是利用概率潜在语义分析获取目标词的语义聚类,然后借鉴基于同义词的词... 该文利用概率潜在语义分析,给出了两种用于判别词汇情感倾向的方法。一是使用概率潜在语义分析获得目标词和基准词之间的相似度矩阵,再利用投票法决定其情感倾向;二是利用概率潜在语义分析获取目标词的语义聚类,然后借鉴基于同义词的词汇情感倾向判别方法对目标词的情感倾向做出判别。两种方法的优点是均可在没有外部资源的条件下,实现词汇情感倾向的判别。 展开更多
关键词 概率在语义分析 数据稀疏 语义聚类 情感倾向
在线阅读 下载PDF
改进的概率潜在语义分析下的文本聚类算法 被引量:14
7
作者 张玉芳 朱俊 熊忠阳 《计算机应用》 CSCD 北大核心 2011年第3期674-676,693,共4页
概率潜在语义分析(PLSA)模型用期望最大化(EM)算法进行参数训练,由于算法参数的随机初始化,致使聚类的效果过度拟合且过分依赖于参数初始值。将潜在语义分析(LSA)模型参数概率化,用以初始化概率潜在语义分析模型的参数,得到的改进算法... 概率潜在语义分析(PLSA)模型用期望最大化(EM)算法进行参数训练,由于算法参数的随机初始化,致使聚类的效果过度拟合且过分依赖于参数初始值。将潜在语义分析(LSA)模型参数概率化,用以初始化概率潜在语义分析模型的参数,得到的改进算法有效解决了参数随机初始化问题。经实验验证,所提出的方法对文本聚类的归一化互信息(NM I)和准确度都有明显提高。 展开更多
关键词 文本聚类 概率在语义分析 参数初始化 在语义分析
在线阅读 下载PDF
基于概率潜在语义分析的中文信息检索 被引量:11
8
作者 罗景 涂新辉 《计算机工程》 CAS CSCD 北大核心 2008年第2期199-201,共3页
传统的信息检索模型把词看作孤立的单元,没有考虑自然语言中存在大量的同义词、多义词现象,对召回率和准确率有不利的影响。概率潜在语义模型使用统计的方法建立"文档-潜在语义-词"之间概率分布关系并利用这种关系进行检索。... 传统的信息检索模型把词看作孤立的单元,没有考虑自然语言中存在大量的同义词、多义词现象,对召回率和准确率有不利的影响。概率潜在语义模型使用统计的方法建立"文档-潜在语义-词"之间概率分布关系并利用这种关系进行检索。该文将概率潜在语义模型用于中文信息检索,实验结果表明,概率潜在语义模型相对于传统的向量空间模型能够显著地提高检索的平均精度。 展开更多
关键词 概率在语义分析 中文信息检索 索引技术 关键词抽取
在线阅读 下载PDF
基于概率隐含语义分析模型的人脸识别算法 被引量:3
9
作者 邹修明 孙怀江 杨赛 《南京理工大学学报》 EI CAS CSCD 北大核心 2016年第5期594-598,共5页
该文提出一种基于概率隐含语义分析(PLSA)的新的人脸识别算法。首先建立人脸图像的词袋模型,然后使用概率隐含语义分析模型得到词袋特征在隐含主题空间中的分布,并将其作为人脸图像的最终语义特征表示,最后采用支持向量机(SVM)对人脸进... 该文提出一种基于概率隐含语义分析(PLSA)的新的人脸识别算法。首先建立人脸图像的词袋模型,然后使用概率隐含语义分析模型得到词袋特征在隐含主题空间中的分布,并将其作为人脸图像的最终语义特征表示,最后采用支持向量机(SVM)对人脸进行识别。Multi-PIE和人脸识别竞赛(FRGC)数据库上的实验结果表明,该文方法的性能优于目前多个人脸识别方法。 展开更多
关键词 人脸识别 概率隐含语义分析 词袋模型
在线阅读 下载PDF
基于概率潜在语义分析的Web用户聚类 被引量:4
10
作者 俞辉 景海峰 《计算机工程与应用》 CSCD 北大核心 2008年第23期160-162,共3页
Web用户聚类知识可以为改进信息搜索效率和提供个性化服务提供帮助。通过对海量日志记录分析,构建会话-页面矩阵;根据信息论理论,在会话-页面矩阵中权值计算中考虑局部和全局权值贡献;利用概率潜在语义分析将隐式变量Z对页面P的条件概... Web用户聚类知识可以为改进信息搜索效率和提供个性化服务提供帮助。通过对海量日志记录分析,构建会话-页面矩阵;根据信息论理论,在会话-页面矩阵中权值计算中考虑局部和全局权值贡献;利用概率潜在语义分析将隐式变量Z对页面P的条件概率转换为隐式变量Z对会话S的条件概率,然后在聚类分析中以此作为相似度计算依据。聚类算法采用了基于距离的k-medoids算法,以进一步改善聚类精度。实验结果验证了该算法的有效性和局限性。 展开更多
关键词 WEB日志 预处理 WEB用户 概率在语义分析 聚类
在线阅读 下载PDF
概率潜在语义分析(PLSA)在中药新药处方发现中的应用 被引量:3
11
作者 雷蕾 张早华 +3 位作者 温先荣 亢力 张竹绿 刘森 《世界科学技术-中医药现代化》 北大核心 2012年第5期1976-1980,共5页
目的:使用概率潜在语义分析(PLSA)算法研究中药配伍方案,为中药处方发现提供新途径。方法:基于丰富的中医药文献数据,从临床治疗缺血性心脑血管疾病的方剂出发,使用PLSA算法,筛选出治疗缺血性心脑血管疾病的新药候选方,并从药理学的角... 目的:使用概率潜在语义分析(PLSA)算法研究中药配伍方案,为中药处方发现提供新途径。方法:基于丰富的中医药文献数据,从临床治疗缺血性心脑血管疾病的方剂出发,使用PLSA算法,筛选出治疗缺血性心脑血管疾病的新药候选方,并从药理学的角度对候选方进行分析,最后结合专家智慧在候选方的基础上给出具有开发潜力的新药处方。结果:筛选出治疗该病的中药核心组合,并证明了PLSA算法用于中药处方发现具有一定的可靠性和稳定性。同时专家从计算机筛选出的处方中选出有开发前景的两首方。结论:PLSA算法在治疗缺血性心脑血管疾病中药处方发现中有着广阔的应用前景。 展开更多
关键词 概率在语义分析 缺血性心脑血管疾病 中药处方发现
在线阅读 下载PDF
一种新的潜在语义分析语言模型 被引量:3
12
作者 任纪生 王作英 《高技术通讯》 CAS CSCD 北大核心 2005年第8期1-5,共5页
提出了基于聚类的方法实现词的快速量化表示,并由此导出潜在语义分析语言模型预测置信度,同时运用新提出的几何加权静态插值方式同三元文法模型相结合,构建了一种新的潜在语义分析语言模型,并将其应用于汉语语音识别.实验表明其效率和... 提出了基于聚类的方法实现词的快速量化表示,并由此导出潜在语义分析语言模型预测置信度,同时运用新提出的几何加权静态插值方式同三元文法模型相结合,构建了一种新的潜在语义分析语言模型,并将其应用于汉语语音识别.实验表明其效率和性能均优于传统基于奇异值分解的潜在语义分析语言模型,相比于三元文法模型,识别错误率相对下降为3.6%~7.1%左右,并为有效量化表示词对进一步提高潜在语义分析语言模型性能提供了新的途径. 展开更多
关键词 语言模型 语音识别 N元文法 在语义分析 奇异值分解 汉语语音识别 模型性能 模型预测 插值方式 量化表
在线阅读 下载PDF
概率隐含语义分析模型在行为识别中的编码与归一化方法研究 被引量:1
13
作者 徐勤军 周同驰 +1 位作者 周琳 吴镇扬 《信号处理》 CSCD 北大核心 2018年第7期766-775,共10页
在视频中的行为识别的语境下,为了提高概率隐含语义分析模型的识别性能,研究了不同编码方法结合归一化方法对于分类性能的影响;还考察了主成分分析预处理原始特征对于性能的影响,在显著降低特征维度进而降低计算量的同时,当特征包含较... 在视频中的行为识别的语境下,为了提高概率隐含语义分析模型的识别性能,研究了不同编码方法结合归一化方法对于分类性能的影响;还考察了主成分分析预处理原始特征对于性能的影响,在显著降低特征维度进而降低计算量的同时,当特征包含较多噪声成分的情况下性能甚至会有所提升。在KTH和UT-interaction数据库上的实验表明,编码和归一化方法的适当组合可以显著提高模型的性能。在UT-interaction数据库的两个子集上识别精度分别达到了当前最好的结果 96.44%、95%,其中在数据集1上采用稀疏的时空兴趣点特征,得到了94.24%的识别精度。 展开更多
关键词 行为识别 主题模型 概率隐含语义分析 局域软分配
在线阅读 下载PDF
结合概率潜在语义分析的文本谱聚类方法研究
14
作者 张玉芳 张洪 +1 位作者 熊忠阳 李文田 《计算机工程与应用》 CSCD 北大核心 2011年第36期134-136,179,共4页
传统谱聚类的相似矩阵建立在VSM(Vector Space Model)之上,该模型把词看作孤立的单元,没有考虑自然语言中存在大量的同义词、多义词现象。针对这一问题,提出一种用概率潜在语义分析(Probabilistic Latent Semantic Analysis,PLSA)来提... 传统谱聚类的相似矩阵建立在VSM(Vector Space Model)之上,该模型把词看作孤立的单元,没有考虑自然语言中存在大量的同义词、多义词现象。针对这一问题,提出一种用概率潜在语义分析(Probabilistic Latent Semantic Analysis,PLSA)来提取文本中隐含语义信息的方法,并构建文本集的相似矩阵,从语义的角度考虑了文本之间的相关性。实验结果表明,利用该方法得到的聚类精度有较大提高,结果要好于传统的谱聚类算法,从而验证了该方法的有效性。 展开更多
关键词 文本聚类 概率在语义分析 谱聚类 相似矩阵
在线阅读 下载PDF
目标语义概率模型在类目标识别和地物场景分析中的算法研究
15
作者 刘玮 陈新武 田金文 《计算机科学》 CSCD 北大核心 2009年第7期273-277,共5页
基于文本分析统计模型提出了图像类目标的语义概率模型,并且将这种概率模型应用于目标识别和复杂场景下的地物分析。首先将图像表示成多个特征局部区域的集合,然后根据目标语义概率模型得到图像、特征局部和目标语义之间的概率关系,通... 基于文本分析统计模型提出了图像类目标的语义概率模型,并且将这种概率模型应用于目标识别和复杂场景下的地物分析。首先将图像表示成多个特征局部区域的集合,然后根据目标语义概率模型得到图像、特征局部和目标语义之间的概率关系,通过计算后验概率可以实现目标语义类别的识别。目标概率模型通过EM算法获得模型估计参数。实验结果显示,在识别复杂背景中的目标达到了很好的效果。场景分析中根据图像中各局部区域与目标语义的概率分布可以实现场景中感兴趣区域的标注,实验结果说明此方法有可行性。 展开更多
关键词 类目标识别 场景分析 语义概率模型 模型
在线阅读 下载PDF
基于潜在语义分析的本体空间表示模型研究
16
作者 汤世平 樊孝忠 朱建勇 《计算机应用与软件》 CSCD 北大核心 2008年第1期53-55,共3页
针对传统的向量空间模型和潜在语义分析方法应用于计算机辅助评估时存在的问题,提出一种将领域本体、一阶逻辑和潜在语义分析方法相结合的本体空间表示模型。该模型采用一阶逻辑表示从短文问题得到的二元关系并建立索引,使用潜在语义分... 针对传统的向量空间模型和潜在语义分析方法应用于计算机辅助评估时存在的问题,提出一种将领域本体、一阶逻辑和潜在语义分析方法相结合的本体空间表示模型。该模型采用一阶逻辑表示从短文问题得到的二元关系并建立索引,使用潜在语义分析来计算关系集合中关系和包含段落的文档的相似度,从而得到段落在关系子集的平均相似度。实验结果表明,与向量空间模型相比,该模型的表示效果更好。 展开更多
关键词 在语义分析 本体空间 表示模型 计算机辅助评估
在线阅读 下载PDF
基于概率潜在语义分析和Adaboost算法的文本分类技术研究
17
作者 刘苗 谢邦昌 《统计与决策》 CSSCI 北大核心 2010年第19期21-23,共3页
文章从文本特征抽取、分类算法效率和精度两个角度出发,首先利用概率潜在语义分析(PLSA)方法,有效地提取出隐含在文档词频数据中的语义概念信息;然后构建了分类精度较高的Adaboost算法作为分类器。实验结果表明,该方法发挥了两种方法的... 文章从文本特征抽取、分类算法效率和精度两个角度出发,首先利用概率潜在语义分析(PLSA)方法,有效地提取出隐含在文档词频数据中的语义概念信息;然后构建了分类精度较高的Adaboost算法作为分类器。实验结果表明,该方法发挥了两种方法的优势,能够很好地完成对文本的自动分类。 展开更多
关键词 文本自动分类 概率在语义分析(PLSA) ADABOOST TEM迭代
在线阅读 下载PDF
基于潜在语义分析的汉语问答系统答案提取 被引量:46
18
作者 余正涛 樊孝忠 +1 位作者 郭剑毅 耿增民 《计算机学报》 EI CSCD 北大核心 2006年第10期1889-1893,共5页
为了解决在汉语问答系统答案提取时,由于词的同义或多义现象而导致的“漏提”或“错提”等问题,提出了一种基于潜在语义分析(LSA)的问题和答案句子相似度计算方法.它利用空间向量模型作为问题和句子的表示方法,借助于潜在语义分析理论,... 为了解决在汉语问答系统答案提取时,由于词的同义或多义现象而导致的“漏提”或“错提”等问题,提出了一种基于潜在语义分析(LSA)的问题和答案句子相似度计算方法.它利用空间向量模型作为问题和句子的表示方法,借助于潜在语义分析理论,对大量问答作句子语料统计分析,构建了一个潜在的词-句子语义空间,从而消除了词之间的相关性,并在语义空间上实现了问题与答案句子相似度计算,有效地解决了词的同义和多义问题.最后结合问题类型和相似度计算结果,对汉语基于事实的简单陈述问题进行了答案句子提取实验.答案提取的MRR值达到了0.47,明显优于空间向量模型.结果说明该方法具有很好的效果. 展开更多
关键词 问答系统 答案提取 相似度 向量空间模型 在语义分析
在线阅读 下载PDF
基于潜在语义分析的信息检索 被引量:29
19
作者 盖杰 王怡 武港山 《计算机工程》 CAS CSCD 北大核心 2004年第2期58-60,共3页
潜在语义分析是一种用于自动实现知识提取和表示的理论和方法,它通过对大量的文本集进行统计分析,从中提取出词语的上下文使用含义。文章介绍了基于潜在语义分析的文本信息检索的基本思想、特点以及实现方法 。
关键词 在语义分析 信息检索 语义 向量空间模型
在线阅读 下载PDF
潜在语义分析理论及其应用 被引量:36
20
作者 盖杰 王怡 武港山 《计算机应用研究》 CSCD 北大核心 2004年第3期9-12,20,共5页
潜在语义分析(LatentSemanticAnalysis,LSA)是一种用于自动地实现知识提取和表示的理论和方法,它通过对大量的文本集进行统计分析,从中提取出词语的上下文使用含义。在技术上,它同向量空间模型类型类似,都是采用空间向量表示文本,但通过... 潜在语义分析(LatentSemanticAnalysis,LSA)是一种用于自动地实现知识提取和表示的理论和方法,它通过对大量的文本集进行统计分析,从中提取出词语的上下文使用含义。在技术上,它同向量空间模型类型类似,都是采用空间向量表示文本,但通过SVD分解等处理,消除了同义词、多义词的影响,提高了后续处理的精度。将着重介绍LSA方法的基本思想、特点、实现方法,以及基于LSA思想的具体应用。 展开更多
关键词 在语义分析 上下文 语义 向量空间模型
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部