期刊文献+
共找到68篇文章
< 1 2 4 >
每页显示 20 50 100
目标语义概率模型在类目标识别和地物场景分析中的算法研究
1
作者 刘玮 陈新武 田金文 《计算机科学》 CSCD 北大核心 2009年第7期273-277,共5页
基于文本分析统计模型提出了图像类目标的语义概率模型,并且将这种概率模型应用于目标识别和复杂场景下的地物分析。首先将图像表示成多个特征局部区域的集合,然后根据目标语义概率模型得到图像、特征局部和目标语义之间的概率关系,通... 基于文本分析统计模型提出了图像类目标的语义概率模型,并且将这种概率模型应用于目标识别和复杂场景下的地物分析。首先将图像表示成多个特征局部区域的集合,然后根据目标语义概率模型得到图像、特征局部和目标语义之间的概率关系,通过计算后验概率可以实现目标语义类别的识别。目标概率模型通过EM算法获得模型估计参数。实验结果显示,在识别复杂背景中的目标达到了很好的效果。场景分析中根据图像中各局部区域与目标语义的概率分布可以实现场景中感兴趣区域的标注,实验结果说明此方法有可行性。 展开更多
关键词 类目标识别 场景分析 语义概率模型 图模型
在线阅读 下载PDF
考虑决策者心理行为的概率语义术语集多属性决策方法 被引量:6
2
作者 张永政 叶春明 耿秀丽 《计算机应用研究》 CSCD 北大核心 2020年第10期3001-3005,3024,共6页
概率语义术语集可以通过给语义赋予概率以表达不同程度偏好,采用概率语义术语集获取专家犹豫和不确定的评价信息。针对传统多属性决策中指标权重确定没有考虑指标间相互影响关系的问题,采用概率语义DEMATEL方法分析指标间的相互影响关系... 概率语义术语集可以通过给语义赋予概率以表达不同程度偏好,采用概率语义术语集获取专家犹豫和不确定的评价信息。针对传统多属性决策中指标权重确定没有考虑指标间相互影响关系的问题,采用概率语义DEMATEL方法分析指标间的相互影响关系,其中采用二元语义将指标间关联关系概率语义术语集的得分函数转换为精确数值,得到指标的权重。考虑决策者的不同偏好和心理行为,采用改进的概率语义TODIM方法对决策对象进行排序。最后以某班轮公司的综合竞争力评估为例,验证了该方法的有效性。 展开更多
关键词 多属性决策 概率语义术语集 二元语义 DEMATEL TODIM
在线阅读 下载PDF
经典命题逻辑的概率语义及其应用 被引量:10
3
作者 张家录 陈雪刚 赵晓东 《计算机学报》 EI CSCD 北大核心 2014年第8期1775-1785,共11页
文中将经典命题逻辑的赋值域由二值({0,1})推广到概率空间,引进了命题公式的概率赋值并建立命题逻辑的概率语义,证明了一个命题公式为重言式当且仅当其在每个概率赋值下的值都等于1.引入了命题公式的概率真度、不确定度、Λ-概率真度、... 文中将经典命题逻辑的赋值域由二值({0,1})推广到概率空间,引进了命题公式的概率赋值并建立命题逻辑的概率语义,证明了一个命题公式为重言式当且仅当其在每个概率赋值下的值都等于1.引入了命题公式的概率真度、不确定度、Λ-概率真度、Λ-不确定度等概念,并说明了Λ-概率真度是已有的二值命题逻辑各种真度概念的推广,通过讨论Λ-概率真度的性质,表明Λ-概率真度在全体公式集F(S)上满足Kolmogorov公理.证明在形式推演的一个有效推理中,结论的Λ-不确定度不超过各前提的Λ-不确定度与其必要度的乘积之和.利用公式的Λ-不确定度引进公式间的Λ-相似度和Λ-伪距离,证明了在一定条件下所建立的Λ-伪距离空间没有孤立点且通常的逻辑运算关于Λ-伪距离是连续的.在Λ-伪距离空间中,提出了F(S)上的两种不同近似推理模式,并通过实际应用例子说明所提出的近似推理模式是有效的. 展开更多
关键词 概率语义 ∧-概率真度 ∧-不确定度 ∧-伪距离 概率逻辑 近似推理
在线阅读 下载PDF
一个基于概率潜语义分析的多模态多媒体检索模型 被引量:5
4
作者 张宇 袁野 王国仁 《小型微型计算机系统》 CSCD 北大核心 2015年第8期1665-1670,共6页
互联网上快速增长的多媒体信息往往包含几种不同的模态,并且在同一个多媒体文档中的这些不同形式的模态往往包含相似的含义.因此,最近多模态检索已经变成了多媒体检索领域的热点问题.提出一个基于概率潜语义分析的多模态检索模型用来完... 互联网上快速增长的多媒体信息往往包含几种不同的模态,并且在同一个多媒体文档中的这些不同形式的模态往往包含相似的含义.因此,最近多模态检索已经变成了多媒体检索领域的热点问题.提出一个基于概率潜语义分析的多模态检索模型用来完成多模态的检索.两个假设被提出:(1)同一个多媒体文档的不同模态是这个文档的多种表达方式,因此它们都表示相似的含义;(2)文本单词和图像特性是独立地被生成出来的.利用概率潜语义分析分别模拟训练集中文本和图像的生成过程并且通过期望最大化算法学习获得它们的潜在主题分布.利用多元线性回归方法分析文本表达和图像表达,并利用最小二乘法得到回归矩阵的估计.这个矩阵用于将文本和图像模态互相转换.实验表明了该方法的有效性. 展开更多
关键词 多模态 多媒体 检索 概率语义分析
在线阅读 下载PDF
基于概率潜语义分析模型的高光谱影像层次聚类分析 被引量:5
5
作者 易文斌 慎利 +1 位作者 齐银凤 唐宏 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2011年第9期2471-2475,共5页
将概率潜语义分析模型(PLSA)应用于高光谱影像聚类,提出一种基于语义信息的影像聚类方法。首先,利用ISODATA算法获取影像的初次聚类结果,从而形成PLSA模型中的视觉词;其次,利用影像分割算法对高光谱影像进行分割,并将分割体作为PLSA模... 将概率潜语义分析模型(PLSA)应用于高光谱影像聚类,提出一种基于语义信息的影像聚类方法。首先,利用ISODATA算法获取影像的初次聚类结果,从而形成PLSA模型中的视觉词;其次,利用影像分割算法对高光谱影像进行分割,并将分割体作为PLSA模型的文档;再次,利用多种最佳聚类类别数估计方法确定PLSA模型的潜语义主题的个数;进而估计PLSA模型的参数,获得概率主题内视觉词的概率分布和每个分割体中各概率主题的混合比例;最后利用统计模式识别方法获取每个影像文档中各个视觉词对应的潜语义主题的类型,从而实现影像的层次聚类分析。相关实验结果表明,本文的层次聚类结果较K-MEANS算法、ISODATA算法聚类结果的面向对象特性更明显,其与真实地物的空间分布更接近。 展开更多
关键词 概率语义分析模型 高光谱影像 层次聚类 语义信息
在线阅读 下载PDF
基于概率潜在语义分析的词汇情感倾向判别 被引量:15
6
作者 宋晓雷 王素格 +1 位作者 李红霞 李德玉 《中文信息学报》 CSCD 北大核心 2011年第2期89-93,共5页
该文利用概率潜在语义分析,给出了两种用于判别词汇情感倾向的方法。一是使用概率潜在语义分析获得目标词和基准词之间的相似度矩阵,再利用投票法决定其情感倾向;二是利用概率潜在语义分析获取目标词的语义聚类,然后借鉴基于同义词的词... 该文利用概率潜在语义分析,给出了两种用于判别词汇情感倾向的方法。一是使用概率潜在语义分析获得目标词和基准词之间的相似度矩阵,再利用投票法决定其情感倾向;二是利用概率潜在语义分析获取目标词的语义聚类,然后借鉴基于同义词的词汇情感倾向判别方法对目标词的情感倾向做出判别。两种方法的优点是均可在没有外部资源的条件下,实现词汇情感倾向的判别。 展开更多
关键词 概率潜在语义分析 数据稀疏 语义聚类 情感倾向
在线阅读 下载PDF
基于概率隐含语义分析模型的人脸识别算法 被引量:3
7
作者 邹修明 孙怀江 杨赛 《南京理工大学学报》 EI CAS CSCD 北大核心 2016年第5期594-598,共5页
该文提出一种基于概率隐含语义分析(PLSA)的新的人脸识别算法。首先建立人脸图像的词袋模型,然后使用概率隐含语义分析模型得到词袋特征在隐含主题空间中的分布,并将其作为人脸图像的最终语义特征表示,最后采用支持向量机(SVM)对人脸进... 该文提出一种基于概率隐含语义分析(PLSA)的新的人脸识别算法。首先建立人脸图像的词袋模型,然后使用概率隐含语义分析模型得到词袋特征在隐含主题空间中的分布,并将其作为人脸图像的最终语义特征表示,最后采用支持向量机(SVM)对人脸进行识别。Multi-PIE和人脸识别竞赛(FRGC)数据库上的实验结果表明,该文方法的性能优于目前多个人脸识别方法。 展开更多
关键词 人脸识别 概率隐含语义分析 词袋模型
在线阅读 下载PDF
改进的概率潜在语义分析下的文本聚类算法 被引量:14
8
作者 张玉芳 朱俊 熊忠阳 《计算机应用》 CSCD 北大核心 2011年第3期674-676,693,共4页
概率潜在语义分析(PLSA)模型用期望最大化(EM)算法进行参数训练,由于算法参数的随机初始化,致使聚类的效果过度拟合且过分依赖于参数初始值。将潜在语义分析(LSA)模型参数概率化,用以初始化概率潜在语义分析模型的参数,得到的改进算法... 概率潜在语义分析(PLSA)模型用期望最大化(EM)算法进行参数训练,由于算法参数的随机初始化,致使聚类的效果过度拟合且过分依赖于参数初始值。将潜在语义分析(LSA)模型参数概率化,用以初始化概率潜在语义分析模型的参数,得到的改进算法有效解决了参数随机初始化问题。经实验验证,所提出的方法对文本聚类的归一化互信息(NM I)和准确度都有明显提高。 展开更多
关键词 文本聚类 概率潜在语义分析 参数初始化 潜在语义分析
在线阅读 下载PDF
基于概率语义信息公理的顾客满意度测评 被引量:3
9
作者 耿秀丽 薄振一 张永政 《计算机集成制造系统》 EI CSCD 北大核心 2020年第7期1868-1874,共7页
在传统制造型企业向服务型制造模式转型的过程中,顾客满意度测评有利于企业寻找薄弱环节、更好地满足顾客需求。以前期市场调研获取的顾客需求作为测评指标,为客观地获取测评指标的顾客满意度,采用信息公理基于指标的实际表现值进行测评... 在传统制造型企业向服务型制造模式转型的过程中,顾客满意度测评有利于企业寻找薄弱环节、更好地满足顾客需求。以前期市场调研获取的顾客需求作为测评指标,为客观地获取测评指标的顾客满意度,采用信息公理基于指标的实际表现值进行测评,其原理是信息量越小的指标顾客满意度越高。为解决评估定性指标过程中获取信息时存在犹豫性的问题,采用概率语义术语集获取信息,并提出将概率语义术语集转化为区间数的方法,从而计算测评指标的信息量。以电梯顾客满意度测评为例,通过与三角模糊信息公理测评方法的比较,验证了所提出方法的有效性。 展开更多
关键词 服务型制造 顾客满意度 顾客需求 信息公理 概率语义术语集
在线阅读 下载PDF
基于概率潜在语义分析的群体情绪演进分析 被引量:4
10
作者 林江豪 周咏梅 +2 位作者 阳爱民 陈昱宏 陈晓帆 《计算机应用》 CSCD 北大核心 2015年第10期2747-2751,2756,共6页
针对群体情绪演进分析中话题内容挖掘及其对应群体情绪分析两个层面的难题,提出了一种基于概率潜在语义分析(PLSA)模型的群体情绪演进分析方法。该方法首先利用PLSA模型抽取时间序列上的子话题,挖掘话题内容随时间的演进规律;再利用句... 针对群体情绪演进分析中话题内容挖掘及其对应群体情绪分析两个层面的难题,提出了一种基于概率潜在语义分析(PLSA)模型的群体情绪演进分析方法。该方法首先利用PLSA模型抽取时间序列上的子话题,挖掘话题内容随时间的演进规律;再利用句法关系和情感本体库,抽取与话题内容相匹配群体情绪单元,计算情绪单元的强度,形成情绪特征向量;最后,对各子话题下的情绪强度进行求和,细粒度分析子话题和事件的整体群体情绪,深入挖掘群体情绪演进规律,并将群体情绪量化和可视化。在话题情绪单元抽取过程中,引入了句法规则和情感本体库,更细粒度地抽取情绪单元,并提高了话题内容与情绪单元匹配的准确性。实验结果表明,该模型能够实现话题内容及其群体情绪按时序特征的演进分析,验证了所提方法的有效性。 展开更多
关键词 群体情绪 概率潜在语义分析模型 话题挖掘 情绪演进 情绪分析
在线阅读 下载PDF
基于概率潜在语义分析的中文信息检索 被引量:11
11
作者 罗景 涂新辉 《计算机工程》 CAS CSCD 北大核心 2008年第2期199-201,共3页
传统的信息检索模型把词看作孤立的单元,没有考虑自然语言中存在大量的同义词、多义词现象,对召回率和准确率有不利的影响。概率潜在语义模型使用统计的方法建立"文档-潜在语义-词"之间概率分布关系并利用这种关系进行检索。... 传统的信息检索模型把词看作孤立的单元,没有考虑自然语言中存在大量的同义词、多义词现象,对召回率和准确率有不利的影响。概率潜在语义模型使用统计的方法建立"文档-潜在语义-词"之间概率分布关系并利用这种关系进行检索。该文将概率潜在语义模型用于中文信息检索,实验结果表明,概率潜在语义模型相对于传统的向量空间模型能够显著地提高检索的平均精度。 展开更多
关键词 概率潜在语义分析 中文信息检索 索引技术 关键词抽取
在线阅读 下载PDF
基于混合概率潜在语义分析模型的Web聚类 被引量:2
12
作者 王治和 王凌云 +1 位作者 党辉 潘丽娜 《计算机应用》 CSCD 北大核心 2012年第11期3018-3022,共5页
在电子商务应用中,为了更好地了解用户的内在特征,制定有效的营销策略,提出一种基于混合概率潜在语义分析(H-PLSA)模型的Web聚类算法。利用概率潜在语义分析(PLSA)技术分别对用户浏览数据、页面内容信息及内容增强型用户事务数据建立PLS... 在电子商务应用中,为了更好地了解用户的内在特征,制定有效的营销策略,提出一种基于混合概率潜在语义分析(H-PLSA)模型的Web聚类算法。利用概率潜在语义分析(PLSA)技术分别对用户浏览数据、页面内容信息及内容增强型用户事务数据建立PLSA模型,通过对数—似然函数对三个PLSA模型进行合并得到用户聚类的H-PLSA模型和页面聚类的H-PLSA模型。聚类分析中以潜在主题与用户、页面以及站点之间的条件概率作为相似度计算依据,聚类算法采用基于距离的k-medoids算法。设计并构建了H-PLSA模型,在该模型上对Web聚类算法进行验证,表明该算法是可行的。 展开更多
关键词 WEB聚类 概率潜在语义分析 潜在主题 k-medoids算法
在线阅读 下载PDF
基于概率潜在语义分析的Web用户聚类 被引量:4
13
作者 俞辉 景海峰 《计算机工程与应用》 CSCD 北大核心 2008年第23期160-162,共3页
Web用户聚类知识可以为改进信息搜索效率和提供个性化服务提供帮助。通过对海量日志记录分析,构建会话-页面矩阵;根据信息论理论,在会话-页面矩阵中权值计算中考虑局部和全局权值贡献;利用概率潜在语义分析将隐式变量Z对页面P的条件概... Web用户聚类知识可以为改进信息搜索效率和提供个性化服务提供帮助。通过对海量日志记录分析,构建会话-页面矩阵;根据信息论理论,在会话-页面矩阵中权值计算中考虑局部和全局权值贡献;利用概率潜在语义分析将隐式变量Z对页面P的条件概率转换为隐式变量Z对会话S的条件概率,然后在聚类分析中以此作为相似度计算依据。聚类算法采用了基于距离的k-medoids算法,以进一步改善聚类精度。实验结果验证了该算法的有效性和局限性。 展开更多
关键词 WEB日志 预处理 WEB用户 概率潜在语义分析 聚类
在线阅读 下载PDF
基于广义内容概率潜在语义分析模型的推荐 被引量:3
14
作者 张伟 黄炜 夏利民 《计算机应用》 CSCD 北大核心 2013年第5期1330-1333,共4页
针对推荐系统中存在新项目及准确性难以把握等问题,提出一种基于广义内容概率潜在语义模型的推荐方法。该方法以概率潜在语义模型为基础,引入两组潜在变量及项目特征来建立广义内容概率潜在语义模型。该模型中两组潜在变量分别表示用户... 针对推荐系统中存在新项目及准确性难以把握等问题,提出一种基于广义内容概率潜在语义模型的推荐方法。该方法以概率潜在语义模型为基础,引入两组潜在变量及项目特征来建立广义内容概率潜在语义模型。该模型中两组潜在变量分别表示用户群体和项目群体,项目特征根据实际情况以特征词的形式进行表示,且通过不对称学习算法完成未知参数的训练及预测。利用三个不同的数据集对所提方法进行实验验证,结果表明该方法具有良好的项目推荐品质。 展开更多
关键词 概率潜在语义 项目特征 最大期望算法 潜在变量 项目推荐
在线阅读 下载PDF
融合语义信息的视觉惯性SLAM算法 被引量:1
15
作者 何铭臻 何元烈 胡涛 《计算机应用研究》 CSCD 北大核心 2024年第8期2533-2539,共7页
针对传统SLAM算法在动态环境中会受到动态特征点的影响,导致算法定位精度下降的问题,提出了一种融合语义信息的视觉惯性SLAM算法SF-VINS(visual inertial navigation system based on semantics fusion)。首先基于VINS-Mono算法框架,将... 针对传统SLAM算法在动态环境中会受到动态特征点的影响,导致算法定位精度下降的问题,提出了一种融合语义信息的视觉惯性SLAM算法SF-VINS(visual inertial navigation system based on semantics fusion)。首先基于VINS-Mono算法框架,将语义分割网络PP-LiteSeg集成到系统前端,并根据语义分割结果去除动态特征点;其次,在后端利用像素语义概率构建语义概率误差约束项,并使用特征点自适应权重,提出了新的BA代价函数和相机外参优化策略,提高了状态估计的准确度;最后,为验证该算法的有效性,在VIODE和NTU VIRAL数据集上进行实验。实验结果表明,与目前先进的视觉惯性SLAM算法相比,该算法在动态场景和静态场景的定位精度和鲁棒性均有一定优势。 展开更多
关键词 动态物体 语义概率 位姿估计 视觉惯性SLAM
在线阅读 下载PDF
概率隐含语义分析模型在行为识别中的编码与归一化方法研究 被引量:1
16
作者 徐勤军 周同驰 +1 位作者 周琳 吴镇扬 《信号处理》 CSCD 北大核心 2018年第7期766-775,共10页
在视频中的行为识别的语境下,为了提高概率隐含语义分析模型的识别性能,研究了不同编码方法结合归一化方法对于分类性能的影响;还考察了主成分分析预处理原始特征对于性能的影响,在显著降低特征维度进而降低计算量的同时,当特征包含较... 在视频中的行为识别的语境下,为了提高概率隐含语义分析模型的识别性能,研究了不同编码方法结合归一化方法对于分类性能的影响;还考察了主成分分析预处理原始特征对于性能的影响,在显著降低特征维度进而降低计算量的同时,当特征包含较多噪声成分的情况下性能甚至会有所提升。在KTH和UT-interaction数据库上的实验表明,编码和归一化方法的适当组合可以显著提高模型的性能。在UT-interaction数据库的两个子集上识别精度分别达到了当前最好的结果 96.44%、95%,其中在数据集1上采用稀疏的时空兴趣点特征,得到了94.24%的识别精度。 展开更多
关键词 行为识别 主题模型 概率隐含语义分析 局域软分配
在线阅读 下载PDF
概率潜在语义分析(PLSA)在中药新药处方发现中的应用 被引量:3
17
作者 雷蕾 张早华 +3 位作者 温先荣 亢力 张竹绿 刘森 《世界科学技术-中医药现代化》 北大核心 2012年第5期1976-1980,共5页
目的:使用概率潜在语义分析(PLSA)算法研究中药配伍方案,为中药处方发现提供新途径。方法:基于丰富的中医药文献数据,从临床治疗缺血性心脑血管疾病的方剂出发,使用PLSA算法,筛选出治疗缺血性心脑血管疾病的新药候选方,并从药理学的角... 目的:使用概率潜在语义分析(PLSA)算法研究中药配伍方案,为中药处方发现提供新途径。方法:基于丰富的中医药文献数据,从临床治疗缺血性心脑血管疾病的方剂出发,使用PLSA算法,筛选出治疗缺血性心脑血管疾病的新药候选方,并从药理学的角度对候选方进行分析,最后结合专家智慧在候选方的基础上给出具有开发潜力的新药处方。结果:筛选出治疗该病的中药核心组合,并证明了PLSA算法用于中药处方发现具有一定的可靠性和稳定性。同时专家从计算机筛选出的处方中选出有开发前景的两首方。结论:PLSA算法在治疗缺血性心脑血管疾病中药处方发现中有着广阔的应用前景。 展开更多
关键词 概率潜在语义分析 缺血性心脑血管疾病 中药处方发现
在线阅读 下载PDF
基于网页概率潜在语义信息的用户兴趣聚类 被引量:2
18
作者 钱雪忠 吴志媛 《计算机工程与科学》 CSCD 北大核心 2014年第4期765-771,共7页
为了能准确挖掘用户兴趣点,首先利用概率潜在语义分析PLSA模型将"网页-词"矩阵向量投影到概率潜在语义向量空间,并提出"自动相似度阈值选择"方法得到网页间的相似度阈值,最后提出将平面划分法与凝聚式层次聚类相结... 为了能准确挖掘用户兴趣点,首先利用概率潜在语义分析PLSA模型将"网页-词"矩阵向量投影到概率潜在语义向量空间,并提出"自动相似度阈值选择"方法得到网页间的相似度阈值,最后提出将平面划分法与凝聚式层次聚类相结合的凝聚式层次k中心点HAK-medoids算法,实现用户兴趣点聚类。实验结果表明,与传统的基于划分的算法相比,HAK-medoids算法聚类效果更好。同时,提出的用户兴趣点聚类技术在个性化服务领域可提高个性化推荐和搜索的效率。 展开更多
关键词 概率潜在语义分析 自动相似度阈值选择 用户兴趣点 凝聚式层次k中心点 个性化服务
在线阅读 下载PDF
基于概率语义轨迹的RFID目标对象兴趣点发现
19
作者 高学东 赵扬 王宏智 《运筹与管理》 CSSCI CSCD 北大核心 2013年第4期190-196,共7页
本文针对RFID天线信号无法覆盖区域内对象目标轨迹数据不完整的问题,提出了一种基于概率语义轨迹的概率目标对象兴趣点发现(估计)方法。本研究的目的是建立完整的目标对象RFID轨迹描述,基于"概率语义轨迹"概念和粒子滤波技术... 本文针对RFID天线信号无法覆盖区域内对象目标轨迹数据不完整的问题,提出了一种基于概率语义轨迹的概率目标对象兴趣点发现(估计)方法。本研究的目的是建立完整的目标对象RFID轨迹描述,基于"概率语义轨迹"概念和粒子滤波技术所产生的数据,发现RFID天线信号无法覆盖区域的目标对象兴趣点分布。本文给出的目标对象兴趣点发现方法同时考虑了对象的概率分布和持续时间两个因素。最后对提出的方法进行了数值实验。 展开更多
关键词 管理科学与工程 兴趣点发现 概率语义轨迹 RFID目标对象分布
在线阅读 下载PDF
结合概率潜在语义分析的文本谱聚类方法研究
20
作者 张玉芳 张洪 +1 位作者 熊忠阳 李文田 《计算机工程与应用》 CSCD 北大核心 2011年第36期134-136,179,共4页
传统谱聚类的相似矩阵建立在VSM(Vector Space Model)之上,该模型把词看作孤立的单元,没有考虑自然语言中存在大量的同义词、多义词现象。针对这一问题,提出一种用概率潜在语义分析(Probabilistic Latent Semantic Analysis,PLSA)来提... 传统谱聚类的相似矩阵建立在VSM(Vector Space Model)之上,该模型把词看作孤立的单元,没有考虑自然语言中存在大量的同义词、多义词现象。针对这一问题,提出一种用概率潜在语义分析(Probabilistic Latent Semantic Analysis,PLSA)来提取文本中隐含语义信息的方法,并构建文本集的相似矩阵,从语义的角度考虑了文本之间的相关性。实验结果表明,利用该方法得到的聚类精度有较大提高,结果要好于传统的谱聚类算法,从而验证了该方法的有效性。 展开更多
关键词 文本聚类 概率潜在语义分析 谱聚类 相似矩阵
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部