期刊文献+
共找到31篇文章
< 1 2 >
每页显示 20 50 100
基于PLSA模型的文本分割 被引量:25
1
作者 石晶 戴国忠 《计算机研究与发展》 EI CSCD 北大核心 2007年第2期242-248,共7页
文本分割在信息提取、文摘自动生成、语言建模、首语消解等诸多领域都有极为重要的应用·基于PLSA模型的文本分割试图使隐藏于片段内的不同主题与文本表面的词、句对建立联系·实验以汉语的整句作为基本块,尝试了多种相似性度... 文本分割在信息提取、文摘自动生成、语言建模、首语消解等诸多领域都有极为重要的应用·基于PLSA模型的文本分割试图使隐藏于片段内的不同主题与文本表面的词、句对建立联系·实验以汉语的整句作为基本块,尝试了多种相似性度量手段及边界估计策略,同时考虑相邻句重复的未登录词对相似值的影响,其最佳结果表明,片段边界的识别错误率为6·06%,远远低于其他同类算法· 展开更多
关键词 文本分割 概率潜在语义分析 相似性度量 边界识别
在线阅读 下载PDF
基于PLSA-BOW模型的医学影像分类算法的研究 被引量:2
2
作者 曹春红 赵大哲 +1 位作者 张斌 刘岳 《计算机应用与软件》 CSCD 北大核心 2012年第12期103-107,共5页
随着现代医学成像技术的快速发展,医学影像分类已经成为重要的辅助诊疗需求。将文本领域中的词袋模型引入到图像领域,构建视觉词袋模型。为解决多义词和同义词问题,通过把词袋模型与PLSA主题模型结合,提出PLSA-BOA模型来解决传统词袋模... 随着现代医学成像技术的快速发展,医学影像分类已经成为重要的辅助诊疗需求。将文本领域中的词袋模型引入到图像领域,构建视觉词袋模型。为解决多义词和同义词问题,通过把词袋模型与PLSA主题模型结合,提出PLSA-BOA模型来解决传统词袋模型中的语义问题,这使得基于词袋模型的分类方法在精度上得到了进一步提高。实验结果表明,PLSA-BOW模型用于医学影像分类,具有较高的分类精度。 展开更多
关键词 医学影像分类 词袋模型 概率潜在语义分析算法
在线阅读 下载PDF
基于标准化高斯pLSA协同过滤的用电量预测模型 被引量:3
3
作者 刘粤钳 姚红玉 《控制理论与应用》 EI CAS CSCD 北大核心 2008年第5期929-932,937,共5页
现有的电力负荷预测算法在中长期预测时存在不同程度的局限性.究其原因,是因为影响复杂非线性系统输出的变元过多,难以用解析的方法对其进行描述.本文提出利用概率潜在语义分析使历史随机数据呈现出各种有规律的示象(aspect),结合对内... 现有的电力负荷预测算法在中长期预测时存在不同程度的局限性.究其原因,是因为影响复杂非线性系统输出的变元过多,难以用解析的方法对其进行描述.本文提出利用概率潜在语义分析使历史随机数据呈现出各种有规律的示象(aspect),结合对内容的协同过滤技术去建立用电量预测模型,从而利用统计学习的方法避开了对影响系统输出的隐含变元的寻找与刻画.采用MATLAB进行数值仿真实验的结果表明该算法相比于神经网络和灰色预测在准确度方面具有优势. 展开更多
关键词 概率潜在语义分析 协同过滤 示象模型 用电量预测模型
在线阅读 下载PDF
一种基于改进PLSA和案例推理的行为识别算法 被引量:1
4
作者 涂宏斌 岳艳艳 +1 位作者 周新建 罗锟 《计算机科学》 CSCD 北大核心 2017年第6期283-289,共7页
针对行为人发生的行为因遮挡或者自遮挡可能导致行为歧义性的问题,提出基于改进PLSA和案例推理算法的行为识别方法。该算法既可以克服传统PLSA算法中生成式模型对观察特征序列的独立性假设会导致过拟合的缺点,又可以消除由于遮挡等原因... 针对行为人发生的行为因遮挡或者自遮挡可能导致行为歧义性的问题,提出基于改进PLSA和案例推理算法的行为识别方法。该算法既可以克服传统PLSA算法中生成式模型对观察特征序列的独立性假设会导致过拟合的缺点,又可以消除由于遮挡等原因引起的歧义性带来的识别精度降低问题。实验表明该方法能有效地提高人体行为识别准确率。 展开更多
关键词 行为识别 歧义性行为 时空兴趣点 plsa 案例推理
在线阅读 下载PDF
基于高斯pLSA模型与项目的协同过滤混合推荐 被引量:5
5
作者 陈登科 孔繁胜 《计算机工程与应用》 CSCD 北大核心 2010年第23期209-211,234,共4页
协同过滤是推荐系统中常用的一种技术。以往的推荐算法往往只从用户或商品的角度单一地进行推荐,在推荐准确率上存在瓶颈和局限性。提出了一种新的混合推荐方法——结合基于高斯概率潜在语义分析模型与改进的基于项目的协同过滤算法,通... 协同过滤是推荐系统中常用的一种技术。以往的推荐算法往往只从用户或商品的角度单一地进行推荐,在推荐准确率上存在瓶颈和局限性。提出了一种新的混合推荐方法——结合基于高斯概率潜在语义分析模型与改进的基于项目的协同过滤算法,通过建立用户群体混合模型和基于目标项目的邻居集进行预测推荐。实验证明该算法与其他协同过滤算法相比具有更高的准确率。 展开更多
关键词 概率潜在语义分析 高斯模型 基于项目的协同过滤 基于模型的协同过滤 混合推荐
在线阅读 下载PDF
基于PLSA主题模型的多标记文本分类 被引量:5
6
作者 蒋铭初 潘志松 尤峻 《数据采集与处理》 CSCD 北大核心 2016年第3期541-547,共7页
为解决多标记文本分类时文本标记关系不明确以及特征维数过大的问题,提出了基于概率隐语义分析(Probabilistic latent semantic analysis,PLSA)模型的多标记假设重用文本分类算法。该方法首先将训练样本通过PLSA模型映射到隐语义空间,... 为解决多标记文本分类时文本标记关系不明确以及特征维数过大的问题,提出了基于概率隐语义分析(Probabilistic latent semantic analysis,PLSA)模型的多标记假设重用文本分类算法。该方法首先将训练样本通过PLSA模型映射到隐语义空间,以文本的主题分布表示一篇文本,在去噪的同时可以大大降低数据维度。在此基础上利用多标记假设重用算法(Multi-label algorithm of hypothesis reuse,MAHR)进行分类,由于经过PLSA降维后的特征组本身就具有语义信息,因此算法能够精确地挖掘出多标记之间的关系并用于训练基分类器,从而避免了人为输入标记关系的缺陷。实验验证了该方法能够充分利用PLSA降维得到的语义信息来改善多标记文本分类的性能。 展开更多
关键词 文本分类 多标记学习 概率隐语义分析 多标记假设重用算法
在线阅读 下载PDF
基于PLSA和BoW的高分遥感影像小型港口检测 被引量:3
7
作者 毕奇 童心 +3 位作者 张济勇 许凯 张涵 秦昆 《应用科学学报》 CAS CSCD 北大核心 2019年第3期301-312,共12页
高分辨率遥感影像可以为小型港口的监管提供有效途径.针对小型港口形态多样、特征难以描述等问题,研究了一种基于概率潜在语义分析(probabilistic latent semantic analysis, PLSA)模型和词袋(bag of words, BoW)模型的小型港口检测方法... 高分辨率遥感影像可以为小型港口的监管提供有效途径.针对小型港口形态多样、特征难以描述等问题,研究了一种基于概率潜在语义分析(probabilistic latent semantic analysis, PLSA)模型和词袋(bag of words, BoW)模型的小型港口检测方法.该方法首先提取水岸线以缩小搜索范围;然后将灰度直方图、归一化差分水体指数、分形维数特征引入PLSA模型生成特征描述集,将加速鲁棒特征向量引入BoW模型生成视觉词典;根据以上特征描述集和构建的小型港口样本库训练SVM分类器,利用22幅影像进行小型港口检测实验.实验结果表明,相比于只使用常见单一特征或单一模型,该方法的检测结果更佳,耗时更少. 展开更多
关键词 高分遥感影像 小型港口检测 概率潜在语义分析 词袋模型 水岸线提取
在线阅读 下载PDF
Complex human activities recognition using interval temporal syntactic model 被引量:1
8
作者 夏利民 韩芬 王军 《Journal of Central South University》 SCIE EI CAS CSCD 2016年第10期2578-2586,共9页
A novel method based on interval temporal syntactic model was proposed to recognize human activities in video flow. The method is composed of two parts: feature extract and activities recognition. Trajectory shape des... A novel method based on interval temporal syntactic model was proposed to recognize human activities in video flow. The method is composed of two parts: feature extract and activities recognition. Trajectory shape descriptor, speeded up robust features(SURF) and histograms of optical flow(HOF) were proposed to represent human activities, which provide more exhaustive information to describe human activities on shape, structure and motion. In the process of recognition, a probabilistic latent semantic analysis model(PLSA) was used to recognize sample activities at the first step. Then, an interval temporal syntactic model, which combines the syntactic model with the interval algebra to model the temporal dependencies of activities explicitly, was introduced to recognize the complex activities with a time relationship. Experiments results show the effectiveness of the proposed method in comparison with other state-of-the-art methods on the public databases for the recognition of complex activities. 展开更多
关键词 trajectory shape descriptor speeded up robust features(SURF) histograms of optical flow(HOF) plsa probabilistic latent semantic analysis syntactic model
在线阅读 下载PDF
基于PLSA和颜色命名的小麦图像分割方法 被引量:1
9
作者 冯晓 张辉 +4 位作者 马中杰 乔璐 靳薇 魏东 臧贺藏 《河南农业科学》 北大核心 2020年第4期173-180,共8页
为减少大田环境下光照不足对小麦图像分割的影响,以及提升小麦图像中偏黄叶片的提取效果,提出了将白平衡调整、局部同态滤波预处理和基于概率潜在语义分析(PLSA)模型的颜色命名算法相结合用于小麦图像分割的方法。首先,对大田采集的小... 为减少大田环境下光照不足对小麦图像分割的影响,以及提升小麦图像中偏黄叶片的提取效果,提出了将白平衡调整、局部同态滤波预处理和基于概率潜在语义分析(PLSA)模型的颜色命名算法相结合用于小麦图像分割的方法。首先,对大田采集的小麦图像进行白平衡调整,得到准确无偏色的图像;然后对光照不足的图像在HSI彩色模型下对亮度分量I进行局部同态滤波处理,以减少光照不足对图像的影响;最后在RGB彩色模型下基于PLSA模型构建的颜色名RGB值字典,提取图像中绿色和黄色像素点对应区域作为目标区域。结果表明,经白平衡调整后F1值提高1.61个百分点;光照不足图像经局部同态滤波处理后F1值提高12.43个百分点,分割效果明显提升;所提方法对绿色、叶片偏黄及光照不足的小麦图像分割的F1值分别为96.39%、97.29%和96.22%,均达到了较好的分割效果;所提方法与K-means聚类算法相比,虽点状噪音和细小孔洞相对较多,但在分割叶片偏黄小麦上F1值提高4.42%,整体分割效果较好,且稳定性强。 展开更多
关键词 小麦 图像分割 颜色命名 plsa 白平衡 同态滤波 图像预处理
在线阅读 下载PDF
融合语义主题的图像自动标注 被引量:50
10
作者 李志欣 施智平 +1 位作者 李志清 史忠植 《软件学报》 EI CSCD 北大核心 2011年第4期801-812,共12页
由于语义鸿沟的存在,图像自动标注已成为一个重要课题.在概率潜语义分析的基础上,提出了一种融合语义主题的方法以进行图像的标注和检索.首先,为了更准确地建模训练数据,将每幅图像的视觉特征表示为一个视觉"词袋";然后设计... 由于语义鸿沟的存在,图像自动标注已成为一个重要课题.在概率潜语义分析的基础上,提出了一种融合语义主题的方法以进行图像的标注和检索.首先,为了更准确地建模训练数据,将每幅图像的视觉特征表示为一个视觉"词袋";然后设计一个概率模型分别从视觉模态和文本模态中捕获潜在语义主题,并提出一种自适应的不对称学习方法融合两种语义主题.对于每个图像文档,它在各个模态上的主题分布通过加权进行融合,而权值由该文档的视觉词分布的熵值来确定.于是,融合之后的概率模型适当地关联了视觉模态和文本模态的信息,因此能够很好地预测未知图像的语义标注.在一个通用的Corel图像数据集上,将提出的方法与几种前沿的图像标注方法进行了比较.实验结果表明,该方法具有更好的标注和检索性能. 展开更多
关键词 图像自动标注 主题模型 概率潜语义分析 自适应不对称学习 图像检索
在线阅读 下载PDF
改进的概率潜在语义分析下的文本聚类算法 被引量:14
11
作者 张玉芳 朱俊 熊忠阳 《计算机应用》 CSCD 北大核心 2011年第3期674-676,693,共4页
概率潜在语义分析(PLSA)模型用期望最大化(EM)算法进行参数训练,由于算法参数的随机初始化,致使聚类的效果过度拟合且过分依赖于参数初始值。将潜在语义分析(LSA)模型参数概率化,用以初始化概率潜在语义分析模型的参数,得到的改进算法... 概率潜在语义分析(PLSA)模型用期望最大化(EM)算法进行参数训练,由于算法参数的随机初始化,致使聚类的效果过度拟合且过分依赖于参数初始值。将潜在语义分析(LSA)模型参数概率化,用以初始化概率潜在语义分析模型的参数,得到的改进算法有效解决了参数随机初始化问题。经实验验证,所提出的方法对文本聚类的归一化互信息(NM I)和准确度都有明显提高。 展开更多
关键词 文本聚类 概率潜在语义分析 参数初始化 潜在语义分析
在线阅读 下载PDF
基于文本和内容的图像检索算法 被引量:9
12
作者 顾昕 张兴亮 +2 位作者 王超 陈思媛 方正 《计算机应用》 CSCD 北大核心 2014年第A02期280-282,313,共4页
为了提高图像检索的效率,提出一种基于文本和内容的图像检索算法。该算法采用稠密的尺度不变特征转换(DSIFT)构造视觉单词的方式来描述图像内容,依据基于概率潜在语义分析(PLSA)模型的图像自动标注方法获取的视觉语义对查询图像进行初... 为了提高图像检索的效率,提出一种基于文本和内容的图像检索算法。该算法采用稠密的尺度不变特征转换(DSIFT)构造视觉单词的方式来描述图像内容,依据基于概率潜在语义分析(PLSA)模型的图像自动标注方法获取的视觉语义对查询图像进行初步检索,在此结果集上对筛选出的语义相关图像按内容相似度排序输出。在数据集Corel1000上的实验结果表明,该算法能够实现有效的图像检索,检索效率优于单一的基于内容的图像检索算法。 展开更多
关键词 图像检索 稠密的尺度不变特征转换 概率潜在语义分析 自动标注 视觉语义
在线阅读 下载PDF
基于分块潜在语义的场景分类方法 被引量:7
13
作者 曾璞 吴玲达 文军 《计算机应用》 CSCD 北大核心 2008年第6期1537-1539,1542,共4页
提出了一种基于分块潜在语义的场景分类方法。该方法首先对图像进行均匀分块并使用分块内视觉词汇的出现频率来描述每一个分块,然后利用概率潜在语义分析(PLSA)方法从图像的分块集合中发现潜在语义模型,最后利用该模型提取出潜在语义在... 提出了一种基于分块潜在语义的场景分类方法。该方法首先对图像进行均匀分块并使用分块内视觉词汇的出现频率来描述每一个分块,然后利用概率潜在语义分析(PLSA)方法从图像的分块集合中发现潜在语义模型,最后利用该模型提取出潜在语义在图像分块中的出现情况来进行场景分类。在13类场景图像上的实验表明,与其他方法相比,该方法具有更高的分类准确率。 展开更多
关键词 场景分类 分块潜在语义 视觉词汇 局部不变特征 概率潜在语义分析
在线阅读 下载PDF
基于语义学习的图像多模态检索 被引量:6
14
作者 李志欣 施智平 +1 位作者 陈宏朝 吴璟莉 《计算机工程》 CAS CSCD 2013年第3期258-263,共6页
针对语义鸿沟问题,在语义学习的基础上设计图像的多模态检索系统。该系统结合3种查询方式进行图像检索。基于视觉特征的查询通过特征提取与相似度匹配进行排位。基于标签的查询建立在图像自动标注的基础上,但在语义空间之外的泛化能力... 针对语义鸿沟问题,在语义学习的基础上设计图像的多模态检索系统。该系统结合3种查询方式进行图像检索。基于视觉特征的查询通过特征提取与相似度匹配进行排位。基于标签的查询建立在图像自动标注的基础上,但在语义空间之外的泛化能力较差。基于语义图例的查询能够在很大程度上克服这个缺陷,通过在显式或隐式的语义空间上进行查询,使检索结果更符合人类感知。实验结果表明,与基于纹理特征的图像检索相比,基于语义图例的检索具有更高的精度及召回率。 展开更多
关键词 图像多模态检索 图像自动标注 概率主题建模 概率潜在语义分析 语义鸿沟 语义学习 语义多项式
在线阅读 下载PDF
基于概率潜在语义分析的群体情绪演进分析 被引量:4
15
作者 林江豪 周咏梅 +2 位作者 阳爱民 陈昱宏 陈晓帆 《计算机应用》 CSCD 北大核心 2015年第10期2747-2751,2756,共6页
针对群体情绪演进分析中话题内容挖掘及其对应群体情绪分析两个层面的难题,提出了一种基于概率潜在语义分析(PLSA)模型的群体情绪演进分析方法。该方法首先利用PLSA模型抽取时间序列上的子话题,挖掘话题内容随时间的演进规律;再利用句... 针对群体情绪演进分析中话题内容挖掘及其对应群体情绪分析两个层面的难题,提出了一种基于概率潜在语义分析(PLSA)模型的群体情绪演进分析方法。该方法首先利用PLSA模型抽取时间序列上的子话题,挖掘话题内容随时间的演进规律;再利用句法关系和情感本体库,抽取与话题内容相匹配群体情绪单元,计算情绪单元的强度,形成情绪特征向量;最后,对各子话题下的情绪强度进行求和,细粒度分析子话题和事件的整体群体情绪,深入挖掘群体情绪演进规律,并将群体情绪量化和可视化。在话题情绪单元抽取过程中,引入了句法规则和情感本体库,更细粒度地抽取情绪单元,并提高了话题内容与情绪单元匹配的准确性。实验结果表明,该模型能够实现话题内容及其群体情绪按时序特征的演进分析,验证了所提方法的有效性。 展开更多
关键词 群体情绪 概率潜在语义分析模型 话题挖掘 情绪演进 情绪分析
在线阅读 下载PDF
建模连续视觉特征的图像语义标注方法 被引量:9
16
作者 李志欣 施智平 +1 位作者 刘曦 史忠植 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2010年第8期1412-1420,共9页
针对图像检索中存在的"语义鸿沟"问题,提出一种对连续视觉特征直接建模的图像自动标注方法.首先对概率潜语义分析(PLSA)模型进行改进,使之能处理连续量,并推导对应的期望最大化算法来确定模型参数;然后根据不同模态数据各自... 针对图像检索中存在的"语义鸿沟"问题,提出一种对连续视觉特征直接建模的图像自动标注方法.首先对概率潜语义分析(PLSA)模型进行改进,使之能处理连续量,并推导对应的期望最大化算法来确定模型参数;然后根据不同模态数据各自的特点,提出一个对不同模态数据分别处理的图像语义标注模型,该模型使用连续PLSA建模视觉特征,使用标准PLSA建模文本关键词,并通过不对称的学习方法学习2种模态之间的关联,从而能较好地对未知图像进行标注.通过在一个包含5000幅图像的标准Corel数据集中进行实验,并与几种典型的图像标注方法进行比较的结果表明,文中方法具有更高的精度和更好的效果. 展开更多
关键词 图像自动标注 概率潜语义分析 主题模型 连续视觉特征 图像检索
在线阅读 下载PDF
面向时序感知的多类别商品方面情感分析推荐模型 被引量:6
17
作者 丁永刚 李石君 +1 位作者 付星 刘梦君 《电子与信息学报》 EI CSCD 北大核心 2018年第6期1453-1460,共8页
电子商务网站中的评论数据隐含着商品特征和用户情感,现有基于方面情感分析的推荐研究大多通过抽取同一类别商品评论数据中用户对商品不同方面的情感来捕捉用户方面偏好,忽略了不同类别商品有不同方面以及用户的方面偏好随时间变化的特... 电子商务网站中的评论数据隐含着商品特征和用户情感,现有基于方面情感分析的推荐研究大多通过抽取同一类别商品评论数据中用户对商品不同方面的情感来捕捉用户方面偏好,忽略了不同类别商品有不同方面以及用户的方面偏好随时间变化的特点。对此,该文提出一种面向时序感知的多类别商品方面情感分析推荐模型,该模型对用户、商品类别、商品、商品方面、方面情感和时间统一建模,以发现用户对不同类别商品的方面偏好随时间变化的特点,并据此做出推荐。该模型能够推断用户在任意时间对商品的方面偏好,从而为用户提供可解释的推荐。两个真实数据集的实验结果表明,与其它基于时间或方面情感分析的推荐模型相比,该文提出的模型在top-N推荐准确率和召回率评价指标上均获得显著改善。 展开更多
关键词 推荐 时序感知 多类别 方面情感分析 概率潜在语义分析
在线阅读 下载PDF
融合主题和视觉语义的图像自动标注方法 被引量:7
18
作者 赵鹏 王文彬 朱伟伟 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2013年第11期1709-1714,共6页
为了减小图像语义检索过程中"语义鸿沟"的影响,提出融合主题和视觉语义的图像自动标注方法.该方法先在训练集的文本空间中用概率潜在语义分析(PLSA)模型拟合出主题集合;然后根据图像的高维视觉特征建立主题集合中每个主题的... 为了减小图像语义检索过程中"语义鸿沟"的影响,提出融合主题和视觉语义的图像自动标注方法.该方法先在训练集的文本空间中用概率潜在语义分析(PLSA)模型拟合出主题集合;然后根据图像的高维视觉特征建立主题集合中每个主题的高斯混合模型(GMM),以准确描述其视觉语义信息,减小了"语义鸿沟",提高了图像自动标注的准确性.在Corel数据集上进行了对比实验的结果表明,文中方法在标注的平均标准率和平均标全率上都表现良好,证明了其有效性. 展开更多
关键词 高斯混合模型 概率潜在语义分析 图像自动标注 语义鸿沟 特征聚类
在线阅读 下载PDF
基于混合概率潜在语义分析模型的Web聚类 被引量:2
19
作者 王治和 王凌云 +1 位作者 党辉 潘丽娜 《计算机应用》 CSCD 北大核心 2012年第11期3018-3022,共5页
在电子商务应用中,为了更好地了解用户的内在特征,制定有效的营销策略,提出一种基于混合概率潜在语义分析(H-PLSA)模型的Web聚类算法。利用概率潜在语义分析(PLSA)技术分别对用户浏览数据、页面内容信息及内容增强型用户事务数据建立PLS... 在电子商务应用中,为了更好地了解用户的内在特征,制定有效的营销策略,提出一种基于混合概率潜在语义分析(H-PLSA)模型的Web聚类算法。利用概率潜在语义分析(PLSA)技术分别对用户浏览数据、页面内容信息及内容增强型用户事务数据建立PLSA模型,通过对数—似然函数对三个PLSA模型进行合并得到用户聚类的H-PLSA模型和页面聚类的H-PLSA模型。聚类分析中以潜在主题与用户、页面以及站点之间的条件概率作为相似度计算依据,聚类算法采用基于距离的k-medoids算法。设计并构建了H-PLSA模型,在该模型上对Web聚类算法进行验证,表明该算法是可行的。 展开更多
关键词 WEB聚类 概率潜在语义分析 潜在主题 k-medoids算法
在线阅读 下载PDF
基于概率潜在语义分析的Web用户聚类 被引量:4
20
作者 俞辉 景海峰 《计算机工程与应用》 CSCD 北大核心 2008年第23期160-162,共3页
Web用户聚类知识可以为改进信息搜索效率和提供个性化服务提供帮助。通过对海量日志记录分析,构建会话-页面矩阵;根据信息论理论,在会话-页面矩阵中权值计算中考虑局部和全局权值贡献;利用概率潜在语义分析将隐式变量Z对页面P的条件概... Web用户聚类知识可以为改进信息搜索效率和提供个性化服务提供帮助。通过对海量日志记录分析,构建会话-页面矩阵;根据信息论理论,在会话-页面矩阵中权值计算中考虑局部和全局权值贡献;利用概率潜在语义分析将隐式变量Z对页面P的条件概率转换为隐式变量Z对会话S的条件概率,然后在聚类分析中以此作为相似度计算依据。聚类算法采用了基于距离的k-medoids算法,以进一步改善聚类精度。实验结果验证了该算法的有效性和局限性。 展开更多
关键词 WEB日志 预处理 WEB用户 概率潜在语义分析 聚类
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部