期刊文献+
共找到507篇文章
< 1 2 26 >
每页显示 20 50 100
基于co-occurrence相似度的聚类集成方法 被引量:3
1
作者 凌光 王明春 冯嘉毅 《计算机应用》 CSCD 北大核心 2011年第2期441-445,461,共6页
首先提出了一种基于属性值的co-occurrence相似度概念,通过对其进一步的研究,提出了3个等价性表述;然后对属性值之间的co-occurrence相似度进行引申,给出了数据对象之间co-occurrence相似度的定义,并将其成功应用到聚类集成方法中。利用... 首先提出了一种基于属性值的co-occurrence相似度概念,通过对其进一步的研究,提出了3个等价性表述;然后对属性值之间的co-occurrence相似度进行引申,给出了数据对象之间co-occurrence相似度的定义,并将其成功应用到聚类集成方法中。利用co-occurrence相似度在计算某个初始聚类结果中数据对象之间的相似度时,充分考虑了其他初始聚类结果和该初始聚类结果之间的相互影响和联系。实验表明,基于co-occurrence相似度的聚类集成(CSCE)方法能有效识别数据之间的细微结构,有助于提高聚类集成的效果。 展开更多
关键词 集成 binary相似 co-occurrence相似 基于簇相似的划分算法 基于co-occurrence相似度的聚类集成
在线阅读 下载PDF
基于相似度和密度的抗噪声船舶轨迹聚类方法
2
作者 杨家轩 吴长胜 赵时雨 《舰船科学技术》 北大核心 2025年第2期178-184,共7页
通过对船舶AIS数据聚类可以掌握船舶运动行为和特征规律,但在轨迹聚类中通过距离描述的相似性不能连续地表征轨迹之间的相似程度,且对轨迹中的噪声点敏感、无法区分轨迹方向。针对上述问题,本文提出一种基于相似度和密度的抗噪声轨迹聚... 通过对船舶AIS数据聚类可以掌握船舶运动行为和特征规律,但在轨迹聚类中通过距离描述的相似性不能连续地表征轨迹之间的相似程度,且对轨迹中的噪声点敏感、无法区分轨迹方向。针对上述问题,本文提出一种基于相似度和密度的抗噪声轨迹聚类方法,构建航向约束分段路径距离并定义轨迹相似度函数;根据轨迹相似度分布特征和聚类评价指标,建立自适应确定最佳聚类参数流程。以长江口水域AIS数据为例,基于确定的最佳参数聚类出8个不同方向的轨迹簇,结果与实际船舶习惯航路相符。实验结果表明,所提出的方法能够快速确定最佳聚类参数并对不同运动方向的轨迹进行聚类,结果可用于特征轨迹提取和航路识别,为智能航海提供技术支撑。 展开更多
关键词 船舶交通 轨迹 相似 轨迹密 特征轨迹
在线阅读 下载PDF
基于字符串相似度的URL聚类方法研究
3
作者 刘翼 田亮亮 +2 位作者 高明 李凯茵 叶倩 《现代电子技术》 北大核心 2025年第11期84-88,共5页
内容分发网络(CDN)被用于解决网络访问负荷过载的问题。然而,同一网络服务可能包含多个域名,导致网页主题分类结果精确度和检索效率降低。文中提出一种基于字符串相似度算法的URL聚类方法,首先,获取校园网络7×24 h的真实流量数据,... 内容分发网络(CDN)被用于解决网络访问负荷过载的问题。然而,同一网络服务可能包含多个域名,导致网页主题分类结果精确度和检索效率降低。文中提出一种基于字符串相似度算法的URL聚类方法,首先,获取校园网络7×24 h的真实流量数据,利用协议分析抽取特征信息,转化为数据集;其次,进行数据清洗与处理,去除缺省字段和错误字段,将相同数据条目集成;最后,采用字符串相似度算法计算URL之间的距离作为聚类算法的特征,并采用K-means聚类算法划分相似URL,达到将多个不同域名分类到相同网络服务的目的。实验通过对5种不同方法进行比较发现,Levenshtein算法的平均轮廓系数达到了91.4%,较其他方法平均提高12%,能够有效应对精确度降低和检索效率低下的问题。 展开更多
关键词 数据 字符串相似 轮廓系数法 协议分析 K-MEANS URL CDN Levenshtein算法
在线阅读 下载PDF
基于组合相似度动态聚类和词熵的网络话题在线检测 被引量:1
4
作者 郭慧 王亚楠 +2 位作者 王欣艳 魏艺泽 王养廷 《情报杂志》 CSSCI 北大核心 2024年第5期159-166,共8页
[研究目的]为实现网络热点话题的在线检测,提升增量式聚类算法的聚类效果,提出了基于组合相似度的动态聚类算法,同时通过计算词熵实现主题词提取和演化跟踪。[研究方法]通过CIFG-BiLSTM-CRF模型实现文本的命名实体识别,计算文本与话题... [研究目的]为实现网络热点话题的在线检测,提升增量式聚类算法的聚类效果,提出了基于组合相似度的动态聚类算法,同时通过计算词熵实现主题词提取和演化跟踪。[研究方法]通过CIFG-BiLSTM-CRF模型实现文本的命名实体识别,计算文本与话题的实体相似度,再取文本词向量与话题中心余弦相似度的最大值作为词向量相似度,二者结合判断文本所属话题。在聚类过程中利用时间窗口策略实现话题中心和成员文本的动态更新。同时,计算文本词熵,生成话题的词熵和列表,实现话题主题词提取和演化跟踪。实验以新冠疫情新闻为数据实现话题在线检测,并展示了话题主题词的演化和跟踪过程。[研究结论]实验表明,与传统相似度计算方法相比,组合相似度能够获得更好的聚类效果,聚类过程中提取出的话题主题词也正确地反映了原始数据的热点话题内容。 展开更多
关键词 网络话题 在线话题检测 增量式 主题词提取 组合相似 动态算法 词熵
在线阅读 下载PDF
基于高斯分布的自适应密度峰值聚类算法
5
作者 李启文 王治和 +1 位作者 杜辉 鲁德鹏 《计算机工程》 北大核心 2025年第4期137-148,共12页
密度峰值聚类(DPC)算法可以发现任意形状的簇,对噪声具有鲁棒性,因此被广泛应用于各个领域。但DPC算法需要人工选取聚类中心,对于密度不均匀型数据集表现较差。为此,提出一种基于高斯分布的自适应密度峰值聚类算法。首先,计算局部密度... 密度峰值聚类(DPC)算法可以发现任意形状的簇,对噪声具有鲁棒性,因此被广泛应用于各个领域。但DPC算法需要人工选取聚类中心,对于密度不均匀型数据集表现较差。为此,提出一种基于高斯分布的自适应密度峰值聚类算法。首先,计算局部密度和相对距离的乘积θ_(i),通过Z-score标准化方法,将θ_(i)映射到符合高斯分布的二维空间中,利用高斯分布的标准偏差来自适应选取聚类中心,得到聚类中心集合;其次,将其余数据点分配到离其最近的聚类中心所在的簇中,得到初步划分结果;最后,设计缝合因子模型,计算簇间缝合系数,当缝合系数大于阈值时合并初步划分结果中最相似簇并更新相似度矩阵,直至完成合并得到最终结果。在人工数据集和真实数据集上的实验结果表明,与DBSCAN算法、DPC算法和ICKDC算法对比,所提算法的聚类准确度更高,聚类性能更佳。 展开更多
关键词 峰值算法 高斯分布 Z-score标准化 缝合因子 簇间相似
在线阅读 下载PDF
基于密度权重的隐私聚类和改进相似度的推荐算法 被引量:4
6
作者 王圣节 张庆红 《科学技术与工程》 北大核心 2024年第29期12623-12630,共8页
针对当前推荐系统中所面临数据稀疏、冷启动、时效性和隐私保护等问题,提出一种基于密度权重的隐私聚类和改进相似度的协同过滤推荐算法。该方法结合了差分隐私保护聚类与改进的相似度的协同过滤推荐算法,旨在提高推荐系统的精准度,同... 针对当前推荐系统中所面临数据稀疏、冷启动、时效性和隐私保护等问题,提出一种基于密度权重的隐私聚类和改进相似度的协同过滤推荐算法。该方法结合了差分隐私保护聚类与改进的相似度的协同过滤推荐算法,旨在提高推荐系统的精准度,同时确保用户数据的隐私安全。通过数据预处理构建用户-项目评分矩阵,并运用Weight Slope One算法智能填充空值,使用DWDPK-medoids隐私聚类算法对矩阵进行精确聚类,融合时间因素和用户兴趣偏好因素,改变相似度的计算,从而提高推荐相关性,最后预测目标用户对项目的评分。在MovieLens数据集,通过和当前学者提出的5种隐私推荐算法进行对比实验验证,该算法在评价指标均方根误差(root mean squared error,RMSE)和平均绝对误差(mean absolute error,MAE)上均有所降低,表明所提方法在一定程度上解决了数据稀疏、冷启动和时效性等问题,并在保护用户隐私的基础上提升了推荐准确性。 展开更多
关键词 推荐系统 隐私保护 协同过滤 相似计算
在线阅读 下载PDF
改进的蜂群优化聚类集成联合相似度推荐算法 被引量:6
7
作者 王岩 王聪英 申艳梅 《计算机工程》 CAS CSCD 北大核心 2020年第10期88-94,102,共8页
协同过滤算法由于推荐效果良好,而被广泛应用于推荐领域,但其在数据稀疏及冷启动的情况下会导致推荐效果明显下降。在数据稀疏情况下,为充分利用用户的历史信息以提高算法的推荐精度,提出一种改进的聚类联合相似度推荐算法。采用改进的... 协同过滤算法由于推荐效果良好,而被广泛应用于推荐领域,但其在数据稀疏及冷启动的情况下会导致推荐效果明显下降。在数据稀疏情况下,为充分利用用户的历史信息以提高算法的推荐精度,提出一种改进的聚类联合相似度推荐算法。采用改进的蜂群算法来优化K-means++聚类的中心点,使聚类中心在整个数据内达到最优,并对聚类结果进行集成,使得聚类得到进一步优化。根据聚类结果,在同一类中采用改进的用户相似度算法来优化传统相似度算法,使用户间的相似度达到最优,并根据领域的评分预测方法将最佳结果推荐给用户。实验结果表明,该算法的精度、召回率及平均绝对误差均优于其他现有算法,且在数据稀疏情况下其性能仍最佳。 展开更多
关键词 联合相似 集成 K-means++ 协同过滤 人工蜂群 邻域搜索
在线阅读 下载PDF
考虑双尺度相似性的负荷曲线集成谱聚类算法 被引量:30
8
作者 徐胜蓝 司曹明哲 +2 位作者 万灿 于建成 曹照静 《电力系统自动化》 EI CSCD 北大核心 2020年第22期152-160,共9页
负荷聚类可以依据形态特性差异对负荷曲线进行归类,实现用户用能行为规律分析,为需求侧响应、电网客户服务等提供重要的决策信息。文中提出一种考虑双尺度相似性的负荷曲线集成谱聚类算法。首先,为了克服欧氏距离在负荷特性相似程度度... 负荷聚类可以依据形态特性差异对负荷曲线进行归类,实现用户用能行为规律分析,为需求侧响应、电网客户服务等提供重要的决策信息。文中提出一种考虑双尺度相似性的负荷曲线集成谱聚类算法。首先,为了克服欧氏距离在负荷特性相似程度度量上的局限,基于负荷差分向量的余弦距离实现负荷形态变化的相似性度量,提出一种双尺度相似性度量方式;然后,基于双尺度相似性与谱聚类算法,建立差异化基聚类模型;最后,依据聚类评价指标自适应计算基聚类模型权重,以加权一致性矩阵与谱聚类实现聚类集成。算例结果证明,所提方法可有效挖掘负荷形态特性差异,在不同数据集中性能表现稳定,具有显著的聚类有效性和鲁棒性。 展开更多
关键词 负荷 集成 双尺相似 一致性矩阵
在线阅读 下载PDF
面向密度分布不均数据的加权逆近邻密度峰值聚类算法 被引量:2
9
作者 吕莉 陈威 +2 位作者 肖人彬 韩龙哲 谭德坤 《智能系统学报》 CSCD 北大核心 2024年第1期165-175,共11页
针对密度分布不均数据,密度峰值聚类算法易忽略类簇间样本的疏密差异,导致误选类簇中心;分配策略易将稀疏区域的样本误分到密集区域,导致聚类效果不佳的问题,本文提出一种面向密度分布不均数据的加权逆近邻密度峰值聚类算法。该算法首... 针对密度分布不均数据,密度峰值聚类算法易忽略类簇间样本的疏密差异,导致误选类簇中心;分配策略易将稀疏区域的样本误分到密集区域,导致聚类效果不佳的问题,本文提出一种面向密度分布不均数据的加权逆近邻密度峰值聚类算法。该算法首先在局部密度公式中引入基于sigmoid函数的权重系数,增加稀疏区域样本的权重,结合逆近邻思想,重新定义了样本的局部密度,有效提升类簇中心的识别率;其次,引入改进的样本相似度策略,利用样本间的逆近邻及共享逆近邻信息,使得同一类簇样本间具有较高的相似度,可有效改善稀疏区域样本分配错误的问题。在密度分布不均、复杂形态和UCI数据集上的对比实验表明,本文算法的聚类效果优于IDPC-FA、FNDPC、FKNN-DPC、DPC和DPCSA算法。 展开更多
关键词 峰值 分布不均 逆近邻 共享逆近邻 样本相似 局部密 分配策略 数据挖掘
在线阅读 下载PDF
基于本地边差分隐私的有向图聚类算法 被引量:1
10
作者 付楠 倪巍伟 +3 位作者 姜泽鹏 侯立贺 张东月 张如玉 《计算机研究与发展》 北大核心 2025年第1期256-268,共13页
基于本地差分隐私的图聚类工作成为近年来的一个研究热点.已有工作主要针对的是无向图,且大多利用位向量技术通过模块化聚合实现.由于噪声量与向量维度成线性关系,使得聚类质量和隐私性难以很好地兼顾.此外,针对无向图中边的有/无设计的... 基于本地差分隐私的图聚类工作成为近年来的一个研究热点.已有工作主要针对的是无向图,且大多利用位向量技术通过模块化聚合实现.由于噪声量与向量维度成线性关系,使得聚类质量和隐私性难以很好地兼顾.此外,针对无向图中边的有/无设计的2元扰动机制在面对有向图时,因无法对边的方向性进行处理而无法适用.针对上述问题,提出一种基于本地边差分隐私(edge local differential privacy,Edge-LDP)的有向图聚类算法DGC-LDP(directed graph clustering under LDP).具体来说,为了降低噪音量同时适用于有向图,基于直接编码方式设计了一种适用于有向星型图的动态扰动机制,通过自适应添加噪声来平衡隐私性和统计效用.在此基础上,在终端和收集者之间构建迭代机制.收集者依据终端上传的噪声数据提取节点间的相似性信息,并设计基于轮廓系数测量模型的节点聚合算法,通过迭代机制不断地优化节点聚合形式形成高质量簇.理论分析和实验结果表明,所提算法在满足Edge-LDP的同时能够有效兼顾聚类精度. 展开更多
关键词 隐私保护 本地差分隐私 随机响应 相似
在线阅读 下载PDF
基于自然邻域图划分的层次聚类算法 被引量:1
11
作者 蔡发鹏 冯骥 +1 位作者 杨德刚 陈仲尚 《计算机工程与科学》 北大核心 2025年第2期370-380,共11页
自然邻域图能自适应地识别不同形状、大小和维度的数据,但在面对密度不均匀且结构复杂的数据时,部分小簇无法被算法正确识别。针对这一问题,提出一种基于自然邻域图划分的层次聚类算法HC-PNNG。HC-PNNG算法首先利用自然邻居关系实现了... 自然邻域图能自适应地识别不同形状、大小和维度的数据,但在面对密度不均匀且结构复杂的数据时,部分小簇无法被算法正确识别。针对这一问题,提出一种基于自然邻域图划分的层次聚类算法HC-PNNG。HC-PNNG算法首先利用自然邻居关系实现了自然稀疏图的构建,随后利用基于自然稀疏图的图间相似度完成了自然稀疏图的层次化合并,进而实现了更具普适性的层次化聚类结果。在合成数据集和真实数据集上将HC-PNNG与最新的聚类算法进行了对比实验,结果表明该算法明显优于其他聚类算法,验证了HC-PNNG算法的有效性。 展开更多
关键词 分析 层次 自然邻域图 图划分 相似
在线阅读 下载PDF
基于结构相似度的轨迹聚类算法 被引量:70
12
作者 袁冠 夏士雄 +1 位作者 张磊 周勇 《通信学报》 EI CSCD 北大核心 2011年第9期103-110,共8页
针对目前轨迹数据聚类直接以整条轨迹数据作为基本单元,导致聚类效果降低的问题,提出了基于结构相似度的轨迹聚类算法。算法引入轨迹结构的概念,并给出结构相似度计算函数来分析轨迹内外部特征。首先根据转角将轨迹划分成若干轨迹段,然... 针对目前轨迹数据聚类直接以整条轨迹数据作为基本单元,导致聚类效果降低的问题,提出了基于结构相似度的轨迹聚类算法。算法引入轨迹结构的概念,并给出结构相似度计算函数来分析轨迹内外部特征。首先根据转角将轨迹划分成若干轨迹段,然后通过计算轨迹段的结构相似度来判断轨迹的匹配程度,进而完成轨迹聚类。真实数据的实验结果表明:该算法较其他同类算法分析轨迹更全面、效率更高;可以通过不同参数灵活调整特征的敏感度,聚类结果更具有实际意义。 展开更多
关键词 轨迹 轨迹转角 结构相似 轨迹匹配
在线阅读 下载PDF
一种相似度改进的用户聚类协同过滤推荐算法 被引量:27
13
作者 孙辉 马跃 +1 位作者 杨海波 张红松 《小型微型计算机系统》 CSCD 北大核心 2014年第9期1967-1970,共4页
协同过滤算法是推荐系统中使用最普遍的个性化推荐技术.该算法基于用户评分相似度,易于实现,但是仍存在不少问题—用户评分矩阵稀疏性问题、推荐准确性问题和推荐时间效率问题.本文针对传统协同过滤算法的诸多问题,引入聚类技术,提出相... 协同过滤算法是推荐系统中使用最普遍的个性化推荐技术.该算法基于用户评分相似度,易于实现,但是仍存在不少问题—用户评分矩阵稀疏性问题、推荐准确性问题和推荐时间效率问题.本文针对传统协同过滤算法的诸多问题,引入聚类技术,提出相似可信度、用户对项目类别喜爱度、用户对项目类别关注度三个概念,并以此来优化相似度计算,使得相似度计算更具有实际意义和准确性.然后提出基于相似度的聚类方法,将用户聚类,推荐是仅考虑同一类别中用户.实验表明,本文提出的优化方法能显著提高推荐效率. 展开更多
关键词 推荐系统 协同过滤 相似 平均绝对偏差
在线阅读 下载PDF
基于触发词指导的自相似度聚类事件检测 被引量:12
14
作者 张先飞 郭志刚 +2 位作者 刘嵩 程磊 田雨暄 《计算机科学》 CSCD 北大核心 2010年第3期212-214,220,共4页
传统方法将事件检测任务看作分类问题,将词作为实例来训练分类器,容易导致训练正反例不平衡,同时,在语料库规模较小时存在一定的数据稀疏问题。首先避开以词为实例进行分类,在事件类别判断上引入聚类思想,在事件触发词的指导下,采用自... 传统方法将事件检测任务看作分类问题,将词作为实例来训练分类器,容易导致训练正反例不平衡,同时,在语料库规模较小时存在一定的数据稀疏问题。首先避开以词为实例进行分类,在事件类别判断上引入聚类思想,在事件触发词的指导下,采用自相似度对K-means聚类算法中的K值进行自收敛,优化了聚类算法。然后结合命名实体及其位置信息,对事件类别进行详细定位,很好地解决了传统事件检测对类别模板的依赖性,所检测的事件在文本摘要、检索和主题检测与追踪上得到了很好的应用。 展开更多
关键词 事件检测 触发词 相似 命名实体
在线阅读 下载PDF
基于TF-IDF相似度的标签聚类方法 被引量:22
15
作者 韩敏 唐常杰 +2 位作者 段磊 李川 巩杰 《计算机科学与探索》 CSCD 2010年第3期240-246,共7页
社会标签系统是Web2.0中提出的新概念,旨在更好地表达用户的兴趣和意愿。标签聚类是社会标签数据挖掘中一个非常重要的研究课题。标签相似度的计算是标签聚类的关键技术。主要工作包括:(1)提出了一种基于TF-IDF的标签相似度计算方法和... 社会标签系统是Web2.0中提出的新概念,旨在更好地表达用户的兴趣和意愿。标签聚类是社会标签数据挖掘中一个非常重要的研究课题。标签相似度的计算是标签聚类的关键技术。主要工作包括:(1)提出了一种基于TF-IDF的标签相似度计算方法和基于该相似度的聚类算法;(2)分析了影响标签相似度的条件;(3)通过实验表明:与已有方法相比,新方法的准确性更高。 展开更多
关键词 标签 相似 社会标签系统 TF—IDF技术
在线阅读 下载PDF
可变相似性度量的近邻传播聚类 被引量:49
16
作者 董俊 王锁萍 熊范纶 《电子与信息学报》 EI CSCD 北大核心 2010年第3期509-514,共6页
近邻传播(AP)聚类算法面临的一个问题是不适用于多重尺度及任意空间形状的数据聚类处理。该文从数据分布特性的表征出发,提出了一种改进的近邻传播聚类算法AP-VSM(Affinity Propagation based on Variable-Similarity Measure)。首先,... 近邻传播(AP)聚类算法面临的一个问题是不适用于多重尺度及任意空间形状的数据聚类处理。该文从数据分布特性的表征出发,提出了一种改进的近邻传播聚类算法AP-VSM(Affinity Propagation based on Variable-Similarity Measure)。首先,综合数据的全局与局部分布特性,设计了一种数据可变相似性度量计算方法,该度量可以有效地反映数据实际聚类的分布特性;然后在传统AP算法框架基础上,构造出基于可变相似性度量的近邻传播聚类算法,从而拓展了传统AP算法的数据处理能力。仿真实验验证了新方法性能优于传统AP算法。 展开更多
关键词 数据处理 分析 近邻传播 可变相似b量 流形分析
在线阅读 下载PDF
C^s相似度函数下正则谱聚类的收敛阶(英) 被引量:14
17
作者 高炜 张云港 梁立 《兰州大学学报(自然科学版)》 CAS CSCD 北大核心 2011年第2期109-111,共3页
用覆盖数逼近的方法给出Cs相似度函数下正则谱聚类的收敛阶.
关键词 正则谱 相似函数 覆盖数 图像分割 本体相似计算
在线阅读 下载PDF
基于模糊聚类和相似度的电力系统可靠性原始参数预估 被引量:21
18
作者 张勇军 陈超 许亮 《电力系统保护与控制》 EI CSCD 北大核心 2011年第8期1-5,共5页
以可靠性气候影响因素作为线路模糊集元素,通过模糊聚类将可靠性原始参数已知和待求的线路进行适当分类,引入β作为考虑其他影响因素的修正系数,在分析欧氏贴近度、模糊贴近度、灰色关联度各自反映模糊集特征的差异性和局限性的基础上... 以可靠性气候影响因素作为线路模糊集元素,通过模糊聚类将可靠性原始参数已知和待求的线路进行适当分类,引入β作为考虑其他影响因素的修正系数,在分析欧氏贴近度、模糊贴近度、灰色关联度各自反映模糊集特征的差异性和局限性的基础上提出相似度指标,在同类中以可靠性参数已知的线路的可靠性影响因素序列为基准向量,以可靠性参数未知的线路的可靠性影响因素序列为待检向量,使用相似度指标进行求取。实例证明该方法的可行性和预估结果的准确性,并讨论了不同的权重系数取值会对结果产生影响。 展开更多
关键词 电力系统 可靠性原始参数 模糊 相似 贴近 灰色关联
在线阅读 下载PDF
基于语义相似度与优化的构件聚类算法 被引量:6
19
作者 张英俊 任姚鹏 +1 位作者 陈立潮 谢斌红 《计算机工程与设计》 CSCD 北大核心 2010年第11期2531-2535,共5页
为克服刻面分类表示法的人为主观因素,采用了刻面分类与全文检索相结合的方法对构件进行了表示。同时,从语义角度出发,结合优化技术,提出了一种基于语义相似度与优化的构件聚类算法。该算法有效地减少了刻面分类的主观性因素,进一步提... 为克服刻面分类表示法的人为主观因素,采用了刻面分类与全文检索相结合的方法对构件进行了表示。同时,从语义角度出发,结合优化技术,提出了一种基于语义相似度与优化的构件聚类算法。该算法有效地减少了刻面分类的主观性因素,进一步提高了构件查询的效率和准确性,并与基于向量空间模型的构件聚类效果进行比较。实验结果表明,基于语义相似度与优化的构件聚类算法的有效性,它在一定程度上改善了构件聚类的效果,提高了聚类质量。 展开更多
关键词 刻面分 全文检索 语义相似 优化 构件
在线阅读 下载PDF
基于启发式聚类模型和类别相似度的协同过滤推荐算法 被引量:24
20
作者 王兴茂 张兴明 +1 位作者 吴毅涛 潘俊池 《电子学报》 EI CAS CSCD 北大核心 2016年第7期1708-1713,共6页
基于k-近邻的协同过滤推荐算法对于邻居数量k的确定过于主观,并且推荐时以k-近邻均值加权推荐不够准确.针对这两个问题,本文首先引入并改进最大最小距离聚类算法,进而设计启发式聚类模型将用户进行不规定类别数的自由聚类划分,目标用户... 基于k-近邻的协同过滤推荐算法对于邻居数量k的确定过于主观,并且推荐时以k-近邻均值加权推荐不够准确.针对这两个问题,本文首先引入并改进最大最小距离聚类算法,进而设计启发式聚类模型将用户进行不规定类别数的自由聚类划分,目标用户所在类的用户为邻居用户,客观确定邻居数量;然后在推荐时定义类别相似度,针对性地建立目标用户未评分和评分项目的潜在类别关系,改进k-近邻均值加权算法.实验结果表明,该算法提高了推荐准确度(约0.035MAE). 展开更多
关键词 协同过滤 推荐算法 算法 启发式模型 相似
在线阅读 下载PDF
上一页 1 2 26 下一页 到第
使用帮助 返回顶部