期刊文献+
共找到74篇文章
< 1 2 4 >
每页显示 20 50 100
基于改进的Affnity Propagation聚类的木材缺陷识别 被引量:4
1
作者 吴东洋 业宁 +1 位作者 徐波 尹佟明 《工程数学学报》 CSCD 北大核心 2012年第4期600-606,共7页
本文提出了一种基于快速Affnity Propagation聚类算法的木材缺陷识别方法.通过提取木材图像的颜色矩特征,建立样本特征集X,以平均平方残基为阈值降低样本特征集X及距离矩阵S的维数,自动识别木材缺陷位置并标记.实验表明,该方法的识别速... 本文提出了一种基于快速Affnity Propagation聚类算法的木材缺陷识别方法.通过提取木材图像的颜色矩特征,建立样本特征集X,以平均平方残基为阈值降低样本特征集X及距离矩阵S的维数,自动识别木材缺陷位置并标记.实验表明,该方法的识别速度较传统的AP算法有明显提高,平均识别时间约为0.557s,平均识别查准率约为70.5%,平均识别查全率约为95.6%. 展开更多
关键词 Affnity propagation 木材缺陷 自动识别 降维
在线阅读 下载PDF
基于AP聚类算法的充电站/光伏电站一体化规划方法 被引量:3
2
作者 陈泫光 刘俊勇 +2 位作者 李林果 梅亦蕾 籍雁南 《可再生能源》 CAS CSCD 北大核心 2024年第10期1371-1380,共10页
文章基于熵权法构建光伏出力特性指标权重,利用AP聚类算法生成典型场景。同时,计入电动汽车负荷时空分布特性及需求响应能力,建立了负荷联动时空响应模型。基于分时电价与光伏典型场景出力,优化电动汽车充电时序及空间布局,满足充电站... 文章基于熵权法构建光伏出力特性指标权重,利用AP聚类算法生成典型场景。同时,计入电动汽车负荷时空分布特性及需求响应能力,建立了负荷联动时空响应模型。基于分时电价与光伏典型场景出力,优化电动汽车充电时序及空间布局,满足充电站距离约束、系统网络约束等前提下,提出了以充电站年总成本最小、用户满意度指标最优的充电站/光伏电站一体化规划方法。最后,通过算例仿真,基于对各个场景下经济性与满意度等指标的权衡考量,求得了充电站/光伏电站一体化规划方案。 展开更多
关键词 充电站规划 电动汽车 ap 用户满意度
在线阅读 下载PDF
融合AP聚类算法和宽度学习系统的分布外硬盘故障预测 被引量:1
3
作者 王屹阳 刘发贵 +1 位作者 彭玲霞 钟国祥 《计算机科学》 CSCD 北大核心 2024年第8期63-74,共12页
硬盘是云数据中心最主要的存储设备,硬盘故障预测是保障数据安全的重要手段。但是,硬盘的故障与健康样本之间存在着极端的数量不平衡问题,这会导致模型偏差;此外,不同型号的硬盘数据分布存在一定的差异,在特定硬盘数据上训练的模型往往... 硬盘是云数据中心最主要的存储设备,硬盘故障预测是保障数据安全的重要手段。但是,硬盘的故障与健康样本之间存在着极端的数量不平衡问题,这会导致模型偏差;此外,不同型号的硬盘数据分布存在一定的差异,在特定硬盘数据上训练的模型往往不适用于其他硬盘。对于这两个问题,文中提出了一种融合AP聚类算法和宽度学习系统的分布外硬盘故障预测方法。针对样本不平衡问题,文中使用AP聚类算法对硬盘故障出现前一阶段的样本集进行聚类,将与故障样本处于同一聚类簇的样本扩充为故障样本。针对不同型号硬盘分布存在差异的问题,文中结合流形正则化框架和宽度学习系统来学习硬盘数据的低维结构,提高模型对未知分布数据的泛化能力。实验结果表明,在AP聚类算法重采样的样本集上,相较于用于对比的重采样方法得到的样本集,多种故障预测方法的F1_Score取得了平均0.2的提升。此外,在分布外硬盘故障预测任务上,所提模型的F1_Score相比对比方法提升了0.1~0.2。 展开更多
关键词 硬盘故障预测 不平衡 分布外泛化 ap 宽度学习系统 流形学习
在线阅读 下载PDF
基于AP聚类和鲁棒优化的电网规划灵活性评估 被引量:18
4
作者 魏联滨 王伟臣 +2 位作者 李慧 宣文博 刘忠义 《电力系统及其自动化学报》 CSCD 北大核心 2020年第3期99-106,150,共9页
高比例可再生能源的并网,给电力系统规划的灵活性带来了挑战。本文考虑源-荷双端的不确定性,提出了一种基于AP(affinity propagation)聚类和两阶段鲁棒优化的电网规划灵活性评估方法。首先,本文提出了基于AP聚类的远景年典型日负荷建模... 高比例可再生能源的并网,给电力系统规划的灵活性带来了挑战。本文考虑源-荷双端的不确定性,提出了一种基于AP(affinity propagation)聚类和两阶段鲁棒优化的电网规划灵活性评估方法。首先,本文提出了基于AP聚类的远景年典型日负荷建模方法。其次,以区间的形式考虑可再生能源出力的不确定性,构建基于鲁棒优化的电力系统规划方案灵活性评估模型。最后,在整个周期的角度和各时间断面的角度提出了一组电网规划灵活性评估指标。本文利用IEEE RTS-24算例验证所提出方法的合理性。 展开更多
关键词 ap 灵活性评估 电网规划 鲁棒优化 可再生能源
在线阅读 下载PDF
基于LMD基本尺度熵的AP聚类滚动轴承故障诊断 被引量:14
5
作者 许凡 方彦军 +1 位作者 张荣 冯海波 《计算机应用研究》 CSCD 北大核心 2017年第6期1732-1736,共5页
针对滚动轴承聚类故障聚类模式识别方法中需要预先设定聚类数目问题,提出了一种基于局部均值分解(local mean decompoeiton,LMD)与基本尺度熵(base scale entropy,BSE)的相邻传播(affinity propagation,AP)滚动轴承聚类故障诊断方法。... 针对滚动轴承聚类故障聚类模式识别方法中需要预先设定聚类数目问题,提出了一种基于局部均值分解(local mean decompoeiton,LMD)与基本尺度熵(base scale entropy,BSE)的相邻传播(affinity propagation,AP)滚动轴承聚类故障诊断方法。该方法首先使用LMD模型将滚动轴承的不同状态振动信号分解为若干乘积函数(production function,PF);其次使用BSE计算前三个PF的熵值(BSE1-BSE3),并将其作为AP的输入进行滚动轴承的故障模式识别。最后实验结果表明,在不需要划分聚类中心个数的前提条件下AP聚类模型对滚动轴承的故障划分效果较好。 展开更多
关键词 局部均值分解 基本尺度熵 滚动轴承 故障诊断 ap算法
在线阅读 下载PDF
基于优化SAX和带权负荷特性指标的AP聚类用户用电行为分析 被引量:38
6
作者 李春燕 蔡文悦 +2 位作者 赵溶生 余长青 张谦 《电工技术学报》 EI CSCD 北大核心 2019年第A01期368-377,共10页
智能电表的推广和安装,使用户侧累积了海量用电数据。特征提取和聚类分析作为有效的数据处理手段,有助于挖掘用电数据中隐藏的宝贵信息,提取用户的用电行为特性。为提取有效直观的负荷特性,本文提出利用优化SAX和带权负荷指标的AP聚类算... 智能电表的推广和安装,使用户侧累积了海量用电数据。特征提取和聚类分析作为有效的数据处理手段,有助于挖掘用电数据中隐藏的宝贵信息,提取用户的用电行为特性。为提取有效直观的负荷特性,本文提出利用优化SAX和带权负荷指标的AP聚类算法,对负荷曲线进行聚类。针对AP聚类复杂度较高的问题,首先利用SAX算法对负荷曲线进行降维并提取特征,利用基于模拟退火粒子群算法,优化确定合理的字符数和状态数;然后结合负荷特性指标,运用改进AP聚类算法,对负荷曲线进行聚类,聚类过程中采用熵权法对负荷特性指标进行客观赋权,避免指标设置的主观性。基于聚类结果,对各类用户的用电行为以及需求响应潜力进行分析。案例分析验证了该算法的高效性和有效性,并可应用于电网公司决策,如负荷预测、异常检测和提供差异化服务等。 展开更多
关键词 特征提取 ap SAX算法 改进粒子群 用电行为分析
在线阅读 下载PDF
基于AP聚类的含分布式光伏的配电网分区方法 被引量:11
7
作者 刘颖 任惠 +1 位作者 孙辰军 米增强 《电测与仪表》 北大核心 2019年第13期70-75,共6页
分布式光伏(Distributed Generation Photovoltaic,DGPV)接入配电网(Distribution Network,DN),其出力具有随机性和波动性,为配电网分区带来了挑战。为获得稳定的全网分区,提出了一种基于AP聚类的分布式光伏接入配电网的分区方法。首先... 分布式光伏(Distributed Generation Photovoltaic,DGPV)接入配电网(Distribution Network,DN),其出力具有随机性和波动性,为配电网分区带来了挑战。为获得稳定的全网分区,提出了一种基于AP聚类的分布式光伏接入配电网的分区方法。首先,针对分布式光伏接入配网其出力对电压的影响,提出了一种适用于除平衡节点外所有节点的综合电气距离指标;其次,考虑以离散概率分布处理光伏出力,建立节点间电气距离期望矩阵作为分区依据,采用AP聚类对除平衡节点外的所有节点进行分区,以IEEE-123节点系统对上述方法进行了验证,结果表明所提方法的有效性和可行性。该分区方法优于以往方法,降低了将PQ节点与PV节点分别进行分区处理的复杂度,且避免了人为确定聚类数目带来的人为主观性,并将分布式光伏出力的随机性和波动性考虑在内,具有广泛的适用性。 展开更多
关键词 电网分区 电气距离 分布式光伏接入 ap
在线阅读 下载PDF
基于核主成分分析和AP聚类算法的电力系统态势感知技术 被引量:16
8
作者 王艳松 高鑫 +2 位作者 胡彩娥 王健 张禄 《电测与仪表》 北大核心 2022年第1期25-36,共12页
随着可再生能源渗透水平的不断提高,现代电力系统面临着更多不可避免的不确定性,这些不确定性可能导致系统的弱阻尼振荡问题。对于可再生能源渗透率很高的电力系统,检测同步发电机之间的相干性是态势感知的关键环节。为此,文中提出了一... 随着可再生能源渗透水平的不断提高,现代电力系统面临着更多不可避免的不确定性,这些不确定性可能导致系统的弱阻尼振荡问题。对于可再生能源渗透率很高的电力系统,检测同步发电机之间的相干性是态势感知的关键环节。为此,文中提出了一种基于广域测量系统(Based Area Measurement System,WAMS)的相干检测算法,该方法采用了核主成分分析(Kernel Principal Component Analysis,KPCA)和聚类(Affinity Propagation,AP)分析法可应用于可再生能源广泛渗透的电力系统。文中提出了几种轨迹相似度指标,用于确定惯性中心(Center of Inertia,COI)坐标中任意两个发电机轨迹之间的相似性;提出了一种基于KPCA方法的集成轨迹相似度指标,以解决多个指标之间的相干性问题;随后采用AP聚类分析方法检测同步发电机之间的相干性,可无需预先指定聚类的数量;利用高可再生能源发电渗透率的华南电力系统和包括张北风电场的华北电力系统的一部分进行仿真分析,结果证明了所提方法的适用性和实用性。 展开更多
关键词 相干性检测 态势感知 广域测量系统 高可再生能源渗透 核主成分分析 ap
在线阅读 下载PDF
基于改进属性约简的细粒度并行AP聚类算法 被引量:7
9
作者 朱红 丁世飞 许新征 《计算机研究与发展》 EI CSCD 北大核心 2012年第12期2638-2644,共7页
Affinity Propagation(AP)聚类算法将所有数据点作为潜在的聚类中心,在相似度矩阵的基础上通过消息传递进行聚类.与传统聚类方法相比,对于规模很大的数据集,AP是一种快速、有效的聚类方法.正是这样,属性约简对于AP算法非常重要.另外,在... Affinity Propagation(AP)聚类算法将所有数据点作为潜在的聚类中心,在相似度矩阵的基础上通过消息传递进行聚类.与传统聚类方法相比,对于规模很大的数据集,AP是一种快速、有效的聚类方法.正是这样,属性约简对于AP算法非常重要.另外,在大规模并行系统的设计中,细粒度并行是实现高性能的基本策略.提出了一种基于改进属性约简的细粒度并行AP聚类算法(IRPAP),将粒度思想引入到并行计算中.首先分析了并行计算中的粒度原理.然后用改进的属性约简算法对数据集预处理.此算法并行计算并选择差别矩阵元素,降低了时间空间复杂度,最后用AP算法聚类.整个IRPAP算法将任务划分到多个线程同时处理.实验证明,对于大规模数据集的聚类,IRPAP算法比AP算法效率更高. 展开更多
关键词 属性约简 细粒度 并行计算 ap算法
在线阅读 下载PDF
基于AP聚类算法的跳汰机床层松散度软测量建模 被引量:10
10
作者 李丽娟 潘磊 张湜 《化工学报》 EI CAS CSCD 北大核心 2012年第9期2675-2680,共6页
松散度是跳汰分选过程的重要影响因素,针对其难以用仪器在线检测的问题,提出采用最小二乘支持向量机(LS-SVM)的软测量建模方法。在充分考虑分选过程高度非线性及强耦合性的基础上,为避免单模型建模回归精度差和泛化能力弱的问题,提出采... 松散度是跳汰分选过程的重要影响因素,针对其难以用仪器在线检测的问题,提出采用最小二乘支持向量机(LS-SVM)的软测量建模方法。在充分考虑分选过程高度非线性及强耦合性的基础上,为避免单模型建模回归精度差和泛化能力弱的问题,提出采用基于仿射传播(AP)聚类的LS-SVM多模型建模算法进行床层松散度软测量建模。首先采用AP算法对样本数据进行聚类划分,再用LS-SVM的方法对子类样本分别建立子模型,最后通过子模型切换策略得到系统输出。仿真实验表明,基于AP聚类算法的LS-SVM软测量建模算法能够更好地预测跳汰机床层松散度。 展开更多
关键词 跳汰机 床层松散度 ap算法 多模型 最小二乘支持向量机
在线阅读 下载PDF
基于EEMD的样本熵的滚动轴承AP聚类故障诊断 被引量:8
11
作者 许凡 方彦军 孔政敏 《仪表技术与传感器》 CSCD 北大核心 2017年第6期129-135,共7页
针对滚动轴承聚类故障诊断需要事先确定聚类数目问题,提出了一种基于总体均值经验模式分解(EEMD)样本熵(SE)的相似近邻传播(AP)聚类故障诊断模型,该模型首先用EEMD方法将滚动轴承振动信号分解为一系列的内禀模式函数(IMFs),其次使用相... 针对滚动轴承聚类故障诊断需要事先确定聚类数目问题,提出了一种基于总体均值经验模式分解(EEMD)样本熵(SE)的相似近邻传播(AP)聚类故障诊断模型,该模型首先用EEMD方法将滚动轴承振动信号分解为一系列的内禀模式函数(IMFs),其次使用相关系数法确定IMF个数,然后使用SE计算其熵值,最后选择第1~3个IMF-SE值作为AP聚类算法的输入。实验结果表明:在没有预先划分聚类数目的情况下,AP聚类方法对滚动轴承的故障诊断效果较好。 展开更多
关键词 总体均值经验模式分解 样本熵 滚动轴承 故障诊断 ap
在线阅读 下载PDF
一种用于公交站点聚类的AP算法 被引量:4
12
作者 胡继华 程智锋 詹承志 《计算机工程》 CAS CSCD 北大核心 2011年第S1期223-225,232,共4页
针对公交站点全球定位系统数据采集过程中定位精度较低的问题,提出一种用于公交站点聚类的AP算法。AP算法以相似度矩阵为基础,根据聚类对象自动进行分类判断,依靠2点之间消息传递迭代更新得到最佳的聚类结果。针对公交站点数据特征选择... 针对公交站点全球定位系统数据采集过程中定位精度较低的问题,提出一种用于公交站点聚类的AP算法。AP算法以相似度矩阵为基础,根据聚类对象自动进行分类判断,依靠2点之间消息传递迭代更新得到最佳的聚类结果。针对公交站点数据特征选择参考度,提出个数控制和距离控制的改进方法。实验结果表明,该算法能够准确得到公交站点聚类个数,有效排除噪声点,执行效率满足要求。 展开更多
关键词 ap算法 相似度矩阵 消息传递
在线阅读 下载PDF
GMAP:一种基于AP聚类的共词分析方法 被引量:10
13
作者 郭崇慧 曹梦月 《情报学报》 CSSCI CSCD 北大核心 2017年第11期1192-1200,共9页
文献计量学领域中的共词分析方法主要分为三个阶段:术语收集阶段、共现频率统计阶段以及聚类分析阶段,传统共词分析方法在以上三个阶段存在主观性过强、信息量不足,聚类不稳定、成员划分不合理、类团解释缺少语义分析等问题,导致了领域... 文献计量学领域中的共词分析方法主要分为三个阶段:术语收集阶段、共现频率统计阶段以及聚类分析阶段,传统共词分析方法在以上三个阶段存在主观性过强、信息量不足,聚类不稳定、成员划分不合理、类团解释缺少语义分析等问题,导致了领域主题发现容易存在偏差。本文针对传统共词分析方法存在的缺陷提出了一种新的共词分析方法——GMAP共词分析方法,即将g指数、互信息概念以及AP聚类算法融入共词分析方法中。首先,使用g指数确定高频关键词的个数;其次,使用互信息概念对共现矩阵进行包容化处理;最后,使用AP算法进行聚类得出领域主题。为了验证GMAP的可行性和有效性,对中国古村落(传统村落)领域文献进行数值实验,结果显示GMAP共词分析法优于传统共词分析方法,为改进共词分析方法提供了一个新的研究思路。 展开更多
关键词 共词分析 G指数 互信息 ap
在线阅读 下载PDF
时空深度特征AP聚类的稀疏表示视频异常检测算法 被引量:12
14
作者 胡正平 张乐 尹艳华 《信号处理》 CSCD 北大核心 2019年第3期386-395,共10页
针对异常行为检测问题,提出基于时空深度特征的AP聚类稀疏表示视频异常检测方法。由于视频序列中大量背景信息及有效信息分布不均匀的情况,首先利用光流结合非均匀的细胞分割对视频的运动目标进行提取并得到空间尺寸大小不同的时空兴趣... 针对异常行为检测问题,提出基于时空深度特征的AP聚类稀疏表示视频异常检测方法。由于视频序列中大量背景信息及有效信息分布不均匀的情况,首先利用光流结合非均匀的细胞分割对视频的运动目标进行提取并得到空间尺寸大小不同的时空兴趣块。其次利用三维卷积神经网络提取不同时空兴趣块的时空深度特征从而对原始视频序列进行三维描述。然后在字典学习时,采用AP聚类方法,将训练样本中具有代表性的特征作为字典,极大降低字典维度以及稀疏表示方法对计算内存的要求。本文将测试样本进行AP聚类后仅对具有代表性的聚类中心进行检测,在减少实验时间的同时削减了阈值对检测效果的敏感度。实验结果表明,与现有的检测方法相比本文方法具有优越性。 展开更多
关键词 异常检测 三维卷积神经网络 时空兴趣块 时空深度特征 ap 稀疏表示
在线阅读 下载PDF
基于属性区分能力和AP聚类的属性粒化方法 被引量:3
15
作者 朱红 丁世飞 《计算机科学》 CSCD 北大核心 2016年第2期95-97,128,共4页
提出了一种基于属性区分能力和AP聚类的属性粒化方法(Attribute Granulation based on attribute discernibility and AP algorithm,AGAP)。该方法首先依据属性依赖度计算属性的区分能力;然后将所有属性作为潜在的聚类中心,使用AP算法聚... 提出了一种基于属性区分能力和AP聚类的属性粒化方法(Attribute Granulation based on attribute discernibility and AP algorithm,AGAP)。该方法首先依据属性依赖度计算属性的区分能力;然后将所有属性作为潜在的聚类中心,使用AP算法聚类,得到若干个属性簇类;最后采取选用代表属性的方法得到较粗的属性粒子,从而达到属性粗粒化的要求。对高维数据的特征降维,这种算法比传统的属性约简算法大大提高了运算效率,在属性粒化精度要求不是很严格的情况下,所提算法优势明显。 展开更多
关键词 属性区分能力 ap 属性粒化
在线阅读 下载PDF
基于AP聚类和互信息的弱标记特征选择方法 被引量:13
16
作者 孙林 施恩惠 +1 位作者 司珊珊 徐久成 《南京师大学报(自然科学版)》 CAS CSCD 北大核心 2022年第3期108-115,共8页
特征选择是多标记学习中重要的预处理过程.针对现有多标记分类方法没有考虑标记占比对特征和标记相关性的影响,以及不能有效处理弱标记数据等问题,提出一种基于仿射传播(affinity propagation,AP)聚类和互信息的弱标记特征选择方法.首先... 特征选择是多标记学习中重要的预处理过程.针对现有多标记分类方法没有考虑标记占比对特征和标记相关性的影响,以及不能有效处理弱标记数据等问题,提出一种基于仿射传播(affinity propagation,AP)聚类和互信息的弱标记特征选择方法.首先,在AP聚类的基础上,结合剩余标记信息和样本相似性,构建概率填补公式,预测缺失标记值,有效补齐缺失标记;然后,使用先验概率定义标记占比,结合互信息构建相关性度量,评估特征与标记集之间的相关程度;最后,设计一种弱标记特征选择算法,有效提高弱标记数据的分类性能.在6个多标记数据集上进行仿真实验,结果表明,该算法在多个指标上获得了良好的分类性能,优于当前多种相关的多标记特征选择算法,有效验证了所提算法的有效性. 展开更多
关键词 多标记学习 特征选择 ap 互信息 缺失标记
在线阅读 下载PDF
基于距离测度学习的AP聚类图像标注 被引量:2
17
作者 王浩 吕学强 黄跃 《计算机工程与应用》 CSCD 北大核心 2017年第23期159-164,207,共7页
针对有效利用图像底层视觉特征和图像语义特征进行图像标注,提出一种改进的AP(Affinity Propagation)聚类标注模型。首先采用半监督距离测度学习算法,融合图像语义信息,训练得到新的距离测度。然后使用新的距离测度对每一类图像进行AP聚... 针对有效利用图像底层视觉特征和图像语义特征进行图像标注,提出一种改进的AP(Affinity Propagation)聚类标注模型。首先采用半监督距离测度学习算法,融合图像语义信息,训练得到新的距离测度。然后使用新的距离测度对每一类图像进行AP聚类,生成各类图像的聚类中心,计算待标注图像到各类图像聚类中心的平均距离,确定待标注图像类别。最后计算待标注图像到类内各个聚类中心的距离,确定待标注图像类内类别,统计该类别下图像的标注词,作为待标注图像的标注词。在Corel5K和NUS-WIDE数据集上进行了实验,经验证,该方法有效提高了标注精度。 展开更多
关键词 距离测度学习 近邻传播(ap)算法 图像标注
在线阅读 下载PDF
基于初始偏向度的AP算法聚类性能优化研究 被引量:2
18
作者 赵延龙 滑楠 《计算机应用研究》 CSCD 北大核心 2018年第2期372-374,399,共4页
在对AP算法仿真研究过程中发现,样本数据点作为类代表点的初始偏向度取值,与算法最终聚类性能有着密切的联系。针对两者之间的数量关系展开深入研究,通过建立初始偏向度多重单目标优化模型,限定算法花费时长在可设定的范围内,确定初始... 在对AP算法仿真研究过程中发现,样本数据点作为类代表点的初始偏向度取值,与算法最终聚类性能有着密切的联系。针对两者之间的数量关系展开深入研究,通过建立初始偏向度多重单目标优化模型,限定算法花费时长在可设定的范围内,确定初始偏向度最优取值,使得算法聚类准确率取得最优,同时花费时长相对较小。实验结果表明,对于三种经典的标准数据集4k2-far、wine和iris,优化后的AP算法与优化前相比,在降低花费时长的同时提高了聚类准确率,从而有效提高算法的聚类性能。 展开更多
关键词 ap算法 初始偏向度 多重单目标优化 性能
在线阅读 下载PDF
基于类内和类间距离的粗粒度并行AP聚类算法 被引量:1
19
作者 张素智 杨芮 +1 位作者 陈小妮 李鹏辉 《华中师范大学学报(自然科学版)》 CAS 北大核心 2018年第6期781-787,797,共8页
近邻传播(Affinity Propagation,AP)聚类是基于数据点间消息传递的算法,主要通过数据间的相似度实现聚类.与传统的聚类方法相比,AP聚类无需事先给定聚类数目就可实现聚类,因此具有快速高效的优点,然而在处理高维复杂数据集时存在随着聚... 近邻传播(Affinity Propagation,AP)聚类是基于数据点间消息传递的算法,主要通过数据间的相似度实现聚类.与传统的聚类方法相比,AP聚类无需事先给定聚类数目就可实现聚类,因此具有快速高效的优点,然而在处理高维复杂数据集时存在随着聚类效率提升而准确度不高的问题.为改善AP聚类算法的效率和精度,提出基于类内和类间距离的粗粒度并行AP聚类算法——IOCAP.首先引入粒度思想将初始数据集划分成多个子集;其次对各子集结合类内和类间距离进行相似度矩阵的改进计算,最后基于MapReduce模型实现改进后的并行AP聚类.在真实数据集上的实验表明,IOCAP算法在大数据集上有较好的适应性,能在保持AP聚类效果的同时有效地提升算法精度. 展开更多
关键词 ap 粒度思想 内距离 间距离 并行处理
在线阅读 下载PDF
结合半监督AP聚类和改进相似度的推荐算法 被引量:5
20
作者 李昆仑 赵佳耀 +1 位作者 王萌萌 于志波 《小型微型计算机系统》 CSCD 北大核心 2021年第7期1396-1401,共6页
寻找近邻用户或近邻项目是传统协同过滤推荐算法的关键内容.通常,数据稀疏性会导致推荐精度降低.基于项目类别偏好的混合协同过滤算法利用项目特征的低维性与二值性进行聚类,通过用户的类别偏好信息寻找近邻用户,此类方法可以在一定程... 寻找近邻用户或近邻项目是传统协同过滤推荐算法的关键内容.通常,数据稀疏性会导致推荐精度降低.基于项目类别偏好的混合协同过滤算法利用项目特征的低维性与二值性进行聚类,通过用户的类别偏好信息寻找近邻用户,此类方法可以在一定程度上缓解数据稀疏性问题.为了进一步提高近邻用户间的相似性,本文在项目类别偏好的混合协同过滤的算法基础上利用半监督AP聚类算法代替传统的聚类算法,并对相似性度量方式进行改进,提出了一种基于半监督AP聚类和改进用户相似度的协同过滤算法.该算法有两个方面改进:一方面,提出了一种新的半监督AP聚类算法-基于k近邻密度估计的半监督AP聚类;另一方面,使用用户活跃因子和用户评分轨迹改进Pearson相似度.实验结果证明了该算法的有效性. 展开更多
关键词 协同过滤 ap 半监督 相似性度量 别偏好
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部