期刊文献+
共找到75篇文章
< 1 2 4 >
每页显示 20 50 100
融合主成分含噪密度聚类与综合关联分析的混合非侵入式负荷辨识方法 被引量:1
1
作者 张荣伟 唐晓杰 +4 位作者 李龙 徐晓东 洪洲 张雪 吕干云 《现代电力》 北大核心 2025年第3期401-410,共10页
为了提高电力负荷监控的准确性,研究融合主成分含噪密度聚类(density-based spatial clustering of applications with noise with principal component analysis,PCADBSCAN)的混合非侵入式负荷辨识方法。首先,针对原始负荷特征维度较... 为了提高电力负荷监控的准确性,研究融合主成分含噪密度聚类(density-based spatial clustering of applications with noise with principal component analysis,PCADBSCAN)的混合非侵入式负荷辨识方法。首先,针对原始负荷特征维度较高的问题,采用主成分分析算法对原始特征数据降维,构建负荷特征模板库,同时,获取负荷电流波形,构建负荷电流模板库。其次,采用基于密度的聚类算法对负荷特征模板库内的样本进行非监督聚类,提取各聚类簇中心。然后,计算待辨识负荷与各特征模板库聚类中心的欧式距离,完成负荷特征匹配,并计算待辨识负荷的电流波形与电流模板库内各电流波形的综合关联度,完成负荷电流波形匹配。最后,混合两次匹配结果,综合判断待辨识负荷,从而实现高可靠辨识。基于用电数据测试数据集的仿真结果显示,该方法各项指标均超过96%。 展开更多
关键词 混合非侵入式负荷辨识 主成分分析 特征降维 DBSCAN聚类 综合关联分析
在线阅读 下载PDF
基于ISOMAP等距离映射聚类的设备故障数据库清洗方法
2
作者 周家玉 侯慧娟 +1 位作者 盛戈皞 江秀臣 《高压电器》 北大核心 2025年第8期74-82,共9页
随着人工智能算法的发展,电力设备的监测数据被广泛应用于设备早期故障诊断中。由于原始监测数据中可能含有部分呈现异常的“脏”数据,会严重影响设备故障智能诊断的准确性,因此,需要对设备故障数据库进行数据清洗。文中综合线性模型和... 随着人工智能算法的发展,电力设备的监测数据被广泛应用于设备早期故障诊断中。由于原始监测数据中可能含有部分呈现异常的“脏”数据,会严重影响设备故障智能诊断的准确性,因此,需要对设备故障数据库进行数据清洗。文中综合线性模型和邻近度模型,构造了一种基于ISOMAP等距离映射聚类的数据清洗方法,先采用ISOMAP分析方法对原始数据进行特征提取,在此基础上进行DBSCAN密度聚类分析,充分考虑了电力设备特征量之间的非线性关系和集群化特点,清除了异常值,提升了数据质量。文中以变压器的油中溶解气体体积分数故障数据库的清洗为例,结果表明,利用清洗后的数据库训练的故障诊断学习网络,诊断准确率提高了17%,且与其他数据清洗算法模型相比,文中所提出的方法的分类识别率提升了5%,数据清洗效果良好。 展开更多
关键词 故障诊断 在线监测 降维 聚类 数据清洗
在线阅读 下载PDF
基于粒球邻域粗糙集的三支高斯混合聚类
3
作者 邵春梅 万仁霞 +1 位作者 苗夺谦 赵杰 《郑州大学学报(理学版)》 北大核心 2025年第6期16-23,共8页
为了解决高维数据集中冗余信息影响三支高斯混合模型聚类效果的问题,将粒球邻域粗糙集的理论融入三支高斯混合聚类模型中,提出一种基于粒球邻域粗糙集的三支高斯混合聚类模型。首先,使用k-means聚类生成满足纯度要求的粒球集,再在粒球... 为了解决高维数据集中冗余信息影响三支高斯混合模型聚类效果的问题,将粒球邻域粗糙集的理论融入三支高斯混合聚类模型中,提出一种基于粒球邻域粗糙集的三支高斯混合聚类模型。首先,使用k-means聚类生成满足纯度要求的粒球集,再在粒球生成正域不变约束下进行属性约简,提取关键属性。其次,使用三支高斯混合模型对约简后的数据进行聚类,将对象划分到类簇的核心域或边界域。在7个UCI公共数据集上的对比实验结果表明,所提模型不仅继承了三支高斯混合聚类模型优越的聚类性能,具有更高的准确率、轮廓系数和更低的戴维森堡丁指数,其对类簇边界部分的刻画也更加准确。此外,由于所提模型对高维空间进行了属性约简处理,使得其具有更小的时间复杂度。 展开更多
关键词 高维数据 三支高斯混合模型 聚类 粒球邻域粗糙集 正域 属性约简
在线阅读 下载PDF
基于关联特征筛选的双层聚类区域配变电压越限特征分析及预测
4
作者 郭少东 赵晓莉 +3 位作者 孙改平 杨秀 杨帆 刘俊 《南方电网技术》 北大核心 2025年第2期19-27,共9页
针对区域配网变压器(简称“配变”)数量多,大量新型负荷、分布式光伏等接入,配变电压随机性波动增强,台区用户电压质量面临挑战。为更好地对区域配变电压进行越限特征分析及预测,提出了基于关联特征筛选的双层聚类区域配变电压预测方法... 针对区域配网变压器(简称“配变”)数量多,大量新型负荷、分布式光伏等接入,配变电压随机性波动增强,台区用户电压质量面临挑战。为更好地对区域配变电压进行越限特征分析及预测,提出了基于关联特征筛选的双层聚类区域配变电压预测方法。首先,将区域配变的越限天数作为第一层聚类特征,获得电压性质正常以及越上限的配变。其次,针对电压越限配变提出结合Pearson相关系数和欧氏距离(Euclidean distance)的最优度量矩阵,提取原有数据的内含信息,作为K均值聚类(K-means)的输入,实现对区域配变双层聚类。在此基础上,选取该集群中代表配变表征该类配变,利用卷积双向长短期记忆网络-注意力机制(convolutional neural network-bidirectional long and short-term memory-attention,CNN-BiLSTM-Attention)模型对配变电压进行预测,该模型能够提取输入数据的双向信息特征,并对重要特征加权,从多时间尺度上获得双向特征信息用于预测。最后,在上海市某区域配变验证了该方法的有效性。 展开更多
关键词 区域配变 最优度量矩阵 双层聚类 降维 电压预测
在线阅读 下载PDF
基于机器学习的我国天然气进口量预测及其运输安全评价
5
作者 邹黎敏 唐永欣 《工业技术经济》 北大核心 2025年第2期108-118,共11页
天然气作为一种高效、低碳、清洁的化石能源,具有易存储、运输和储量丰富的特性,被视为其他化石能源的最佳替代品之一。在确保我国天然气供应的连续性及实现碳达峰与碳中和目标的过程中,准确预测我国天然气进口量并对其运输安全进行评... 天然气作为一种高效、低碳、清洁的化石能源,具有易存储、运输和储量丰富的特性,被视为其他化石能源的最佳替代品之一。在确保我国天然气供应的连续性及实现碳达峰与碳中和目标的过程中,准确预测我国天然气进口量并对其运输安全进行评价显得尤为关键。针对单一特征选择方法特征筛选结果不稳定的问题,本文提出了一种基于多属性决策的特征选择方法,并根据特征选择结果建立高斯过程回归模型对我国天然气进口量进行预测。同时,提出了一种结合熵权与t-SNE降维的K均值聚类模型,并将其应用于评估我国天然气进口运输安全。结果表明:本文所提出的基于多属性决策的特征选择方法所得到的特征重要程度排序更加稳定,对我国天然气进口量影响最大的3个指标分别是:能源消费总量中天然气占比、居民消费水平和国内天然气管道长度;高斯过程回归模型对我国天然气进口量预测的绝对百分比误差均在5%以下,预测精度高;与传统t-SNE降维相比,结合熵权的t-SNE降维方法具有更低的KL散度,其降维结果更贴近原始数据的分布;结合熵权与t-SNE降维的K均值聚类结果可信度更高,我国进口天然气运输安全状态越来越好,并且对其影响最大的3个指标分别是:自有船队运力供给、管道气年运输量和LNG年运输量。 展开更多
关键词 机器学习 天然气进口量 运输安全 熵权 特征选择 高斯过程回归 t-SNE降维 K均值聚类
在线阅读 下载PDF
基于随机邻域嵌入的无监督复杂工况识别
6
作者 黄林 刘善君 +1 位作者 王伟 龚立 《系统仿真学报》 CAS CSCD 北大核心 2024年第6期1334-1343,共10页
现代工业生产设备通常结构复杂并交替运行于不同工况,基于监测数据进行准确的工况识别是对系统进行健康监测的基础,但系统的监测数据通常维度较高、数据量较大。针对设备复杂工况的识别问题,提出了一种基于随机邻域嵌入的无监督工况识... 现代工业生产设备通常结构复杂并交替运行于不同工况,基于监测数据进行准确的工况识别是对系统进行健康监测的基础,但系统的监测数据通常维度较高、数据量较大。针对设备复杂工况的识别问题,提出了一种基于随机邻域嵌入的无监督工况识别方法。采用随机邻域嵌入算法,能够保留数据的局部和全局结构特性;计算了高维和低维空间中数据点的概率相似性,可实现设备高维监测数据的降维和无监督聚类,在不建立系统模型的基础上达成准确识别系统工况的目的。结果表明:该方法可有效实现高维监测数据的复杂工况识别,是一种有效的无监督聚类学习方法。 展开更多
关键词 随机邻域嵌入 无监督 工况识别 降维 聚类
在线阅读 下载PDF
基于凝聚层次聚类的接地网定向支路减维腐蚀诊断优化方法 被引量:5
7
作者 谢炀 杨鑫 +3 位作者 黄亚飞 朱子茵 黎昊聪 胡君瑶 《高电压技术》 EI CAS CSCD 北大核心 2024年第4期1723-1730,共8页
为了更有效地对接地网水平支路导体的腐蚀故障情况进行诊断,采用模型仿真方法对基于电网络理论的接地网腐蚀诊断方法进行分析,针对现有接地网腐蚀诊断模型存在的缺陷,提出了一种基于凝聚层次聚类的接地网定向支路减维腐蚀诊断优化方法... 为了更有效地对接地网水平支路导体的腐蚀故障情况进行诊断,采用模型仿真方法对基于电网络理论的接地网腐蚀诊断方法进行分析,针对现有接地网腐蚀诊断模型存在的缺陷,提出了一种基于凝聚层次聚类的接地网定向支路减维腐蚀诊断优化方法。该方法通过分析恒定直流激励下接地网各支路电阻变化对于端口的灵敏度规律,利用支路端口灵敏度对接地网可及端口进行凝聚层次聚类,以选出最优端口测量组合;然后采用定向支路减维方法对各端口电阻方程进行支路筛选,将灵敏度低于判定阈值的导体支路划为未知支路,高于判定阈值的导体支路划为健康支路,以降低腐蚀诊断模型的病态程度和计算维度。在某模拟变电站接地网上对该方法进行了仿真验证,结果显示优化后的整体诊断相对误差仅为3.07%,远小于普通接地网腐蚀诊断的6.74%,证明该方法能显著提高接地网腐蚀诊断精度,可为接地网腐蚀诊断提供理论指导。 展开更多
关键词 接地网 腐蚀诊断 支路端口灵敏度 凝聚层次聚类 定向支路减维
在线阅读 下载PDF
红外特征提取与关联分析的设备故障预警方法 被引量:1
8
作者 杨磊 王国丽 +4 位作者 朱丽晓 李云红 李丽敏 苏雪平 王梅 《激光与红外》 CAS CSCD 北大核心 2024年第8期1277-1285,共9页
水电站电气设备的安全稳定运行至关重要。为了实现设备故障的自动预警,通过红外特征提取并进行灰色关联分析,提出建立主成分分析(PCA)和基于密度的聚类算法(DBSCAN)的设备故障预警模型。首先,通过数据预处理补全缺失数据,剔除异常数据... 水电站电气设备的安全稳定运行至关重要。为了实现设备故障的自动预警,通过红外特征提取并进行灰色关联分析,提出建立主成分分析(PCA)和基于密度的聚类算法(DBSCAN)的设备故障预警模型。首先,通过数据预处理补全缺失数据,剔除异常数据后进行主成分分析降维并提取新的主成分特征。其次,将新的主成分采用DBSCAN算法构建特征样本集,建立灰色关联模型,计算灰色关联系数,然后,通过灰色关联系数的变化程度突变点进行故障预警。实验结果表明,所提方法能有效提取红外特征,并在设备异常状态下实现设备故障预警,故障预警准确率达到97.88%。 展开更多
关键词 红外特征提取 PCA降维 DBSCAN聚类 灰色关联分析 故障预警
在线阅读 下载PDF
混合多类型储能的分布式能源系统运行优化方法 被引量:5
9
作者 郭佩乾 郝峰杰 +4 位作者 袁志昌 尹立坤 姜智霖 潘海宁 项淼毅 《南方电网技术》 CSCD 北大核心 2024年第8期29-38,60,共11页
对于含多类型混合储能系统的运行优化,通常将所有设备等效为一个整体,并未考虑各储能系统的运行特性差异等因素,最终导致设备利用率低,经济运行能力差。为此,首先以最大可再生能源消纳以及最小电网交换电量为目标,构建了优化函数模型。... 对于含多类型混合储能系统的运行优化,通常将所有设备等效为一个整体,并未考虑各储能系统的运行特性差异等因素,最终导致设备利用率低,经济运行能力差。为此,首先以最大可再生能源消纳以及最小电网交换电量为目标,构建了优化函数模型。其次,考虑到多类型储能系统在充放电动态特性、运行成本特征以及SOC设定等方面差异,提出了一种结合能量型储能SOC一致性约束的双层解耦式运行优化方法,以适应分布式能源系统中的多类型储能协同运行。最后,以某个在建的分布式可再生能源系统工业示范园区数据为基础,对所提方法进行了算例验证与分析。结果证明,所提方法在保证分布式能源系统内多个能量型储能系统充放电同步性的同时,能够对具有相同运行特性的储能系统进行聚类,有效了降低计算复杂性,完成多类型储能协调与优化,并最终促进分布式能源系统的新能源消纳。 展开更多
关键词 分布式能源系统 功率型储能 能量型储能 双层解耦式运行优化 聚类降维 SOC一致性约束
在线阅读 下载PDF
基于两步降维的单相接地故障发生时刻估计算法 被引量:1
10
作者 李冠华 徐凯 +2 位作者 刘志宇 马一菱 王雅楠 《电力系统及其自动化学报》 CSCD 北大核心 2024年第7期140-149,共10页
为准确估计单相接地故障发生时刻,本文提出一种基于两步降维的配电网单相接地故障发生时刻估计算法。该算法利用经验模态分解构建滤波器,根据馈线零序电流建立高维特征数据集,经过主成分分析法及希尔伯特变换映射算法将高维数据两次降... 为准确估计单相接地故障发生时刻,本文提出一种基于两步降维的配电网单相接地故障发生时刻估计算法。该算法利用经验模态分解构建滤波器,根据馈线零序电流建立高维特征数据集,经过主成分分析法及希尔伯特变换映射算法将高维数据两次降维后得到二维特征数据集。利用基于密度的聚类方法自适应地将数据分为故障数据和非故障数据两类,从而估计故障发生时刻。文中设计了包含7种常见高阻接地介质的11组实验,对该算法的故障时刻辨识精度进行验证,结果表明,该算法精度在7.3 ms以内,对瞬时性故障能够有效识别故障时段。 展开更多
关键词 配电网单相接地故障 经验模态分解 故障时刻检测 降维 聚类
在线阅读 下载PDF
协同过滤技术在个性化推荐中的运用 被引量:15
11
作者 宋真真 王浩 杨静 《合肥工业大学学报(自然科学版)》 CAS CSCD 北大核心 2008年第7期1059-1062,1148,共5页
协同过滤技术是目前运用最广泛的个性化推荐技术之一,但随着系统规模的不断扩大,用户评分数据极端稀疏等问题使其推荐质量严重下降。因此,文章提出将维数简化和聚类的方法运用到协同过滤技术中,从而较好地解决协同过滤推荐技术中存在的... 协同过滤技术是目前运用最广泛的个性化推荐技术之一,但随着系统规模的不断扩大,用户评分数据极端稀疏等问题使其推荐质量严重下降。因此,文章提出将维数简化和聚类的方法运用到协同过滤技术中,从而较好地解决协同过滤推荐技术中存在的稀疏性、扩展性等问题,快速准确地产生个性化推荐结果。 展开更多
关键词 个性化推荐 协同过滤 维数简化 聚类
在线阅读 下载PDF
基于面板数据有序聚类的主动配电网规划场景降维技术 被引量:14
12
作者 刘洁颖 刘俊勇 +4 位作者 黄媛 刘友波 高红均 庄丹 马铁丰 《电网技术》 EI CSCD 北大核心 2017年第4期1132-1138,共7页
研究了基于面板数据的含分布式电源(distributed generator,DG)的主动配电网规划场景的降维技术。首先,对主动配电网的中长期规划进行时序模拟,将负荷按不同的类型建立其增长的时序数学模型,在考虑光伏、风电等DG容量自然增长的前提下... 研究了基于面板数据的含分布式电源(distributed generator,DG)的主动配电网规划场景的降维技术。首先,对主动配电网的中长期规划进行时序模拟,将负荷按不同的类型建立其增长的时序数学模型,在考虑光伏、风电等DG容量自然增长的前提下采用自回归-滑动平均(auto regression-moving average model,ARMA)模型建立时序模型;然后,引入统计学中的变点理论分别建立DG和负荷的时序分区子场景,最后通过综合变点理论对上述时序场景进行融合,分段抽取出典型时序场景。仿真表明,有序聚类可以有效体现不同时间尺度上负荷以及DG的增长运行情况;通过搜寻变点,能将模拟出的近百万个中长期时序场景有序地聚类成14个连续时间场景,大大削减了场景个数,提高了效率。 展开更多
关键词 主动配电网 时序 面板数据 有序聚类 场景降维
在线阅读 下载PDF
基于内容图像检索中的索引技术 被引量:7
13
作者 贺玲 吴玲达 蔡益朝 《计算机应用研究》 CSCD 北大核心 2005年第11期219-221,224,共4页
首先总结了基于内容图像检索中索引技术的研究现状,指出了其中存在的问题以及今后发展趋势,然后提出了一个新的聚类算法和降维算法,并将两者结合起来提出了一个可用于基于内容图像检索的索引机制。
关键词 基于内容图像检索 维度灾难 索引 降维 聚类
在线阅读 下载PDF
基于核函数距离测度的LLE降维及其在离群聚类中的应用 被引量:5
14
作者 徐雪松 张宏 刘凤玉 《仪器仪表学报》 EI CAS CSCD 北大核心 2008年第9期1996-2000,共5页
局部线性嵌入算法(locally linear embedding,LLE)是一种流形降维方法,在高维稀疏数据空间中,针对LLE不适合稀疏采样和欧氏距离公式的缺陷,研究该算法的扩展,引入核函数,并将样本映射到高维特征空间,核映射改善了样本的空间分布,改进的... 局部线性嵌入算法(locally linear embedding,LLE)是一种流形降维方法,在高维稀疏数据空间中,针对LLE不适合稀疏采样和欧氏距离公式的缺陷,研究该算法的扩展,引入核函数,并将样本映射到高维特征空间,核映射改善了样本的空间分布,改进的LLE方法在适当选取近邻点个数情况下,可得到良好的效果。对从高维采样数据中恢复得到低维数据集,通过本文提出的离群数据假设,并结合本文给出的离群聚类方法对所得低维数据是否是离群数据进行判别。仿真文验的结果表明了该方法能够有效地发现高维数据集中的离群点,与此同时,该算法具有参数估计简单、参数影响不大等优点,该算法为离群点检测问题的机器学习提供了一条新的途径。 展开更多
关键词 核函数 维数消减 非线性数据集 离群数据 聚类
在线阅读 下载PDF
基于改进的Affnity Propagation聚类的木材缺陷识别 被引量:4
15
作者 吴东洋 业宁 +1 位作者 徐波 尹佟明 《工程数学学报》 CSCD 北大核心 2012年第4期600-606,共7页
本文提出了一种基于快速Affnity Propagation聚类算法的木材缺陷识别方法.通过提取木材图像的颜色矩特征,建立样本特征集X,以平均平方残基为阈值降低样本特征集X及距离矩阵S的维数,自动识别木材缺陷位置并标记.实验表明,该方法的识别速... 本文提出了一种基于快速Affnity Propagation聚类算法的木材缺陷识别方法.通过提取木材图像的颜色矩特征,建立样本特征集X,以平均平方残基为阈值降低样本特征集X及距离矩阵S的维数,自动识别木材缺陷位置并标记.实验表明,该方法的识别速度较传统的AP算法有明显提高,平均识别时间约为0.557s,平均识别查准率约为70.5%,平均识别查全率约为95.6%. 展开更多
关键词 Affnity Propagation聚类 木材缺陷 自动识别 降维
在线阅读 下载PDF
基于流形学习的聚类方法在基因芯片表达谱分析中的应用 被引量:5
16
作者 黄伟 刘战民 +1 位作者 薛丹 尹京苑 《中国生物医学工程学报》 CAS CSCD 北大核心 2010年第1期77-85,共9页
对基因芯片表达谱的聚类分析有助于发现共表达的基因,而共表达的特性往往是共调控基因所拥有的性质。因此,对基因表达谱的准确聚类将有利于更加准确地发现基因之间的调控关系。本研究使用机器学习中的等度规映射、局部线性嵌入、拉普拉... 对基因芯片表达谱的聚类分析有助于发现共表达的基因,而共表达的特性往往是共调控基因所拥有的性质。因此,对基因表达谱的准确聚类将有利于更加准确地发现基因之间的调控关系。本研究使用机器学习中的等度规映射、局部线性嵌入、拉普拉斯特征根映射等流形学习方法处理基因表达谱数据,得到非线性降维后的数据。在此基础上应用K均值聚类、模糊聚类、自组织映射神经网络等聚类方法,根据给定的阈值,从酵母基因表达数据的382个聚类结果中得到了117个共表达基因对,而从人类血清组织细胞的基因表达数据的132个聚类结果中得到了89个共表达基因对。使用的判别准则表明,基于流形学习的聚类方法与以往的方法相当,且能够被用以发现高维基因芯片表达数据中的低维的流形结构。 展开更多
关键词 非线性降维 流形学习 聚类分析 基因芯片
在线阅读 下载PDF
基于LDA模型和T-OPTICS算法的中文新闻话题检测 被引量:3
17
作者 李琮 袁方 +1 位作者 刘宇 李欣雨 《河北大学学报(自然科学版)》 CAS 北大核心 2016年第1期106-112,共7页
给出了一种针对大量新闻数据的话题检测方法.首先通过LDA(latent dirichlet allocation)模型从语义层面抽取新闻数据主题,有效降低数据分析维度,更合理地体现新闻主题特征.然后改进OPTICS(ordering point to identify the cluster struc... 给出了一种针对大量新闻数据的话题检测方法.首先通过LDA(latent dirichlet allocation)模型从语义层面抽取新闻数据主题,有效降低数据分析维度,更合理地体现新闻主题特征.然后改进OPTICS(ordering point to identify the cluster structure)密度聚类算法,基于新闻话题的时间延续性给出了T-OPTICS算法.该算法继承了OPTICS算法对参数不敏感的特性,降低了参数选择对聚类结果的影响.改进了OPTICS算法中文本间相似度的计算方法,体现了话题的时间延续性.基于TDT4数据集的实验表明,该方法能够快速有效地发现新闻中的话题. 展开更多
关键词 LDA模型 T-OPTICS 聚类 降维
在线阅读 下载PDF
结合用户聚类和评分偏好的推荐算法 被引量:8
18
作者 高茂庭 段元波 《计算机应用研究》 CSCD 北大核心 2018年第8期2260-2264,共5页
针对推荐算法中用户评分矩阵维度高、计算量大的问题,为更加真实地反映用户本身评分偏好,提出一种结合用户聚类和评分偏好的推荐算法。先利用PCA降维和K-means聚类对用户评分矩阵进行预处理,在最近邻选取方法上,添加用户共同评分数量作... 针对推荐算法中用户评分矩阵维度高、计算量大的问题,为更加真实地反映用户本身评分偏好,提出一种结合用户聚类和评分偏好的推荐算法。先利用PCA降维和K-means聚类对用户评分矩阵进行预处理,在最近邻选取方法上,添加用户共同评分数量作为约束,利用用户和相似簇的相似度对相似簇内评分加权求和生成基本预测评分;再综合用户评分偏置和用户项目类型偏好,建立用户评分偏好模型;最后通过多元线性回归确定每部分的权重,生成最终的预测评分。对比实验结果表明,新算法能更真实地反映用户评分,有效减少计算量并提高推荐系统的预测准确率,更好地满足用户对于推荐系统的个性化需求。 展开更多
关键词 协同过滤 降维 聚类 用户偏好 推荐系统
在线阅读 下载PDF
在高维数据上的近邻传播聚类降维研究 被引量:6
19
作者 李界家 郭鹏程 韩忠华 《控制工程》 CSCD 北大核心 2016年第9期1418-1422,共5页
为了使近邻传播(AP)聚类在高维空间中获得更好的聚类效果,该文提出一种基于谱分析的近邻传播聚类方法(Affinity Propagation based on Spectrum analyze,AP-SA)。首先,通过采用谱分析技术将分布在高维非线性的数据点集映射到几乎线性的... 为了使近邻传播(AP)聚类在高维空间中获得更好的聚类效果,该文提出一种基于谱分析的近邻传播聚类方法(Affinity Propagation based on Spectrum analyze,AP-SA)。首先,通过采用谱分析技术将分布在高维非线性的数据点集映射到几乎线性的子空间上,映射过程实现高维数据降至低维。最后,通过AP聚类算法对映射在低维空间上的数据进行聚类,从而提高了AP算法在高维空间上的聚类性能。仿真实验结果表明,该方法相比于传统AP算法,在低维数据中无明显的优势,但随着实验的数据集的样本规模与维数的增加,在高维数据中的该方法降低了聚类时间的同时,也保证了较好的聚类效果。 展开更多
关键词 数据聚类 高维空间 降维 近邻传播聚类 谱分析
在线阅读 下载PDF
采用云计算的数据挖掘技术可视化教学与实验方案 被引量:10
20
作者 史虹 邓红霞 曹晓叶 《实验室研究与探索》 CAS 北大核心 2021年第1期115-119,125,共6页
针对数据挖掘技术较为抽象并且难以理解等问题,设计了数据挖掘课程的教学与实验方案。方案包含了数据分类、聚类、降维以及关联规则等数据挖掘子技术。将传感器、互联网、社交媒体等不同类型的数据作为实验数据集,采用云计算技术提高计... 针对数据挖掘技术较为抽象并且难以理解等问题,设计了数据挖掘课程的教学与实验方案。方案包含了数据分类、聚类、降维以及关联规则等数据挖掘子技术。将传感器、互联网、社交媒体等不同类型的数据作为实验数据集,采用云计算技术提高计算与存储的效果,提高教学与实验的效率。设计了图形交互界面,能够以图形形式与表格输出数据分类、聚类、降维以及关联规则的结果,提高数据挖掘技术的可理解性。数据挖掘的实验结果表明,本方案能够准确生成数据挖掘技术的散列图,可直观地观察数据挖掘的工作流程。 展开更多
关键词 云计算 大数据 数据挖掘 课程改革 数据聚类 数据降维 关联规则
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部