期刊文献+
共找到281篇文章
< 1 2 15 >
每页显示 20 50 100
基于一种多分类半监督学习算法的驾驶风格分类模型 被引量:13
1
作者 李明俊 张正豪 +2 位作者 宋晓琳 曹昊天 易滨林 《湖南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2020年第4期10-15,共6页
基于驾驶模拟平台设计实验方案,同步采集驾驶员的驾驶操作信息和车辆状态信息,选取6个表征驾驶风格的特征参数,采用主成分分析(Principal Component Analysis,PCA)算法对多元特征参数进行特征提取,将前3个主成分作为驾驶风格识别模型的... 基于驾驶模拟平台设计实验方案,同步采集驾驶员的驾驶操作信息和车辆状态信息,选取6个表征驾驶风格的特征参数,采用主成分分析(Principal Component Analysis,PCA)算法对多元特征参数进行特征提取,将前3个主成分作为驾驶风格识别模型的特征输入.利用K-means聚类完成样本标记工作.基于有监督支持向量机(Support Vector Machine,SVM)与多分类半监督学习算法(i MLCU)的原理,分别建立SVM与i MLCU驾驶风格识别模型,通过调节标记样本与未标记样本比例,对比使用不同样本比例训练的SVM和i MLCU模型的驾驶风格识别准确率.结果表明:相比于SVM,i MLCU表现出了更优异的驾驶风格识别能力,由此可知半监督i MLCU模型可以利用未标记样本提高模型对驾驶风格的识别能力. 展开更多
关键词 驾驶风格 主成 K-MEANS聚 支持向量机 多分类半监督学习算法
在线阅读 下载PDF
基于类内区域动态解耦的半监督肺气管分割
2
作者 汪子宇 曹维维 +4 位作者 曹玉柱 刘猛 陈俊 刘兆邦 郑健 《图学学报》 北大核心 2025年第4期763-774,共12页
从计算机断层扫描(CT)图像中精确分割肺气管是诊断和治疗各类肺部疾病的重要前提,但气管复杂的树状结构使得获取用于深度神经网络训练的像素级标注数据极为困难。半监督学习为在有限标注数据下的气管分割提供了新的思路。然而,在气道分... 从计算机断层扫描(CT)图像中精确分割肺气管是诊断和治疗各类肺部疾病的重要前提,但气管复杂的树状结构使得获取用于深度神经网络训练的像素级标注数据极为困难。半监督学习为在有限标注数据下的气管分割提供了新的思路。然而,在气道分割任务中,大气管(气管及其主分支)和小气管(外周细支气管)在体素数量、分支数量和形态结构等方面存在显著的类内差异。严重的类内不平衡问题导致模型易在半监督学习中对占主导地位的分割类别发生过拟合,从而对外周细支气管的表征学习不足、分割精度差,限制了临床应用。针对这一问题,提出了一种新颖的基于单教师双学生三分支网络的半监督肺气管分割框架,在有限的标注数据下实现气管树状结构的精准分割。同时,设计了一个即插即用的动态阈值模块,在网络迭代训练的过程中引导网络识别具有不同分割难度的子区域。此外,还提出了一种新颖的类内区域解耦策略,通过采取不同约束优化方式对不同分割难度的子区域进行表征学习。在2个公开数据集和一个私有数据集上的实验结果表明,该方法在气管分割上优于现有最先进方法,Dice相似系数(DSC)指标达到了91.96%,气管中心线长度(TD)和气管树分支(BD)指标分别达到81.88%和78.32%,实现了CT图像中肺气管快速精准分割。 展开更多
关键词 深度学习 气管 监督学习 内解耦 动态阈值
在线阅读 下载PDF
基于水波传播特性的半监督密度聚类算法
3
作者 冯彦超 王杰 +2 位作者 栗雅婷 蔡江辉 杨海峰 《计算机应用研究》 北大核心 2025年第8期2329-2334,共6页
半监督密度聚类通过融合监督信息与密度特征优化聚类性能,但在数据分布不均时,传统半监督密度聚类算法常因全局密度阈值设定与约束信息利用不足,难以捕捉局部密度差异,导致稀疏区域簇识别能力受限。针对这一挑战,提出了一种基于水波传... 半监督密度聚类通过融合监督信息与密度特征优化聚类性能,但在数据分布不均时,传统半监督密度聚类算法常因全局密度阈值设定与约束信息利用不足,难以捕捉局部密度差异,导致稀疏区域簇识别能力受限。针对这一挑战,提出了一种基于水波传播特性的半监督密度聚类算法(SDR)。受水波“波心恒定”和“振幅衰减”特性的启发,SDR模拟簇心稳定性及密度从中心向边界递减的趋势,通过局部密度差异识别初始子簇。进一步利用邻居影响力分配剩余点,并结合标签附着度动态合并子簇。在5个合成数据集和7个真实数据集上的实验结果证实了SDR算法在稀疏区域聚类任务中的有效性。 展开更多
关键词 监督学习 密度聚 水波传播 约束优化
在线阅读 下载PDF
类别条件噪声下的半监督AUC优化理论与算法
4
作者 姜阳邦彦 许倩倩 +3 位作者 杨智勇 郝前秀 操晓春 黄庆明 《计算机学报》 北大核心 2025年第1期136-155,共20页
现有半监督AUC优化方法通常假设数据标注是准确的。然而在许多实际应用中,研究者往往会同时面临标注量不足和不准确的问题。为此,该文首次尝试在不完整和不准确的数据标注情况下优化AUC指标。具体而言,通过分析,对称替代损失在某些情况... 现有半监督AUC优化方法通常假设数据标注是准确的。然而在许多实际应用中,研究者往往会同时面临标注量不足和不准确的问题。为此,该文首次尝试在不完整和不准确的数据标注情况下优化AUC指标。具体而言,通过分析,对称替代损失在某些情况下可以在半监督问题中具有噪声鲁棒性。在此基础上,该文构建了一个鲁棒半监督AUC优化框架,其导出的经验风险无需估计噪声率。此外,通过紧致泛化上界的分析表明,当模型基于足够大的训练数据集进行学习时,其在未见数据上能够很好地泛化。随后,使用Barrier hinge损失对该框架进行实例化。为加快训练过程,进一步开发了一种加速算法,将损失和梯度估计的复杂度从O(n^(2))降低至O(nlogn),在实验中可获得高达200倍的加速。最后,通过在15个基准数据集上进行实验验证,证明了所提方法的有效性。 展开更多
关键词 监督学习 AUC优化 标签噪声 问题 不平衡数据学习
在线阅读 下载PDF
面向类不平衡和重叠的工控数据异常检测的半监督欠采样方法 被引量:1
5
作者 顾兆军 扬雪影 +1 位作者 隋翯 张一诺 《计算机应用研究》 北大核心 2025年第1期156-164,共9页
工业控制系统异常检测面临着数据缺乏标签信息、类不平衡和类重叠的耦合问题,导致现有的分类器难以精准检测异常数据。现有的数据级采样方法在打伪标签、数据平衡或检测重叠区域时存在着打伪标签结果不准确、采样效果稳定性差以及重叠... 工业控制系统异常检测面临着数据缺乏标签信息、类不平衡和类重叠的耦合问题,导致现有的分类器难以精准检测异常数据。现有的数据级采样方法在打伪标签、数据平衡或检测重叠区域时存在着打伪标签结果不准确、采样效果稳定性差以及重叠识别率低等问题。为此,提出一种基于半监督学习的欠采样方法(SSLU-LP)。该方法通过异构集成将标签传播机制和单类分类器结合,补充数据伪标签;利用最小生成树策略构建重叠区域检测模型;采用欠采样策略,通过最近邻搜索有选择性地去除部分多数类样本。最后该方法与四种经典分类器结合,在九个工控数据集上与九种混合算法进行比较。实验结果表明,所提方法可以精准地为无标签数据打伪标签,高效且有效检测出不平衡数据集中的重叠数据,改善了分类器的训练效果,提高了分类器的异常检测性能。 展开更多
关键词 工业控制系统 不平衡 重叠 监督学习 异常检测
在线阅读 下载PDF
一种基于EM和分类损失的半监督主动DBN学习算法 被引量:2
6
作者 赵悦 穆志纯 +1 位作者 李霞丽 潘秀琴 《小型微型计算机系统》 CSCD 北大核心 2007年第4期656-660,共5页
对于建立动态贝叶斯网络(DBN)分类模型时,带有类标注样本数据集获得困难的问题,提出一种基于EM和分类损失的半监督主动DBN学习算法.半监督学习中的EM算法可以有效利用未标注样本数据来学习DBN分类模型,但是由于迭代过程中易于加入错误... 对于建立动态贝叶斯网络(DBN)分类模型时,带有类标注样本数据集获得困难的问题,提出一种基于EM和分类损失的半监督主动DBN学习算法.半监督学习中的EM算法可以有效利用未标注样本数据来学习DBN分类模型,但是由于迭代过程中易于加入错误的样本分类信息而影响模型的准确性.基于分类损失的主动学习借鉴到EM学习中,可以自主选择有用的未标注样本来请求用户标注,当把这些样本加入训练集后能够最大程度减少模型对未标注样本分类的不确定性.实验表明,该算法能够显著提高DBN学习器的效率和性能,并快速收敛于预定的分类精度. 展开更多
关键词 动态贝叶斯网络 监督学习 主动学习 EM算法
在线阅读 下载PDF
约束传播自适应半监督非负矩阵分解聚类算法
7
作者 朱拓基 林浩申 +2 位作者 赵伟豪 王靖 杨晓君 《计算机工程与应用》 CSCD 北大核心 2024年第13期81-91,共11页
对称非负矩阵分解(SNMF)能够自然地捕获图表示中嵌入的聚类结构,是线性和非线性数据聚类应用的重要方法。但其对变量的初始化较敏感,初始化矩阵的质量好坏会较大地影响聚类性能,且在半监督聚类中面临着从有限的标记数据中学习更具辨别... 对称非负矩阵分解(SNMF)能够自然地捕获图表示中嵌入的聚类结构,是线性和非线性数据聚类应用的重要方法。但其对变量的初始化较敏感,初始化矩阵的质量好坏会较大地影响聚类性能,且在半监督聚类中面临着从有限的标记数据中学习更具辨别力表示的挑战。针对以上问题,提出了一种约束传播自适应半监督非负矩阵分解聚类算法(constrained propagation self-adaptived semi-supervised non-negative matrix factorization clustering algorithm,CPS3NMF)。该算法将有限约束传播到无约束数据点,构建出带有约束信息的相似矩阵,所获得的相似矩阵充当SNMF中分解的非负对称矩阵,还用于对分配矩阵进行图正则化,充分利用约束信息来保存数据空间的几何结构。同时结合SNMF对初始化特征的敏感性,使用自适应学习的权重对多个初始化矩阵的质量进行排序,集成多次聚类结果来逐步提高半监督聚类性能。在6个公开数据集上进行实验表明所提出的CPS3NMF算法优于其他先进算法,证明了其在半监督聚类中的有效性。 展开更多
关键词 对称非负矩阵 监督学习 约束传播
在线阅读 下载PDF
非独立同分布下联邦半监督学习的数据分享研究 被引量:1
8
作者 顾永跟 高凌轩 +1 位作者 吴小红 陶杰 《计算机工程》 CAS CSCD 北大核心 2024年第6期188-196,共9页
联邦学习作为一种保护本地数据隐私安全的分布式机器学习方法,联合分散的设备共同训练共享模型。通常联邦学习在数据均有标签情况下进行训练,然而现实中无法保证标签数据完全存在,提出联邦半监督学习。在联邦半监督学习中,如何利用无标... 联邦学习作为一种保护本地数据隐私安全的分布式机器学习方法,联合分散的设备共同训练共享模型。通常联邦学习在数据均有标签情况下进行训练,然而现实中无法保证标签数据完全存在,提出联邦半监督学习。在联邦半监督学习中,如何利用无标签数据提升系统性能和如何缓解数据异质性带来的负面影响是两大挑战。针对标签数据仅在服务器场景,基于分享的思想,设计一种可应用在联邦半监督学习系统上的方法Share&Mark,该方法将客户端的分享数据由专家标记后参与联邦训练。同时,为充分利用分享的数据,根据各客户端模型在服务器数据集上的损失值动态调整各客户端模型在联邦聚合时的占比,即ServerLoss聚合算法。综合考虑隐私牺牲、通信开销以及人工标注成本3个方面的因素,对不同分享率下的实验结果进行分析,结果表明,约3%的数据分享比例能平衡各方面因素。此时,采用Share&Mark方法的联邦半监督学习系统FedMatch在CIFAR-10和Fashion-MNIST数据集上训练的模型准确率均可提升8%以上,并具有较优的鲁棒性。 展开更多
关键词 联邦监督学习 联邦学习 数据非独立同 鲁棒性 聚合算法 数据
在线阅读 下载PDF
基于半监督学习的煤层钻孔预抽瓦斯状态评价方法
9
作者 晏立 文虎 +1 位作者 王振平 金永飞 《工矿自动化》 北大核心 2025年第3期113-121,共9页
目前单一钻孔抽采状态评价方法通常依赖于瓦斯抽采浓度,而忽视了煤层瓦斯赋存的多样性。监督学习模型依赖于样本的特征标记,在样本量较大时,人工标注的成本较高;无监督学习模型缺乏样本标记,无法实现定性评价。针对上述问题,提出一种基... 目前单一钻孔抽采状态评价方法通常依赖于瓦斯抽采浓度,而忽视了煤层瓦斯赋存的多样性。监督学习模型依赖于样本的特征标记,在样本量较大时,人工标注的成本较高;无监督学习模型缺乏样本标记,无法实现定性评价。针对上述问题,提出一种基于半监督学习的煤层钻孔预抽瓦斯状态评价方法。构建了包含甲烷浓度、抽采负压、环境温度等8项指标的多维度评价体系,采用层次分析法(AHP)与模糊评价法(FEM)结合的权重赋值方法,建立抽采效果等级划分标准。在此基础上,提出基于高斯混合模型(GMM)与K-Means算法的半监督学习模型(SSGMM/SSK-Means),通过融合少量人工标注样本与大量未标注数据,实现单一钻孔抽采状态的动态分类。SSGMM聚集度更好,SSK-Means效率更高,形成“精度-效率”的互补关系。在陕西黄陵二号煤矿215工作面的应用结果表明:SSGMM和SSK-Means的最大聚集度(MVCR)和修正Rand指数(ARI)分别达82.64%和85.83%,显著优于传统聚类方法;通过动态反馈机制优化后,原等级为“差”的钻孔抽采效率提升5.26%~5.80%,补差率达100%。 展开更多
关键词 煤层瓦斯 抽采效果评价 监督学习 层次析法 模糊评价法 高斯混合模型 K-MEANS算法
在线阅读 下载PDF
基于相关熵的多视角低秩矩阵分解和多视角数据聚类中的约束图学习
10
作者 杜元花 陈盼 +3 位作者 周楠 施开波 陈二阳 张远鹏 《计算机科学》 北大核心 2025年第S1期714-723,共10页
目前大多数的多视角聚类方法都集中在无监督的学习场景上,它们不能利用数据中的标签信息。此外,它们还无法处理可能存在于数据中的异常值。为了解决这些问题,提出了一种基于相关熵的多视角低秩矩阵分解(CMLMF)的多视角数据半监督聚类方... 目前大多数的多视角聚类方法都集中在无监督的学习场景上,它们不能利用数据中的标签信息。此外,它们还无法处理可能存在于数据中的异常值。为了解决这些问题,提出了一种基于相关熵的多视角低秩矩阵分解(CMLMF)的多视角数据半监督聚类方法。具体来说,采用一个约束矩阵引入标签信息,通过最大化相关熵准则来消除亲和矩阵和标签中异常值的影响。为了充分利用局部结构信息,还提出了一种基于相关熵的多视角约束图学习框架,自适应地提取隐藏在多视角数据中的局部结构。此外,提出了一种基于相关熵的多视角低秩矩阵分解(CMLMF)模型,该模型与自适应图学习框架相结合,以提取数据的全局重构信息。最后,设计了一种结合芬切尔共轭(FC)和块坐标更新(BCU)的有效优化算法来求解该模型。实验结果表明,与现有方法相比,CMLMF的准确性(ACC)、归一化互信息(NMI)和精度(Precision)有了很大的提高,其有效性得到验证。 展开更多
关键词 低秩矩阵 监督学习(SSL) 多视角聚 最大相关熵准则(MCC)
在线阅读 下载PDF
基于主动学习的图半监督分类算法 被引量:1
11
作者 高成 陈秀新 +1 位作者 于重重 刘宇 《计算机工程与设计》 北大核心 2015年第7期1871-1875,共5页
为抑制噪声数据对分类结果的影响,将噪声处理算法与高斯随机域算法相结合,提出一种带噪声系数的高斯随机域学习算法;针对样本集不平衡性数据分类问题,考虑主动学习在样本不平衡问题中的应用,将主动学习与图半监督算法相结合,提出一种鲁... 为抑制噪声数据对分类结果的影响,将噪声处理算法与高斯随机域算法相结合,提出一种带噪声系数的高斯随机域学习算法;针对样本集不平衡性数据分类问题,考虑主动学习在样本不平衡问题中的应用,将主动学习与图半监督算法相结合,提出一种鲁棒性强的主动学习图半监督分类算法。利用基于样本划分的主动学习方法,对正类的近邻样本集中样本与特定类样本形成的新样本集做总体散度排序,筛选出能使新样本集中总体散度最小的样本,代替正类的近邻样本集中所有样本,形成平衡类。在UCI标准数据集上的实验结果表明,与标准的图半监督算法相比,该算法的分类精度更高、泛化能力更强。 展开更多
关键词 带噪声系数的高斯随机域学习算法 样本不平衡问题 主动学习 监督算法 主动学习监督算法
在线阅读 下载PDF
基于深度聚类学习的无监督行人重识别
12
作者 邓子文 段勇 《电子测量与仪器学报》 北大核心 2025年第3期208-216,共9页
无监督行人重识别是一种在没有任何标签的情况下,通过特征提取和聚类算法对行人进行识别和匹配的计算机视觉方法。针对当前无监督行人重识别方法普遍存在的特征提取不足、聚类不准确、计算复杂度高以及模型缺乏鲁棒性等问题,提出了一种... 无监督行人重识别是一种在没有任何标签的情况下,通过特征提取和聚类算法对行人进行识别和匹配的计算机视觉方法。针对当前无监督行人重识别方法普遍存在的特征提取不足、聚类不准确、计算复杂度高以及模型缺乏鲁棒性等问题,提出了一种基于深度聚类学习的无监督行人重识别方法。首先,研究了结合GeM池化方法的实例批量归一化网络(IBN-Net)作为特征提取网络,使得提取出的行人特征更具判别性;其次,针对聚类算法对于超参数较为敏感的问题,提出通过有序点识别聚类结构(OPTICS)辅助基于密度的聚类算法(DBSCAN)选取超参数,进一步降低了DBSCAN对超参数的敏感度;此外,为了更加充分利用训练集的所有数据,将离群值也视为单独的聚类参与到记忆字典的初始化与更新过程中;最后,针对记忆字典更新过程中各个聚类更新速率不一致的问题,提出了聚类级别的记忆字典,消除了聚类更新速率不一致的问题。实验结果验证了研究工作的有效性,提出的方法在无监督行人重识别任务中的精度与准确度均有明显的提升。 展开更多
关键词 行人重识别 监督学习 对比学习 深度学习 算法
在线阅读 下载PDF
基于主动学习的深度半监督聚类模型 被引量:2
13
作者 付艳艳 黄瑞章 +3 位作者 薛菁菁 任丽娜 陈艳平 林川 《计算机应用研究》 CSCD 北大核心 2024年第10期2955-2961,共7页
深度半监督聚类旨在利用少量的监督信息达到更好的聚类效果。然而,由于标注成本昂贵,监督信息的数量往往是有限的。因此,在监督信息有限的情况下,如何选择对聚类最有价值的监督信息变得至关重要。针对以上问题,提出了基于主动学习的深... 深度半监督聚类旨在利用少量的监督信息达到更好的聚类效果。然而,由于标注成本昂贵,监督信息的数量往往是有限的。因此,在监督信息有限的情况下,如何选择对聚类最有价值的监督信息变得至关重要。针对以上问题,提出了基于主动学习的深度半监督聚类模型(DASCM)。该模型设计了一种主动学习方法,能够挑选出蕴涵丰富信息的边缘文本,并进一步生成蕴涵边缘文本的高价值监督信息。该模型利用这些监督信息指导聚类,从而提升聚类性能。在5个真实文本数据集上的实验表明,DASCM的聚类性能有显著提升。这一结果验证了利用主动学习方法生成的涵盖边缘文本的监督信息对于提升聚类效果是有效的。 展开更多
关键词 深度监督 主动学习 边缘文本
在线阅读 下载PDF
一种结合主动学习的半监督文档聚类算法 被引量:30
14
作者 赵卫中 马慧芳 +1 位作者 李志清 史忠植 《软件学报》 EI CSCD 北大核心 2012年第6期1486-1499,共14页
半监督文档聚类,即利用少量具有监督信息的数据来辅助无监督文档聚类,近几年来逐渐成为机器学习和数据挖掘领域研究的热点问题.由于获取大量监督信息费时费力,因此,国内外学者考虑如何获得少量但对聚类性能提高显著的监督信息.提出一种... 半监督文档聚类,即利用少量具有监督信息的数据来辅助无监督文档聚类,近几年来逐渐成为机器学习和数据挖掘领域研究的热点问题.由于获取大量监督信息费时费力,因此,国内外学者考虑如何获得少量但对聚类性能提高显著的监督信息.提出一种结合主动学习的半监督文档聚类算法,通过引入成对约束信息指导DBSCAN的聚类过程来提高聚类性能,得到一种半监督文档聚类算法Cons-DBSCAN.通过对约束集中所含信息量的衡量和对DBSCAN算法本身的分析,提出了一种启发式的主动学习算法,能够选取含信息量大的成对约束集,从而能够更高效地辅助半监督文档聚类.实验结果表明,所提出的算法能够高效地进行文档聚类.通过主动学习算法获得的成对约束集,能够显著地提高聚类性能.并且,算法的性能优于两个代表性的结合主动学习的半监督聚类算法. 展开更多
关键词 监督 文档聚 主动学习 成对约束
在线阅读 下载PDF
一种分层组合的半监督近邻传播聚类算法 被引量:15
15
作者 张震 汪斌强 +1 位作者 伊鹏 兰巨龙 《电子与信息学报》 EI CSCD 北大核心 2013年第3期645-651,共7页
针对近邻传播(AP)聚类算法的计算复杂度和准确性,该文提出一种分层组合的半监督近邻传播聚类算法(SAP-SC)。算法引入"分层聚类"的思想,将一次AP聚类过程等分成若干层聚类,使得处理过程简单、易于实现;每层只关注聚类"困... 针对近邻传播(AP)聚类算法的计算复杂度和准确性,该文提出一种分层组合的半监督近邻传播聚类算法(SAP-SC)。算法引入"分层聚类"的思想,将一次AP聚类过程等分成若干层聚类,使得处理过程简单、易于实现;每层只关注聚类"困难"的数据点,并通过构造"成对点约束"和使用"子簇标签映射"进行半监督学习;基于"组合提升"的方法将各层聚类结果加权叠加,从而提升了算法的准确性能。理论分析和实验结果表明:算法在聚类准确性和计算复杂度方面有了较大改进。 展开更多
关键词 监督学习 近邻传播聚 层聚 组合提升
在线阅读 下载PDF
基于自训练EM算法的半监督文本分类 被引量:17
16
作者 张博锋 白冰 苏金树 《国防科技大学学报》 EI CAS CSCD 北大核心 2007年第6期65-69,共5页
为了提高计算效率,提出基于自训练的改进EM算法STEM。在每步迭代的E-step中,将中间分类器最有把握对其类别进行预测的未标注样本转移至标注样本集,并应用到M-step中进行下一个中间分类器的训练,从而引入了利用中间结果的自训练机制。文... 为了提高计算效率,提出基于自训练的改进EM算法STEM。在每步迭代的E-step中,将中间分类器最有把握对其类别进行预测的未标注样本转移至标注样本集,并应用到M-step中进行下一个中间分类器的训练,从而引入了利用中间结果的自训练机制。文本分类实验表明STEM算法在大部分情况下的分类准确性都高于EM,并通过减少迭代提高了分类器学习的计算效率。 展开更多
关键词 监督学习 EM算法 自训练 文本 NAIVE BAYES
在线阅读 下载PDF
基于近邻传播学习的半监督流量分类方法 被引量:14
17
作者 张震 汪斌强 +1 位作者 李向涛 黄万伟 《自动化学报》 EI CSCD 北大核心 2013年第7期1100-1109,共10页
准确的流量分类是进行网络管理、安全检测以及应用趋势分析的基础.针对完全监督和无监督分类的缺陷,提出了一种基于近邻传播学习的半监督流量分类方法.通过引入"近邻传播聚类"机制构建分类模型,使得分类器实现过程简单、运行... 准确的流量分类是进行网络管理、安全检测以及应用趋势分析的基础.针对完全监督和无监督分类的缺陷,提出了一种基于近邻传播学习的半监督流量分类方法.通过引入"近邻传播聚类"机制构建分类模型,使得分类器实现过程简单、运行高效.应用"半监督学习"的思想,抽象出少量已标记样本流约束和流形空间先验信息,定义了"流形相似度"的距离测度,既降低了标记流量样本的复杂度,又提高了流量分类器的性能.理论分析和实验结果表明:算法具有较高的分类准确性和较好的凝聚性. 展开更多
关键词 流量 监督学习 近邻传播聚 流形相似度
在线阅读 下载PDF
一种半监督局部线性嵌入算法的文本分类方法 被引量:9
18
作者 夏士雄 李佑文 周勇 《计算机应用研究》 CSCD 北大核心 2010年第1期64-67,共4页
针对局部线性嵌入算法(LLE)应用于非监督机器学习中的缺陷,将该算法与半监督思想相结合,提出了一种基于半监督局部线性嵌入算法的文本分类方法。通过使用文本数据的流形结构和少量的标签样本,将LLE中的距离矩阵采用分段形式进行调整;使... 针对局部线性嵌入算法(LLE)应用于非监督机器学习中的缺陷,将该算法与半监督思想相结合,提出了一种基于半监督局部线性嵌入算法的文本分类方法。通过使用文本数据的流形结构和少量的标签样本,将LLE中的距离矩阵采用分段形式进行调整;使用调整后的矩阵进行线性重建从而实现数据降维;针对半监督LLE中使用欧氏距离的缺点,采用高斯核函数将欧氏距离进行变换,并用新的核距离取代欧氏距离,提出了基于核的半监督局部线性嵌入算法;最后通过仿真实验验证了改进算法的有效性。 展开更多
关键词 局部线性嵌入算法 监督学习 流形学习 文本 核函数
在线阅读 下载PDF
基于分裂层次半监督谱聚类算法的风电场机群划分方法 被引量:18
19
作者 林俐 潘险险 《电力自动化设备》 EI CSCD 北大核心 2015年第2期8-14,共7页
在谱聚类技术的基础上,面向风电场动态等值建模,提出一种基于分裂层次半监督谱聚类算法的风电场机群划分方法。首先根据风电机组的实测运行数据,构造一个可以体现原始数据结构且能为分类提供更多有效信息的特征向量矩阵Y。进而利用获取... 在谱聚类技术的基础上,面向风电场动态等值建模,提出一种基于分裂层次半监督谱聚类算法的风电场机群划分方法。首先根据风电机组的实测运行数据,构造一个可以体现原始数据结构且能为分类提供更多有效信息的特征向量矩阵Y。进而利用获取的部分样本组的先验信息,采用自顶向下的簇分裂策略,对Y中的样本组进行半监督聚类划分,得到风电机组的机群划分结果 ,采用容量加权法计算各机群等值风电机组的参数,建立风电场的动态等值模型。以某实际风电场为例进行仿真验证,结果表明,采用所提方法建立的动态等值模型与详细模型较接近,能够较准确地反映风电场的动态响应特性。 展开更多
关键词 裂层次 监督 谱聚 风电场 机群划 算法 动态等值
在线阅读 下载PDF
基于局部聚类与图方法的半监督学习算法 被引量:7
20
作者 李明 杨艳屏 占惠融 《自动化学报》 EI CSCD 北大核心 2010年第12期1655-1660,共6页
基于图的算法已经成为半监督学习中的一种流行方法,该方法把数据定义为图的节点,用图的边表示数据之间的关系,在各种数据分布情况下都具有很高的分类准确度.然而图方法的计算复杂度比较高,当图的规模比较大时,计算所需要的时间和存储都... 基于图的算法已经成为半监督学习中的一种流行方法,该方法把数据定义为图的节点,用图的边表示数据之间的关系,在各种数据分布情况下都具有很高的分类准确度.然而图方法的计算复杂度比较高,当图的规模比较大时,计算所需要的时间和存储都非常大,这在一定程度上限制了图方法的使用.因此,如何控制图的大小是基于图的半监督学习算法中的一个重要问题.本文提出了一种基于密度估计的快速聚类方法,可以在局部范围对数据点进行聚类,以聚类形成的子集作为构图的节点,从而大大降低了图的复杂度.新的聚类方法计算量较小,通过推导得到的距离函数能较好地保持原有数据分布.实验结果表明,通过局部聚类后构建的小图在分类效果上与在原图上的结果相当,同时在计算速度上有极大的提高. 展开更多
关键词 监督学习 图方法 密度估计 局部聚
在线阅读 下载PDF
上一页 1 2 15 下一页 到第
使用帮助 返回顶部