期刊文献+
共找到22篇文章
< 1 2 >
每页显示 20 50 100
Deep plug-and-play self-supervised neural networks for spectral snapshot compressive imaging
1
作者 ZHANG Xing-Yu ZHU Shou-Zheng +4 位作者 ZHOU Tian-Shu QI Hong-Xing WANG Jian-Yu LI Chun-Lai LIU Shi-Jie 《红外与毫米波学报》 CSCD 北大核心 2024年第6期846-857,共12页
The encoding aperture snapshot spectral imaging system,based on the compressive sensing theory,can be regarded as an encoder,which can efficiently obtain compressed two-dimensional spectral data and then decode it int... The encoding aperture snapshot spectral imaging system,based on the compressive sensing theory,can be regarded as an encoder,which can efficiently obtain compressed two-dimensional spectral data and then decode it into three-dimensional spectral data through deep neural networks.However,training the deep neural net⁃works requires a large amount of clean data that is difficult to obtain.To address the problem of insufficient training data for deep neural networks,a self-supervised hyperspectral denoising neural network based on neighbor⁃hood sampling is proposed.This network is integrated into a deep plug-and-play framework to achieve self-supervised spectral reconstruction.The study also examines the impact of different noise degradation models on the fi⁃nal reconstruction quality.Experimental results demonstrate that the self-supervised learning method enhances the average peak signal-to-noise ratio by 1.18 dB and improves the structural similarity by 0.009 compared with the supervised learning method.Additionally,it achieves better visual reconstruction results. 展开更多
关键词 compressed sensing deep learning self-supervised coded aperture imaging
在线阅读 下载PDF
RVFLN-based online adaptive semi-supervised learning algorithm with application to product quality estimation of industrial processes 被引量:5
2
作者 DAI Wei HU Jin-cheng +2 位作者 CHENG Yu-hu WANG Xue-song CHAI Tian-you 《Journal of Central South University》 SCIE EI CAS CSCD 2019年第12期3338-3350,共13页
Direct online measurement on product quality of industrial processes is difficult to be realized,which leads to a large number of unlabeled samples in modeling data.Therefore,it needs to employ semi-supervised learnin... Direct online measurement on product quality of industrial processes is difficult to be realized,which leads to a large number of unlabeled samples in modeling data.Therefore,it needs to employ semi-supervised learning(SSL)method to establish the soft sensor model of product quality.Considering the slow time-varying characteristic of industrial processes,the model parameters should be updated smoothly.According to this characteristic,this paper proposes an online adaptive semi-supervised learning algorithm based on random vector functional link network(RVFLN),denoted as OAS-RVFLN.By introducing a L2-fusion term that can be seen a weight deviation constraint,the proposed algorithm unifies the offline and online learning,and achieves smoothness of model parameter update.Empirical evaluations both on benchmark testing functions and datasets reveal that the proposed OAS-RVFLN can outperform the conventional methods in learning speed and accuracy.Finally,the OAS-RVFLN is applied to the coal dense medium separation process in coal industry to estimate the ash content of coal product,which further verifies its effectiveness and potential of industrial application. 展开更多
关键词 semi-supervised learning(ssl) L2-fusion term online adaptation random vector functional link network(RVFLN)
在线阅读 下载PDF
基于个性化数据增强的自监督序列推荐算法
3
作者 王帅 史艳翠 《计算机工程》 北大核心 2025年第8期190-202,共13页
序列推荐算法通过对用户的历史行为进行动态建模,以预测其可能感兴趣的内容。聚焦对比式自监督学习(SSL)在序列推荐中的应用,通过设计有效的自监督信号,增强模型在稀疏数据场景下的表征能力。首先,针对随机数据增强易引入数据噪声的问题... 序列推荐算法通过对用户的历史行为进行动态建模,以预测其可能感兴趣的内容。聚焦对比式自监督学习(SSL)在序列推荐中的应用,通过设计有效的自监督信号,增强模型在稀疏数据场景下的表征能力。首先,针对随机数据增强易引入数据噪声的问题,提出融合用户偏好的个性化数据增强方法,通过用户评分引导增强过程,同时对长、短序列使用不同的增强方法组合,生成符合用户偏好的增强序列;其次,为了缓解训练中出现的数据特征学习不平衡问题,设计一种混合增强训练法,在训练前期,通过随机选择增强方法生成增强序列,提高模型的性能和泛化能力,在训练后期,选择与原始序列相似度较高的增强序列,使模型全面学习用户的实际偏好和行为模式;最后,将传统的序列预测目标与SSL目标相结合,推断出用户的表示。在数据集Beauty、Toys和Sports上进行实验验证,结果表明,相较于基线模型中的最优结果,所提方法的HR@5指标分别提升了6.61%、3.11%和3.76%,NDCG@5指标分别提升了11.40%、3.50%和2.16%,上述实验结果验证了该方法的合理性和有效性。 展开更多
关键词 序列推荐 自监督学习 数据增强 推荐系统 数据特征
在线阅读 下载PDF
基于相关熵的多视角低秩矩阵分解和多视角数据聚类中的约束图学习
4
作者 杜元花 陈盼 +3 位作者 周楠 施开波 陈二阳 张远鹏 《计算机科学》 北大核心 2025年第S1期714-723,共10页
目前大多数的多视角聚类方法都集中在无监督的学习场景上,它们不能利用数据中的标签信息。此外,它们还无法处理可能存在于数据中的异常值。为了解决这些问题,提出了一种基于相关熵的多视角低秩矩阵分解(CMLMF)的多视角数据半监督聚类方... 目前大多数的多视角聚类方法都集中在无监督的学习场景上,它们不能利用数据中的标签信息。此外,它们还无法处理可能存在于数据中的异常值。为了解决这些问题,提出了一种基于相关熵的多视角低秩矩阵分解(CMLMF)的多视角数据半监督聚类方法。具体来说,采用一个约束矩阵引入标签信息,通过最大化相关熵准则来消除亲和矩阵和标签中异常值的影响。为了充分利用局部结构信息,还提出了一种基于相关熵的多视角约束图学习框架,自适应地提取隐藏在多视角数据中的局部结构。此外,提出了一种基于相关熵的多视角低秩矩阵分解(CMLMF)模型,该模型与自适应图学习框架相结合,以提取数据的全局重构信息。最后,设计了一种结合芬切尔共轭(FC)和块坐标更新(BCU)的有效优化算法来求解该模型。实验结果表明,与现有方法相比,CMLMF的准确性(ACC)、归一化互信息(NMI)和精度(Precision)有了很大的提高,其有效性得到验证。 展开更多
关键词 低秩矩阵分解 半监督学习(ssl) 多视角聚类 最大相关熵准则(MCC)
在线阅读 下载PDF
基于联合自监督学习的多模态融合推荐算法
5
作者 吴宗航 张东 李冠宇 《计算机应用》 北大核心 2025年第6期1858-1868,共11页
针对多模态推荐算法的数据稀疏性问题,以及现有的自监督学习(SSL)算法往往集中在对数据集中单一特征的SSL上,而忽视了多特征联合学习的可能性的问题,提出一种基于联合SSL的多模态融合推荐算法SFELMMR(SelF supErvised Learning for Mult... 针对多模态推荐算法的数据稀疏性问题,以及现有的自监督学习(SSL)算法往往集中在对数据集中单一特征的SSL上,而忽视了多特征联合学习的可能性的问题,提出一种基于联合SSL的多模态融合推荐算法SFELMMR(SelF supErvised Learning for MultiModal Recommendation)。首先,整合并优化现有的SSL策略,以通过联合学习不同模态的数据特征,显著增强数据的表示能力,从而缓解数据稀疏性的问题;其次,通过融合全局视角下的深层次项目关系和局部视角下的直接相互作用,设计一种构造多模态潜在语义图的方法,使算法能更精准地捕捉项目间的复杂联系;最后,在3个数据集上进行实验。结果表明,与现有算法中表现最佳的多模态推荐算法相比,所提算法在多个推荐性能指标上取得了显著提升。具体地,所提算法的Recall@10分别提升了5.49%、2.56%、2.99%,NDCG@10分别提升了1.17%、1.98%、3.52%,Precision@10分别提升了4.69%、2.74%、1.22%,Map@10分别提升了0.81%、1.59%、3.11%。此外,通过对所提算法进行消融实验,验证了该算法的有效性。 展开更多
关键词 推荐系统 多模态 自监督学习 图卷积神经网络 特征融合
在线阅读 下载PDF
融合扩增技术的无监督域适应方法
6
作者 曹艺 郭茂祖 吴伟宁 《软件学报》 北大核心 2025年第7期3253-3270,共18页
域适应(domain adaptation,DA)是一类训练集(源域)和测试集(目标域)数据分布不一致条件下的机器学习任务.其核心在于如何克服数据域的分布差异对分类器泛化能力的负面影响,即设计合理而有效的训练策略,通过最小化数据域之间的差异,获得... 域适应(domain adaptation,DA)是一类训练集(源域)和测试集(目标域)数据分布不一致条件下的机器学习任务.其核心在于如何克服数据域的分布差异对分类器泛化能力的负面影响,即设计合理而有效的训练策略,通过最小化数据域之间的差异,获得高泛化能力的分类模型.研究了源域中包含标注信息,目标域中缺少标注信息条件下的无监督域适应(unsupervised domain adaptation,UDA)任务.将其形式化为如何利用部分标注样本和其余未标注样本进行分类器训练的半监督学习问题,进而引入伪标签(pseudo label,PL)和一致性正则化(consistent regularization,CR)这两种半监督学习技术,对所观测数据域有目的进行标记和样本扩增,使用扩增后的训练样本学习分类器,从而,在无监督域适应任务上取得了良好的泛化能力.提出一种融合扩增技术的无监督域适应(augmentation-based unsupervised domain adaptation,A-UDA)方法,在分类器的训练过程中:首先,使用随机数据增强技术(random augmentation)对目标域中的未标注样本进行扩增,即样本扩增;其次,利用模型的预测输出结果,对高置信度的未标注样本添加伪标记,即标注扩增;最后,使用扩增后的数据集训练分类模型,利用最大均值差异(maximum mean difference,MMD)计算源域和目标域的分布距离,通过最小化该分布距离获得具有高泛化能力的分类器.在MNIST-USPS,Office-Home和ImageCLEF-DA等多个无监督域适应任务上对所提出方法进行比较,与现有其他工作相比,获得了更好的分类效果. 展开更多
关键词 无监督域适应 半监督学习 数据扩增 伪标签 一致性正则化
在线阅读 下载PDF
面向SSL VPN加密流量的识别方法 被引量:6
7
作者 王宇航 姜文刚 +1 位作者 翟江涛 史正爽 《计算机工程与应用》 CSCD 北大核心 2022年第1期143-151,共9页
SSLVPN流量常常被一些非法应用利用,来绕过防火墙等安全设施的检测。因此,对SSLVPN加密流量的有效识别对网络信息安全具有重要意义。针对此,提出了一种基于Bit级DPI和深度学习的SSLVPN加密流量识别方法,所提方法分为两个步骤:利用Bit级... SSLVPN流量常常被一些非法应用利用,来绕过防火墙等安全设施的检测。因此,对SSLVPN加密流量的有效识别对网络信息安全具有重要意义。针对此,提出了一种基于Bit级DPI和深度学习的SSLVPN加密流量识别方法,所提方法分为两个步骤:利用Bit级DPI指纹生成技术识别SSL流量,缩小识别范围;再利用基于注意力机制的改进的CNN网络流量识别模型识别SSLVPN流量。该方法不仅有效解决了传统SSL加密流量指纹识别方法存在的漏识别率较高的问题,同时改进后的深度学习模型能提取网络流量中具有非常显著性的细粒度的特征,从而更加有效地捕捉网络流量中存在的依赖性。实验结果表明,该方法较现有的模型对SSLVPN加密流量的识别效果提高了6%以上。 展开更多
关键词 sslVPN 指纹识别 深度学习 注意力机制
在线阅读 下载PDF
一种面向类别不平衡SSL VPN加密流量识别方法 被引量:3
8
作者 王宇航 姜文刚 +3 位作者 翟江涛 王晰晨 戴伟东 张帆 《计算机应用与软件》 北大核心 2023年第12期318-324,349,共8页
传统方法在处理不平衡的海量高维数据时存在特征提取困难、检测率低的问题。对此,提出一种先使用基于遗传染色体理论的数据合成过采样技术(NEDIL)平衡原始数据集,再利用基于注意力机制的双向GRU网络流量识别模型识别SSL VPN流量的方法... 传统方法在处理不平衡的海量高维数据时存在特征提取困难、检测率低的问题。对此,提出一种先使用基于遗传染色体理论的数据合成过采样技术(NEDIL)平衡原始数据集,再利用基于注意力机制的双向GRU网络流量识别模型识别SSL VPN流量的方法。不仅解决了样本不平衡造成的模型拟合问题,同时能够增强关键特征的区分度,解决一般识别模型无法区分时间序列数据重要程度的差异性的问题。对比实验结果表明,该方法在公开的流量数据集上取得了比当前典型方法更好的识别精度,实现了整体高于92%的应用识别准确度。 展开更多
关键词 ssl VPN 不平衡数据集 过采样 深度学习 注意力机制
在线阅读 下载PDF
用于脑卒中病灶分割的具有注意力机制的校正交叉伪监督方法
9
作者 周妍 李阳 《计算机应用》 CSCD 北大核心 2024年第6期1942-1948,共7页
脑部病变的自动分割为脑卒中患者的及时诊治和诊疗方案的制定提供了可靠的依据,但获取大规模标记数据昂贵且耗时。半监督学习(SSL)方法通过利用大量的未标记图像和有限的标记图像缓解这一问题。针对SSL中伪标签存在噪声,以及现有的三维(... 脑部病变的自动分割为脑卒中患者的及时诊治和诊疗方案的制定提供了可靠的依据,但获取大规模标记数据昂贵且耗时。半监督学习(SSL)方法通过利用大量的未标记图像和有限的标记图像缓解这一问题。针对SSL中伪标签存在噪声,以及现有的三维(3D)网络缺乏聚焦较小目标的能力这2个问题,提出一种半监督方法,即用于脑卒中病灶分割的具有注意力机制的校正交叉伪监督方法RPE-CPS(Rectified Cross Pseudo Supervision with Project&Excite modules)。首先,将数据输入2个结构相同但初始化不同的3D U-Net分割网络,将得到的伪分割图用于交叉监督训练分割网络,充分利用伪标签数据扩展训练集,并鼓励不同初始化网络对同一输入图像的预测之间具有较高的相似性;其次,设计一种基于不确定性估计的交叉伪监督方法的校正策略,以降低伪标签中的噪声影响;最后,在3D U-Net分割网络中,为提高小目标类的分割性能,将投影-激发(PE)模块添加至每一个编码器模块、解码器模块和瓶颈模块之后。为验证所提方法的有效性,在合作医院急性缺血性脑卒中(AIS)数据集和缺血性脑卒中病灶分割挑战赛(ISLES2022)数据集上分别进行评估实验。实验结果表明,在仅使用训练集中20%的标记数据时,在公开数据集ISLES2022上Dice相似系数(DSC)、95%豪斯多夫距离(HD95)和平均表面距离(ASD)分别达到了73.87%、6.08 mm和1.31 mm;在AIS数据集上DSC、HD95和ASD分别达到了67.74%、15.38 mm和1.05 mm。与先进的半监督方法不确定性校正金字塔(URPC)相比,DSC分别提升了2.19和3.43个百分点。所提方法可以有效地利用未标记数据提高分割精度,优于其他半监督方法,并具有鲁棒性。 展开更多
关键词 医学影像 脑卒中病灶分割 半监督学习 注意力机制 不确定性估计
在线阅读 下载PDF
引入预训练表示混合矢量量化和CTC的语音转换
10
作者 王琳 黄浩 《计算机工程》 CAS CSCD 北大核心 2024年第4期313-320,共8页
预训练模型通过自监督学习表示在非平行语料语音转换(VC)取得了重大突破。随着自监督预训练表示(SSPR)的广泛使用,预训练模型提取的特征中被证实包含更多的内容信息。提出一种基于SSPR同时结合矢量量化(VQ)和联结时序分类(CTC)的VC模型... 预训练模型通过自监督学习表示在非平行语料语音转换(VC)取得了重大突破。随着自监督预训练表示(SSPR)的广泛使用,预训练模型提取的特征中被证实包含更多的内容信息。提出一种基于SSPR同时结合矢量量化(VQ)和联结时序分类(CTC)的VC模型。将预训练模型提取的SSPR作为端到端模型的输入,用于提高单次语音转换质量。如何有效地解耦内容表示和说话人表示成为语音转换中的关键问题。使用SSPR作为初步的内容信息,采用VQ从语音中解耦内容和说话人表示。然而,仅使用VQ只能将内容信息离散化,很难将纯粹的内容表示从语音中分离出来,为了进一步消除内容信息中说话人的不变信息,提出CTC损失指导内容编码器。CTC不仅作为辅助网络加快模型收敛,同时其额外的文本监督可以与VQ联合优化,实现性能互补,学习纯内容表示。说话人表示采用风格嵌入学习,2种表示作为系统的输入进行语音转换。在开源的CMU数据集和VCTK语料库对所提的方法进行评估,实验结果表明,该方法在客观上的梅尔倒谱失真(MCD)达到8.896 d B,在主观上的语音自然度平均意见分数(MOS)和说话人相似度MOS分别为3.29和3.22,均优于基线模型,此方法在语音转换的质量和说话人相似度上能够获得最佳性能。 展开更多
关键词 预训练表示 自监督学习 矢量量化 解耦 联结时序分类
在线阅读 下载PDF
标签传播算法理论及其应用研究综述 被引量:44
11
作者 张俊丽 常艳丽 师文 《计算机应用研究》 CSCD 北大核心 2013年第1期21-25,共5页
介绍了标签传播算法理论,分析了标签传播算法的特点,总结了其在多媒体信息检索、分类、标注、处理和社区发现等方面的应用研究,最后探讨了标签传播算法未来的研究方向。
关键词 标签传播算法 半监督学习 多媒体 社区发现
在线阅读 下载PDF
半监督学习机制下的说话人辨认算法 被引量:2
12
作者 李燕萍 唐振民 +1 位作者 丁辉 张燕 《计算机工程》 CAS CSCD 北大核心 2009年第14期221-223,共3页
针对说话人辨认中训练语音有限时系统泛化能力差的问题,提出一种基于半监督学习的复合高斯混合模型算法。通过复合高斯混合模型对所有说话人的特征分布统一建模,基于半监督学习机制下的EM算法对学习样本进行学习。实验证明,该算法能够... 针对说话人辨认中训练语音有限时系统泛化能力差的问题,提出一种基于半监督学习的复合高斯混合模型算法。通过复合高斯混合模型对所有说话人的特征分布统一建模,基于半监督学习机制下的EM算法对学习样本进行学习。实验证明,该算法能够充分利用未标记样本对系统进行有效的自适应更新,改善系统的性能,获得比传统高斯混合模型更高的识别率,提高系统的泛化能力。 展开更多
关键词 说话人辨认 半监督学习 复合高斯混合模型 EM算法
在线阅读 下载PDF
基于分段损失的生成对抗网络 被引量:5
13
作者 刘其开 姜代红 李文吉 《计算机工程》 CAS CSCD 北大核心 2019年第5期155-160,168,共7页
生成对抗网络(GAN)在训练过程中未能有效进行生成器与鉴别器间的同步更新,导致模型训练不稳定并出现模式崩溃的现象。为此,提出一种基于分段损失的生成对抗网络PL-GAN。生成器在不同的训练时期采用不同形式的损失函数,同时引入真实样本... 生成对抗网络(GAN)在训练过程中未能有效进行生成器与鉴别器间的同步更新,导致模型训练不稳定并出现模式崩溃的现象。为此,提出一种基于分段损失的生成对抗网络PL-GAN。生成器在不同的训练时期采用不同形式的损失函数,同时引入真实样本与生成样本之间的特征级损失,从而使鉴别器提取的特征更具有鲁棒性。MNIST和CIFAR-10数据集上的实验结果表明,与regular GAN、feature-wise GAN相比,PL-GAN具有更高的分类精度与运行效率。 展开更多
关键词 生成对抗网络 模式崩溃 特征级损失 分段损失 半监督学习
在线阅读 下载PDF
自监督增广的监督分类学习增强 被引量:4
14
作者 耿传兴 谭正豪 陈松灿 《软件学报》 EI CSCD 北大核心 2023年第4期1870-1878,共9页
借助预置任务创建的免费监督信号/标记,自监督学习(SSL)能学得无标记数据的有效表示,并已在多种下游任务中获得了验证.现有预置任务通常先对原视图数据作显式的线性或非线性变换,由此形成了多个增广视图数据,然后通过预测上述视图或变... 借助预置任务创建的免费监督信号/标记,自监督学习(SSL)能学得无标记数据的有效表示,并已在多种下游任务中获得了验证.现有预置任务通常先对原视图数据作显式的线性或非线性变换,由此形成了多个增广视图数据,然后通过预测上述视图或变换的对应标记或最大化视图间的一致性达成学习表示.发现这种自监督增广(即数据自身与自监督标记的增广)不仅有益无监督预置任务而且也有益监督分类任务的学习,而当前鲜有工作对此关注,它们要么将预置任务作为下游分类任务的学习辅助,采用多任务学习建模;要么采用多标记学习,联合建模下游任务标记与自监督标记.然而,下游任务与预置任务间往往存在固有差异(语义,任务难度等),由此不可避免地造成二者学习间的竞争,给下游任务的学习带来风险.为挑战该问题,提出一种简单但有效的自监督多视图学习框架(SSL-MV),通过在增广数据视图上执行与下游任务相同的学习来避免自监督标记对下游标记学习的干扰.更有意思的是,借助多视图学习,设计的框架自然拥有了集成推断能力,因而显著提升了下游分类任务的学习性能.最后,基于基准数据集的广泛实验验证了SSL-MV的有效性. 展开更多
关键词 机器学习 监督分类学习 自监督学习 多视图学习 数据增广
在线阅读 下载PDF
自训练新类探测半监督学习算法 被引量:1
15
作者 何玉林 陈佳琪 +2 位作者 黄启航 菲律普弗尼尔-维格 黄哲学 《计算机科学与探索》 CSCD 北大核心 2023年第9期2184-2197,共14页
传统的半监督学习算法(SSL)存在适用范围有限和泛化能力不足的缺陷,尤其是当训练数据集中出现未见标签的新类样本时,算法的性能将在很大程度上受到影响。基于人工标注的有标记样本获取方式需要领域专家的参与,消耗了高昂的时间和财力成... 传统的半监督学习算法(SSL)存在适用范围有限和泛化能力不足的缺陷,尤其是当训练数据集中出现未见标签的新类样本时,算法的性能将在很大程度上受到影响。基于人工标注的有标记样本获取方式需要领域专家的参与,消耗了高昂的时间和财力成本,且由于专家背景知识的局限,无法避免标记过程中的人为错标现象。为此,以提高对未见标签样本标注正确性为出发点的半监督学习算法具有迫切的实际需要。在对自训练算法进行了详细剖析之后,提出了一种有效的新类探测半监督学习算法(NCD-SSL)。首先,基于经典的极限学习机模型,构造了可处理标签增量和样本增量学习的通用增量极限学习机;然后,对自训练算法进行改进,利用标注可信度高的样本进行样本增量学习,同时设置了缓存池用以存储标注可信度低的样本;之后,使用聚类和分布一致性判定方法进行新类探测,进而实现类增量学习;最后,在仿真数据集和真实数据集上对提出算法的可行性和有效性进行了实验验证,实验结果显示在缺失类别数为3、2、1时,新算法的测试精度普遍比其他6种半监督学习算法高出30、20、10个百分点左右,从而证实了提出的算法能够获得更好的新类探测半监督学习表现。 展开更多
关键词 半监督学习(ssl) 新类探测 自训练 极限学习机 最大平均差异 分布一致性
在线阅读 下载PDF
基于半监督学习和三支决策的入侵检测模型 被引量:8
16
作者 张师鹏 李永忠 杜祥通 《计算机应用》 CSCD 北大核心 2021年第9期2602-2608,共7页
针对现有的入侵检测模型在未知攻击上表现不佳,且标注数据极其有限的情况,提出一种基于半监督学习(SSL)和三支决策(3WD)的入侵检测模型--SSL-3WD。SSL-3WD模型通过3WD在信息不足情况下的优秀表现来满足SSL在数据信息的充分冗余性上的假... 针对现有的入侵检测模型在未知攻击上表现不佳,且标注数据极其有限的情况,提出一种基于半监督学习(SSL)和三支决策(3WD)的入侵检测模型--SSL-3WD。SSL-3WD模型通过3WD在信息不足情况下的优秀表现来满足SSL在数据信息的充分冗余性上的假设。首先利用3WD理论对网络行为数据进行分类,而后根据分类结果选择适当的“伪标记”样本组成新的训练集以扩充原有数据集,最后重复分类过程,以得到所有对于网络行为数据的分类。在NSL-KDD数据集上,所提模型的检出率达到了97.7%,相较于对比方法中检出率最高的自适应的集成学习入侵检测模型Multi-Tree,提升了5.8个百分点;在UNSW-NB15数据集上,所提模型的准确率达到了94.7%,检出率达到了96.3%,相较于对比方法中表现最好的基于深度堆叠非对称自编码器(SNDAE)的入侵检测模型,分别提升了3.5个百分点和6.2个百分点。实验结果表明,所提SSL-3WD模型提升了对网络行为进行检测的准确率和检出率。 展开更多
关键词 入侵检测 半监督学习 三支决策 未知攻击 充分冗余
在线阅读 下载PDF
Hessian正则化Logistic回归模型 被引量:2
17
作者 刘红丽 刘伟锋 +1 位作者 王延江 董丽萍 《计算机工程与应用》 CSCD 北大核心 2016年第5期236-240,共5页
针对大数据量的图像分类问题,Laplacian正则化的半监督学习方法获得了广阔的应用前景。然而Laplacian正则化使分类函数趋向于常数函数而易导致较差的推测能力。提出了基于Hessian正则化的Logistic回归模型用于图像分类,Hessian正则化可... 针对大数据量的图像分类问题,Laplacian正则化的半监督学习方法获得了广阔的应用前景。然而Laplacian正则化使分类函数趋向于常数函数而易导致较差的推测能力。提出了基于Hessian正则化的Logistic回归模型用于图像分类,Hessian正则化可以较好地预测区域之外的数据点。在MIR Flickr数据库上进行图像分类实验,与SVM、Logistic回归和Laplacian正则化的Logistic回归方法相比,Hessian正则化的Logistic回归模型更有效。 展开更多
关键词 半监督学习 HESSIAN Logistic核回归 图像分类
在线阅读 下载PDF
基于半监督学习的动态神经网络结构设计 被引量:2
18
作者 任红格 李冬梅 李福进 《计算机应用》 CSCD 北大核心 2016年第3期703-707,734,共6页
针对神经网络初始结构的设定依赖于工作者的经验、自适应能力较差等问题,提出一种基于半监督学习(SSL)算法的动态神经网络结构设计方法。该方法采用半监督学习方法利用已标记样例和无标记样例对神经网络进行训练,得到一个性能较为完善... 针对神经网络初始结构的设定依赖于工作者的经验、自适应能力较差等问题,提出一种基于半监督学习(SSL)算法的动态神经网络结构设计方法。该方法采用半监督学习方法利用已标记样例和无标记样例对神经网络进行训练,得到一个性能较为完善的初始网络结构,之后采用全局敏感度分析法(GSA)对网络隐层神经元输出权值进行分析,判断隐层神经元对网络输出的影响程度,即其敏感度值大小,适时地删减敏感度值很小的神经元或增加敏感度值较大的神经元,实现动态神经网络结构的优化设计,并给出了网络结构变化过程中收敛性的证明。理论分析和Matlab仿真实验表明,基于SSL算法的神经网络隐层神经元会随训练时间而改变,实现了网络结构动态设计。在液压厚度自动控制(AGC)系统应用中,大约在160 s时系统输出达到稳定,输出误差大约为0.03 mm,与监督学习(SL)方法和无监督学习(USL)方法相比,输出误差分别减小了0.03 mm和0.02 mm,这表明基于SSL算法的动态网络在实际应用中能有效提高系统输出的准确性。 展开更多
关键词 动态神经网络 半监督学习 全局敏感度分析法 自适应能力 敏感度值
在线阅读 下载PDF
Multi-label dimensionality reduction based on semi-supervised discriminant analysis
19
作者 李宏 李平 +1 位作者 郭跃健 吴敏 《Journal of Central South University》 SCIE EI CAS 2010年第6期1310-1319,共10页
Multi-label data with high dimensionality often occurs,which will produce large time and energy overheads when directly used in classification tasks.To solve this problem,a novel algorithm called multi-label dimension... Multi-label data with high dimensionality often occurs,which will produce large time and energy overheads when directly used in classification tasks.To solve this problem,a novel algorithm called multi-label dimensionality reduction via semi-supervised discriminant analysis(MSDA) was proposed.It was expected to derive an objective discriminant function as smooth as possible on the data manifold by multi-label learning and semi-supervised learning.By virtue of the latent imformation,which was provided by the graph weighted matrix of sample attributes and the similarity correlation matrix of partial sample labels,MSDA readily made the separability between different classes achieve maximization and estimated the intrinsic geometric structure in the lower manifold space by employing unlabeled data.Extensive experimental results on several real multi-label datasets show that after dimensionality reduction using MSDA,the average classification accuracy is about 9.71% higher than that of other algorithms,and several evaluation metrices like Hamming-loss are also superior to those of other dimensionality reduction methods. 展开更多
关键词 manifold learning semi-supervised learning ssl linear diseriminant analysis (LDA) multi-label classification dimensionality reduction
在线阅读 下载PDF
基于自监督学习的多密度图会话推荐
20
作者 刘晓黎 王轶彤 《计算机工程》 CAS CSCD 北大核心 2023年第9期60-68,78,共10页
基于会话的推荐系统旨在根据匿名用户短时间内的历史行为序列预测下一个可能的项目,会话中的项目来自用户的反馈数据。然而,在海量的候选项目集中,用户倾向于反馈其中的小部分项目,除了少部分热门项目外,大量长尾项目的反馈数据非常稀... 基于会话的推荐系统旨在根据匿名用户短时间内的历史行为序列预测下一个可能的项目,会话中的项目来自用户的反馈数据。然而,在海量的候选项目集中,用户倾向于反馈其中的小部分项目,除了少部分热门项目外,大量长尾项目的反馈数据非常稀疏。现有的会话推荐方法大多集中在对会话的序列模式以及项目之间的复杂关联关系进行建模,忽略了会话推荐中的长尾分布现象。针对这一问题,提出一种基于多任务自监督学习的会话推荐模型。在原始推荐任务基础上,使用基于项目频率的逆采样器建立自监督学习任务,以增强对长尾项目嵌入的学习,同时缓解数据稀疏性。此外,构建一个多密度会话图,并通过统一的图神经网络以可解释的方式学习会话的嵌入,以更准确地捕捉用户意图。为了避免过拟合,采用带有标签平滑正则化的交叉熵作为目标函数。实验结果表明,与GCE-GNN、COTREC、MSGIFSR等先进的基线方法相比,该方法在Diginetica、Tmall、Gowalla和Last.FM这4个真实数据集上的命中率与宏命中率显著提升,其中,在top-20推荐结果上,命中率分别提升了1.37%、5.88%、0.30%和2.16%,宏命中率分别提升了2.49%、12.86%、1.97%和10.19%。 展开更多
关键词 会话推荐 图神经网络 自监督学习 多任务学习 多密度图 长尾分布
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部