期刊文献+
共找到653篇文章
< 1 2 33 >
每页显示 20 50 100
Real-Time Smart Meter Abnormality Detection Framework via End-to-End Self-Supervised Time-Series Contrastive Learning with Anomaly Synthesis
1
作者 WANG Yixin LIANG Gaoqi +1 位作者 BI Jichao ZHAO Junhua 《南方电网技术》 北大核心 2025年第7期62-71,89,共11页
The rapid integration of Internet of Things(IoT)technologies is reshaping the global energy landscape by deploying smart meters that enable high-resolution consumption monitoring,two-way communication,and advanced met... The rapid integration of Internet of Things(IoT)technologies is reshaping the global energy landscape by deploying smart meters that enable high-resolution consumption monitoring,two-way communication,and advanced metering infrastructure services.However,this digital transformation also exposes power system to evolving threats,ranging from cyber intrusions and electricity theft to device malfunctions,and the unpredictable nature of these anomalies,coupled with the scarcity of labeled fault data,makes realtime detection exceptionally challenging.To address these difficulties,a real-time decision support framework is presented for smart meter anomality detection that leverages rolling time windows and two self-supervised contrastive learning modules.The first module synthesizes diverse negative samples to overcome the lack of labeled anomalies,while the second captures intrinsic temporal patterns for enhanced contextual discrimination.The end-to-end framework continuously updates its model with rolling updated meter data to deliver timely identification of emerging abnormal behaviors in evolving grids.Extensive evaluations on eight publicly available smart meter datasets over seven diverse abnormal patterns testing demonstrate the effectiveness of the proposed full framework,achieving average recall and F1 score of more than 0.85. 展开更多
关键词 abnormality detection cyber-physical security anomaly synthesis contrastive learning time-series
在线阅读 下载PDF
FedCLCC:A personalized federated learning algorithm for edge cloud collaboration based on contrastive learning and conditional computing
2
作者 Kangning Yin Xinhui Ji +1 位作者 Yan Wang Zhiguo Wang 《Defence Technology(防务技术)》 2025年第1期80-93,共14页
Federated learning(FL)is a distributed machine learning paradigm for edge cloud computing.FL can facilitate data-driven decision-making in tactical scenarios,effectively addressing both data volume and infrastructure ... Federated learning(FL)is a distributed machine learning paradigm for edge cloud computing.FL can facilitate data-driven decision-making in tactical scenarios,effectively addressing both data volume and infrastructure challenges in edge environments.However,the diversity of clients in edge cloud computing presents significant challenges for FL.Personalized federated learning(pFL)received considerable attention in recent years.One example of pFL involves exploiting the global and local information in the local model.Current pFL algorithms experience limitations such as slow convergence speed,catastrophic forgetting,and poor performance in complex tasks,which still have significant shortcomings compared to the centralized learning.To achieve high pFL performance,we propose FedCLCC:Federated Contrastive Learning and Conditional Computing.The core of FedCLCC is the use of contrastive learning and conditional computing.Contrastive learning determines the feature representation similarity to adjust the local model.Conditional computing separates the global and local information and feeds it to their corresponding heads for global and local handling.Our comprehensive experiments demonstrate that FedCLCC outperforms other state-of-the-art FL algorithms. 展开更多
关键词 Federated learning Statistical heterogeneity Personalized model Conditional computing contrastive learning
在线阅读 下载PDF
Controlling update distance and enhancing fair trainable prototypes in federated learning under data and model heterogeneity
3
作者 Kangning Yin Zhen Ding +1 位作者 Xinhui Ji Zhiguo Wang 《Defence Technology(防务技术)》 2025年第5期15-31,共17页
Heterogeneous federated learning(HtFL)has gained significant attention due to its ability to accommodate diverse models and data from distributed combat units.The prototype-based HtFL methods were proposed to reduce t... Heterogeneous federated learning(HtFL)has gained significant attention due to its ability to accommodate diverse models and data from distributed combat units.The prototype-based HtFL methods were proposed to reduce the high communication cost of transmitting model parameters.These methods allow for the sharing of only class representatives between heterogeneous clients while maintaining privacy.However,existing prototype learning approaches fail to take the data distribution of clients into consideration,which results in suboptimal global prototype learning and insufficient client model personalization capabilities.To address these issues,we propose a fair trainable prototype federated learning(FedFTP)algorithm,which employs a fair sampling training prototype(FSTP)mechanism and a hyperbolic space constraints(HSC)mechanism to enhance the fairness and effectiveness of prototype learning on the server in heterogeneous environments.Furthermore,a local prototype stable update(LPSU)mechanism is proposed as a means of maintaining personalization while promoting global consistency,based on contrastive learning.Comprehensive experimental results demonstrate that FedFTP achieves state-of-the-art performance in HtFL scenarios. 展开更多
关键词 Heterogeneous federated learning Model heterogeneity Data heterogeneity contrastive learning
在线阅读 下载PDF
Deep plug-and-play self-supervised neural networks for spectral snapshot compressive imaging
4
作者 ZHANG Xing-Yu ZHU Shou-Zheng +4 位作者 ZHOU Tian-Shu QI Hong-Xing WANG Jian-Yu LI Chun-Lai LIU Shi-Jie 《红外与毫米波学报》 CSCD 北大核心 2024年第6期846-857,共12页
The encoding aperture snapshot spectral imaging system,based on the compressive sensing theory,can be regarded as an encoder,which can efficiently obtain compressed two-dimensional spectral data and then decode it int... The encoding aperture snapshot spectral imaging system,based on the compressive sensing theory,can be regarded as an encoder,which can efficiently obtain compressed two-dimensional spectral data and then decode it into three-dimensional spectral data through deep neural networks.However,training the deep neural net⁃works requires a large amount of clean data that is difficult to obtain.To address the problem of insufficient training data for deep neural networks,a self-supervised hyperspectral denoising neural network based on neighbor⁃hood sampling is proposed.This network is integrated into a deep plug-and-play framework to achieve self-supervised spectral reconstruction.The study also examines the impact of different noise degradation models on the fi⁃nal reconstruction quality.Experimental results demonstrate that the self-supervised learning method enhances the average peak signal-to-noise ratio by 1.18 dB and improves the structural similarity by 0.009 compared with the supervised learning method.Additionally,it achieves better visual reconstruction results. 展开更多
关键词 compressed sensing deep learning self-supervised coded aperture imaging
在线阅读 下载PDF
基于one-shot learning的人脸识别研究
5
作者 程远航 余军 《现代电子技术》 2021年第19期76-80,共5页
由于在特殊场景下大量标注人脸数据样本识别时需要大量带有身份标记的训练样本,且无法精准提取小样本特征,故提出单样本学习(one-shot learning)的人脸识别算法。选取并赋值单样本人脸图像像素点中间值,保存至缓冲区进行遍历,利用Siames... 由于在特殊场景下大量标注人脸数据样本识别时需要大量带有身份标记的训练样本,且无法精准提取小样本特征,故提出单样本学习(one-shot learning)的人脸识别算法。选取并赋值单样本人脸图像像素点中间值,保存至缓冲区进行遍历,利用Siamese Network模型计算遍历结果共享权重,利用共享权值识别图像特征相似性,得到人脸识别结果。结果表明,与基于卷积神经网络的人脸识别方法相比,所研究方法识别准确率达到95.68%,识别效率达到354.25 s,结果更好。由此说明所研究方法在小样本的情况下也能更为快速且准确地完成人脸识别任务。 展开更多
关键词 人脸识别 one-shot learning 共享权值 Siamese Network模型 图像处理 对比分析
在线阅读 下载PDF
基于多模态对比学习的输电线路螺栓缺陷分类 被引量:1
6
作者 张珂 郑朝烨 +2 位作者 石超君 赵振兵 肖扬杰 《高电压技术》 北大核心 2025年第2期630-641,共12页
输电线路巡检中采集的螺栓图像有分辨率低、视觉信息不足的特点。针对传统图像分类模型难以从螺栓图像中学习到语义丰富的视觉表征问题,提出了一种基于多模态对比学习的输电线路螺栓缺陷分类方法。首先,为了将文本中螺栓相关的语义信息... 输电线路巡检中采集的螺栓图像有分辨率低、视觉信息不足的特点。针对传统图像分类模型难以从螺栓图像中学习到语义丰富的视觉表征问题,提出了一种基于多模态对比学习的输电线路螺栓缺陷分类方法。首先,为了将文本中螺栓相关的语义信息和先验知识以跨模态的方式注入视觉表征,提出了一种结合多模态对比预训练和监督式微调的二阶段训练算法;其次,为了缓解多模态对比预训练中的过拟合问题,提出了标签平滑的信息噪声对比估计损失(info noise contrastive estimation loss with label smoothing,infoNCE-LS),以提高预训练视觉表征的泛化性能;最后,针对上下游任务的不匹配问题,设计了3种基于文本提示的分类头,以改善预训练视觉表征在监督式微调阶段的迁移学习效果。实验结果表明:该文基于Res Net50和ViT构建的两种模型在螺栓缺陷分类数据集上的准确率分别为92.3%和97.4%,相比基线分别提高了2.4%和5.8%。研究实现了从文本到图像的语义信息跨模态补充,为螺栓缺陷识别的研究提供了新的思路。 展开更多
关键词 输电线路 螺栓缺陷分类 多模态预训练 对比学习 迁移学习
在线阅读 下载PDF
基于对比学习和标签挖掘的点云分割算法 被引量:1
7
作者 黄华 卜一凡 +1 位作者 许宏丽 王晓荣 《计算机研究与发展》 北大核心 2025年第1期132-143,共12页
基于深度学习的点云分割算法通过设计复杂的特征提取模块,可以对高维空间点云进行有效的分割.但由于缺乏对边界点集的特征挖掘,使得其对边界分割的精度欠佳.已有将对比学习思想用于点云分割以解决边界区域分割性能不足问题的研究中,忽... 基于深度学习的点云分割算法通过设计复杂的特征提取模块,可以对高维空间点云进行有效的分割.但由于缺乏对边界点集的特征挖掘,使得其对边界分割的精度欠佳.已有将对比学习思想用于点云分割以解决边界区域分割性能不足问题的研究中,忽略了点云无序和稀疏特性,特征提取不够准确.对此,设计了基于对比学习和标签挖掘的点云分割模型CL2M(contrastive learning label mining),通过自注意力机制学习不同位置处点云更为精准的特征,并引入对比学习方法,提高了点云边界处的分割精度.在对比边界学习过程中通过深入挖掘语义空间中的标签并设计了基于标签分布的对比边界学习模块,使得高维空间点云标签分布包含更多的语义信息.CL2M充分利用标签的分布规律计算分布间的距离,可准确划分正负样本,减少了常规硬划分带来的累计错误.在2个公开数据集上进行的实验结果表明,CL2M在多个评价指标上优于既有的点云分割模型,验证了模型的有效性. 展开更多
关键词 计算机视觉 点云分割 对比学习 自注意力机制 边界挖掘
在线阅读 下载PDF
结合对比学习和双流网络融合知识图谱摘要模型 被引量:3
8
作者 赵霞 王钊 《计算机应用研究》 北大核心 2025年第3期720-727,共8页
提出了一种融合对比学习与双流网络的新型知识图谱摘要模型(KGDR-CLSUM),旨在解决现有模型在生成摘要时存在的事实性错误和信息提取不足的问题。该模型通过设计双流网络同时处理文本特征和知识图谱特征,并采用对比学习来强化这两类特征... 提出了一种融合对比学习与双流网络的新型知识图谱摘要模型(KGDR-CLSUM),旨在解决现有模型在生成摘要时存在的事实性错误和信息提取不足的问题。该模型通过设计双流网络同时处理文本特征和知识图谱特征,并采用对比学习来强化这两类特征的有效融合。此外,引入动量蒸馏策略以降低知识图谱中的数据噪声,从而提升摘要生成的质量和准确性。在CNN/Daily Mail数据集上,KGDR-CLSUM相较于基线模型PEGASUS BASE,在ROUGE-1、ROUGE-2和ROUGE-L指标上分别提升了3.03%、3.42%和2.56%,在XSum数据集上更是达到了7.54%、8.78%和8.51%的显著提升。此外,人工评分显著高于ChatGPT,进一步证明了该模型的优越性能。结果表明,KGDR-CLSUM在生成摘要时,尤其在短文本生成任务中,能够有效降低错误信息,并显著提高摘要的质量。 展开更多
关键词 文本摘要 知识图谱 动量蒸馏 对比学习 双流网络
在线阅读 下载PDF
基于多模态的缺陷绝缘子图像的多标签分类 被引量:3
9
作者 周景 王满意 田兆星 《高电压技术》 北大核心 2025年第2期642-651,共10页
对巡检图像中绝缘子缺陷准确分类是输电线路自动巡检领域中的关键技术之一。针对传统深度学习的分类方法对文本信息利用不够充分以及绝缘子图像分类标签较为单一的问题,该文首次提出了一种基于多模态的缺陷绝缘子图像的多标签分类方法... 对巡检图像中绝缘子缺陷准确分类是输电线路自动巡检领域中的关键技术之一。针对传统深度学习的分类方法对文本信息利用不够充分以及绝缘子图像分类标签较为单一的问题,该文首次提出了一种基于多模态的缺陷绝缘子图像的多标签分类方法。首先,采用一种多模态联合数据增强方法,实现了绝缘子图像和标签文本间跨模态的数据增强。然后,使用Vision Transformer网络提取图像的特征信息和BERT网络提取标签文本的特征信息,充分利用图像和标签文本的特征信息,从不同模态获取全面的信息,提高了网络的分类能力。最后,通过对比学习的方式将图像和文本的特征信息关联,增强网络分类的可靠性的同时,又为分类结果提供了良好的可解释性。实验结果表明,该方法的分类总体准确率达到93.87%,在同一数据集中对比其他模型,分类性能具有明显优势,为多模态技术在电网领域的应用提供了较好的基础。 展开更多
关键词 绝缘子图像 多标签分类 多模态 对比学习 数据增强
在线阅读 下载PDF
基于自适应增强的多视图对比推荐算法 被引量:1
10
作者 姚迅 王海鹏 +1 位作者 胡新荣 杨捷 《计算机工程》 北大核心 2025年第5期103-113,共11页
近年来,基于神经网络架构的推荐系统取得了显著成功,但在处理富含流行偏见和交互噪声的数据时,未能达到期望的效果。对比学习作为一种从无标记数据中学习的新兴技术备受关注,为解决这一问题提供了潜在方案。提出一种端到端的图对比推荐... 近年来,基于神经网络架构的推荐系统取得了显著成功,但在处理富含流行偏见和交互噪声的数据时,未能达到期望的效果。对比学习作为一种从无标记数据中学习的新兴技术备受关注,为解决这一问题提供了潜在方案。提出一种端到端的图对比推荐算法AMV-CL。首先,基于节点的潜在表征构建用户-项目交互图的互补图;其次,引入自适应增强技术,分别从节点和边缘角度生成多视图数据,并通过重参数化网络调整图结构;最后,规范化对比损失中锚节点的正样本来源,同时利用多视图对比损失来学习用户/项目的潜在表征。在公共数据集上的实验结果显示,相较于最优基准方法SimGCL,AMV-CL在评价指标Recall@20和NDCG@20上的提升最高可达到12.03%和12.64%,表明所提方法能够有效提升推荐性能。 展开更多
关键词 图神经网络 推荐系统 多视图 对比学习 自适应增强
在线阅读 下载PDF
图对比学习研究进展 被引量:2
11
作者 吴国栋 吴贞畅 +2 位作者 王雪妮 胡全兴 秦辉 《小型微型计算机系统》 北大核心 2025年第1期44-54,共11页
图对比学习可以提取无标注数据自身信息作为自监督信号指导模型训练,并帮助缓解图神经网络对标签数据的依赖及结构不公平等问题,已成为图神经网络领域的研究热点.本文从数据增广方式、样本对构造、对比学习粒度3个方面对现有图对比学习... 图对比学习可以提取无标注数据自身信息作为自监督信号指导模型训练,并帮助缓解图神经网络对标签数据的依赖及结构不公平等问题,已成为图神经网络领域的研究热点.本文从数据增广方式、样本对构造、对比学习粒度3个方面对现有图对比学习研究进行了深入探讨,分析了已有不同图对比学习研究方法各自的优点与不足.在此基础上,指出了现有图对比学习研究存在的问题,并提出了自适应性图对比学习、上下文图对比学习、动态图对比学习、超图对比学习、因果推断图对比学习、无负样本图对比学习及基于大语言模型的图对比学习等未来图对比学习的研究方向. 展开更多
关键词 图对比学习 研究进展 数据增广 样本对 对比粒度
在线阅读 下载PDF
基于对比学习的动作识别研究综述
12
作者 孙中华 吴双 +2 位作者 贾克斌 冯金超 刘鹏宇 《电子与信息学报》 北大核心 2025年第8期2473-2485,共13页
人体动作具有类别数量多、类内/类间差异不均衡等特性,导致动作识别对数据标签数量与质量的依赖度过高,大幅增加了学习模型的训练成本,而对比学习是解决该问题的有效方法之一,近年来基于对比学习的动作识别逐渐成为研究热点。基于此,该... 人体动作具有类别数量多、类内/类间差异不均衡等特性,导致动作识别对数据标签数量与质量的依赖度过高,大幅增加了学习模型的训练成本,而对比学习是解决该问题的有效方法之一,近年来基于对比学习的动作识别逐渐成为研究热点。基于此,该文全面论述了对比学习在动作识别中的最新进展,将对比学习的研究分为3大阶段:传统对比学习、基于聚类的对比学习以及不使用负样本的对比学习。在每一阶段,首先概述具有代表性的对比学习模型,然后分析了当前基于该类模型的主要动作识别方法。另外,介绍了主流基准数据集,总结了经典方法在数据集上的性能对比。最后,探讨了对比学习模型在动作识别研究中的局限性和可延展之处。 展开更多
关键词 动作识别 对比学习 对比损失 无监督学习
在线阅读 下载PDF
基于对比学习和扩散模型的图像语义通信方法
13
作者 邢焕来 况田泽宇 +6 位作者 徐乐西 李洋 郑丹阳 罗寿西 戴朋林 李可 冯力 《计算机学报》 北大核心 2025年第5期1151-1167,共17页
无监督图像传输语义通信方法的目的是在接收端生成与原始图像尽可能相似的图像。然而,在低压缩比(Compression Ratios,CRs)或低信噪比(Signal-to-Noise Ratio,SNR)的条件下,重建图像的质量往往会显著下降。为了解决上述问题,本文提出了... 无监督图像传输语义通信方法的目的是在接收端生成与原始图像尽可能相似的图像。然而,在低压缩比(Compression Ratios,CRs)或低信噪比(Signal-to-Noise Ratio,SNR)的条件下,重建图像的质量往往会显著下降。为了解决上述问题,本文提出了一种能够自监督提取并利用图像高层语义的语义通信模型。为有效地提取包含高、低层的混合语义特征,本文提出了一种基于动量对比(Momentum Contrast,MoCo)的自监督语义编码器。与纯高层语义特征相比,混合语义特征能够提高生成图像与原图的相似性;与纯低层语义特征相比,混合语义特征能够更好地表示图像的核心语义。本文设计了一种基于扩散模型(Diffusion Model)的语义解码器,旨在建立高层语义特征到图像像素的映射关系,将接收到的语义信息还原为图像像素。实验结果表明,在低CRs和低SNR条件下,与传统通信方法和四种无监督语义通信方法相比,本文所提出的模型在加性高斯白噪声(Additive White Gaussian Noise,AWGN)信道、瑞利(Rayleigh)信道和莱斯(Rician)信道下生成的图像在视觉特征方面与原数据集更接近,并在使用第三方图像分类器进行分类时具有更高的正确率。 展开更多
关键词 语义通信 深度学习 对比学习 扩散模型 图像处理
在线阅读 下载PDF
引入单模态监督对比学习的多视图讽刺检测
14
作者 张政 刘金硕 +1 位作者 邓娟 王丽娜 《计算机工程与应用》 北大核心 2025年第19期118-126,共9页
社交媒体上图像和文本数据的快速增长导致人们对多模态讽刺检测问题的关注不断提高。然而,现有基于特征提取融合的检测方法存在一些缺陷:一是大多数方法缺乏多模态检测所需的底层模态对齐能力,二是模态融合过程忽视了模态间的动态关系,... 社交媒体上图像和文本数据的快速增长导致人们对多模态讽刺检测问题的关注不断提高。然而,现有基于特征提取融合的检测方法存在一些缺陷:一是大多数方法缺乏多模态检测所需的底层模态对齐能力,二是模态融合过程忽视了模态间的动态关系,三是未能充分利用模态互补性。为此,提出一种基于单模态监督对比学习、多模态融合和多视图聚合预测的检测模型。以CLIP(contrastive language image pre-training)模型作为编码器来增强图像和文本底层编码的对齐效果。结合单模态监督对比学习方法,通过单模态预测来指导模态间的动态关系。然后,设计了全局-局部跨模态融合方法,利用每种模态的语义级表示作为全局多模态上下文与局部单模态特征进行交互,通过多个跨模态融合层提高模态融合效果,并减少了以往局部-局部跨模态融合方法的时间和空间成本。采用多视图聚合预测方法充分利用图像、文本和图文视图的互补性。总之,该模型能有效捕捉多模态讽刺数据的跨模态语义不一致性,在公开数据集MSD上取得了比现有最好方法DMSD-Cl更好的结果。 展开更多
关键词 讽刺检测 多模态 对比学习 跨模态融合
在线阅读 下载PDF
结合图同构和混合阶残差门控图神经网络的会话推荐 被引量:1
15
作者 王永贵 于琦 《计算机科学与探索》 北大核心 2025年第2期502-512,共11页
基于会话推荐的目的是依据当前会话的先前动作来预测用户的下一个动作。针对现有基于图神经网络的会话推荐模型存在的不足之处,提出一种结合图同构和混合阶残差门控图神经网络的会话推荐模型(GIHR-GNN)。使用图同构网络聚合相邻项目的... 基于会话推荐的目的是依据当前会话的先前动作来预测用户的下一个动作。针对现有基于图神经网络的会话推荐模型存在的不足之处,提出一种结合图同构和混合阶残差门控图神经网络的会话推荐模型(GIHR-GNN)。使用图同构网络聚合相邻项目的特征向量,有效融合全局和局部信息,解决图神经网络善于捕获节点之间的局部连接而忽略全局信息的问题,并通过门控融合函数聚合用户的长短期兴趣以更好地捕捉用户兴趣的动态变化。使用混合阶门控图神经网络对位置嵌入向量进行处理以捕获用户长时间后重新交互所反映出的用户意图,并在此基础之上添加残差模块,解决深层网络的退化问题。将未去噪和去噪后的用户长期兴趣表示进行对比学习,缓解了数据稀疏和噪声干扰的问题。在Tmall和RetailRocket两个数据集上进行多次实验,并与先进基线模型进行比较,结果表明该模型在Tmall数据集上P@20指标和MRR@20指标至少提升了3.26%和10.33%,在RetailRocket数据集上P@20指标和MRR@20指标至少提升了0.55%和2.57%,证明了GIHR-GNN模型的有效性。 展开更多
关键词 会话推荐 图同构网络 混合阶残差门控图神经网络 对比学习
在线阅读 下载PDF
FGITA:一种基于细粒度对齐的多模态命名实体识别框架
16
作者 吕学强 王涛 +3 位作者 游新冬 赵海兴 才藏太 陈玉忠 《小型微型计算机系统》 北大核心 2025年第4期769-775,共7页
命名实体识别任务旨在识别出非结构化文本中所包含的实体并将其分配给预定义的实体类别中.随着互联网和社交媒体的发展,文本信息往往伴随着图像等视觉模态信息出现,传统的命名实体识别方法在多模态信息中表现不佳.近年来,多模态命名实... 命名实体识别任务旨在识别出非结构化文本中所包含的实体并将其分配给预定义的实体类别中.随着互联网和社交媒体的发展,文本信息往往伴随着图像等视觉模态信息出现,传统的命名实体识别方法在多模态信息中表现不佳.近年来,多模态命名实体识别任务广受重视.然而,现有的多模态命名实体识别方法中,存在跨模态知识间的细粒度对齐不足问题,文本表征会融合语义不相关的图像信息,进而引入噪声.为了解决这些问题,提出了一种基于细粒度图文对齐的多模态命名实体识别方法(FGITA:A Multi-Modal NER Frame based on Fine-Grained Image-Text Alignment).首先,该方法通过目标检测、语义相似性判断等,确定更为细粒度的文本实体和图像子对象之间的语义相关性;其次,通过双线性注意力机制,计算出图像子对象与实体的相关性权重,并依据权重将子对象信息融入到实体表征中;最后,提出了一种跨模态对比学习方法,依据图像和实体之间的匹配程度,优化实体和图像在嵌入空间中的距离,借此帮助实体表征学习相关的图像信息.在两个公开数据集上的实验表明,FGITA优于5个主流多模态命名实体识别方法,验证了方法的有效性,同时验证了细粒度跨模态对齐在多模态命名实体识别任务中的重要性和优越性. 展开更多
关键词 多模态 命名实体识别 信息抽取 知识图谱 对比学习
在线阅读 下载PDF
面向智能巡检的视觉模型鲁棒性优化方法
17
作者 王震洲 郭方方 +2 位作者 宿景芳 苏鹤 王建超 《计算机应用》 北大核心 2025年第7期2361-2368,共8页
输电线路的智能巡检视觉任务对电力系统的安全稳定至关重要。尽管深度学习网络在分布一致的训练和测试数据集上表现良好,但实际应用中数据分布的偏差常常会降低模型性能。为了解决这一问题,提出一种基于对比学习的训练方法(TMCL),旨在... 输电线路的智能巡检视觉任务对电力系统的安全稳定至关重要。尽管深度学习网络在分布一致的训练和测试数据集上表现良好,但实际应用中数据分布的偏差常常会降低模型性能。为了解决这一问题,提出一种基于对比学习的训练方法(TMCL),旨在增强模型鲁棒性。首先,构建专为输电线路场景设计的基准测试集TLD-C(Transmission Line Dataset-Corruption)用于评估模型在面对图像损坏时的鲁棒性;其次,通过构建对类别特征敏感的正负样本对,提升模型对不同类别特征的区分能力;然后,使用结合对比损失和交叉熵损失的联合优化策略对特征提取过程施加额外约束,以优化特征向量的表征;最后,引入非局部特征去噪网络(NFD)用于提取与类别密切相关的特征。实验结果表明,模型改进后的训练方法在输电线路数据集(TLD)上的平均精度比原始方法高出3.40个百分点,在TLD-C数据集上的相对损坏精度(rCP)比原始方法高出4.69个百分点。 展开更多
关键词 智能巡检 深度学习 鲁棒性 对比学习 训练方法
在线阅读 下载PDF
基于跨域交互注意力和对比学习引导的红外与可见光图像融合
18
作者 邸敬 梁婵 +1 位作者 刘冀钊 廉敬 《中国光学(中英文)》 北大核心 2025年第2期317-332,共16页
现有红外与可见光图像融合方法难以充分提取和保留源图像细节信息与对比度,导致纹理细节模糊。针对这一问题,本文提出了一种跨域交互注意力和对比学习引导的红外与可见光图像融合方法。首先,设计了双支路跳跃连接的细节增强网络,从红外... 现有红外与可见光图像融合方法难以充分提取和保留源图像细节信息与对比度,导致纹理细节模糊。针对这一问题,本文提出了一种跨域交互注意力和对比学习引导的红外与可见光图像融合方法。首先,设计了双支路跳跃连接的细节增强网络,从红外和可见光图像中分别提取和增强细节信息,并利用跳跃连接避免信息丢失,生成增强后的细节图像。接着,构建了联合双分支编码器和跨域交互注意力模块的图像融合网络,确保特征融合时充分进行特征交互,并通过解码器重建为最终的融合图像。然后,引入了通过对比学习块进行浅层和深层属性和内容的对比学习网络,优化特征表示,进一步提升图像融合网络的性能。最后,为了约束网络训练以保留源图像的固有特征,设计了一种基于对比约束的损失函数,以辅助融合过程对源图像信息的对比保留。将提出方法与前沿融合方法进行了定性和定量的分析比较。在TNO、MSRS、RoadSence数据集上的实验结果表明:本文方法的8项客观评价指标均较对比方法有显著提升。本文方法融合后图像具有丰富的细节纹理、显著的清晰度和对比度,有效提高了道路交通、安防监控等实际应用中的目标识别和环境感知能力。 展开更多
关键词 红外与可见光图像融合 对比学习 跨域交互注意力机制 对比约束损失
在线阅读 下载PDF
基于多兴趣对比的深度强化学习推荐模型
19
作者 刘慧婷 刘绍雄 +1 位作者 王佳乐 赵鹏 《华南理工大学学报(自然科学版)》 北大核心 2025年第9期11-21,共11页
深度强化学习(DRL)被广泛应用于推荐系统中,用于动态建模用户兴趣并最大化用户的累积收益。然而,用户反馈稀疏问题成为基于DRL的推荐算法面临的重要挑战之一。对比学习作为一种自监督学习方法,通过构造用户兴趣的多个视角增强其表示,进... 深度强化学习(DRL)被广泛应用于推荐系统中,用于动态建模用户兴趣并最大化用户的累积收益。然而,用户反馈稀疏问题成为基于DRL的推荐算法面临的重要挑战之一。对比学习作为一种自监督学习方法,通过构造用户兴趣的多个视角增强其表示,进而缓解用户反馈稀疏问题。现有的对比学习方法通常利用基于启发式的增强策略,导致关键信息丢失,且未充分利用异构的交互信息。为解决这些问题,该文提出了基于多兴趣对比的深度强化学习推荐模型(MOCIR)。该模型包括一个对比表示模块和一个策略网络模块。对比表示模块利用异构信息网络(HIN)建模用户不同方面的局部兴趣,同时基于原始数据建模用户的全局兴趣,然后将同一用户的全局兴趣与局部兴趣、不同用户的全局兴趣与局部兴趣分别作为对比学习的正样本对和负样本对,以有效捕捉用户兴趣;策略网络模块用于在聚合用户状态表示后进行推荐;2个模块采用交替更新机制。在3个数据集上的实验结果表明,所提模型的推荐性能优于多个基于深度强化学习的模型,有效地解决了推荐中用户反馈稀疏问题。 展开更多
关键词 多兴趣 强化学习 对比学习 异质信息网络
在线阅读 下载PDF
加强决策边界与自监督的在线持续学习方法
20
作者 王伟 尤可鑫 刘晓芮 《计算机应用研究》 北大核心 2025年第1期133-138,共6页
针对在线持续学习于图像分类中既要适应新数据,又要减轻灾难性遗忘这一问题,基于重放的方法在减轻在线持续学习的灾难性遗忘方面展现出了优良性能。然而,此类方法中的大多数模型往往更倾向于学习与对象无关的解决方案,这些方案难以泛化... 针对在线持续学习于图像分类中既要适应新数据,又要减轻灾难性遗忘这一问题,基于重放的方法在减轻在线持续学习的灾难性遗忘方面展现出了优良性能。然而,此类方法中的大多数模型往往更倾向于学习与对象无关的解决方案,这些方案难以泛化且易于遗忘,因此,学习最能够代表类别的特征对于解决灾难性遗忘问题显得极为关键。基于此,提出加强决策边界与自监督的在线持续学习方法。首先,该方法通过加强新类之间的决策边界,帮助模型更好地进行任务的分类。其次,使用了一种融合的自监督学习方法,帮助模型更好地学习每个类的代表特征。通过与主流在线持续学习算法在公开数据集CIFAR-10和CIFAR-100上的实验对比,当内存库M为100时,该方法在CIFAR-10上的平均准确率达到了60.8%,平均遗忘率达到了15.5%。当内存库M为500时,该方法在CIFAR-100上的平均准确率达到了25.9%,平均遗忘率达到了13.7%。这一结果验证了加强决策边界与自监督的在线持续学习方法对减轻灾难性遗忘是有效的。 展开更多
关键词 持续学习 灾难性遗忘 对比学习 决策边界
在线阅读 下载PDF
上一页 1 2 33 下一页 到第
使用帮助 返回顶部