期刊文献+
共找到40篇文章
< 1 2 >
每页显示 20 50 100
基于改进双重压缩和激励与多头特征注意力机制的电-热负荷协同预测 被引量:1
1
作者 余强 韩静娴 +4 位作者 杨子梁 宋济东 杨德昌 齐海杰 于芃 《电力自动化设备》 北大核心 2025年第3期201-208,共8页
综合能源系统中负荷多样且存在耦合,为提升负荷预测精度,提出一种基于改进双重注意力机制的分组卷积神经网络-门控循环单元短期电-热负荷协同预测模型。通过改进的压缩和激励注意力为各输入通道加权,再对其进行分组卷积;利用多头特征注... 综合能源系统中负荷多样且存在耦合,为提升负荷预测精度,提出一种基于改进双重注意力机制的分组卷积神经网络-门控循环单元短期电-热负荷协同预测模型。通过改进的压缩和激励注意力为各输入通道加权,再对其进行分组卷积;利用多头特征注意力对卷积结果进行赋权,并利用输入门控循环单元模型对负荷进行预测。算例仿真结果表明,所提模型的平均绝对百分比误差均低于3%。 展开更多
关键词 综合能源系统 负荷预测 分组卷积神经网络 门控循环单元 改进的压缩和激励注意力机制 多头特征注意力机制
在线阅读 下载PDF
基于双注意力图神经网络的链路预测 被引量:2
2
作者 杨真真 林泽龙 杨永鹏 《南京邮电大学学报(自然科学版)》 北大核心 2025年第1期106-114,共9页
链路预测是在图结构中预测未知或潜在的边,对挖掘图中的隐含信息、补全图中的缺失数据和发现图中的新知识都具有重要意义。图神经网络(Graph Neural Network,GNN)已被广泛应用于链路预测,然而,现有基于GNN的链路预测方法存在一些问题:(1... 链路预测是在图结构中预测未知或潜在的边,对挖掘图中的隐含信息、补全图中的缺失数据和发现图中的新知识都具有重要意义。图神经网络(Graph Neural Network,GNN)已被广泛应用于链路预测,然而,现有基于GNN的链路预测方法存在一些问题:(1)大多数基于GNN的方法往往容易忽略为链路预测提供额外帮助的边信息的重要性;(2)大多数基于GNN的方法都仅捕获表示图的邻居节点间相似性的低频信息,忽略了表示邻居节点间差异性的高频信息;(3)大多数基于GNN的方法都未考虑输入特征矩阵的节点维度和特征维度两个维度,只关注其中一个维度。针对这些问题,提出了一种基于双注意力图神经网络(Dual Attention Graph Neural Network,DAGNN)的链路预测方法,该方法包含两条路径,以不同的角度更新节点表示。其中一条是基于图神经网络的路径,采用含边信息的频率自适应图注意力网络(Frequency Adaptive Graph Attention Network with Edge Information,FAGAT⁃EI)作为基础模型,有效地利用边信息增强节点之间的关系,并利用频率自适应机制平衡高低频率邻居信息的权重,从而缓解GNN的过度平滑问题;另一条是基于通道注意力网络的路径,提出了一种新的压缩-激励通道注意力模块(Squeeze and Excitation⁃Channel At⁃tention Module,SE⁃CAM)作为基础模型,充分考虑输入特征矩阵的节点维度和特征维度,并自动学习和调整每个节点的不同特征权重,从而得到更有意义的节点表示。最后在两个基准数据集上进行了实验,实验结果表明,提出的链路预测方法在Last⁃FM和Book⁃Crossing两个数据集上的AUC和ACC指标均优于其他基线模型,展现出了卓越的链路预测性能。 展开更多
关键词 链路预测 图神经网络 注意力机制 压缩-激励模块 频率自适应
在线阅读 下载PDF
基于注意力和挤压-激励Inception的双分支合成语音检测
3
作者 王晗 赵腊生 +2 位作者 张强 程银清 邱泽鹏 《计算机应用》 CSCD 北大核心 2024年第10期3217-3222,共6页
合成语音攻击给人们的生活带来巨大的威胁。为了解决现有模型从冗余信息中提取关键信息能力不足和单一模型无法综合利用多检测模型优势的问题,提出一种基于注意力和挤压-激励(SE)模块Inception(SE-Inc)的双分支(Dual-ABIB)合成语音检测... 合成语音攻击给人们的生活带来巨大的威胁。为了解决现有模型从冗余信息中提取关键信息能力不足和单一模型无法综合利用多检测模型优势的问题,提出一种基于注意力和挤压-激励(SE)模块Inception(SE-Inc)的双分支(Dual-ABIB)合成语音检测模型。首先,基于SincNet(Sinc-based convolutional neural Network)提取的初始特征图训练注意力分支合成语音检测模型,并输出注意力图;其次,将注意力图和初始特征图相乘后再叠加,并将结果作为SE-Inc分支的输入进行训练;最后,通过决策级加权融合处理2个分支获得的分类分数,从而实现合成语音检测。实验结果表明,所提模型在参数量为539×10^(3)的情况下,在ASVspoof2019数据集上获得了0.0332的最小串联检测代价函数(mint-DCF)和1.15%的等错误率(EER);与SE-ResABNet(Squeeze-Excitation ResNet Attention Branch Network)相比,所提模型在参数量仅为它的56%的情况下,min t-DCF和EER分别下降了34.5%和39.2%;同时,在ASVspoof2015和ASVspoof2021数据集上所提模型表现了更好的泛化能力。以上结果验证了所提模型能够在参数量较小的情况下,获得更低的min t-DCF和EER。 展开更多
关键词 注意力机制 挤压-激励模块 双分支 合成语音检测 决策级融合
在线阅读 下载PDF
基于挤压激励的轻量化注意力机制模块 被引量:11
4
作者 吕振虎 许新征 张芳艳 《计算机应用》 CSCD 北大核心 2022年第8期2353-2360,共8页
针对向卷积神经网络(CNN)中嵌入注意力机制模块以提高模型应用精度导致参数和计算量增加的问题,提出基于挤压激励的轻量化高度维度挤压激励(HD-SE)模块和宽度维度挤压激励(WD-SE)模块。为了充分利用特征图中潜在的信息,HD-SE对卷积层输... 针对向卷积神经网络(CNN)中嵌入注意力机制模块以提高模型应用精度导致参数和计算量增加的问题,提出基于挤压激励的轻量化高度维度挤压激励(HD-SE)模块和宽度维度挤压激励(WD-SE)模块。为了充分利用特征图中潜在的信息,HD-SE对卷积层输出的特征图在高度维度上进行挤压激励操作,获得高度维度上的权重信息;而WD-SE在宽度维度上进行挤压激励操作,以得到特征图宽度维度上的权重信息;然后,将得到的权重信息分别应用于对应维度的特征图张量,以提高模型的应用精度。将HD-SE与WD-SE分别嵌入VGG16、ResNet56、MobileNetV1和MobileNetV2模型中,在CIFAR10和CIFAR100数据集上进行的实验结果表明,与挤压激励(SE)模块、协调注意力(CA)模块、卷积块注意力模块(CBAM)和高效通道注意力(ECA)模块等先进的注意力机制模块相比,HD-SE与WDSE在向网络模型中增加的参数和计算量更少的同时得到的精度相似或者更高。 展开更多
关键词 卷积神经网络 挤压激励 轻量化 多维度 注意力机制模块
在线阅读 下载PDF
基于类注意力的眼睛凝视估计网络
5
作者 徐金龙 董明瑞 +2 位作者 李颖颖 刘艳青 韩林 《计算机科学》 CSCD 北大核心 2024年第10期295-301,共7页
近年来,眼睛凝视估计引起广泛关注。基于RGB外观的凝视估计方法使用普通摄像机和深度学习来进行凝视估计,避免了像商用眼动仪一样使用昂贵的红外设备,为更准确和成本更低的眼睛凝视估计提供了可能。然而,RGB外观图像中包含如光照强度、... 近年来,眼睛凝视估计引起广泛关注。基于RGB外观的凝视估计方法使用普通摄像机和深度学习来进行凝视估计,避免了像商用眼动仪一样使用昂贵的红外设备,为更准确和成本更低的眼睛凝视估计提供了可能。然而,RGB外观图像中包含如光照强度、肤色等多种与凝视无关的特征,这些无关特征会在深度学习回归的过程中产生干扰,进而影响凝视估计的精度。针对以上问题,提出了一种名为类注意力网络(CA-Net)的新架构,它包含通道、尺度、眼睛3种不同的类注意力模块,通过这些类注意力模块可以提取和融合不同种类的注意力编码,从而降低与凝视无关特征所占的权重。在GazeCapture数据集上的大量实验表明,在基于RGB外观的凝视估计方法中,相比现有的最先进方法,CA-Net在手机和平板上分别能够提高约0.6%和7.4%的凝视估计精度。 展开更多
关键词 注意力 压缩激励 注意力 多尺度 眼睛凝视估计
在线阅读 下载PDF
基于双分支融合和时频压缩激励的鲁棒语音关键词识别 被引量:1
6
作者 张婷婷 邱泽鹏 +1 位作者 赵腊生 毛嘉莹 《计算机应用研究》 CSCD 北大核心 2024年第12期3658-3663,共6页
现实生活中的噪声会对语音时域和频域信息产生干扰,导致语音关键词识别模型在噪声环境下准确率下降。针对此问题,提出了双分支融合单元,其中时域分支与频域分支以并行的方式提取时域特征和频域特征,降低了串行堆叠时域卷积和频域卷积所... 现实生活中的噪声会对语音时域和频域信息产生干扰,导致语音关键词识别模型在噪声环境下准确率下降。针对此问题,提出了双分支融合单元,其中时域分支与频域分支以并行的方式提取时域特征和频域特征,降低了串行堆叠时域卷积和频域卷积所带来的信息损耗;随后通过交叉融合的方式加强模型对时频信息的感知,进一步增强了模型特征表达能力。同时提出了时频压缩激励模块,通过对时域与频域中信息的重要性分布建模,可以为模型提供选择性关注有价值片段的能力,进一步提高了模型鲁棒性。在Google Command v2-12数据集上,相比于对比模型,所提模型在不同信噪比的测试中取得了更高的识别准确率,且参数量更低;对于训练阶段未涵盖的信噪比条件,所提模型在测试中展现出更高的泛化性。实验结果表明,本文模型在识别准确率和参数量方面更具优势,具有更好的噪声鲁棒性。 展开更多
关键词 关键词识别 双分支融合 时频压缩激励 鲁棒性模型 注意力机制
在线阅读 下载PDF
基于压缩图像与YOLOv5模型的架空输电线路缺陷检测技术 被引量:2
7
作者 刘敏 姜亮 +2 位作者 田杨阳 张璐 陈岑 《沈阳工业大学学报》 北大核心 2025年第2期152-159,共8页
【目的】输电线路作为电能传输和使用过程中的重要环节,其安全稳定对电力系统的正常运行起着至关重要的作用,因此输电线路日常巡检具有重要作用。重大事故通常由微小缺陷隐患发展而来,日常巡检通常采用人工、无人机、可视化通道等手段,... 【目的】输电线路作为电能传输和使用过程中的重要环节,其安全稳定对电力系统的正常运行起着至关重要的作用,因此输电线路日常巡检具有重要作用。重大事故通常由微小缺陷隐患发展而来,日常巡检通常采用人工、无人机、可视化通道等手段,无论何种方式都需要处理大量可视化、红外或者紫外照片。但由于输电线路的特殊性,架设条件涉及多种环境,其巡检图像背景通常较为复杂,采用人工复核审查的方式精度较高,但对经验依赖较大且效率极低。如何快速、准确地识别架空线路巡检图片是架空输电线路缺陷识别的关键。传统输电线路巡检图片识别方法在复杂背景的干扰下,容易出现缺陷识别精确度不高的问题。【方法】为提高架空输电线路巡检图像复杂背景下的检测准确率,提出了一种兼顾识别效率和准确性的缺陷检测方法。基于压缩图像技术并结合YOLOv5模型,设计了一种基于稀疏卷积的非对称特征聚合压缩算法,将原始图像通过编码减少图像存储所需空间以便于存储和传输,经过信息通道传输到解密器后,再将压缩图像进行解码复原以提升局部集合特征的学习效率。同时,通过融入通道空间注意力模块从特征图中得到注意力通道权重矩阵和空间权重矩阵,并通过权重矩阵判断特征图区域的重要程度,完成对YOLOv5模型处理效率的提升。【结果】将压缩恢复后的图像输入改进YOLOv5模型中,利用通道注意力模块(CAM)和空间注意力模块(SAM)分别对图像进行通道与空间上的注意力数据处理,通过全局平均池化和最大池化处理增强目标区域的特征,并引入空间注意力模块增强通道注意力对特征位置信息的关注,以检测出存在缺陷的设备,并通过实验验证了方法的有效性。【结论】以某架空线路的巡检图像数据集为基础,对检测方法开展训练与测试,结果表明,巡检图像经所提技术压缩后,尺寸明显减小,恢复后的图像尺寸较原图约降低了3 MB且未出现失真;改进YOLOv5模型具有较高的检测精确度,其检测准确率和时间分别为0.91和0.87 s,算法在降低图像尺寸提升检测速度的同时保证了检测准确率。 展开更多
关键词 架空输电线路 缺陷检测 图像压缩 改进YOLOv5模型 非对称特征聚合编解码网络 通道空间注意力模块 逐通道稀疏残差卷积 检测准确率
在线阅读 下载PDF
融合Transformer和级联聚合模块的细胞分割算法
8
作者 杨国亮 王乾琛 +1 位作者 耿珍 熊文楷 《计算机工程与应用》 北大核心 2025年第17期292-303,共12页
针对细胞形态不规则、大小差异大、目标区域密度高和目标区域受到遮挡干扰等问题,提出一种融合Transformer和级联聚合模块肠镜活检组织细胞分割算法。运用金字塔视觉变压器PVTv2作为主干特征提取网络,逐层地提取细胞图像的空间细节和语... 针对细胞形态不规则、大小差异大、目标区域密度高和目标区域受到遮挡干扰等问题,提出一种融合Transformer和级联聚合模块肠镜活检组织细胞分割算法。运用金字塔视觉变压器PVTv2作为主干特征提取网络,逐层地提取细胞图像的空间细节和语义信息,构建特征信息之间的长期交互。设计级联聚合模块,不断将高维信息向低维映射来完成全局空间信息与语义信息的融合,同时依靠输入依赖的深度卷积来聚合局部信息,完成特征信息的全面融合。构造混合压缩注意力机制,减少通道维度特征信息冗余并聚焦有效信息,增强空间感知能力,有效减少遮挡和噪声的干扰。在EBHI-Seg数据集上进行实验,并在其子数据集Low-grade IN和Serratedadenoma上取得最佳结果,Dice相似系数和Jaccard指数分别达到93.00%、93.75%和87.21%、88.44%。实验结果表明,该算法能够有效解决细胞分割中被遮挡问题和目标区域细胞过于密集等问题,分割性能较已有算法有所提升。 展开更多
关键词 肠镜活检组织细胞 TRANSFORMER 级联聚合模块 混合压缩注意力机制
在线阅读 下载PDF
基于通道注意力和边缘融合的伪装目标分割方法 被引量:3
9
作者 詹春兰 王安志 王明辉 《计算机应用》 CSCD 北大核心 2023年第7期2166-2172,共7页
伪装目标分割(COS)的目标是从背景中分离出隐藏的目标对象。近年来,基于卷积神经网络(CNN)的伪装目标检测(COD)发展迅速,然而仍存在无法从前/背景高度相似的场景中准确地检测出完整目标对象的问题。针对上述问题,提出一种基于通道注意力... 伪装目标分割(COS)的目标是从背景中分离出隐藏的目标对象。近年来,基于卷积神经网络(CNN)的伪装目标检测(COD)发展迅速,然而仍存在无法从前/背景高度相似的场景中准确地检测出完整目标对象的问题。针对上述问题,提出一种基于通道注意力(CA)和边缘融合的COS方法CANet(Network based on Channel Attention and edge fusion),以得到伪装目标的边缘细节更清晰的完整分割结果。首先,引入压缩和激励(SE)注意力模块,以提取更丰富的高级语义特征;其次,提出一个边缘融合模块,抑制低级特征中的干扰,并充分利用图像的边缘细节信息;最后,设计了基于深度可分离卷积的通道注意力模块,以自上而下的方式逐步融合跨级的多尺度特征,进一步地提升检测精度和效率。在多个公开的COD数据集上的实验结果表明,相较于SINet(Search Identification Net)、TINet(Textureaware Interactive guidance Network)和C2FNet(Context-aware Cross-level Fusion Network)等8种主流的方法,CANet表现更佳,且能够获取到丰富的伪装目标内部及边缘细节信息,而且在具有挑战性的COD10K数据集上结构度量指标相较于SINet提升了2.6个百分点。CANet性能优越,适用于医学上检测与人体组织相似的病灶区域、军事领域检测隐蔽目标等相关领域。 展开更多
关键词 伪装目标分割 边缘融合 压缩和激励注意力模块 深度可分离卷积 多尺度特征
在线阅读 下载PDF
融合残差及通道注意力机制的单幅图像去雨方法 被引量:6
10
作者 张世辉 闫晓蕊 桑榆 《计量学报》 CSCD 北大核心 2021年第1期20-28,共9页
为了去除雨天图像上附着的雨滴并恢复图像的清晰度,提出一种基于深度学习思想结合图像增强技术融合残差及通道注意力机制来实现的单幅图像去雨方法。首先,利用导向滤波将有雨图像分解为平滑基本层和高频细节层;其次,提出自适应Gamma校... 为了去除雨天图像上附着的雨滴并恢复图像的清晰度,提出一种基于深度学习思想结合图像增强技术融合残差及通道注意力机制来实现的单幅图像去雨方法。首先,利用导向滤波将有雨图像分解为平滑基本层和高频细节层;其次,提出自适应Gamma校正算法增强平滑基本层以提高对比度;然后,构建融合残差块和通道注意力机制的深度神经网络实现高频细节层去雨;最后,将去雨后的高频细节层与增强后的平滑基本层融合实现单幅图像去雨功能。实验结果表明:与具有代表性的单幅图像去雨方法相比,所提方法效果较好并可保留更多的图像细节信息。 展开更多
关键词 计量学 单幅图像去雨 图像处理 压缩和激励残差网络 注意力机制 深度学习 GAMMA校正
在线阅读 下载PDF
基于U-Net多尺度自校准注意力视网膜分割算法 被引量:5
11
作者 梁礼明 陈鑫 +1 位作者 周珑颂 余洁 《计算机应用研究》 CSCD 北大核心 2023年第3期943-948,共6页
针对视网膜细小血管分割精度低的问题,提出一种融合可伸缩级联模块、Transformer和自校准注意力的改进U-Net算法以提高细小血管分割精度。首先在编码阶段利用可伸缩级联模块,先行学习复杂多变的视网膜血管拓扑结构。然后在解码阶段提出... 针对视网膜细小血管分割精度低的问题,提出一种融合可伸缩级联模块、Transformer和自校准注意力的改进U-Net算法以提高细小血管分割精度。首先在编码阶段利用可伸缩级联模块,先行学习复杂多变的视网膜血管拓扑结构。然后在解码阶段提出一种自校准注意力机制,利用多尺度挤压激励模块,自适应对特征图通道和空间之间特征重要性进行校准,增强目标区域特征响应,抑制背景噪声。最后使用Transformer特征提取块,提高特征空间映射能力。基于DRIVE和CHASEDB1数据集的实验结果表明,所提算法准确率分别为96.49%和96.67%,灵敏度分别为83.75%和83.30%,特异性分别为98.28%和98.01%,AUC分别为0.987 1和0.987 2,所提算法的整体性能优于现有算法,各模块能够有效提高细小血管分割能力。 展开更多
关键词 视网膜分割 可伸缩级联模块 自校准注意力 Transformer特征提取 多尺度挤压激励模块
在线阅读 下载PDF
基于注意力机制和混合网络的小群体情绪识别 被引量:6
12
作者 季欣欣 邵洁 钱勇生 《计算机工程与设计》 北大核心 2020年第6期1683-1688,共6页
针对自然状态下小群体图像的情绪分类,提出基于面部、场景和骨架3种视觉线索的混合深度网络,分别利用3类卷积神经网络(convolutional neural networks,CNN)分支独立学习,通过决策融合获得最终的情绪分类。其中面部CNN通过注意力机制学... 针对自然状态下小群体图像的情绪分类,提出基于面部、场景和骨架3种视觉线索的混合深度网络,分别利用3类卷积神经网络(convolutional neural networks,CNN)分支独立学习,通过决策融合获得最终的情绪分类。其中面部CNN通过注意力机制学习不同人脸的权重,获得整张图片关于人脸的特征表示,利用large-margin softmax(L-softmax)损失函数进行判别性学习;使用先进的姿势估计方法OpenPose获得图像中所有人体骨架,作为基于骨架卷积神经网络的输入。考虑图片的场景信息,将整张图片作为基于场景CNN的输入。实验结果表明,改进模型对自然状态下3种类型的小群体情绪识别鲁棒,取得了较高的准确率。 展开更多
关键词 小群体情绪识别 场景理解 混合网络 注意力机制 大边缘损失函数 压缩和奖惩网络模块
在线阅读 下载PDF
基于注意力生成对抗网络的图像强光去除
13
作者 赵心驰 姜策 何为 《中国科学院大学学报(中英文)》 CSCD 北大核心 2022年第4期524-531,共8页
图像中的强光在一定程度上会降低图像的质量,本文致力于从受到强光影响的图像中去除强光并生成清晰图像。为解决这个问题,提出一种带有注意力辅助模块的生成对抗网络。它主要由加入压缩-激励模块的卷积长短期记忆网络和注意力矩阵辅助... 图像中的强光在一定程度上会降低图像的质量,本文致力于从受到强光影响的图像中去除强光并生成清晰图像。为解决这个问题,提出一种带有注意力辅助模块的生成对抗网络。它主要由加入压缩-激励模块的卷积长短期记忆网络和注意力矩阵辅助模块组成,注意力辅助模块可以指导自动编码器生成清晰的图像。该方法可以轻松地移植处理其他类似的图像恢复问题。实验证明,改进后的网络体系结构是有效的并且有一定的意义。 展开更多
关键词 生成对抗网络 注意力矩阵辅助 压缩-激励模块 图像恢复 强光去除
在线阅读 下载PDF
基于增强型多尺度残差生成对抗网络的图像压缩 被引量:1
14
作者 马婷 刘友鑫 +2 位作者 胡峰 聂伟 吴建芳 《计算机工程与设计》 北大核心 2024年第8期2415-2422,共8页
为解决低码率下更符合人类视觉感知的图像压缩,提出一种基于增强型多尺度残差生成对抗网络的有损压缩方法。在网络框架的自动编码器中,使用一种结构上改进的增强型多尺度残差块,其可以扩大感受野,更容易获得图像的全局信息。引入简易注... 为解决低码率下更符合人类视觉感知的图像压缩,提出一种基于增强型多尺度残差生成对抗网络的有损压缩方法。在网络框架的自动编码器中,使用一种结构上改进的增强型多尺度残差块,其可以扩大感受野,更容易获得图像的全局信息。引入简易注意力模块,帮助网络更加关注图像复杂的部分,减少简单部分的比特。判别器部分采用全新的相对平均判别器,在网络框架中使用LPIPS(learned perceptual image patch similarity)感知损失减轻图像伪影问题。采用两阶段训练的方式解决引入生成对抗网络导致训练不稳定的问题。实验结果表明了在低码率下所提模型的有效性,与之前的工作相比,所提方法在感知失真指标上表现更优,性能提升了65%左右,重建图像更符合人类视觉感知。 展开更多
关键词 低码率 图像压缩 生成对抗网络 多尺度残差块 注意力模块 相对平均判别器 感知损失
在线阅读 下载PDF
基于改进YOLOv8的实时坑槽检测算法
15
作者 马荣贵 黄训燕 董世浩 《计算机工程》 北大核心 2025年第11期226-234,共9页
针对道路坑槽检测中存在坑槽大小不同、形状不规则导致的特征提取不完全及图像拍摄不满足道路检测车的视角问题,收集并制作不同来源、视角和像素分辨率的坑槽数据集,并对模型进行改进。首先在Backbone部分的C2f结构中引入DCNv3,以获取... 针对道路坑槽检测中存在坑槽大小不同、形状不规则导致的特征提取不完全及图像拍摄不满足道路检测车的视角问题,收集并制作不同来源、视角和像素分辨率的坑槽数据集,并对模型进行改进。首先在Backbone部分的C2f结构中引入DCNv3,以获取更丰富完整的坑槽特征;其次融合压缩和激励(SE)模块的注意力机制,以提高对坑槽特征的提取能力;然后在Neck部分融合双向特征金字塔网络(BiFPN)结构,降低网络的计算量;最后使用Focal-EIoU作为改进模型的损失函数,降低复杂背景对网络检测性能的影响。改进后的YOLOv8-master网络相较于未改进前的网络,坑槽检测精度提高了4.06%,检测速度提高了85帧/s,浮点运算量降低了19.54%。结果表明,所提出的改进方法能有效提高原网络检测坑槽的性能,相比目前主流的目标检测算法,具有一定的先进性。 展开更多
关键词 坑槽检测 可变形卷积 压缩和激励模块 双向特征金字塔网络 Focal-EIoU损失函数
在线阅读 下载PDF
基于ASP-SERes2Net的说话人识别算法 被引量:1
16
作者 令晓明 陈鸿雁 +1 位作者 张小玉 张真 《北京工业大学学报》 CAS 北大核心 2025年第1期42-50,共9页
为提升说话人识别的特征提取能力,解决在噪声环境下识别率低的问题,提出一种基于残差网络的说话人识别算法——ASP-SERes2Net。首先,采用梅尔语谱图作为神经网络的输入;其次,改进Res2Net网络的残差块,并且在每个残差块后引入压缩激活(sq... 为提升说话人识别的特征提取能力,解决在噪声环境下识别率低的问题,提出一种基于残差网络的说话人识别算法——ASP-SERes2Net。首先,采用梅尔语谱图作为神经网络的输入;其次,改进Res2Net网络的残差块,并且在每个残差块后引入压缩激活(squeeze-and-excitation,SE)注意力模块;然后,用注意力统计池化(attention statistics pooling,ASP)代替原来的平均池化;最后,采用附加角裕度的Softmax(additive angular margin Softmax,AAM-Softmax)对说话人身份进行分类。通过实验,将ASP-SERes2Net算法与时延神经网络(time delay neural network,TDNN)、ResNet34和Res2Net进行对比,ASP-SERes2Net算法的最小检测代价函数(minimum detection cost function,MinDCF)值为0.0401,等误率(equal error rate,EER)为0.52%,明显优于其他3个模型。结果表明,ASP-SERes2Net算法性能更优,适合应用于噪声环境下的说话人识别。 展开更多
关键词 说话人识别 梅尔语谱图 Res2Net 压缩激活(squeeze-and-excitation SE)注意力模块 注意力统计池化(attention statistics pooling ASP) 附加角裕度的Softmax(additive angular margin Softmax AAM-Softmax)
在线阅读 下载PDF
增强自适应TCN的柴油发动机剩余寿命预测模型
17
作者 张曦 杨颖 +1 位作者 陈超君 王春风 《计算机工程与设计》 北大核心 2025年第7期2071-2080,共10页
时间卷积网络在剩余使用寿命预测方面取得了显著进展,但现有模型没有考虑输入特征在不同时间步和通道的重要性,以及网络结构固定,无法灵活学习深度时间表示。针对这些问题,提出一种增强自适应时间卷积网络(EATCN)。通过改进的自注意力... 时间卷积网络在剩余使用寿命预测方面取得了显著进展,但现有模型没有考虑输入特征在不同时间步和通道的重要性,以及网络结构固定,无法灵活学习深度时间表示。针对这些问题,提出一种增强自适应时间卷积网络(EATCN)。通过改进的自注意力模块对输入特征的不同时间步进行加权,采用压缩激励模块对长期特征的不同通道进行加权。自适应时间卷积网络能够动态调整网络结构,更好地提取深层长期时间特征。在某柴油发动机制造商两个真实的数据集上进行实验,实验结果验证了所提模型的有效性。 展开更多
关键词 剩余使用寿命预测 时间卷积网络 注意力机制 压缩激励 滑动窗口 指数平滑 归一化
在线阅读 下载PDF
基于SE模块和ResNet的番茄病虫害识别方法 被引量:14
18
作者 胡文艺 王洪坤 杜育佳 《农业工程》 2022年第9期33-40,共8页
番茄病虫害是引起番茄减产的重要因素。精确识别病虫害种类是当前国际热点问题之一,有助于及时有效采取针对性的病虫防治办法,减少和避免因番茄减产导致的经济损失。针对传统虫害识别方法存在效率和精确率低的问题,利用Kaggle网站上的To... 番茄病虫害是引起番茄减产的重要因素。精确识别病虫害种类是当前国际热点问题之一,有助于及时有效采取针对性的病虫防治办法,减少和避免因番茄减产导致的经济损失。针对传统虫害识别方法存在效率和精确率低的问题,利用Kaggle网站上的Tomato数据集,构建基于压缩和激励(SE)模块的深度残差网络模型(ResNet),优化番茄病虫害识别方法。结果表明:通过Pytorch框架下的迁移学习,改进后的网络模型对番茄病虫害图像的平均识别准确率最高为97.96%;基于SE模块的ResNet网络模型有助于增强特征区分能力,增加模型的通用性和鲁棒性。研究结果对番茄病虫害的及时监测和处理、提高番茄产量具有重要意义。 展开更多
关键词 番茄 病虫害识别 迁移学习 压缩和激励模块 深度残差网络模型 Pytorch
在线阅读 下载PDF
基于MTF-DARCNN的滚动轴承故障诊断方法
19
作者 金岩 缪成翔 《机电工程》 北大核心 2025年第11期2084-2095,共12页
针对传统卷积神经网络模型由于滚动轴承的负载或转速变化而导致故障识别性能下降这一问题,提出了一种创新的基于马尔科夫转移场(MTF)与双注意力残差卷积神经网络(DARCNN)的轴承故障诊断方法。首先,采用MTF将原始信号转换为具有时间相关... 针对传统卷积神经网络模型由于滚动轴承的负载或转速变化而导致故障识别性能下降这一问题,提出了一种创新的基于马尔科夫转移场(MTF)与双注意力残差卷积神经网络(DARCNN)的轴承故障诊断方法。首先,采用MTF将原始信号转换为具有时间相关性的二维图像,这种转换有助于更好地捕捉信号的时序特征;然后,构建了压缩和激励-多尺度注意力模块(SE-MSAM),该模块能够有效提取不同尺度下的特征信息,以增强模型对多层次特征的理解;接着,设计了轻量级残差模块(LRM),该模块不仅降低了计算复杂度,还提升了特征学习的有效性,增强了模型的整体性能;最后,引入全局注意力模块(GAM)提升了特征区分,基于此开发MTF-DARCNN方法用于轴承故障诊断;并采用了美国凯斯西储大学及本实验室机械故障模拟(MFS)轴承数据集,在变工况条件下,对模型故障诊断的鲁棒性与泛化性能进行了实验验证。研究结果表明:MTF-DARCNN方法在变负载和变转速的工况下,平均识别准确率分别达到了99%和98.47%;此外,在不同工况下,该方法的诊断稳定性也明显优于其他诊断方法;这些高准确率的结果充分验证了MTF-DARCNN方法不仅具备卓越的故障识别能力,还展现了在面对多样化工况挑战时的更高泛化能力。这意味着在工况变化的条件下,该方法能有效进行故障诊断,确保设备的正常运行。 展开更多
关键词 轴承故障识别准确率 马尔科夫转移场 注意力残差卷积神经网络 压缩和激励-多尺度注意力模块 轻量级残差模块 全局注意力模块 机械故障模拟
在线阅读 下载PDF
基于深度学习的太阳黑子群磁类型分类
20
作者 尹耀 李依洋 +6 位作者 黄狮勇 徐思博 袁志刚 吴红红 姜奎 熊启洋 林仁桐 《空间科学学报》 北大核心 2025年第2期253-265,共13页
太阳活动作为太阳大气层中能量释放和物质运动的显著表现形式,是空间天气的主要扰动源,以太阳黑子为代表的剧烈太阳活动可能导致近地空间环境的剧烈变化,进而对人类的生产生活产生深远影响.准确、高效地预报空间天气有助于减少其对人类... 太阳活动作为太阳大气层中能量释放和物质运动的显著表现形式,是空间天气的主要扰动源,以太阳黑子为代表的剧烈太阳活动可能导致近地空间环境的剧烈变化,进而对人类的生产生活产生深远影响.准确、高效地预报空间天气有助于减少其对人类生产生活的影响.本文利用2010-2017年太阳动力学天文台(Solar Dynamics Observatory,SDO)搭载的HMI仪器观测的连续谱图和磁图数据,建立了基于压缩激励模块和深度残差网络的太阳黑子威尔逊山磁类型分类模型.为了有效避免因时间序列连续性导致的模型过拟合问题,采用时序分割法划分数据集,并结合太阳黑子图像的特点应用了数据增强策略,以提高模型的泛化能力.结果表明,提出的模型能够较准确地完成太阳黑子磁分类任务,尤其是在复杂类型黑子的识别方面,相较于传统方法其识别能力得到了显著的提升.此外,使用类激活映射方法对测试集样本进行了可视化研究,分析了模型提取到的特征图像和分类依据,从而提高模型的可解释性. 展开更多
关键词 太阳黑子 深度残差网络 压缩激励模块 数据增强 类激活映射
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部