期刊文献+
共找到19篇文章
< 1 >
每页显示 20 50 100
基于窗口自注意力网络与YOLOv5融合的输电线路通道异物检测 被引量:1
1
作者 薛昂 姜恩宇 +2 位作者 张文涛 林顺富 米阳 《上海交通大学学报》 北大核心 2025年第3期413-423,共11页
针对输电线路通道异物检测背景复杂以及小目标情况下检测效果不佳等问题,提出一种基于窗口自注意力网络与YOLOv5模型融合的输电线路通道安全检测算法.首先,选用窗口自注意力(S-T)网络优化主干网络,扩大模型感受视野,增强提取有效信息的... 针对输电线路通道异物检测背景复杂以及小目标情况下检测效果不佳等问题,提出一种基于窗口自注意力网络与YOLOv5模型融合的输电线路通道安全检测算法.首先,选用窗口自注意力(S-T)网络优化主干网络,扩大模型感受视野,增强提取有效信息的能力.其次,改进自适应空间特征融合(ASFF)模块,增强多尺度特征融合能力.最后,考虑到真实框与预测框不匹配的问题,引入结构相似性交并比(SIoU),优化边界误差,提高小目标定位准确性.实验结果表明,本文模型对线路通道多目标入侵检测精度达到90.2%,且提升了小目标检测效果;与主流目标检测算法相比,可以更好地满足输电线路通道中的异物检测需求. 展开更多
关键词 智能化巡检 输电线路通道 目标检测 窗口自注意力网络 自适应空间特征融合
在线阅读 下载PDF
基于多尺度伸缩卷积与注意力机制的光伏组件缺陷分割算法
2
作者 党宁 李世峰 于坤義 《电子技术应用》 2025年第4期66-71,共6页
无人机在光伏系统的巡检过程中需要对光伏组件的缺陷进行准确和快速识别,为此提出了一种基于多尺度伸缩卷积与注意力机制的光伏组件缺陷分割网络。首先在传统的U-Net网络每个Stage加入多尺度伸缩卷积模块,从而对光伏组件缺陷进行分割,P... 无人机在光伏系统的巡检过程中需要对光伏组件的缺陷进行准确和快速识别,为此提出了一种基于多尺度伸缩卷积与注意力机制的光伏组件缺陷分割网络。首先在传统的U-Net网络每个Stage加入多尺度伸缩卷积模块,从而对光伏组件缺陷进行分割,PA达到了98.61%,与传统U-Net、FCN网络进行对比分析,准确率分别提高了0.32%和1.17%,算法消耗时间0.054 s,相较于对比的分割算法提高了0.006 s~0.013 s;然后将分割后的缺陷掩码mask和原图进行与操作,最后通过轻量级网络MobileNetV3对光伏组件缺陷(热斑、裂缝、鸟粪)进行检测并分类,精确率达到了98.82%,与SqueezeNet、ShuffleNet V2和GhostNet网络进行对比,分别提高了0.43%、1.08%和0.8%,平均检测时间0.026s,相较于对比的检测算法提高了0.002s~0.036s。实验结果表明基于多尺度伸缩卷积与注意力机制的光伏组件缺陷分割网络具有较高的准确率和识别速率。 展开更多
关键词 光伏组件缺陷 注意力机制 多尺度伸缩卷积 U-net网络 MobileNetV3网络
在线阅读 下载PDF
一种基于时空频多维特征的短时窗口脑电听觉注意解码网络
3
作者 王春丽 李金絮 +2 位作者 高玉鑫 王晨名 张珈豪 《电子与信息学报》 北大核心 2025年第3期814-824,共11页
在鸡尾酒会场景中,听力正常的人有能力选择性地注意特定的说话者语音,但听力障碍者在这种场景中面临困难。听觉注意力解码(AAD)的目的是通过分析听者的脑电信号(EEG)响应特征来推断听者关注的是哪个说话者。现有的AAD模型只考虑脑电信... 在鸡尾酒会场景中,听力正常的人有能力选择性地注意特定的说话者语音,但听力障碍者在这种场景中面临困难。听觉注意力解码(AAD)的目的是通过分析听者的脑电信号(EEG)响应特征来推断听者关注的是哪个说话者。现有的AAD模型只考虑脑电信号的时域或频域单个特征或二者的组合(如时频特征),而忽略了时-空-频域特征之间的互补性,这在一定程度上限制了模型的分类能力,进而影响了模型在决策窗口上的解码精度。同时,已有AAD模型大多在长时决策窗口(1~5 s)中有较高的解码精度。该文提出一种基于时-空-频多维特征的短时窗口脑电信号听觉注意解码网络(TSF-AADNet),用于提高短时决策窗口(0.1~1 s)的解码精度。该模型由两个并行的时空、频空特征提取分支以及特征融合和分类模块组成,其中,时空特征提取分支由时空卷积块和高阶特征交互模块组成,频空特征提取分支采用基于频空注意力的3维卷积模块(FSA-3DCNN),最后将双分支网络提取的时空和频空特征进行融合,得到最终的听觉注意力二分类解码结果。实验结果表明,TSF-AADNet模型在听觉注意检测数据集KULeuven(KUL)和听觉注意检测的脑电和音频数据集(DTU)的0.1 s决策窗口下,解码精度分别为91.8%和81.1%,与最新的AAD模型一种基于时频融合的双分支并行网络(DBPNet)相比,分别提高了5.40%和7.99%。TSF-AADNet作为一种新的短时决策窗口的AAD模型,可为听力障碍诊断以及神经导向助听器研发提供有效参考。 展开更多
关键词 脑电信号 听觉注意力解码 短时决策窗口 时空频特征 神经导向助听器
在线阅读 下载PDF
改进自注意力机制的滚动轴承寿命预测方法
4
作者 史竞成 吴占涛 +1 位作者 程军圣 杨宇 《噪声与振动控制》 北大核心 2025年第2期90-96,104,共8页
针对现有的卷积、循环模型预测滚动轴承剩余使用寿命(Residual Life,RL)精度低的问题,提出一种基于改进自注意力机制的RL预测模型。首先,针对Transformer模型中自注意力机制内存占用高、信号存在噪声信息的问题,在窗口自注意力机制(Wind... 针对现有的卷积、循环模型预测滚动轴承剩余使用寿命(Residual Life,RL)精度低的问题,提出一种基于改进自注意力机制的RL预测模型。首先,针对Transformer模型中自注意力机制内存占用高、信号存在噪声信息的问题,在窗口自注意力机制(Window Based Multi-head Self-attention,W-MSA)的基础上,提出概率窗口自注意力机制(Probwindow Based Multi-head Self-attention,PW-MSA);然后,针对多头信息不匹配和缺少局部信息的问题,采用Talking Head方法实现多头信息融合,并在前馈神经网络层加入深度可分离卷积提取局部信息,从而提升模型的预测精度。采用PHM2012轴承数据集将改进前后的自注意力机制模型进行比较,并和现有的先进预测模型对比,结果表明,改进自注意力机制模型可使预测精度提升13.04%。 展开更多
关键词 故障诊断 滚动轴承 剩余使用寿命预测 概率窗口自注意力机制 Transformer模型
在线阅读 下载PDF
基于卷积辅助自注意力的胸部疾病分类网络
5
作者 张自然 李锵 关欣 《浙江大学学报(工学版)》 北大核心 2025年第5期890-901,共12页
针对胸部X光影像中的病变大小不一,纹理复杂,且存在相互影响等问题,提出基于卷积辅助窗口自注意力的胸部X光影像疾病分类网络CAWSNet.使用Swin Transformer作为骨干网络,以窗口自注意力建模长距离视觉依赖关系,通过引入卷积辅助,在弥补... 针对胸部X光影像中的病变大小不一,纹理复杂,且存在相互影响等问题,提出基于卷积辅助窗口自注意力的胸部X光影像疾病分类网络CAWSNet.使用Swin Transformer作为骨干网络,以窗口自注意力建模长距离视觉依赖关系,通过引入卷积辅助,在弥补其缺陷的同时,强化局部特征提取能力.引入图像相对位置编码,通过有向相对位置的动态计算,帮助网络更好地建模像素间的位置关系.使用类别残差注意力,根据疾病类别来调整分类器关注的区域,突出有效信息,提高多标签分类能力.提出动态难度损失函数,解决不同疾病分类的难度差异大,数据集中正负样本不平衡的问题.在公开数据集ChestX-Ray14、CheXpert和MIMIC-CXR-JPG上的实验结果表明,提出CAWSNet的AUC分数分别达到0.853、0.898和0.819,表明该网络在胸部X光影像疾病诊断中的有效性和鲁棒性. 展开更多
关键词 胸部X光图像分类 窗口自注意力 卷积 图像相对位置编码 动态难度损失函数
在线阅读 下载PDF
SW-SAN:基于Seq2Seq结合注意力机制与滑动窗口的车辆轨迹预测模型 被引量:1
6
作者 朱云鹤 刘明剑 +1 位作者 祝朗千 李沐阳 《现代电子技术》 北大核心 2024年第11期175-180,共6页
针对长时间内4~5 s车辆轨迹预测精度较差的问题,提出基于Seq2Seq结合注意力机制与滑动窗口的车辆轨迹预测模型(SW-SAN)。首先,使用滑动窗口的方法更新历史轨迹状态集合,利用编码器对目标车辆的历史轨迹数据编码,得到历史轨迹特征向量;其... 针对长时间内4~5 s车辆轨迹预测精度较差的问题,提出基于Seq2Seq结合注意力机制与滑动窗口的车辆轨迹预测模型(SW-SAN)。首先,使用滑动窗口的方法更新历史轨迹状态集合,利用编码器对目标车辆的历史轨迹数据编码,得到历史轨迹特征向量;其次,经过注意力机制计算历史时间内各时刻的关联性得分、时间注意力权重因子和历史时间相关性特征向量;最后,解码器将历史时间相关性特征向量作为输入,多次循环解码层,输出目标车辆的未来预测轨迹。实验结果表明,SW-SAN模型在4 s和5 s时预测轨迹的RMSE误差为1.99 m和1.94 m,SW-SAN模型在较长时间4~5 s的预测误差更低,在车辆轨迹预测问题上性能更强。 展开更多
关键词 交通工程 轨迹预测 深度学习 编-解码器结构 注意力机制 滑动窗口
在线阅读 下载PDF
基于位移窗口自注意力网络和迁移学习的地震面波分离
7
作者 杨晨睿 沈鸿雁 +2 位作者 车晗 孙云鹏 刘帅 《西安石油大学学报(自然科学版)》 CAS 北大核心 2024年第6期39-50,共12页
反射地震资料中的面波也携带了丰富的地质信息,充分利用这类面波解决地质问题的前提条件是将其完整地分离出来。针对现有深度学习方法没有充分利用面波与体波表现在时空域图像中的分布位置和纹理细节等问题,提出一种基于深度学习的地震... 反射地震资料中的面波也携带了丰富的地质信息,充分利用这类面波解决地质问题的前提条件是将其完整地分离出来。针对现有深度学习方法没有充分利用面波与体波表现在时空域图像中的分布位置和纹理细节等问题,提出一种基于深度学习的地震面波分离方法。通过融合位移窗口自注意力机制和U-net主干网络,构建出面波智能分离网络,并使用数据增广后的模拟数据与实际数据构建面波数据集来提升神经网络的泛化性;在充分利用面波全局数据特征的同时,为避免波场分离过程中的面波损伤问题,提出一种对边界、结构和纹理信息敏感的混合损失函数以进一步提高面波分离的质量。通过数值模拟地震记录测试了本文方法的正确性,进而将该方法应用于实际地震资料处理。研究结果表明,在模拟地震记录训练的模型基础上进行迁移学习,可进一步提升神经网络的泛化性;相较于低通滤波法和去噪卷积神经网络方法,本文方法分离的面波更为完整,能大幅度提高能量混叠区域的面波分离质量。 展开更多
关键词 地震信号处理 面波 波场分离与去噪 深度学习 窗口自注意力网络 U-net网络 迁移学习
在线阅读 下载PDF
基于窗口自注意力网络的单图像去雨算法 被引量:5
8
作者 高涛 文渊博 +1 位作者 陈婷 张静 《上海交通大学学报》 EI CAS CSCD 北大核心 2023年第5期613-623,共11页
单图像去雨研究旨在利用退化的雨图恢复出无雨图像,而现有的基于深度学习的去雨算法未能有效地利用雨图的全局性信息,导致去雨后的图像损失部分细节和结构信息.针对此问题,提出一种基于窗口自注意力网络(Swin Transformer)的单图像去雨... 单图像去雨研究旨在利用退化的雨图恢复出无雨图像,而现有的基于深度学习的去雨算法未能有效地利用雨图的全局性信息,导致去雨后的图像损失部分细节和结构信息.针对此问题,提出一种基于窗口自注意力网络(Swin Transformer)的单图像去雨算法.该算法网络主要包括浅层特征提取模块和深度特征提取网络两部分.前者利用上下文信息聚合输入来适应雨痕分布的多样性,进而提取雨图的浅层特征.后者利用Swin Transformer捕获全局性信息和像素点间的长距离依赖关系,并结合残差卷积和密集连接强化特征学习,最后通过全局残差卷积输出去雨图像.此外,提出一种同时约束图像边缘和区域相似性的综合损失函数来进一步提高去雨图像的质量.实验表明,与目前单图像去雨表现优秀的算法MSPFN、 MPRNet相比,该算法使去雨图像的峰值信噪比提高0.19 dB和2.17 dB,结构相似性提高3.433%和1.412%,同时网络模型参数量下降84.59%和34.53%,前向传播平均耗时减少21.25%和26.67%. 展开更多
关键词 计算机视觉 单图像去雨 窗口自注意力网络 残差网络 自注意力机制 空洞卷积
在线阅读 下载PDF
基于局部窗口交叉注意力的轻量型语义分割 被引量:2
9
作者 金祖亮 隗寒冰 +2 位作者 Zheng Liu 娄路 郑国峰 《汽车工程》 EI CSCD 北大核心 2023年第9期1617-1625,共9页
在自动驾驶汽车环境感知任务中,采用环视相机在统一鸟瞰图(bird′s eye view,BEV)坐标系下对车道线、车辆等目标进行语义分割受到广泛关注。针对相机个数增加致使任务推理延迟线性上升、实时性难以完成语义分割任务的难题,本文提出一种... 在自动驾驶汽车环境感知任务中,采用环视相机在统一鸟瞰图(bird′s eye view,BEV)坐标系下对车道线、车辆等目标进行语义分割受到广泛关注。针对相机个数增加致使任务推理延迟线性上升、实时性难以完成语义分割任务的难题,本文提出一种基于局部窗口交叉注意力的轻量型语义分割方法。采用改进型EdgeNeXt骨干网络提取特征,通过构建BEV查询和图像特征之间的局部窗口交叉注意力,完成对跨相机透视图之间的特征查询,然后对融合后的BEV特征图通过上采样残差块对BEV特征解码,以得到BEV语义分割结果。在nuScenes公开数据集上的实验结果表明,该方法在BEV地图静态车道线分割任务中平均IoU达到35.1%,相较于表现较好的HDMapNet提高2.2%,推理速度相较于较快的GKT提高58.2%,帧率达到106 FPS。 展开更多
关键词 鸟瞰图 语义分割 局部窗口 交叉注意力
在线阅读 下载PDF
Kubernetes容器云的弹性伸缩方法
10
作者 李佳颖 杨泽民 +1 位作者 宋哲代 朱金荣 《电子科技》 2025年第3期32-39,共8页
Kubernetes容器云是当前流行的云计算技术,其默认的弹性伸缩方法HPA(Horizontal Pod Autoscaler)能对云原生应用进行横向扩缩容。但该方法存在以下问题:基于单一负载指标,使其难以适用于多样化云原生应用;基于当前负载进行弹性伸缩,使... Kubernetes容器云是当前流行的云计算技术,其默认的弹性伸缩方法HPA(Horizontal Pod Autoscaler)能对云原生应用进行横向扩缩容。但该方法存在以下问题:基于单一负载指标,使其难以适用于多样化云原生应用;基于当前负载进行弹性伸缩,使扩缩容过程具有明显的滞后性;基于滑动时间窗口算法进行弹性缩容,使缩容过程缓慢易造成系统资源浪费。针对上述问题,文中提出一种改进的弹性伸缩方法。设计一种动态加权融合算法将多种负载指标融合为综合负载因子,全面反映云原生应用的综合负载。提出CEEMDAN(Complete Ensemble Empirical Mode Decomposition with Adaptive Noise)-ARIMA(Autoregressive Integrated Moving Average Model)预测模型,基于该模型的预测负载值实现预先弹性伸缩以应对突发流量。提出快速缩容与滑动时间窗口相结合的方法,在确保应用服务质量的基础上减少系统资源浪费。实验结果表明,相较于HPA机制,改进的弹性伸缩方法在应对首次突发流量时的平均响应时间缩短了336.55%,流量结束后系统资源占用减少了50%,再次遇到突发流量时能迅速扩容,平均响应时间缩短66.83%。 展开更多
关键词 云计算 容器云 Kubernetes HPA 弹性伸缩 时间序列 滑动窗口 加权融合 负载预测
在线阅读 下载PDF
面向道路场景语义分割的移动窗口变换神经网络设计 被引量:4
11
作者 杭昊 黄影平 +1 位作者 张栩瑞 罗鑫 《光电工程》 CAS CSCD 北大核心 2024年第1期100-112,共13页
道路场景语义分割是自动驾驶环境感知的一项重要任务。近年来,变换神经网络(Transformer)在计算机视觉领域开始应用并取得了很好的效果。针对复杂场景图像语义分割精度低、细小目标识别能力不足等问题,本文提出了一种基于移动窗口Transf... 道路场景语义分割是自动驾驶环境感知的一项重要任务。近年来,变换神经网络(Transformer)在计算机视觉领域开始应用并取得了很好的效果。针对复杂场景图像语义分割精度低、细小目标识别能力不足等问题,本文提出了一种基于移动窗口Transformer的多尺度特征融合的道路场景语义分割算法。该网络采用编码-解码结构,编码器使用改进后的移动窗口Transformer特征提取器对道路场景图像进行特征提取,解码器由注意力融合模块和特征金字塔网络构成,充分融合多尺度的语义特征。在Cityscapes城市道路场景数据集上进行验证测试,实验结果表明,与多种现有的语义分割算法进行对比,本文方法在分割精度方面有较大的提升。 展开更多
关键词 语义分割 移动窗口变换神经网络 注意力机制 自动驾驶 深度学习
在线阅读 下载PDF
基于神经网络的加密恶意流量检测技术研究
12
作者 夏龙飞 张琪浩 +3 位作者 吴宪云 朱雪田 谷欣 田敏 《电子技术应用》 2025年第3期12-16,共5页
随着加密通信的广泛应用,传统基于内容分析的恶意流量检测方法逐渐失效,如何高效检测加密流量中的恶意行为成为网络安全领域的研究重点。研究提出了一种基于神经网络的加密恶意流量检测方法,通过深度学习模型实现恶意加密流量的分类。首... 随着加密通信的广泛应用,传统基于内容分析的恶意流量检测方法逐渐失效,如何高效检测加密流量中的恶意行为成为网络安全领域的研究重点。研究提出了一种基于神经网络的加密恶意流量检测方法,通过深度学习模型实现恶意加密流量的分类。首先,将网络流量预处理并提取关键特征,包括包大小分布、时间间隔及协议类型等,随后将特征映射为二维特征图(Feature Map),作为深度学习模型的输入。设计可伸缩的窗口自注意力机制,利用Transfomer神经网络模型对特征图进行分类,实现了对恶意流量的高效检测。实验结果表明,该方法在检测精度、召回率等方面均表现优异,为解决加密流量恶意行为检测问题提供了一种可行方案。 展开更多
关键词 加密恶意流量 可伸缩的窗口自注意力 深度学习 网络安全
在线阅读 下载PDF
基于区域增长的自适应窗口立体匹配算法 被引量:10
13
作者 罗三定 陈海波 《中南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2005年第6期1042-1047,共6页
针对基于区域的立体匹配算法支持窗口难以选择的问题,提出一种新的自适应窗口区域立体匹配算法。该区域增长的方法可以动态地获得形状和大小均具有自适应特性的支持窗口,并通过区域视差范围估计、核心窗口视差近似、动态搜索步距调整等... 针对基于区域的立体匹配算法支持窗口难以选择的问题,提出一种新的自适应窗口区域立体匹配算法。该区域增长的方法可以动态地获得形状和大小均具有自适应特性的支持窗口,并通过区域视差范围估计、核心窗口视差近似、动态搜索步距调整等方法使算法得到改进。研究结果表明该算法对于视差不连续和遮挡区域都有着良好的适应性;采用该算法获得的视差图像的准确度高达95%,且计算时间缩短到5s以内。 展开更多
关键词 立体匹配 自适应窗口 视差估计 动态伸缩 边界约束
在线阅读 下载PDF
畸变测量中应用窗口傅里叶变换载频条纹分析 被引量:3
14
作者 杨初平 翁嘉文 刘建斌 《光电工程》 CAS CSCD 北大核心 2010年第1期13-18,共6页
为了测量光学成像系统的径向畸变,提出了基于伸缩窗口傅里叶变换空间载频条纹相位分析的测量新方法。畸变分布测量转化为调制相位测量。首先,将纵向朗奇基准光栅作为模板,通过成像系统成为变形光栅即畸变像。接着采用伸缩窗口傅里叶变... 为了测量光学成像系统的径向畸变,提出了基于伸缩窗口傅里叶变换空间载频条纹相位分析的测量新方法。畸变分布测量转化为调制相位测量。首先,将纵向朗奇基准光栅作为模板,通过成像系统成为变形光栅即畸变像。接着采用伸缩窗口傅里叶变换提取畸变载频光栅条纹中心无畸变点的基频和相位信息,获得理想无畸变像的基频成分,然后对变形载频光栅条纹进行频谱分析,滤波提取基频信息、逆傅里叶变换、相位解包,提取径向调制相位分布,计算畸变图像的径向位置畸变分布。最后利用该径向位置畸变分布规律和双线性插值灰度重建对畸变图像进行校正。详细的理论分析和实验结果证明,该方法是可行的。 展开更多
关键词 光学测量 图像畸变 条纹分析 伸缩窗口傅里叶变换
在线阅读 下载PDF
基于半监督神经网络的铜矿矿坑涌水量精准估计研究
15
作者 苏航 张奋明 +3 位作者 余莉 黎华平 孙双龙 李奇 《非金属矿》 2025年第2期102-106,共5页
为改善铜矿矿坑涌水量估计效果,为矿山安全生产提供有力支持,研究基于半监督神经网络的铜矿矿坑涌水量精准估计方法。构建基于半监督动态深度融合神经网络的涌水量估计模型,以有、无标注矿坑涌水量数据为模型输入,作滑动窗口处理后,在... 为改善铜矿矿坑涌水量估计效果,为矿山安全生产提供有力支持,研究基于半监督神经网络的铜矿矿坑涌水量精准估计方法。构建基于半监督动态深度融合神经网络的涌水量估计模型,以有、无标注矿坑涌水量数据为模型输入,作滑动窗口处理后,在特征提取网络中进行位置编码,通过注意力机制模块提取出对涌水量估计更有价值的数据。采用t分布随机邻域嵌入方法降低包含位置信息的有、无标注涌水量数据空间分布差异后,通过堆叠自动编码器逐层学习原始输入数据,准确提取已标注涌水量数据隐层特征,作为特征回归网络输入,经过门控循环神经网络处理后,输出铜矿矿坑涌水量精准估计。结果表明,该方法可实现金平县龙脖河铜矿区矿坑涌水量的精准估计,RMSE、MAE、MAPE指标分别为0.01786、0.01295、0.20646,R2指标为0.97802,涌水量误差介于0.1~0.5 m^(3)/h之间,铜矿矿坑涌水量估计精度较高。 展开更多
关键词 半监督 涌水量 滑动窗口 注意力机制 自动编码器 门控循环神经网络
在线阅读 下载PDF
YOLOv5-LR:一种遥感影像旋转目标检测模型 被引量:2
16
作者 高明明 李沅洲 +2 位作者 马雷 南敬昌 周芊邑 《红外技术》 CSCD 北大核心 2024年第1期43-51,共9页
真实遥感图像中,目标呈现任意方向分布的特点,原始YOLOv5网络存在难以准确表达目标的位置和范围、以及检测速度一般的问题。针对上述问题,提出一种遥感影像旋转目标检测模型YOLOv5-Left-Rotation,首先利用Transformer自注意力机制,让模... 真实遥感图像中,目标呈现任意方向分布的特点,原始YOLOv5网络存在难以准确表达目标的位置和范围、以及检测速度一般的问题。针对上述问题,提出一种遥感影像旋转目标检测模型YOLOv5-Left-Rotation,首先利用Transformer自注意力机制,让模型更加注意感兴趣的目标,并且在图像预处理过程中采用Mosaic数据增强,对后处理过程使用改进后的非极大值抑制算法Non-Maximum Suppression。其次,引入角度损失函数,增加网络的输出维度,得到旋转矩形的预测框。最后,在网络模型的浅层阶段,增加滑动窗口分支,来提高大尺寸遥感稀疏目标的检测效率。实验数据集为自制飞机数据集CASIA-plane78和公开的舰船数据集HRSC2016,结果表明,改进旋转目标检测算法相比于原始YOLOv5网络的平均精度提升了3.175%,在吉林一号某星推扫出的大尺寸多光谱影像中推理速度提升了13.6%,能够尽可能地减少冗余背景信息,更加准确检测出光学遥感图像中排列密集、分布无规律的感兴趣目标的区域。 展开更多
关键词 遥感图像 滑动窗口 注意力机制 旋转目标检测 YOLOv5
在线阅读 下载PDF
基于局部增强的中文医疗命名实体识别模型
17
作者 陈晶 邢珂萱 +2 位作者 孟伟伦 郭景峰 冯建周 《通信学报》 EI CSCD 北大核心 2024年第7期171-183,共13页
医学实体的识别往往受到其相邻上下文的影响,目前的命名实体识别方法通常依赖于BiLSTM捕捉文本中的全局依赖关系,缺乏对字符之间局部依赖关系的建模。针对这一问题,提出了一种基于局部增强的中文医疗命名实体识别模型LENER。首先,LENER... 医学实体的识别往往受到其相邻上下文的影响,目前的命名实体识别方法通常依赖于BiLSTM捕捉文本中的全局依赖关系,缺乏对字符之间局部依赖关系的建模。针对这一问题,提出了一种基于局部增强的中文医疗命名实体识别模型LENER。首先,LENER使用包括字音、字形和语义在内的多源信息来丰富底层字符表征。然后,结合相对位置编码对滑动窗口划分出的序列片段进行局部注意力计算,并通过非线性计算融合局部信息和BiLSTM得到的全局信息。最后,对识别出的实体头部和尾部进行组合,进而提取出实体。实验结果表明,LENER模型具有良好的实体识别能力,与其他模型相比,LENER模型的F1值提升了0.5%~2.0%。 展开更多
关键词 中文命名实体识别 上下文环境 注意力机制 多源信息 滑动窗口
在线阅读 下载PDF
基于多层次特征聚合的图像压缩伪影去除方法
18
作者 易天儒 郑明魁 +1 位作者 张承琰 陈祖儿 《信息技术与信息化》 2024年第4期45-49,共5页
压缩图像伪影去除作为一个图像恢复的子任务,目的是从有损压缩图像中恢复出高质量图像。现有基于Transformer的方法在计算自注意力时杂度过高,不适用于高分辨图像。有多种方法都被提出用来减小Transformer的计算量,但都会造成恢复效果... 压缩图像伪影去除作为一个图像恢复的子任务,目的是从有损压缩图像中恢复出高质量图像。现有基于Transformer的方法在计算自注意力时杂度过高,不适用于高分辨图像。有多种方法都被提出用来减小Transformer的计算量,但都会造成恢复效果下降。对此,提出一个CNN和Transformer结合的高效多层次特征聚合网络EMFANet。图像中在整体、部分和细小范围内存在全局、区域和局部特征,对于全局特征建模采用具有线性复杂度的自注意力,对于区域特征建模采用具有随机移位的窗口自注意力,对于局部特征建模采用基于通道注意力的轻量级卷积。经过实验验证,所提出的方法在JPEG压缩伪影去除任务上实现了较为先进的性能。 展开更多
关键词 压缩伪影去除 深度学习 多层次特征 注意力机制 移位窗口
在线阅读 下载PDF
基于深度学习的羊脸检测模型构建
19
作者 高耀智 李春芝 《数字技术与应用》 2024年第12期192-194,共3页
在现代化的羊场经营中,羊只身份识别是实现羊场精准化养殖的重要途径。目前,羊场工作人员通常采用无线射频(RFID)来识别羊只身份,但是这一方法成本高且耳标易脱落,受人脸技术的启发,本文将研究羊脸检测方法。由于羊场环境复杂,羊与相机... 在现代化的羊场经营中,羊只身份识别是实现羊场精准化养殖的重要途径。目前,羊场工作人员通常采用无线射频(RFID)来识别羊只身份,但是这一方法成本高且耳标易脱落,受人脸技术的启发,本文将研究羊脸检测方法。由于羊场环境复杂,羊与相机之间合作度较低,且湖羊羊脸相似度极高,普通深度模型检测率较低,且计算复杂度高,以至于难以在羊场实际环境中部署应用。设计局部特征捕捉与全局特征结合的轻量级检测网络,为兼顾算法性能及实用性,本文首先对YOLOv5颈部网络C3模块的Bottleneck进行了改进,并将其中的第一个卷积替换为部分卷积以减少原模块产生的信息冗余,进而将骨干网络中的Bottleneck模块替换成Swin-Transformer,构成C3STR模块,而C3STR则通过移动窗口获取足够的全局上下文信息,并利用多头自注意力机制提取更多差异化特征。实验结果表明,改进后的模型在平均准确度(mAP)上达到了97.6%,而模型大小仅为13.3 MB,相较于改进前下降了0.6 MB。 展开更多
关键词 注意力机制 移动窗口 检测网络 身份识别 上下文信息 差异化特征 信息冗余 深度学习
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部