期刊文献+
共找到30篇文章
< 1 2 >
每页显示 20 50 100
基于振幅一致性残差卷积编码-解码器的不规则缺失数据重建
1
作者 王志勇 刘国昌 +2 位作者 王梓旭 郭严粮 秦晨 《吉林大学学报(地球科学版)》 北大核心 2025年第4期1336-1350,共15页
地震数据重建方法是地震信号处理中提高采样密度和获取完整波场信息的重要途径。野外勘探采集数据受到地表条件以及成本控制的限制,往往是不完整的或采样不规则的,因此研究不规则地震信号重建方法具有重要意义。本文基于不规则地震数据... 地震数据重建方法是地震信号处理中提高采样密度和获取完整波场信息的重要途径。野外勘探采集数据受到地表条件以及成本控制的限制,往往是不完整的或采样不规则的,因此研究不规则地震信号重建方法具有重要意义。本文基于不规则地震数据可以看作是规则完整数据的随机稀疏、两者在数据区间内数学统计分布高度一致、在稀疏域的表现具有极高相似性的假设,提出通过残差卷积编码-解码器将数据降维到稀疏域再升维的方法实现数据重建。进一步地,针对地震衰减导致的振幅深浅层不一致问题,以及不同数据间数学统计分布差异过大现象严重影响神经网络的训练和泛化问题,对网络的输入数据进行振幅一致性校正处理,平衡能量。合成数据算例证明了提出方法比传统二维预测误差滤波器和残差网络插值方法精度更高,比传统三维预测误差滤波器插值方法效率更快。不同的野外陆地和海洋数据算例都取得了较好的重建结果,证明该方法极大地增大了网络的泛化能力,降低了网络的训练难度。 展开更多
关键词 残差卷积编码-解码器 振幅一致性 不规则采样 数据重建 地震信号处理
在线阅读 下载PDF
SOSNet:一种非对称编码器-解码器结构的非小细胞肺癌CT图像分割模型 被引量:11
2
作者 谢娟英 张凯云 《电子学报》 EI CAS CSCD 北大核心 2024年第3期824-837,共14页
非小细胞肺癌严重损害人类健康,早期非小细胞肺癌CT(Computed Tomography)图像中的肿瘤结节体积小,不易发现,极易造成漏诊和误诊.为了精确分割非小细胞肺癌CT图像中的小体积肿瘤结节,本文提出SOSNet(Small Object Segmentation Networks... 非小细胞肺癌严重损害人类健康,早期非小细胞肺癌CT(Computed Tomography)图像中的肿瘤结节体积小,不易发现,极易造成漏诊和误诊.为了精确分割非小细胞肺癌CT图像中的小体积肿瘤结节,本文提出SOSNet(Small Object Segmentation Networks)自动分割模型,利用ResNet(Residual Network)基础层和空洞卷积构造非对称编码器-解码器结构作为分割主网络,利用轴向取反注意力模块ARA(Axial Reverse Attention)逐步擦除背景中对分割有影响的结构,再使用结构细化模块SR(Structure Refinement)对主网络输出的粗略特征图进行结构细化,从而实现非小细胞肺癌肿瘤结节分割.在非小细胞肺癌公开数据集的实验测试表明,本文提出的小目标自动分割模型SOSNet可以有效分割出非小细胞肺癌CT图像中的小体积肿瘤结节,其mDice(mean-Dice)、mIoU(mean Intersection over Union)、Sensitivity、F1、Specificity、平均绝对误差MAE(Mean Absolute Error)均优于当前最先进的小目标分割模型CaraNet(Context Axial Reverse Attention Network). 展开更多
关键词 小目标分割 非小细胞肺癌 非对称编码-解码器 结构细化 轴向取反注意力 CT图像 深度学习 卷积
在线阅读 下载PDF
基于注意力机制编码器-解码器的手写数学公式识别模型 被引量:3
3
作者 陈路 陈道喜 +1 位作者 陆一鸣 陆卫忠 《计算机应用》 CSCD 北大核心 2023年第4期1297-1302,共6页
针对现有的手写数学公式识别(HMER)方法经过卷积神经网络(CNN)多次池化后,图像分辨率降低、特征信息丢失,从而引起解析错误的问题,提出基于注意力机制编码器-解码器的HMER模型。首先,采用稠密卷积网络(DenseNet)作为编码器,使用稠密连... 针对现有的手写数学公式识别(HMER)方法经过卷积神经网络(CNN)多次池化后,图像分辨率降低、特征信息丢失,从而引起解析错误的问题,提出基于注意力机制编码器-解码器的HMER模型。首先,采用稠密卷积网络(DenseNet)作为编码器,使用稠密连接加强特征提取,促进梯度传播,并缓解梯度消失;其次,采用门控循环单元(GRU)作为解码器,并引入注意力机制,将注意力分配到图像的不同区域,从而准确地实现符号识别和结构分析;最后,对手写数学公式图像进行编码,将编码结果解码为LaTeX序列。在在线手写数学公式识别竞赛(CROHME)数据集上的实验结果表明,所提模型的识别率提升到40.39%,而在3个级别的允许误差范围内,识别率分别提升到52.74%、58.82%和62.98%。相较于双向长短期记忆(BLSTM)网络模型,所提模型的识别率提高了3.17个百分点;而在3个级别的允许误差范围内,识别率分别提高了8.52、11.56和12.78个百分点。可见,所提模型能够准确地解析手写数学公式图像,生成LaTeX序列,提升识别率。 展开更多
关键词 手写数学公式识别 编码-解码器 稠密卷积网络 门控循环单元 注意力机制
在线阅读 下载PDF
基于深度编码-解码器的图像模糊核估计 被引量:2
4
作者 余孝源 谢巍 《控制理论与应用》 EI CAS CSCD 北大核心 2020年第4期731-738,共8页
在图像去模糊问题中,显著边缘结构对图像的模糊核估计具有重要的作用.本文提出一种基于深度编码-解码器的图像模糊核估计算法.首先,通过构建训练数据集对深度编码-解码器进行训练,进而自适应地获得模糊图像的显著边缘结构;接着,结合显... 在图像去模糊问题中,显著边缘结构对图像的模糊核估计具有重要的作用.本文提出一种基于深度编码-解码器的图像模糊核估计算法.首先,通过构建训练数据集对深度编码-解码器进行训练,进而自适应地获得模糊图像的显著边缘结构;接着,结合显著边缘结构和模糊图像,利用L2范数正则化对模糊核进行估计;最后,利用超拉普拉斯先验和所估计的模糊核对清晰图像进行估计.与传统的方法相比,所提出的方法不需要多尺度迭代框架.实验结果表明,所提出的算法在获得较好的显著边缘结构以及清晰图像的同时,能够减少算法计算的时间. 展开更多
关键词 图像去模糊 编码-解码器 显著边缘结构 模糊卷积核估计
在线阅读 下载PDF
基于MSCNN-LSTM编解码器的飞机辅助动力装置EGT预测模型 被引量:3
5
作者 白春垣 孙有朝 《组合机床与自动化加工技术》 北大核心 2022年第2期45-49,共5页
针对提高飞机辅助动力装置(auxiliary power unit,APU)排气温度(exhaust gas temperature,EGT)参数的预测精度问题,提出了一种基于特征选择和多尺度卷积-长短期记忆网络编码器-解码器的EGT预测模型。首先,利用随机森林方法确定重要度较... 针对提高飞机辅助动力装置(auxiliary power unit,APU)排气温度(exhaust gas temperature,EGT)参数的预测精度问题,提出了一种基于特征选择和多尺度卷积-长短期记忆网络编码器-解码器的EGT预测模型。首先,利用随机森林方法确定重要度较高的APU监测参数;其次,利用多尺度卷积神经网络能够提取信号深度特征和LSTM网络能够学习序列长时间依赖的特性,建立了编码器-解码器预测模型;最后,以某型APU实时报文数据为例,通过与其他方法进行对比验证了模型的可行性,能够提高EGT预测的准确度。 展开更多
关键词 辅助动力装置 排气温度 多尺度卷积神经网络 长短期记忆网络 编码-解码器
在线阅读 下载PDF
结合特征融合注意力的规范化卷积图像去雾网络 被引量:1
6
作者 王燕 卢鹏屹 他雪 《计算机工程与应用》 北大核心 2025年第8期226-238,共13页
图像去雾方法可以从受雾、霾或大气干扰影响的模糊图像中恢复清晰图像,在自动驾驶、监控系统等领域有重要意义。近年来,基于深度学习方法在图像去雾领域取得了显著进展,但在去雾过程中会损失一些细节信息,导致纹理信息恢复不足、去雾不... 图像去雾方法可以从受雾、霾或大气干扰影响的模糊图像中恢复清晰图像,在自动驾驶、监控系统等领域有重要意义。近年来,基于深度学习方法在图像去雾领域取得了显著进展,但在去雾过程中会损失一些细节信息,导致纹理信息恢复不足、去雾不均匀现象。为了解决这个问题,提出了一种端到端的单幅图像去雾方法,称为EFANNet。该方法由编码器模块、去雾模块、解码器模块组成。编码器模块用于提取图像特征信息传递给去雾模块;去雾模块通过特征融合组(FFG)获得更多图像信息使去雾图像颜色失真更小、伪影更少,将获得的图像信息传递给深度规范化修正卷积块(DNCC)减少协变量偏移,使模型更容易训练。多路径特征卷积块(MFCB)获得纹理细节更丰富的图像信息,最后经过解码器模块通过反卷积和上采样操作将低维的特征映射转换回高维的原始输入空间,得到去雾图像。大量实验结果表明,所提方法在定量和定性上都取得了较好的结果并优于相关的最新方法。 展开更多
关键词 图像去雾 深度学习 编码-解码器 深度规范化修正卷积
在线阅读 下载PDF
融合条形卷积和Transformer的风机叶片裂纹检测研究
7
作者 黄启昀 李黄强 +2 位作者 舒征宇 李欣 付军军 《现代电子技术》 北大核心 2025年第14期123-128,共6页
针对风机叶片早期出现的浅色、细小裂纹难以识别问题,提出一种融合条形卷积和Transformer的风机叶片裂纹检测方法。首先基于不同方向条形卷积构建多方向裂纹特征增强模块,在不同尺度下增强网络对裂纹特征的提取能力;其次,在Transformer... 针对风机叶片早期出现的浅色、细小裂纹难以识别问题,提出一种融合条形卷积和Transformer的风机叶片裂纹检测方法。首先基于不同方向条形卷积构建多方向裂纹特征增强模块,在不同尺度下增强网络对裂纹特征的提取能力;其次,在Transformer中引入非线性无激活网络,以降低Transformer在利用高分辨率图像进行检测任务时的计算复杂度;最后结合Transformer与条形卷积的优势,构建一种四级对称编码-解码器网络,完成叶片裂纹缺陷检测任务。测试结果表明,该方法在自制数据集上的mPA值和mIoU值分别达到86.87%和79.54%,且网络的训练速率达到13.24幅/s,说明风机叶片裂纹检测方法在检测性能与检测速率上均具有良好的效果。 展开更多
关键词 风机叶片 裂纹检测 多尺度特征 条形卷积 TRANSFORMER 编码-解码器网络
在线阅读 下载PDF
基于映射空间编码的高速运动轨道图像去模糊研究 被引量:3
8
作者 鄢化彪 刘词波 +1 位作者 黄绿娥 赵恒 《铁道科学与工程学报》 EI CAS CSCD 北大核心 2024年第2期812-825,共14页
针对轨道缺陷检测系统因镜头抖动或相机快速移动而导致所采集图像较为模糊的问题,提出一种基于最大后验概率估计思想的映射空间编码的高速运动轨道图像去模糊算法。首先,该算法使用深度编解码器和残差网络分别对数据集中清晰图像到模糊... 针对轨道缺陷检测系统因镜头抖动或相机快速移动而导致所采集图像较为模糊的问题,提出一种基于最大后验概率估计思想的映射空间编码的高速运动轨道图像去模糊算法。首先,该算法使用深度编解码器和残差网络分别对数据集中清晰图像到模糊图像的映射关系和模糊核进行编码,为了保证编码时频率信息的完整性,算法在传统的残差模块上引入快速傅里叶变换通道构成双通道残差网络,以补偿多次特征提取带来的频率损失;其次,算法采用深度图像先验(Deep Image Prior,DIP)将潜在的清晰图像和模糊核进行参数化,再利用先验得到的模糊核和清晰图像来调用编码空间中的映射关系;最后,通过交替优化潜在的清晰图像和模糊核,从而去逼近一个真实未知的映射,进而实现真实场景下高速运动轨道图像的去模糊。实验结果表明,双通道残差模块提取的特征图频率信息分量强度普遍高于传统的残差模块,相较于使用传统残差模块实现该算法,采用双通道残差模块可使峰值信噪比(Peak Signal-to-Noise Ratio,PSNR)提升0.84 dB,结构相似性(Structural Similarity,SSIM)提高0.025 1。与现有的深度学习去模糊算法相比,提出的去模糊算法对高速轨道检测系统所采集图像的去模糊效果更佳,在性能方面相较于最好的去模糊算法,PSNR提高了1.84 dB,SSIM提升了0.017 3,显著提升了采集图像的质量。研究结果可为下一步识别轨道部件是否存在缺陷提供清晰图像。 展开更多
关键词 运动去模糊 编码-解码器 映射空间 深度图像先验 残差网络
在线阅读 下载PDF
基于ResCSP-34的集成电路供电网络静态电压降预测研究 被引量:1
9
作者 李岳 夏益民 《电子测量技术》 北大核心 2024年第8期148-156,共9页
随着超大规模集成电路的不断发展,片上供电网络的设计日益重要,需要通过计算供电网络的静态电压降来反映设计的性能。然而传统的计算方法需要耗费大量的时间,导致芯片设计周期延长。为了缩短芯片设计的周期和提高芯片设计的效率,本文提... 随着超大规模集成电路的不断发展,片上供电网络的设计日益重要,需要通过计算供电网络的静态电压降来反映设计的性能。然而传统的计算方法需要耗费大量的时间,导致芯片设计周期延长。为了缩短芯片设计的周期和提高芯片设计的效率,本文提出了一个基于卷积神经网络—ResCSP-34的快速静态电压降预测模型。模型采用编码器-解码器结构,首先对残差网络ResNet34进行修改作为编码器的主体结构,然后在解码器中引入特征融合模块,并且在编码器和解码器的连接处引入注意力机制模块,最后提出了一个同时结合了均方误差、皮尔逊相关系数和平均绝对误差的损失函数对模型进行训练。实验结果表明,在CircuitNet数据集上,模型预测结果的平均绝对误差为0.7 mV,小于1 mV,皮尔逊相关系数的平均值大于0.93,接近于1,对一个片上供电网络设计进行静态电压降预测的平均总时间为7.36 s,其中卷积神经网络的平均推理时间为0.015 s。实验结果表明,ResCSP-34模型能够快速且精准地预测静态电压降。 展开更多
关键词 集成电路 静态电压降 卷积神经网络 编码-解码器 注意力机制
在线阅读 下载PDF
一种基于深度残差网络的图像修复算法设计与实现 被引量:1
10
作者 吴金苗 王育欣 +3 位作者 韩江宁 张家亮 张志 魏雨露 《天津农学院学报》 CAS 2024年第3期85-91,共7页
随着数字图像在人们日常生活中使用越来越多,针对破损图像缺失区域的数字图像修复问题,本文提出一种基于深度残差网络的图像修复模型。该模型总体架构基于编码-解码结构,编码器采用不同深度的残差网络,解码器分别使用反卷积网络结构和... 随着数字图像在人们日常生活中使用越来越多,针对破损图像缺失区域的数字图像修复问题,本文提出一种基于深度残差网络的图像修复模型。该模型总体架构基于编码-解码结构,编码器采用不同深度的残差网络,解码器分别使用反卷积网络结构和上采样-卷积结构。通过实验探讨在本模型中不同结构的解码器、编码器以及不同的损失函数对图像修复效果的影响。实验结果表明:本文提出的基于深度残差网络的图像修复模型,采用修改后的Resnet 34-layer作为编码器,反卷积网络作为解码器,L1 Loss作为损失函数,能够达到较好的图像修复效果。 展开更多
关键词 图像修复 残差网络 卷积 编码-解码器
在线阅读 下载PDF
基于多尺度循环残差神经网络的图像去运动模糊 被引量:5
11
作者 方睿 周愉 +1 位作者 刘鹏 刘凯 《计算机工程与设计》 北大核心 2022年第3期786-793,共8页
现有图像去运动模糊结果容易在视觉感知上产生边缘特征不明显,出现大幅度的伪影现象,且在深度网络训练过程中,存在因加深网络导致参数过多不易训练即不稳定的问题,为此提出多尺度循环残差神经网络模型。在SRN基础上,为平衡评价指标(PSNR... 现有图像去运动模糊结果容易在视觉感知上产生边缘特征不明显,出现大幅度的伪影现象,且在深度网络训练过程中,存在因加深网络导致参数过多不易训练即不稳定的问题,为此提出多尺度循环残差神经网络模型。在SRN基础上,为平衡评价指标(PSNR、SSIM)与感知质量,提高图像中的高频细节信息等,进行多损失融合改进;在网络的编码器-解码器结构中,在其卷积层中使用小卷积核堆叠,加深网络的同时使网络参数更少更容易训练,更好地拟合图片的特征信息。实验结果表明,改进算法生成的网络模型取得了更好的去模糊结果。 展开更多
关键词 运动模糊 视觉感知 多损失融合 编码-解码器 卷积核堆叠
在线阅读 下载PDF
基于空洞卷积和多特征融合的混凝土路面裂缝检测 被引量:9
12
作者 瞿中 陈雯 《计算机科学》 CSCD 北大核心 2022年第3期192-196,共5页
混凝土路面的裂缝检测是确保道路安全的重要基础任务。针对混凝土路面的复杂背景和裂缝本身复杂的拓扑结构,提出了一种基于空洞卷积和多特征融合的混凝土路面裂缝检测网络,该网络采用基于U-Net的编码-解码结构。在编码阶段,使用改进的... 混凝土路面的裂缝检测是确保道路安全的重要基础任务。针对混凝土路面的复杂背景和裂缝本身复杂的拓扑结构,提出了一种基于空洞卷积和多特征融合的混凝土路面裂缝检测网络,该网络采用基于U-Net的编码-解码结构。在编码阶段,使用改进的残差网络Res2Net提高特征提取能力;在网络的中间部分,使用串联和并联相结合的不同空洞率的空洞卷积,从而在增加特征点的感受野的同时不会降低特征图的分辨率;在解码阶段,融合了从低层卷积到高层卷积的多尺度和多级特征,提高了裂缝检测的准确性。为证明所提算法的有效性和准确性,将其与现有的部分检测方法进行了比较并使用F-score来评估检测性能。在多个混凝土路面数据集上的实验结果表明,该算法提高了裂缝检测的准确性,具有较好的鲁棒性。 展开更多
关键词 裂缝检测 空洞卷积 多特征融合 编码-解码结构 残差网络
在线阅读 下载PDF
GMFNet:全局多尺度和多级别的特征融合语义分割网络 被引量:1
13
作者 陈金令 赵成明 李洁 《计算机应用与软件》 北大核心 2025年第4期311-318,334,共9页
语义分割网络在编码器-解码器中融合高低水平特征存在以下问题:(1)在空间和通道中特征提取无法同步,导致特征组合无法获取全局上下文信息;(2)特征融合无法充分利用高低水平特征图像,导致语义边界模糊。设计全局空洞空间金字塔池化,该结... 语义分割网络在编码器-解码器中融合高低水平特征存在以下问题:(1)在空间和通道中特征提取无法同步,导致特征组合无法获取全局上下文信息;(2)特征融合无法充分利用高低水平特征图像,导致语义边界模糊。设计全局空洞空间金字塔池化,该结构不仅在空间上提取多尺度信息和通道上对图像信息充分利用,还增强编码器阶段的特征重用。设计特征融合注意力模块,在编码器中连接不同阶段的高低水平特征和新特征。实验表明,该算法在Cityscapes数据集上达到了77.92%mIoU。 展开更多
关键词 语义分割 卷积神经网络 全局上下文信息 特征融合 编码-解码器
在线阅读 下载PDF
基于空洞卷积神经网络的毒株胚蛋裂纹分割
14
作者 耿磊 张静 +1 位作者 肖志涛 童军 《天津工业大学学报》 CAS 北大核心 2022年第3期69-75,共7页
针对工厂机械设备的噪声和振动、胚蛋蛋壳表面的污斑和裂纹大小、光源打光方式会对裂纹检测产生严重影响,提出一种基于密集空洞卷积模块(DACM)与空洞空间金字塔池化结构(ASPP)的卷积神经网络(CNN)分割方法分割胚蛋裂纹。采用编码器-解... 针对工厂机械设备的噪声和振动、胚蛋蛋壳表面的污斑和裂纹大小、光源打光方式会对裂纹检测产生严重影响,提出一种基于密集空洞卷积模块(DACM)与空洞空间金字塔池化结构(ASPP)的卷积神经网络(CNN)分割方法分割胚蛋裂纹。采用编码器-解码器网络结构与密集连接的空洞卷积结合,增强空间信息表示并重建不同尺度目标信息;同时,在网络浅层引入ASPP,获取多尺度特征,增强细节信息,提高网络分割性能。结果表明:在自制毒株胚蛋顶部裂纹与侧面裂纹数据集上,该方法的平均交并比(MIoU)分别达到了74.2%与81.3%,具有较强的鲁棒性。 展开更多
关键词 毒株胚蛋裂纹分割 卷积神经网络 编码-解码器 空洞卷积 空洞空间金字塔池化
在线阅读 下载PDF
基于单目相机的复杂场景深度估计网络
15
作者 陈占国 陈振军 +4 位作者 薛晨霞 王国亮 李金峄 李玉廷 于保才 《辽宁工程技术大学学报(自然科学版)》 北大核心 2025年第4期505-512,共8页
为提升复杂多变场景下深度估计的精度,提出一种基于U型编码器-解码器的单目深度估计网络。采用Swin Transformer架构作为编码器核心,实现对输入数据多层级、多尺度的精细化特征提取。采用逐层扩张卷积提取多尺度局部特征,通过特征交互... 为提升复杂多变场景下深度估计的精度,提出一种基于U型编码器-解码器的单目深度估计网络。采用Swin Transformer架构作为编码器核心,实现对输入数据多层级、多尺度的精细化特征提取。采用逐层扩张卷积提取多尺度局部特征,通过特征交互模块交互局部和全局特征,实现对复杂场景的更全面理解。采用对称式Transformer解码器并结合图像块扩展层将相邻维度的特征图重塑为更高分辨率的特征图,最终输出像素级深度预测结果。在NYU Depth v2数据集和KITTI数据集上进行定量实验。研究结果表明:该网络在复杂多变场景中具有高效性和实用性。研究方法突破了传统方法在复杂多变场景下的局限性,为深度估计的理论研究提供新的视角和方法。 展开更多
关键词 单目深度估计 U型编码-解码器 逐层扩张卷积 特征交互模块 对称式Transformer解码器
在线阅读 下载PDF
基于多任务学习的全景驾驶感知算法
16
作者 吴伟林 刘春泉 余孝源 《计算机工程与设计》 北大核心 2025年第4期1127-1133,共7页
针对全景驾驶感知算法YOLOP存在特征图池化操作自适应较差、下采样过程细节丢失和模型性能差的问题,提出一种基于多任务学习的全景驾驶感知算法,引入高效处理模块,提高对特征图池化操作自适应能力,采用不同加权系数的损失函数,提升网络... 针对全景驾驶感知算法YOLOP存在特征图池化操作自适应较差、下采样过程细节丢失和模型性能差的问题,提出一种基于多任务学习的全景驾驶感知算法,引入高效处理模块,提高对特征图池化操作自适应能力,采用不同加权系数的损失函数,提升网络的检测性能及鲁棒性。在BDD100K数据集的评估结果中,车道线检测准确率提高11.6%,可行驶区域检测的平均交并比(mIoU)提高2.1%,车辆检测的平均精确率均值的50%指标(mAP50)提高3.7%。在KITTI数据集的评估结果中,车辆检测mAP50指标提高3.4%。 展开更多
关键词 多任务学习网络 编码-解码器 车道线检测 可行驶区域检测 车辆检测 特征对齐 转置卷积
在线阅读 下载PDF
基于方向引导的残差去雨网络 被引量:1
17
作者 杨爱萍 张腾飞 +3 位作者 王朝臣 邵明福 周雅然 丁学文 《天津大学学报(自然科学与工程技术版)》 EI CAS CSCD 北大核心 2023年第4期391-399,共9页
基于深度学习的单幅图像去雨已经取得了较大进展,但现有的图像去雨方法大多没有考虑真实场景中雨纹方向的多样性,导致各方向雨纹去除不均匀,复原图像仍存在雨纹残留及颜色失真问题.基于此,以雨纹方向信息为导向,提出了一种基于雨纹方向... 基于深度学习的单幅图像去雨已经取得了较大进展,但现有的图像去雨方法大多没有考虑真实场景中雨纹方向的多样性,导致各方向雨纹去除不均匀,复原图像仍存在雨纹残留及颜色失真问题.基于此,以雨纹方向信息为导向,提出了一种基于雨纹方向引导的残差去雨网络.该网络由带有残差校正模块的编解码主干网络、基于方向引导的特征提取子网络以及颜色修正模块组成.在主干网络中,融入残差校正模块可学习低质量特征表示到最优特征表示的映射,校正后的网络可恢复更多高频细节;特征提取子网络包含方向引导模块和自适应循环递归模块,通过动态卷积核自适应选择与注意力机制引导,可实现不同方向、不同感受野的雨纹特征提取和融合;进一步,为了改善去雨后图像的视觉质量,设计了颜色修正模块,可以对复原图像的色彩信息进行补偿.在合成和真实数据集上的实验表明,所提方法可在彻底去除雨纹的同时保持细节丰富、颜色自然. 展开更多
关键词 图像去雨 方向引导 信息补偿 编码-解码器 残差网络
在线阅读 下载PDF
软阈值时序卷积网络在冷水机组传感器故障诊断中的应用 被引量:9
18
作者 洪琳 李冬辉 +1 位作者 高龙 赵墨刊 《西安交通大学学报》 EI CAS CSCD 北大核心 2023年第2期67-77,共11页
为了提高冷水机组传感器的故障诊断性能,提出了一种基于软阈值时序卷积网络的编码-解码器重构模型(ST-TCN),并建立基于该模型的传感器故障诊断方法。采用时序卷积网络(TCN)充分挖掘冷水机组传感器的时间相关性、热力学物理量间的数据相... 为了提高冷水机组传感器的故障诊断性能,提出了一种基于软阈值时序卷积网络的编码-解码器重构模型(ST-TCN),并建立基于该模型的传感器故障诊断方法。采用时序卷积网络(TCN)充分挖掘冷水机组传感器的时间相关性、热力学物理量间的数据相关性以及动态响应差异性特征。在TCN的残差块中引入软阈值自适应模块剔除冗余信息,降低噪声干扰。依托ST-TCN模型“端到端”的网络结构优势,将绝对重构残差向量与故障阈值向量进行比较,直接定位故障传感器。在实际压缩式冷水机组平台上采集传感器数据进行实验,结果表明,软阈值自适应模块能有效地增强网络模型的重构能力,从而提高故障传感器的诊断性能。以压缩机吸气温度传感器T1为例,ST-TCN的平均偏差故障识别率比改进前提升了45.9%;与其他故障诊断方法相比,所提的最新框架获得了较高的偏差故障识别率。 展开更多
关键词 时序卷积网络 编码-解码器 软阈值化 冷水机组 传感器故障诊断
在线阅读 下载PDF
基于跨层次聚合网络的实时城市街景语义分割 被引量:2
19
作者 侯志强 程敏婕 +2 位作者 马素刚 屈敏杰 杨小宝 《光学精密工程》 EI CAS CSCD 北大核心 2024年第8期1212-1226,共15页
随着自动驾驶技术的迅速发展,精确高效的场景理解显得尤为重要。城市街景语义分割旨在准确识别并分割出行人、障碍物、道路和标志物等要素,为自动驾驶技术提供必要的道路信息。然而,当前的语义分割算法在城市街景分割中仍然面临一些挑战... 随着自动驾驶技术的迅速发展,精确高效的场景理解显得尤为重要。城市街景语义分割旨在准确识别并分割出行人、障碍物、道路和标志物等要素,为自动驾驶技术提供必要的道路信息。然而,当前的语义分割算法在城市街景分割中仍然面临一些挑战,主要表现为不同类别的像素区分不够清晰、对于复杂场景结构的理解不够精准以及对小尺度对象或大尺度结构的分割不准确等问题。为此,本文提出一种基于跨层次聚合网络的实时城市街景语义分割算法。首先,在编码器末端设计了结合跨层次聚合的金字塔池化模块,用于高效提取多尺度上下文信息;其次,在编码器和解码器之间设计了跨层次聚合模块,通过引入通道注意力机制增强信息的表征能力,逐级聚合编码器阶段的特征以充分实现特征复用;最后,在解码器阶段设计了多尺度融合模块,在通道维度聚合全局信息与局部信息,促进深层特征与浅层特征的融合。将所提算法在两个通用的城市街景数据集上进行了验证。在一张RTX3090显卡上(TensorRT测速环境),本文算法在Cityscapes测试集以294 FPS的实时性达到73.0%mIoU的准确性,在更高分辨率的图像上以164 FPS的实时性达到75.8%mIoU的准确性;在CamVid数据集以239 FPS的实时性达到74.8%mIoU的准确性。实验结果表明,本文算法在准确性与实时性之间取得了有效平衡,对比其他算法的语义分割性能具有显著提升,为实时城市街景语义分割领域带来了新的突破。 展开更多
关键词 语义分割 卷积神经网络 城市街景 编码-解码器结构 金字塔池化模块
在线阅读 下载PDF
多尺度融合的双分支特征提取人群计数算法 被引量:1
20
作者 曾芸芸 张红英 袁明东 《计算机工程与应用》 CSCD 北大核心 2024年第20期224-232,共9页
人群计数在公共安全管理、公共空间设计以及其他视觉任务如行为分析、拥塞分析等方面具有重要的应用。然而复杂的背景和人头尺度大小不一导致人群计数的效果并不理想。针对静态图像中尺度变化和背景干扰问题,提出了一种基于双分支中间... 人群计数在公共安全管理、公共空间设计以及其他视觉任务如行为分析、拥塞分析等方面具有重要的应用。然而复杂的背景和人头尺度大小不一导致人群计数的效果并不理想。针对静态图像中尺度变化和背景干扰问题,提出了一种基于双分支中间特征提取的人群计数网络——DBFE_MFNet。该网络沿用编码-解码器结构,在编码阶段使用VGG19卷积神经网络的前16层,为了更好融合多尺度信息,将VGG19卷积神经网络的前16层的后4层卷积替换成空洞率为2的膨胀卷积,解码部分采用抑制背景干扰的残差卷积注意力模块(residual convolutional attention module,RCAM),在编码-解码器结构中间插入双分支中间特征提取模块(dual branch intermediate feature extraction module,DBFE),分支1采用金字塔结构并融合位置注意力模块提取多尺度上下文信息,分支2沿用金字塔结构融合双通道注意力机制使模型关注不同大小人头信息,最后使用1×1卷积生成密度图。实验方面,在ShanghaiTech PartA、ShanghaiTech PartB、Mall数据集上进行了算法对比实验,DBFE_MFNet模型在上述数据集的平均绝对误差和均方根误差分别为63.2、7.1、1.80和99.2、11.8、2.28,经对比实验分析,DBFE_MFNet模型具有不错的计数性能和稳定性能;在ShanghaiTech PartB进行了消融实验,实验验证了模型各模块的有效性。 展开更多
关键词 人群计数 VGG19 编码-解码器 残差卷积注意力模块 双分支中间特征提取模块
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部