期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于区域信息聚合的轻量化人群计数方法
1
作者 席志国 刘光辉 《高技术通讯》 CAS 北大核心 2024年第9期945-959,共15页
针对高密人群图像中细节信息丢失、背景噪声易与人群特征混淆以及网络模型复杂度高等问题,本文提出一种基于区域信息聚合的轻量化人群计数方法。首先,为获取高密图像中细粒度化的多尺度特征,设计了基于通道激活的多尺度特征提取模块,此... 针对高密人群图像中细节信息丢失、背景噪声易与人群特征混淆以及网络模型复杂度高等问题,本文提出一种基于区域信息聚合的轻量化人群计数方法。首先,为获取高密图像中细粒度化的多尺度特征,设计了基于通道激活的多尺度特征提取模块,此模块通过引入Ghost卷积构建了层间分级类残差连接结构,同时对每级特征辅以通道激活,以轻量化的方式实现了网络感受野的逐级扩张。其次,提出一种自注意力区域信息聚合模块获取不同尺度区域的特征信息,该模块通过轻量级自注意力机制分别从通道和空间维度集成区域信息,增强对人群特征的关注,从而弱化背景噪声对计数的影响。最后,考虑到原始计数损失收敛过程中的不稳定性,在DM-Count损失的基础上引入一种新型计数损失,提高了模型稳定性和计数敏感性,进一步提升了计数性能。在Shanghai Tech、UCFQNRF、JHU-CROWD++以及NWPU-Crowd这4个公开数据集的实验结果表明,本文所提方法对比其他主流轻量级人群计数方法有一定的提升,且模型参数量保持在较低水平。 展开更多
关键词 人群计数 区域信息聚合 轻量化 自注意力 损失函数
在线阅读 下载PDF
基于双频域特征聚合的低照度图像增强 被引量:7
2
作者 徐胜军 杨华 +3 位作者 李明海 刘光辉 孟月波 韩九强 《光电工程》 CAS CSCD 北大核心 2023年第12期28-44,共17页
针对低照度图像质量较差、噪声多、纹理模糊等问题,提出一种基于双频域特征聚合的低照度增强网络(dual frequency-domain feature aggregation network,DF-DFANet)。首先,构建频谱光照估计模块(frequency domain illumination estimatio... 针对低照度图像质量较差、噪声多、纹理模糊等问题,提出一种基于双频域特征聚合的低照度增强网络(dual frequency-domain feature aggregation network,DF-DFANet)。首先,构建频谱光照估计模块(frequency domain illumination estimation module,FDIEM)实现跨域特征提取,通过共轭对称约束调整频域特征图抑制噪声信号,并采用逐层融合方式提高多尺度融合效率以扩大特征图感受野范围。其次,设计多谱双注意力模块(multiple spectral attention module,MSAM)聚焦图像局部频率特征,通过小波域空间、通道注意力机制关注图像细节信息。最后,提出双域特征聚合模块(dual domain feature aggregation module,DDFAM)融合傅里叶域和小波域特征信息,利用激活函数计算自适应调整权重实现像素级图像增强,并结合傅里叶域全局信息提高融合效果。实验结果表明,在LOL数据集上所提网络的PSNR达到24.3714,SSIM达到0.8937。与对比网络相比,所提网络增强效果更具自然性。 展开更多
关键词 深度学习 图像增强 傅里叶变换 小波变换 双域融合 注意力机制
在线阅读 下载PDF
一种编解码结构的车牌图像超分辨率网络 被引量:6
3
作者 徐胜军 邓博文 +3 位作者 史亚 孟月波 刘光辉 韩九强 《西安交通大学学报》 EI CAS CSCD 北大核心 2022年第10期101-110,共10页
针对复杂实际场景中模糊、污损、扭曲、倾斜等车牌图像关键信息缺失以及新能源车牌背景与字符对比度低难以识别的问题,提出了一种编解码结构的车牌图像超分辨率网络。首先,构建一种基于编解码结构的车牌重构生成器网络,利用编码器对车... 针对复杂实际场景中模糊、污损、扭曲、倾斜等车牌图像关键信息缺失以及新能源车牌背景与字符对比度低难以识别的问题,提出了一种编解码结构的车牌图像超分辨率网络。首先,构建一种基于编解码结构的车牌重构生成器网络,利用编码器对车牌图像的纹理、字符等特征进行提取,解码器对车牌特征进行重构;然后,设计一种基于语义监督的判别器网络,在网络损失中引入了对抗损失与CTC(connectionist temporal classification)损失,增强生成器网络对车牌图像语义特征的表征能力;最后,基于VGG16网络提取车牌顶角点特征,利用坐标变换方法对车牌图像进行矫正,进一步提高重构清晰度与识别准确率。采用所提网络在自建XAUAT-Parking数据集和公开CCPD数据集上进行超分辨率重构与识别实验,结果表明:所提网络在CCPD数据集上的平均峰值信噪比可达25.5 dB,结构相似性(SSIM)可达0.989;在XAUAT-Parking数据集上峰值信噪比可达26.6 dB,结构相似性可达0.997。研究结果表明,该网络有较好的车牌图像超分辨率重建效果,而且对车牌关键信息缺失问题具有较强的鲁棒性。 展开更多
关键词 车牌图像 超分辨率 图像矫正 VGG16网络 编解码结构 生成对抗网络
在线阅读 下载PDF
多尺度区域注意力InfoGAN车牌识别网络 被引量:1
4
作者 徐胜军 杜淼 +2 位作者 段中兴 李明海 韩九强 《西安交通大学学报》 EI CAS CSCD 北大核心 2023年第8期206-218,共13页
针对车牌图像倾斜、遮挡、失真、模糊导致车牌图像难以识别的问题,提出一种多尺度区域注意力InfoGAN车牌识别网络。基于InfoGAN框架提出一种多尺度区域注意力车牌超分辨率模块,通过引入颜色分布、字符结构特征的互信息约束,提升网络不... 针对车牌图像倾斜、遮挡、失真、模糊导致车牌图像难以识别的问题,提出一种多尺度区域注意力InfoGAN车牌识别网络。基于InfoGAN框架提出一种多尺度区域注意力车牌超分辨率模块,通过引入颜色分布、字符结构特征的互信息约束,提升网络不同特征维度上的判别能力,重构失真、模糊的低分辨率车牌图像中的关键字符特征;在无车牌字符位置标签信息的情况下,使用多尺度区域注意力机制对车牌全局特征图中的车牌字符和背景解耦合,渐进式地对不同尺度特征图进行不同区域加权,提高网络对字符区域显著性的关注能力和背景噪声区域的抗干扰能力;提出多尺度语义车牌字符特征提取模块,对重构后车牌图像中字符特征解码并识别。在自建XAUAT-Parking数据集和公开CCPD数据集上进行车牌识别准确率实验,实验结果表明:所提网络在CCPD公开车牌数据集上的平均识别准确率为99.3%,在自建XAUAT-Parking数据集上的平均识别准确率为99.2%。所提网络在复杂场景下具有准确的车牌识别效果和较强的鲁棒性。 展开更多
关键词 车牌识别 注意力机制 超分辨率 生成对抗网络
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部