目前在铝材表面缺陷检测领域,常用的检测模型存在检测精度不高、实时性不强和参数量大等问题。针对上述问题,对目标检测模型YOLOv8做了改进。首先,该模型使用自研的动态可变形卷积模块取代原有最后一层C2f模块;其次,将RT-DETR(real-time...目前在铝材表面缺陷检测领域,常用的检测模型存在检测精度不高、实时性不强和参数量大等问题。针对上述问题,对目标检测模型YOLOv8做了改进。首先,该模型使用自研的动态可变形卷积模块取代原有最后一层C2f模块;其次,将RT-DETR(real-time detection transformer)模型中的检测头移植到新模型中,利用Transformer中解码器的思想,省去了模型后处理的步骤;最后,将NWD(normalized Wasserstein distance)loss和WIoUv3(wise-intersection over union version 3)loss结合作为改进后模型的回归损失函数,使模型动态筛选锚框,解决IoU对于不同尺寸缺陷类型敏感度不同导致的标签分配不准确的问题。改进之后的模型相比于基线模型YOLOv8,平均精度提高了3.8%,每秒处理帧数提高至92 f/s,同时在钢材表面缺陷检测数据集和太阳能电池板表面缺陷检测数据集上也具有很强的鲁棒性,新模型在实时检测、实际部署中具有很大优势。展开更多
针对IEEE 802.11p标准中导频数量有限,难以准确追踪车联万物(Vehicle-to-Everything,V2X)通信中时变信道的问题,学者们研究了数据导频辅助(Data Pilot Aided,DPA)信道估计方案。然而,这些经典DPA方案不能在完整的信噪比(Signal to Noise...针对IEEE 802.11p标准中导频数量有限,难以准确追踪车联万物(Vehicle-to-Everything,V2X)通信中时变信道的问题,学者们研究了数据导频辅助(Data Pilot Aided,DPA)信道估计方案。然而,这些经典DPA方案不能在完整的信噪比(Signal to Noise Ratio,SNR)范围内给出令人满意的效果,并且其估计结果的可靠性易受误差传播的影响。研究了一种新的信道估计方案,基于使用虚拟子载波的最小均方误差(Minimum Mean Square Error Using Virtual Pilots,MMSE-VP)方案,提出一种带有时间平均操作的改进MMSE(Improved MMSE,IMMSE)方案。IMMSE方案通过利用相邻正交频分复用(Orthogonal Frequency Division Multiplexing,OFDM)符号间信道的相关性来提高MMSE-VP方案在低SNR区域的性能,达到在整个SNR区域有良好表现的目的。联合深度学习技术,采用全连接神经网络(Fully Connected Neural Network,FCNN)作为IMMSE方案的非线性后处理模块,减少误差并获得更好的估计性能。在不同实验条件下的仿真结果表明,提出的信道估计方案可以适应调制方式和车辆速度的变化,能有效应对V2X通信中的信道估计问题。展开更多
在深度学习领域中,注意力机制因其出色的性能以及即插即用的便捷性,在图像处理任务中得到了广泛应用。介绍了通道注意力机制、空间注意力机制以及通道与空间混合注意力机制这3类主流注意力机制的核心思想和实现方法。通过对比分析它们...在深度学习领域中,注意力机制因其出色的性能以及即插即用的便捷性,在图像处理任务中得到了广泛应用。介绍了通道注意力机制、空间注意力机制以及通道与空间混合注意力机制这3类主流注意力机制的核心思想和实现方法。通过对比分析它们之间的优势与缺陷,探讨了注意力机制所存在的挑战与问题,给出了采用VGGNet(Visual Geometry Group Network)模型对注意力机制在图像分类任务中的性能评测结果。最后,展望了注意力机制未来的发展趋势,以期为后续研究提供有价值的参考与启示。展开更多
文摘目前在铝材表面缺陷检测领域,常用的检测模型存在检测精度不高、实时性不强和参数量大等问题。针对上述问题,对目标检测模型YOLOv8做了改进。首先,该模型使用自研的动态可变形卷积模块取代原有最后一层C2f模块;其次,将RT-DETR(real-time detection transformer)模型中的检测头移植到新模型中,利用Transformer中解码器的思想,省去了模型后处理的步骤;最后,将NWD(normalized Wasserstein distance)loss和WIoUv3(wise-intersection over union version 3)loss结合作为改进后模型的回归损失函数,使模型动态筛选锚框,解决IoU对于不同尺寸缺陷类型敏感度不同导致的标签分配不准确的问题。改进之后的模型相比于基线模型YOLOv8,平均精度提高了3.8%,每秒处理帧数提高至92 f/s,同时在钢材表面缺陷检测数据集和太阳能电池板表面缺陷检测数据集上也具有很强的鲁棒性,新模型在实时检测、实际部署中具有很大优势。
文摘针对IEEE 802.11p标准中导频数量有限,难以准确追踪车联万物(Vehicle-to-Everything,V2X)通信中时变信道的问题,学者们研究了数据导频辅助(Data Pilot Aided,DPA)信道估计方案。然而,这些经典DPA方案不能在完整的信噪比(Signal to Noise Ratio,SNR)范围内给出令人满意的效果,并且其估计结果的可靠性易受误差传播的影响。研究了一种新的信道估计方案,基于使用虚拟子载波的最小均方误差(Minimum Mean Square Error Using Virtual Pilots,MMSE-VP)方案,提出一种带有时间平均操作的改进MMSE(Improved MMSE,IMMSE)方案。IMMSE方案通过利用相邻正交频分复用(Orthogonal Frequency Division Multiplexing,OFDM)符号间信道的相关性来提高MMSE-VP方案在低SNR区域的性能,达到在整个SNR区域有良好表现的目的。联合深度学习技术,采用全连接神经网络(Fully Connected Neural Network,FCNN)作为IMMSE方案的非线性后处理模块,减少误差并获得更好的估计性能。在不同实验条件下的仿真结果表明,提出的信道估计方案可以适应调制方式和车辆速度的变化,能有效应对V2X通信中的信道估计问题。
文摘在深度学习领域中,注意力机制因其出色的性能以及即插即用的便捷性,在图像处理任务中得到了广泛应用。介绍了通道注意力机制、空间注意力机制以及通道与空间混合注意力机制这3类主流注意力机制的核心思想和实现方法。通过对比分析它们之间的优势与缺陷,探讨了注意力机制所存在的挑战与问题,给出了采用VGGNet(Visual Geometry Group Network)模型对注意力机制在图像分类任务中的性能评测结果。最后,展望了注意力机制未来的发展趋势,以期为后续研究提供有价值的参考与启示。