遥感图像船舶目标检测作为遥感应用的重要方向,在海洋监测、港口管理和国防安全等领域具有广泛的应用价值,近年来,深度学习技术的快速发展为船舶目标检测提供了新的解决方案。为系统分析现有船舶目标检测算法的优势与局限性,全面探讨了...遥感图像船舶目标检测作为遥感应用的重要方向,在海洋监测、港口管理和国防安全等领域具有广泛的应用价值,近年来,深度学习技术的快速发展为船舶目标检测提供了新的解决方案。为系统分析现有船舶目标检测算法的优势与局限性,全面探讨了遥感图像船舶检测的改进策略,从而为各类船舶的运行组织提供有力的人工智能技术支撑。首先,系统总结了基于深度学习的目标检测算法的发展历程;随后,针对遥感图像的检测难点分析当前各阶段改进措施的优点与不足。之后,利用CiteSpace对中国知网(China National Knowledge Infrastructure,CNKI)和Web of Science近8年的文献进行关键词共现分析,探讨当前的研究进展和领域热点。此外,结合最新的YOLOv10和YOLOv11实验结果,剖析现有技术的优势与不足。最后,基于文献综述和实验结果,总结了现有技术的局限性,并提出了未来的研究方向。展开更多
伪装目标与背景具有高度的相似性,极易受背景特征混淆,导致边界信息难以分辨且提取目标特征困难。目前主流的伪装目标检测(COD)算法主要针对性研究伪装目标本身及其边界行,忽略了图像背景与目标的相互关系,在复杂场景下的检测结果不理...伪装目标与背景具有高度的相似性,极易受背景特征混淆,导致边界信息难以分辨且提取目标特征困难。目前主流的伪装目标检测(COD)算法主要针对性研究伪装目标本身及其边界行,忽略了图像背景与目标的相互关系,在复杂场景下的检测结果不理想。为了探索背景和目标的潜在联系,提出一种通过挖掘边界和背景检测伪装目标的算法——I2DNet(Indirect to Direct Network)。该算法由5个部分组成:编码器,处理初始原始数据;边界指导的特征提取和挖掘框架,通过特征处理和特征挖掘提取更多精细的边界特征;背景引导的潜在特征学习框架,通过多尺度卷积探索更多的显著特征,同时基于注意力设计混合注意力模块(HAM),增强对背景特征的强化选择;信息补偿模块(ISM),弥补在特征处理过程中损失的细节信息;多任务协同分割解码器(MCD)则高效融合不同任务和模块提取的特征,并输出最终的预测结果。在广泛使用的3个数据集上的实验结果表明,所提算法优于其他15个先进模型,尤其在CAMO数据集上的平均绝对误差指标下降至0.042。展开更多
为解决现有时间序列模型未能充分融合局部和全局依赖的问题,提出一种融合局部和全局相关性的多变量时间序列预测方法PatchLG(Patch-integrated Local-Global correlation method)。该方法基于3个关键部分:1)将时间序列划分为多个子序列(...为解决现有时间序列模型未能充分融合局部和全局依赖的问题,提出一种融合局部和全局相关性的多变量时间序列预测方法PatchLG(Patch-integrated Local-Global correlation method)。该方法基于3个关键部分:1)将时间序列划分为多个子序列(Patch),在保持时间序列的局部性的同时使模型更易于提取全局依赖;2)使用深度可分离卷积和自注意力机制建模局部和全局相关性;3)将时间序列分解为趋势项与季节项2个部分同时进行预测,并将预测结果组合起来得到最终预测结果。在7个基准数据集上的实验结果表明,PatchLG相较于最优基线方法PatchTST(Patch Time Series Transformer)在均方误差(MSE)和平均绝对误差(MAE)2个指标上平均改进量为3.0%和2.9%,同时具有较短的实际运行时间和较低的内存消耗,验证了PatchLG在时间序列预测中的有效性。展开更多
文摘遥感图像船舶目标检测作为遥感应用的重要方向,在海洋监测、港口管理和国防安全等领域具有广泛的应用价值,近年来,深度学习技术的快速发展为船舶目标检测提供了新的解决方案。为系统分析现有船舶目标检测算法的优势与局限性,全面探讨了遥感图像船舶检测的改进策略,从而为各类船舶的运行组织提供有力的人工智能技术支撑。首先,系统总结了基于深度学习的目标检测算法的发展历程;随后,针对遥感图像的检测难点分析当前各阶段改进措施的优点与不足。之后,利用CiteSpace对中国知网(China National Knowledge Infrastructure,CNKI)和Web of Science近8年的文献进行关键词共现分析,探讨当前的研究进展和领域热点。此外,结合最新的YOLOv10和YOLOv11实验结果,剖析现有技术的优势与不足。最后,基于文献综述和实验结果,总结了现有技术的局限性,并提出了未来的研究方向。
文摘伪装目标与背景具有高度的相似性,极易受背景特征混淆,导致边界信息难以分辨且提取目标特征困难。目前主流的伪装目标检测(COD)算法主要针对性研究伪装目标本身及其边界行,忽略了图像背景与目标的相互关系,在复杂场景下的检测结果不理想。为了探索背景和目标的潜在联系,提出一种通过挖掘边界和背景检测伪装目标的算法——I2DNet(Indirect to Direct Network)。该算法由5个部分组成:编码器,处理初始原始数据;边界指导的特征提取和挖掘框架,通过特征处理和特征挖掘提取更多精细的边界特征;背景引导的潜在特征学习框架,通过多尺度卷积探索更多的显著特征,同时基于注意力设计混合注意力模块(HAM),增强对背景特征的强化选择;信息补偿模块(ISM),弥补在特征处理过程中损失的细节信息;多任务协同分割解码器(MCD)则高效融合不同任务和模块提取的特征,并输出最终的预测结果。在广泛使用的3个数据集上的实验结果表明,所提算法优于其他15个先进模型,尤其在CAMO数据集上的平均绝对误差指标下降至0.042。
文摘为解决现有时间序列模型未能充分融合局部和全局依赖的问题,提出一种融合局部和全局相关性的多变量时间序列预测方法PatchLG(Patch-integrated Local-Global correlation method)。该方法基于3个关键部分:1)将时间序列划分为多个子序列(Patch),在保持时间序列的局部性的同时使模型更易于提取全局依赖;2)使用深度可分离卷积和自注意力机制建模局部和全局相关性;3)将时间序列分解为趋势项与季节项2个部分同时进行预测,并将预测结果组合起来得到最终预测结果。在7个基准数据集上的实验结果表明,PatchLG相较于最优基线方法PatchTST(Patch Time Series Transformer)在均方误差(MSE)和平均绝对误差(MAE)2个指标上平均改进量为3.0%和2.9%,同时具有较短的实际运行时间和较低的内存消耗,验证了PatchLG在时间序列预测中的有效性。
文摘针对现有异常检测(Anomaly detection,AD)模型计算效率低和检测性能差等问题,提出一种多尺度流模型(Multi-scale normalizing flow,MS-Flow),通过多尺度交叉融合实现高效的视觉图像异常识别.具体地,在流模型(Normalizing flow,NF)内部构建层级式的多尺度架构来避免多通道数据的冗余交叉计算,同时保证网络的多尺度表达能力.此外,设计的层级感知模块通过逐层级的多粒度特征融合,在细粒度级别表达多尺度特征,有效地提高分布估计的精确性.该方法是一个平衡检测精度与计算效率的解决方案.在两个公开数据集上的实验表明,所提方法相较于以往的检测模型能够获得更高的检测精度(在MVTec AD和BTAD数据集上的平均AUROC(Area under the receiver operating characteristics)分别为99.7%和96.0%),同时具有更高的计算效率,浮点运算次数(Floating point operations,FLOPs)约为CS-Flow的1/8.