[目的/意义]为解决无人机平台下“三北”工程内蒙古地区植树位点(树坑)受复杂背景(灌木、杂草群、裸露沙土、起伏地形等)影响,容易出现树坑漏检错检问题,构建了一种针对该场景下的小目标检测模型——YOLOv10-MHSA(You Only Look Once ve...[目的/意义]为解决无人机平台下“三北”工程内蒙古地区植树位点(树坑)受复杂背景(灌木、杂草群、裸露沙土、起伏地形等)影响,容易出现树坑漏检错检问题,构建了一种针对该场景下的小目标检测模型——YOLOv10-MHSA(You Only Look Once version 10-Multi-head Self-Attention)。[方法]以YOLOv10为基准模型,采用分层特征增强策略,通过跨层信息补偿提升小目标语义表征的完整性,提高其对小目标特征描述的准确性;引入可变卷积核AKConv(Adaptive Kernel Convolution),使模型更精确地聚焦输入图像的特征;构建融合特征的多头自注意力机制MHSA以实现考虑复杂环境因素的有效特征获取;引入Focal-EIOU Loss(Focal Efficient Inter-section over Union Loss)替代原有CIOU Loss(Complete Intersection over Union Loss)作为边界框的回归损失,构建非线性优化策略,在保证训练稳定性的同时实现边界框参数的精确计算;最后,选择影响精准识别效果最大的两个因素,通过设计多尺度空间分布与光照强度梯度变化的对比实验,系统性验证了模型在复杂场景下的泛化性与鲁棒性。[结果和讨论]提出的模型YOLOv10-MHSA在实验数据集上的平均识别精度和检测准确率分别达96.1%和92.1%,相比原模型分别提高4.1%和5.1%,可满足无人机对“三北”工程内蒙古地区植树位点(树坑)进行实时识别的精度和速度要求。[结论]YOLOv10-MHSA模型通过引入动态特征增强模块,在维持原有检测效率的基础上,成功解决了复杂场景中植树位点小目标特征易湮没的检测瓶颈,这为无人机平台下“三北”工程内蒙古地区植树位点的遥感精准、快速检测提供了新方法。展开更多
文摘[目的/意义]为解决无人机平台下“三北”工程内蒙古地区植树位点(树坑)受复杂背景(灌木、杂草群、裸露沙土、起伏地形等)影响,容易出现树坑漏检错检问题,构建了一种针对该场景下的小目标检测模型——YOLOv10-MHSA(You Only Look Once version 10-Multi-head Self-Attention)。[方法]以YOLOv10为基准模型,采用分层特征增强策略,通过跨层信息补偿提升小目标语义表征的完整性,提高其对小目标特征描述的准确性;引入可变卷积核AKConv(Adaptive Kernel Convolution),使模型更精确地聚焦输入图像的特征;构建融合特征的多头自注意力机制MHSA以实现考虑复杂环境因素的有效特征获取;引入Focal-EIOU Loss(Focal Efficient Inter-section over Union Loss)替代原有CIOU Loss(Complete Intersection over Union Loss)作为边界框的回归损失,构建非线性优化策略,在保证训练稳定性的同时实现边界框参数的精确计算;最后,选择影响精准识别效果最大的两个因素,通过设计多尺度空间分布与光照强度梯度变化的对比实验,系统性验证了模型在复杂场景下的泛化性与鲁棒性。[结果和讨论]提出的模型YOLOv10-MHSA在实验数据集上的平均识别精度和检测准确率分别达96.1%和92.1%,相比原模型分别提高4.1%和5.1%,可满足无人机对“三北”工程内蒙古地区植树位点(树坑)进行实时识别的精度和速度要求。[结论]YOLOv10-MHSA模型通过引入动态特征增强模块,在维持原有检测效率的基础上,成功解决了复杂场景中植树位点小目标特征易湮没的检测瓶颈,这为无人机平台下“三北”工程内蒙古地区植树位点的遥感精准、快速检测提供了新方法。