摘要
                
                    针对大豆豆荚植株大小不一、重叠以及茎秆遮挡等特点,同时为解决基于Transformer架构的豆荚目标检测模型检测中参数量大导致其在边缘设备部署困难的问题,提出一种改进RT-DETR的豆荚检测模型POD-DETR。首先,引入RepNCSPELAN特征提取模块和Adown降采样模块改进主干网络;其次,提出一种轻量级自适应编码器LWA-Encoder,在内部引入基于小波操作的池化方法替代最近邻插值上采样和卷积下采样操作,设计一种融合无参注意力机制SimAM的自适应细节融合模块DI-SAM改进编码器中原有的特征融合方式,提高模型对不同尺度豆荚的适应能力;最后,使用DIoU作为边界框损失函数,用于提升模型检测准确率。POD-DETR在自建数据集上准确率、召回率和平均精度均值分别达到94.7%、92.9%和97.2%,综合指标优于当前主流的一阶段、二阶段检测模型,在保持高精度的情况下,较基线模型在参数量和浮点运算量上分别降低59.9%和60.9%,实现了模型轻量化。在开源豆荚数据集上的试验结果中POD-DETR也有一定程度的性能提升,表明其具有良好的鲁棒性和泛化能力,可为豆荚检测与产量估计提供技术落地参考。
                
                
    
    
    
    
                出处
                
                    《江苏农业科学》
                        
                                北大核心
                        
                    
                        2025年第15期227-239,共13页
                    
                
                    Jiangsu Agricultural Sciences
     
            
                基金
                    国家自然科学基金(编号:62276032、32072016)
                    中国农业科学院农业科技创新计划(编号:ASTIP)。
            
    
    
    
                作者简介
刘亿琳(2001-),女,湖北黄冈人,硕士研究生,研究方向为人工智能与机器学习。E-mail:2023710687@yangtzeu.edu.cn;通信作者:黄岚,博士,副教授,主要从事人工智能与机器学习研究。E-mail:lanhuang@yangtzeu.edu.cn。