针对现有害虫智能识别方法仅能鉴别害虫类型而无法获取其详细生物特性的局限,该研究提出一种跨模态枸杞害虫检索模型(cross-modal wolfberry pest retrieval, CWPR),旨在实现害虫图像与其对应文本描述的精准匹配。模型通过一种两层级特...针对现有害虫智能识别方法仅能鉴别害虫类型而无法获取其详细生物特性的局限,该研究提出一种跨模态枸杞害虫检索模型(cross-modal wolfberry pest retrieval, CWPR),旨在实现害虫图像与其对应文本描述的精准匹配。模型通过一种两层级特征融合方法,深度融合视觉Transformer特征和文本双向编码特征;同时引入标签增强技术,融入物种分布信息以学习强化的标签矩阵,有效缓解害虫数据种类不平衡问题。相较于单层融合方案,两层级特征融合使检索性能提升了1.21个百分点;标签增强技术的引入进一步使性能平均提升0.8个百分点。与现有较先进的跨模态检索方法相比,CWPR在两种跨模态枸杞害虫检索任务中平均性能高出1.89个百分点。该模型具备较高的跨模态检索精确度,可为枸杞害虫相关情报信息的有效获取提供有力技术支撑。展开更多
为了提高单阶段目标检测算法对小目标和重叠目标的检测性能,使其能够应用到自动驾驶场景中,提出一种基于SSD(Single Shot Multibox Detector)的深度特征融合算法DFSSD(Deep Fusion based Single Shot Multibox Detector)。DFSSD主要从...为了提高单阶段目标检测算法对小目标和重叠目标的检测性能,使其能够应用到自动驾驶场景中,提出一种基于SSD(Single Shot Multibox Detector)的深度特征融合算法DFSSD(Deep Fusion based Single Shot Multibox Detector)。DFSSD主要从两个角度对SSD算法进行改进:一方面提出一种高效的特征融合方式,在不引入大量参数和过多计算量的情况下,增强了模型的特征表达能力和对困难小目标的检测能力;另一方面引入一种带噪声的训练方式,即在训练时,随机地将样本中未标记的困难正例目标(不易分辨的正例目标)加入训练,以提高算法对复杂背景的抗干扰能力,降低对困难小目标的误检率。在PASCAL VOC2007测试集上,DFSSD300比SSD300的mAP(mean Average Precision)提升了3.7个百分点,在KITTI数据集上,Car类困难目标的AP(Average Precision)值提升了5个百分点,同时与SSD300具有相当的检测速率。展开更多
文摘针对现有害虫智能识别方法仅能鉴别害虫类型而无法获取其详细生物特性的局限,该研究提出一种跨模态枸杞害虫检索模型(cross-modal wolfberry pest retrieval, CWPR),旨在实现害虫图像与其对应文本描述的精准匹配。模型通过一种两层级特征融合方法,深度融合视觉Transformer特征和文本双向编码特征;同时引入标签增强技术,融入物种分布信息以学习强化的标签矩阵,有效缓解害虫数据种类不平衡问题。相较于单层融合方案,两层级特征融合使检索性能提升了1.21个百分点;标签增强技术的引入进一步使性能平均提升0.8个百分点。与现有较先进的跨模态检索方法相比,CWPR在两种跨模态枸杞害虫检索任务中平均性能高出1.89个百分点。该模型具备较高的跨模态检索精确度,可为枸杞害虫相关情报信息的有效获取提供有力技术支撑。
文摘为了提高单阶段目标检测算法对小目标和重叠目标的检测性能,使其能够应用到自动驾驶场景中,提出一种基于SSD(Single Shot Multibox Detector)的深度特征融合算法DFSSD(Deep Fusion based Single Shot Multibox Detector)。DFSSD主要从两个角度对SSD算法进行改进:一方面提出一种高效的特征融合方式,在不引入大量参数和过多计算量的情况下,增强了模型的特征表达能力和对困难小目标的检测能力;另一方面引入一种带噪声的训练方式,即在训练时,随机地将样本中未标记的困难正例目标(不易分辨的正例目标)加入训练,以提高算法对复杂背景的抗干扰能力,降低对困难小目标的误检率。在PASCAL VOC2007测试集上,DFSSD300比SSD300的mAP(mean Average Precision)提升了3.7个百分点,在KITTI数据集上,Car类困难目标的AP(Average Precision)值提升了5个百分点,同时与SSD300具有相当的检测速率。