期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
语言引导视觉的小样本航拍图像目标检测
1
作者 张智 易华挥 郑锦 《北京航空航天大学学报》 北大核心 2025年第7期2338-2348,共11页
针对现有航拍图像目标检测方法在航拍数据集变化时,即拍摄视角、图像质量、照明条件、背景环境等发生大幅变化,以及目标外观变化明显、目标类别新增时,不经过对新数据集全样本训练,而采用原有数据集直接推理,检测精度大幅下降的问题,提... 针对现有航拍图像目标检测方法在航拍数据集变化时,即拍摄视角、图像质量、照明条件、背景环境等发生大幅变化,以及目标外观变化明显、目标类别新增时,不经过对新数据集全样本训练,而采用原有数据集直接推理,检测精度大幅下降的问题,提出语言引导视觉的小样本航拍图像目标检测方法。采用词语-区域对齐分支取代传统目标检测网络中的分类分支,得到同时具有语言和视觉信息的词语-区域对齐分类分数作为预测分类结果,进而将目标检测和词语定位统一为一个任务,并利用语言引导提升视觉目标检测精度。针对输入文本语言变化引起小样本目标检测精度波动的情况,设计语言视觉偏置网络,挖掘语言特征和视觉特征的关联关系,提升语言视觉的匹配度,缩小精度波动,并进一步提升小样本目标检测精度。在UAVDT、Visdrone、AeriaDrone、VEDAI、CARPK_PUCPR数据集上的大量实验结果证明了所提方法的优越性能,在UAVDT航拍数据集上所提方法在30样本时平均精度均值(mAP)可达14.6%,相比航拍图像检测方法簇检测器(ClusDet)、密度图引导的目标检测网络(DMNet)、全局-局部自适应网络(GLSAN)和粗粒度密度图网络(CDMNet)在全样本训练的精度,分别提高了0.9%、−0.1%、−2.4%和−2.2%;在CARPK_PUCPR数据集上所提方法在30样本时mAP可达58.0%,相比通用目标检测方法全卷积单阶段目标检测器(FCOS)、自适应训练样本选择(ATSS)、广义焦点损失V2(GFLV2)和交并比感知密集目标检测器(VFNET)在全样本训练的精度,分别提高了1.0%、0.8%、0.1%和0.3%,体现了所提方法强大的小样本泛化和迁移能力。 展开更多
关键词 航拍图像 小样本 词语-区域对齐分支 语言视觉偏置网络 目标检测
在线阅读 下载PDF
基于对抗正则化的自然语言推理 被引量:4
2
作者 刘广灿 曹宇 +1 位作者 许家铭 徐波 《自动化学报》 EI CSCD 北大核心 2019年第8期1455-1463,共9页
目前自然语言推理(Natural language inference, NLI)模型存在严重依赖词信息进行推理的现象.虽然词相关的判别信息在推理中占有重要的地位,但是推理模型更应该去关注连续文本的内在含义和语言的表达,通过整体把握句子含义进行推理,而... 目前自然语言推理(Natural language inference, NLI)模型存在严重依赖词信息进行推理的现象.虽然词相关的判别信息在推理中占有重要的地位,但是推理模型更应该去关注连续文本的内在含义和语言的表达,通过整体把握句子含义进行推理,而不是仅仅根据个别词之间的对立或相似关系进行浅层推理.另外,传统有监督学习方法使得模型过分依赖于训练集的语言先验,而缺乏对语言逻辑的理解.为了显式地强调句子序列编码学习的重要性,并降低语言偏置的影响,本文提出一种基于对抗正则化的自然语言推理方法.该方法首先引入一个基于词编码的推理模型,该模型以标准推理模型中的词编码作为输入,并且只有利用语言偏置才能推理成功;再通过两个模型间的对抗训练,避免标准推理模型过多依赖语言偏置.在 SNLI和 Breaking-NLI 两个公开的标准数据集上进行实验,该方法在 SNLI 数据集已有的基于句子嵌入的推理模型中达到最佳性能,在测试集上取得了 87.60 %的准确率;并且在 Breaking-NLI 数据集上也取得了目前公开的最佳结果. 展开更多
关键词 深度学习 自然语言推理 语言偏置 对抗正则化
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部