期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
基于语义信息引导的多标签图像分类
1
作者 黄俊 范浩东 +1 位作者 洪旭东 李雪 《北京航空航天大学学报》 北大核心 2025年第7期2271-2281,共11页
多标签图像分类旨在为给定的输入图像预测一组标签,基于语义信息的研究主要利用语义和视觉空间的相关性指导特征提取过程生成有效的特征表示,或利用语义和标签空间的相关性学习能够捕获标签相关性的加权分类器,未能同时建模语义、视觉... 多标签图像分类旨在为给定的输入图像预测一组标签,基于语义信息的研究主要利用语义和视觉空间的相关性指导特征提取过程生成有效的特征表示,或利用语义和标签空间的相关性学习能够捕获标签相关性的加权分类器,未能同时建模语义、视觉和标签空间相关性。针对该问题,提出一种基于语义信息引导的多标签图像分类(SIG-MLIC)方法,SIG-MLIC方法可以同时利用语义、视觉和标签空间,通过语义引导的注意力(SGA)机制增强标签与图像区域的关联性而生成语义特定的特征表示,同时利用标签的语义信息生成一个具有标签相关性约束的语义字典对视觉特征进行重建,获得归一化的表示系数作为标签出现的概率。在3个标准的多标签图像分类数据集上的实验结果表明:SIG-MLIC方法中的注意力机制和字典学习可以有效提高分类性能,验证了所提方法的有效性。 展开更多
关键词 多标签图像分类 语义空间 视觉空间 标签空间 注意力机制 字典学习
在线阅读 下载PDF
基于标签相关性学习网络的多标签图像分类方法
2
作者 王路芳 张海云 《太原理工大学学报》 CAS 北大核心 2024年第6期1097-1106,共10页
【目的】针对多标签图像分类任务中的标签特征混乱和标签关系局限性问题,提出了一种基于标签相关性学习网络的多标签图像分类方法(MLLCLN)。【方法】采用掩码注意力方法和多头自注意力机制。在掩码注意力方法中,通过图像真实标签对应的... 【目的】针对多标签图像分类任务中的标签特征混乱和标签关系局限性问题,提出了一种基于标签相关性学习网络的多标签图像分类方法(MLLCLN)。【方法】采用掩码注意力方法和多头自注意力机制。在掩码注意力方法中,通过图像真实标签对应的状态词向量遮盖注意力机制产生的标签特征,使模型能获得更多上下文信息,一定程度上避免了注意力机制的注意力区域重叠的问题。设计了标签相关性学习网络,该网络是由多层多头注意力机制和图神经网络组成。多头自注意力机制能够基于标签特征学习局部标签关系,而图神经网络使用了现有的方法MLGCN作为引导,使模型能同时考虑全局标签关系,缓解了由于标签关系局限性导致的模型出现虚假预测的问题。【结果】MLLCLN在公开数据集MSCOCO2014和VOC2007上的实验结果表明了其较好的性能,分类精度分别达到了84.4%和96.0%,为多标签图像分类提供了新思路。 展开更多
关键词 多头自注意力机制 多标签图像分类 注意力机制 自适应权重 卷积神经网络
在线阅读 下载PDF
结合图像-文本提示与跨模态适配器的零样本多标签图像分类
3
作者 宋铁成 黄宇 《重庆理工大学学报(自然科学)》 北大核心 2024年第12期182-188,共7页
最近的零样本多标签图像分类方法主要基于视觉语言预训练模型CLIP(contrastive language-image pre-training)。然而,这些工作仅仅在文本提示上进行改进,忽略了图像和文本2种模态之间的交互。针对以上问题,提出一种结合图像-文本提示和... 最近的零样本多标签图像分类方法主要基于视觉语言预训练模型CLIP(contrastive language-image pre-training)。然而,这些工作仅仅在文本提示上进行改进,忽略了图像和文本2种模态之间的交互。针对以上问题,提出一种结合图像-文本提示和跨模态适配器(image-text prompts and cross-modal adapter,ITPCA)的零样本多标签图像分类方法,充分挖掘视觉语言预训练模型的图文匹配能力。通过结合提示学习为图像和文本分支设计提示,提高了模型对不同标签的泛化能力。此外,设计了一个跨模态适配器建立图像和文本2种模态之间的联系。实验结果表明,在NUS-WIDE、MS-COCO多标签数据集上,所提方法优于其他零样本多标签图像分类方法。 展开更多
关键词 视觉语言预训练模型 提示学习 零样本学习 多标签图像分类
在线阅读 下载PDF
融合注意力机制和语义关联性的多标签图像分类 被引量:5
4
作者 薛丽霞 江迪 +1 位作者 汪荣贵 杨娟 《光电工程》 CAS CSCD 北大核心 2019年第9期20-28,共9页
卷积神经网络在单标签图像分类中表现出了良好的性能,但是,如何将其更好地应用到多标签图像分类仍然是一项重要的挑战。本文提出一种基于卷积神经网络并融合注意力机制和语义关联性的多标签图像分类方法。首先,利用卷积神经网络来提取特... 卷积神经网络在单标签图像分类中表现出了良好的性能,但是,如何将其更好地应用到多标签图像分类仍然是一项重要的挑战。本文提出一种基于卷积神经网络并融合注意力机制和语义关联性的多标签图像分类方法。首先,利用卷积神经网络来提取特征;其次,利用注意力机制将数据集中的每个标签类别和输出特征图中的每个通道进行对应;最后,利用监督学习的方式学习通道之间的关联性,也就是学习标签之间的关联性。实验结果表明,本文方法可以有效地学习标签之间语义关联性,并提升多标签图像分类效果。 展开更多
关键词 多标签图像分类 卷积神经网络 注意力机制 语义关联性
在线阅读 下载PDF
基于双文本提示和多重相似性学习的多标签遥感图像分类
5
作者 白淑芬 宋铁成 《电讯技术》 北大核心 2025年第1期35-42,共8页
多标签遥感图像分类旨在预测遥感图像中出现的多个相互关联的对象,其中文本标签能赋予丰富的语义信息。然而,目前多数多标签图像分类法未能充分考虑视觉语义图像-文本对信息。为了解决这一问题,提出了一种基于双文本提示和多重相似性(Bi... 多标签遥感图像分类旨在预测遥感图像中出现的多个相互关联的对象,其中文本标签能赋予丰富的语义信息。然而,目前多数多标签图像分类法未能充分考虑视觉语义图像-文本对信息。为了解决这一问题,提出了一种基于双文本提示和多重相似性(Bi-text Prompts and Multi-similarity,BTPMS)学习的多标签遥感图像分类算法。该算法首先利用场景与对象标签文本的双文本提示(Bi-text Prompts,BTP)提供丰富的先验知识,再综合考虑场景与对象标签之间的关联,对所得的文本特征和图像特征计算多重相似性,最后利用相似性得分进行多标签遥感图像分类。此外,设计了新颖的局部特征注意力(Local Feature Attention,LFA)模块,从空间与通道维度上捕捉图像中局部结构。在两个基准遥感数据集上进行广泛实验,结果表明所提算法优于对比的多标签图像分类方法。 展开更多
关键词 遥感图像 多标签图像分类 视觉语言预训练 提示学习 局部特征注意力
在线阅读 下载PDF
多标签遥感图像分类研究现状与展望
6
作者 林聃 李秋岑 +2 位作者 陈志奎 钟芳明 李丽方 《自然资源遥感》 CSCD 北大核心 2024年第2期10-20,共11页
多标签遥感图像分类是遥感分析领域的基础研究任务之一,解析给定的遥感图像并识别其中的类别语义,可以为下游计算机视觉任务提供重要的技术基础;由于遥感图像空间分辨率不断提升,众多遥感对象以不同规模、颜色、形状分布于图像的各个区... 多标签遥感图像分类是遥感分析领域的基础研究任务之一,解析给定的遥感图像并识别其中的类别语义,可以为下游计算机视觉任务提供重要的技术基础;由于遥感图像空间分辨率不断提升,众多遥感对象以不同规模、颜色、形状分布于图像的各个区域,为遥感图像多标签分类任务带来了严峻挑战。该文聚焦于遥感领域的多标签图像分类研究,对该问题的前沿研究进展进行总结分析。首先,阐述多标签遥感图像分类任务的问题定义,并对该研究问题中常用的多标签图像数据集和模型评估指标进行归纳介绍;进而,对该领域的前沿进展进行系统性的介绍,深入剖析多标签遥感图像分类过程中的2个关键任务——遥感图像特征提取和标签特征提取;最后,针对遥感图像特性,分析了该任务当前存在的挑战和问题,并对未来研究方向进行展望。 展开更多
关键词 遥感图像 多标签遥感图像分类 多标签分类 遥感
在线阅读 下载PDF
基于八度卷积神经网络的多标签胸部X光图像分类算法 被引量:4
7
作者 刘开华 田岚 +1 位作者 李锵 关欣 《天津大学学报(自然科学与工程技术版)》 EI CAS CSCD 北大核心 2023年第4期381-390,共10页
胸部疾病高发,且有些疾病种类的癌症转变率很高,因此基于卷积神经网络的胸部X光图像疾病自动检测分类方法是计算机辅助诊断的研究热点之一.然而,目前的自动分类方法仍面临胸部病灶的X光图像特异性特征表达不充分、不同胸部疾病发病率不... 胸部疾病高发,且有些疾病种类的癌症转变率很高,因此基于卷积神经网络的胸部X光图像疾病自动检测分类方法是计算机辅助诊断的研究热点之一.然而,目前的自动分类方法仍面临胸部病灶的X光图像特异性特征表达不充分、不同胸部疾病发病率不平衡、卷积神经网络参数量过大等问题.针对上述问题,提出了一种端到端的基于八度卷积的ResNet(octave convolution based residual network,OC-ResNet)结构.首先,利用八度卷积改进ResNet中的普通卷积,将高低频特征分离,增强对高频信息的提取,以更好地表达胸部病灶的特异性特征,降低模型计算复杂度.其次,利用渐进式迁移学习,将OC-ResNet在ImageNet数据集进行预训练,获得网络的初始参数,然后固定网络浅层参数,在ChestX-Ray14数据集上微调网络深层参数.最后,为改善样本不平衡问题,网络训练时,采用了焦点损失函数,增加样本数较少类别的权重.在ChestX-Ray14数据集上的实验结果表明,OC-ResNet对14种胸部疾病分类的平均AUC值达到0.856,与目前先进的深度学习方法相比,其中13种疾病分类的AUC值达到最优,同时,计算复杂度相比基础网络降低了44.77%. 展开更多
关键词 八度卷积 残差网络 多标签图像分类 胸部X光图像 迁移学习
在线阅读 下载PDF
基于改进MobileNet的公路行车环境安全风险源识别 被引量:2
8
作者 赵树恩 龚志坤 刘伟 《重庆交通大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第1期75-82,共8页
为了检测公路行车环境安全风险源,为公路风险源智能化管控和随机不确定场景下实时安全风险评估提供依据,研究了基于深度卷积神经网络模型的公路行车环境安全风险源识别算法。通过改进MobileNetV3的输出层激活函数和损失函数,将网络输出... 为了检测公路行车环境安全风险源,为公路风险源智能化管控和随机不确定场景下实时安全风险评估提供依据,研究了基于深度卷积神经网络模型的公路行车环境安全风险源识别算法。通过改进MobileNetV3的输出层激活函数和损失函数,将网络输出的风险源类别数量由一个变为多个,解决了同一图像中存在多种风险源的识别问题。利用空间注意力机制加强MobileNetV3网络的特征提取能力,解决了MobileNetV3通道注意力机制无法关注到通道内部风险源特征信息的问题,提升了模型识别准确率。通过通道剪枝方法去除冗余扩张通道,减少网络参数量,提升了模型预测速度。实验结果表明:该方法能够有效识别行车环境安全风险源,检测率达0.829,平均分类准确率达0.833,且具备实时检测效果。 展开更多
关键词 车辆工程 交通安全 行车环境安全风险源 多标签图像分类算法 MobileNet
在线阅读 下载PDF
知识引导的图联合推理目标检测方法
9
作者 谢斌红 王文博 张睿 《计算机工程与应用》 2025年第18期252-262,共11页
主流的目标检测方法通常局限于单独处理每个区域,忽视了重要的全局上下文信息和物体类别之间的关联。提出一种知识引导的图联合推理目标检测方法(knowledge-guided graph conjoint reasoning object detection method,GCRKG),其包括全... 主流的目标检测方法通常局限于单独处理每个区域,忽视了重要的全局上下文信息和物体类别之间的关联。提出一种知识引导的图联合推理目标检测方法(knowledge-guided graph conjoint reasoning object detection method,GCRKG),其包括全局关系推理(global relational reasoning,GRR)模块和全局知识映射(global knowledge mapping,GKM)模块,旨在通过模仿人类推理过程来提高目标检测性能。GRR模块通过综合考虑类别的特征、共现和语义相关性知识之间的相对重要性,利用图联合注意力网络(graph conjoint attention networks,GCAT)完成类别关系推理。GKM模块利用多标签图像分类概率和目标检测分类器类别概率,将类别关联知识有效地映射到视觉区域。将映射特征与原始视觉区域特征做拼接增强,以预测出更合理的结果。在VOC和COCO两个数据集上与基线模型的对比结果表明了该方法的有效性和优越性。 展开更多
关键词 目标检测 知识引导 图联合注意力 多标签图像分类
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部