期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
基于关键词生成与标签匹配的零样本多标签图像分类
1
作者 高立卫 吕学强 马登豪 《北京信息科技大学学报(自然科学版)》 2024年第6期9-16,共8页
针对零样本多标签图像分类,提出了一种基于关键词生成与标签匹配的分类方法,在无须额外训练的情况下,通过输入图像来预测其关键词信息及标签概率。图像关键词生成模块利用视觉编码器和文本解码器生成图像语义描述,清洗并提取相关的关键... 针对零样本多标签图像分类,提出了一种基于关键词生成与标签匹配的分类方法,在无须额外训练的情况下,通过输入图像来预测其关键词信息及标签概率。图像关键词生成模块利用视觉编码器和文本解码器生成图像语义描述,清洗并提取相关的关键词及权重信息。标签匹配模块使用词嵌入模型编码关键词和待预测标签,并结合权重计算图像关于任意标签的匹配概率,得到预测结果。在5个公开数据集上的实验结果表明,所提方法能够显著提高不同基线模型的图像分类性能与效果。 展开更多
关键词 多标签图像分类 关键词生成 标签匹配 零样本
在线阅读 下载PDF
融合注意力机制和语义关联性的多标签图像分类 被引量:5
2
作者 薛丽霞 江迪 +1 位作者 汪荣贵 杨娟 《光电工程》 CAS CSCD 北大核心 2019年第9期20-28,共9页
卷积神经网络在单标签图像分类中表现出了良好的性能,但是,如何将其更好地应用到多标签图像分类仍然是一项重要的挑战。本文提出一种基于卷积神经网络并融合注意力机制和语义关联性的多标签图像分类方法。首先,利用卷积神经网络来提取特... 卷积神经网络在单标签图像分类中表现出了良好的性能,但是,如何将其更好地应用到多标签图像分类仍然是一项重要的挑战。本文提出一种基于卷积神经网络并融合注意力机制和语义关联性的多标签图像分类方法。首先,利用卷积神经网络来提取特征;其次,利用注意力机制将数据集中的每个标签类别和输出特征图中的每个通道进行对应;最后,利用监督学习的方式学习通道之间的关联性,也就是学习标签之间的关联性。实验结果表明,本文方法可以有效地学习标签之间语义关联性,并提升多标签图像分类效果。 展开更多
关键词 多标签图像分类 卷积神经网络 注意力机制 语义关联性
在线阅读 下载PDF
基于空间注意力与图卷积的多标签图像分类算法 被引量:1
3
作者 康萍萍 侯进 +2 位作者 周浩然 陈子锐 李晨 《微电子学与计算机》 2022年第5期10-19,共10页
针对传统多标签图像分类模型存在难以生成更接近相关标签的高层图像特征,以及因未能利用标签之间的视觉相关性而导致的识别精度不够高等问题,提出了一种基于空间注意力与图卷积的多标签图像分类算法.首先,利用图卷积网络学习标签邻接图... 针对传统多标签图像分类模型存在难以生成更接近相关标签的高层图像特征,以及因未能利用标签之间的视觉相关性而导致的识别精度不够高等问题,提出了一种基于空间注意力与图卷积的多标签图像分类算法.首先,利用图卷积网络学习标签邻接图特征和使用GLOVE算法,从标签序列获取的标签嵌入;其次,在高层语义信息中引入改进的空间注意力网络以对特定类别的语义特征进行重标定,实现背景和干扰信息的抑制;最后,在基于共现特征融合的分类器中,整合高层语义信息与图卷积网络提取的标签共现特征,采用通道一对一的方式完成模型最终预测.在两个公开数据集上进行实验表明,该算法在MS-COCO和VOC-2007数据集上的平均精度分别为81.42%和94.3%,较基础的MLGCN网络分别提升了1.13和1.3个百分点,且模型参数量仅为原模型的八分之一,训练过程中需要的迭代次数也远少于原模型,极大程度地降低了其训练成本. 展开更多
关键词 图卷积网络 多标签图像分类 空间注意力 特征融合
在线阅读 下载PDF
基于多头类特定残差注意力和图卷积的多标签图像分类算法
4
作者 龚亮威 宣士斌 +1 位作者 李培杰 李然 《微电子学与计算机》 2023年第8期45-54,共10页
针对ML-GCN中全局最大池化所获得的图像特征对特定类别在不同图像区域上缺乏针对性和丢失图像局部特征信息的问题,提出了类特定残差注意力(CSRA)模块.该模块可以有效捕获不同类别对象所占据的不同空间区域.此外,将提出的类特定残差注意... 针对ML-GCN中全局最大池化所获得的图像特征对特定类别在不同图像区域上缺乏针对性和丢失图像局部特征信息的问题,提出了类特定残差注意力(CSRA)模块.该模块可以有效捕获不同类别对象所占据的不同空间区域.此外,将提出的类特定残差注意力与图卷积神经网络相结合,提出了基于多头类特定残差注意力与图卷积的多标签图像分类算法(ML-CSRA).首先利用卷积神经网络提取通用的图像特征图,之后将提出的类特定残差注意力扩展为多头形式,并将其应用于通过卷积神经网络提取到的通用图像特征图,提取各个区域对应不同类别的特征.最后将图卷积神经网络提取的标签相关特征与多头类特定残差注意力提取的图像特征结合,得到最后的多标签图像分类结果.在MS-COCO 2014和VOC-2007数据集上的实验结果表明提出算法在所有评估指标上都优于目前已有算法. 展开更多
关键词 多标签图像分类 残差注意力 标签相关性 图卷积神经网络
在线阅读 下载PDF
基于双文本提示和多重相似性学习的多标签遥感图像分类
5
作者 白淑芬 宋铁成 《电讯技术》 北大核心 2025年第1期35-42,共8页
多标签遥感图像分类旨在预测遥感图像中出现的多个相互关联的对象,其中文本标签能赋予丰富的语义信息。然而,目前多数多标签图像分类法未能充分考虑视觉语义图像-文本对信息。为了解决这一问题,提出了一种基于双文本提示和多重相似性(Bi... 多标签遥感图像分类旨在预测遥感图像中出现的多个相互关联的对象,其中文本标签能赋予丰富的语义信息。然而,目前多数多标签图像分类法未能充分考虑视觉语义图像-文本对信息。为了解决这一问题,提出了一种基于双文本提示和多重相似性(Bi-text Prompts and Multi-similarity,BTPMS)学习的多标签遥感图像分类算法。该算法首先利用场景与对象标签文本的双文本提示(Bi-text Prompts,BTP)提供丰富的先验知识,再综合考虑场景与对象标签之间的关联,对所得的文本特征和图像特征计算多重相似性,最后利用相似性得分进行多标签遥感图像分类。此外,设计了新颖的局部特征注意力(Local Feature Attention,LFA)模块,从空间与通道维度上捕捉图像中局部结构。在两个基准遥感数据集上进行广泛实验,结果表明所提算法优于对比的多标签图像分类方法。 展开更多
关键词 遥感图像 多标签图像分类 视觉语言预训练 提示学习 局部特征注意力
在线阅读 下载PDF
基于改进MobileNet的公路行车环境安全风险源识别 被引量:1
6
作者 赵树恩 龚志坤 刘伟 《重庆交通大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第1期75-82,共8页
为了检测公路行车环境安全风险源,为公路风险源智能化管控和随机不确定场景下实时安全风险评估提供依据,研究了基于深度卷积神经网络模型的公路行车环境安全风险源识别算法。通过改进MobileNetV3的输出层激活函数和损失函数,将网络输出... 为了检测公路行车环境安全风险源,为公路风险源智能化管控和随机不确定场景下实时安全风险评估提供依据,研究了基于深度卷积神经网络模型的公路行车环境安全风险源识别算法。通过改进MobileNetV3的输出层激活函数和损失函数,将网络输出的风险源类别数量由一个变为多个,解决了同一图像中存在多种风险源的识别问题。利用空间注意力机制加强MobileNetV3网络的特征提取能力,解决了MobileNetV3通道注意力机制无法关注到通道内部风险源特征信息的问题,提升了模型识别准确率。通过通道剪枝方法去除冗余扩张通道,减少网络参数量,提升了模型预测速度。实验结果表明:该方法能够有效识别行车环境安全风险源,检测率达0.829,平均分类准确率达0.833,且具备实时检测效果。 展开更多
关键词 车辆工程 交通安全 行车环境安全风险源 多标签图像分类算法 MobileNet
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部