-
题名基于改进YOLOv8s的遥感图像目标检测
- 1
-
-
作者
刘雅
张智
-
机构
武汉科技大学计算机科学与技术学院
武汉科技大学湖北省智能信息处理与实时计算重点实验室
-
出处
《计算机工程与设计》
北大核心
2025年第5期1459-1466,共8页
-
基金
科技创新“2030”新一代人工智能技术基金项目(2020AAA0108500)
国家自然科学基金项目(U1836118)
+1 种基金
武汉市重点研发计划基金项目(2022012202015070)
富媒体数字出版内容组织与知识服务重点实验室开放基金项目(ZD2022-10/05)。
-
文摘
针对遥感图像存在的小目标密集、目标遮挡、背景复杂等问题,提出一种改进YOLOv8s的遥感图像目标检测网络模型。采用空间到深度卷积中的SPD模块,在特征提取时保留更多信息;基于Bottleneck Transformer设计BOT模块,在保持全局上下文建模的同时,更好地捕捉图像中的局部特征;引入注意力机制设计C2fGAM模块,聚焦有效信息,抑制无效背景信息;将上采样模块替换为CARAFE上采样,提高特征重建质量。实验结果表明,该模型相较其它算法具有更好的检测效果和较强的通用性。
-
关键词
YOLOv8s
目标检测
深度学习
遥感图像
空间到深度卷积
TRANSFORMER
注意力机制
-
Keywords
YOLOv8s
target detection
depth learning
remote sensing image
space-to-depth convolution
Transformer
attention mechanism
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名基于记忆增强潜在扩散模型的异常检测
- 2
-
-
作者
张吉陈
张智
-
机构
武汉科技大学计算机科学与技术学院
国家新闻出版署富媒体数字出版内容组织与知识服务重点实验室
武汉科技大学湖北省智能信息处理与实时计算重点实验室
武汉科技大学大数据科学与工程研究院
-
出处
《计算机工程与设计》
北大核心
2025年第9期2592-2598,共7页
-
基金
科技创新“2030”新一代人工智能技术基金项目(2020AAA0108500)
国家自然科学基金项目(U1836118)
+1 种基金
武汉市重点研发计划基金项目(2022012202015070)
富媒体数字出版内容组织与知识服务重点实验室开放基金项目(ZD2022-10/05)。
-
文摘
为解决传统基于重构的异常检测方法重建图像质量低导致异常检测准确度不高的问题,提出了一种基于记忆增强扩散模型的异常检测方法。考虑到时间成本以及计算资源有限,使用潜在扩散模型作为基础架构。同时为更好的避免异常部分的直接重建,引入了记忆增强模块记住正常数据的典型特征,从而使异常数据的重构误差更大,提高了异常检测的准确性。为了在保证正常区域相同的情况下重建异常区域,提出了一种噪声条件嵌入的方法,提高了重建的稳定性。在MVTec-AD上的实验结果表明,与相关方法相比,所提方法有更好的检测和定位性能。
-
关键词
异常检测
扩散模型
记忆增强
潜在空间
自编码器
噪声条件嵌入
生成模型
-
Keywords
anomaly detection
diffusion model
memory-augmented
latent space
autoencoder
noise-conditioned embedding
generative model
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名结合多尺度融合和图匹配的行人重识别
- 3
-
-
作者
李冬
张智
-
机构
武汉科技大学计算机科学与技术学院
国家新闻出版署富媒体数字出版内容组织与知识服务重点实验室
武汉科技大学湖北省智能信息处理与实时计算重点实验室
武汉科技大学大数据科学与工程研究院
-
出处
《计算机工程与设计》
北大核心
2024年第7期2180-2186,共7页
-
基金
科技创新“2030”新一代人工智能技术基金项目(2020AAA0108500)
国家自然科学基金项目(U1836118)
+1 种基金
武汉市重点研发计划基金项目(2022012202015070)
富媒体数字出版内容组织与知识服务重点实验室开放基金项目(ZD2022-10/05)。
-
文摘
由于行人遮挡、视角变化等因素影响,传统的行人重识别并不能准确表达遮挡行人的信息。针对该问题,提出一种基于多尺度融合和图匹配的网络模型。分为提取不同尺度的特征和基于拓扑结构匹配图像两个部分,将主干网络分为两个子分支分别提取全局特征并融合多个网络层面的局部特征;使用多头注意力机制学习相邻关键点的关系,基于拓扑结构匹配图像并预测相似度结果。使用ResNet-50作为主干网络,在Occluded-Duke数据集上的Rank-1和mAP分别是64.8%和59.9%,验证该模型在遮挡行人重识别中有一定程度的准确率提升。
-
关键词
行人重识别
目标检测
局部特征
多尺度特征融合
图注意力机制
图匹配
卷积神经网络
-
Keywords
person re-identification
target detection
local features
multi-scale feature fusion
graph attention mechanism
graph matching
convolutional neural network
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-