-
题名多分支特征映射的遥感图像目标检测算法
被引量:5
- 1
-
-
作者
闵锋
况永刚
郝琳琳
彭伟明
-
机构
武汉工程大学计算机科学与工程学院智能机器人湖北省重点实验室
-
出处
《计算机科学与探索》
CSCD
北大核心
2024年第6期1543-1555,共13页
-
基金
国家自然科学基金(62171328)
武汉工程大学研究生教育创新基金项目(CX2022321)。
-
文摘
由于遥感图像具有背景复杂、目标较小且密集、尺度连续变化大等特点,通用目标检测器难以较好地适应,导致检测效果不佳。针对以上问题,基于YOLOv5s模型,提出一种多分支特征映射的遥感图像目标检测算法。首先,利用结构重参数化技术设计一种结合门控通道转换的RepVGG模块,采用其串联结构替换原主干网络的C3模块,聚合全局上下文信息,增强特征表达和特征提取能力;其次,使用自适应指数加权池化方法以及逆过程重构特征融合网络的采样方式,最大化地保留特征信息,改善较小目标的检测效果;最后,引入EIoU和Focal Loss组合作为模型的损失函数,优化预测框的回归速率以及难易样本的损失权重分配,进一步提高定位精度。在DIOR和NWPU VHR-10数据集上的实验结果表明,提出算法的平均精度均值分别达到92.2%、92.5%,较YOLOv5s分别提高了3.5个百分点、5.6个百分点,达到了更好的检测效果,同时实时性也满足实际场景下的遥感图像目标检测。
-
关键词
遥感图像
结构重参数化
门控通道转换
采样方式
损失权重分配
-
Keywords
remote sensing images
structural reparameterization
gated channel transformation
sampling method
loss weight allocation
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名跨视图时序对比学习的自监督视频表征算法
- 2
-
-
作者
王露露
徐增敏
张雪莲
蒙儒省
卢涛
-
机构
桂林电子科技大学数学与计算科学学院广西高校数据分析与计算重点实验室
广西应用数学中心(桂林电子科技大学)
桂林安维科技有限公司
武汉工程大学计算机科学与工程学院智能机器人湖北省重点实验室
-
出处
《计算机工程与应用》
CSCD
北大核心
2024年第18期158-166,共9页
-
基金
广西自然科学基金(2024GXNSFAA010493)
国家自然科学基金(61862015,62072350)
+1 种基金
广西科技基地和人才专项(AD23023002,AD21220114)
广西重点研发计划项目(AB17195025)。
-
文摘
现有的自监督表征算法主要关注视频帧之间的短期运动特性,但是帧间动作序列的变化幅度较小,而且单视图数据因语义受限影响深度特征表达能力,视频动作中丰富的多视图信息未被充分利用。为此提出基于跨视图语义一致性的时序对比学习算法,自监督学习RGB帧和光流场两种数据中蕴含的动作时序变化特性,主要思路为:设计局部时序对比学习方法,采用不同正负样本划分策略,挖掘同一实例不重叠片段之间的时序相关性和判别可分性,增强细粒度特征表达能力;研究全局对比学习方法,通过跨视图语义协同训练来增加正样本,学习多实例不同视图的语义一致性,提高模型的泛化能力。通过两个下游任务对模型效果进行评估,在UCF101和HMDB51数据集的实验结果表明,所提方法在动作识别和视频检索任务上,较前沿主流方法平均提升了2~3.5个百分点。
-
关键词
自监督学习
视频表征学习
时序对比学习
局部对比学习
跨视图协同
-
Keywords
self-supervised learning
video representation learning
temporal contrastive learning
local contrastive learning
cross-view co-training
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
TP183
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于空间自适应和内容感知的红外小目标检测
- 3
-
-
作者
闵锋
刘彪
况永刚
毛一新
刘煜晖
-
机构
武汉工程大学计算机科学与工程学院智能机器人湖北省重点实验室
-
出处
《红外技术》
CSCD
北大核心
2024年第7期735-742,共8页
-
基金
国家自然科学基金(62171328)。
-
文摘
由于红外街道图像中小目标像素较少、颜色特征不丰富,容易导致模型漏检、误检以及检测效果不佳等问题,因此提出了一种基于空间自适应和内容感知的红外小目标检测算法。首先,通过堆叠局部注意力与可变形注意力设计一种基于空间自适应的转换器,以增强对长距离依赖特征的建模能力,捕获到更多空间位置信息。其次,采用内容感知特征重组算子进行特征上采样,实现在大感受野内聚合上下文信息以及利用浅层特征信息来自适应地重组特征。最后增加160×160的高分辨率预测头,将输入特征的像素点映射到更细小的检测区域,进一步改善小目标的检测效果。在FILR数据集上的实验结果表明,改进算法的平均精度均值达到85.6%,相较于YOLOX-s算法提高了3.9%,验证了所提算法在红外小目标检测上的优越性。
-
关键词
空间自适应
内容感知
红外目标
重组特征
高分辨率预测头
-
Keywords
spatially adaptive
content aware
infrared targe
restructuring features
high resolution prediction head
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名在线模板的人脸特征点对齐
被引量:7
- 4
-
-
作者
徐国庆
-
机构
武汉工程大学计算机科学与工程学院智能机器人湖北省重点实验室
-
出处
《计算机工程与设计》
CSCD
北大核心
2013年第11期4021-4026,共6页
-
基金
湖北省高等学校优秀中青年科技创新团队计划基金项目(T201206)
武汉工程大学科研基金项目(12126021)
-
文摘
为提高实时人脸对齐的精度和效率,在AAM关键点对齐算法基础上,提出融合在线多帧特征信息的特征点更新实时人脸对齐方法。利用前帧已对齐的特征点信息,快速计算本帧运动矢量,作为本帧对齐初始位置,使本帧对齐迭代的初始点充分接近最优解,避免大范围搜索容易陷入的局部极小问题;人脸检测的初始化过程仅在完全丢失或第一帧初始化时进行一次,后续帧在前帧基础上更新位置,提高跟踪速度;针对人脸运动过快出现的块匹配失效问题,使用多分辨率块搜索算法,在各级图像上进行块对齐,在大范围的快速移动条件下,仍然能够实现特征点匹配。在实时网络摄像头条件下进行跟踪实验。实验结果表明,提出的特征点更新算法能够实时跟踪快速的人脸移动,并在较少的迭代次数内实现人脸对齐。
-
关键词
人机交互
人脸对齐
在线特征点更新
主动表观模型
主方向滤波
-
Keywords
human computer interactive
face alignment
online features update
active appearance mode
principal direction filtering
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名基于递归树的递归调用分析
被引量:7
- 5
-
-
作者
张俊
-
机构
武汉工程大学计算机科学与工程学院智能机器人湖北省重点实验室
-
出处
《实验室研究与探索》
CAS
北大核心
2010年第3期83-87,共5页
-
文摘
提出一种基于递归树的递归调用分析方法。通过建立子递归调用与树节点的映射关系,设计了创建递归树的递归算法。研究了观察点与递归树遍历序列的关系,提出了"遍历序列-观察点-递归调用映射规则"。实现了递归树的创建及遍历,并基于STL和boost库定义了一组分析工具。
-
关键词
递归树
创建算法
遍历序列
映射规则
分析工具
-
Keywords
recursive tree
creation algorithm
traverse sequence
mapping rule
analytical tools
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名复合特征的眼睛中心定位
被引量:4
- 6
-
-
作者
徐国庆
-
机构
武汉工程大学计算机科学与工程学院智能机器人湖北省重点实验室
-
出处
《计算机工程与设计》
CSCD
北大核心
2014年第10期3598-3601,共4页
-
基金
湖北省高等学校优秀中青年科技创新团队计划基金项目(T201206)
武汉工程大学科研基金项目(12126021)
-
文摘
为实现在正面人脸中定位眼睛中心点,提出复合特征算法。在整体人脸图像主动表观模型的基础上,引入局部表观模型,使全局AAM的最优结果进一步转换到眼睛局部区域的最优定位,结合在线的肤色纹理特征,使用扇形区域积分定位内外眼角点,实现眼睛边界点的在线精确定位。使用积分图的特征梯度定位虹膜区域的边界,用圆形参数进行虹膜边缘检测,实现眼睛虹膜区域的精确定位。实验结果表明,该算法可以鲁棒地确定眼睛中心,对于实时视频等低分辨率图像能够较好地实现定位。
-
关键词
人机交互
局部表观模型
复合投影
眼睛定位
在线特征
-
Keywords
human computer interactive
local active appearance mode
composite projection
eye corner location
online fea-ture points
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名上肢残肢肌电信号交互的实现
被引量:1
- 7
-
-
作者
徐国庆
吴云韬
-
机构
武汉工程大学计算机科学与工程学院智能机器人湖北省重点实验室
-
出处
《计算机工程与设计》
北大核心
2015年第12期3344-3348,共5页
-
基金
湖北省自然科学基金项目(2014CFB786)
湖北省高等学校青年教师深入企业行动计划基金项目(XD2014146)
+1 种基金
湖北省高等学校优秀中青年科技创新团队计划基金项目(T201206)
武汉工程大学科学研究基金项目
-
文摘
针对上肢截肢患者的康复训练,结合上肢残肢肌电信号,获取并识别截肢上肢动作。从上肢表面肌电信号中提取短时能量和短时过零率特征,实现对动作段的分割,构建特征向量,使用SVM分类器对多样本数据进行统计分类,生成最优分类面。实验中,针对伸屈腕动作信号中的连续动作段,该方法总体识别率为99.1%,实验结果表明,肌电信号的短时特征基于时域累积,可以对上肢肌电信号动作进行鲁棒识别,是截肢上肢康复训练系统的有效方法。
-
关键词
人机交互
上肢截肢
肌电信号
支持向量机
虚拟现实
动作识别
-
Keywords
human computer interactive
upper limb amputation
electromyographic signal
support vector machine
virtual reality
motion recognition
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名肤色历史图的人脸动作识别
被引量:1
- 8
-
-
作者
徐国庆
吴云韬
-
机构
武汉工程大学计算机科学与工程学院智能机器人湖北省重点实验室
-
出处
《计算机工程与设计》
北大核心
2015年第10期2813-2817,共5页
-
基金
湖北省自然科学基金项目(2014CFB786)
湖北省高等学校青年教师深入企业行动计划基金项目(XD2014146)
+1 种基金
湖北省高等学校优秀中青年科技创新团队计划基金项目(T201206)
武汉工程大学科研基金项目(12126021)
-
文摘
为实现对视频中的人脸动作进行识别,提出一种肤色历史图的识别算法。在运动人脸视频中通过在线肤色实现人脸运动的位置预估,结合主动表观模型的关键点匹配,在历史图像中获得运动矢量;对匹配的关键点使用运动方向滤波算法,去除误匹配的关键点,使保留的关键点的匹配方向与脸部实际运动方向一致,提高关键点匹配的有效性。在动作识别中,使用动作序列概率算法对两类脸部运动进行区分,实验结果表明,该算法能够在运动人脸视频中较好地识别点头摇头动作,对快速运动视频有较鲁棒的跟踪效果。
-
关键词
人机交互
表观模型
运动历史图
关键点跟踪
动作识别
-
Keywords
human computer interactive
active appearance mode
motion history image
key point track
motion recognition
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名基于稀疏主成分分析和自适应阈值选择的图像分割算法
被引量:1
- 9
-
-
作者
卢涛
万永静
杨威
-
机构
武汉工程大学计算机科学与工程学院智能机器人湖北省重点实验室
-
出处
《计算机科学》
CSCD
北大核心
2016年第7期95-100,共6页
-
基金
863计划项目(2013AA12A202)
国家自然科学基金项目(61502354)
+9 种基金
国家留学基金委
湖北省自然科学基金项目(2012FFA099
2012FFA134
2013CF125
2014CFA130
2015CFB451)
湖北省青年科技晨光计划:极低质量图像超分辨率重建与识别
湖南省科技计划项目(2014FJ3157)
自主系统与网络控制教育部重点实验室开放基金(2013A11)
武汉工程大学研究基金项目(K201403)资助
-
文摘
图像分割是机器视觉中的基础问题,基于阈值的图像分割算法依赖于参数调整,但参数调整容易受到局部最小值的影响且需要耗费大量时间,从而降低了分割算法的质量和效率。为了实现图像分割过程中的自适应阈值选择,提出了一种基于稀疏主成分分析和自适应阈值选择的图像分割算法。该算法首先利用稀疏主成分分析感知图像的噪声水平以自适应去噪,其次通过二维直方图感知图像的主干区域内容以自适应获得全局分割阈值,然后通过移动平均法的局部阈值分割算法对图像进行分割,最后将全局阈值分割和局部阈值分割图像结合,从而获得最佳的分割图像结果。在伯克利数据集上的仿真实验结果表明:相比传统的阈值分割算法,该算法在分割边缘的准确性和对噪声的鲁棒性上具有一定的优势,在主客观上均具有较好的分割效果,基于稀疏主成分分析的自适应阈值选择方法提高了图像的分割质量。
-
关键词
阈值分割
稀疏主成分分析
全局阈值
局部阈值
-
Keywords
Threshold segmentation, Sparse principal component analysis,Global threshold, Local threshold
-
分类号
TP37
[自动化与计算机技术—计算机系统结构]
-
-
题名低分辨图像眼睛精确定位方法
被引量:1
- 10
-
-
作者
徐国庆
-
机构
武汉工程大学计算机科学与工程学院智能机器人湖北省重点实验室
-
出处
《计算机应用研究》
CSCD
北大核心
2015年第11期3501-3503,3512,共4页
-
基金
湖北省自然科学基金资助项目(2014CFB786)
湖北省高等学校青年教师深入企业行动计划资助项目(XD2014146)
+1 种基金
湖北省高等学校优秀中青年科技创新团队计划资助项目(T201206)
武汉工程大学科学研究基金资助项目(K201543)
-
文摘
针对低分辨率图像中的人眼定位问题,提出一种融合主动表观模型和在线肤色纹理特征的低分辨图像中精确定位眼睛的方法。该方法通过在线人脸的肤色模板,结合眼睛局部区域的纹理特征,同时引入眼睛拟合模型,对上下眼睑边缘和眼角点进行精确拟合定位。考虑到虹膜区域的低分辨特点,使用圆形区域积分计算虹膜的精确位置,实现对虹膜中心点的精确定位。实验结果表明,该算法在低分辨率图像特别是网络摄像头采集的视频人脸图像中能够鲁棒实现眼睛区域的精确定位。
-
关键词
人脸对齐
在线特征
关键点检测
眼睛定位
眼睛参数拟合
-
Keywords
face alignment
online features
key points detection
eye location
eye parameter fitting
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名对称边界搜索的虹膜中心定位
- 11
-
-
作者
徐国庆
-
机构
武汉工程大学计算机科学与工程学院智能机器人湖北省重点实验室
-
出处
《计算机工程与设计》
北大核心
2015年第9期2514-2518,共5页
-
基金
湖北省自然科学基金项目(2014CFB786)
湖北省高等学校青年教师深入企业行动计划基金项目(XD2014146)
+1 种基金
湖北省高等学校优秀中青年科技创新团队计划基金项目(T201206)
武汉工程大学科研基金项目(12126021)
-
文摘
提出一种对称边界虹膜中心搜索算法,利用像素搜索计算简单、时间消耗少、定位准确的优点,解决眉毛及上眼睑厚重导致定位点上移的问题。使用人脸特征检测实现眼睛区域的粗定位,通过在线肤色纹理及边缘特征确定眼睛的准确角点,在眼睛局部区域使用投影函数检测眼睛的中心点,以中心点为起始点,使用对称边界搜索检测虹膜区域的边界,实现虹膜中心点的定位。测试实验结果表明,使用本文的方法能够快速准确实现虹膜中心点和边界点的定位,准确率在94%以上。
-
关键词
人机交互
局部表观模型
复合投影
眼睛检测
虹膜定位
-
Keywords
human computer interactives
local features
compound projection
eye detection
iris location
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名基于时域频域混合特征的多变量时序预测模型
- 12
-
-
作者
闵锋
刘宇卓
刘煜晖
刘彪
-
机构
武汉工程大学计算机科学与工程学院智能机器人湖北省重点实验室
-
出处
《计算机科学与探索》
2025年第8期2099-2109,共11页
-
基金
国家自然科学基金(62171328)
武汉工程大学研究生教育创新基金(CX2024144)。
-
文摘
目前多变量时间序列预测方法主要是将时间序列转换为频域表示来提取特征信息,然而频域表示下序列会损失部分时域信息造成精度损失,且传统注意力机制会产生平方级时间复杂度。针对上述问题,提出了一种基于时域频域混合特征的多变量时序预测模型(TFMformer)。模型采用多尺度切分操作,以多尺度混合的视角分解出更准确语义,增强模型捕获序列综合语义信息的能力并通过切片操作减少模型输入token数来降低时间复杂度。提出时域频域混合特征增强模块,将时域和频域特征进行融合与交互,从而提升整体特征表征能力。同时提出在频域注意力的基础上引入时域特征信息,提升频域空间对时域信息感知能力,使得模型能够更精准地聚焦于有意义的特征组合,减少因时域信息缺失造成的预测偏差。TFMformer模型在6个基准数据集上进行了实验,预测结果与现有的先进方法相比,均方误差和平均绝对误差分别平均下降了3.8%和2.8%,其中平均绝对误差最高下降了11.2%,证明了该模型的有效性。
-
关键词
多变量时间序列预测
Transformer
序列分解
频域注意力机制
深度学习
-
Keywords
multivariate time series prediction
Transformer
sequence decomposition
frequency domain attention mechanism
deep learning
-
分类号
TP183
[自动化与计算机技术]
-