题名 面向超分辨率重建的层次间局部特征增强网络
1
作者
王晓峰
黄煜婷
张文尉
张轩
陈东方
机构
武汉科技大学计算机科学与技术学院
武汉科技大学智能信息处理与实时工业系统湖北省重点实验室
出处
《计算机工程与设计》
北大核心
2024年第8期2407-2414,共8页
基金
智能信息处理与实时工业系统湖北省重点实验室开放研究课题基金项目(ZNXX2022008)。
文摘
基于卷积神经网络的超分辨率重建模型以单项传播为主,层次越靠后感知信息的能力越微弱,导致层次间局部特征部分丢失,难以实质提升网络的特征表达能力。针对此问题,提出层次间局部特征增强网络。该方法由级联残差模块、层次间特征增强块和特征感知注意力机制组成。级联残差模块通过有效残差连接增加对残差分支信息的利用;层次间特征增强块提取不同深度特征的依赖关系,自适应调整中间层特征权值增强捕获关键信息的能力;特征感知注意力机制采用方向感知和位置判断的方式准确定位和识别感兴趣对象。多项标准数据集的实验结果表明,该方法能改善超分辨率的视觉重建效果,整体性能优于现有方法。
关键词
卷积神经网络
超分辨率
局部 特征 增强
级联残差模块
注意力机制
方向感知
位置判断
Keywords
convolutional neural network
super resolution
local feature enhancement block
cascade residual module
attention mechanism
direction perception
position judgement
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
题名 面向长期时间序列预测的多局部增强线性解码器研究
2
作者
陈子盎
郭世伟
马玉鹏
韩云飞
王保全
机构
中国科学院新疆理化技术研究所
中国科学院大学
新疆民族语音语言信息处理重点实验室
出处
《计算机工程与应用》
北大核心
2025年第16期179-186,共8页
基金
新疆杰出青年科学基金(2022D01E93)
新疆天山英才培养计划(2023TSYCLJ0022)
+2 种基金
新疆自然科学基金青年项目(2022D01B67)
新疆重大科技专项(2023A01006)
新疆天山英才创新团队项目(2023TSYCTD0011)。
文摘
在长期时间序列预测(long-term time series forecasting,LTSF)领域,采用编码器-解码器架构的深度学习模型展现出了卓越的性能。目前,虽然编码器从输入的历史序列中能够提取深层次的时间变化特征,捕获时间序列内部的周期性、趋势性以及局部信息相关性,但是解码器多依赖于编码器输出的全局特征,对编码器提取的局部特征利用不充分,限制了模型的预测性能。为充分挖掘和利用局部特征,提出了一种多局部增强线性解码器(multiple local augmented linear decoders,MLAD),通过引入局部特征增强机制(local feature augmented mechanism,LFAM),在编码器生成的特征序列上进行滑动,并将提取的局部特征与原始历史序列融合,从而生成多个局部增强序列,然后通过计算所有的局部增强序列对应预测序列的平均值来确定预测结果。在7个公开数据集上进行实验,结果表明MLAD达到或超过了现有主流模型性能,证明了其在LTSF任务中的有效性。
关键词
长期时间序列预测(LTSF)
多局部 增强 线性解码器(MLAD)
局部 特征 增强 机制 (lfam )
Keywords
long-term time series forecasting(LTSF)
multiple local augmented linear decoders(MLAD)
local feature augmented mechanism(lfam )
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
题名 融合有效掩膜和局部增强的遮挡行人重识别
被引量:4
3
作者
王小檬
梁凤梅
机构
太原理工大学信息与计算机学院
出处
《计算机工程与应用》
CSCD
北大核心
2024年第11期156-164,共9页
基金
山西省重点研发计划(202102030201012)。
文摘
在监控系统中行人经常会被各种障碍物遮挡,使得遮挡行人重识别仍然是一个长期存在的挑战。最近一些基于Transformer和外部语义线索的方法都改善了特征的表示和相关性能,但仍存在表示弱和语义线索不可靠等问题。为解决上述问题,提出了一种基于Transformer的新方法。引入了一种有效的掩膜生成方式,可靠的掩膜可以使模型不依赖外部语义线索并实现自动对齐。提出了一种基于平均注意力分数的序列重建模块,可以更有效地关注前景信息。提出了局部增强模块,获得了更鲁棒的特征表示。比较了所提方法和现有的各种方法在Occluded-Duke,Occluded-ReID,Partial-ReID,Market-1501数据集上的性能。Rank-1准确率分别达到了72.3%、84.8%、86.5%和95.6%,mAP精度分别为62.9%、83.2%、76.4%和89.9%,实验结果表明所提模型性能较其他先进网络有所提升。
关键词
遮挡行人重识别
原型掩膜
特征 注意力机制
平均注意力分数
局部 增强
TRANSFORMER
Keywords
occluded person re-identification
prototype mask
features attention mechanism
average attention score
local enhancement
Transformer
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 面向点云理解的双邻域图卷积方法
4
作者
李宗民
徐畅
白云
鲜世洋
戎光彩
机构
中国石油大学(华东)青岛软件学院计算机科学与技术学院
青岛滨海学院信息工程学院
出处
《浙江大学学报(工学版)》
北大核心
2025年第5期879-889,共11页
基金
国家重点研发计划资助项目(2019YFF0301800)
国家自然科学基金:资助项目(61379106)
山东省自然科学基金:资助项目(ZR2013FM036,ZR2015FM011)。
文摘
针对现有方法对局部点云结构建模时空间跨度有限以及传统特征聚合方法造成一定信息损失的问题,提出双邻域图卷积网络(DNGCN).在原始点云中增加角度先验,以增强对点云局部几何结构的理解,捕捉局部细节.对原始邻域进行扩展,在局域内设计双邻域图卷积,通过集成高斯自适应聚合,在提取较大感受野范围内显著特征的同时,充分保留原始邻域信息.通过局部-全局信息交互来增大局部点的空间跨度,捕获远距离依赖关系.本文方法在分类数据集ModelNet40和ScanObjectNN上分别取得了94.1%、89.6%的总体精度,与其他先进算法相比有显著提升,较DGCNN分别提升了1.2%、11.5%.在部件分割数据集ShapeNetPart和语义分割数据集ScanNetv2、S3DIS上均获得优秀的性能,平均交并比分别为86.7%、74.9%和69.8%.通过大量的实验,证明了该模型的有效性.
关键词
点云特征
图卷积网络
几何增强
局部 全局交互
注意力机制
Keywords
point cloud feature
graph convolution network
geometric enhancement
local-global interaction
attention mechanism
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 基于改进YOLOv8n的井下人员多目标检测
5
作者
问永忠
贾澎涛
夏敏高
张龙刚
王伟峰
机构
陕西陕煤蒲白矿业有限公司
西安科技大学计算机科学与技术学院
西安科技大学安全科学与工程学院
出处
《工矿自动化》
北大核心
2025年第1期31-37,77,共8页
基金
陕西省重点研发计划(2022QCY−LL−70)
陕西省秦创原“科学家+工程师”队伍建设项目(2023KXJ−052)。
文摘
针对井下危险区域人员监测视频存在光照不均匀、目标尺度不一致、遮挡等复杂情况,基于YOLOv8n网络结构,提出一种改进的井下人员多目标检测算法—YOLOv8n-MSMLAS。该算法对YOLOv8n的Neck层进行改进,添加多尺度空间增强注意力机制(MultiSEAM),以增强对遮挡目标的检测性能;在C2f模块中引入混合局部通道注意力(MLCA)机制,构建C2f-MLCA模块,以融合局部和全局特征信息,提高特征表达能力;在Head层检测头中嵌入自适应空间特征融合(ASFF)模块,以增强对小尺度目标的检测性能。实验结果表明:(1)与Faster R-CNN,SSD,RT-DETR,YOLOv5s,YOLOv7等主流模型相比,YOLOv8n-MSMLAS综合性能表现最佳,mAP@0.5和mAP@0.5:0.95分别达到93.4%和60.1%,FPS为80.0帧/s,参数量为5.80×106个,较好平衡了模型的检测精度和复杂度。(2)YOLOv8n-MSMLAS在光照不均、目标尺度不一致、遮挡等条件下表现出较好的检测性能,适用于现场检测。
关键词
煤矿井下危险区域
井下人员多目标检测
YOLOv8n
多尺度空间增强 注意力机制
自适应空间特征 融合
轻量化混合局部 通道注意力机制
Keywords
underground hazardous areas in coal mines
multi-target detection of underground personnel
YOLOv8n
multi-scale spatially enhanced attention mechanism
adaptive spatial feature fusion
lightweight hybrid local channel attention mechanism
分类号
TD323
[矿业工程—矿井建设]