检索结果-维普期刊中文期刊服务平台

融合双重注意力机制的缅甸语图像文本识别方法: 1; 作者王奉孝毛存礼 +3 位作者余正涛高盛祥黄于欣刘福浩《中文信息学报》北大核心 2025年第1期47-55,共9页; 由于缅甸语字符具有独特的语言编码结构以及字符组合规则,现有图像文本识别方法在缅甸语图像识别任务中无法充分关注文字边缘的特征,会导致缅甸语字符上下标丢失的问题。因此,该文基于Transformer框架的图像文本识别方法做出改进,提出... 展开更多; 关键词缅甸语文本识别通道和空间注意力特征增强文字边缘特征; 在线阅读下载PDF 职称材料

基于CSLS-CycleGAN的侧扫声纳水下目标图像样本扩增法被引量：2: 2; 作者汤寓麟王黎明 +3 位作者余德荧李厚朴刘敏张卫东《系统工程与电子技术》 EI CSCD 北大核心 2024年第5期1514-1524,共11页; 针对侧扫声纳水下目标图像稀缺,获取难度大、成本高,导致基于深度学习的目标检测模型性能差的问题,结合光学域类目标数据集丰富的现状,提出一种基于通道和空间注意力(channel and spatial attention,CSA)模块、最小二乘生成对抗生成网络... 展开更多; 关键词样本扩增侧扫声纳循环生成对抗网络通道和空间注意力模块最小二乘生成对抗网络; 在线阅读下载PDF 职称材料

基于改进FCOS网络的遥感目标检测被引量：7: 3; 作者郑美俊田益民杨帅《航天返回与遥感》 CSCD 北大核心 2022年第5期133-141,共9页; 找出目标的位置和类别是目标检测的主要任务。随着人工智能和深度学习的发展,目标检测可以达到人眼所达不到的精度。由于信息较少,覆盖面积小且基于锚框的检测算法易受锚框大小、比例数目的影响,对较小的目标难以精确检测。针对以上问题... 展开更多; 关键词卷积神经网络单阶段目标检测通道和空间注意力机制遥感应用; 在线阅读下载PDF 职称材料

基于全局时空感受野的高效视频分类方法: 4; 作者王辉涛胡燕《小型微型计算机系统》 CSCD 北大核心 2020年第8期1768-1775,共8页; 在现有混合卷积神经网络架构(2D+3D)的视频分类方法中,卷积滤波器都是对局部区域进行操作,无法捕获大范围的时空依赖关系,特征通道之间缺乏相互依赖关系,传统的三维卷积核无法很好地建模时空特征.针对这些问题,提出了一种基于全局时空... 展开更多; 关键词视频分类卷积神经网络通道和空间注意力全局时空感受野三维卷积核分解; 在线阅读下载PDF 职称材料

题名融合双重注意力机制的缅甸语图像文本识别方法: 1; 作者王奉孝毛存礼余正涛高盛祥黄于欣刘福浩; 机构昆明理工大学信息工程与自动化学院昆明理工大学云南省人工智能重点实验室; 出处《中文信息学报》北大核心 2025年第1期47-55,共9页; 基金国家自然科学基金(61732005,U21B2027,62166023,61866019) 云南省自然科学基金(2019FA023) 云南省重大科技专项计划(202103AA080015,202002AD080001)。; 文摘由于缅甸语字符具有独特的语言编码结构以及字符组合规则,现有图像文本识别方法在缅甸语图像识别任务中无法充分关注文字边缘的特征,会导致缅甸语字符上下标丢失的问题。因此,该文基于Transformer框架的图像文本识别方法做出改进,提出一种融合通道和空间注意力机制的视觉关注模块,旨在捕获像素级成对关系和通道依赖关系,降低缅甸语图像中噪声干扰,从而获得语义更完整的特征图。此外,在解码过程中,将基于多头注意力的解码单元组合为解码器,用于将特征序列转化为缅甸语文字。实验结果表明,该方法在自构的缅甸语图像文本识别数据集上相比Transformer识别准确率提高0.5%,达到95.3%。; 关键词缅甸语文本识别通道和空间注意力特征增强文字边缘特征; Keywords Burmese text recognition channels and spatial attention feature enhancement text edge features; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名基于CSLS-CycleGAN的侧扫声纳水下目标图像样本扩增法被引量：2: 2; 作者汤寓麟王黎明余德荧李厚朴刘敏张卫东; 机构海军工程大学电气工程学院中国人民解放军中国人民解放军; 出处《系统工程与电子技术》 EI CSCD 北大核心 2024年第5期1514-1524,共11页; 基金国家优秀青年科学基金(42122025) 国家自然科学基金(41974005,41971416,42074074) 湖北省杰出青年科学基金(2019CFA086)资助课题。; 文摘针对侧扫声纳水下目标图像稀缺,获取难度大、成本高,导致基于深度学习的目标检测模型性能差的问题,结合光学域类目标数据集丰富的现状,提出一种基于通道和空间注意力(channel and spatial attention,CSA)模块、最小二乘生成对抗生成网络(least squares generative adversarial networks,LSGAN)及循环对抗生成网络(cycle generative adversarial networks,CycleGAN)的侧扫声纳水下目标图像样本扩增方法。首先,受CycleGAN的启发,设计基于循环一致性的单循环网络结构,保证模型的训练效率。然后,在生成器中融合CSA模块,减少信息弥散的同时增强跨纬度交互。最后,设计了基于LSGAN的损失函数,提高生成图像质量的同时提高训练稳定性。在船舶光学域数据集与侧扫声纳沉船数据集上进行实验,所提方法实现了光学-侧扫声纳样本间信息的高效、稳健转换以及大量侧扫声纳目标样本的扩增。同时,基于本文生成样本训练后的检测模型进行了水下目标检测,结果表明,使用本文样本扩增数据训练后的模型在少样本沉船目标检测的平均准确率达到了84.71%,证明了所提方法实现了零样本和小样本水下强代表性目标样本的高质量扩增,并为高性能水下目标检测模型构建提供了一种新的途径。; 关键词样本扩增侧扫声纳循环生成对抗网络通道和空间注意力模块最小二乘生成对抗网络; Keywords sample augmentation side-scan sonar cycle generative adversarial networks(CycleGAN) channel and spatial attention(CSA)module least squares generative adversarial networks(LSGAN); 分类号 P227 [天文地球—大地测量学与测量工程]; 在线阅读下载PDF 职称材料

题名基于改进FCOS网络的遥感目标检测被引量：7: 3; 作者郑美俊田益民杨帅; 机构北京印刷学院信息工程学院; 出处《航天返回与遥感》 CSCD 北大核心 2022年第5期133-141,共9页; 基金国家自然科学基金项目(NSFC61378001,NSFC61178092)。; 文摘找出目标的位置和类别是目标检测的主要任务。随着人工智能和深度学习的发展,目标检测可以达到人眼所达不到的精度。由于信息较少,覆盖面积小且基于锚框的检测算法易受锚框大小、比例数目的影响,对较小的目标难以精确检测。针对以上问题,改进无锚框算法全卷积单阶段目标检测(Fully Convolutional One-stage Object Detection,FCOS)实现了小目标检测的效率和精度。将FCOS算法的特征提取网络结构残差网络(Residual Network,ResNet)更换为轻量级网络结构MobileNetV3,随后在骨干网络中引入通道注意力机制和空间注意力机制对特征提取网络进行改进,最后设计T交并比(TIOU)代替原本的交并比(IOU),改善模型精度。实验结果表明,所改进的网络结构与FCOS相比,网络训练时间和模型大小为原来的一半,计算参数量由原来的32.12×106减少为11.73×106,减少到原来的三分之一,模型推理速度提升了10%,每秒传输帧数为11帧,与主流网络Faster RCNN相比,检测精度和速度更快,可以满足对小目标的实时检测。; 关键词卷积神经网络单阶段目标检测通道和空间注意力机制遥感应用; Keywords convolutional neural network one-stage object detection convolutional block attention module remote sensing application; 分类号 TP79 [自动化与计算机技术—检测技术与自动化装置]; 在线阅读下载PDF 职称材料

题名基于全局时空感受野的高效视频分类方法: 4; 作者王辉涛胡燕; 机构武汉理工大学计算机学院; 出处《小型微型计算机系统》 CSCD 北大核心 2020年第8期1768-1775,共8页; 基金湖北省自然科学基金重点类项目(2017CFA012)资助湖北省自然科学基金项目(2019CFC919)资助.; 文摘在现有混合卷积神经网络架构(2D+3D)的视频分类方法中,卷积滤波器都是对局部区域进行操作,无法捕获大范围的时空依赖关系,特征通道之间缺乏相互依赖关系,传统的三维卷积核无法很好地建模时空特征.针对这些问题,提出了一种基于全局时空感受野的高效视频分类方法(CS-NL-SECO).首先将传统的三维卷积核分解成空域卷积核和时域卷积核,来更好地学习时空特征.然后在已有混合架构中的底层二维网络引入通道和空间注意力,通过学习自动获取每个特征通道的权重,依照权重关注重要的特征而抑制不相关的背景.最后在高层三维网络中引入全局时空感受野,学习全局时空特征表示自动捕获大范围的时空依赖关系.并在UCF101、HMDB51、Kinetics以及Something-something这四个视频分类常用的公有数据集上进行了实验,结果表明该方法无论在速度和精度上都远好于原方法,并且整体性能达到了最新方法的基准.; 关键词视频分类卷积神经网络通道和空间注意力全局时空感受野三维卷积核分解; Keywords video classification convolutional neural network channel and spatial attention global spatiotemporal receptive field seperable 3D convolution kernels; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	融合双重注意力机制的缅甸语图像文本识别方法	王奉孝毛存礼余正涛高盛祥黄于欣刘福浩	《中文信息学报》北大核心	2025	0	在线阅读下载PDF 职称材料
2	基于CSLS-CycleGAN的侧扫声纳水下目标图像样本扩增法	汤寓麟王黎明余德荧李厚朴刘敏张卫东	《系统工程与电子技术》 EI CSCD 北大核心	2024	2	在线阅读下载PDF 职称材料
3	基于改进FCOS网络的遥感目标检测	郑美俊田益民杨帅	《航天返回与遥感》 CSCD 北大核心	2022	7	在线阅读下载PDF 职称材料
4	基于全局时空感受野的高效视频分类方法	王辉涛胡燕	《小型微型计算机系统》 CSCD 北大核心	2020	0	在线阅读下载PDF 职称材料