期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于双重注意力融合和空洞残差特征增强的场景文本检测
被引量:
1
1
作者
李利荣
张开
+4 位作者
陈鹏
周蕾
乐玲
熊炜
巩朋成
《激光杂志》
CAS
北大核心
2022年第1期45-51,共7页
针对自然场景中任意形状文本容易漏检、错检的问题,提出了一种基于双重注意力融合和空洞残差特征增强的场景文本检测方法。为了增强文本特征通道之间的潜在联系,提出了双重注意力融合(DAF)模块,采用双向特征金字塔与双重注意力融合模块...
针对自然场景中任意形状文本容易漏检、错检的问题,提出了一种基于双重注意力融合和空洞残差特征增强的场景文本检测方法。为了增强文本特征通道之间的潜在联系,提出了双重注意力融合(DAF)模块,采用双向特征金字塔与双重注意力融合模块相结合的方式进行多层的特征融合;另外针对深层特征图在降维的过程中可能造成语义丢失的现象,提出了空洞残差特征增强(D-RFA)模块。通过在弯曲文本数据集CTW1500上的测试表明,该方法的准确率、召回率和F值分别达到了87.8%、84.2%和86.0%,同时在多方向文本数据集ICDAR2015上也有良好的表现,证明了该方法在各种形状文本检测上的有效性。
展开更多
关键词
场景文本检测
双向特征金字塔
双重注意力融合
空洞残差特征增强
在线阅读
下载PDF
职称材料
PillarTNet:基于Transformer的三维目标检测模型
2
作者
韩建栋
苏佳
《小型微型计算机系统》
北大核心
2025年第9期2168-2175,共8页
针对三维点云目标检测中传统的卷积神经网络在特征提取阶段因下采样导致分辨率降低,影响小目标的识别准确性问题,本文提出一种基于Transformer的三维目标检测模型:PillarTNet.该模型首先使用双重注意力融合模块强化特征编码,然后通过区...
针对三维点云目标检测中传统的卷积神经网络在特征提取阶段因下采样导致分辨率降低,影响小目标的识别准确性问题,本文提出一种基于Transformer的三维目标检测模型:PillarTNet.该模型首先使用双重注意力融合模块强化特征编码,然后通过区域扩张注意力模块提取特征,保持整个过程伪图像分辨率不变,更有利于小目标的检测,同时引入区域移位机制促进不同区域的信息交流.但是注意力操作会存在大量空体素,可能增加大目标的漏检与误检风险,为此,对检测头采用空体素关注模块以缓解这一问题.在KITTI数据集上的实验结果显示:PillarTNet在确保Car和Cyclist检测精度的同时,Pedestrian的检测在3个难度等级的AP 3D分别达到了62.48%、53.21%和49.57%,且本模型在推理速度和内存需求方面均表现出色,充分验证了PillarTNet的优越性和适应性.
展开更多
关键词
三维目标检测
点云
TRANSFORMER
双重注意力融合
空体素关注
在线阅读
下载PDF
职称材料
题名
基于双重注意力融合和空洞残差特征增强的场景文本检测
被引量:
1
1
作者
李利荣
张开
陈鹏
周蕾
乐玲
熊炜
巩朋成
机构
湖北工业大学电气与电子工程学院
湖北工业大学太阳能高效利用省协同创新中心
出处
《激光杂志》
CAS
北大核心
2022年第1期45-51,共7页
基金
国家自然科学基金(No.62071172)。
文摘
针对自然场景中任意形状文本容易漏检、错检的问题,提出了一种基于双重注意力融合和空洞残差特征增强的场景文本检测方法。为了增强文本特征通道之间的潜在联系,提出了双重注意力融合(DAF)模块,采用双向特征金字塔与双重注意力融合模块相结合的方式进行多层的特征融合;另外针对深层特征图在降维的过程中可能造成语义丢失的现象,提出了空洞残差特征增强(D-RFA)模块。通过在弯曲文本数据集CTW1500上的测试表明,该方法的准确率、召回率和F值分别达到了87.8%、84.2%和86.0%,同时在多方向文本数据集ICDAR2015上也有良好的表现,证明了该方法在各种形状文本检测上的有效性。
关键词
场景文本检测
双向特征金字塔
双重注意力融合
空洞残差特征增强
Keywords
scene text detection
bidirectional feature pyramid
dual attention fusion
dilated residual feature augmentation
分类号
TN249 [电子电信—物理电子学]
在线阅读
下载PDF
职称材料
题名
PillarTNet:基于Transformer的三维目标检测模型
2
作者
韩建栋
苏佳
机构
山西大学计算机与信息技术学院
山西大学计算智能与中文信息处理教育部重点实验室
出处
《小型微型计算机系统》
北大核心
2025年第9期2168-2175,共8页
基金
山西省自然科学基金项目(20210302123443)资助。
文摘
针对三维点云目标检测中传统的卷积神经网络在特征提取阶段因下采样导致分辨率降低,影响小目标的识别准确性问题,本文提出一种基于Transformer的三维目标检测模型:PillarTNet.该模型首先使用双重注意力融合模块强化特征编码,然后通过区域扩张注意力模块提取特征,保持整个过程伪图像分辨率不变,更有利于小目标的检测,同时引入区域移位机制促进不同区域的信息交流.但是注意力操作会存在大量空体素,可能增加大目标的漏检与误检风险,为此,对检测头采用空体素关注模块以缓解这一问题.在KITTI数据集上的实验结果显示:PillarTNet在确保Car和Cyclist检测精度的同时,Pedestrian的检测在3个难度等级的AP 3D分别达到了62.48%、53.21%和49.57%,且本模型在推理速度和内存需求方面均表现出色,充分验证了PillarTNet的优越性和适应性.
关键词
三维目标检测
点云
TRANSFORMER
双重注意力融合
空体素关注
Keywords
3D object detection
point cloud
Transformer
dual attention fusion
empty voxel attention
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于双重注意力融合和空洞残差特征增强的场景文本检测
李利荣
张开
陈鹏
周蕾
乐玲
熊炜
巩朋成
《激光杂志》
CAS
北大核心
2022
1
在线阅读
下载PDF
职称材料
2
PillarTNet:基于Transformer的三维目标检测模型
韩建栋
苏佳
《小型微型计算机系统》
北大核心
2025
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部