-
题名三维坐标注意力路径聚合网络的目标检测算法
被引量:3
- 1
-
-
作者
涂小妹
包晓安
吴彪
金瑜婷
张庆琪
-
机构
浙江广厦建设职业技术大学建筑工程学院
浙江理工大学计算机科学与技术学院(人工智能学院)
浙江理工大学理学院
浙江广厦建设职业技术大学信息学院
山口大学东亚研究科
-
出处
《计算机科学与探索》
CSCD
北大核心
2023年第12期2984-2998,共15页
-
基金
浙江省重点研发计划项目(2020C03094)
国家级大学生创新创业训练计划项目(202010338024)
浙江省教育厅一般科研项目(Y202250677,Y202250706,Y202147659,Y202250679)。
-
文摘
针对YOLO系列算法在实际工业应用中存在对目标预测框定位不够准确,难以适用于对定位要求较高的现实场景的问题,提出了三维坐标注意力路径聚合网络的目标检测算法YOLO-T。首先,采用短连接方式对路径聚合特征金字塔的跨层特征进行融合,保留其浅层语义信息;其次,基于坐标注意力机制提出了三维坐标注意力(TDCA)模型,利用该模型对路径聚合特征金字塔内的特征进行注意力加权(TPA-FPN),保留有用信息和去除冗余信息;然后,改进了标签分配策略中简单最优传输分配(SimOTA)的损失矩阵计算方法,在保证不损失效率的同时增强了性能;最后,利用Depthwise Separable Conv改进了主干特征提取网络中的卷积模块使模型轻量化。实验结果表明:该算法在PASCAL VOC2007+2012数据集上,检测准确率mAP@0.50比YOLOX-S提高了1.3个百分点,mAP@0.50:0.95提高了3.8个百分点;在COCO2017数据集上平均检测精度mAP@0.50:0.95提高了2.4个百分点。
-
关键词
目标检测
三维坐标注意力(tdca)
注意力路径聚合特征金字塔(TPA-FPN)
YOLOX-S算法
改进SimOTA策略
-
Keywords
object detection
three-dimensional coordinate attention(tdca)
tdca path aggregation feature pyramid networks(TPA-FPN)
YOLOX-S algorithm
improved SimOTA strategy
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于原始点云网格自注意力机制的三维目标检测方法
被引量:4
- 2
-
-
作者
鲁斌
孙洋
杨振宇
-
机构
华北电力大学计算机系
复杂能源系统智能计算教育部工程研究中心
-
出处
《通信学报》
EI
CSCD
北大核心
2023年第10期72-84,共13页
-
基金
国家自然科学基金资助项目(No.62371188)
河北省在读研究生创新能力培养基金资助项目(No.CXZZBS2023153)。
-
文摘
为了增强感兴趣区域(RoI)的特征表达,包括空间网格特征编码模块和软回归损失,提出了一种基于原始点云网格自注意力机制的三维目标检测方法GT3D。网格特征编码模块用于通过自注意力机制对点的局部特征和空间特征进行有效加权,充分考虑点云之间的几何关系,以提供更准确的特征表达;软回归损失用于改善数据标注过程中由于标注不准确而产生的回归歧义问题。将所提方法在公开的三维目标检测数据集KITTI上进行实验。结果表明,所提方法相比其他已公开的基于点云的三维目标检测方法检测准确率提升明显,并提交了KITTI官方测试集进行公开测试,对简单、中等和困难3个难度等级的汽车检测准确率分别达到91.45%、82.76%和79.74%。
-
关键词
三维目标检测
点云
自注意力机制
空间坐标编码
软回归损失
-
Keywords
3D object detection
point cloud
self-attention mechanism
spatial coordinate encoding
soft regression loss
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名基于特征融合与注意力机制的脑肿瘤分割算法
被引量:9
- 3
-
-
作者
褚张晴晴
钟志强
颜子夜
战荫伟
-
机构
广东工业大学计算机学院
广州柏视医疗科技有限公司临床研究部算法组
-
出处
《计算机工程》
CAS
CSCD
北大核心
2023年第10期154-161,共8页
-
基金
广东省重点领域研发计划(2020B0101130019)。
-
文摘
脑肿瘤核磁共振成像(MRI)的准确分割对手术方案的制定和放疗计划具有重要意义。U-Net作为脑肿瘤分割领域应用最广泛的网络,具有较优的性能,但是存在跳跃连接中语义差距较大、MRI图像中跨通道信息利用不足的问题。为对脑肿瘤各区域进行准确分割,提出一种基于特征融合与注意力机制的改进U-Net模型FFCA-U-Net。在跳跃连接中设计特征融合模块代替U-Net中的直接拼接操作,以有效融合不同层次、不同尺度的特征信息,减小语义差距并调整感受野,增强网络对肿瘤特征的学习能力。在编码器中引入改进的三维坐标注意力机制,沿MRI图像的3个方向捕获跨通道信息,增强网络对脑肿瘤边界信息的感知能力,获得肿瘤子区域更精确的位置。此外,为快速获得肿瘤的相对位置、减少网络学习冗余,增加的掩码图像与MRI图像一起作为网络输入。在MSD数据集上的实验结果表明,FFCA-U-Net在增强肿瘤区域、非增强肿瘤区域和水肿区域的Dice系数分别为0.803 4、0.628 6和0.799 3,平均Dice为0.743 8,优于TransBTS、UNETR等其他先进网络。
-
关键词
脑肿瘤
U-Net模型
特征融合
三维坐标注意力机制
医学图像分割
-
Keywords
brain tumor
U-Net model
Feature Fusion(FF)
three-dimensional Coordinate Attention(CA)mechanism
medical image segmentation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名三维多层次特征协同的无人机遥感目标检测算法
被引量:5
- 4
-
-
作者
吕伏
傅宇恒
贺丽娜
杨冬鹏
-
机构
辽宁工程技术大学软件学院
辽宁工程技术大学基础教学部
无锡飞谱电子信息技术有限公司
辽宁省水利水电勘测设计研究院有限责任公司
-
出处
《计算机科学与探索》
CSCD
北大核心
2024年第5期1301-1317,共17页
-
基金
国家自然科学基金面上项目(51874166,52274206)
国家自然科学基金青年基金(51904144)。
-
文摘
针对无人机航拍图像小目标占比大和背景复杂的特点,当前目标检测模型存在精度低和小目标漏检等问题。基于YOLOv8s模型,提出了三维多层次特征协同的无人机遥感目标检测算法。首先,在坐标注意力的基础上提出了三维多分支坐标注意力(MBCA),通过增加通道维度的信息交互和扩展分支的拆分融合,减少空间维度的计算量,提高了模型全局特征提取能力。其次,采用SPD-Conv替换部分标准卷积,在下采样时有效保留更多特征信息并加快推理速度。然后,在C2f模块中采用了更高效的FastDBB_Bottleneck模块,结合PConv与DBB结构重参数化叠加,以进一步降低模型计算量。最终,通过引入PG-Detect检测头,显著减少计算量并有效降低小目标的漏检率。在VisDrone2019数据集上的实验结果显示,该方法的mAP50值达到了44.5%,较YOLOv8s基线模型提升了5.7个百分点。同时,在自建水坝裂缝数据集上,进行裂缝检测验证实验,改进方法的mAP50值相比YOLOv8s提升了3.3个百分点,FPS达到289帧。实验结果表明在复杂场景目标检测中,所提方法提升了检测模型的精度和实时性,具有良好的适应性和鲁棒性。
-
关键词
无人机遥感
三维多分支坐标注意力(MBCA)
YOLOv8
多层次特征融合
小目标检测
-
Keywords
UAV remote sensing
3D multi-branch coordinate attention(MBCA)
YOLOv8
multi-layer feature fusion
small target detection
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名融合点云和体素信息的目标检测网络
被引量:3
- 5
-
-
作者
刘慧
董振阳
田帅华
-
机构
北京建筑大学电气与信息工程学院
北京建筑大学建筑大数据智能处理方法研究北京市重点实验室
-
出处
《计算机工程与设计》
北大核心
2024年第9期2771-2778,共8页
-
基金
国家自然科学基金项目(62176018)。
-
文摘
为解决复杂自动驾驶场景下小目标检测效果不佳和漏检的问题,提出一种融合点云和体素信息的高性能网络架构。通过预处理模块、空间语义特征关联模块、坐标注意力机制模块等改进PV-RCNN网络的检测性能,构建网络架构PSC-RCNN。在KITTI上进行验证,实验结果表明,PSC-RCNN在简单、中等、困难3种检测难度的类别下,对于自行车这种形状复杂的小物体识别精度分别为82.99%、67.03%、59.88%,相对原有的PV-RCNN网络,识别精度分别提高了4.39%、3.32%、2.23%;相对于现有3D目标检测网络,识别精度分别提高了0.51%、2.93%、2.23%。
-
关键词
机器视觉
三维点云
三维体素
目标检测
空间语义特征关联
坐标注意力
特征融合
-
Keywords
machine vision
3D point cloud
3D voxel
object detection
spatial semantic feature concatenation
coordinate attention
feature fusion
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-