-
题名融合视觉机制和多尺度特征的小目标检测算法
被引量:1
- 1
-
-
作者
武德彬
刘笑楠
刘振宇
杨娜
-
机构
沈阳工业大学信息科学与工程学院
-
出处
《电讯技术》
北大核心
2024年第2期200-206,共7页
-
基金
辽宁省自然科学基金(20180520022)。
-
文摘
针对SSD(Single Shot MultiBox Detector)目标检测算法对小目标检测能力不足的问题,提出一种引入视觉机制和多尺度语义信息融合的VFF-SSD(Vision Feature Fusion SSD)改进算法。为了增大浅层网络的感受野提高特征提取能力,首先在SSD浅层特征层中加入视觉机制,然后利用改进PANet(Path Aggregation Network)多尺度特征融合网络与深层特征增强网络得到新的特征层,旨在增强浅层网络的语义信息并加强深层特征的特征表达能力,最后应用注意力机制模块提高对重要信息的学习能力。实验结果表明,在PASCAL VOC2007测试集检测的mAP(Mean Average Precision)值达到81.1%,对数据集中小目标的mAP值较原SSD提高了6.6%。
-
关键词
小目标检测
深度学习
视觉机制
多尺度语义信息
注意力机制
-
Keywords
small object detection
deep learning
vision mechanism
multi-scale semantic information
attention mechanism
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名基于改进SEGNET模型的图像语义分割
被引量:10
- 2
-
-
作者
罗嗣卿
张志超
岳琪
-
机构
东北林业大学信息与计算机工程学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2021年第4期256-261,共6页
-
基金
国家自然科学基金青年项目“基于用户标签和主体兴趣的社会媒体信息推荐研究”(61806049)。
-
文摘
使用原始SEGNET模型对图像进行语义分割时,未对图像中相邻像素点间的关系进行考虑,导致同一目标中像素点类别预测结果不一致。通过在SEGNET结构中加入一条自上而下的通道,使得SEGNET包含的多尺度语义信息更加丰富,从而提升对每个像素点的类别预测精度,在模型中加入生成对抗网络以充分考虑空间中相邻像素点间关系。实验结果表明,该模型的语义分割效果相比原始SEGNET模型显著提升,且可有效解决SEGNET测试中出现的分类错误问题。
-
关键词
SEGNET模型
生成对抗网络
多尺度语义信息
相邻像素类别关系
特征融合
-
Keywords
SEGNET model
Generative Adversarial Network(GAN)
multi-scale semantic information
adjacent pixel category relationship
feature fusion
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名融合注意力机制的肠道息肉分割多尺度卷积神经网络
被引量:4
- 3
-
-
作者
单芳湄
王梦文
李敏
-
机构
南京理工大学计算机科学与工程学院
山东省数字医学与计算机辅助手术重点实验室
-
出处
《图学学报》
CSCD
北大核心
2023年第1期50-58,共9页
-
基金
国家自然科学基金项目(61501241)
江苏省自然科学基金项目(BK20150792)
+1 种基金
山东省数字医学与计算机辅助手术重点实验室开放基金项目(SDKL-DMCAS-2018-04)
江苏省交通运输科技项目(2021Y)。
-
文摘
肠道息肉分割能够提供息肉在结肠中的位置和形态信息,方便医生依据其结构变化程度来推断癌变可能性,有利于结肠癌的早期诊断和治疗。针对许多现有的卷积神经网络所提取的多尺度特征有限,且常引入冗余和干扰特征,难以应对复杂多变的肠道息肉分割问题,提出了一种融合注意力机制的肠道息肉分割多尺度卷积神经网络(CNN)。首先,设计不同比例金字塔池化策略提取丰富的多尺度上下文信息;然后,通过在网络中融入通道注意力机制,模型能够根据目标自适应地选择合适的局部上下文信息和全局上下文信息进行特征集成;最后,联合金字塔池化策略和通道注意力机制构建多尺度有效语义融合解码网络,增强模型对形状、大小复杂多变的肠道息肉分割的鲁棒性。实验结果表明,本文模型分割的Dice系数、IoU和灵敏度在CVC-ClinicDB数据集上分别为90.6%,84.4%和91.1%,在ETIS-Larib数据集上分别为80.6%,72.6%和79.0%,其能够从肠镜图像中准确、有效地分割出肠道息肉。
-
关键词
息肉分割
肠镜图像
卷积神经网络
多尺度语义信息
注意力机制
-
Keywords
polyp segmentation
colonoscopy images
convolutional neural network
multiscale semantic information
attention mechanism
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-