-
题名复杂场景下的行人跌倒检测算法
被引量:5
- 1
-
-
作者
方可
刘蓉
魏驰宇
张心月
刘杨
-
机构
华中师范大学物理科学与技术学院
-
出处
《计算机应用》
CSCD
北大核心
2023年第6期1811-1817,共7页
-
基金
国家社会科学基金资助项目(19BTQ005)。
-
文摘
随着人口老龄化程度的不断深化,跌倒检测成为医疗与健康领域的一个关键问题。针对复杂场景下跌倒检测算法准确率偏低的问题,提出一种改进的跌倒检测模型——PDD-FCOS(PVT DRFPN DIoU-Fully Convolutional One-Stage object detection)。在基准FCOS算法的骨干网络中引入金字塔视觉转换器(PVT),以不增加计算量为前提提取更丰富的语义信息;在特征信息融合阶段插入双重细化特征金字塔网络(DRFPN),更加准确地学习特征图之间采样点的位置和其他信息,并通过上下文信息捕获特征通道之间更准确的语义关系,从而提升检测性能;训练阶段采用距离交并比(DIoU)损失进行边界框回归,通过优化预测框与目标框中心点的距离,使回归框收敛得更快更准确,从而有效提高跌倒检测算法的准确率。实验结果表明,所提模型在开源数据集Fall detection Database上平均精确度均值(mAP)达到82.2%,与基准FCOS算法相比,所提算法的mAP提升了6.4个百分点,且相较于其他主流目标检测算法有精度上的提升以及更好的泛化能力。
-
关键词
目标检测
行人跌倒检测
金字塔视觉转换器
注意力机制
双重细化特征金字塔网络
距离交并比
-
Keywords
object detection
pedestrian fall detection
Pyramid Vision Transformer(PVT)
attention mechanism
Double Refinement Feature Pyramid Networks(DRFPN)
Distance Intersection over Union(DIoU)
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名多分辨率融合输入的U型视网膜血管分割算法
被引量:7
- 2
-
-
作者
梁礼明
詹涛
雷坤
冯骏
谭卢敏
-
机构
江西理工大学电气工程与自动化学院
-
出处
《电子与信息学报》
EI
CSCD
北大核心
2023年第5期1795-1806,共12页
-
基金
国家自然科学基金(51365017,61463018)
江西省自然科学基金面上项目(20192BAB205084)
江西省教育厅科学技术研究重点项目(GJJ170491)。
-
文摘
针对视网膜血管拓扑结构不规则、形态复杂和尺度变化多样的特点,该文提出一种多分辨率融合输入的U型网络(MFIU-Net),旨在实现视网膜血管精准分割。设计以多分辨率融合输入为主干的粗略分割网络,生成高分辨率特征。采用改进的ResNeSt代替传统卷积,优化血管分割边界特征;将并行空间激活模块嵌入其中,捕获更多的语义和空间信息。构架另一U型精细分割网络,提高模型的微观表示和识别能力。一是底层采用多尺度密集特征金字塔模块提取血管的多尺度特征信息。二是利用特征自适应模块增强粗、细网络之间的特征融合,抑制不相关的背景噪声。三是设计面向细节的双重损失函数融合,以引导网络专注于学习特征。在眼底数据用于血管提取的数字视网膜图像(DRIVE)、视网膜结构分析(STARE)和儿童心脏与健康研究(CHASE_DB1)上进行实验,其准确率分别为97.00%,97.47%和97.48%,灵敏度分别为82.73%,82.86%和83.24%,曲线下的面积(AUC)值分别为98.74%,98.90%和98.93%。其模型整体性能优于现有算法。
-
关键词
视网膜血管分割
U型网络
并行空间激活模块
多尺度密集特征金字塔模块
双重损失函数融合
-
Keywords
Retinal vessel segmentation
U-shaped network
Parallel space activation module
Multiscale dense feature pyramid module
Double loss function fusion
-
分类号
R318
[医药卫生—生物医学工程]
TP391
[自动化与计算机技术—计算机应用技术]
-