-
题名基于多路激励和金字塔切分注意力的鸟类行为识别
- 1
-
-
作者
邓抒憧
陈爱斌
戴子健
-
机构
中南林业科技大学人工智能应用研究所
-
出处
《应用科学学报》
北大核心
2025年第1期154-168,共15页
-
基金
国家自然科学基金(No.62276276)
湖南省自然科学基金(No.2024JJ5647)资助。
-
文摘
针对传统行为识别方法在处理复杂鸟类行为模式时存在辨识率低、误判率高等问题,提出了一种基于多路激励模块和金字塔切分注意力的改进3D残差网络的深度学习模型。利用帧间差分法有效减轻计算负担,在精确保留关键时空信息的同时提高了识别精度。引入多路激励模块改进原有残差块,使模型能够精准捕捉细微运动行为特征,解决了鸟类复杂动态行为识别易混淆的问题。以3D金字塔切分注意力替换原有3D卷积层,实现对不同尺度鸟类行为特征的有效捕获。在自建鸟类行为视频数据集上进行实验,对常见鸟类行为的识别准确率达到90.48%,显著优于基准模型与其他现有流行行为识别网络,证明了所提模型对复杂鸟类行为识别的有效性。
-
关键词
鸟类行为识别
多路激励
金字塔切分注意力
帧间差分法
自建数据集
-
Keywords
bird action recognition
multiple excitation
pyramid split attention
inter-frame difference method
self-built dataset
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名基于多任务学习的舌像分割与分类
- 2
-
-
作者
曾素明
吴丽君
-
机构
福州大学物理与信息工程学院
-
出处
《微电子学与计算机》
2023年第10期20-28,共9页
-
基金
国家自然科学基金项目(62271151)
福建省自然科学基金项目(2022H0008,2021J01)。
-
文摘
针对舌体分割和单标签分类任务独立实现存在着难以提供舌诊所需的病理特征信息问题,通过共享层提取特征策略,提出联合舌体分割及多标签分类的多任务网络框架.首先,共享层采用轻量化编码模块,并结合金字塔切分注意力解码块以融合舌像深浅层特征,提升共享层特征提取能力.其次,舌像不同标签之间没有明显的关联性,难以对不同标签的相关性进行建模,因此设计了双流分支网络以实现多标签分类:其中一个分支基于自适应分割掩膜设计了背景屏蔽模块以提升舌裂纹识别性能,另一分支在编码块基础上使用空间金字塔池化实现舌苔分类.最后,在早期训练过程中分割损失远小于分类损失,相等损失权重策略将导致分割任务无法学习到最优参数,为此,通过优化的不确定性加权策略同时提升多个任务的性能.实验表明,多任务学习框架在提取共享特征降低网络参数的同时,能有效联合优化各个任务,提升性能.与Y-Net、MT-UNet等多任务学习网络相比,在舌体分割和多标签分类性能上均有提升.
-
关键词
多任务学习
金字塔切分注意力
双流分支网络
-
Keywords
muti-task learning
pyramid spilt attention
two-stream branch network
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-