期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于自适应梯度调制的音视频多模态平衡学习方法
1
作者 王忠美 敖文秀 +4 位作者 刘建华 贾林 张昌凡 彭深奥 刘金平 《智能系统学报》 北大核心 2025年第5期1217-1226,共10页
针对音视频多模态学习中因异质学习速率导致单一模态主导模型学习过程,抑制其他模态学习,进而削弱多模态协同决策效果的问题,提出一种基于自适应梯度调制的多模态平衡学习方法(adaptive gradient modulation based compensation and reg... 针对音视频多模态学习中因异质学习速率导致单一模态主导模型学习过程,抑制其他模态学习,进而削弱多模态协同决策效果的问题,提出一种基于自适应梯度调制的多模态平衡学习方法(adaptive gradient modulation based compensation and regularization,AGM-CR)。首先,根据模态间的学习梯度差异引入调制系数来自适应调整各模态的学习速率;然后,通过梯度均衡化策略,将单个模态的梯度损失作为正则项融入总损失来约束模态间梯度差异,进一步平衡各模态的学习过程;最后,实验结果表明在CREMA-D和RAVDESS数据集上,AGM-CR将分类准确率分别提高了2.5和3.3百分点,并在多次迭代中减小模型的梯度波动,表现出更高的训练稳定性和收敛速度。与现有的平衡方法相比,AGM-CR可即插即用,更具灵活性和通用性。 展开更多
关键词 平衡学习 模态学习 梯度调制 自适应学习 梯度均衡化 学习速率 音视频模态 协同决策
在线阅读 下载PDF
基于残差网络和粗细粒度的音视频情感识别 被引量:3
2
作者 于明 刘子微 +1 位作者 师硕 吕华 《计算机工程与设计》 北大核心 2023年第7期2192-2199,共8页
针对情感特征表征性不足以及离散型和连续型情感描述间关联缺失的问题,提出一种基于残差网络和粗细粒度的音视频情感识别方法。基于残差网络构建双子网络提取特征,视频子网设计恒定残差网络和细节关注分支,弥补深层特征的细节信息;音频... 针对情感特征表征性不足以及离散型和连续型情感描述间关联缺失的问题,提出一种基于残差网络和粗细粒度的音视频情感识别方法。基于残差网络构建双子网络提取特征,视频子网设计恒定残差网络和细节关注分支,弥补深层特征的细节信息;音频子网利用分段注意力机制提升特征判别力。使用比例决策融合策略得到最终情感分类结果。设计粗细粒度损失函数,优化整个网络的性能。实验结果表明,所提方法有效提升了识别精度,验证了不同情感描述间的关联对情感识别的辅助作用。 展开更多
关键词 音视频模态 情感识别 残差网络 比例决策融合 细节信息 分段注意力机制 粗细粒度损失
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部