为解决网络训练复杂度高的问题并改进语音情感特征提取,提出了基于双嵌套残差网络(DNResNet11)与通道注意残差网络(CRNet)的双支路特征提取模型。首先,设计了低复杂度的DN-ResNet11以高效提取语谱图的融合情感特征,提升情感识别率;然后...为解决网络训练复杂度高的问题并改进语音情感特征提取,提出了基于双嵌套残差网络(DNResNet11)与通道注意残差网络(CRNet)的双支路特征提取模型。首先,设计了低复杂度的DN-ResNet11以高效提取语谱图的融合情感特征,提升情感识别率;然后,结合多尺度引导滤波和局部二值模式(local binary pattern,LBP)算法对语谱图进行细节增强;最后,融合两组特征进行情感分类,形成双支路加权融合模型(weighted fusion model based on dual nested residual and channel residual network,WFDN_CRNet),进一步提升情感表征能力。在CASIA、EMO-DB、IEMOCAP等语音情感数据集上情感识别率分别达到94.58%、85.59%、65.72%,所提方法在情感识别率优于ResNet18等基准方法的同时,显著降低了计算成本,验证了模型的有效性。展开更多
针对低信噪比(signal-to-noise ratio,SNR)下跳周期估计和跳频频率估计误差较大的情况,提出了一种基于最大熵二值化时频图以及检测和定位(detection and localization,DL)-YOLOv5s的跳周期估计和跳频频率估计方法。首先,利用最大熵阈值...针对低信噪比(signal-to-noise ratio,SNR)下跳周期估计和跳频频率估计误差较大的情况,提出了一种基于最大熵二值化时频图以及检测和定位(detection and localization,DL)-YOLOv5s的跳周期估计和跳频频率估计方法。首先,利用最大熵阈值分割方法结合形态学滤波对时频图进行处理,获得清晰的最大熵二值化时频图,再通过提出的DL-YOLOv5s模型对最大熵二值化时频图中的跳频信号进行检测和定位,通过增加ASPP模块和BiFPN模块,提高跳频信号的边缘和角点检测精度,并通过BOT3模块引入多头自注意力机制,提高跳频信号的定位精度,最后得到跳频信号的坐标位置,通过坐标的对照关系完成跳周期估计和跳频频率估计。实验结果表明,相较于YOLOv5s模型,提出的DL-YOLOv5s模型精确率P提高了5%,召回率R提高了2.2%,平均精度mAP 0.5和mAP 0.5:0.9分别提高了5.1%和4.2%,相较于YOLOv7、YOLOv8等其他模型,提出的DL-YOLOv5s模型体积更小,更适用于跳频信号参数估计常用的嵌入式设备这类资源受限的环境,且相较于传统跳频信号参数估计方法,提出的方法可以有效降低低信噪比下跳周期估计和跳频频率估计的误差。展开更多
文摘为解决网络训练复杂度高的问题并改进语音情感特征提取,提出了基于双嵌套残差网络(DNResNet11)与通道注意残差网络(CRNet)的双支路特征提取模型。首先,设计了低复杂度的DN-ResNet11以高效提取语谱图的融合情感特征,提升情感识别率;然后,结合多尺度引导滤波和局部二值模式(local binary pattern,LBP)算法对语谱图进行细节增强;最后,融合两组特征进行情感分类,形成双支路加权融合模型(weighted fusion model based on dual nested residual and channel residual network,WFDN_CRNet),进一步提升情感表征能力。在CASIA、EMO-DB、IEMOCAP等语音情感数据集上情感识别率分别达到94.58%、85.59%、65.72%,所提方法在情感识别率优于ResNet18等基准方法的同时,显著降低了计算成本,验证了模型的有效性。