期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于图神经网络的多通道语音增强
1
作者 宁振杰 闫坤 +1 位作者 陈海贞 韦焯淇 《计算机工程与设计》 北大核心 2025年第10期2945-2951,共7页
多通道语音增强旨在利用多个麦克风在噪声环境中提取干净语音。然而,缺乏精确的麦克风阵列位置信息和空间信息使得这一过程十分困难。因此,提出了一种能够根据多通道语音信号自动学习邻接矩阵的多通道语音增强网络,称为自动返回邻接矩... 多通道语音增强旨在利用多个麦克风在噪声环境中提取干净语音。然而,缺乏精确的麦克风阵列位置信息和空间信息使得这一过程十分困难。因此,提出了一种能够根据多通道语音信号自动学习邻接矩阵的多通道语音增强网络,称为自动返回邻接矩阵的图卷积网络(automatic adjacency matrix-returning graph convolutional network,AAMR-GCN),通过图自编码器(graph auto-encoder, GAE)从麦克风阵列捕获的语音信号中学习邻接矩阵,利用图卷积网络(graph convolutional network,GCN)和多层感知器(multilayer perceptron,MLP)实现语音增强。在多通道的语音增强任务中,AAMR-GCN在客观语音质量评估(perceptual evaluation of speech quality, PESQ)和短时客观可懂度(short-time objective intelligibility,STOI)两个指标上均优于几种先进方法。 展开更多
关键词 多通道语音增强 自动邻接矩阵返回的图卷积网络 图自编码器 多层感知器 麦克风阵列 客观语音质量评估 短时客观可懂度
在线阅读 下载PDF
基于图稀疏性的语音盲信噪比估计
2
作者 陈海贞 闫坤 +1 位作者 宁振杰 王对强 《计算机工程与设计》 北大核心 2025年第8期2170-2177,共8页
为了在噪声环境中实现准确的信噪比估计,提出了一种高效准确的盲信噪比估计方法,该方法将图信号分析方法用于语音盲信噪比估计。研究发现,若样本量有限,与噪声相比语音信号转换所得的图具有更低稀疏性。基于这一发现,利用语音活动检测... 为了在噪声环境中实现准确的信噪比估计,提出了一种高效准确的盲信噪比估计方法,该方法将图信号分析方法用于语音盲信噪比估计。研究发现,若样本量有限,与噪声相比语音信号转换所得的图具有更低稀疏性。基于这一发现,利用语音活动检测器获取语音活动区域,将区域内信号转换为图并计算其稀疏度,利用稀疏度与信噪比关系估计语音信号的信噪比。实验结果表明,与现有的方法相比,该算法能更准确地估计信噪比,尤其在信噪比为-14 dB到-4 dB环境下表现出优越性。 展开更多
关键词 盲信噪比估计 非平稳性 图信号分析方法 梅尔能量 语音活动检测器 图构造 图稀疏性
在线阅读 下载PDF
面向Non-IID数据的联邦学习工业仪表定位与分类算法
3
作者 王瑞龙 闫坤 +1 位作者 宁振杰 肖霄 《仪表技术与传感器》 北大核心 2025年第11期19-24,共6页
针对现有联邦学习算法在各客户端仅有单个类别的Non-IID仪表数据集上训练出的定位与分类模型性能不佳的问题,提出了一种改进的FedProx算法。在客户端本地训练时,使用预训练模型参数与客户端本地训练过程中的模型参数差值的L2范数作为正... 针对现有联邦学习算法在各客户端仅有单个类别的Non-IID仪表数据集上训练出的定位与分类模型性能不佳的问题,提出了一种改进的FedProx算法。在客户端本地训练时,使用预训练模型参数与客户端本地训练过程中的模型参数差值的L2范数作为正则化损失项添加到原始的损失函数中;在服务器端,使用训练出的模型在测试集上的精度作为各客户端参全局模型聚合的权重。实验结果表明:改进的FedProx算法训练出的模型的mAP0.5指标达到0.9720,仅比集中式训练出的模型的0.9994低了0.0274;该算法在各客户端仅有单个类别的Non-IID数据集上训练出的模型的mAP0.5指标为0.9392,比FedAvg和FedProx算法分别高出了0.0785和0.1289。实验结果充分证明了改进的FedProx算法的准确性和有效性。 展开更多
关键词 联邦学习 工业仪表 定位与分类 Non-IID数据 FedAvg FedProx
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部