期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于图神经网络的多通道语音增强
1
作者
宁振杰
闫坤
+1 位作者
陈海贞
韦焯淇
《计算机工程与设计》
北大核心
2025年第10期2945-2951,共7页
多通道语音增强旨在利用多个麦克风在噪声环境中提取干净语音。然而,缺乏精确的麦克风阵列位置信息和空间信息使得这一过程十分困难。因此,提出了一种能够根据多通道语音信号自动学习邻接矩阵的多通道语音增强网络,称为自动返回邻接矩...
多通道语音增强旨在利用多个麦克风在噪声环境中提取干净语音。然而,缺乏精确的麦克风阵列位置信息和空间信息使得这一过程十分困难。因此,提出了一种能够根据多通道语音信号自动学习邻接矩阵的多通道语音增强网络,称为自动返回邻接矩阵的图卷积网络(automatic adjacency matrix-returning graph convolutional network,AAMR-GCN),通过图自编码器(graph auto-encoder, GAE)从麦克风阵列捕获的语音信号中学习邻接矩阵,利用图卷积网络(graph convolutional network,GCN)和多层感知器(multilayer perceptron,MLP)实现语音增强。在多通道的语音增强任务中,AAMR-GCN在客观语音质量评估(perceptual evaluation of speech quality, PESQ)和短时客观可懂度(short-time objective intelligibility,STOI)两个指标上均优于几种先进方法。
展开更多
关键词
多通道语音增强
自动邻接矩阵返回的图卷积网络
图自编码器
多层感知器
麦克风阵列
客观语音质量评估
短时客观可懂度
在线阅读
下载PDF
职称材料
基于图稀疏性的语音盲信噪比估计
2
作者
陈海贞
闫坤
+1 位作者
宁振杰
王对强
《计算机工程与设计》
北大核心
2025年第8期2170-2177,共8页
为了在噪声环境中实现准确的信噪比估计,提出了一种高效准确的盲信噪比估计方法,该方法将图信号分析方法用于语音盲信噪比估计。研究发现,若样本量有限,与噪声相比语音信号转换所得的图具有更低稀疏性。基于这一发现,利用语音活动检测...
为了在噪声环境中实现准确的信噪比估计,提出了一种高效准确的盲信噪比估计方法,该方法将图信号分析方法用于语音盲信噪比估计。研究发现,若样本量有限,与噪声相比语音信号转换所得的图具有更低稀疏性。基于这一发现,利用语音活动检测器获取语音活动区域,将区域内信号转换为图并计算其稀疏度,利用稀疏度与信噪比关系估计语音信号的信噪比。实验结果表明,与现有的方法相比,该算法能更准确地估计信噪比,尤其在信噪比为-14 dB到-4 dB环境下表现出优越性。
展开更多
关键词
盲信噪比估计
非平稳性
图信号分析方法
梅尔能量
语音活动检测器
图构造
图稀疏性
在线阅读
下载PDF
职称材料
面向Non-IID数据的联邦学习工业仪表定位与分类算法
3
作者
王瑞龙
闫坤
+1 位作者
宁振杰
肖霄
《仪表技术与传感器》
北大核心
2025年第11期19-24,共6页
针对现有联邦学习算法在各客户端仅有单个类别的Non-IID仪表数据集上训练出的定位与分类模型性能不佳的问题,提出了一种改进的FedProx算法。在客户端本地训练时,使用预训练模型参数与客户端本地训练过程中的模型参数差值的L2范数作为正...
针对现有联邦学习算法在各客户端仅有单个类别的Non-IID仪表数据集上训练出的定位与分类模型性能不佳的问题,提出了一种改进的FedProx算法。在客户端本地训练时,使用预训练模型参数与客户端本地训练过程中的模型参数差值的L2范数作为正则化损失项添加到原始的损失函数中;在服务器端,使用训练出的模型在测试集上的精度作为各客户端参全局模型聚合的权重。实验结果表明:改进的FedProx算法训练出的模型的mAP0.5指标达到0.9720,仅比集中式训练出的模型的0.9994低了0.0274;该算法在各客户端仅有单个类别的Non-IID数据集上训练出的模型的mAP0.5指标为0.9392,比FedAvg和FedProx算法分别高出了0.0785和0.1289。实验结果充分证明了改进的FedProx算法的准确性和有效性。
展开更多
关键词
联邦学习
工业仪表
定位与分类
Non-IID数据
FedAvg
FedProx
在线阅读
下载PDF
职称材料
题名
基于图神经网络的多通道语音增强
1
作者
宁振杰
闫坤
陈海贞
韦焯淇
机构
桂林电子科技大学信息与通信学院
桂林电子科技大学卫星导航定位与位置服务国家地方联合工程研究中心
出处
《计算机工程与设计》
北大核心
2025年第10期2945-2951,共7页
基金
国家自然科学基金项目(62101147)
广西自然科学基金项目(桂科2020GXNSFAA159146)
+1 种基金
广西创新驱动发展专项基金项目(桂科AA21077008)
教育部重点实验室基金项目(CRKL190108)。
文摘
多通道语音增强旨在利用多个麦克风在噪声环境中提取干净语音。然而,缺乏精确的麦克风阵列位置信息和空间信息使得这一过程十分困难。因此,提出了一种能够根据多通道语音信号自动学习邻接矩阵的多通道语音增强网络,称为自动返回邻接矩阵的图卷积网络(automatic adjacency matrix-returning graph convolutional network,AAMR-GCN),通过图自编码器(graph auto-encoder, GAE)从麦克风阵列捕获的语音信号中学习邻接矩阵,利用图卷积网络(graph convolutional network,GCN)和多层感知器(multilayer perceptron,MLP)实现语音增强。在多通道的语音增强任务中,AAMR-GCN在客观语音质量评估(perceptual evaluation of speech quality, PESQ)和短时客观可懂度(short-time objective intelligibility,STOI)两个指标上均优于几种先进方法。
关键词
多通道语音增强
自动邻接矩阵返回的图卷积网络
图自编码器
多层感知器
麦克风阵列
客观语音质量评估
短时客观可懂度
Keywords
multi-channel speech enhancement
graph convolutional network with auto-returned adjacency matrix
graph auto-encoder
multilayer perceptron
microphone array
objective speech quality assessment
short-time objective intelligibility
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于图稀疏性的语音盲信噪比估计
2
作者
陈海贞
闫坤
宁振杰
王对强
机构
桂林电子科技大学信息与通信学院
桂林电子科技大学卫星导航定位与位置服务国家地方联合工程研究中心
贺州学院人工智能学院
出处
《计算机工程与设计》
北大核心
2025年第8期2170-2177,共8页
基金
国家自然科学基金项目(62101147)
广西自然科学基金项目(桂科2020GXNSFAA159146)
+1 种基金
广西创新驱动发展专项基金项目(桂科AA21077008)
教育部重点实验室基金项目(CRKL190108)。
文摘
为了在噪声环境中实现准确的信噪比估计,提出了一种高效准确的盲信噪比估计方法,该方法将图信号分析方法用于语音盲信噪比估计。研究发现,若样本量有限,与噪声相比语音信号转换所得的图具有更低稀疏性。基于这一发现,利用语音活动检测器获取语音活动区域,将区域内信号转换为图并计算其稀疏度,利用稀疏度与信噪比关系估计语音信号的信噪比。实验结果表明,与现有的方法相比,该算法能更准确地估计信噪比,尤其在信噪比为-14 dB到-4 dB环境下表现出优越性。
关键词
盲信噪比估计
非平稳性
图信号分析方法
梅尔能量
语音活动检测器
图构造
图稀疏性
Keywords
blind signal-to-noise ratio estimation
non-stationarity
graphical signal analysis method
mel energy
voice activity detector
graph construction
graph sparsity
分类号
TN912.3 [电子电信—通信与信息系统]
在线阅读
下载PDF
职称材料
题名
面向Non-IID数据的联邦学习工业仪表定位与分类算法
3
作者
王瑞龙
闫坤
宁振杰
肖霄
机构
桂林电子科技大学信息与通信学院
桂林电子科技大学卫星导航定位与位置服务国家地方联合工程研究中心
出处
《仪表技术与传感器》
北大核心
2025年第11期19-24,共6页
基金
国家自然科学基金项目(62101147)
广西自然科学基金项目(桂科2020GXNSFAA159146)
+1 种基金
广西创新驱动发展专项(桂科AA21077008)
“认知无线电与信息处理”教育部重点实验室基金项目(CRKL190108)。
文摘
针对现有联邦学习算法在各客户端仅有单个类别的Non-IID仪表数据集上训练出的定位与分类模型性能不佳的问题,提出了一种改进的FedProx算法。在客户端本地训练时,使用预训练模型参数与客户端本地训练过程中的模型参数差值的L2范数作为正则化损失项添加到原始的损失函数中;在服务器端,使用训练出的模型在测试集上的精度作为各客户端参全局模型聚合的权重。实验结果表明:改进的FedProx算法训练出的模型的mAP0.5指标达到0.9720,仅比集中式训练出的模型的0.9994低了0.0274;该算法在各客户端仅有单个类别的Non-IID数据集上训练出的模型的mAP0.5指标为0.9392,比FedAvg和FedProx算法分别高出了0.0785和0.1289。实验结果充分证明了改进的FedProx算法的准确性和有效性。
关键词
联邦学习
工业仪表
定位与分类
Non-IID数据
FedAvg
FedProx
Keywords
federated learning
industrial instrumentation
positioning and classification
Non-IID data
FedAvg
FedProx
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于图神经网络的多通道语音增强
宁振杰
闫坤
陈海贞
韦焯淇
《计算机工程与设计》
北大核心
2025
0
在线阅读
下载PDF
职称材料
2
基于图稀疏性的语音盲信噪比估计
陈海贞
闫坤
宁振杰
王对强
《计算机工程与设计》
北大核心
2025
0
在线阅读
下载PDF
职称材料
3
面向Non-IID数据的联邦学习工业仪表定位与分类算法
王瑞龙
闫坤
宁振杰
肖霄
《仪表技术与传感器》
北大核心
2025
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部