期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于互相关序列和BP网络的声源定位算法
被引量:
5
1
作者
曾庆宁
苏盼
+1 位作者
王红丽
龙超
《科学技术与工程》
北大核心
2023年第16期6945-6951,共7页
在基于麦克风阵列的声源定位算法中,一种常用算法的基本思路是通过麦克风接收到信号的相关序列来计算信号之间的时延,进而再根据阵列的结构确定声源的位置。在分析传统的声源定位算法基础上,针对双五元十字阵模型,介绍传统的基于广义互...
在基于麦克风阵列的声源定位算法中,一种常用算法的基本思路是通过麦克风接收到信号的相关序列来计算信号之间的时延,进而再根据阵列的结构确定声源的位置。在分析传统的声源定位算法基础上,针对双五元十字阵模型,介绍传统的基于广义互相关相位变换加权(generalized cross correlation-phase transform,GCC-PHAT)时延估计的定位算法,并给出基于GCC-PHAT时延估计和反向传播(back propagation,BP)神经网络的定位算法、基于抛物线互相关时延估计和BP网络的定位算法,进而通过分析影响时延估计的主要因素,提出了基于互相关序列和BP网络的新定位算法,该算法将GCC-PHAT互相关序列最大值点的位置、最大值点及其左右各一点的相关值作为BP网络的输入,通过对BP网络进行训练来实现声源的三维定位。仿真实验表明:与传统的基于GCC-PHAT时延估计的定位算法相比,所提出的各个算法均具有较好的定位效果,后者均比前者的定位精度更高,而且提出的基于互相关序列和BP网络的新定位算法在低信噪比和高混响的条件下,也具有较好的定位效果。
展开更多
关键词
声源定位
时延估计
反向传播(BP)网络
相关
序列
广义互相关相位变换
加权
麦克风阵列
在线阅读
下载PDF
职称材料
基于LeNet-RES的室内声源区域定位算法
2
作者
延浩浩
杨瑞峰
郭晨霞
《现代电子技术》
北大核心
2025年第10期20-24,共5页
在低信噪比和高混响的条件下,室内声源区域定位的难度增大。为解决这一问题,设计一种神经网络,即LeNet-RES,利用残差块改进LeNet,从而提高网络的性能。通过仿真8阵元正方体麦克风阵列的房间脉冲响应,得到室内声源的数据集。将麦克风接...
在低信噪比和高混响的条件下,室内声源区域定位的难度增大。为解决这一问题,设计一种神经网络,即LeNet-RES,利用残差块改进LeNet,从而提高网络的性能。通过仿真8阵元正方体麦克风阵列的房间脉冲响应,得到室内声源的数据集。将麦克风接收到的信号进行分帧处理,并计算每帧信号之间的相位变换加权广义互相关函数,将其排列成二维数据作为输入特征;再将房间划分区域标签作为网络输出,训练得到最终网络模型。实验中分别测试房间分区数为8和16时,两种神经网络的定位准确率。结果表明:在相同信噪比条件下,房间分区数为16,混响时间为0.6 s时,LeNet-RES-16的准确率为81.33%,比LeNet-16高23%;在相同混响条件下,房间分区数为16,信噪比为0时,LeNet-RES-16的准确率为84.16%,比LeNet-16高29%。LeNet-RES在多种信噪比和多种混响时间的条件下,区域定位性能均优于LeNet。
展开更多
关键词
室内声源定位
麦克风阵列
神经网络
相位
变换
加权
广义
互
相关
函数
信号处理
房间脉冲响应
在线阅读
下载PDF
职称材料
强混响环境下基于K⁃medoids特征聚类的话者计数
被引量:
1
3
作者
吴礼福
姬广慎
胡秋岑
《南京大学学报(自然科学版)》
CAS
CSCD
北大核心
2021年第5期875-880,共6页
强混响环境下的话者数量是语音处理应用中的关键信息.以不同话者语音之间的频域幅度平方相干(Magnitude Squared Coherence,MSC)为特征进行话者计数,首先提取语音中的短时频域MSC特征,再采用K⁃medoids算法对其进行聚类得到话者个数.该...
强混响环境下的话者数量是语音处理应用中的关键信息.以不同话者语音之间的频域幅度平方相干(Magnitude Squared Coherence,MSC)为特征进行话者计数,首先提取语音中的短时频域MSC特征,再采用K⁃medoids算法对其进行聚类得到话者个数.该方法无需麦克风间距和话者到麦克风之间相对距离的先验信息.不同混响条件、不同信噪比和不同麦克风间距的实验结果表明,频域MSC特征与话者是相干的,与基于广义互相关相位变换(Generalized Cross⁃Correlation Phase Transform,GCC⁃PHAT)的到达时间差方法(Time Difference of Arrival,TDOA)相比,本方法的话者计数准确率更高,对麦克风间距的敏感度更低,鲁棒性更优.
展开更多
关键词
话者计数
幅度平方相干
K⁃medoids
广义互相关相位变换
到达时间差
在线阅读
下载PDF
职称材料
题名
基于互相关序列和BP网络的声源定位算法
被引量:
5
1
作者
曾庆宁
苏盼
王红丽
龙超
机构
桂林电子科技大学信息与通信学院
出处
《科学技术与工程》
北大核心
2023年第16期6945-6951,共7页
基金
国家自然科学基金(61961009)
广西省无线宽带通信与信号处理重点实验室基金(GXKL06200107)
桂林电子科技大学研究生教育创新计划资助项目(2022YCXS042,2021YCXS028)
文摘
在基于麦克风阵列的声源定位算法中,一种常用算法的基本思路是通过麦克风接收到信号的相关序列来计算信号之间的时延,进而再根据阵列的结构确定声源的位置。在分析传统的声源定位算法基础上,针对双五元十字阵模型,介绍传统的基于广义互相关相位变换加权(generalized cross correlation-phase transform,GCC-PHAT)时延估计的定位算法,并给出基于GCC-PHAT时延估计和反向传播(back propagation,BP)神经网络的定位算法、基于抛物线互相关时延估计和BP网络的定位算法,进而通过分析影响时延估计的主要因素,提出了基于互相关序列和BP网络的新定位算法,该算法将GCC-PHAT互相关序列最大值点的位置、最大值点及其左右各一点的相关值作为BP网络的输入,通过对BP网络进行训练来实现声源的三维定位。仿真实验表明:与传统的基于GCC-PHAT时延估计的定位算法相比,所提出的各个算法均具有较好的定位效果,后者均比前者的定位精度更高,而且提出的基于互相关序列和BP网络的新定位算法在低信噪比和高混响的条件下,也具有较好的定位效果。
关键词
声源定位
时延估计
反向传播(BP)网络
相关
序列
广义互相关相位变换
加权
麦克风阵列
Keywords
sound source localization
time difference of arrival
back propagation(BP)neural
correlation sequence
generalized cross correlation-phase transform
microphone array
分类号
TN912.3 [电子电信—通信与信息系统]
在线阅读
下载PDF
职称材料
题名
基于LeNet-RES的室内声源区域定位算法
2
作者
延浩浩
杨瑞峰
郭晨霞
机构
中北大学仪器与电子学院
出处
《现代电子技术》
北大核心
2025年第10期20-24,共5页
基金
山西省中央引导地方科技发展自由探索类基础研究项目(YDZJSX2022A027)。
文摘
在低信噪比和高混响的条件下,室内声源区域定位的难度增大。为解决这一问题,设计一种神经网络,即LeNet-RES,利用残差块改进LeNet,从而提高网络的性能。通过仿真8阵元正方体麦克风阵列的房间脉冲响应,得到室内声源的数据集。将麦克风接收到的信号进行分帧处理,并计算每帧信号之间的相位变换加权广义互相关函数,将其排列成二维数据作为输入特征;再将房间划分区域标签作为网络输出,训练得到最终网络模型。实验中分别测试房间分区数为8和16时,两种神经网络的定位准确率。结果表明:在相同信噪比条件下,房间分区数为16,混响时间为0.6 s时,LeNet-RES-16的准确率为81.33%,比LeNet-16高23%;在相同混响条件下,房间分区数为16,信噪比为0时,LeNet-RES-16的准确率为84.16%,比LeNet-16高29%。LeNet-RES在多种信噪比和多种混响时间的条件下,区域定位性能均优于LeNet。
关键词
室内声源定位
麦克风阵列
神经网络
相位
变换
加权
广义
互
相关
函数
信号处理
房间脉冲响应
Keywords
indoor sound source localization
microphone array
neural network
generalized cross correlation PHAse transformation
signal processing
room impulse response
分类号
TN912-34 [电子电信—通信与信息系统]
TP183 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
强混响环境下基于K⁃medoids特征聚类的话者计数
被引量:
1
3
作者
吴礼福
姬广慎
胡秋岑
机构
南京信息工程大学电子与信息工程学院
江苏省大气环境与装备技术协同创新中心
出处
《南京大学学报(自然科学版)》
CAS
CSCD
北大核心
2021年第5期875-880,共6页
基金
国家自然科学基金(12074192)。
文摘
强混响环境下的话者数量是语音处理应用中的关键信息.以不同话者语音之间的频域幅度平方相干(Magnitude Squared Coherence,MSC)为特征进行话者计数,首先提取语音中的短时频域MSC特征,再采用K⁃medoids算法对其进行聚类得到话者个数.该方法无需麦克风间距和话者到麦克风之间相对距离的先验信息.不同混响条件、不同信噪比和不同麦克风间距的实验结果表明,频域MSC特征与话者是相干的,与基于广义互相关相位变换(Generalized Cross⁃Correlation Phase Transform,GCC⁃PHAT)的到达时间差方法(Time Difference of Arrival,TDOA)相比,本方法的话者计数准确率更高,对麦克风间距的敏感度更低,鲁棒性更优.
关键词
话者计数
幅度平方相干
K⁃medoids
广义互相关相位变换
到达时间差
Keywords
speaker counting
Magnitude Squared Coherence(MSC)
K⁃medoids clustering
Generalized Cross⁃Correlation Phase Transform(GCC⁃PHAT)
Time Difference of Arriva(TDOA)
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于互相关序列和BP网络的声源定位算法
曾庆宁
苏盼
王红丽
龙超
《科学技术与工程》
北大核心
2023
5
在线阅读
下载PDF
职称材料
2
基于LeNet-RES的室内声源区域定位算法
延浩浩
杨瑞峰
郭晨霞
《现代电子技术》
北大核心
2025
0
在线阅读
下载PDF
职称材料
3
强混响环境下基于K⁃medoids特征聚类的话者计数
吴礼福
姬广慎
胡秋岑
《南京大学学报(自然科学版)》
CAS
CSCD
北大核心
2021
1
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部