期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
强混响环境下基于K⁃medoids特征聚类的话者计数
被引量:
1
1
作者
吴礼福
姬广慎
胡秋岑
《南京大学学报(自然科学版)》
CAS
CSCD
北大核心
2021年第5期875-880,共6页
强混响环境下的话者数量是语音处理应用中的关键信息.以不同话者语音之间的频域幅度平方相干(Magnitude Squared Coherence,MSC)为特征进行话者计数,首先提取语音中的短时频域MSC特征,再采用K⁃medoids算法对其进行聚类得到话者个数.该...
强混响环境下的话者数量是语音处理应用中的关键信息.以不同话者语音之间的频域幅度平方相干(Magnitude Squared Coherence,MSC)为特征进行话者计数,首先提取语音中的短时频域MSC特征,再采用K⁃medoids算法对其进行聚类得到话者个数.该方法无需麦克风间距和话者到麦克风之间相对距离的先验信息.不同混响条件、不同信噪比和不同麦克风间距的实验结果表明,频域MSC特征与话者是相干的,与基于广义互相关相位变换(Generalized Cross⁃Correlation Phase Transform,GCC⁃PHAT)的到达时间差方法(Time Difference of Arrival,TDOA)相比,本方法的话者计数准确率更高,对麦克风间距的敏感度更低,鲁棒性更优.
展开更多
关键词
话者计数
幅度平方相干
K⁃medoids
广义互相关相位变换
到达时间差
在线阅读
下载PDF
职称材料
题名
强混响环境下基于K⁃medoids特征聚类的话者计数
被引量:
1
1
作者
吴礼福
姬广慎
胡秋岑
机构
南京信息工程大学电子与信息工程学院
江苏省大气环境与装备技术协同创新中心
出处
《南京大学学报(自然科学版)》
CAS
CSCD
北大核心
2021年第5期875-880,共6页
基金
国家自然科学基金(12074192)。
文摘
强混响环境下的话者数量是语音处理应用中的关键信息.以不同话者语音之间的频域幅度平方相干(Magnitude Squared Coherence,MSC)为特征进行话者计数,首先提取语音中的短时频域MSC特征,再采用K⁃medoids算法对其进行聚类得到话者个数.该方法无需麦克风间距和话者到麦克风之间相对距离的先验信息.不同混响条件、不同信噪比和不同麦克风间距的实验结果表明,频域MSC特征与话者是相干的,与基于广义互相关相位变换(Generalized Cross⁃Correlation Phase Transform,GCC⁃PHAT)的到达时间差方法(Time Difference of Arrival,TDOA)相比,本方法的话者计数准确率更高,对麦克风间距的敏感度更低,鲁棒性更优.
关键词
话者计数
幅度平方相干
K⁃medoids
广义互相关相位变换
到达时间差
Keywords
speaker counting
Magnitude Squared Coherence(MSC)
K⁃medoids clustering
Generalized Cross⁃Correlation Phase Transform(GCC⁃PHAT)
Time Difference of Arriva(TDOA)
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
强混响环境下基于K⁃medoids特征聚类的话者计数
吴礼福
姬广慎
胡秋岑
《南京大学学报(自然科学版)》
CAS
CSCD
北大核心
2021
1
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部