期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于VMD的双通道构音障碍语音特征图谱提取算法
1
作者
薛珮芸
白静
+1 位作者
张楠
赵建星
《东北大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2024年第6期793-801,共9页
针对在提取构音障碍患者语音有效特征信息不足,导致语音识别率低的问题,提出一种基于变分模态分解(VMD)的多尺度双通道滤波器组(MBCFbank)特征图谱提取算法.首先,为了更好地提取符合人耳听觉结构特性的声学特征,提出一种双通道滤波器组(...
针对在提取构音障碍患者语音有效特征信息不足,导致语音识别率低的问题,提出一种基于变分模态分解(VMD)的多尺度双通道滤波器组(MBCFbank)特征图谱提取算法.首先,为了更好地提取符合人耳听觉结构特性的声学特征,提出一种双通道滤波器组(BCFbank)特征提取算法,该算法采用Mel滤波后做对数变换,同时采用Gammatone滤波后作非线性响度变换;其次,采用VMD来优化BCFbank特征,对分解后的多个语音信号分量筛选出相关系数较高的3个,分别提取其BCFbank特征及其差分特征,同时对未分解的语音信号提取BCFbank特征,从而构成MBCFbank特征图谱;最后,在双路语音识别模型上进行训练和识别.实验结果表明,基于BCFbank特征、MBCFbank特征图谱的语音识别模型准确率最高分别达到了87.82%,94.34%,优于Fbank特征的识别效果.
展开更多
关键词
构音障碍语音识别
变分模态分解
卷积神经网络
MBCFbank特征
在线阅读
下载PDF
职称材料
题名
基于VMD的双通道构音障碍语音特征图谱提取算法
1
作者
薛珮芸
白静
张楠
赵建星
机构
太原理工大学电子信息工程学院
山西高等创新研究院博士后科研工作站
中北大学信息与通信工程学院
出处
《东北大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2024年第6期793-801,共9页
基金
山西省应用基础研究计划项目(201901D111094)
山西省基础研究项目(青年)(20210302124544).
文摘
针对在提取构音障碍患者语音有效特征信息不足,导致语音识别率低的问题,提出一种基于变分模态分解(VMD)的多尺度双通道滤波器组(MBCFbank)特征图谱提取算法.首先,为了更好地提取符合人耳听觉结构特性的声学特征,提出一种双通道滤波器组(BCFbank)特征提取算法,该算法采用Mel滤波后做对数变换,同时采用Gammatone滤波后作非线性响度变换;其次,采用VMD来优化BCFbank特征,对分解后的多个语音信号分量筛选出相关系数较高的3个,分别提取其BCFbank特征及其差分特征,同时对未分解的语音信号提取BCFbank特征,从而构成MBCFbank特征图谱;最后,在双路语音识别模型上进行训练和识别.实验结果表明,基于BCFbank特征、MBCFbank特征图谱的语音识别模型准确率最高分别达到了87.82%,94.34%,优于Fbank特征的识别效果.
关键词
构音障碍语音识别
变分模态分解
卷积神经网络
MBCFbank特征
Keywords
speech recognition with dysarthria
variational mode decomposition
convolutional neural network
MBCFbank features
分类号
TP912.34 [自动化与计算机技术]
R741 [医药卫生—神经病学与精神病学]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于VMD的双通道构音障碍语音特征图谱提取算法
薛珮芸
白静
张楠
赵建星
《东北大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2024
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部