-
题名融合发音动作特征和声学特征的病理语音检测
被引量:4
- 1
-
-
作者
王颇
白静
薛珮芸
-
机构
太原理工大学信息与计算机学院
-
出处
《计算机工程与设计》
北大核心
2021年第3期776-781,共6页
-
基金
山西省自然科学基金项目(201901D111094)
山西省基础研究计划基金项目(2013021016-1)。
-
文摘
为提高听障患者病理语音的检测效果,提出一种融合发音动作特征和声学特征的检测方法。分析病理语音和正常语音发音动作特征的差异,提取位移、速度两种发音动作特征,提取梅尔倒谱系数、基频、共振峰3种声学特征,对两类特征归一化处理,使用核主成分分析法进行降维,在支持向量机、随机森林、多层感知机中测试特征的检测性能。实验结果表明,发音动作特征和声学特征同样有效,两类特征构成的融合特征检测效果优于单一特征,验证该方法提高了病理语音的检测效果。
-
关键词
病理语音检测
发音动作特征
声学特征
核主成分分析
多层感知机
-
Keywords
pathological speech detection
articulatory movement features
acoustic features
kernel principal component analysis
multilayer perceptron
-
分类号
TN912.34
[电子电信—通信与信息系统]
-
-
题名双模态融合特征下的说话人识别
被引量:2
- 2
-
-
作者
谢娅利
庞炜千
白静
薛珮芸
赵建星
师晨康
-
机构
太原理工大学信息与计算机学院
-
出处
《计算机工程与设计》
北大核心
2023年第8期2454-2458,共5页
-
基金
山西省应用基础研究计划基金项目(201901D111094)
山西省留学回国人员科技活动择优基金项目(20200017)
山西省应用基础研究计划基金项目(青年基金20210302124544)。
-
文摘
为提高说话人识别的准确率,提出一种双模态融合特征的算法。提取韵律特征和伽玛通滤波倒谱系数两种声学特征,计算其统计特性;提取舌、唇和下颌分别相对于鼻梁的发音动作参数,获得参考点发音动作特征;将声学特征和参考点发音动作特征进行融合,对其进行嵌入式特征选择,获得双模态融合特征;通过支持向量机、高斯混合模型-支持向量机进行分类。实验结果表明,参考点发音动作特征识别效果优于传统发音动作特征识别效果,双模态融合特征识别率明显高于单模态特征的识别率,验证了所提方法的有效性。
-
关键词
韵律特征
伽玛通滤波倒谱系数
发音动作特征
特征融合
特征选择
高斯混合模型-支持向量机
说话人识别
-
Keywords
prosodic features
Gammatone filter cepstral coefficient
articulatory movement features
feature fusion
feature selection
Gaussian mixture model-support vector machine
speaker recognition
-
分类号
TN912.34
[电子电信—通信与信息系统]
-