期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于Squeezeformer的多颗粒度多方面发音质量评测方法
1
作者 费涛 艾山·吾买尔 +1 位作者 杜文旭 朱翠翠 《计算机工程》 北大核心 2025年第1期81-87,共7页
口语发音质量评测相对于发音错误检测和诊断(MDD)任务,不仅需要原始的数据特征,还需要许多流畅度、准确度、完整度等特征辅助进行实现,所以对口语发音质量评测的研究远远少于对MDD的研究。目前对于口语发音质量评测的研究都是对语音评... 口语发音质量评测相对于发音错误检测和诊断(MDD)任务,不仅需要原始的数据特征,还需要许多流畅度、准确度、完整度等特征辅助进行实现,所以对口语发音质量评测的研究远远少于对MDD的研究。目前对于口语发音质量评测的研究都是对语音评分某一项指标单方面进行评分。设计将Transformer替换Squeezeformer的改进模型Squeezeformer-MR对基线模型进行改进,Squeezeformer-MR使用多个残差连接增强了前后特征信息的传递。实验中,在参数设置上保持与基线模型一致,使用最稳定的24层嵌入层时,音素级、词级和句子级方面的综合评分的皮尔逊相关系数(PCC)相比基线模型分别提升了1.96%、6.37%和1.08%。在初次改进的基础上,使用WavLM和HuBERT预训练模型对训练集提取相应的特征,将提取到的预训练特征以拼接方式添加到原GOP特征中进行特征融合,使用融合特征以相同方式进行训练,得到的音素级、词级和句子级方面综合评分的PCC相比基线模型分别提升了2.45%、7.10%和1.89%。 展开更多
关键词 Squeezeformer模型 发音质量评测 预训练模型 特征融合 皮尔逊相关系数
在线阅读 下载PDF
针对发音质量评测的声学模型优化算法 被引量:4
2
作者 严可 魏思 戴礼荣 《中文信息学报》 CSCD 北大核心 2013年第1期98-107,共10页
在发音质量评测研究中,传统仅用发音标准的数据进行声学建模,难以描述实际测试面临的非标准发音,使得训练与测试的失配在所难免。针对上述问题,该文提出一种利用覆盖各种发音的数据,根据最小化机器分与人工分均方误差准则进行声学模型... 在发音质量评测研究中,传统仅用发音标准的数据进行声学建模,难以描述实际测试面临的非标准发音,使得训练与测试的失配在所难免。针对上述问题,该文提出一种利用覆盖各种发音的数据,根据最小化机器分与人工分均方误差准则进行声学模型优化的算法。实验在普通话水平考试现场3 685份数据(其中498份测试,3 187份训练)上进行。实验表明采用优化算法得到的针对发音质量的评测声学模型相比传统建模方式得到的声学模型有显著的优势。 展开更多
关键词 计算机辅助学习 区分性训练 普通话水平测试 发音质量评测
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部