期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于Squeezeformer的多颗粒度多方面发音质量评测方法
1
作者
费涛
艾山·吾买尔
+1 位作者
杜文旭
朱翠翠
《计算机工程》
北大核心
2025年第1期81-87,共7页
口语发音质量评测相对于发音错误检测和诊断(MDD)任务,不仅需要原始的数据特征,还需要许多流畅度、准确度、完整度等特征辅助进行实现,所以对口语发音质量评测的研究远远少于对MDD的研究。目前对于口语发音质量评测的研究都是对语音评...
口语发音质量评测相对于发音错误检测和诊断(MDD)任务,不仅需要原始的数据特征,还需要许多流畅度、准确度、完整度等特征辅助进行实现,所以对口语发音质量评测的研究远远少于对MDD的研究。目前对于口语发音质量评测的研究都是对语音评分某一项指标单方面进行评分。设计将Transformer替换Squeezeformer的改进模型Squeezeformer-MR对基线模型进行改进,Squeezeformer-MR使用多个残差连接增强了前后特征信息的传递。实验中,在参数设置上保持与基线模型一致,使用最稳定的24层嵌入层时,音素级、词级和句子级方面的综合评分的皮尔逊相关系数(PCC)相比基线模型分别提升了1.96%、6.37%和1.08%。在初次改进的基础上,使用WavLM和HuBERT预训练模型对训练集提取相应的特征,将提取到的预训练特征以拼接方式添加到原GOP特征中进行特征融合,使用融合特征以相同方式进行训练,得到的音素级、词级和句子级方面综合评分的PCC相比基线模型分别提升了2.45%、7.10%和1.89%。
展开更多
关键词
Squeezeformer模型
发音质量评测
预训练模型
特征融合
皮尔逊相关系数
在线阅读
下载PDF
职称材料
针对发音质量评测的声学模型优化算法
被引量:
4
2
作者
严可
魏思
戴礼荣
《中文信息学报》
CSCD
北大核心
2013年第1期98-107,共10页
在发音质量评测研究中,传统仅用发音标准的数据进行声学建模,难以描述实际测试面临的非标准发音,使得训练与测试的失配在所难免。针对上述问题,该文提出一种利用覆盖各种发音的数据,根据最小化机器分与人工分均方误差准则进行声学模型...
在发音质量评测研究中,传统仅用发音标准的数据进行声学建模,难以描述实际测试面临的非标准发音,使得训练与测试的失配在所难免。针对上述问题,该文提出一种利用覆盖各种发音的数据,根据最小化机器分与人工分均方误差准则进行声学模型优化的算法。实验在普通话水平考试现场3 685份数据(其中498份测试,3 187份训练)上进行。实验表明采用优化算法得到的针对发音质量的评测声学模型相比传统建模方式得到的声学模型有显著的优势。
展开更多
关键词
计算机辅助学习
区分性训练
普通话水平测试
发音质量评测
在线阅读
下载PDF
职称材料
题名
基于Squeezeformer的多颗粒度多方面发音质量评测方法
1
作者
费涛
艾山·吾买尔
杜文旭
朱翠翠
机构
新疆大学软件学院
新疆大学计算机科学与技术学院
出处
《计算机工程》
北大核心
2025年第1期81-87,共7页
基金
中央引导地方科技发展专项资金项目(202204120018)。
文摘
口语发音质量评测相对于发音错误检测和诊断(MDD)任务,不仅需要原始的数据特征,还需要许多流畅度、准确度、完整度等特征辅助进行实现,所以对口语发音质量评测的研究远远少于对MDD的研究。目前对于口语发音质量评测的研究都是对语音评分某一项指标单方面进行评分。设计将Transformer替换Squeezeformer的改进模型Squeezeformer-MR对基线模型进行改进,Squeezeformer-MR使用多个残差连接增强了前后特征信息的传递。实验中,在参数设置上保持与基线模型一致,使用最稳定的24层嵌入层时,音素级、词级和句子级方面的综合评分的皮尔逊相关系数(PCC)相比基线模型分别提升了1.96%、6.37%和1.08%。在初次改进的基础上,使用WavLM和HuBERT预训练模型对训练集提取相应的特征,将提取到的预训练特征以拼接方式添加到原GOP特征中进行特征融合,使用融合特征以相同方式进行训练,得到的音素级、词级和句子级方面综合评分的PCC相比基线模型分别提升了2.45%、7.10%和1.89%。
关键词
Squeezeformer模型
发音质量评测
预训练模型
特征融合
皮尔逊相关系数
Keywords
Squeezeformer model
pronunciation quality assessment
pre-training model
feature fusion
Pearson Correlation Coefficient(PCC)
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
针对发音质量评测的声学模型优化算法
被引量:
4
2
作者
严可
魏思
戴礼荣
机构
中国科学技术大学
科大讯飞股份有限公司
出处
《中文信息学报》
CSCD
北大核心
2013年第1期98-107,共10页
文摘
在发音质量评测研究中,传统仅用发音标准的数据进行声学建模,难以描述实际测试面临的非标准发音,使得训练与测试的失配在所难免。针对上述问题,该文提出一种利用覆盖各种发音的数据,根据最小化机器分与人工分均方误差准则进行声学模型优化的算法。实验在普通话水平考试现场3 685份数据(其中498份测试,3 187份训练)上进行。实验表明采用优化算法得到的针对发音质量的评测声学模型相比传统建模方式得到的声学模型有显著的优势。
关键词
计算机辅助学习
区分性训练
普通话水平测试
发音质量评测
Keywords
computer assisted language learning
discriminative training
PSC
pronunciation quality evaluation
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于Squeezeformer的多颗粒度多方面发音质量评测方法
费涛
艾山·吾买尔
杜文旭
朱翠翠
《计算机工程》
北大核心
2025
0
在线阅读
下载PDF
职称材料
2
针对发音质量评测的声学模型优化算法
严可
魏思
戴礼荣
《中文信息学报》
CSCD
北大核心
2013
4
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部