期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
辅助短语音条件下说话人确认系统的seq2seq模型
1
作者 杨爽 马佰超 +1 位作者 杨宇 陈丹 《计算机应用与软件》 北大核心 2025年第4期223-228,共6页
文本无关的说话人确认系统使用的测试语音时长越短效果越差。针对这种情况,提出增强声学特征的方法。使用基于seq2seq(Sequence to Sequence)的生成模型将短时声学特征生成更长的特征,其中,编码器用于提取深层特征,解码器输出声学特征,... 文本无关的说话人确认系统使用的测试语音时长越短效果越差。针对这种情况,提出增强声学特征的方法。使用基于seq2seq(Sequence to Sequence)的生成模型将短时声学特征生成更长的特征,其中,编码器用于提取深层特征,解码器输出声学特征,使用注意力机制来获取序列之间的关系。在训练时加入余弦距离损失来提升生成模型的泛化性能,将训练好的说话人确认模型作为生成模型训练架构的组件。实验结果表明,在1~3 s语音时长下,采用该模型后等错误率平均降低7.78%。 展开更多
关键词 说话人确认 短时语音 seq2seq 余弦距离损失
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部