期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于分段动态时间规整的语音样例快速检索 被引量:5
1
作者 冯志远 张连海 《数据采集与处理》 CSCD 北大核心 2014年第2期265-273,共9页
提出了一种融合下界估计和分段动态时间规整的语音样例快速检索方法。该方法针对缺乏合适的训练数据等语音资源较为有限的语言进行快速检索所设计。此方法首先提取查询样例和测试集的音素后验概率;然后,根据限制条件在测试语句中选定候... 提出了一种融合下界估计和分段动态时间规整的语音样例快速检索方法。该方法针对缺乏合适的训练数据等语音资源较为有限的语言进行快速检索所设计。此方法首先提取查询样例和测试集的音素后验概率;然后,根据限制条件在测试语句中选定候选分段,并计算查询样例和每个候选分段之间实际动态时间规整得分的下界估计,再运用K最近邻搜索算法搜索与查询样例相似度最高的分段;最后,使用虚拟相关反馈技术对检索结果进行修正。实验结果表明:尽管此方法的检索精度略低于直接运用动态时间规整进行检索的检索精度,但其检索速度优于后者,且检索结果经过虚拟相关反馈技术修正后,其检索精度也得到有效提升。 展开更多
关键词 语音样例检索 音素后验概率 分段动态时间规整 下界估计 虚拟相关反馈
在线阅读 下载PDF
采用深层神经网络中间层特征的关键词识别 被引量:2
2
作者 刘学 王年松 郭武 《小型微型计算机系统》 CSCD 北大核心 2015年第7期1540-1544,共5页
在基于模板匹配的关键词识别中,提出采用深层神经网络的中间层特征(bottleneck,BN)作为特征输入,将其取代传统的声学参数来生成后验概率图.首先采用传统语音识别的过程训练一个中间层很窄的深层神经网络,将所有的语音特征经过这个神经... 在基于模板匹配的关键词识别中,提出采用深层神经网络的中间层特征(bottleneck,BN)作为特征输入,将其取代传统的声学参数来生成后验概率图.首先采用传统语音识别的过程训练一个中间层很窄的深层神经网络,将所有的语音特征经过这个神经网络后得到稳健的BN特征;然后利用混合高斯模型将BN特征转化成后验概率图;在识别过程中,利用后验概率图作为特征参数,采用简化的分段动态时间规整算法实现关键词匹配.在TIMIT数据库上,相对于采用传统感知线性参数的系统,采用BN特征的系统,识别准确率有30%的提升. 展开更多
关键词 识别 分段动态时间规整 深层神经网络 中间层
在线阅读 下载PDF
基于NMF后验特征优化的语音查询样例检测
3
作者 曹建凯 张连海 李勃昊 《数据采集与处理》 CSCD 北大核心 2017年第6期1198-1207,共10页
提出一种基于非负矩阵分解(Nonnegative matrix factorization,NMF)后验特征优化和修正分段动态时间规整(Segmental dynamic time warping,SDTW)检索的无监督语音查询样例检测方法。该方法首先应用频域线性预测(Frequency domain linear... 提出一种基于非负矩阵分解(Nonnegative matrix factorization,NMF)后验特征优化和修正分段动态时间规整(Segmental dynamic time warping,SDTW)检索的无监督语音查询样例检测方法。该方法首先应用频域线性预测(Frequency domain linear prediction,FDLP)声学特征参数代替梅尔频率倒谱系数(Mel-frequency cepstral coefficients,MFCCs)训练高斯混合模型(Gaussian mixture model,GMM)模型,然后使用NMF算法对高斯后验特征矩阵进行分解,将得到的基矩阵作为子空间变换矩阵对原始后验特征投影,投影可以突出特征中主要分量,平滑距离矩阵。在检索阶段,使用多相邻输出得分对最佳匹配得分进行修正,用于代替标准SDTW算法的1-best输出得分。实验结果表明,在不增加检索时间的情况下,该方法相比应用MFCCs和FDLP特征的基线系统性能提升明显,检索精度分别相对提升了18.6%和18.1%。 展开更多
关键词 无监督 查询样例检测 后验特征 非负矩阵分解优化 修正分段动态时间规整
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部