-
题名基于加权有限状态机的动态匹配词图生成算法
被引量:4
- 1
-
-
作者
郭宇弘
黎塔
肖业鸣
潘接林
颜永红
-
机构
中国科学院语言声学与内容理解重点实验室
-
出处
《电子与信息学报》
EI
CSCD
北大核心
2014年第1期140-146,共7页
-
基金
国家自然科学基金(10925419
90920302
+8 种基金
61072124
11074275
11161140319
91120001
61271426)
中国科学院战略性先导科技专项(XDA06030100
XDA06030500)
国家863计划项目(2012AA012503)
中科院重点部署项目(KGZD-EW-103-2)资助课题
-
文摘
由于现有的加权有限状态机(WFST)解码网络没有精确词尾标记,导致当前已有的词图生成算法不含精确的词尾时间点,或者仅是状态、音素级别的词图,无法应用到关键词检索中。该文提出在WFST静态解码器下的语音识别词图生成算法。首先从理论上分析了WFST解码音素图和词图的可转换关系,然后提出了字典的动态音素匹配方法解决了WFST网络中词尾时间点对齐的问题,最后通过令牌传递的遍历方法生成了词图。同时,考虑到计算量优化,在令牌传递过程中引入了剪枝算法,使音素图转词图的耗时不到解码耗时的3%。得到的词图,不仅可以用于语言模型重打分,由于含有精确的词尾时间点,还可以直接应用到关键词检索系统中。实验结果表明,该文的词图生成算法具有较高的计算效率;和已有动态解码器的词图相比,词图中包含更多解码信息,在大词汇连续语音识别的重打分结果和关键词检索中都能取得更好的性能。
-
关键词
自动语音识别
加权有限状态机
词图生成
关键词检索
-
Keywords
Automatic speech recognition
Weighted Finite State Transducer (WFST)
Lattice generation
Keyword spotting
-
分类号
TP391.42
[自动化与计算机技术—计算机应用技术]
-