-
题名面向铁路领域的多方言免切换语音识别方法
- 1
-
-
作者
杨立鹏
胡从刚
陈华龙
韩可可
刘峰
张志科
-
机构
中国铁道科学研究院集团有限公司电子计算技术研究所
中国国家铁路集团有限公司客运部
-
出处
《中国铁路》
北大核心
2025年第1期30-39,共10页
-
基金
中国铁道科学研究院集团有限公司科研开发基金项目(2023YJ132)。
-
文摘
随着铁路智能客服系统的持续发展,现有语音识别模型的准确率已达到较高水平,但面对铁路领域术语和多样化方言场景,其语音识别效果仍然较差,因此提出1种融合铁路领域知识的多方言免切换语音识别方法。基于RepVGG网络模型构建方言语种识别器,以获取语种信息;对Transformer语音识别模型进行改进,通过在编码器中融合注意力机制的语种残差模块,并在解码器中嵌入语种信息,以实现多方言免切换功能;基于LSTM网络模型在铁路文本语料库上训练铁路领域专用的语言模型,并将其与改进的Transformer模型进行融合,以提升对铁路术语的识别准确率;在自建数据集上对所提方法进行实验验证,结果表明:所提方法在粤语、四川话和普通话上的识别准确率均超过90%,且有效提升对铁路领域术语的识别性能,具有一定应用价值。
-
关键词
铁路领域语言模型
多方言
语音识别
RepVGG
TRANSFORMER
LSTM
-
Keywords
railway-specific language model
multi-dialect
speech recognition
RepVGG
Transformer
LSTM
-
分类号
U29-39
[交通运输工程—交通运输规划与管理]
TP18
[自动化与计算机技术—控制理论与控制工程]
TP391.4
[自动化与计算机技术—计算机应用技术]
-