-
题名基于HTK实时中文语音路名查询系统的设计和实现
被引量:4
- 1
-
-
作者
林立
朱杰
-
机构
上海交通大学电子工程系
-
出处
《电子测量技术》
2008年第3期45-46,54,共3页
-
文摘
HTK是英国剑桥大学开发的一个用于创建和处理隐马尔可夫模型的实验工具包,由一整套基于C语言的库函数组成。由于其在语音识别方面处于相对领先地位,且源代码公开便于系统开发调试,所以是进行语音识别研究的一个理想平台。本文介绍了HTK语音识别系统处理流程,提出了基于HTK的实时中文语音路名查询系统的设计和实现,可实现用户实时中文语音输入路名的情况下,系统将识别结果以汉字方式显示在屏幕上。本系统小巧快速,且具有较高的识别率。
-
关键词
中文语音识别
HTK
路名查询
-
Keywords
Chinese speech recognition
HTK
road inquiry
-
分类号
TN912.34
[电子电信—通信与信息系统]
-
-
题名基于自监督知识迁移的鲁棒性语音识别技术
被引量:2
- 2
-
-
作者
柏财通
崔翛龙
郑会吉
李爱
-
机构
武警工程大学研究生大队
武警工程大学反恐指挥信息工程研究团队
武警工程大学乌鲁木齐校区
-
出处
《计算机应用》
CSCD
北大核心
2022年第10期3217-3223,共7页
-
基金
国家自然科学基金资助项目(U1603261)
网信融合项目(LXJH-10(A)-09)。
-
文摘
针对标注神经网络训练数据的成本日益增加与噪声干扰阻碍语音识别系统性能提升的问题,提出一种基于自监督知识迁移的鲁棒性语音识别模型的模型训练算法。首先,在预处理阶段提取原始语音样本的三个人工特征;然后,在训练阶段将特征提取网络生成的高级特征分别通过三个浅层网络来拟合预处理阶段提取的人工特征;同时,把特征提取前端与语音识别后端进行交叉训练,并合并它们的损失函数;最后,通过梯度反向传播令特征提取网络学会提取更有助于去噪语音识别的高级特征,从而实现人工知识迁移与去噪,并高效利用了训练数据。在军事装备控制的应用场景下,基于加噪后的THCHS-30、希尔贝壳数据集AISHELL-1与ST-CMDS这三个开源中文语音识别数据集以及军事装备控制指令的数据集上进行测试,实验结果表明,基于自监督知识迁移的鲁棒性语音识别模型的模型训练算法词错率可以降低到0.12,不仅可以实现对鲁棒性语音识别模型的模型训练,同时通过自监督知识迁移提高了训练样本的利用率,可完成装备控制任务。
-
关键词
知识迁移
鲁棒性语音识别
自监督学习
中文语音识别
语音去噪
-
Keywords
knowledge transfer
robust speech recognition
self-supervised learning
Chinese speech recognition
speech denoising
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
TP309
[自动化与计算机技术—计算机系统结构]
-
-
题名稠密子图发现的视频语义挖掘方法
被引量:3
- 3
-
-
作者
张师林
李和平
张树武
-
机构
北方工业大学计算机基础教研室
中国科学院自动化研究所数字媒体研究中心
-
出处
《计算机工程与应用》
CSCD
北大核心
2011年第33期13-14,21,共3页
-
基金
科技部国家科技支撑计划(No.2011BAH16B00)~~
-
文摘
目前基于内容的视频语义挖掘方法并未考虑到视频的多模态特性,不能够实现对于目前海量涌现视频的自动分析处理任务。针对此问题,提出了基于稠密子图发现的视频语义挖掘方法。该方法对待处理的视频进行中文连续语音识别、视频目标识别和视频文字识别,对于识别结果进行中文分词和词性标注,保留名词和动词作为图模型的顶点,顶点之间的边权重设置为两个顶点所代表的词语的中文语义距离,根据稠密子图发现算法挖掘视频的语义信息。实验结果表明这种方法是有效的。
-
关键词
稠密子图
中文连续语音识别
视频目标识别
-
Keywords
dense sub graph
Chinese continuous speech recognition
video object recognition
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-