期刊文献+
共找到62篇文章
< 1 2 4 >
每页显示 20 50 100
基于EfficientNetV2-RetNet的端到端中文管制语音识别
1
作者 梁海军 常瀚文 +2 位作者 何一民 赵志伟 孔建国 《电讯技术》 北大核心 2025年第2期254-260,共7页
自动语音识别(Automatic Speech Recognition, ASR)技术在空中交通管制(Air Traffic Control, ATC)领域的应用有望提高通信效率、减少人为错误、提升安全性,并促进航空交通管理系统的创新和改进。然而,由于ATC通信通常涉及敏感信息,获... 自动语音识别(Automatic Speech Recognition, ASR)技术在空中交通管制(Air Traffic Control, ATC)领域的应用有望提高通信效率、减少人为错误、提升安全性,并促进航空交通管理系统的创新和改进。然而,由于ATC通信通常涉及敏感信息,获取大量带有标签的ATC语音数据较为困难,这给构建高准确度的ASR系统带来了巨大挑战。基于Retentive Network(RetNet)和迁移学习设计了一种新的端到端ASR框架EfficientNetV2-RetNet-CTC,用于ATC系统。EfficientNetV2的多层卷积结构有助于对语音信号提取更复杂的特征表示。RetNet使用多尺度保持机制学习序列数据上的全局时间动态,可以非常高效地处理长距离依赖性。连接时序分类不用强制对齐标签且标签可变长。此外,迁移学习通过在源任务上学习的知识来改善在目标任务上的性能,解决了民航领域数据资源稀缺的问题且提高了模型的泛化能力。实验结果表明,所设计的模型优于其他基线,在Aishell语料库上预训练的最低词错误率为7.6%和8.7%,在ATC语料库上降至5.6%和6.8%。 展开更多
关键词 空中交通管制 自动语音识别 端到端深度学习 迁移学习
在线阅读 下载PDF
基于ASR与Arduino的语音控制照明系统设计 被引量:1
2
作者 胡芷晗 《电声技术》 2019年第5期56-57,63,共3页
通过对Arduino单板深入研究,结合高性能的ASR语音识别芯片,将语音识别技术引入照明系统设计中,进行了语音控制系统的总体结构、主控制模块和语音识别的软硬件设计,实现了一套基于Arduino的语音控制系统。最终测试完成了远程控制台灯即... 通过对Arduino单板深入研究,结合高性能的ASR语音识别芯片,将语音识别技术引入照明系统设计中,进行了语音控制系统的总体结构、主控制模块和语音识别的软硬件设计,实现了一套基于Arduino的语音控制系统。最终测试完成了远程控制台灯即时状态,提高智能化程度的目的。 展开更多
关键词 语音识别 语音控制 asr ARDUINO
在线阅读 下载PDF
基于AR与ASR的变电运检系统设计与实现
3
作者 梁日才 刘文平 +1 位作者 罗海鑫 王晓强 《通信电源技术》 2022年第13期99-103,共5页
目前电力企业需要开展变电设备巡视、维护、检修和紧急抢修工作,传统变电运检工作存在技能水平不足、沟通不畅以及智能化水平不高的问题。同时,变电运检工作还具有复杂性和综合性的特点,为现场作业人员提供实时专家库支持,是变电运检工... 目前电力企业需要开展变电设备巡视、维护、检修和紧急抢修工作,传统变电运检工作存在技能水平不足、沟通不畅以及智能化水平不高的问题。同时,变电运检工作还具有复杂性和综合性的特点,为现场作业人员提供实时专家库支持,是变电运检工作的重要发展方向。为提高专家会诊效率和质量,保障专家快速了解现场并作出准确的指导,缩短消缺周期和提高消缺效率,基于增强现实(Augmented Reality,AR)和自动语音识别(Automatic Speech Recognition,ASR)技术,设计了一种交互式变电运检系统,实现了专家远程快速会诊功能,高效辅助解决现场问题,显著提升了变电运检工作效率,并进一步保障了变电作业人员的人身安全。该系统在某变电管理所的成功应用,验证了系统的实用性及有效性。 展开更多
关键词 变电消缺 增强现实(AR) 自动语音识别(asr) 交互式系统 远程视频会诊
在线阅读 下载PDF
基于语音识别的机械零件自动分类回收系统的研究 被引量:1
4
作者 于洪波 邵娟 《电声技术》 2024年第2期36-38,共3页
针对传统机械零件自动分类回收系统因复杂噪声环境导致语音识别准确性不高的问题,文章提出一种混合语音降噪算法,利用谱减法、维纳滤波与小波阈值降噪对语音进行多级降噪处理。搭建实验环境对改进后的方式进行验证,实验结果表明改进后... 针对传统机械零件自动分类回收系统因复杂噪声环境导致语音识别准确性不高的问题,文章提出一种混合语音降噪算法,利用谱减法、维纳滤波与小波阈值降噪对语音进行多级降噪处理。搭建实验环境对改进后的方式进行验证,实验结果表明改进后的方式能够有效改善系统语音识别的准确性,提升系统分拣效率。 展开更多
关键词 机械零件 自动分类 语音识别 语音降噪
在线阅读 下载PDF
面向空管模拟机培训的智能应答机长研究 被引量:1
5
作者 郭成龙 廖伟 +5 位作者 田晨 林毅 吴九州 赵雅珺 游学杭 李锦恒 《海军航空大学学报》 2024年第1期115-122,共8页
针对当前日益增长的空中交通管制员(以下简称“管制员”)培训需求以及传统管制员培训模拟机面临的效率低等问题,设计了1个面向空管模拟机培训的智能应答机长系统。该系统利用语音识别、指令提取、指令复诵、语音合成等技术,能够实现对... 针对当前日益增长的空中交通管制员(以下简称“管制员”)培训需求以及传统管制员培训模拟机面临的效率低等问题,设计了1个面向空管模拟机培训的智能应答机长系统。该系统利用语音识别、指令提取、指令复诵、语音合成等技术,能够实现对管制模拟培训过程中管制员语音的智能识别和理解,并模拟飞行员自动输出复诵指令的功能。通过对真实空管对话语音模式的研究和分析,制定了1套详细的复诵规则,以适应不同场景下的管制指令复诵模式。此外,集成了特情处理模块以支持管制员特情处理培训。在真实管制培训环境下进行实验验证,结果表明,所提出的智能应答机长系统综合复诵准确率为88.6%,可以有效提升管制员培训质量和效率,显著降低了人力成本。并且,该系统可以作为子系统集成到现有的管制员培训模拟机系统中,具有较强的便捷性和兼容性。 展开更多
关键词 空管模拟机 智能机长 指令复诵 语音识别
在线阅读 下载PDF
基于语音识别的机械臂控制系统设计 被引量:1
6
作者 白梦飞 金衎哲 符朝兴 《青岛大学学报(工程技术版)》 2024年第4期44-51,共8页
为了方便工作人员控制机械臂,设计了一种通过语音命令机械臂完成动作的控制系统。通过自动语音识别模块采集语音,对语音信号进行降噪处理,提高语音信号质量,利用语音识别模型对语音信号进行识别分析和关键词匹配,自动生成指导机械臂运... 为了方便工作人员控制机械臂,设计了一种通过语音命令机械臂完成动作的控制系统。通过自动语音识别模块采集语音,对语音信号进行降噪处理,提高语音信号质量,利用语音识别模型对语音信号进行识别分析和关键词匹配,自动生成指导机械臂运动的数据。机械臂控制模块分析运动数据,并转化为控制指令,通过控制算法完成机械臂的运动动作。实验结果表明,谱减法降噪使语音识别准确率提高了14.77%,验证了降噪算法的有效性,满足系统对语音识别的技术要求。语音控制机械臂实验中,机械臂能够完成预期动作,验证了系统的可行性。 展开更多
关键词 自动语音识别 谱减法 关键词匹配 机械臂控制
在线阅读 下载PDF
类别条件生成对抗网络的语音对抗样本生成方法 被引量:1
7
作者 于振华 胡旭飞 叶鸥 《西安交通大学学报》 EI CAS CSCD 北大核心 2024年第12期153-164,共12页
针对现有面向自动语音识别系统的对抗攻击方法难以捕捉不同语音尺度之间的相关性、导致攻击成功率低的问题,提出一种类别条件生成对抗网络的语音对抗样本生成方法。通过目标标签映射模块,将攻击目标标签转化为独热向量,作为条件输入到... 针对现有面向自动语音识别系统的对抗攻击方法难以捕捉不同语音尺度之间的相关性、导致攻击成功率低的问题,提出一种类别条件生成对抗网络的语音对抗样本生成方法。通过目标标签映射模块,将攻击目标标签转化为独热向量,作为条件输入到构建的类别条件生成对抗网络中,以此控制语音样本类别的生成。该类别条件生成对抗网络中的生成器,采用设计的NReSidual U-block网络模块与U-Net相融合,可以更好地学习不同时间尺度的语音特征,以及提升语音特征的表示能力,从而可以针对特定语音类别生成对抗样本;判别器采用卷积块和全连接层相结合的网络结构,将错误损失通过梯度反向传播至生成器,能有效保留语音信号的时序信息,并解决数据分布不稳定问题。在通用的谷歌命令数据集和音乐流派数据集上进行实验,结果表明,所提语音对抗样本生成方法的攻击成功率与主流方法相比,分别提高了3.47%、5.1%,平均信噪比提升了3.2、1.49 dB,该方法具有较好的攻击效果和语音质量。 展开更多
关键词 自动语音识别系统 生成对抗网络 对抗攻击 语音对抗样本生成 标签映射
在线阅读 下载PDF
复杂真实环境下的调度电话转录算法研究
8
作者 詹丛茵 鲁工圆 +2 位作者 高辉 钱立 陈历泉 《铁道运输与经济》 北大核心 2024年第4期83-93,100,共12页
调度电话的应答是调度员日常工作的重要部分,也是事故回放审查的重要依据。为了提高事故分析及回放审查的效率,为调度指挥智能化打下基础,提出一种基于注意力机制及连接时序分类联合训练的调度电话转录算法,旨在提高复杂现实环境中调度... 调度电话的应答是调度员日常工作的重要部分,也是事故回放审查的重要依据。为了提高事故分析及回放审查的效率,为调度指挥智能化打下基础,提出一种基于注意力机制及连接时序分类联合训练的调度电话转录算法,旨在提高复杂现实环境中调度电话的转录精确率及稳定性。通过在公开数据上添加调度大厅噪音来模拟现场环境,从而测试不同信噪比条件下算法的转录性能。在0 dB、1 dB、5 dB、10 dB的信噪比条件下测试转录错字率,结果分别是17.37%,16.48%,12.46%和9.69%,证明算法在强噪声环境下依旧能够保持稳定。算法包含半监督训练,实验表明,在小规模数据上,半监督训练相较于有监督训练可保证1%~2%的错字率降低。最后,算法在调度电话数据集上进行测试,并取得87.39%的关键字转录正确率。 展开更多
关键词 铁路运输 调度电话转录 多任务训练 铁路调度指挥 半监督训练 自动语音识别
在线阅读 下载PDF
基于语音识别的智慧分类医疗垃圾桶的设计与实现
9
作者 黄佳兴 吕廷新 +1 位作者 石青盈 高翔 《现代信息科技》 2024年第12期18-22,26,共6页
以Arduino Nano单片机为核心,采用SU-03T语音识别芯片、ESP8266联网模块以及其他模块,设计一款具备语音识别和联网功能的医疗垃圾分类垃圾桶,实现了对医疗垃圾分类的语音化管理、垃圾溢满提示、环境照明和垃圾桶开合等自动化功能。同时... 以Arduino Nano单片机为核心,采用SU-03T语音识别芯片、ESP8266联网模块以及其他模块,设计一款具备语音识别和联网功能的医疗垃圾分类垃圾桶,实现了对医疗垃圾分类的语音化管理、垃圾溢满提示、环境照明和垃圾桶开合等自动化功能。同时设计移动端应用程序与联网模块的信息交互,获取垃圾桶的状态信息,实现对垃圾桶容量的查看和分楼层对垃圾桶的管理。实验结果表明,智慧分类医疗垃圾桶语音识别的正确率达97%,满足设计需要。 展开更多
关键词 医疗垃圾分类 ARDUINO 语音识别 定位联网 自动判断 模块化
在线阅读 下载PDF
视觉语言——唇读综述 被引量:31
10
作者 姚鸿勋 高文 +1 位作者 王瑞 郎咸波 《电子学报》 EI CAS CSCD 北大核心 2001年第2期239-246,共8页
本文介绍了目前唇读研究的现状与发展水平 ,详细阐述了唇读研究的内容和方法 ,以及唇读研究的意义 ,旨在引起大家对此新兴研究方向的关注与兴趣 ,从而积极参与对唇读问题的研究 。
关键词 唇读 自动语音识别 手语识别 情感计算 视觉语言
在线阅读 下载PDF
汽车语控智能电器系统 被引量:6
11
作者 张新丰 林凯 +2 位作者 刘旺 杨殿阁 连小珉 《汽车工程》 EI CSCD 北大核心 2007年第7期601-605,共5页
提出一种语音控制汽车智能电器系统的总体结构框架,包括语音识别和驾驶员意图识别的运算平台及汽车智能电器系统。在车载环境下,利用规范模式和有限状态机理论对驾驶员的自然语言进行分析,达到意图识别和语音控制的目的。引入抗干扰设... 提出一种语音控制汽车智能电器系统的总体结构框架,包括语音识别和驾驶员意图识别的运算平台及汽车智能电器系统。在车载环境下,利用规范模式和有限状态机理论对驾驶员的自然语言进行分析,达到意图识别和语音控制的目的。引入抗干扰设计方法后系统对驾驶员意图识别的正确率有明显提高。最后通过试验系统验证了利用驾驶员语言进行汽车电器控制的可行性。 展开更多
关键词 语音控制 自动语音识别 驾驶员意图识别 智能电器系统
在线阅读 下载PDF
多特征融合的英语口语考试自动评分系统的研究 被引量:11
12
作者 李艳玲 颜永红 《电子与信息学报》 EI CSCD 北大核心 2012年第9期2097-2102,共6页
该文主要针对大规模英语口语考试自动评分系统的问答题型,采用多特征融合的方法进行评分。以语音识别文本作为研究对象,提取了3类特征进行评分。这3类特征分别是:相似度特征、句法特征和语音特征。总共9个特征从不同方面描述了考生回答... 该文主要针对大规模英语口语考试自动评分系统的问答题型,采用多特征融合的方法进行评分。以语音识别文本作为研究对象,提取了3类特征进行评分。这3类特征分别是:相似度特征、句法特征和语音特征。总共9个特征从不同方面描述了考生回答与专家评分之间的关系。在相似度特征中,改进了Manhattan距离作为相似度。同时提出了基于编辑距离的关键词覆盖率的特征,充分考虑了识别文本中存在的单词变异现象,为给考生一个客观公平的分数提供依据。所有提取的特征利用多元线性回归模型进行融合,得到机器评分。实验结果表明,提取的特征对机器评分是十分有效的,并且在以考生为单位的系统评分性能达到了专家评分性能的98.4%。 展开更多
关键词 自动语音识别 自动评分 特征选择 相似度 句法树
在线阅读 下载PDF
基于语音交互功能的医疗服务机器人控制系统设计 被引量:6
13
作者 毛丽民 卢振利 +1 位作者 谢新明 浦宇欢 《高技术通讯》 CAS CSCD 北大核心 2014年第7期745-751,共7页
根据老年人、残疾人的实际需求,设计了医疗服务型机器人移动本体和6自由度机械手臂,搭建了以简化隐式马科夫模型为基础的自动语音辨识控制系统。该控制系统通过人机交互系统的语音命令与键盘指令,可控制机器人运行到指定位置,控制机械... 根据老年人、残疾人的实际需求,设计了医疗服务型机器人移动本体和6自由度机械手臂,搭建了以简化隐式马科夫模型为基础的自动语音辨识控制系统。该控制系统通过人机交互系统的语音命令与键盘指令,可控制机器人运行到指定位置,控制机械手抓取物体,实现机器人的避障功能和座椅、病床两模式的自主切换。针对典型医疗服务需求,对所设计的医疗服务机器人进行了实验,实验结果表明,该机器人在人机交互指令控制下能很好地实现到达指定位置、抓取物体、避障和病床/座椅模式切换,不仅易于操作,而且性能稳定,语音系统对命令的识别率达90%以上,从而验证了该医疗服务型机器人控制系统设计的可行性和有效性。 展开更多
关键词 自动语音辨识(asr) 医疗服务机器人(MSR) 人机交互(HRI) 隐式马尔科夫模型(HMM) 机械手臂
在线阅读 下载PDF
语音大数据信息处理架构及关键技术研究 被引量:6
14
作者 杨震 徐敏捷 +2 位作者 刘璋峰 秦达 姚晓辉 《电信科学》 北大核心 2013年第11期1-5,共5页
针对如何从音频信息中获得有商业价值的信息这一大数据研究的重要方向,首先分析了大数据的基础技术特性、涉及的技术,然后分析了语音识别的基本技术环节,最后结合大数据信息处理架构,给出了语音识别技术与大数据相结合的应用开发技术架... 针对如何从音频信息中获得有商业价值的信息这一大数据研究的重要方向,首先分析了大数据的基础技术特性、涉及的技术,然后分析了语音识别的基本技术环节,最后结合大数据信息处理架构,给出了语音识别技术与大数据相结合的应用开发技术架构及应用流程。 展开更多
关键词 自然语言处理架构 大数据 自动语音识别
在线阅读 下载PDF
基于语音识别的发音学习技术 被引量:9
15
作者 韩纪庆 王欢良 +1 位作者 李海峰 郑铁然 《电声技术》 北大核心 2004年第9期47-51,共5页
在语言发音学习中,有效的反馈对学习者有很大的帮助。计算机辅助发音学习系统可以给学习者有效的发音指导。就目前基于语音识别的发音学习技术进行介绍,给出系统原理框图,对一些关键技术和问题进行探讨,并对其发展进行展望。
关键词 发音学习 语音识别 自动发音打分 计算机辅助语言学〉-7
在线阅读 下载PDF
英语篇章朗读质量的自动评分 被引量:3
16
作者 蒋同海 张俊博 +1 位作者 潘复平 颜永红 《应用声学》 CSCD 北大核心 2011年第6期418-426,共9页
本文研究了英语篇章朗读的计算机自动评分。本文根据人工评分的角度和准则,用语音识别技术分析语音,提取一系列评价特征,包括朗读完整度特征、发音准确度特征、流利度特征,然后通过SVM回归把这些评价特征映射为质量分数。在对4000名中... 本文研究了英语篇章朗读的计算机自动评分。本文根据人工评分的角度和准则,用语音识别技术分析语音,提取一系列评价特征,包括朗读完整度特征、发音准确度特征、流利度特征,然后通过SVM回归把这些评价特征映射为质量分数。在对4000名中学生的英语水平自动测试中,用3200名学生的人工评分训练系统,对其余800名学生的机器自动测试取得分差为1.18的良好结果,而专家评分与参考评分的平均分差为1.31。实验表明该项技术已达到实用化水平。 展开更多
关键词 自动评分 发音质量评估 语音识别
在线阅读 下载PDF
基于硬件加速模块的嵌入式语音识别系统解决方案 被引量:3
17
作者 智强 李鹏 +2 位作者 董明 梁维谦 刘润生 《电子技术应用》 北大核心 2008年第8期31-33,37,共4页
在基于 CHMM 模型的语音识别原理的基础上,设计了一个以 MCU 和自行设计的语音识别加速模块(ASIC 模块)为核心的低成本、高性能的嵌入式语音识别系统。该系统配合外围电路,能够独立完成语音识别工作,并且有大幅度的性能提升,从而使嵌入... 在基于 CHMM 模型的语音识别原理的基础上,设计了一个以 MCU 和自行设计的语音识别加速模块(ASIC 模块)为核心的低成本、高性能的嵌入式语音识别系统。该系统配合外围电路,能够独立完成语音识别工作,并且有大幅度的性能提升,从而使嵌入式语音识别更加方便简洁。以 ARM7作为系统的控制内核,语音识别加速模块负责完成隐含马尔可夫模型识别算法中运算量最大的 Ma-halanobis 距离运算部分。该系统具有低成本、高性能、高通用性、可裁剪性强等特点。 展开更多
关键词 嵌入式语音识别 MCU+ASIC MAHALANOBIS距离
在线阅读 下载PDF
基于调度电话语音信息的调度命令智能生成方法 被引量:10
18
作者 吴佳佳 彭其渊 鲁工圆 《铁道运输与经济》 北大核心 2021年第4期105-111,134,共8页
目前行车调度命令的拟写流程模式化、工作量大,为减轻调度员的工作强度,对调度命令智能生成方法进行研究。在阐述调度命令内容及发布流程的基础上,分析调度命令智能生成方法的总体架构,提出由调度电话语音识别、调度命令模板匹配、调度... 目前行车调度命令的拟写流程模式化、工作量大,为减轻调度员的工作强度,对调度命令智能生成方法进行研究。在阐述调度命令内容及发布流程的基础上,分析调度命令智能生成方法的总体架构,提出由调度电话语音识别、调度命令模板匹配、调度命令参数的抽取与填写3个模块构成的基于调度电话语音信息的调度命令智能生成方法,并设计3个实验以对比验证方法的有效性。结果表明,该调度命令智能生成方法可实现调度电话向调度命令的直接转化,提高调度命令发布的效率与准确性。 展开更多
关键词 铁路运输 调度命令生成 文本相似度 调度电话 语音识别
在线阅读 下载PDF
基于多传感器的智能温控风扇调速控制器设计 被引量:4
19
作者 李圣普 王小辉 +1 位作者 李阳 许代代 《电声技术》 2015年第7期26-29,共4页
设计了一个基于温度、光照度和人体红外等检测信息,结合语音控制模块对风扇工作状态进行智能控制的控制器,解决风扇因昼夜不同、温度不同时的自动控制问题。从系统总体设计、温控调速的硬件设计、智能温控的软件设计等方面阐述了基于多... 设计了一个基于温度、光照度和人体红外等检测信息,结合语音控制模块对风扇工作状态进行智能控制的控制器,解决风扇因昼夜不同、温度不同时的自动控制问题。从系统总体设计、温控调速的硬件设计、智能温控的软件设计等方面阐述了基于多传感器的单片机智能控制风扇系统。经实验运行证明,该多模式智能风扇控制器设计合理、节能环保,有较好的应用前景。 展开更多
关键词 自动识别 多传感器 语音控制 温控调速
在线阅读 下载PDF
基于加权有限状态机的动态匹配词图生成算法 被引量:4
20
作者 郭宇弘 黎塔 +2 位作者 肖业鸣 潘接林 颜永红 《电子与信息学报》 EI CSCD 北大核心 2014年第1期140-146,共7页
由于现有的加权有限状态机(WFST)解码网络没有精确词尾标记,导致当前已有的词图生成算法不含精确的词尾时间点,或者仅是状态、音素级别的词图,无法应用到关键词检索中。该文提出在WFST静态解码器下的语音识别词图生成算法。首先从理论... 由于现有的加权有限状态机(WFST)解码网络没有精确词尾标记,导致当前已有的词图生成算法不含精确的词尾时间点,或者仅是状态、音素级别的词图,无法应用到关键词检索中。该文提出在WFST静态解码器下的语音识别词图生成算法。首先从理论上分析了WFST解码音素图和词图的可转换关系,然后提出了字典的动态音素匹配方法解决了WFST网络中词尾时间点对齐的问题,最后通过令牌传递的遍历方法生成了词图。同时,考虑到计算量优化,在令牌传递过程中引入了剪枝算法,使音素图转词图的耗时不到解码耗时的3%。得到的词图,不仅可以用于语言模型重打分,由于含有精确的词尾时间点,还可以直接应用到关键词检索系统中。实验结果表明,该文的词图生成算法具有较高的计算效率;和已有动态解码器的词图相比,词图中包含更多解码信息,在大词汇连续语音识别的重打分结果和关键词检索中都能取得更好的性能。 展开更多
关键词 自动语音识别 加权有限状态机 词图生成 关键词检索
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部