期刊文献+
共找到54篇文章
< 1 2 3 >
每页显示 20 50 100
基于EfficientNetV2-RetNet的端到端中文管制语音识别 被引量:1
1
作者 梁海军 常瀚文 +2 位作者 何一民 赵志伟 孔建国 《电讯技术》 北大核心 2025年第2期254-260,共7页
自动语音识别(Automatic Speech Recognition, ASR)技术在空中交通管制(Air Traffic Control, ATC)领域的应用有望提高通信效率、减少人为错误、提升安全性,并促进航空交通管理系统的创新和改进。然而,由于ATC通信通常涉及敏感信息,获... 自动语音识别(Automatic Speech Recognition, ASR)技术在空中交通管制(Air Traffic Control, ATC)领域的应用有望提高通信效率、减少人为错误、提升安全性,并促进航空交通管理系统的创新和改进。然而,由于ATC通信通常涉及敏感信息,获取大量带有标签的ATC语音数据较为困难,这给构建高准确度的ASR系统带来了巨大挑战。基于Retentive Network(RetNet)和迁移学习设计了一种新的端到端ASR框架EfficientNetV2-RetNet-CTC,用于ATC系统。EfficientNetV2的多层卷积结构有助于对语音信号提取更复杂的特征表示。RetNet使用多尺度保持机制学习序列数据上的全局时间动态,可以非常高效地处理长距离依赖性。连接时序分类不用强制对齐标签且标签可变长。此外,迁移学习通过在源任务上学习的知识来改善在目标任务上的性能,解决了民航领域数据资源稀缺的问题且提高了模型的泛化能力。实验结果表明,所设计的模型优于其他基线,在Aishell语料库上预训练的最低词错误率为7.6%和8.7%,在ATC语料库上降至5.6%和6.8%。 展开更多
关键词 空中交通管制 自动语音识别 端到端深度学习 迁移学习
在线阅读 下载PDF
低资源语言自动语音识别中的数据处理与数据增强综述
2
作者 杨健 孙浏 张丽芳 《计算机科学》 北大核心 2025年第8期86-99,共14页
由于标注语音数据不足,端到端自动语音识别(Automatic Speech Recognition,ASR)技术难以直接应用到低资源语言场景,低资源语言ASR也成为NLP领域的热点问题。目前,低资源环境下ASR的研究可以从数据增强和模型改进两方面开展,以低资源语言... 由于标注语音数据不足,端到端自动语音识别(Automatic Speech Recognition,ASR)技术难以直接应用到低资源语言场景,低资源语言ASR也成为NLP领域的热点问题。目前,低资源环境下ASR的研究可以从数据增强和模型改进两方面开展,以低资源语言ASR中的训练数据处理为主要研究对象,重点从数据增强、样本处理、特征工程等角度,对近年来该领域的重要研究成果进行梳理和总结。分析了不同类型的数据增强方案,强调未配对语音和文本的利用,并从特征抽取、嵌入和融合等不同方面对低资源环境下ASR的特征工程进行分析和总结,阐述了低资源语音语料库建设等问题,并对低资源环境下用于语音识别的数据增强技术未来可以进一步深入研究的重要方向进行展望。 展开更多
关键词 低资源 自动语音识别 数据增强 特征表示
在线阅读 下载PDF
面向开源视频的深度学习情报分析系统设计与实现
3
作者 鄢靖昀 姜君 曹秀云 《现代电子技术》 北大核心 2025年第12期167-178,共12页
针对传统视频情报分析中信息提取效率低下的问题,设计一种基于深度学习的人机交互式视频情报分析系统,以满足快速提取大量视频关键情报的需求。系统框架围绕数据采集、存储、处理及应用进行分层设计,采用组件化设计实现功能模块的独立运... 针对传统视频情报分析中信息提取效率低下的问题,设计一种基于深度学习的人机交互式视频情报分析系统,以满足快速提取大量视频关键情报的需求。系统框架围绕数据采集、存储、处理及应用进行分层设计,采用组件化设计实现功能模块的独立运行,并集成基于深度学习的自动语音识别、神经机器翻译、光学字符识别以及大模型文本摘要生成等前沿技术,提供端到端的解决方案,实现全面的视频分析功能。功能测试结果显示,所有模块均能按设计要求正常运行。性能测试结果表明,系统在处理大规模视频数据的实时环境中表现稳定、性能优异,高并发情况下响应时间在3 s以内,支持最多2万并发用户。所设计系统不仅能高效提取视频情报,还拥有直观的用户交互界面,可以提供多样化的情报分析应用服务,并满足大规模用户在视频分析场景下的业务需求。 展开更多
关键词 情报分析 开源视频 深度学习 自动语音识别 神经机器翻译 光学字符识别
在线阅读 下载PDF
基于对比学习的转录文本翻译方法研究
4
作者 王世宁 刘宇宸 宗成庆 《中文信息学报》 北大核心 2025年第4期67-76,共10页
神经机器翻译系统极易受到输入噪声的干扰,特别是在口语翻译场景中,翻译系统的输入来自语音识别模块的输出,而后者不可避免地存在着识别错误,最终影响翻译性能。现有方法多采用错误修正和翻译的级联式策略以减少识别错误造成的影响,但... 神经机器翻译系统极易受到输入噪声的干扰,特别是在口语翻译场景中,翻译系统的输入来自语音识别模块的输出,而后者不可避免地存在着识别错误,最终影响翻译性能。现有方法多采用错误修正和翻译的级联式策略以减少识别错误造成的影响,但易导致系统时延增长,且可能引入额外的噪声。该文提出了一种基于对比学习的鲁棒神经机器翻译方法,将包含识别错误的样本作为正例,通过句子级别或词级别的对比损失,分别从整体和局部两种不同角度拉近含噪声文本与干净文本在表示空间中的距离,以降低识别错误对文本表示的影响。同时,该文设计了多种精细化的错误合成方法以模拟更加真实的语音识别错误。在英汉双向多个数据集上的实验表明,该文所提出的方法可以有效降低语音识别错误对翻译模型的影响,提高模型的鲁棒性和翻译性能。 展开更多
关键词 对比学习 鲁棒神经机器翻译 语音识别错误
在线阅读 下载PDF
WTSTC:基于广域时频采样和时序感知卷积的语音识别模型
5
作者 刘立波 王詠森 +1 位作者 刘倩 邓箴 《中文信息学报》 北大核心 2025年第4期161-171,共11页
针对现有语音识别模型存在的时频特征感受野不足、时序特征损失及模型结构扩展性较差等方面的问题,该文提出基于广域时频采样和时序感知卷积的语音识别模型WTSTC,在保证模型轻量化的同时提升识别精度。首先,通过结合RepLKNet模块和传统... 针对现有语音识别模型存在的时频特征感受野不足、时序特征损失及模型结构扩展性较差等方面的问题,该文提出基于广域时频采样和时序感知卷积的语音识别模型WTSTC,在保证模型轻量化的同时提升识别精度。首先,通过结合RepLKNet模块和传统卷积下采样模块,构建了一种新型的广域时频采样模块,增大感受野的同时更加关注输入音频序列的时频特征;其次,设计了时序感知卷积模块,通过实现应用于时序特征的一维全局响应归一化层取代原有的Batch Norm以增强通道间的特征竞争,避免了归一化过程中语音信号的时序特征信息丢失的潜在可能;最后,在模型内部各模块间引入Droppath正则化方法,通过在模块间随机跳跃样本避免模型对特定模块的依赖。实验结果表明,该方法在中文公共数据集AISHELL-1的测试集上字错率为4.27%,在更大规模英文公共数据集Librispeech的测试集clean和other上的词错率分别为2.2%和5.1%。在保持相同训练策略的前提下,该方法相较现有先进模型展现出更优异的性能。 展开更多
关键词 自动语音识别 端到端 CONFORMER RepLKNet
在线阅读 下载PDF
基于IMS的智能多媒体通信技术研究
6
作者 焦立彬 王明 +1 位作者 马文学 王建超 《无线电通信技术》 北大核心 2025年第4期815-822,共8页
针对指挥调度业务多样化、指挥移动化、通信智能化以及多制式融合通信的需求,开展基于IP多媒体子系统(IP Multimedia Subsystem,IMS)的智能多媒体通信技术研究。提出了基于IMS的智能多媒体通信系统,从系统技术架构和应用场景设计、媒体... 针对指挥调度业务多样化、指挥移动化、通信智能化以及多制式融合通信的需求,开展基于IP多媒体子系统(IP Multimedia Subsystem,IMS)的智能多媒体通信技术研究。提出了基于IMS的智能多媒体通信系统,从系统技术架构和应用场景设计、媒体控制、会议混音、视频会议、跨网短数据、智能语音与基础管理等业务单元设计实现等方面进行了详细阐述。系统基于IMS、语音识别、融合通信、网页实时通信(Web Real-Time Communication,WebRTC)等关键技术,实现不同制式、不同网络环境下的通信系统有效整合、指挥调度统一接口及通信业务全融合,在应急指挥和电力调度等多个场景示范应用,为融合指挥和智能调度提供了有力的通信支撑,可有效提升协同指挥效率。 展开更多
关键词 多媒体通信 IP多媒体子系统 语音识别 融合通信 会议混音 跨网短数据
在线阅读 下载PDF
面向管制语音识别系统的性能评价方法 被引量:1
7
作者 潘卫军 王梓璇 +1 位作者 蒋培元 王壮 《科学技术与工程》 北大核心 2024年第33期14278-14286,共9页
目前,随着空中交通管理领域的发展,越来越多的人工智能技术运用到管制领域。其中自动语音识别技术被用于管制指令纠错、复诵一致性检验等方面,用于提升飞行安全和效率。为了解决自动语音识别系统的性能参差不齐的问题,提出了一种面向管... 目前,随着空中交通管理领域的发展,越来越多的人工智能技术运用到管制领域。其中自动语音识别技术被用于管制指令纠错、复诵一致性检验等方面,用于提升飞行安全和效率。为了解决自动语音识别系统的性能参差不齐的问题,提出了一种面向管制语音识别系统的性能评价方法,对3个待测系统进行了评价与分析。首先,按照一定的管制场景比例收集管制语音并进行数据标注,建立管制语音识别系统测试语料库;其次,设计管制语音识别系统评价指标体系,并通过层次分析法计算指标权重;最后,提出并训练3个待测管制语音识别系统用于评价分析。结果表明,通过该评价方法可以对管制语音识别系统进行全面的评价以及分析不同管制场景下系统的表现情况,并能够根据不同的管制场景提出性能改进建议。该方法提供了一种直观的评价管制语音识别系统的途径,有望为未来的研究提供有力的指导。 展开更多
关键词 自动语音识别 空中交通管制 性能评价 层次分析法
在线阅读 下载PDF
类别条件生成对抗网络的语音对抗样本生成方法 被引量:2
8
作者 于振华 胡旭飞 叶鸥 《西安交通大学学报》 EI CAS CSCD 北大核心 2024年第12期153-164,共12页
针对现有面向自动语音识别系统的对抗攻击方法难以捕捉不同语音尺度之间的相关性、导致攻击成功率低的问题,提出一种类别条件生成对抗网络的语音对抗样本生成方法。通过目标标签映射模块,将攻击目标标签转化为独热向量,作为条件输入到... 针对现有面向自动语音识别系统的对抗攻击方法难以捕捉不同语音尺度之间的相关性、导致攻击成功率低的问题,提出一种类别条件生成对抗网络的语音对抗样本生成方法。通过目标标签映射模块,将攻击目标标签转化为独热向量,作为条件输入到构建的类别条件生成对抗网络中,以此控制语音样本类别的生成。该类别条件生成对抗网络中的生成器,采用设计的NReSidual U-block网络模块与U-Net相融合,可以更好地学习不同时间尺度的语音特征,以及提升语音特征的表示能力,从而可以针对特定语音类别生成对抗样本;判别器采用卷积块和全连接层相结合的网络结构,将错误损失通过梯度反向传播至生成器,能有效保留语音信号的时序信息,并解决数据分布不稳定问题。在通用的谷歌命令数据集和音乐流派数据集上进行实验,结果表明,所提语音对抗样本生成方法的攻击成功率与主流方法相比,分别提高了3.47%、5.1%,平均信噪比提升了3.2、1.49 dB,该方法具有较好的攻击效果和语音质量。 展开更多
关键词 自动语音识别系统 生成对抗网络 对抗攻击 语音对抗样本生成 标签映射
在线阅读 下载PDF
复杂真实环境下的调度电话转录算法研究
9
作者 詹丛茵 鲁工圆 +2 位作者 高辉 钱立 陈历泉 《铁道运输与经济》 北大核心 2024年第4期83-93,100,共12页
调度电话的应答是调度员日常工作的重要部分,也是事故回放审查的重要依据。为了提高事故分析及回放审查的效率,为调度指挥智能化打下基础,提出一种基于注意力机制及连接时序分类联合训练的调度电话转录算法,旨在提高复杂现实环境中调度... 调度电话的应答是调度员日常工作的重要部分,也是事故回放审查的重要依据。为了提高事故分析及回放审查的效率,为调度指挥智能化打下基础,提出一种基于注意力机制及连接时序分类联合训练的调度电话转录算法,旨在提高复杂现实环境中调度电话的转录精确率及稳定性。通过在公开数据上添加调度大厅噪音来模拟现场环境,从而测试不同信噪比条件下算法的转录性能。在0 dB、1 dB、5 dB、10 dB的信噪比条件下测试转录错字率,结果分别是17.37%,16.48%,12.46%和9.69%,证明算法在强噪声环境下依旧能够保持稳定。算法包含半监督训练,实验表明,在小规模数据上,半监督训练相较于有监督训练可保证1%~2%的错字率降低。最后,算法在调度电话数据集上进行测试,并取得87.39%的关键字转录正确率。 展开更多
关键词 铁路运输 调度电话转录 多任务训练 铁路调度指挥 半监督训练 自动语音识别
在线阅读 下载PDF
新闻视频结构化浏览与标注系统 被引量:5
10
作者 刘安安 李锦涛 +3 位作者 张勇东 唐胜 杨兆选 吴佳鹏 《计算机工程》 CAS CSCD 北大核心 2009年第1期33-35,共3页
阐述一种新颖的新闻视频结构化浏览和标注系统。应用基于时空切片分析的新闻主播检测方法和基于颜色直方图的镜头分割方法实现新闻视频的结构化。通过自动语音识别技术和特定语义概念模型的建立实现了对主播场景的文本信息标注和对新闻... 阐述一种新颖的新闻视频结构化浏览和标注系统。应用基于时空切片分析的新闻主播检测方法和基于颜色直方图的镜头分割方法实现新闻视频的结构化。通过自动语音识别技术和特定语义概念模型的建立实现了对主播场景的文本信息标注和对新闻故事镜头的语义概念标注。该系统有利于用户根据个人爱好进行新闻视频的浏览和编辑,有效实现新闻视频的索引和浏览。 展开更多
关键词 新闻 时空切片 语义概念 自动语音识别
在线阅读 下载PDF
视觉语言——唇读综述 被引量:31
11
作者 姚鸿勋 高文 +1 位作者 王瑞 郎咸波 《电子学报》 EI CAS CSCD 北大核心 2001年第2期239-246,共8页
本文介绍了目前唇读研究的现状与发展水平 ,详细阐述了唇读研究的内容和方法 ,以及唇读研究的意义 ,旨在引起大家对此新兴研究方向的关注与兴趣 ,从而积极参与对唇读问题的研究 。
关键词 唇读 自动语音识别 手语识别 情感计算 视觉语言
在线阅读 下载PDF
汽车语控智能电器系统 被引量:6
12
作者 张新丰 林凯 +2 位作者 刘旺 杨殿阁 连小珉 《汽车工程》 EI CSCD 北大核心 2007年第7期601-605,共5页
提出一种语音控制汽车智能电器系统的总体结构框架,包括语音识别和驾驶员意图识别的运算平台及汽车智能电器系统。在车载环境下,利用规范模式和有限状态机理论对驾驶员的自然语言进行分析,达到意图识别和语音控制的目的。引入抗干扰设... 提出一种语音控制汽车智能电器系统的总体结构框架,包括语音识别和驾驶员意图识别的运算平台及汽车智能电器系统。在车载环境下,利用规范模式和有限状态机理论对驾驶员的自然语言进行分析,达到意图识别和语音控制的目的。引入抗干扰设计方法后系统对驾驶员意图识别的正确率有明显提高。最后通过试验系统验证了利用驾驶员语言进行汽车电器控制的可行性。 展开更多
关键词 语音控制 自动语音识别 驾驶员意图识别 智能电器系统
在线阅读 下载PDF
多特征融合的英语口语考试自动评分系统的研究 被引量:11
13
作者 李艳玲 颜永红 《电子与信息学报》 EI CSCD 北大核心 2012年第9期2097-2102,共6页
该文主要针对大规模英语口语考试自动评分系统的问答题型,采用多特征融合的方法进行评分。以语音识别文本作为研究对象,提取了3类特征进行评分。这3类特征分别是:相似度特征、句法特征和语音特征。总共9个特征从不同方面描述了考生回答... 该文主要针对大规模英语口语考试自动评分系统的问答题型,采用多特征融合的方法进行评分。以语音识别文本作为研究对象,提取了3类特征进行评分。这3类特征分别是:相似度特征、句法特征和语音特征。总共9个特征从不同方面描述了考生回答与专家评分之间的关系。在相似度特征中,改进了Manhattan距离作为相似度。同时提出了基于编辑距离的关键词覆盖率的特征,充分考虑了识别文本中存在的单词变异现象,为给考生一个客观公平的分数提供依据。所有提取的特征利用多元线性回归模型进行融合,得到机器评分。实验结果表明,提取的特征对机器评分是十分有效的,并且在以考生为单位的系统评分性能达到了专家评分性能的98.4%。 展开更多
关键词 自动语音识别 自动评分 特征选择 相似度 句法树
在线阅读 下载PDF
基于语音交互功能的医疗服务机器人控制系统设计 被引量:6
14
作者 毛丽民 卢振利 +1 位作者 谢新明 浦宇欢 《高技术通讯》 CAS CSCD 北大核心 2014年第7期745-751,共7页
根据老年人、残疾人的实际需求,设计了医疗服务型机器人移动本体和6自由度机械手臂,搭建了以简化隐式马科夫模型为基础的自动语音辨识控制系统。该控制系统通过人机交互系统的语音命令与键盘指令,可控制机器人运行到指定位置,控制机械... 根据老年人、残疾人的实际需求,设计了医疗服务型机器人移动本体和6自由度机械手臂,搭建了以简化隐式马科夫模型为基础的自动语音辨识控制系统。该控制系统通过人机交互系统的语音命令与键盘指令,可控制机器人运行到指定位置,控制机械手抓取物体,实现机器人的避障功能和座椅、病床两模式的自主切换。针对典型医疗服务需求,对所设计的医疗服务机器人进行了实验,实验结果表明,该机器人在人机交互指令控制下能很好地实现到达指定位置、抓取物体、避障和病床/座椅模式切换,不仅易于操作,而且性能稳定,语音系统对命令的识别率达90%以上,从而验证了该医疗服务型机器人控制系统设计的可行性和有效性。 展开更多
关键词 自动语音辨识(asr) 医疗服务机器人(MSR) 人机交互(HRI) 隐式马尔科夫模型(HMM) 机械手臂
在线阅读 下载PDF
用于自动语音识别系统的切换语音功率谱估计算法 被引量:4
15
作者 刘金刚 周翊 +1 位作者 马永保 刘宏清 《计算机应用》 CSCD 北大核心 2016年第12期3369-3373,3384,共6页
针对语音识别系统在噪声环境下不能保持很好鲁棒性的问题,提出了一种切换语音功率谱估计算法。该算法假设语音的幅度谱服从Chi分布,提出了一种改进的基于最小均方误差(MMSE)的语音功率谱估计算法。然后,结合语音存在的概率(SPP),推导出... 针对语音识别系统在噪声环境下不能保持很好鲁棒性的问题,提出了一种切换语音功率谱估计算法。该算法假设语音的幅度谱服从Chi分布,提出了一种改进的基于最小均方误差(MMSE)的语音功率谱估计算法。然后,结合语音存在的概率(SPP),推导出改进的基于语音存在概率的MMSE估计器。接下来,将改进的MSME估计器与传统的维纳滤波器结合。在噪声干扰比较大时,使用改进的MMSE估计器来估计纯净语音的功率谱,当噪声干扰较小时,改用传统的维纳滤波器以减少计算量,最终得到用于识别系统的切换语音功率谱估计算法。实验结果表明,所提算法相比传统的瑞利分布下的MMSE估计器在各种噪声的情况下识别率平均提高在8个百分点左右,在去除噪声干扰、提高识别系统鲁棒性的同时,减小了语音识别系统的功耗。 展开更多
关键词 自动语音识别系统 鲁棒性 最小均方误差 语音存在概率 功率谱估计 维纳滤波器
在线阅读 下载PDF
语音大数据信息处理架构及关键技术研究 被引量:6
16
作者 杨震 徐敏捷 +2 位作者 刘璋峰 秦达 姚晓辉 《电信科学》 北大核心 2013年第11期1-5,共5页
针对如何从音频信息中获得有商业价值的信息这一大数据研究的重要方向,首先分析了大数据的基础技术特性、涉及的技术,然后分析了语音识别的基本技术环节,最后结合大数据信息处理架构,给出了语音识别技术与大数据相结合的应用开发技术架... 针对如何从音频信息中获得有商业价值的信息这一大数据研究的重要方向,首先分析了大数据的基础技术特性、涉及的技术,然后分析了语音识别的基本技术环节,最后结合大数据信息处理架构,给出了语音识别技术与大数据相结合的应用开发技术架构及应用流程。 展开更多
关键词 自然语言处理架构 大数据 自动语音识别
在线阅读 下载PDF
唇读识别中的基本口型分类 被引量:3
17
作者 柴秀娟 姚鸿勋 +1 位作者 高文 王瑞 《计算机科学》 CSCD 北大核心 2002年第2期130-133,共4页
1引言自然人机交互方式使得人同计算机的交流不再局限于键盘、鼠标等外设.而是通过语言及手势、表情、唇动等形体语言来进行,从而使得人机交互变得像人与人之间的交流一样轻松自如.唇读通常被视为说话过程中伴随的辅助信息,它有助于对... 1引言自然人机交互方式使得人同计算机的交流不再局限于键盘、鼠标等外设.而是通过语言及手势、表情、唇动等形体语言来进行,从而使得人机交互变得像人与人之间的交流一样轻松自如.唇读通常被视为说话过程中伴随的辅助信息,它有助于对说话者提供信息的更准确理解.减弱噪音干扰. 展开更多
关键词 唇读识别 口型分类 语音识别 计算机
在线阅读 下载PDF
一个语音信息门户的设计与实现 被引量:4
18
作者 周宽久 曾琳铖曦 李瑶 《计算机工程》 EI CAS CSCD 北大核心 2006年第9期101-103,共3页
语音门户是利用了CTI技术实现电话网与互联网集成的重要部件,支持了用户通过普通电话访问互联网获取信息,是由IVR(Interactive Voice Response)、TTS(Text To Speech)、ASR(Automatic Speech Recognition)、Voice XML 4个子系统组成,该... 语音门户是利用了CTI技术实现电话网与互联网集成的重要部件,支持了用户通过普通电话访问互联网获取信息,是由IVR(Interactive Voice Response)、TTS(Text To Speech)、ASR(Automatic Speech Recognition)、Voice XML 4个子系统组成,该文在一个实用的语音门户系统的基础上,讨论了系统结构以及4个模块的设计实现,系统设计采用面向对象技术、自动机技术将板卡、通道以其语音合成、识别等资源有机集成在一个系统内,方便了系统设计与功能扩充。 展开更多
关键词 语音门户 交互式语音问答 语音合成 语音识别 VOICE XML
在线阅读 下载PDF
一种基于语义分析的汉语语音识别纠错方法 被引量:2
19
作者 韦向峰 张全 熊亮 《计算机科学》 CSCD 北大核心 2006年第10期152-155,共4页
汉语语音识别的研究越来越重视与语言处理的结合,语音识别已经不是单纯的语音信号处理。N-gram语言模型应用到语音识别系统中,大大增强了系统的正确率和稳定性,但它也有其自身的局限性,使得语音识别出现许多语法和语义的错误结果。本文... 汉语语音识别的研究越来越重视与语言处理的结合,语音识别已经不是单纯的语音信号处理。N-gram语言模型应用到语音识别系统中,大大增强了系统的正确率和稳定性,但它也有其自身的局限性,使得语音识别出现许多语法和语义的错误结果。本文分析了语音识别产生语音和文字方面的错误的原因和类型,在概念层次网络语言模型的基础上提出了一种基于语句语义分析和混淆音矩阵的语音识别纠错方法。通过三个发音人、5万字的声音语料和216句实验语句的纠错测试,本文的纠错系统在纠正语义搭配型错误方面有比较好的表现,可克服N-gram语言模型带来的一些缺陷。本文提出的纠错方法还可以融合到语音识别系统中,以便更好地为语音识别的纠错处理服务。 展开更多
关键词 语音识别 纠错 语义分析 语言模型 概念层次网络
在线阅读 下载PDF
基于语音识别的汉语发音自动评分系统的设计与实现 被引量:12
20
作者 吕军 曹效英 《计算机工程与设计》 CSCD 北大核心 2007年第5期1232-1235,共4页
语音识别技术的发展使得人与计算机的交互成为可能,针对目前对外汉语中发音教学的不足,在结合了语音识别的相关原理,提出了在对外汉语教学领域中汉语自动发音水平评价系统的设计,详细地描述了系统的结构、功能及流程。介绍了系统实现中... 语音识别技术的发展使得人与计算机的交互成为可能,针对目前对外汉语中发音教学的不足,在结合了语音识别的相关原理,提出了在对外汉语教学领域中汉语自动发音水平评价系统的设计,详细地描述了系统的结构、功能及流程。介绍了系统实现中的关键技术和步骤:动态时间弯折算法、语料库的建立、声韵分割技术以及评价分级标准。通过小范围的试验,表明该系统对留学生汉语发音水平的测试有一定的参考价值。 展开更多
关键词 语音识别 对外汉语 自动评分 动态时间弯折 音素分割
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部