期刊文献+
共找到18篇文章
< 1 >
每页显示 20 50 100
基于DCOM的分布式电话语音识别系统
1
作者 刘鹏 田野 王作英 《计算机工程与应用》 CSCD 北大核心 2002年第14期4-5,35,共3页
文章讨论了一个分布式电话语音识别系统的设计与实现。首先介绍了系统的框架结构和基于DCOM的进程间通信;然后给出了系统主要模块的功能和实现方法,并讨论了针对分布式系统和语音识别的特点而进行的性能优化。
关键词 dcom 分布式电话语音识别系统 分布式组件对象模型
在线阅读 下载PDF
BP-Bagging模型在光纤陀螺温度补偿中的应用 被引量:11
2
作者 刘元元 杨功流 李思宜 《中国惯性技术学报》 EI CSCD 北大核心 2014年第2期254-259,共6页
为了消除光纤陀螺的温度效应并提高陀螺的精度,BP神经网络模型广泛的应用在光纤陀螺的零偏温度漂移辨识和补偿中。然而,单神经网络模型的泛化能力差,影响模型的预测结果。结合神经网络集成学习的思想,利用Bagging集成技术产生差异大、... 为了消除光纤陀螺的温度效应并提高陀螺的精度,BP神经网络模型广泛的应用在光纤陀螺的零偏温度漂移辨识和补偿中。然而,单神经网络模型的泛化能力差,影响模型的预测结果。结合神经网络集成学习的思想,利用Bagging集成技术产生差异大、预测能力强的个体网络,提升模型的预测能力。建立光纤陀螺零偏温度的BP-Bagging模型,将其应用在温度补偿中。通过对某型光纤陀螺的零偏漂移数据进行仿真,结果表明:BP-Bagging模型相比线性回归模型、单BP神经网络模型的补偿效果更显著,有效改善了陀螺的零偏稳定性能。 展开更多
关键词 光纤陀螺 神经网络集成 BP-Bagging模型 温度补偿
在线阅读 下载PDF
语音识别中的两级MEL域滤波器组维纳滤波方法 被引量:2
3
作者 刘波 李锦宇 +1 位作者 戴礼荣 王仁华 《信号处理》 CSCD 2004年第2期133-137,126,共6页
欧洲电信标准化协会(European Telecommunications Standards Institute,简称ETSI)于2002年10月发布了分布式语音识别的鲁棒性前端标准。该标准参数的鲁棒性远优于MFCC参数。为了能够在低运算资源的设备上实现鲁棒性前端,在ETSI标准的... 欧洲电信标准化协会(European Telecommunications Standards Institute,简称ETSI)于2002年10月发布了分布式语音识别的鲁棒性前端标准。该标准参数的鲁棒性远优于MFCC参数。为了能够在低运算资源的设备上实现鲁棒性前端,在ETSI标准的核心两级维纳滤波算法的基础上,我们提出了一种新方法以提高算法效率。我们首先在Mel域滤波器组幅度上构造维纳滤波器,然后对维纳滤波器系数进行平滑。最后,将维纳滤波器直接应用到Mel域滤波器组幅度上。实验表明,新方法在保持ETSI两级维纳滤波算法出色性能的同时,大大地降低了运算量。 展开更多
关键词 分布式语音识别 鲁棒性 滤波器 维纳滤波
在线阅读 下载PDF
一种适用于说话人识别的改进Mel滤波器 被引量:8
4
作者 项要杰 杨俊安 +1 位作者 李晋徽 陆俊 《计算机工程》 CAS CSCD 2013年第11期214-217,222,共5页
Mel倒谱系数(MFCC)侧重提取语音信号的低频信息,对语音信号的频谱分布特性描述不充分,不能有效区分说话人个性信息。为此,通过分析语音信号各频段所含说话人个性信息的不同,结合Mel滤波器和反Mel滤波器在高低频段的不同特性,提出一种适... Mel倒谱系数(MFCC)侧重提取语音信号的低频信息,对语音信号的频谱分布特性描述不充分,不能有效区分说话人个性信息。为此,通过分析语音信号各频段所含说话人个性信息的不同,结合Mel滤波器和反Mel滤波器在高低频段的不同特性,提出一种适于说话人识别的改进Mel滤波器。实验结果表明,改进Mel滤波器提取的新特征能够获得比传统Mel倒谱系数以及反Mel倒谱系数(IMFCC)更好的识别效果,并且基本不增加说话人识别系统训练和识别的时间开销。 展开更多
关键词 说话人识别 MEL倒谱系数 个性信息 反Mel倒谱系数 频谱分布 语音信号
在线阅读 下载PDF
基于决策边界优化域自适应的跨库语音情感识别 被引量:8
5
作者 汪洋 傅洪亮 +3 位作者 陶华伟 杨静 谢跃 赵力 《计算机应用》 CSCD 北大核心 2023年第2期374-379,共6页
域自适应算法被广泛应用于跨库语音情感识别中;然而,许多域自适应算法在追求减小域差异的同时,丧失了目标域样本的鉴别性,导致其以高密度的形式存在于模型决策边界处,降低了模型的性能。基于此,提出一种基于决策边界优化域自适应(DBODA... 域自适应算法被广泛应用于跨库语音情感识别中;然而,许多域自适应算法在追求减小域差异的同时,丧失了目标域样本的鉴别性,导致其以高密度的形式存在于模型决策边界处,降低了模型的性能。基于此,提出一种基于决策边界优化域自适应(DBODA)的跨库语音情感识别方法。首先利用卷积神经网络进行特征处理,随后将特征送入最大化核范数及均值差异(MNMD)模块,在减小域间差异的同时,最大化目标域情感预测概率矩阵的核范数,从而提升目标域样本的鉴别性并优化决策边界。在以Berlin、eNTERFACE和CASIA语音库为基准库设立的六组跨库实验中,所提方法的平均识别精度领先于其他算法1.68~11.01个百分点,说明所提模型有效降低了决策边界的样本密度,提升了预测的准确性。 展开更多
关键词 跨库语音情感识别 卷积神经网络 决策边界优化 域自适应 特征分布差异
在线阅读 下载PDF
韵律相关的汉语语音识别系统研究 被引量:3
6
作者 倪崇嘉 刘文举 徐波 《计算机应用研究》 CSCD 北大核心 2011年第8期2941-2945,共5页
首先,给出结合韵律信息的系统框架。然后,针对汉语的特点,解决了韵律相关的语音识别系统中建模单元选择、模型训练等问题,并在多空间概率分布隐马尔可夫模型(multiple-space distribution hidden Markov mod-el,MSD-HMM)框架下构建了韵... 首先,给出结合韵律信息的系统框架。然后,针对汉语的特点,解决了韵律相关的语音识别系统中建模单元选择、模型训练等问题,并在多空间概率分布隐马尔可夫模型(multiple-space distribution hidden Markov mod-el,MSD-HMM)框架下构建了韵律相关的语音识别系统。最后,通过语音识别的实验验证了方法的有效性。在"863"测试集上,该方法能够达到76.18%的带调音节识别正确率。 展开更多
关键词 韵律 语音识别 基频 多空间概率分布隐马尔可夫模型(MSD-HMM)
在线阅读 下载PDF
基于分层增长语音活动检测的鲁棒性说话人识别
7
作者 解焱陆 张劲松 +1 位作者 刘明辉 黄中伟 《深圳大学学报(理工版)》 EI CAS 北大核心 2012年第4期328-334,共7页
基于欧洲电信标准化协会颁布的分布式语音识别和前端标准(ETSI-DSR-AFE).针对分布式说话人识别噪声鲁棒性较差的问题,提出一种新的前端处理方法.该方法以似然距离为测度,对语音进行无监督聚类,为减少计算量,采用分层增长(level-building... 基于欧洲电信标准化协会颁布的分布式语音识别和前端标准(ETSI-DSR-AFE).针对分布式说话人识别噪声鲁棒性较差的问题,提出一种新的前端处理方法.该方法以似然距离为测度,对语音进行无监督聚类,为减少计算量,采用分层增长(level-building)方法进行逐层分割,从而准确找出语音和静音的边界点.实验结果表明,用该方法改进ETSI-DSR-AFE标准后,信噪比在大于0 dB时,说话人辨认系统识别率相对改进了18.9%,相对原有的Mel频率倒谱系数(Mel-frequenly Ceptral coefficients,MFCC)系统识别率改进了60.7%. 展开更多
关键词 语音信号处理 说话人识别 分布式语音识别 分层增长 语音活动检测 似然距离
在线阅读 下载PDF
高斯样本模式混淆度分析及其在语音识别中的应用
8
作者 王作英 赵蕤 《计算机工程与应用》 CSCD 北大核心 2002年第18期11-13,共3页
文章介绍了一种非统计地分析具有高斯分布样本的模式之间混淆度的方法,并将此种方法应用在语音识别中。实验表明,由此种方法得到的模式之间的混淆度信息对提高模式识别系统的性能有很大的帮助。
关键词 高斯样本模式 混淆度分析 语音识别 模式识别 高斯分布 贝叶斯判别准则 语音信号处理
在线阅读 下载PDF
集成语种辨识的中英文LVCSR系统
9
作者 孙健 王作英 《计算机工程与设计》 CSCD 北大核心 2007年第8期1931-1933,共3页
为了在未知一段语音所属语言种类的情况下将其转换为正确的字符序列,将语种辨识(language identification,LID)同语音识别集成在一起建立了中、英文大词汇量连续语音识别(large vocabulary continuous speech recognition,LVCSR)系统。... 为了在未知一段语音所属语言种类的情况下将其转换为正确的字符序列,将语种辨识(language identification,LID)同语音识别集成在一起建立了中、英文大词汇量连续语音识别(large vocabulary continuous speech recognition,LVCSR)系统。为了在中、英文连续语音识别系统中能够尽早的对语音所属的语言种类做出判决以便进行识别,从而降低解码的计算量,对语种辨识过程中的语种剪枝进行了研究,表明采用合理的语种剪枝门限在不降低系统性能的情况下,可以有效的降低系统的计算量及识别时间。 展开更多
关键词 连续语音识别 语种辨识 段长分布 非齐次隐含马尔科夫模型 语种剪枝
在线阅读 下载PDF
HMM识别孤立词的研究与实现
10
作者 丁纪凯 《中国纺织大学学报》 CSCD 1990年第3期60-68,共9页
本文介绍了隐式 Markov 模型(简称 HMM)识别语音的基本原理,对在训练孤立词模型过程中采用的 Baum-Welch 算法和 Viterbi 算法进行了研究,导出了参数估计的整套算式,提出了解决 HMM 在计算机上实现时出现的问题的方法及其实现算式。作者... 本文介绍了隐式 Markov 模型(简称 HMM)识别语音的基本原理,对在训练孤立词模型过程中采用的 Baum-Welch 算法和 Viterbi 算法进行了研究,导出了参数估计的整套算式,提出了解决 HMM 在计算机上实现时出现的问题的方法及其实现算式。作者将 HMM 应用于汉语数字的识别,进行了不同算法的比较和不同初值条件的试验,给出了相应的识别结果。 展开更多
关键词 微机 语音识别 孤立词 HMM法
在线阅读 下载PDF
面向变电站智能运检的声音谱特征语音识别方法 被引量:5
11
作者 高宝明 孙国繁 +3 位作者 冯俊杰 段雨松 刘霄 杨爱民 《高压电器》 CAS CSCD 北大核心 2023年第11期40-47,共8页
语音识别是变电站智能运检中关键的人机交互技术。然而,由于生产环境中存在使用专业术语多和噪声大的问题,传统的语音识别方法的效果受限。为此,文中提出了一种基于声音谱特征的语音识别方法。通过融合MFCC与CQT谱,形成一种基于声音谱... 语音识别是变电站智能运检中关键的人机交互技术。然而,由于生产环境中存在使用专业术语多和噪声大的问题,传统的语音识别方法的效果受限。为此,文中提出了一种基于声音谱特征的语音识别方法。通过融合MFCC与CQT谱,形成一种基于声音谱的特征参数,通过对参数分布的估计,能够有效地降低语音信息中的噪声干扰。为提升语音识别性能,文中设计一个端到端的语音识别模型。该模型基于卷积神经网络(CNN),并融合了CTC和注意力机制。CNN网络能够有效地捕捉语音数据中的局部模式和结构信息,而CTC和注意力机制在解码过程中起到关键作用。文中使用Aurora、Aishell以及运检语音数据集进行了实验评估,比较了语音降噪、语音识别同传统方法的效果。实验结果表明,所提出的语音识别模型取得了显著的性能提升,可为相关领域的研究和应用提供有价值的参考。 展开更多
关键词 智能运检 语音识别 声音谱特性 分布估计 卷积神经网络
在线阅读 下载PDF
利用空间相关性的改进HMM模型 被引量:3
12
作者 苏腾荣 吴及 +1 位作者 王作英 吕萍 《计算机工程与设计》 CSCD 北大核心 2010年第5期1023-1026,共4页
语音识别领域中所采用的经典HMM模型,忽略了语音信号间的相关信息。针对这一问题,利用语音信号的空间相关性对经典HMM模型进行补偿,得到一种改进模型。该方法通过空间相关变换,描述了当前语音特征与历史数据之间的空间相关性,从而对联... 语音识别领域中所采用的经典HMM模型,忽略了语音信号间的相关信息。针对这一问题,利用语音信号的空间相关性对经典HMM模型进行补偿,得到一种改进模型。该方法通过空间相关变换,描述了当前语音特征与历史数据之间的空间相关性,从而对联合状态输出分布进行建模。改进模型的解码算法利用空间相关性变换的参数更新算法在经典HMM的解码算法基础上得到。实验结果表明,上述方法在说话人无关连续语音识别系统上获得了明显的性能改进。 展开更多
关键词 语音识别 空间相关性 隐马尔可夫模型 状态输出独立假设 解码算法
在线阅读 下载PDF
汉语连续语音识别系统与知识导引的搜索策略研究 被引量:1
13
作者 宋战江 郑方 +2 位作者 徐明星 武健 吴文虎 《自动化学报》 EI CSCD 北大核心 2000年第4期470-477,共8页
从整体上介绍了汉语连续语音识别系统的基本原理 ,并重点对声学和语言两个层面的建模与搜索策略进行了分析 .在对传统帧同步搜索算法进行研究的基础上 ,提出了基于统计知识的帧同步搜索算法 SKB- FSS.它包含了三个主要的功能层次 :基于... 从整体上介绍了汉语连续语音识别系统的基本原理 ,并重点对声学和语言两个层面的建模与搜索策略进行了分析 .在对传统帧同步搜索算法进行研究的基础上 ,提出了基于统计知识的帧同步搜索算法 SKB- FSS.它包含了三个主要的功能层次 :基于归并的音节切分自动机产生确定的搜索边界点 ,由统计得到的差分状态驻留信息控制搜索过程中的状态转移 ,利用词搜索树控制音节候选的扩展规模并根据动态前向预测的方法进行合理而及时的路径剪枝 .实验结果验证了该搜索策略的有效性 . 展开更多
关键词 汉语连续语音识别系统 知识导引 语言处理
在线阅读 下载PDF
用于分布式识别的语音参数的提取和性能分析 被引量:1
14
作者 郑清 杨震 《南京邮电学院学报(自然科学版)》 2003年第2期31-34,共4页
主要研究用于分布式语音识别(DSR)的语音参数的提取方法以及参数性能分析。以前所用到的语音参数大部分是LPC倒谱参数,但其抗噪声性能较差。文中主要讨论了MEL倒谱参数,并在移动通信环境下,比较了两者的性能。
关键词 分布式语音识别 DSR Q-CELP语音编码 Mel倒谱参数 LPC倒谱参数
在线阅读 下载PDF
基于语音识别的智能家居物联网系统 被引量:17
15
作者 余亚东 李春江 杨丽 《计算机应用》 CSCD 北大核心 2022年第S01期391-394,共4页
针对中国逐渐步入老龄化时代,传统交互方式的物联网系统操作繁杂、不够人性化的问题,提出了一种基于语音识别和物联网技术智能融合的新型物联网系统。首先,通过引入内置处理器的语音识别模块,不仅实现了传统语音识别,还实现了语音的云... 针对中国逐渐步入老龄化时代,传统交互方式的物联网系统操作繁杂、不够人性化的问题,提出了一种基于语音识别和物联网技术智能融合的新型物联网系统。首先,通过引入内置处理器的语音识别模块,不仅实现了传统语音识别,还实现了语音的云端传输,突破了主控芯片的计算能力和储存能力低的瓶颈;然后,利用物联网技术把复杂的算法置换到云端去执行,在语音识别方面有质的变化,结合云端分布式储存的特点,能够分门别类地建立用户的语音数据库,在用户习惯学习时提供大量的数据基础;最后,根据大量的数据基础,逐渐通过学习能力建立属于用户个人的语音识别库。通过实验对所提出的智能融合式物联网系统在语音识别的准确度、计算能力、语音交互的智能化程度等方面进行了有效性验证。实验结果表明,在语音识别精度方面随着距离增加至10 m以上,所提系统的准确度仍可达到70%以上,语音数据计算能力方面提高了31倍,同时在语音交互的智能化程度方面性能更优。该系统为老年人使用物联网交互提供了便利。 展开更多
关键词 融合式物联网系统 语音识别 云端算法 分布式储存 语音交互 智能化
在线阅读 下载PDF
语音使能的多模态输入Web应用系统设计
16
作者 崔崧 何量 刘允才 《计算机工程》 CAS CSCD 北大核心 2003年第11期119-122,共4页
主要研究了语音使能的多模态输入Web应用的系统架构和运行机制?该系统在传 统Web交互模式的基础上引入了分布式语音识别功能模块,使手持移动设备的用户可以同时 使用语音和其他传统输入方式获得无线因特网的信息服务?
关键词 多模态人机界面 分布式语音识别 语音特征 WEB XML
在线阅读 下载PDF
基于本地蒸馏联邦学习的鲁棒语音识别技术 被引量:4
17
作者 柏财通 崔翛龙 李爱 《计算机工程》 CAS CSCD 北大核心 2022年第10期103-109,共7页
当联邦学习(FL)算法应用于鲁棒语音识别任务时,为解决训练数据非独立同分布(Non-IID)与客户端模型缺乏个性化问题,提出基于个性化本地蒸馏的联邦学习(PLD-FLD)算法。客户端通过上行链路上传本地Logits并在中心服务器聚合后下传参数,当... 当联邦学习(FL)算法应用于鲁棒语音识别任务时,为解决训练数据非独立同分布(Non-IID)与客户端模型缺乏个性化问题,提出基于个性化本地蒸馏的联邦学习(PLD-FLD)算法。客户端通过上行链路上传本地Logits并在中心服务器聚合后下传参数,当边缘端模型测试性能优于本地模型时,利用下载链路接收中心服务器参数,确保了本地模型的个性化与泛化性,同时将模型参数与全局Logits通过下行链路下传至客户端,实现本地蒸馏学习,解决了训练数据的Non-IID问题。在AISHELL与PERSONAL数据集上的实验结果表明,PLD-FLD算法能在模型性能与通信成本之间取得较好的平衡,面向军事装备控制任务的语音识别准确率高达91%,相比于分布式训练的FL和FLD算法具有更快的收敛速度和更强的鲁棒性。 展开更多
关键词 鲁棒语音识别 联邦学习 本地蒸馏 非独立同分布 分布式训练
在线阅读 下载PDF
基于语音技术的分布式光伏交互查询技术 被引量:1
18
作者 向东旭 刘庆节 +2 位作者 吴丹 付俊强 傅琳 《农村电气化》 2022年第1期46-47,共2页
在我国大力发展新能源的过程中,分布式光伏因其具有环境友好、地域局限性小、投资少等优点受到广泛重视。但分布式光伏的运行数据分布在各自不同的系统中,在接入电网运行时对调度人员的数据工作带来极大的困难。利用语音技术可以进行语... 在我国大力发展新能源的过程中,分布式光伏因其具有环境友好、地域局限性小、投资少等优点受到广泛重视。但分布式光伏的运行数据分布在各自不同的系统中,在接入电网运行时对调度人员的数据工作带来极大的困难。利用语音技术可以进行语音识别与语言解析、数据搜索与输出等,实现更高效快捷的获取数据,且通过多种呈现方式,为电网运行计算提供全面的数据支持。 展开更多
关键词 分布式光伏 语音识别 数据查询
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部