期刊文献+
共找到99篇文章
< 1 2 5 >
每页显示 20 50 100
大词汇量连续语音识别中搜索空间的表示及相关搜索方法的研究进展 被引量:2
1
作者 杨凤芹 孙吉贵 +1 位作者 张长胜 张长海 《计算机科学》 CSCD 北大核心 2008年第2期191-195,共5页
本文综述了近年来大词汇量连续语音识别中搜索空间的表示及相关搜索方法的研究进展,分析了搜索空间的表示及相关搜索方法对语音识别性能产生的影响,并对本领域的研究中存在的问题和未来的发展动向进行了讨论。
关键词 大词汇量连续语音识别 搜索空间 搜索 声学模型 语言模型
在线阅读 下载PDF
汉语大词汇量连续语音识别系统研究进展 被引量:51
2
作者 刘加 《电子学报》 EI CAS CSCD 北大核心 2000年第1期85-91,共7页
本文综述了近年来大词汇量连续语音识别技术进步和发展,描述了大词汇量连续汉语语音识别系统的设计方法.对语音识别系统中的一些关键技术和原理进行了详细地分析和讨论,并对语音识别技术进一步发展中存在的问题和近年语音识别研究发... 本文综述了近年来大词汇量连续语音识别技术进步和发展,描述了大词汇量连续汉语语音识别系统的设计方法.对语音识别系统中的一些关键技术和原理进行了详细地分析和讨论,并对语音识别技术进一步发展中存在的问题和近年语音识别研究发展动向进行了讨论. 展开更多
关键词 语音识别 汉语 大词汇量
在线阅读 下载PDF
高噪声背景下舰船指挥舱大词汇量连续语音识别方法
3
作者 刘雪燕 《舰船科学技术》 北大核心 2019年第8期157-159,共3页
传统的舰船指挥舱大词汇量连续语音识别方法存在着识别错误率高的缺陷,为此提出高噪声背景下舰船指挥舱大词汇量连续语音识别方法研究。对采集的连续语音信号进行预加重和预处理,以预处理后的连续语音信号为基础,采用多通道语音增强方... 传统的舰船指挥舱大词汇量连续语音识别方法存在着识别错误率高的缺陷,为此提出高噪声背景下舰船指挥舱大词汇量连续语音识别方法研究。对采集的连续语音信号进行预加重和预处理,以预处理后的连续语音信号为基础,采用多通道语音增强方法对连续语音信号进行增强,得到纯净连续语音信号估计,采用CDMFCC方法对纯净连续语音信号特征参数进行提取,通过CDHMM方法实现了高噪声背景下舰船指挥舱大词汇量连续语音的识别。通过实验得到,提出的舰船指挥舱大词汇量连续语音识别方法识别错误率比传统方法低了16%,说明提出的舰船指挥舱大词汇量连续语音识别方法识别性能更好。 展开更多
关键词 噪声 背景 舰船 词汇量 连续语音 识别
在线阅读 下载PDF
基于仿生模式识别的小词汇量连续型语音识别的研究 被引量:3
4
作者 王守觉 沈孙园 曹文明 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2006年第B07期1-5,共5页
提出了一种基于仿生模式识别理论的非特定人连续语音关键词识别的新算法.该算法无需对待识别连续语音进行端点检测和分割,通过直接对特征提取后的连续语音进行动态搜索,得到待识别连续语音到各类关键词训练网络的距离随时间变化的曲... 提出了一种基于仿生模式识别理论的非特定人连续语音关键词识别的新算法.该算法无需对待识别连续语音进行端点检测和分割,通过直接对特征提取后的连续语音进行动态搜索,得到待识别连续语音到各类关键词训练网络的距离随时间变化的曲线,通过动态搜索距离曲线上谷值的大小和数目来判断有多少关键词.通过对小词汇量、不同语速条件下的连续语音的测试,得到了良好的识别结果,验证了此方法的有效性. 展开更多
关键词 仿生模式识别 连续语音识别 关键词识别 高维空间点覆盖 词汇量
在线阅读 下载PDF
基于小波分析的大词汇汉语连续语音识别系统鲁棒性的研究 被引量:6
5
作者 颜龙 刘刚 郭军 《中文信息学报》 CSCD 北大核心 2006年第2期60-65,共6页
本文提出一种基于小波分析的大词汇汉语连续语音识别的方法,即采用一维小波变换将原始语音信号进行五层小波分解,然后对各层小波系数进行重构,得到五层语音信号,分别对各层语音信号进行训练,得到各层的声学模型,然后结合语言模型对各层... 本文提出一种基于小波分析的大词汇汉语连续语音识别的方法,即采用一维小波变换将原始语音信号进行五层小波分解,然后对各层小波系数进行重构,得到五层语音信号,分别对各层语音信号进行训练,得到各层的声学模型,然后结合语言模型对各层声学模型的性能进行测试。通过对纯净语音和带噪语音的各层重构语音数据进行测试。结果表明对于含有高斯白噪声的带噪语音,该方法能使系统性能有所提高,但对于粉红噪声,该方法效果不明显。对于含有真实环境噪声的带噪语音,该方法能获得比基线系统更好的性能。 展开更多
关键词 计算机应用 中文信息处理 词汇连续语音识别 小波分析 声学模型
在线阅读 下载PDF
利用CASSANDRA-Ⅰ神经计算机实现有限词汇连续语音识别
6
作者 顾晓东 余道衡 赵鹤鸣 《电子与信息学报》 EI CSCD 北大核心 2002年第7期987-991,共5页
该文提出并讨论了如何用小型神经计算机 CASSANDRA-Ⅰ进行有限词汇非特定人连续语音识别的方法,同时还提出了一种新的基于关键词的句法分析方法.利用 CASSANDRA-Ⅰ小型神经计算机,可满足有限词汇连续语音实时识别的要求;利用基于关键词... 该文提出并讨论了如何用小型神经计算机 CASSANDRA-Ⅰ进行有限词汇非特定人连续语音识别的方法,同时还提出了一种新的基于关键词的句法分析方法.利用 CASSANDRA-Ⅰ小型神经计算机,可满足有限词汇连续语音实时识别的要求;利用基于关键词的句法分析,可提高有限词汇连续语音识别的识别率与识别速度。 展开更多
关键词 有限词汇 连续 语音识别 神经计算机 句法分析
在线阅读 下载PDF
用于连续语音识别的词汇搜索算法
7
作者 许晓斌 林碧琴 +1 位作者 傅秋良 袁保宗 《北方交通大学学报》 CSCD 北大核心 1998年第6期8-12,共5页
给出一种用于连续语音识别的词汇树搜索算法.这种方法基于启发搜索,分为音节层—树搜索、词层—树搜索两个过程.为在提高识别速度的同时不牺牲识别率,上述两个过程采用的是“有限宽度树搜索”.在音节层—树搜索中,根据Nbest... 给出一种用于连续语音识别的词汇树搜索算法.这种方法基于启发搜索,分为音节层—树搜索、词层—树搜索两个过程.为在提高识别速度的同时不牺牲识别率,上述两个过程采用的是“有限宽度树搜索”.在音节层—树搜索中,根据Nbest算法确定允许扩展的有限个音节串.而在词层—树搜索中,根据已得到的允许扩展的音节串确定不同长度的“退回词路径”.这样,每一时刻的最大似然词串可由这些“退回词路径”来确定.这种算法的优点是在搜索不同长度的多音节词的同时,可以减少搜索计算开销和降低对存储空间的需求. 展开更多
关键词 音节层 语音识别 连续语音识别 词汇搜索算法
在线阅读 下载PDF
一种基于高维空间覆盖动态搜索方法的非特定人连续数字语音识别的研究 被引量:7
8
作者 王守觉 潘晓霞 +3 位作者 徐春燕 陈旭 安冬 曹文明 《电子学报》 EI CAS CSCD 北大核心 2005年第10期1790-1793,共4页
本文使用高维空间点分布分析原理,在仿生模式识别高维空间点覆盖原理的基础上,提出了一种基于高维空间点覆盖动态搜索理论的非特定人连续数字语音识别的新算法,这种算法可以不经过端点检测和分割,通过对被识别连续数字语音直接进行动态... 本文使用高维空间点分布分析原理,在仿生模式识别高维空间点覆盖原理的基础上,提出了一种基于高维空间点覆盖动态搜索理论的非特定人连续数字语音识别的新算法,这种算法可以不经过端点检测和分割,通过对被识别连续数字语音直接进行动态搜索,得到被识别语音到各类高维空间覆盖范围的距离随时间变化曲线,通过距离曲线上的极小值点进行识别. 展开更多
关键词 连续语音识别 高维空间点覆盖 非特定人语音识别
在线阅读 下载PDF
连续汉语语音识别中基于归并的音节切分自动机 被引量:10
9
作者 张继勇 sp.cs.tsinghua.edu.cn +7 位作者 郑方 sp.cs.tsinghua.edu.cn 杜术 sp.cs.tsinghua.edu.cn 宋战江 sp.cs.tsinghua.edu.cn 徐明星 sp.cs.tsinghua.edu.cn 《软件学报》 EI CSCD 北大核心 1999年第11期1212-1215,共4页
文章研究并实现了汉语连续语音中的音节自动切分算法─—基于归并的音节切分自动机(merging-basedSyllabledeteCtionautomaton,简称MBSDA)算法.MBSDA算法利用了包括语音的短时能量、过零率和基音周期在内的多种特征参数,把特征参... 文章研究并实现了汉语连续语音中的音节自动切分算法─—基于归并的音节切分自动机(merging-basedSyllabledeteCtionautomaton,简称MBSDA)算法.MBSDA算法利用了包括语音的短时能量、过零率和基音周期在内的多种特征参数,把特征参数高度相似的相邻帧(1帧或若干帧)的语音信号进行“归并(merging)”,形成“归并类似段(mergedsimilarsegment,简称MSS)”,它们被认定属于同一音节的相同状态.这些MSS经过一个包含若干状态的“音节切分自动机(syllabledetectionautomaton,简称SDA)”后,输出音节的切分点.每个确定的切分段中所包合音节个数的范围(rangeofsyllablenumber,简称RSN)也由MBSDA算法给出. 展开更多
关键词 语音识别 归并 音节切分自动机 连续汉语语音
在线阅读 下载PDF
基于连续分布型HMM的汉语连续语音的声调识别方法 被引量:6
10
作者 赵力 邹采荣 吴镇扬 《信号处理》 CSCD 2000年第1期20-23,共4页
本文介绍了基于连续分布型HMM的汉语连续语音声调识别方法,提出了一个适合于汉语连续语音声调识别的特征参数提取和识别方案。通过对汉语连续语音声调特点的分析,选择了8个音节单位的连续分布型HMM作为声调识别用基元模型进行识别试... 本文介绍了基于连续分布型HMM的汉语连续语音声调识别方法,提出了一个适合于汉语连续语音声调识别的特征参数提取和识别方案。通过对汉语连续语音声调特点的分析,选择了8个音节单位的连续分布型HMM作为声调识别用基元模型进行识别试验,识别结果表明,10名话者1070个句子的连续语音声调识别的平均识别率是95.1%。 展开更多
关键词 汉语连续语音 声调识别 基频 语音识别
在线阅读 下载PDF
基于HMM/VQ的认人的中等词表连续语音识别 被引量:4
11
作者 林道发 罗万伯 杨家沅 《电子学报》 EI CAS CSCD 北大核心 1992年第7期59-65,共7页
本文讨论基于隐马尔可夫模型(HMM)和矢量量化(VQ)的连续语音识别方法。用这种方法,对每个单词作成一个HMM,对多个模型组合成的状态转移网络搜索其状态转移的最佳路径,从而实现不预先进行单词切分的连续语音的识别,使用有限态文法约束及... 本文讨论基于隐马尔可夫模型(HMM)和矢量量化(VQ)的连续语音识别方法。用这种方法,对每个单词作成一个HMM,对多个模型组合成的状态转移网络搜索其状态转移的最佳路径,从而实现不预先进行单词切分的连续语音的识别,使用有限态文法约束及其它一些改善识别性能的措施,演示系统能识别特定人的18种英语句式,150个单词,用312个话句(共有2710个单词)进行测试,识别延迟时间为发音时长的62%,发音速度平均为每秒2.32个单词,单词识准率为97.3%。 展开更多
关键词 连续语音 识别 文法分析 HMM
在线阅读 下载PDF
基于归一化算法的噪音鲁棒性连续语音识别 被引量:5
12
作者 刘妍秀 孙一鸣 杨华民 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2015年第3期519-524,共6页
针对归一化方法在连续语音特征曲线调整时存在的问题,提出一种优化解决方案,解决了噪声的不稳定性及不可预测性对语音特征的影响.结果表明,基于该优化方法建立的鲁棒性连续语音识别模型可实现在实验室干净环境和现实噪音环境下同时得到... 针对归一化方法在连续语音特征曲线调整时存在的问题,提出一种优化解决方案,解决了噪声的不稳定性及不可预测性对语音特征的影响.结果表明,基于该优化方法建立的鲁棒性连续语音识别模型可实现在实验室干净环境和现实噪音环境下同时得到较好的识别结果. 展开更多
关键词 归一化 噪音鲁棒性 连续语音识别
在线阅读 下载PDF
连续语音识别中基于Dropout修正线性深度置信网络的声学模型 被引量:4
13
作者 陈雷 杨俊安 +1 位作者 王龙 李晋徽 《声学技术》 CSCD 北大核心 2016年第2期146-154,共9页
大词汇量连续语音识别系统中,为了增强现有声学模型的表征能力、防止模型过拟合,提出一种基于遗失策略(Dropout)修正线性深度置信网络的声学模型构建方法。该方法使用修正线性函数代替传统Logistic函数进行深度置信网络训练,修正线性函... 大词汇量连续语音识别系统中,为了增强现有声学模型的表征能力、防止模型过拟合,提出一种基于遗失策略(Dropout)修正线性深度置信网络的声学模型构建方法。该方法使用修正线性函数代替传统Logistic函数进行深度置信网络训练,修正线性函数更接近生物神经网络的工作方式,增强了模型的表征能力;同时引入Dropout策略对修正线性深度置信网络进行调整,避免节点之间的协同作用,防止网络出现过拟合。文章利用公开语音数据集进行了实验,实验结果证明了所提出的声学模型构建方法相对于传统方法的优越性。 展开更多
关键词 连续语音识别 深度置信网络 修正线性 过拟合 DROPOUT
在线阅读 下载PDF
基于3维空间Viterbi算法的汉语连续语音识别方法 被引量:5
14
作者 赵力 邹采荣 吴镇扬 《电子学报》 EI CAS CSCD 北大核心 2000年第7期67-69,58,共4页
本文提出了基于 3维空间Viterbi算法的汉语连续语音识别方法 .本方法采用 6 0个音素单位的隐马尔可夫模型 (HMM)和 8个声调单位的HMM作为识别用基元模型 .音素基元模型和声调基元模型的识别结果的统合 ,采用音素单位的HMM状态、声调单位... 本文提出了基于 3维空间Viterbi算法的汉语连续语音识别方法 .本方法采用 6 0个音素单位的隐马尔可夫模型 (HMM)和 8个声调单位的HMM作为识别用基元模型 .音素基元模型和声调基元模型的识别结果的统合 ,采用音素单位的HMM状态、声调单位的HMM状态和时间的 3维空间Viterbi算法来实现 .语音声学处理和语音言语处理的结合 ,采用修改型Earley分析法的Top Done型文法分析器和OnePassDP为基础的帧同步识别算法来实现 .在由 10名话者发音的有关旅馆预约指南的识别困难度是 2 7 3的 10 70句子的识别实验中 ,总平均识别率达到 94 4% . 展开更多
关键词 汉语连续语音识别 三维空间 VITERBI算法
在线阅读 下载PDF
汉语连续语音中声调识别的特殊性研究 被引量:2
15
作者 钟金宏 杨善林 蒋俊杰 《小型微型计算机系统》 CSCD 北大核心 2002年第4期470-473,共4页
大词汇连续语音识别是当前语音识别研究的主流 ,探讨其中声调识别的特殊性是一项有意义的工作 .本文从声调获取、语音分割、声调模式和声调识别等四个方面进行了研究 ,通过对现有研究成果的分析和总结 ,并结合自己的研究工作 ,得出了若... 大词汇连续语音识别是当前语音识别研究的主流 ,探讨其中声调识别的特殊性是一项有意义的工作 .本文从声调获取、语音分割、声调模式和声调识别等四个方面进行了研究 ,通过对现有研究成果的分析和总结 ,并结合自己的研究工作 ,得出了若干结论 。 展开更多
关键词 声调识别 基音检测 语音分割 声调模式 汉语连续语音 特殊性 语音识别
在线阅读 下载PDF
汉语连续语音识别中上下文相关的识别单元(三音子)的研究 被引量:4
16
作者 赵庆卫 王作英 陆大 《电子学报》 EI CAS CSCD 北大核心 1999年第6期79-82,117,共5页
本文详细研究了汉语语音识别中如何有效地建立上下文相关的识别单元,以解决连续语音之间的协同发音问题.本文首先利用信息论原理,研究了传统的聚类算法的距离测度,分别是模型分布的散度和模型合并或分裂前后熵的变化值.然后本文提... 本文详细研究了汉语语音识别中如何有效地建立上下文相关的识别单元,以解决连续语音之间的协同发音问题.本文首先利用信息论原理,研究了传统的聚类算法的距离测度,分别是模型分布的散度和模型合并或分裂前后熵的变化值.然后本文提出了基于决策树的聚类方法,它的主要优点是充分利用了语音学知识,聚类后得到的模型可推广性好,尤其适用于集外语料中出现大量的未在训练语料中出现的三音子单元的情况.接着介绍了模型聚类和训练的实验步骤最后,非特定人大词汇量连续语音识别的实验表明,基于决策树的聚类方法所得到的识别单元,当识别集外语料时使系统的误识率降低了7.95%,而基于合并的聚类方法所得到的识别单元只降低了2.63%. 展开更多
关键词 连续语音识别 上下文相关 决策树 聚类算法
在线阅读 下载PDF
汉语连续语音识别中经典HMM的实验评测 被引量:6
17
作者 郝杰 李星 《计算机工程与应用》 CSCD 北大核心 2001年第13期1-4,101,共5页
定量地分析与评价经典隐马尔可夫模型(Hidden Markov Model,HMM)的性能,是汉语连续语音识别研究中尚未解决并且亟需解决的问题。文章构造了基于经典HMM模型的汉语连续语音识别系统。针对语音单元和输出概率... 定量地分析与评价经典隐马尔可夫模型(Hidden Markov Model,HMM)的性能,是汉语连续语音识别研究中尚未解决并且亟需解决的问题。文章构造了基于经典HMM模型的汉语连续语音识别系统。针对语音单元和输出概率这两个自由度上的各种组合,研究了经典HMM模型的复杂度、稳健性、精确性与训练集合的数据量、训练时间、解码效率等特性之间的关系;并且通过实验分析了多候选的构造和剪枝的意义。该文构造的系统与具有国内最高水平的 THEESP系统的识别率相当,所得实验结果和结论为汉语语音识别的深入研究提供了必要的参考和依据。 展开更多
关键词 汉语连续语音识别 经典HMM模型 THEESP系统 语音信号处理
在线阅读 下载PDF
正反向隐马尔可夫模型及其在连续语音识别中的应用 被引量:3
18
作者 王仁华 江辉 《电子学报》 EI CAS CSCD 北大核心 1996年第10期63-68,共6页
本文针对语音信号中客观存在的正、反向依赖特性,明确提出了用条件概率的概念来定量表述语音信号的这种正、反向的马尔可大依赖关系,提出了描述语音信号这种正反向依赖关系的正反向隐马尔可夫模型(HMM),并用实验证明了仅仅利用... 本文针对语音信号中客观存在的正、反向依赖特性,明确提出了用条件概率的概念来定量表述语音信号的这种正、反向的马尔可大依赖关系,提出了描述语音信号这种正反向依赖关系的正反向隐马尔可夫模型(HMM),并用实验证明了仅仅利用语音反向依赖关系语音识别同样也能获得相当可观的识别性能。接着,本文针对孤立字和连续语音两种不同的识别任务,研究了在语音识别中同时利用这两种依赖信息的方法,并提出了一种连续语音识别中的新的搜索算法──正反向分半混合搜索。这种方法利用基于正向HMM的正向Viterbi搜索和基于反向HMM的反向Viterbi搜索的中间结果来有效地结合正反向依赖信息,实验证明正反向分半混合搜索方法确实一致地优于单用任何一种依赖信息的单向搜索识别方法。 展开更多
关键词 语音识别 连续语音识别 HMM模型
在线阅读 下载PDF
低资源少样本连续语音识别最新进展 被引量:4
19
作者 屈丹 杨绪魁 +2 位作者 闫红刚 陈雅淇 牛铜 《郑州大学学报(工学版)》 CAS 北大核心 2023年第4期1-9,共9页
低资源少样本语音识别是目前语音识别行业面临的迫切技术需求。首先,总结了低资源连续语音识别技术的框架技术,重点介绍了低资源语音在特征提取、声学建模和资源扩展等方面的若干关键技术研究进展。其次,在连续语音识别框架技术发展的... 低资源少样本语音识别是目前语音识别行业面临的迫切技术需求。首先,总结了低资源连续语音识别技术的框架技术,重点介绍了低资源语音在特征提取、声学建模和资源扩展等方面的若干关键技术研究进展。其次,在连续语音识别框架技术发展的基础上,重点阐述了生成对抗网络、自监督表示学习、深度强化学习和元学习等高级深度学习技术在解决少样本语音识别方面的最新发展,如FGSM、wav2vec、AMS等代表性方法。在此基础上,分析了目前该技术面临的互补有限、数据和任务不均衡与模型轻量化部署问题。最后,对低资源少样本连续语音识别进行了总结,提出未来少样本训练识别的研究方向可以朝着先验信息引入、假设空间约束条件设定等方向进一步研究。 展开更多
关键词 低资源少样本 连续语音识别 生成对抗网络 自监督表示学习 深度强化学习 元学习
在线阅读 下载PDF
一种基于数据筛的音频视频连续语音识别系统 被引量:1
20
作者 谢磊 I Ravyse +4 位作者 蒋冬梅 赵荣椿 H Sahli W Verhelst J Cornelis 《计算机应用》 CSCD 北大核心 2003年第7期1-3,共3页
文中考虑语音的音频和视频双模型特性,建立了一个在噪音环境下的基于音频和视频复合特征的连续语音识别系统。在视频特征提取方面,引入了一种鲁棒性较好的数据筛特征提取方法;在音频和视频集成建模方面,使用多数据流HMM来反映语音的双... 文中考虑语音的音频和视频双模型特性,建立了一个在噪音环境下的基于音频和视频复合特征的连续语音识别系统。在视频特征提取方面,引入了一种鲁棒性较好的数据筛特征提取方法;在音频和视频集成建模方面,使用多数据流HMM来反映语音的双模型特性。识别实验表明,文中建立的音频视频连续语音识别系统具有很好的抗噪性。 展开更多
关键词 语音识别 音频视频 连续语音识别 数据筛 多数据流HMM
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部