期刊文献+
共找到79篇文章
< 1 2 4 >
每页显示 20 50 100
LVCSR系统中一种基于区分性和自适应瓶颈深度置信网络的特征提取方法 被引量:9
1
作者 陈雷 杨俊安 +1 位作者 王一 王龙 《信号处理》 CSCD 北大核心 2015年第3期290-298,共9页
大词汇量连续语音识别系统中,为了进一步增强网络的鲁棒性、提升瓶颈深度置信网络的识别准确率,本文提出一种基于区分性和自适应瓶颈深度置信网络的特征提取方法。该方法首先使用鲁棒性较强的瓶颈深度置信网络进行初步特征提取,进而进... 大词汇量连续语音识别系统中,为了进一步增强网络的鲁棒性、提升瓶颈深度置信网络的识别准确率,本文提出一种基于区分性和自适应瓶颈深度置信网络的特征提取方法。该方法首先使用鲁棒性较强的瓶颈深度置信网络进行初步特征提取,进而进行区分性训练,使网络的区分性更强、识别准确率更高,在此基础上引入说话人自适应技术对网络进行调整,提高系统的鲁棒性。本文利用提出的声学特征在多个噪声较强、主题风格较为随意的多个公共连续语音数据库上进行了测试,识别准确率取得了6.9!的提升。实验结果表明所提出的特征提取方法相对于传统方法的优越性。 展开更多
关键词 连续语音识别 瓶颈深度置信网络 区分性训练 说话人自适应
在线阅读 下载PDF
面向语音情感识别的持续特征解耦生成方法
2
作者 宁美玲 齐佳音 +2 位作者 梁快 张洵 陈凯帆 《计算机科学与探索》 北大核心 2025年第7期1888-1898,共11页
针对语音情绪识别领域中语音模型缺乏大量带标签的训练数据和语音模型无法持续学习的问题,提出了一种面向语音情感识别的持续特征解耦生成方法,该方法能够有效地提取数据情感信息并能较好地进行持续学习分类。构建并行选择解耦器,利用... 针对语音情绪识别领域中语音模型缺乏大量带标签的训练数据和语音模型无法持续学习的问题,提出了一种面向语音情感识别的持续特征解耦生成方法,该方法能够有效地提取数据情感信息并能较好地进行持续学习分类。构建并行选择解耦器,利用频谱选择模块和内容选择模块将语音的频谱特征和内容特征建立联系,通过计算情绪相关系数,赋予解耦数据相关权重,生成融合特征数据。构建二阶知识流情绪分类器,充分挖掘利用生成的语音情绪数据,引入自定义L2归一化层,构建自定义持续语音情绪分类网络(CL-SER),利用多层卷积结构处理语音情绪数据,减少模型误差损失。利用任务蒸馏损失和任务平滑损失优化持续语音情感网络CL-SER,实现跨任务的知识迁移,提高模型持续分类准确率。在IEMOCAP数据集上,进行了生成数据性能、模型防止灾难性遗忘性能和情绪分类性能测试。实验结果表明,提出的持续语音情感数据生成方法在多组持续学习方法和语音情感识别方法中均展现出了在准确率、遗忘率和未加权平均召回率等方面的良好性能,相较于其他经典的持续学习方法和情绪识别方法更具优势。 展开更多
关键词 语音情感识别 持续学习 特征解耦学习 变分自编码器 知识迁移
在线阅读 下载PDF
集成语种辨识的中英文LVCSR系统
3
作者 孙健 王作英 《计算机工程与设计》 CSCD 北大核心 2007年第8期1931-1933,共3页
为了在未知一段语音所属语言种类的情况下将其转换为正确的字符序列,将语种辨识(language identification,LID)同语音识别集成在一起建立了中、英文大词汇量连续语音识别(large vocabulary continuous speech recognition,LVCSR)系统。... 为了在未知一段语音所属语言种类的情况下将其转换为正确的字符序列,将语种辨识(language identification,LID)同语音识别集成在一起建立了中、英文大词汇量连续语音识别(large vocabulary continuous speech recognition,LVCSR)系统。为了在中、英文连续语音识别系统中能够尽早的对语音所属的语言种类做出判决以便进行识别,从而降低解码的计算量,对语种辨识过程中的语种剪枝进行了研究,表明采用合理的语种剪枝门限在不降低系统性能的情况下,可以有效的降低系统的计算量及识别时间。 展开更多
关键词 连续语音识别 语种辨识 段长分布 非齐次隐含马尔科夫模型 语种剪枝
在线阅读 下载PDF
基于元音检测的汉语连续语音声韵母分割 被引量:7
4
作者 王艳 冯宏伟 +1 位作者 张利平 忽满利 《计算机工程与应用》 CSCD 北大核心 2011年第14期134-136,共3页
在基于声韵母的汉语连续语音识别中,声韵母基元的准确分割是非常重要的一步。当前的声韵母分割方法在非连续语音中分割准确度较高,但在连续语音中准确度大幅度降低。利用熵与汉语元音的共振峰能量设计了一种新的分割方法,并引入重叠分... 在基于声韵母的汉语连续语音识别中,声韵母基元的准确分割是非常重要的一步。当前的声韵母分割方法在非连续语音中分割准确度较高,但在连续语音中准确度大幅度降低。利用熵与汉语元音的共振峰能量设计了一种新的分割方法,并引入重叠分割策略,完整地分割出汉语连续语音中的声韵母基元。实验结果表明,这种分割方法在低信噪比下也有很高的分割正确率。 展开更多
关键词 连续语音识别 共振峰
在线阅读 下载PDF
一种基于高维空间覆盖动态搜索方法的非特定人连续数字语音识别的研究 被引量:7
5
作者 王守觉 潘晓霞 +3 位作者 徐春燕 陈旭 安冬 曹文明 《电子学报》 EI CAS CSCD 北大核心 2005年第10期1790-1793,共4页
本文使用高维空间点分布分析原理,在仿生模式识别高维空间点覆盖原理的基础上,提出了一种基于高维空间点覆盖动态搜索理论的非特定人连续数字语音识别的新算法,这种算法可以不经过端点检测和分割,通过对被识别连续数字语音直接进行动态... 本文使用高维空间点分布分析原理,在仿生模式识别高维空间点覆盖原理的基础上,提出了一种基于高维空间点覆盖动态搜索理论的非特定人连续数字语音识别的新算法,这种算法可以不经过端点检测和分割,通过对被识别连续数字语音直接进行动态搜索,得到被识别语音到各类高维空间覆盖范围的距离随时间变化曲线,通过距离曲线上的极小值点进行识别. 展开更多
关键词 连续语音识别 高维空间点覆盖 非特定人语音识别
在线阅读 下载PDF
利用背景知识提高web语音浏览中的识别精度的方法 被引量:8
6
作者 李红莲 袁保宗 王春花 《电子学报》 EI CAS CSCD 北大核心 2002年第12期1836-1839,共4页
语音识别的精度不够高一直是阻碍语音技术得以广泛应用的瓶颈,在具体的应用中充分利用背景知识是解决此问题的一种有效方法.在web语音浏览中,用户的语音输入为某个有限集的元素之一,本文利用这个特点,首先定义了一种文本字符串之间的相... 语音识别的精度不够高一直是阻碍语音技术得以广泛应用的瓶颈,在具体的应用中充分利用背景知识是解决此问题的一种有效方法.在web语音浏览中,用户的语音输入为某个有限集的元素之一,本文利用这个特点,首先定义了一种文本字符串之间的相似度,利用相似度对识别引擎的识别结果进行后处理,进而给出更准确的识别结果.实验结果表明,采用这种方法,语音识别的正确率能够达到95%以上,为真正实现语音上网提供了有力支持. 展开更多
关键词 背景知识 web语音浏览 识别精度 相似度 语音识别 语音理解
在线阅读 下载PDF
基于归一化算法的噪音鲁棒性连续语音识别 被引量:5
7
作者 刘妍秀 孙一鸣 杨华民 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2015年第3期519-524,共6页
针对归一化方法在连续语音特征曲线调整时存在的问题,提出一种优化解决方案,解决了噪声的不稳定性及不可预测性对语音特征的影响.结果表明,基于该优化方法建立的鲁棒性连续语音识别模型可实现在实验室干净环境和现实噪音环境下同时得到... 针对归一化方法在连续语音特征曲线调整时存在的问题,提出一种优化解决方案,解决了噪声的不稳定性及不可预测性对语音特征的影响.结果表明,基于该优化方法建立的鲁棒性连续语音识别模型可实现在实验室干净环境和现实噪音环境下同时得到较好的识别结果. 展开更多
关键词 归一化 噪音鲁棒性 连续语音识别
在线阅读 下载PDF
基于最大似然可变子空间的快速说话人自适应方法 被引量:3
8
作者 张文林 牛铜 +1 位作者 张连海 李弼程 《电子与信息学报》 EI CSCD 北大核心 2012年第3期571-575,共5页
该文提出一种基于最大似然可变子空间的说话人自适应方法。在训练阶段,对训练集中的说话人相关模型参数进行主分量分析,得到一组说话人基矢量;在自适应阶段,通过最大似然准则选取与当前说话人相关性最大的基矢量子集,进而将新的说话人... 该文提出一种基于最大似然可变子空间的说话人自适应方法。在训练阶段,对训练集中的说话人相关模型参数进行主分量分析,得到一组说话人基矢量;在自适应阶段,通过最大似然准则选取与当前说话人相关性最大的基矢量子集,进而将新的说话人相关模型限制在这组基矢量所张成的说话人子空间中,通过求解每一个基矢量对应的系数从而进行说话人自适应。与经典的基于子空间的说话人自适应方法不同,该文中的说话人子空间是在自适应阶段动态选取的,所需要估计的参数更少,在少量自适应数据下可以得到更稳健的自适应结果。在基于微软语料库的连续语音识别自适应实验中,给定极少量自适应数据(小于5 s),在有监督和无监督条件下,该文方法均优于经典的本征音自适应方法和基于最大似然线性回归的方法。 展开更多
关键词 连续语音识别 说话人自适应 本征音 子空间方法
在线阅读 下载PDF
基于子字单元的维吾尔语语音识别研究 被引量:5
9
作者 薛化建 董兴华 +2 位作者 周喜 吐尔洪.吾司曼 李晓 《计算机工程》 CAS CSCD 北大核心 2011年第20期208-210,共3页
为提高维吾尔语语音识别的识别率,在分析维吾尔语特点的基础上,设计一种基于子字单元的维吾尔语语音识别总体结构,指出维吾尔语单词的发音模型,给出构建子字发音字典的方法,及其以子字单元为基础构建语言模型与声学模型的方法。在一个... 为提高维吾尔语语音识别的识别率,在分析维吾尔语特点的基础上,设计一种基于子字单元的维吾尔语语音识别总体结构,指出维吾尔语单词的发音模型,给出构建子字发音字典的方法,及其以子字单元为基础构建语言模型与声学模型的方法。在一个语音库上进行实验,采用一种非监督的词切分方法对维吾尔语单词进行词切分,生成子字。实验结果表明,基于子字单元的维吾尔语语音识别可以获得更好的识别结果。 展开更多
关键词 维吾尔语 词切分 子字单元 隐马尔科夫模型 连续语音识别
在线阅读 下载PDF
基于HMM/VQ的认人的中等词表连续语音识别 被引量:4
10
作者 林道发 罗万伯 杨家沅 《电子学报》 EI CAS CSCD 北大核心 1992年第7期59-65,共7页
本文讨论基于隐马尔可夫模型(HMM)和矢量量化(VQ)的连续语音识别方法。用这种方法,对每个单词作成一个HMM,对多个模型组合成的状态转移网络搜索其状态转移的最佳路径,从而实现不预先进行单词切分的连续语音的识别,使用有限态文法约束及... 本文讨论基于隐马尔可夫模型(HMM)和矢量量化(VQ)的连续语音识别方法。用这种方法,对每个单词作成一个HMM,对多个模型组合成的状态转移网络搜索其状态转移的最佳路径,从而实现不预先进行单词切分的连续语音的识别,使用有限态文法约束及其它一些改善识别性能的措施,演示系统能识别特定人的18种英语句式,150个单词,用312个话句(共有2710个单词)进行测试,识别延迟时间为发音时长的62%,发音速度平均为每秒2.32个单词,单词识准率为97.3%。 展开更多
关键词 连续语音 识别 文法分析 HMM
在线阅读 下载PDF
基于连续分布型HMM的汉语连续语音的声调识别方法 被引量:6
11
作者 赵力 邹采荣 吴镇扬 《信号处理》 CSCD 2000年第1期20-23,共4页
本文介绍了基于连续分布型HMM的汉语连续语音声调识别方法,提出了一个适合于汉语连续语音声调识别的特征参数提取和识别方案。通过对汉语连续语音声调特点的分析,选择了8个音节单位的连续分布型HMM作为声调识别用基元模型进行识别试... 本文介绍了基于连续分布型HMM的汉语连续语音声调识别方法,提出了一个适合于汉语连续语音声调识别的特征参数提取和识别方案。通过对汉语连续语音声调特点的分析,选择了8个音节单位的连续分布型HMM作为声调识别用基元模型进行识别试验,识别结果表明,10名话者1070个句子的连续语音声调识别的平均识别率是95.1%。 展开更多
关键词 汉语连续语音 声调识别 基频 语音识别
在线阅读 下载PDF
汉语连续语音识别中上下文相关的识别单元(三音子)的研究 被引量:4
12
作者 赵庆卫 王作英 陆大 《电子学报》 EI CAS CSCD 北大核心 1999年第6期79-82,117,共5页
本文详细研究了汉语语音识别中如何有效地建立上下文相关的识别单元,以解决连续语音之间的协同发音问题.本文首先利用信息论原理,研究了传统的聚类算法的距离测度,分别是模型分布的散度和模型合并或分裂前后熵的变化值.然后本文提... 本文详细研究了汉语语音识别中如何有效地建立上下文相关的识别单元,以解决连续语音之间的协同发音问题.本文首先利用信息论原理,研究了传统的聚类算法的距离测度,分别是模型分布的散度和模型合并或分裂前后熵的变化值.然后本文提出了基于决策树的聚类方法,它的主要优点是充分利用了语音学知识,聚类后得到的模型可推广性好,尤其适用于集外语料中出现大量的未在训练语料中出现的三音子单元的情况.接着介绍了模型聚类和训练的实验步骤最后,非特定人大词汇量连续语音识别的实验表明,基于决策树的聚类方法所得到的识别单元,当识别集外语料时使系统的误识率降低了7.95%,而基于合并的聚类方法所得到的识别单元只降低了2.63%. 展开更多
关键词 连续语音识别 上下文相关 决策树 聚类算法
在线阅读 下载PDF
一种新的基于子空间的说话人自适应方法 被引量:3
13
作者 张文林 张卫强 +2 位作者 刘加 李弼程 屈丹 《自动化学报》 EI CSCD 北大核心 2011年第12期1495-1502,共8页
提出了一种新的基于子空间的快速说话人自适应方法.该方法在本征音(Eigen-voice,EV)自适应方法基础上,进一步在音子空间寻找低维子空间,得到更为紧凑的"说话人–音子"联合子空间.该子空间不仅包含了说话人间的模型参数相关性... 提出了一种新的基于子空间的快速说话人自适应方法.该方法在本征音(Eigen-voice,EV)自适应方法基础上,进一步在音子空间寻找低维子空间,得到更为紧凑的"说话人–音子"联合子空间.该子空间不仅包含了说话人间的模型参数相关性信息,而且对音子间的模型参数相关性信息也进行了显式建模,在大大降低模型存储量的同时更为全面地反映模型参数的先验信息.在基于连续语音识别的无监督自适应实验中,在少量的自适应数据条件下,新方法取得了比最大似然线性回归和聚类最大似然线性基方法更好的效果. 展开更多
关键词 连续语音识别 说话人自适应 本征音 本征音子
在线阅读 下载PDF
汉语连续语音中声调识别的特殊性研究 被引量:2
14
作者 钟金宏 杨善林 蒋俊杰 《小型微型计算机系统》 CSCD 北大核心 2002年第4期470-473,共4页
大词汇连续语音识别是当前语音识别研究的主流 ,探讨其中声调识别的特殊性是一项有意义的工作 .本文从声调获取、语音分割、声调模式和声调识别等四个方面进行了研究 ,通过对现有研究成果的分析和总结 ,并结合自己的研究工作 ,得出了若... 大词汇连续语音识别是当前语音识别研究的主流 ,探讨其中声调识别的特殊性是一项有意义的工作 .本文从声调获取、语音分割、声调模式和声调识别等四个方面进行了研究 ,通过对现有研究成果的分析和总结 ,并结合自己的研究工作 ,得出了若干结论 。 展开更多
关键词 声调识别 基音检测 语音分割 声调模式 汉语连续语音 特殊性 语音识别
在线阅读 下载PDF
基于仿生模式识别的小词汇量连续型语音识别的研究 被引量:3
15
作者 王守觉 沈孙园 曹文明 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2006年第B07期1-5,共5页
提出了一种基于仿生模式识别理论的非特定人连续语音关键词识别的新算法.该算法无需对待识别连续语音进行端点检测和分割,通过直接对特征提取后的连续语音进行动态搜索,得到待识别连续语音到各类关键词训练网络的距离随时间变化的曲... 提出了一种基于仿生模式识别理论的非特定人连续语音关键词识别的新算法.该算法无需对待识别连续语音进行端点检测和分割,通过直接对特征提取后的连续语音进行动态搜索,得到待识别连续语音到各类关键词训练网络的距离随时间变化的曲线,通过动态搜索距离曲线上谷值的大小和数目来判断有多少关键词.通过对小词汇量、不同语速条件下的连续语音的测试,得到了良好的识别结果,验证了此方法的有效性. 展开更多
关键词 仿生模式识别 连续语音识别 关键词识别 高维空间点覆盖 小词汇量
在线阅读 下载PDF
关键词识别的基本技术和研究进展 被引量:2
16
作者 陈凯江 欧嘉致 +1 位作者 黄萱菁 吴立德 《计算机科学》 CSCD 北大核心 2002年第2期115-119,97,共6页
Keyword Spotting (KWS) or Keyword Recognition is to recognize a set of given keywords in continuous,spontaneous speech.It is a very active branch of Speech Recognition.It differs from Continuous Speech Recognition (CS... Keyword Spotting (KWS) or Keyword Recognition is to recognize a set of given keywords in continuous,spontaneous speech.It is a very active branch of Speech Recognition.It differs from Continuous Speech Recognition (CSR) in terms of research focus,implementation techniques and application background.So they are often regarded as two different issues.This paper gives an overview of basic techniques and advances in recent years,including how to combine the traits of Mandarin. 展开更多
关键词 语音识别 关键词识别 信息处理 多媒体 计算机
在线阅读 下载PDF
汉语连续语音识别中经典HMM的实验评测 被引量:6
17
作者 郝杰 李星 《计算机工程与应用》 CSCD 北大核心 2001年第13期1-4,101,共5页
定量地分析与评价经典隐马尔可夫模型(Hidden Markov Model,HMM)的性能,是汉语连续语音识别研究中尚未解决并且亟需解决的问题。文章构造了基于经典HMM模型的汉语连续语音识别系统。针对语音单元和输出概率... 定量地分析与评价经典隐马尔可夫模型(Hidden Markov Model,HMM)的性能,是汉语连续语音识别研究中尚未解决并且亟需解决的问题。文章构造了基于经典HMM模型的汉语连续语音识别系统。针对语音单元和输出概率这两个自由度上的各种组合,研究了经典HMM模型的复杂度、稳健性、精确性与训练集合的数据量、训练时间、解码效率等特性之间的关系;并且通过实验分析了多候选的构造和剪枝的意义。该文构造的系统与具有国内最高水平的 THEESP系统的识别率相当,所得实验结果和结论为汉语语音识别的深入研究提供了必要的参考和依据。 展开更多
关键词 汉语连续语音识别 经典HMM模型 THEESP系统 语音信号处理
在线阅读 下载PDF
调制域谱减法用于鲁棒性语音识别 被引量:5
18
作者 胡丹 曾庆宁 龙超 《科学技术与工程》 北大核心 2016年第4期216-220,共5页
针对语音识别在实际环境中缺乏稳健性的问题,提出了将调制域谱减法应用于语音识别前端的方法。先将语音信号变换到调制域,在调制域用谱减法将信号增强,在减少语音畸变的基础上提高信噪比,然后再进行识别。仿真实验表明,调制域谱减法能... 针对语音识别在实际环境中缺乏稳健性的问题,提出了将调制域谱减法应用于语音识别前端的方法。先将语音信号变换到调制域,在调制域用谱减法将信号增强,在减少语音畸变的基础上提高信噪比,然后再进行识别。仿真实验表明,调制域谱减法能在较大的信噪比区间内提高系统识别率,证明此方法能显著提高语音识别系统的抗噪声能力。 展开更多
关键词 调制域 谱减法 连续语音识别 识别率 相位补偿
在线阅读 下载PDF
一种抗噪孤立字语音识别模型 被引量:2
19
作者 徐文盛 戴蓓倩 +1 位作者 方绍武 李辉 《中国科学技术大学学报》 CAS CSCD 北大核心 2000年第6期659-665,共7页
论文提出了一种连续隐Markov模型和BP神经网络相结合的、具有两次辨识过程的抗噪孤立字识别模型 .首先以连续隐Markov模型完成语音信号的时序建模并提供一次识别信息 ;以BP神经网络进行后处理 ,提取二次识别信息 ,识别结果由两次识别信... 论文提出了一种连续隐Markov模型和BP神经网络相结合的、具有两次辨识过程的抗噪孤立字识别模型 .首先以连续隐Markov模型完成语音信号的时序建模并提供一次识别信息 ;以BP神经网络进行后处理 ,提取二次识别信息 ,识别结果由两次识别信息共同决定 .实验证明 ,由于有效地利用了隐Markov模型的强时序信号处理能力和BP神经网络的强模式分类和泛化性能 ,这种识别模型明显地改善了孤立字识别系统的抗噪性能 . 展开更多
关键词 连续隐MArkov模型 人工神经网络 噪声鲁棒性 语音识别 抗噪性能
在线阅读 下载PDF
正反向隐马尔可夫模型及其在连续语音识别中的应用 被引量:3
20
作者 王仁华 江辉 《电子学报》 EI CAS CSCD 北大核心 1996年第10期63-68,共6页
本文针对语音信号中客观存在的正、反向依赖特性,明确提出了用条件概率的概念来定量表述语音信号的这种正、反向的马尔可大依赖关系,提出了描述语音信号这种正反向依赖关系的正反向隐马尔可夫模型(HMM),并用实验证明了仅仅利用... 本文针对语音信号中客观存在的正、反向依赖特性,明确提出了用条件概率的概念来定量表述语音信号的这种正、反向的马尔可大依赖关系,提出了描述语音信号这种正反向依赖关系的正反向隐马尔可夫模型(HMM),并用实验证明了仅仅利用语音反向依赖关系语音识别同样也能获得相当可观的识别性能。接着,本文针对孤立字和连续语音两种不同的识别任务,研究了在语音识别中同时利用这两种依赖信息的方法,并提出了一种连续语音识别中的新的搜索算法──正反向分半混合搜索。这种方法利用基于正向HMM的正向Viterbi搜索和基于反向HMM的反向Viterbi搜索的中间结果来有效地结合正反向依赖信息,实验证明正反向分半混合搜索方法确实一致地优于单用任何一种依赖信息的单向搜索识别方法。 展开更多
关键词 语音识别 连续语音识别 HMM模型
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部