期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
鲁棒性话者辨识中的一种改进的马尔科夫模型 被引量:6
1
作者 刘鸣 戴蓓倩 +2 位作者 李辉 陆伟 李霄寒 《电子学报》 EI CAS CSCD 北大核心 2002年第1期46-48,共3页
为了提高话者识别系统的噪声鲁棒性 ,本文对CHMM进行了改进 ,将每帧特征参数之间的差分参数来对应状态之间的转移 ,从而使帧间信息在模型中得到了体现 .利用改进后的CHMM模型对不同的特征参数携带的信息进行信息融合 .使得在强噪环境下 ... 为了提高话者识别系统的噪声鲁棒性 ,本文对CHMM进行了改进 ,将每帧特征参数之间的差分参数来对应状态之间的转移 ,从而使帧间信息在模型中得到了体现 .利用改进后的CHMM模型对不同的特征参数携带的信息进行信息融合 .使得在强噪环境下 ,鲁棒性好的特征参数起主导作用 ,而在噪声比较小的环境下 ,精细度高的特征参数起主导作用 .实验证明 ,这种改进的马尔可夫模型明显提高语音识别系统的鲁棒性能 。 展开更多
关键词 连续隐马尔可夫模型 鲁棒性 话者识别 语音识别
在线阅读 下载PDF
嵌入式语音识别系统的研究和实现 被引量:19
2
作者 方敏 浦剑涛 +1 位作者 李成荣 台宪青 《中文信息学报》 CSCD 北大核心 2004年第6期73-78,共6页
本文首先给出了一种适合于在嵌入式平台上实现的可变命令集的非特定人语音识别系统 ,同传统的基于PC的非特定人语音识别系统相比 ,该系统具备内存消耗小 ,运算速度快的优点。然后给出了该语音识别系统在多种嵌入式平台上的实现和评估结... 本文首先给出了一种适合于在嵌入式平台上实现的可变命令集的非特定人语音识别系统 ,同传统的基于PC的非特定人语音识别系统相比 ,该系统具备内存消耗小 ,运算速度快的优点。然后给出了该语音识别系统在多种嵌入式平台上的实现和评估结果 ,论证了非特定人语音识别系统在嵌入式平台上实现的可行性及其对硬件的最低配置要求 ,在技术层次上分析了目前实现高性能语音识别SOC的主要问题和困难 。 展开更多
关键词 计算机应用 中文信息处理 嵌入式平台 非特定人语音识别 语音识别SOIC
在线阅读 下载PDF
多用途汉语方言语音数据库的设计 被引量:8
3
作者 高原 顾明亮 +2 位作者 孙平 王侠 张长水 《计算机工程与应用》 CSCD 2012年第5期118-120,共3页
建立了一个多用途汉语方言语音数据库,用于说话人信息处理、方言特征词识别、语音识别等领域的研究。以多通道的方式采集时长106小时的语音数据,包括七种主要的汉语方言区语音,对数据进行预处理。在此基础上提出了汉语方言数据库的设计... 建立了一个多用途汉语方言语音数据库,用于说话人信息处理、方言特征词识别、语音识别等领域的研究。以多通道的方式采集时长106小时的语音数据,包括七种主要的汉语方言区语音,对数据进行预处理。在此基础上提出了汉语方言数据库的设计标准以及实施方案,有助于推动汉语语音库特别是方言语音库的建立。 展开更多
关键词 汉语方言数据库 说话人信息处理 方言特征词识别
在线阅读 下载PDF
邮包校核语音识别系统的实时实现 被引量:6
4
作者 单翼翔 张昊天 +4 位作者 李虎生 钟林 张进 刘加 刘润生 《电子学报》 EI CAS CSCD 北大核心 2002年第4期544-547,共4页
本文研究开发了一套邮包信息校核语音识别系统 .该系统利用中大词汇量非特定人连续语音识别技术实时实现了邮包信息的语音校核 .系统可以识别普通话或四川话语音 ,可识别的词汇量约为 4 5 0 0条 .系统还采用了拒识技术与说话人自适应技... 本文研究开发了一套邮包信息校核语音识别系统 .该系统利用中大词汇量非特定人连续语音识别技术实时实现了邮包信息的语音校核 .系统可以识别普通话或四川话语音 ,可识别的词汇量约为 4 5 0 0条 .系统还采用了拒识技术与说话人自适应技术 ,提高了整个系统的稳健性 .实验表明对普通话的首选识别率达到 98.7% ,前三选识别率达到 99.9% .对四川话的首选识别率达到 95 .9% ,前三选识别率达到 98.6 % ,对无关语音的正确拒识率达到 85 % ,对口音较重的说话人经过自适应后识别率可提高 5 - 展开更多
关键词 邮包校核 实时实现 语音识别系统
在线阅读 下载PDF
语音识别中的一种说话人聚类算法 被引量:4
5
作者 肖述才 欧智坚 王作英 《中文信息学报》 CSCD 北大核心 2005年第4期84-88,共5页
本文介绍了稳健语音识别中的一种说话人聚类算法,包括它在语音识别中的作用和具体的用法,聚类中常用的特征、距离测度,聚类的具体实现步骤等。我们从两个方面对该算法的性能进行了测试,一是直接计算句子聚类的正确率,二是对说话人自适... 本文介绍了稳健语音识别中的一种说话人聚类算法,包括它在语音识别中的作用和具体的用法,聚类中常用的特征、距离测度,聚类的具体实现步骤等。我们从两个方面对该算法的性能进行了测试,一是直接计算句子聚类的正确率,二是对说话人自适应效果的改进的作用,即比较使用此算法后系统性能的改进进行评价。实验表明:在使用GLR距离作为距离测度的时候,该算法对句子的聚类正确率达85·69%;在识别实验中,该聚类算法的使用,使得用于说话人自适应的数据更加充分,提高了自适应的效果,系统的误识率已经接近利用已知说话人信息进行自适应时的误识率。 展开更多
关键词 计算机应用 中文信息处理 说话人聚类 说话人自适应 语音识别
在线阅读 下载PDF
一种适用于说话人识别的改进Mel滤波器 被引量:8
6
作者 项要杰 杨俊安 +1 位作者 李晋徽 陆俊 《计算机工程》 CAS CSCD 2013年第11期214-217,222,共5页
Mel倒谱系数(MFCC)侧重提取语音信号的低频信息,对语音信号的频谱分布特性描述不充分,不能有效区分说话人个性信息。为此,通过分析语音信号各频段所含说话人个性信息的不同,结合Mel滤波器和反Mel滤波器在高低频段的不同特性,提出一种适... Mel倒谱系数(MFCC)侧重提取语音信号的低频信息,对语音信号的频谱分布特性描述不充分,不能有效区分说话人个性信息。为此,通过分析语音信号各频段所含说话人个性信息的不同,结合Mel滤波器和反Mel滤波器在高低频段的不同特性,提出一种适于说话人识别的改进Mel滤波器。实验结果表明,改进Mel滤波器提取的新特征能够获得比传统Mel倒谱系数以及反Mel倒谱系数(IMFCC)更好的识别效果,并且基本不增加说话人识别系统训练和识别的时间开销。 展开更多
关键词 说话人识别 MEL倒谱系数 个性信息 反Mel倒谱系数 频谱分布 语音信号
在线阅读 下载PDF
基于结构化特征语音模型的区别性说话人自适应算法
7
作者 蔡铁 朱杰 《上海交通大学学报》 EI CAS CSCD 北大核心 2005年第S1期138-142,共5页
针对特征语音说话人自适应算法的缺陷,提出了基于结构化特征语音模型的区别性说话人自适应方法.该算法能根据自适应数据量调整自适应参数,并采用基于最大互信息量准则的区别性参数估计方法,进一步提高了自适应性能.有监督自适应的实验... 针对特征语音说话人自适应算法的缺陷,提出了基于结构化特征语音模型的区别性说话人自适应方法.该算法能根据自适应数据量调整自适应参数,并采用基于最大互信息量准则的区别性参数估计方法,进一步提高了自适应性能.有监督自适应的实验结果表明,在仅有一句自适应语句的情况下系统误识率相对下降了6.7%,同时算法表现出了优于特征语音自适应方法的渐进性能. 展开更多
关键词 语音识别 说话人自适应 特征语音 最大互信息量
在线阅读 下载PDF
应用于军事指挥中的鲁棒性语音识别系统 被引量:5
8
作者 赵军辉 匡镜明 谢湘 《兵工学报》 EI CAS CSCD 北大核心 2004年第4期509-512,共4页
恶劣的军事环境为语音识别系统应用于军事指挥带来了巨大的困难 ,本文基于语音识别的基本原理 ,并根据军事指挥这一特殊的应用环境 ,提出了一种高鲁棒性的语音识别方案。经过战场仿真环境测试表明 ,该方案的语音识别率在高噪声环境中能... 恶劣的军事环境为语音识别系统应用于军事指挥带来了巨大的困难 ,本文基于语音识别的基本原理 ,并根据军事指挥这一特殊的应用环境 ,提出了一种高鲁棒性的语音识别方案。经过战场仿真环境测试表明 ,该方案的语音识别率在高噪声环境中能达到 90 %以上 。 展开更多
关键词 军事指挥 鲁棒性 语音识别系统 信息处理技术 感知线性预测 噪声抑制
在线阅读 下载PDF
渐进式神经网络多维说话人信息识别技术 被引量:3
9
作者 陈海霞 徐珑婷 杨震 《南京邮电大学学报(自然科学版)》 北大核心 2019年第1期45-51,共7页
提出了一种识别多维语音信息的方法,用来同时识别说话人身份、性别和情感信息,选择身份特征参数I-vector向量表示语句特征。首先基于深度置信网络(DBN)设计了一个性别相关的多维语音识别基线系统,然后在基线系统基础上又提出了一种基于... 提出了一种识别多维语音信息的方法,用来同时识别说话人身份、性别和情感信息,选择身份特征参数I-vector向量表示语句特征。首先基于深度置信网络(DBN)设计了一个性别相关的多维语音识别基线系统,然后在基线系统基础上又提出了一种基于渐进式神经网络技术(Progressive Neural Network,ProgNets)的多维说话人信息识别方法。在性别相关的基础上,将辅助语音识别模型知识迁移学习到主语音识别模型中,进而增强语音识别性能。实验结果表明,基线系统识别结果比非同时识别的单维语音识别DBN模型的平均识别率提升了4.73%,而基于ProgNets系统的多维系统识别精度比基线系统高1.8%。 展开更多
关键词 I-vector特征向量 深度置信网络 渐进式神经网络 多维说话人信息识别
在线阅读 下载PDF
说话人识别中基于音素分类的数据选择方法
10
作者 吴蔚澜 张卫强 +4 位作者 刘巍巍 田垚 陈振锋 刘加 夏善红 《中国科学院大学学报(中英文)》 CAS CSCD 北大核心 2014年第5期714-719,共6页
在说话人识别中,有效语音数据的选择是一个重要的预处理环节.常用的数据选择方法根据能量信息的强弱对有效数据进行提取,但在实际情况中能量的高低与语音数据并无必然联系.本文在对传统方法进行分析比较的同时引入语言学知识,提出基于... 在说话人识别中,有效语音数据的选择是一个重要的预处理环节.常用的数据选择方法根据能量信息的强弱对有效数据进行提取,但在实际情况中能量的高低与语音数据并无必然联系.本文在对传统方法进行分析比较的同时引入语言学知识,提出基于辅音信息的有效数据选择方法.该方法通过对活动语音检测结果中音素识别结果进行分析,保留所有元音,对辅音进行筛选,去除无益于说话人识别的干扰辅音音素,从而实现对有效语音数据的选取.实验表明,应用该方法得到的说话人识别结果,明显优于传统的基于能量的数据选择算法,如基于G.723.1标准的活动语音检测算法和近期提出的基于交叉熵顺序统计滤波的端点检测算法. 展开更多
关键词 说话人识别 有效数据 音素解码器 辅音
在线阅读 下载PDF
一种快速说话人搜索算法
11
作者 朱磊 江杰 +1 位作者 郑榕 徐波 《中文信息学报》 CSCD 北大核心 2008年第2期60-63,共4页
随着音频数据的不断增加,说话人识别已经变得越来越困难。本文提出了一种新颖的方法,在已有的说话人识别系统(GMM-UBM系统)的基础上,综合利用Index和Simulation,以很小的代价,极大地提高了说话人识别的速度,从而使说话人搜索成为可能。... 随着音频数据的不断增加,说话人识别已经变得越来越困难。本文提出了一种新颖的方法,在已有的说话人识别系统(GMM-UBM系统)的基础上,综合利用Index和Simulation,以很小的代价,极大地提高了说话人识别的速度,从而使说话人搜索成为可能。具体而言,就是采用两遍搜索策略,首先通过建立索引,在索引空间,比较索引间的欧氏距离,粗略地筛选出一定量的候选说话人目标;然后在此基础上,通过更精细的Simulation模型匹配,找出最佳的识别结果。实验结果显示我们的方法能以很小的代价,显著地提高说话人识别的速度。 展开更多
关键词 计算机应用 中文信息处理 说话人识别 说话人搜索 两遍搜索
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部