期刊文献+
共找到26篇文章
< 1 2 >
每页显示 20 50 100
基于DNN的声学模型自适应实验 被引量:5
1
作者 张宇 计哲 +3 位作者 万辛 张震 葛凤培 颜永红 《天津大学学报(自然科学与工程技术版)》 EI CAS CSCD 北大核心 2015年第9期765-770,共6页
声学模型自适应算法研究目的是缓解由测试数据和训练数据不匹配而引起的识别性能下降问题.基于深度神经网络(DNN)模型框架的自适应技术中,重训练是最直接的方法,但极容易出现过拟合现象,尤其是自适应数据稀疏的情况下.文章针对领域相关... 声学模型自适应算法研究目的是缓解由测试数据和训练数据不匹配而引起的识别性能下降问题.基于深度神经网络(DNN)模型框架的自适应技术中,重训练是最直接的方法,但极容易出现过拟合现象,尤其是自适应数据稀疏的情况下.文章针对领域相关的自动语音识别任务,对典型的两种声学模型自适应算法进行了尝试,实验了基于线性变换网络的自适应方法和基于相对熵正则化准则的自适应方法,并对两种算法进行了详尽的系统性能比较.结果表明,在不同的自适应数据量下,相对熵正则化自适应方法均能表现出较好的性能. 展开更多
关键词 声学模型自适应 语音识别 深度神经网络
在线阅读 下载PDF
中文口语理解中关键语义类模糊匹配方法的研究 被引量:2
2
作者 李艳玲 颜永红 《小型微型计算机系统》 CSCD 北大核心 2014年第9期2182-2186,共5页
针对人机交互过程中语音识别引起的发音变异以及用户表达关键信息不完整情况,提出一种模糊匹配方法.该方法分两步,第一步,通过条件随机场进行序列标注,定位查询语句中的关键语义概念,并得到其初步类别;第二步,利用几种相似度计算方法,... 针对人机交互过程中语音识别引起的发音变异以及用户表达关键信息不完整情况,提出一种模糊匹配方法.该方法分两步,第一步,通过条件随机场进行序列标注,定位查询语句中的关键语义概念,并得到其初步类别;第二步,利用几种相似度计算方法,寻找与领域词典中发音相似度最大的字符串对错误的语义概念进行替换,并标注出具体类别.另外针对最优模糊匹配结果不一定满足用户需要,进行了多个候选的实验.实验结果证明:无论使用哪种相似度计算方法,基于拼音的模糊匹配方法比基于字的模糊匹配方法在语音识别的文本上都具有更好的性能,而且在多候选的结果上也仍旧适用,说明该方法对于提高口语理解系统的鲁棒性上是有效的. 展开更多
关键词 模糊匹配 条件随机场 口语理解 命名实体识别 相似度函数
在线阅读 下载PDF
基于深度学习的两阶段联合声学回波和混响抑制技术 被引量:1
3
作者 栾书明 程龙彪 +2 位作者 孙兴伟 李军锋 颜永红 《信号处理》 CSCD 北大核心 2020年第6期948-957,共10页
在现代通信系统中,回波与混响常损害通信语音的质量和可懂度。为克服回波与混响的负面影响,本文提出了一种基于深度学习的两阶段联合声学回波和混响抑制系统。系统先用基于理想比值掩蔽的模型去除与目标信号不相关的声学回波;然后用一... 在现代通信系统中,回波与混响常损害通信语音的质量和可懂度。为克服回波与混响的负面影响,本文提出了一种基于深度学习的两阶段联合声学回波和混响抑制系统。系统先用基于理想比值掩蔽的模型去除与目标信号不相关的声学回波;然后用一个基于"隐掩蔽"的谱映射模型去除与目标信号强相关的混响干扰;最后联合训练两阶段模型以获得更好的系统性能。一系列不同声学环境下的实验结果表明,本文所提出的系统可显著地消除回波与混响干扰,从而极大地增强了目标语音的语音质量与可懂度。 展开更多
关键词 回波消除 去混响 双向长短时记忆网络 理想比率掩蔽 联合训练 谱映射
在线阅读 下载PDF
基于改进主题分布特征的神经网络语言模型 被引量:10
4
作者 刘畅 张一珂 +1 位作者 张鹏远 颜永红 《电子与信息学报》 EI CSCD 北大核心 2018年第1期219-225,共7页
在递归神经网络(RNN)语言模型输入中增加表示当前词所对应主题的特征向量是一种有效利用长时间跨度历史信息的方法。由于在不同文档中各主题的概率分布通常差别很大,该文提出一种使用文档主题概率改进当前词主题特征的方法,并将改进后... 在递归神经网络(RNN)语言模型输入中增加表示当前词所对应主题的特征向量是一种有效利用长时间跨度历史信息的方法。由于在不同文档中各主题的概率分布通常差别很大,该文提出一种使用文档主题概率改进当前词主题特征的方法,并将改进后的特征应用于基于长短时记忆(LSTM)单元的递归神经网络语言模型中。实验表明,在PTB数据集上该文提出的方法使语言模型的困惑度相对于基线系统下降11.8%。在SWBD数据集多候选重估实验中,该文提出的特征使LSTM模型相对于基线模型词错误率(WER)相对下降6.0%;在WSJ数据集上的实验中,该特征使LSTM模型相对于基线模型词错误率(WER)相对下降6.8%,并且在eval92测试集上,改进隐含狄利克雷分布(LDA)特征使RNN效果与LSTM相当。 展开更多
关键词 语音识别 语言模型 隐含狄利克雷分布 长短时记忆
在线阅读 下载PDF
基于预训练语言表示模型的汉语韵律结构预测 被引量:2
5
作者 张鹏远 卢春晖 王睿敏 《天津大学学报(自然科学与工程技术版)》 EI CSCD 北大核心 2020年第3期265-271,共7页
韵律结构预测作为语音合成系统中的一个关键步骤,其结果直接影响合成语音的自然度和可懂度.本文提出了一种基于预训练语言表示模型的韵律结构预测方法,以字为建模单位,在预训练语言模型的基础上对每个韵律层级设置了独立的输出层,利用... 韵律结构预测作为语音合成系统中的一个关键步骤,其结果直接影响合成语音的自然度和可懂度.本文提出了一种基于预训练语言表示模型的韵律结构预测方法,以字为建模单位,在预训练语言模型的基础上对每个韵律层级设置了独立的输出层,利用韵律标注数据对预训练模型进行微调.另外在此基础上额外增加了分词任务,通过多任务学习的方法对各韵律层级间的关系及韵律与词间的关系建模,实现对输入文本各级韵律边界的同时预测.实验首先证明了多输出结构设置的合理性及使用预训练模型的有效性,并验证了分词任务的加入可以进一步提升模型性能;将最优的结果与设置的两个基线模型相比,在韵律词和韵律短语预测的F1值上与条件随机场模型相比分别有2.48%和4.50%的绝对提升,而与双向长短时记忆网络相比分别有6.2%和5.4%的绝对提升;最后实验表明该方法可以在保证预测性能的同时减少对训练数据量的需求. 展开更多
关键词 韵律结构预测 预训练语言表示模型 多任务学习 语音合成
在线阅读 下载PDF
基于对抗训练策略的语言模型数据增强技术 被引量:20
6
作者 张一珂 张鹏远 颜永红 《自动化学报》 EI CSCD 北大核心 2018年第5期891-900,共10页
基于最大似然估计(Maximum likelihood estimation,MLE)的语言模型(Language model,LM)数据增强方法由于存在暴露偏差问题而无法生成具有长时语义信息的采样数据.本文提出了一种基于对抗训练策略的语言模型数据增强的方法,通过一个辅助... 基于最大似然估计(Maximum likelihood estimation,MLE)的语言模型(Language model,LM)数据增强方法由于存在暴露偏差问题而无法生成具有长时语义信息的采样数据.本文提出了一种基于对抗训练策略的语言模型数据增强的方法,通过一个辅助的卷积神经网络判别模型判断生成数据的真伪,从而引导递归神经网络生成模型学习真实数据的分布.语言模型的数据增强问题实质上是离散序列的生成问题.当生成模型的输出为离散值时,来自判别模型的误差无法通过反向传播算法回传到生成模型.为了解决此问题,本文将离散序列生成问题表示为强化学习问题,利用判别模型的输出作为奖励对生成模型进行优化,此外,由于判别模型只能对完整的生成序列进行评价,本文采用蒙特卡洛搜索算法对生成序列的中间状态进行评价.语音识别多候选重估实验表明,在有限文本数据条件下,随着训练数据量的增加,本文提出的方法可以进一步降低识别字错误率(Character error rate,CER),且始终优于基于MLE的数据增强方法.当训练数据达到6 M词规模时,本文提出的方法使THCHS 30数据集的CER相对基线系统下降5.0%,AISHELL数据集的CER相对下降7.1%. 展开更多
关键词 数据增强 语言模型 生成对抗网络 强化学习 语音识别
在线阅读 下载PDF
双向长短时记忆模型训练中的空间平滑正则化方法研究 被引量:3
7
作者 李文洁 葛凤培 +1 位作者 张鹏远 颜永红 《电子与信息学报》 EI CSCD 北大核心 2019年第3期544-550,共7页
双向长短时记忆模型(BLSTM)由于其强大的时间序列建模能力,以及良好的训练稳定性,已经成为语音识别领域主流的声学模型结构。但是该模型结构拥有更大计算量以及参数数量,因此在神经网络训练的过程当中很容易过拟合,进而无法获得理想的... 双向长短时记忆模型(BLSTM)由于其强大的时间序列建模能力,以及良好的训练稳定性,已经成为语音识别领域主流的声学模型结构。但是该模型结构拥有更大计算量以及参数数量,因此在神经网络训练的过程当中很容易过拟合,进而无法获得理想的识别效果。在实际应用中,通常会使用一些技巧来缓解过拟合问题,例如在待优化的目标函数中加入L2正则项就是常用的方法之一。该文提出一种空间平滑的方法,把BLSTM模型激活值的向量重组成一个2维图,通过滤波变换得到它的空间信息,并将平滑该空间信息作为辅助优化目标,与传统的损失函数一起,作为优化神经网络参数的学习准则。实验表明,在电话交谈语音识别任务上,这种方法相比于基线模型取得了相对4%的词错误率(WER)下降。进一步探索了L2范数正则技术和空间平滑方法的互补性,实验结果表明,同时应用这2种算法,能够取得相对8.6%的WER下降。 展开更多
关键词 语音信号处理 空间平滑 双向长短时记忆模型(LSTM) 正则化 过拟合
在线阅读 下载PDF
面向口语统计语言模型建模的自动语料生成算法 被引量:1
8
作者 司玉景 肖业鸣 +2 位作者 徐及 潘接林 颜永红 《自动化学报》 EI CSCD 北大核心 2014年第12期2808-2814,共7页
在资源相对匮乏的自动语音识别(Automatic speech recognition,ASR)领域,如面向电话交谈的语音识别系统中,统计语言模型(Language model,LM)存在着严重的数据稀疏问题,本文提出了一种基于等概率事件的采样语料生成算法,白动生成领域相... 在资源相对匮乏的自动语音识别(Automatic speech recognition,ASR)领域,如面向电话交谈的语音识别系统中,统计语言模型(Language model,LM)存在着严重的数据稀疏问题,本文提出了一种基于等概率事件的采样语料生成算法,白动生成领域相关的语料,用来强化统计语言模型建模实验结果表明,加入本算法生成的采样语料可以缓解语言模型的稀疏性,从而提升整个语音识别系统的性能,在开发集上语言模型的困惑度相对降低7.5%,字错误率(Character error rate,CER)绝对降低0.2个点;在测试集上语言模型的困惑度相对降低6%,字错误率绝对降低0.4点. 展开更多
关键词 自动语音识别 资源匮乏 语言模型 等概率事件 语料生成算法
在线阅读 下载PDF
基于对抗训练的端到端语音翻译研究 被引量:4
9
作者 何文龙 高长丰 +1 位作者 黎塔 刘建 《信号处理》 CSCD 北大核心 2021年第5期893-901,共9页
为了进一步利用源文本数据来提高语音翻译的性能,本文提出了一种基于生成对抗网络的端到端语音翻译算法。通过加入判别网络来判断语音特征序列和文本特征序列的真伪,从而引导生成模型来学习文本真实序列的分布,以使语音序列特征分布更... 为了进一步利用源文本数据来提高语音翻译的性能,本文提出了一种基于生成对抗网络的端到端语音翻译算法。通过加入判别网络来判断语音特征序列和文本特征序列的真伪,从而引导生成模型来学习文本真实序列的分布,以使语音序列特征分布更加逼近文本特征序列的分布。引入了Wasserstein GAN(WGAN)来计算语音特征序列和文本特征序列通过判别器的标量似然值的Earth-Mover(EM)距离,来解决语音特征序列和文本特征序列存在长度不一致的问题。整个模型遵从多任务学习和对抗学习的训练准则,本文在How2数据集上和MuST-C英中数据集上验证了本文提出算法的有效性,该方法可以显著提升翻译质量。 展开更多
关键词 语音翻译 文本翻译 Wasserstein生成对抗网络 多任务学习
在线阅读 下载PDF
针对口音识别中冗余特征及长尾效应的有效方法
10
作者 杨壮 颜永红 黄志华 《应用声学》 CSCD 北大核心 2024年第3期498-504,共7页
口音识别是指在同一语种下识别不同的区域口音的过程。为了提高口音识别的准确率,采用了多种方法,取得了明显的效果。首先,为了解决声学特征中关键特征权重不突出的问题,引入了有效的注意力机制,并对多种注意力机制进行了比较和分析。... 口音识别是指在同一语种下识别不同的区域口音的过程。为了提高口音识别的准确率,采用了多种方法,取得了明显的效果。首先,为了解决声学特征中关键特征权重不突出的问题,引入了有效的注意力机制,并对多种注意力机制进行了比较和分析。通过模型自适应学习通道和空间维度的不同权重,提高了口音识别的性能。在Common Voice英语口音数据集上的实验结果表明,引入CBAM注意力模块是有效的,识别准确率相对提升了12.7%,精确度相对提升了17.9%,F1值相对提升了6.98%。之后,提出了一种树形分类方法来缓解数据集中的长尾效应,识别准确率最多相对提升了5.2%。受域对抗训练的启发,尝试通过对抗学习方法剔除口音特征中的冗余信息,使得准确率最多相对提升了3.4%,召回率最多相对提升了16.9%。 展开更多
关键词 口音识别 注意力机制 树形分类 对抗学习
在线阅读 下载PDF
基于递归神经网络的语音识别快速解码算法 被引量:17
11
作者 张舸 张鹏远 +1 位作者 潘接林 颜永红 《电子与信息学报》 EI CSCD 北大核心 2017年第4期930-937,共8页
递归神经网络(Recurrent Neural Network,RNN)如今已经广泛用于自动语音识别(Automatic Speech Recognition,ASR)的声学建模。虽然其较传统的声学建模方法有很大优势,但相对较高的计算复杂度限制了这种神经网络的应用,特别是在实时应用... 递归神经网络(Recurrent Neural Network,RNN)如今已经广泛用于自动语音识别(Automatic Speech Recognition,ASR)的声学建模。虽然其较传统的声学建模方法有很大优势,但相对较高的计算复杂度限制了这种神经网络的应用,特别是在实时应用场景中。由于递归神经网络采用的输入特征通常有较长的上下文,因此利用重叠信息来同时降低声学后验和令牌传递的时间复杂度成为可能。该文介绍了一种新的解码器结构,通过有规律抛弃存在重叠的帧来获得解码过程中的计算开销降低。特别地,这种方法可以直接用于原始的递归神经网络模型,只需对隐马尔可夫模型(Hidden Markov Model,HMM)结构做小的变动,这使得这种方法具有很高的灵活性。该文以时延神经网络为例验证了所提出的方法,证明该方法能够在精度损失相对较小的情况下取得2~4倍的加速比。 展开更多
关键词 语音识别 递归神经网络 解码器 跳帧计算
在线阅读 下载PDF
基于隐马尔可夫模型的非监督噪声功率谱估计 被引量:4
12
作者 许春冬 战鸽 +2 位作者 应冬文 李军锋 颜永红 《数据采集与处理》 CSCD 北大核心 2015年第2期359-364,共6页
噪声功率谱估计是语音增强算法的基本组成部分,传统算法大多采用启发式的估计方法,因而不能保证噪声估计值的统计最优。提出了一种基于极大似然的非监督噪声功率谱估计方法,采用隐马尔可夫模型(Hidden Markov model,HMM)在每个子带建立... 噪声功率谱估计是语音增强算法的基本组成部分,传统算法大多采用启发式的估计方法,因而不能保证噪声估计值的统计最优。提出了一种基于极大似然的非监督噪声功率谱估计方法,采用隐马尔可夫模型(Hidden Markov model,HMM)在每个子带建立语音和非语音对数功率谱的统计模型,模型包含语音和非语音两个高斯分量,其中非语音高斯分量的均值表示噪声功率谱估计值,根据最大期望(Expectation maximization,EM)算法得到包括噪声均值在内的HMM参数集。针对语音信号可能出现的长时缺失,对HMM引入了一些约束条件,保证了模型的稳定性。实验表明,该方法获得的极大似然噪声估计优于基于启发式的经典方法获得的噪声估计。 展开更多
关键词 语音增强 噪声功率谱估计 隐马尔可夫模型 极大似然准则 模型约束
在线阅读 下载PDF
心音信号MFCC特征向量提取方法的优化 被引量:12
13
作者 许春冬 周静 +1 位作者 应冬文 龙清华 《信号处理》 CSCD 北大核心 2019年第3期410-418,共9页
为了提高利用梅尔频率倒谱系数(Mel-frequency cepstral coefficients, MFCC)特征向量进行心音信号分类的准确率,本文提出以一种基于独立成分分析(independent component analysis, ICA)及权值优化的MFCC特征向量优化方法。首先,通过消... 为了提高利用梅尔频率倒谱系数(Mel-frequency cepstral coefficients, MFCC)特征向量进行心音信号分类的准确率,本文提出以一种基于独立成分分析(independent component analysis, ICA)及权值优化的MFCC特征向量优化方法。首先,通过消除趋势项、降噪、提取心动周期与基础心音分割等步骤对心音信号预处理;接着,对提取的基础心音信号做Mel频谱变换及倒谱分析提取MFCC特征向量,其中用ICA替代离散余弦变换去除分量间高阶量的相关性,同时采用相关系数为权值优化整体混合矩阵;最后,采用F比衡量特征向量贡献率,并以其为权值优化各维特征向量。通过提取MFCC特征向量采用支持向量机(support vector machine, SVM)的分类器识别第一心音及第二心音,并与人工标注心音状态集进行对比。实验结果表明,基于ICA及权值优化的MFCC特征向量在SVM分类器中识别率得到了有效的提升,且优化算法具备一定抗噪性能。 展开更多
关键词 心音 梅尔频率倒谱系数 独立成分分析 权值优化 支持向量机
在线阅读 下载PDF
基于概率语义分布的短文本分类 被引量:9
14
作者 马成龙 颜永红 《自动化学报》 EI CSCD 北大核心 2016年第11期1711-1717,共7页
在短文本分类中,面对特征稀疏的短文本,如何充分利用文本中的每一个词语成为关键.本文提出概率语义分布模型的思想,首先通过查询词矢量词典,将文本转换为词矢量数据;其次,在概率语义分布模型的假设下利用混合高斯模型对无标注的文本数... 在短文本分类中,面对特征稀疏的短文本,如何充分利用文本中的每一个词语成为关键.本文提出概率语义分布模型的思想,首先通过查询词矢量词典,将文本转换为词矢量数据;其次,在概率语义分布模型的假设下利用混合高斯模型对无标注的文本数据进行通用背景语义模型训练;利用训练数据对通用模型进行自适应得到各个领域的目标领域语义分布模型;最后,在测试过程中,计算短文本属于领域模型的概率,得到最终的分类结果.实验结果表明,本文提出的方法能够从一定程度上利用短文本所提供的信息,有效降低了对训练数据的依赖性,相比于支持向量机(Support vector machine,SVM)和最大熵分类方法性能相对提高了17.7%. 展开更多
关键词 短文本分类 词矢量 语义分布 高斯混合模型
在线阅读 下载PDF
英语篇章朗读质量的自动评分 被引量:3
15
作者 蒋同海 张俊博 +1 位作者 潘复平 颜永红 《应用声学》 CSCD 北大核心 2011年第6期418-426,共9页
本文研究了英语篇章朗读的计算机自动评分。本文根据人工评分的角度和准则,用语音识别技术分析语音,提取一系列评价特征,包括朗读完整度特征、发音准确度特征、流利度特征,然后通过SVM回归把这些评价特征映射为质量分数。在对4000名中... 本文研究了英语篇章朗读的计算机自动评分。本文根据人工评分的角度和准则,用语音识别技术分析语音,提取一系列评价特征,包括朗读完整度特征、发音准确度特征、流利度特征,然后通过SVM回归把这些评价特征映射为质量分数。在对4000名中学生的英语水平自动测试中,用3200名学生的人工评分训练系统,对其余800名学生的机器自动测试取得分差为1.18的良好结果,而专家评分与参考评分的平均分差为1.31。实验表明该项技术已达到实用化水平。 展开更多
关键词 自动评分 发音质量评估 语音识别
在线阅读 下载PDF
基于DHMM的低心率变异性心音的分割方法 被引量:4
16
作者 许春冬 周静 +2 位作者 应冬文 侯雷静 龙清华 《数据采集与处理》 CSCD 北大核心 2019年第4期605-614,共10页
针对现有心音定位分割方法精度有限的难题,提出了一种对心率变异性较低的信号建模分割方法。首先,通过集合经验模态分解(Ensemble empirical mode decomposition,EEMD)使用有效的本征模态函数(Intrinsic mode function,IMF)分量来表征... 针对现有心音定位分割方法精度有限的难题,提出了一种对心率变异性较低的信号建模分割方法。首先,通过集合经验模态分解(Ensemble empirical mode decomposition,EEMD)使用有效的本征模态函数(Intrinsic mode function,IMF)分量来表征心音信号,提高心音信号的可分析性;然后,通过基础心音与非基础心音间的高斯约束关系建立高斯混合模型(Gaussian mixture model,GMM);接着,优化隐马尔可夫模型(Hidden Markov model,HMM)并建立基于时间相关性的隐马尔可夫模型(Duration-dependent hidden Markov model,DHMM),更简洁地描述分割模型,降低算法复杂度;最后,通过时域特征区分出s1,收缩期,s2和舒张期。将本文算法与经典Hilbert算法和逻辑回归的隐半马尔科夫模型(Logistic regression hidden semi-Markov model,LRHSMM)算法进行了对比,实验结果表明,本文算法的检出正确率和运算耗时等评价指标更优。 展开更多
关键词 心音分割 集合经验模态分解 高斯建模 时域特征 基于时间相关性的隐马尔可夫模型
在线阅读 下载PDF
基于功率谱包络动态分割的鲁棒语音端点检测 被引量:1
17
作者 许春冬 王晶 +3 位作者 战鸽 应冬文 李军锋 颜永红 《北京理工大学学报》 EI CAS CSCD 北大核心 2015年第11期1189-1193,共5页
在复杂的声学环境中,由于环境噪声的干扰,导致声学特征的稳定性不够理想.为克服此难题,通常对决策结果在时间维度上进行平滑.然而,这些平滑过程本身没有考虑数据在时间维度上的结构特征,属于启发式的方法.该文采用动态分割的方法,将语... 在复杂的声学环境中,由于环境噪声的干扰,导致声学特征的稳定性不够理想.为克服此难题,通常对决策结果在时间维度上进行平滑.然而,这些平滑过程本身没有考虑数据在时间维度上的结构特征,属于启发式的方法.该文采用动态分割的方法,将语音的频谱包络在时间维度上分割成具有特征同一性的时间块,以分割块为单位计算能量特征,并进行语音/非语音决策,从而达到提高语音端点检测的稳定性目的.实验表明,提出的方法有效提高了语音端点检测的鲁棒性. 展开更多
关键词 语音端点检测 动态分割 聚类 最小描述长度准则
在线阅读 下载PDF
两扬声器配置下的串声消除系统参数优化设置 被引量:1
18
作者 许春冬 李军锋 +2 位作者 裘嫄 夏日升 颜永红 《计算机应用》 CSCD 北大核心 2014年第5期1503-1506,1525,共5页
针对三维声音两扬声器重放中基本上独立研究逆滤波器的设计或扬声器的配置等因素对串声消除系统(CCS)性能的影响,提出了采用频域最小均方(LS)估计逼近方法,系统考察这些因素之间的关联以及对串声消除性能优化的作用,并通过折中考虑CCS... 针对三维声音两扬声器重放中基本上独立研究逆滤波器的设计或扬声器的配置等因素对串声消除系统(CCS)性能的影响,提出了采用频域最小均方(LS)估计逼近方法,系统考察这些因素之间的关联以及对串声消除性能优化的作用,并通过折中考虑CCS的运算效率及系统性能获得了一组最优参数。实验采用通道分离度(CS)和性能误差(PE)两个指标对串声消除效果进行综合评价,仿真结果表明,该组最优参数能获得很好的串声消除效果。 展开更多
关键词 三维声音 扬声器配置 串声消除 逆滤波 客观评价
在线阅读 下载PDF
高斯超向量-支持向量机鉴别性语种识别系统
19
作者 梁春燕 安茂波 +2 位作者 刘振业 索宏彬 汪俊杰 《计算机工程与应用》 CSCD 2013年第2期174-176,180,共4页
支持向量机在语种识别技术中获得了广泛的研究和应用,并且达到和传统混合高斯模型相当的性能。高斯超向量-支持向量机系统将高斯混合模型与支持向量机有效地结合起来,采用高斯超向量核函数,以支持向量机作为后端分类器。重点介绍基于高... 支持向量机在语种识别技术中获得了广泛的研究和应用,并且达到和传统混合高斯模型相当的性能。高斯超向量-支持向量机系统将高斯混合模型与支持向量机有效地结合起来,采用高斯超向量核函数,以支持向量机作为后端分类器。重点介绍基于高斯超向量-支持向量机的语种识别系统,并和传统的高斯混合模型系统进行比较。在美国国家标准技术研究院2003年和2007年语种识别评测数据集上进行实验。实验结果表明,高斯超向量-支持向量机系统相对于混合高斯模型建模的方法,在长时数据上有较明显的性能优势。 展开更多
关键词 语种识别 高斯混合模型 支持向量机 高斯超矢量
在线阅读 下载PDF
基于非平稳系统辨识的心音包络自适应分割
20
作者 许春冬 周静 +1 位作者 应冬文 龙清华 《计算机工程》 CAS CSCD 北大核心 2020年第8期290-296,304,共8页
为实现心音信号的有效分割,提出一种基于非平稳系统辨识的心音信号特征包络自适应分割方法。根据非平稳系统辨识原理,提取心音信号特征包络并对包络作平滑与展宽处理。基于重尺度小波降噪信噪比与特征包络均值参数,创建自适应阈值函数... 为实现心音信号的有效分割,提出一种基于非平稳系统辨识的心音信号特征包络自适应分割方法。根据非平稳系统辨识原理,提取心音信号特征包络并对包络作平滑与展宽处理。基于重尺度小波降噪信噪比与特征包络均值参数,创建自适应阈值函数进行心音信号分割,同时利用包络与时域特征剔除因噪音及杂音引起的错误分割点。实验结果表明,该方法能够有效提取基础心音信号特征,分割精度达到89.21%,相比维奥拉积分包络分割法、改进型希尔伯特-黄变换包络双阈值分割法等对比方法分割精度更高、实时性更强。 展开更多
关键词 非平稳系统辨识 心音信号 心音分割 自适应阈值 包络提取
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部