期刊文献+
共找到456篇文章
< 1 2 23 >
每页显示 20 50 100
汉语双音节词中声调和音节音段信息的加工
1
作者 王曼 刘帅 +1 位作者 张家欢 布占廷 《心理学探新》 北大核心 2025年第4期331-338,共8页
音韵编码是言语产出中的重要环节,但研究多集中在音段信息加工,超音段信息加工尚未引起足够重视。使用掩蔽启动范式可以探究声调在汉语双音节词音韵编码过程中的作用。实验结果发现:(1)在双音节词编码早期,声调与音节音段的主效应和交... 音韵编码是言语产出中的重要环节,但研究多集中在音段信息加工,超音段信息加工尚未引起足够重视。使用掩蔽启动范式可以探究声调在汉语双音节词音韵编码过程中的作用。实验结果发现:(1)在双音节词编码早期,声调与音节音段的主效应和交互效应显著,共享的声调与音节音段表征显著促进命名;(2)在双音节词编码后期,声调独立效应显著,即当启动词与目标词仅共享声调表征时会促进命名。结果表明,声调作为韵律框架,具有编码稳定性及独立性,但仍受音节音段信息影响,具体表现为双音节词中音节-韵律框架的组合。作为汉语特色的韵律单元,声调的编码方式与WEAVER++模型中的理论一致。 展开更多
关键词 言语产出 声调 音段 心理加工
在线阅读 下载PDF
语音转换及相关技术综述 被引量:34
2
作者 李波 王成友 +2 位作者 蔡宣平 唐朝京 张尔扬 《通信学报》 EI CSCD 北大核心 2004年第5期109-118,共10页
给出了语音转换的定义,介绍了语音转换的用途,分析了表征说话人个性特征的语音参数,研究了语音转换的系统结构,对语音转换的实现主要从频谱包络和韵律两个方面的转换进行了研究讨论,分析并介绍了语音转换现在的发展水平及存在的问题。
关键词 语音处理 语音转换 频谱包络 韵律特征
在线阅读 下载PDF
小波变换用于信号突变的检测 被引量:37
3
作者 程俊 张璞 +1 位作者 戴善荣 易克初 《通信学报》 EI CSCD 北大核心 1995年第3期96-104,共9页
本文介绍了小波变换用于信号突变的检测原理,给出了实现小波变换的快速算法。语音的基音检测作为一个应用实例,在文中得到验证。理论与实验表明,利用小波变换检测基音与传统方法相比具有独到之处。
关键词 小波变换 信号突变 信号检测 信号处理
在线阅读 下载PDF
一种基于奇异值分解的带噪语音识别方法 被引量:10
4
作者 徐金甫 韦岗 梁树雄 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2001年第1期91-93,共3页
提出了一种抗噪声的语音识别方法 .用于训练和用于测试的语音信号在提取特征之前 ,均需经过相同的奇异值分解滤波 .本文还提出了一种滤波参数的选取方法 .实验证明 ,采用这种方法可以大幅度提高传统隐马尔可夫模型语音识别系统的抗噪声... 提出了一种抗噪声的语音识别方法 .用于训练和用于测试的语音信号在提取特征之前 ,均需经过相同的奇异值分解滤波 .本文还提出了一种滤波参数的选取方法 .实验证明 ,采用这种方法可以大幅度提高传统隐马尔可夫模型语音识别系统的抗噪声性能 . 展开更多
关键词 语音处理 语音识别 信号处理 抗噪声性能 奇异值分解滤波 隐弥可夫模型 噪声消减
在线阅读 下载PDF
一种基于非自回归模型的文本转语音方法
5
作者 郭璐璐 高尚 《南京师大学报(自然科学版)》 北大核心 2025年第5期129-138,共10页
文本转语音(Text-to-Speech,TTS)是一种将给定文本合成为语音的技术,具有广泛的应用前景.相比于自回归的TTS模型,非自回归的TTS模型在语音合成速度上有显著提升.然而,非自回归模型在长序列的语音合成任务中其合成速度和语音质量仍有提... 文本转语音(Text-to-Speech,TTS)是一种将给定文本合成为语音的技术,具有广泛的应用前景.相比于自回归的TTS模型,非自回归的TTS模型在语音合成速度上有显著提升.然而,非自回归模型在长序列的语音合成任务中其合成速度和语音质量仍有提升空间.为此,本文提出了一种基于非自回归的EnhanceSpeech模型.首先,该模型利用可学习的外部记忆向量简化注意力机制计算方式,有效减少了计算复杂度和内存占用,并提升了模型的推理速度.其次,通过引入基于分层挤压注意力的后处理网络,利用二维卷积将梅尔频谱图生成过程视为图像处理,显著提升了梅尔频谱图的生成质量.实验结果表明,EnhanceSpeech模型与自回归模型相比生成速度提高了60倍以上.此外,与同类非自回归模型相比,本文方法的性能突出,更接近领先的自回归模型水平. 展开更多
关键词 语音合成 自回归模型 非自回归模型 注意力机制 后处理网络
在线阅读 下载PDF
基于混合幅度差函数的基音提取算法 被引量:16
6
作者 刘建 郑方 +1 位作者 邓菁 吴文虎 《电子学报》 EI CAS CSCD 北大核心 2006年第10期1925-1928,共4页
为了减少基音周期提取中的倍频和半频错误,进行更准确的基音周期估计,提出一种基于混合幅度差函数的基音周期提取方法.分析比较了不同幅度差和自相关函数估计基音周期错误率的分布,结合两类典型幅度差函数的优点定义了混合幅度差函数;... 为了减少基音周期提取中的倍频和半频错误,进行更准确的基音周期估计,提出一种基于混合幅度差函数的基音周期提取方法.分析比较了不同幅度差和自相关函数估计基音周期错误率的分布,结合两类典型幅度差函数的优点定义了混合幅度差函数;进而基于混合幅度差函数,给出了使用历史信息进行校正的后处理方法.分析表明,所提方法可提高基音周期估计准确率,接近实时地确定基音周期,减少了传统基音周期估计因平滑处理而带来的误差或者动态规划处理带来的延迟.大量实验表明本文提出的基音周期提取方法比传统方法的错误率降低了13.8%. 展开更多
关键词 语音信息处理 基音周期提取 混合幅度差函数
在线阅读 下载PDF
基于最长次长匹配的汉语自动分词 被引量:14
7
作者 黄德根 朱和合 +2 位作者 王昆仑 杨元生 钟万勰 《大连理工大学学报》 CAS CSCD 北大核心 1999年第6期831-835,共5页
汉语自动分词是中文信息处理领域所特有的一个重要研究课题,机器翻译(MT)、自然语言理解(NLU)、情报检索(IR)等都需以自动分词作为基础. 为解决分词中的歧义问题,针对歧义切分字段的分布特点,提出一种基于最长次长匹... 汉语自动分词是中文信息处理领域所特有的一个重要研究课题,机器翻译(MT)、自然语言理解(NLU)、情报检索(IR)等都需以自动分词作为基础. 为解决分词中的歧义问题,针对歧义切分字段的分布特点,提出一种基于最长次长匹配原则的汉语自动分词方法,分词效果较好. 展开更多
关键词 语言处理 自动分词 机器翻译 最长匹配法 汉语
在线阅读 下载PDF
语音信号端点检测方法综述及展望 被引量:41
8
作者 刘华平 李昕 +1 位作者 徐柏龄 姜宁 《计算机应用研究》 CSCD 北大核心 2008年第8期2278-2283,共6页
端点检测是语音信号处理过程中非常重要的一步,它的准确性直接影响语音信号处理的速度和结果,因此端点检测方法的研究,特别是在噪声环境下端点检测的研究,一直是语音信号处理中的热点。从基于时域参数、频域参数、时频参数、模型匹配等... 端点检测是语音信号处理过程中非常重要的一步,它的准确性直接影响语音信号处理的速度和结果,因此端点检测方法的研究,特别是在噪声环境下端点检测的研究,一直是语音信号处理中的热点。从基于时域参数、频域参数、时频参数、模型匹配等方法的角度,较全面地回顾了端点检测方法的发展历程,对各种方法的优缺点进行了比较分析,并给出了这些方法的改进意见,对端点检测未来的研究方向进行了展望。 展开更多
关键词 语音信号处理 端点检测 鲁棒性
在线阅读 下载PDF
基于语音频谱包络抽取的MFCC算法 被引量:4
9
作者 李波 王成友 +2 位作者 杨聪 蔡宣平 张尔扬 《国防科技大学学报》 EI CAS CSCD 北大核心 2004年第4期42-45,共4页
MFCC可以更加准确地表示语音低频处的频谱包络,在语音转换中是一种很好的频谱包络表示方法;提出一种新的有效的求解MFCC的算法,先对频谱通过谐波抽取得到阶梯谱包络,再对阶梯谱包络进行Mel尺度变换,最后通过余弦变换求得MFCC参数。该方... MFCC可以更加准确地表示语音低频处的频谱包络,在语音转换中是一种很好的频谱包络表示方法;提出一种新的有效的求解MFCC的算法,先对频谱通过谐波抽取得到阶梯谱包络,再对阶梯谱包络进行Mel尺度变换,最后通过余弦变换求得MFCC参数。该方法实现简单,运算结果准确。 展开更多
关键词 语音处理 MFCC 语音识别 说话人识别 语音转换
在线阅读 下载PDF
基于Fisher线性判别分析的语音信号端点检测方法 被引量:20
10
作者 王明合 张二华 +1 位作者 唐振民 许昊 《电子与信息学报》 EI CSCD 北大核心 2015年第6期1343-1349,共7页
传统的语音端点检测方法对辅音,特别是受到噪声污染的清音部分与背景噪声之间分离能力不足。针对上述问题,该文提出一种基于Fisher线性判别分析的梅尔频率倒谱系数(F-MFCC)端点检测方法。将清音信号和背景噪声视为两类分类问题,采用Fis... 传统的语音端点检测方法对辅音,特别是受到噪声污染的清音部分与背景噪声之间分离能力不足。针对上述问题,该文提出一种基于Fisher线性判别分析的梅尔频率倒谱系数(F-MFCC)端点检测方法。将清音信号和背景噪声视为两类分类问题,采用Fisher准则求解具有判别信息的最佳投影方向,使得投影后的特征参数具有最小类内散度和最大类间散度,从而增大清音与背景噪声的可分离性。在不同语音库上的实验结果表明,F-MFCC能够在不同信噪比和背景噪声条件下提高语音端点检测的准确率。 展开更多
关键词 语音处理 语音端点检测 梅尔频率倒谱系数 FISHER线性判别分析
在线阅读 下载PDF
基于LabVIEW的LMS自适应滤波器的设计及其应用 被引量:10
11
作者 罗伟栋 肖光华 方勇 《上海大学学报(自然科学版)》 CAS CSCD 北大核心 2007年第4期456-460,共5页
传统自适应滤波器的研究大多局限于Matlab、Simulink等工具,由于不能设计成一个虚拟仪器或者一个应用系统,无法测试滤波器在工程应用中的实际性能.因此,该文以LMS算法为例,设计了一种基于LabVIEW的LMS自适应滤波器.实验证明,该滤波器有... 传统自适应滤波器的研究大多局限于Matlab、Simulink等工具,由于不能设计成一个虚拟仪器或者一个应用系统,无法测试滤波器在工程应用中的实际性能.因此,该文以LMS算法为例,设计了一种基于LabVIEW的LMS自适应滤波器.实验证明,该滤波器有效、性能良好,而且能很好地应用于语音信号的分析和处理. 展开更多
关键词 LABVIEW 自适应滤波器 LMS算法 语音处理
在线阅读 下载PDF
基于归一化互相关函数的基音检测算法 被引量:42
12
作者 鲍长春 樊昌信 《通信学报》 EI CSCD 北大核心 1998年第10期27-31,共5页
本文提出了一种归一化互相关函数基音检测算法(NCCFPDA——NormalizedCross-CorrelationFunctionPitchDetectionAlgorithm),该算法在基音检测主过程的前端和末端... 本文提出了一种归一化互相关函数基音检测算法(NCCFPDA——NormalizedCross-CorrelationFunctionPitchDetectionAlgorithm),该算法在基音检测主过程的前端和末端加入了有效的预处理和后处理技术,实验分析表明,该方法在一般噪声环境下,基音周期提取和清浊判决具有令人满意的效果。 展开更多
关键词 语音处理 基音检测 相关函数
在线阅读 下载PDF
一种新的对数能量谱熵语音端点检测方法 被引量:17
13
作者 赵欢 王纲金 赵丽霞 《湖南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2010年第7期72-77,共6页
将一种新的对数能量(LE)特征和谱熵(SE)特征相结合,提出一种新的对数能量谱熵(LESE)特征,采用模糊C均值聚类算法和贝叶斯信息准则算法进行LESE特征门限估计,并使用双门限法进行语音端点检测.在TIMIT连续语音库上的实验结果表明,相比于... 将一种新的对数能量(LE)特征和谱熵(SE)特征相结合,提出一种新的对数能量谱熵(LESE)特征,采用模糊C均值聚类算法和贝叶斯信息准则算法进行LESE特征门限估计,并使用双门限法进行语音端点检测.在TIMIT连续语音库上的实验结果表明,相比于能量谱熵(EE)法和对数能量(LE)法,在噪声环境下LESE法具有更好的检测性能,表现出更好的稳健性.当信噪比为-5 dB时,LESE法的检测错误率仅为18.02%,在信噪比为0~10 dB时,其检测错误率要明显低于EE法和LE法. 展开更多
关键词 语音处理 语音端点检测 对数能量谱熵 能量谱熵 对数能量
在线阅读 下载PDF
基于智能语音技术的闪电哨声波自动识别 被引量:6
14
作者 袁静 王子杰 +8 位作者 泽仁志玛 王志国 丰继林 申旭辉 吴鹏 王桥 杨德贺 王统领 周乐 《地球物理学报》 SCIE EI CAS CSCD 北大核心 2022年第3期882-897,共16页
闪电哨声波是一种重要的电磁波动,了解其传播特征及传播过程有助于揭开圈层电磁耦合机理.从卫星观测资料识别闪电哨声波通常需要将原始电磁波形进行滤波处理再转化为时频图像,最后采用目视方法识别图像中的色散状形态,整个过程消耗大量... 闪电哨声波是一种重要的电磁波动,了解其传播特征及传播过程有助于揭开圈层电磁耦合机理.从卫星观测资料识别闪电哨声波通常需要将原始电磁波形进行滤波处理再转化为时频图像,最后采用目视方法识别图像中的色散状形态,整个过程消耗大量人机时间和内存资源,不能满足张衡一号(ZH-1)卫星观测的海量电磁场数据处理的需求.针对该问题,鉴于闪电哨声波原始波形数据能够通过播放器产生降调的声音,本文打破以视觉分析为主的闪电哨声波研究惯例,首次采用语音智能技术研究其自动识别算法.首先,以张衡一号卫星感应磁力仪(SCM)的VLF波段的波形数据为研究对象,截取时间窗口为0.16 s的波形数据作为音频片段;然后对该片段进行去趋势处理;基于梅尔频率倒谱系数(MFCCs)能够刻画人耳的听觉机理,提取闪电哨声波的MFCCs特征;其次,构建长短期记忆(LSTM)神经网络并输入波形数据的MFCCs特征训练分类模型;最后利用MFCCs特征和训练得到的LSTM分类模型实现闪电哨声波自动识别.通过对10200数据集(5100段包含闪电哨声波,5100段无闪电哨声波)上开展实验发现:该方法的准确率为96.7%,召回率为84.2%,调和平均得分(F1-score)为90.0%,AUC(Area under Curve)评分为90.1%,而且消耗的时间成本是2.28 s,消耗内存资源是82.89 MB;当前最优的基于时频图的闪电哨声波识别算法在本数据集上的准确率为97.3%,内存消耗为233 MB,在CPU上处理0.16 s的片段数据所消耗的时间是6.71 s,内存消耗和时间消耗比较严重.相比而言,基于智能语音的闪电哨声波识别算法准确率略低0.6%,但能够节约66%的时间成本以及65%的内存资源.这表明该算法不仅仅适合从卫星观测的海量数据中快速准确识别出闪电哨声波,且更适合应用于星载识别. 展开更多
关键词 智能语音 张衡一号卫星 闪电哨声波 长短时记忆网络
在线阅读 下载PDF
基于DSP的语音处理系统设计 被引量:7
15
作者 曹晓琳 吴平 丁铁夫 《仪器仪表学报》 EI CAS CSCD 北大核心 2005年第z1期583-584,588,共3页
介绍了一种较强背景噪声下工作的语音处理系统。其语音采集部分由FPGA控制PCM语音编码器完成,语音增强部分以TMS320VC5402为核心实现。文章讨论了系统硬件设计、语音增强算法的原理及其DSP实现,给出了软件流程及实验结果。
关键词 语音处理 语音增强 DSP
在线阅读 下载PDF
车载环境下基于样本熵的语音端点检测方法 被引量:7
16
作者 赵欢 王纲金 +1 位作者 胡炼 彭秀娟 《计算机研究与发展》 EI CSCD 北大核心 2011年第3期471-476,共6页
在语音处理中一个关键性问题是如何准确找到语音的起止位置,目前提出许多的语音端点检测算法不能得到理想的检测结果.由于样本熵是近似熵的改进算法,提出车载环境下基于样本熵的语音端点检测方法,并采用模糊C均值聚类算法和贝叶斯信息... 在语音处理中一个关键性问题是如何准确找到语音的起止位置,目前提出许多的语音端点检测算法不能得到理想的检测结果.由于样本熵是近似熵的改进算法,提出车载环境下基于样本熵的语音端点检测方法,并采用模糊C均值聚类算法和贝叶斯信息判决算法进行样本熵特征门限估计,以及使用双门限法进行语音端点检测.在TIMIT连续语音库上的实验表明,车载噪声环境下,样本熵法和近似熵法的检测正确率均远高于谱熵法和能量谱熵法,而样本熵法相对于近似熵法具有更好的检测效果,特别是当信噪比小于等于0dB时,样本熵法的检测性能优于近似熵法近10%.因此,样本熵法在车载智能语音领域具有很好的应用前景,能够为车载导航提供准确的语音端点检测技术. 展开更多
关键词 语音处理 语音端点检测 样本熵 近似熵 谱熵 能量谱熵
在线阅读 下载PDF
基于伽马通滤波器组的听觉特征提取算法研究 被引量:30
17
作者 王玥 钱志鸿 +1 位作者 王雪 程光明 《电子学报》 EI CAS CSCD 北大核心 2010年第3期525-528,共4页
本文从模拟人类听觉角度出发,给出了基于人耳耳蜗听觉模型的伽马通滤波器组模型,测试语音通过该滤波器组输出得到了高维听觉特征向量.经过主成分分析和离散余弦变换,分别得到了可用于表征说话人的伽马通系数和伽马通滤波器倒谱系数及其... 本文从模拟人类听觉角度出发,给出了基于人耳耳蜗听觉模型的伽马通滤波器组模型,测试语音通过该滤波器组输出得到了高维听觉特征向量.经过主成分分析和离散余弦变换,分别得到了可用于表征说话人的伽马通系数和伽马通滤波器倒谱系数及其衍生特征.实验证明,与传统梅尔倒谱特征相比,采用本文提出特征的说话人识别系统在识别率及鲁棒性上均有明显提高. 展开更多
关键词 语音信号处理 伽马通滤波器 听觉特征提取 倒谱系数
在线阅读 下载PDF
一种新的基于自相关相似距离的语音信号端点检测方法 被引量:15
18
作者 陈斐利 朱杰 《上海交通大学学报》 EI CAS CSCD 北大核心 1999年第9期1097-1099,共3页
基于短时能量和隐马尔可夫模型(HMM)的端点检测方法都有一定的局限性,提出了自相关相似距离的概念,并讨论了基于自相关相似距离的新的端点检测方法.对自相关相似距离进行统计分析,给出了算法的具体实现步骤,阐述了门限的确定... 基于短时能量和隐马尔可夫模型(HMM)的端点检测方法都有一定的局限性,提出了自相关相似距离的概念,并讨论了基于自相关相似距离的新的端点检测方法.对自相关相似距离进行统计分析,给出了算法的具体实现步骤,阐述了门限的确定方法.用此方法、人工方法和HMM 模型方法得到的实验测试结果进行了比较.结果表明,即使在较低信噪比的环境下,采用本算法仍能较准确地检测出语音信号的端点位置. 展开更多
关键词 语音处理 端点检测 自相关相似距离 HMM
在线阅读 下载PDF
混沌、分形理论与语音信号处理 被引量:33
19
作者 韦岗 陆以勤 欧阳景正 《电子学报》 EI CAS CSCD 北大核心 1996年第1期34-39,共6页
本文旨在将新兴的混沌、分形理论引入语音信号处理。本文提出了一种新的语音信号相空间重构方法,分析、统计了语音信号最大Lyapunov指数及分维度的分布,并提出了基于分形码本的语音信号码激励线性预测编码新算法。本文的研究... 本文旨在将新兴的混沌、分形理论引入语音信号处理。本文提出了一种新的语音信号相空间重构方法,分析、统计了语音信号最大Lyapunov指数及分维度的分布,并提出了基于分形码本的语音信号码激励线性预测编码新算法。本文的研究表明,混沌、分形理论在语音信号处理中有良好的应用前景。 展开更多
关键词 混沌理论 分形理论 语音信号处理
在线阅读 下载PDF
一种基于分带谱熵和谱能量的语音端点检测算法 被引量:12
20
作者 李如玮 鲍长春 《北京工业大学学报》 CAS CSCD 北大核心 2007年第9期920-924,共5页
语音端点检测的精确度直接影响语音识别的准确度.在噪声环境下,语音端点检测很困难.信噪比下降,语音端点检测的正确率也随之下降,同时,噪声类型的变化影响端点检测的正确率.为此,提出了一种改进的、适合在电话语音城市名识别系统中应用... 语音端点检测的精确度直接影响语音识别的准确度.在噪声环境下,语音端点检测很困难.信噪比下降,语音端点检测的正确率也随之下降,同时,噪声类型的变化影响端点检测的正确率.为此,提出了一种改进的、适合在电话语音城市名识别系统中应用的端点检测算法,并结合分带谱熵和谱能量形成了一个新的特征参数集,利用该参数集进行端点检测,弥补了分别采用分带谱熵和谱能量进行端点检测的缺陷,提高了检测性能. 展开更多
关键词 语音处理 语音识别 谱分析 端点检测 分带谱熵
在线阅读 下载PDF
上一页 1 2 23 下一页 到第
使用帮助 返回顶部