期刊文献+
共找到16篇文章
< 1 >
每页显示 20 50 100
基于自监督预训练模型和NWCE的口吃语音分类
1
作者 殷志鹏 徐新洲 《中北大学学报(自然科学版)》 2025年第1期19-26,共8页
口吃语音分类旨在利用语音信号对不同口吃类别进行分类识别,而现有相关研究没有充分考虑自监督预训练模型表示嵌入的时序特性,且只简单地表征了口吃语音数据的类别不平衡性。为此,本文提出一种基于自监督预训练模型和非线性加权交叉熵(N... 口吃语音分类旨在利用语音信号对不同口吃类别进行分类识别,而现有相关研究没有充分考虑自监督预训练模型表示嵌入的时序特性,且只简单地表征了口吃语音数据的类别不平衡性。为此,本文提出一种基于自监督预训练模型和非线性加权交叉熵(NWCE)损失的口吃语音分类方法。该方法首先利用自监督预训练模型提取副语言表示嵌入,然后通过带自注意力机制的双向长短期记忆网络模型,捕捉嵌入中显著的时序特征和上下文信息,最后利用非线性加权交叉熵损失来关注样本较少的口吃语音类别。在口吃语音分类数据集上的实验结果表明,本文方法通过学习语音中自监督预训练模型多层表示嵌入的时序信息,并且通过NWCE充分描述了各口吃类别数据间的关系,取得了比现有方法更好的口吃语音分类性能。 展开更多
关键词 计算副语言 口吃语音分类 自监督预训练模型 非线性加权交叉熵损失
在线阅读 下载PDF
基于支持向量机的变异语音分类研究 被引量:7
2
作者 王欢良 韩纪庆 张磊 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2003年第4期389-393,共5页
变异语音的训练样本有限 ,采用传统的分类方法进行分类 ,效果不够理想 ,而支持向量机方法在有限样本情况下可以保持很好的分类推广能力 .采用支持向量机方法进行变异语音分类 ,提取基频和TEO基频作为变异语音分类的特征 ,讨论了样本预... 变异语音的训练样本有限 ,采用传统的分类方法进行分类 ,效果不够理想 ,而支持向量机方法在有限样本情况下可以保持很好的分类推广能力 .采用支持向量机方法进行变异语音分类 ,提取基频和TEO基频作为变异语音分类的特征 ,讨论了样本预处理和参数选择等问题 .提出了直接截取和DTW规正两种方法来解决语音样本特征向量长度不一致的问题 .基于TEO基频特征 ,采用指数径向基函数 (ERBF)内核 ,对应力(G -force)影响下的变异语音进行分类 ,分类正确率可达到 99 2 % ,比传统的贝叶斯分类器和HMM分类器 ,分类性能分别平均提高了 12 6 %和 6 0 % .实验结果表明 ,采用支持向量机方法进行变异语音分类是可行的 . 展开更多
关键词 支持向量机 变异语音分类 样本预处理 参数选择 TE0基频 语音信号处理
在线阅读 下载PDF
一种采用栈自动编码机的语音分类算法 被引量:4
3
作者 马鸿飞 赵月娇 +1 位作者 刘珂 刘浩 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2017年第5期13-17,共5页
为提高语音清音、浊音和静默帧的分类准确率,提出了一种基于栈自动编码机的语音分类新方法.该方法由栈自动编码机和Softmax分类器组成的深度神经网络实现.首先,提取子带信号强度、残差信号峰值、增益、基音周期和线谱频率作为训练序列... 为提高语音清音、浊音和静默帧的分类准确率,提出了一种基于栈自动编码机的语音分类新方法.该方法由栈自动编码机和Softmax分类器组成的深度神经网络实现.首先,提取子带信号强度、残差信号峰值、增益、基音周期和线谱频率作为训练序列无监督训练栈自动编码机;然后,使用栈自动编码机的输出对Softmax分类器进行有监督训练;最后,有监督微调整个网络,得到最终网络参数.实验结果表明,在不同背景噪声及不同信噪比下,文中算法的分类准确率均优于传统算法的,且信噪比越低,性能优势越明显. 展开更多
关键词 深度学习 栈自动编码机 语音处理 语音分类
在线阅读 下载PDF
基于模式识别的语音分类方法 被引量:2
4
作者 朱琦 酆广增 肖海勇 《南京邮电学院学报》 2000年第4期29-33,共5页
对语音的浊 /清分类方法进行了讨论 ,并着重研究了基于多个特征参数、应用模式识别理论的语音分类系统。实验表明 ,采用Fisher分类器实现的语音分类方法 ,对训练内语音分类准确率可达98 6 % ,而训练外语音分类准确率也可达 96 7%。
关键词 语音数据处理 模式识别 语音分类
在线阅读 下载PDF
一种基于语音分类的清晰度客观评价算法
5
作者 张雄伟 沈刘平 +2 位作者 曹铁勇 杨吉斌 孙新建 《解放军理工大学学报(自然科学版)》 EI 2007年第2期103-107,共5页
为了能方便、快捷、可靠地对失真语音进行语音清晰度性能评价,提出了一种基于语音分类的加权巴克谱失真语音清晰度客观评价算法SC-W BSD。该算法提出在巴克域中对清音帧、浊音帧及过渡音帧巴克带谱失真进行加权来求失真语音的客观失真... 为了能方便、快捷、可靠地对失真语音进行语音清晰度性能评价,提出了一种基于语音分类的加权巴克谱失真语音清晰度客观评价算法SC-W BSD。该算法提出在巴克域中对清音帧、浊音帧及过渡音帧巴克带谱失真进行加权来求失真语音的客观失真测度。通过分析3类语音的巴克谱失真测度与DRT分的相关程度,提出一组以相关系数的幂次方为权重的有效SC-W BSD权重矢量。实验结果表明,SC-W BSD方法和DRT分的相关度达到了0.924 73,与巴克谱失真测度算法相比提高了4%。 展开更多
关键词 语音清晰度 客观评价 语音分类 加权巴克谱失真 相关度
在线阅读 下载PDF
二进小波变换的语音分类及其应用
6
作者 吴强 《空军雷达学院学报》 2005年第3期65-68,共4页
提出了一种基于Daubechies8二进小波变换的语音分类算法.该算法利用各分解尺度上的小波系数计算出语音分类的特征参数,并通过有限状态机模型将每帧语音分为5类,它们与SMV语音编码算法中所需类别完全兼容,因此可将其应用于SMV算法中.仿... 提出了一种基于Daubechies8二进小波变换的语音分类算法.该算法利用各分解尺度上的小波系数计算出语音分类的特征参数,并通过有限状态机模型将每帧语音分为5类,它们与SMV语音编码算法中所需类别完全兼容,因此可将其应用于SMV算法中.仿真结果表明:基于该语音分类方案的SMV编码算法在保持高质量语音的同时,实现了变速率编码,在话音质量和带宽占用之间达到了良好的均衡. 展开更多
关键词 二进小波变换 语音分类 语音编码
在线阅读 下载PDF
基于线性预测能量谱系数的自然语音和耳语音的分类研究 被引量:1
7
作者 姚真真 胡金瑶 艾斯卡尔·艾木都拉 《现代电子技术》 2023年第2期85-90,共6页
在进行语音识别之前对自然语音和耳语音进行预分类,再分别放入各自的识别系统,可以提高耳语语音识别系统的识别性能。基于此,文中提出一个新的特征线性预测能量谱系数(LPESC),在该特征的提取过程中,对提取到的频谱图进行切分,以便获取... 在进行语音识别之前对自然语音和耳语音进行预分类,再分别放入各自的识别系统,可以提高耳语语音识别系统的识别性能。基于此,文中提出一个新的特征线性预测能量谱系数(LPESC),在该特征的提取过程中,对提取到的频谱图进行切分,以便获取到更多的语音信息,并将其用于耳语音分类。此外,还特别设计4种不同的滤波器组,并将提取到的特征应用于7个分类器上。实验结果表明,密集的均匀三角滤波器组更加适合提取该特征,在7种传统分类器上均有较好的分类效果,其中SVM分类效果最好。最后,对比LPESC与传统特征(39维的LFCC和MFCC)在7种分类器上的分类效果,验证新特征的有效性。实验还发现,女生的耳语音有更好的分类效果。 展开更多
关键词 语音分类 语音识别 语音 线性预测能量谱系数 特征提取 频谱图切分 结果分析 效果验证
在线阅读 下载PDF
一种基于灰关联分析的语音/音乐分类方法 被引量:8
8
作者 陈功 张雄伟 《声学技术》 CSCD 北大核心 2007年第2期262-267,共6页
针对音频信号的特点,提出了一种将灰关联分析应用于语音/音乐信号的分类方法,并给出了对音频信号进行灰关联分析的方法和步骤。利用语音和音乐信号的短时能量均方根的概率统计特征值建立了目标的参考数据和比较数据,进行了不同语音和音... 针对音频信号的特点,提出了一种将灰关联分析应用于语音/音乐信号的分类方法,并给出了对音频信号进行灰关联分析的方法和步骤。利用语音和音乐信号的短时能量均方根的概率统计特征值建立了目标的参考数据和比较数据,进行了不同语音和音乐信号的灰关联分析,确定了目标分类的判据,并对两类信号以及含有独立两类信号的音频信号进行了分类。仿真结果表明:基于单特征值的音频信号灰关联分析方法实现过程简单,分类平均准确率达到90%,优于文献[4]中基于1种和2种特征值的分类性能。 展开更多
关键词 灰关联 特征 语音和音乐分类
在线阅读 下载PDF
变码率分类型实时语音声码器
9
作者 李碧洲 姚峰英 张敏 《电子学报》 EI CAS CSCD 北大核心 1999年第5期136-138,共3页
本文提出的声码器将语音分成静音、清音、浊音和混合音四类.用自适应方法进行分频带清浊音判决和有声/无声判决,提高了分类算法的稳定性、准确性和灵活性,还保持了混合语音的音质,且无须对清浊音判决结果进行编码.对清音和浊音的... 本文提出的声码器将语音分成静音、清音、浊音和混合音四类.用自适应方法进行分频带清浊音判决和有声/无声判决,提高了分类算法的稳定性、准确性和灵活性,还保持了混合语音的音质,且无须对清浊音判决结果进行编码.对清音和浊音的频谱分别采用不同的LSP量化表进行编码,从而用标量量化器替代了矢量量化器,降低了复杂度.声码器的码率最高24kbps,最低为100bps,平均码率14kbps.实时软件系统的延迟时间约03秒.用40MHzTMS320C50定点DSP实现了解码与合成部分的实时处理,平均运算量为113MIPS. 展开更多
关键词 变码率 语音分类 声码器
在线阅读 下载PDF
一种基于噪声模型的语音/噪声分类方法
10
作者 吴边 任晓林 +1 位作者 刘重庆 张亚昕 《上海交通大学学报》 EI CAS CSCD 北大核心 2004年第9期1528-1531,共4页
提出了一种可用于嵌入式ASR系统的语音/噪声分类的新方法,该方法利用一个噪声模型,对每帧信号的评价值进行语音/噪声分类.实验表明,该方法可以有效地区分语音和噪声,并表现出在各种噪声环境和不同信噪比条件下的鲁棒性.该算法已经集成... 提出了一种可用于嵌入式ASR系统的语音/噪声分类的新方法,该方法利用一个噪声模型,对每帧信号的评价值进行语音/噪声分类.实验表明,该方法可以有效地区分语音和噪声,并表现出在各种噪声环境和不同信噪比条件下的鲁棒性.该算法已经集成进一个ASR系统,并在Com-paqiPAQ上进行了测试,其计算代价不到整个系统代价的10%. 展开更多
关键词 语音识别 语音/噪声分类 噪声鲁棒性
在线阅读 下载PDF
一种快速稳健的语音/音乐分类方法 被引量:4
11
作者 贾兰兰 《信息与电子工程》 2008年第4期281-283,288,共4页
介绍了一种简单而有效的区分语音/音乐的方法。该方法仅提取唯一的区别性特征,即改进型低能量帧率(MLER),应用贝叶斯最大后验分类器判断每1段的音频类别,再根据音频流的相邻段有很强的相关性这一特点,采用一种新颖的基于相关性的后验决... 介绍了一种简单而有效的区分语音/音乐的方法。该方法仅提取唯一的区别性特征,即改进型低能量帧率(MLER),应用贝叶斯最大后验分类器判断每1段的音频类别,再根据音频流的相邻段有很强的相关性这一特点,采用一种新颖的基于相关性的后验决策方法对分类器的分类结果进行进一步改善。实验结果表明,该方法算法简单,分类效果好。 展开更多
关键词 语音/音乐分类 改进型低能量帧率 后验决策方法 低能量帧率
在线阅读 下载PDF
基于决策树的语音与乐音信号分类算法
12
作者 伍小二 应忍冬 刘佩林 《电声技术》 2012年第4期38-41,共4页
提出一种基于决策的语音与乐音信号的分类算法,通过提取输入信号的幅度信息、频谱分布特征信息用于信号的分类的特征参数,再利用决策树中的ID3算法进行分类,并对分类结果进行后期调整,进一步提高算法分类的正确率。实验结果表明,提出的... 提出一种基于决策的语音与乐音信号的分类算法,通过提取输入信号的幅度信息、频谱分布特征信息用于信号的分类的特征参数,再利用决策树中的ID3算法进行分类,并对分类结果进行后期调整,进一步提高算法分类的正确率。实验结果表明,提出的语音与乐音信号分类算法取得了平均96.12%的正确率。 展开更多
关键词 语音与乐音分类 频谱幅度 频谱分布 决策树
在线阅读 下载PDF
基于多示例学习的语音内容分类算法 被引量:2
13
作者 许薇 姚佳奇 +1 位作者 燕继坤 欧阳喜 《信息工程大学学报》 2020年第6期674-679,共6页
多示例学习为语音内容分类提供了一种新思路。提出将语音内容分类任务转化为多示例学习问题,首先通过音素识别器将语音转化为音素序列,其次对音素序列进行tri-phone建模并分割成多个片段,然后对片段进行特征提取,最后使用基于支持向量... 多示例学习为语音内容分类提供了一种新思路。提出将语音内容分类任务转化为多示例学习问题,首先通过音素识别器将语音转化为音素序列,其次对音素序列进行tri-phone建模并分割成多个片段,然后对片段进行特征提取,最后使用基于支持向量机和卷积神经网络的多示例学习算法对语音内容进行分类。在真实数据集上的实验结果显示,相比于非多示例学习方法,多示例学习技术的引入使平均准确率和F1值得到明显提升。 展开更多
关键词 多示例学习 语音内容分类 音素 支持向量机 卷积神经网络
在线阅读 下载PDF
基于预训练模型的多示例语音内容分类
14
作者 张建宜 姚佳奇 +2 位作者 褚衍杰 燕继坤 梁杰 《信息工程大学学报》 2022年第2期141-147,共7页
语音内容分类主要用于对大批量信号进行自动处理,并基于用户的兴趣选择语音文件。据此提出了一种新的分类方法,在多示例学习框架下,使用无监督语音表示学习对大规模未标记数据进行预训练,得到用于提取语音深层表示的预训练模型,提取的... 语音内容分类主要用于对大批量信号进行自动处理,并基于用户的兴趣选择语音文件。据此提出了一种新的分类方法,在多示例学习框架下,使用无监督语音表示学习对大规模未标记数据进行预训练,得到用于提取语音深层表示的预训练模型,提取的语音表示作为下游分类器的输入。真实语音数据集上的实验结果表明,多示例学习在处理语音分类问题上具有优势,提出的方法能够提高分类的效果,在平均准确率指标上优于3种基线方法。 展开更多
关键词 语音内容分类 多示例学习 预训练模型 无监督语音表示学习
在线阅读 下载PDF
变异语音处理的研究进展 被引量:3
15
作者 张磊 韩纪庆 王承发 《电子学报》 EI CAS CSCD 北大核心 2003年第3期411-418,共8页
本文讨论了变异语音处理技术及其研究进展 ,分析了变异情况对语音识别性能产生的影响 ,综述了变异语音分类和变异语音识别方法 ,探讨了变异语音处理研究中存在的问题及未来的研究重点 .
关键词 变异语音 语音分类 顽健语音识别 语音处理
在线阅读 下载PDF
基于HHT的声频传感器车辆分类识别 被引量:6
16
作者 毕超 冯玉田 +1 位作者 李园辉 刁志蕙 《电声技术》 2016年第6期48-52,共5页
针对传统语音信号识别过程中出现的识别率较低或者是计算时间复杂度高的问题,提出了基于希尔伯特黄变换(HHT)的快速声频传感器车辆识别方法。该方法将HHT算法和语音信号特征提取中常用的梅尔倒谱系数(MFCC)相结合,形成一种新的特征提取... 针对传统语音信号识别过程中出现的识别率较低或者是计算时间复杂度高的问题,提出了基于希尔伯特黄变换(HHT)的快速声频传感器车辆识别方法。该方法将HHT算法和语音信号特征提取中常用的梅尔倒谱系数(MFCC)相结合,形成一种新的特征提取方法。实验中,将这种方法分别与K-近邻算法(K-NN)、支持向量机算法(SVM)和稀疏表示分类算法(SRC)配合进行语音信号识别,结果表明,该特征提取方法与K-NN分类算法配合,在识别率和算法运行效率方面具有明显的优势。 展开更多
关键词 语音分类识别 希尔伯特黄变换(HHT) 特征提取
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部