期刊文献+
共找到781篇文章
< 1 2 40 >
每页显示 20 50 100
基于IP包拆分重组技术的混合语音压缩编码算法研究
1
作者 李凌云 李肖克 +2 位作者 陈奕钊 王国法 王辉 《电子技术应用》 2025年第2期70-74,共5页
针对某特殊通信网业务系统中,在10 kb/s的窄带信道上传输1路标准G.729编码格式的VoIP语音数据的特殊通信场景,提出一种基于IP包拆分重组技术的混合语音压缩编码算法,将G.729压缩后的语音数据进行解压缩,再通过AMBE进行二次压缩,结合IP... 针对某特殊通信网业务系统中,在10 kb/s的窄带信道上传输1路标准G.729编码格式的VoIP语音数据的特殊通信场景,提出一种基于IP包拆分重组技术的混合语音压缩编码算法,将G.729压缩后的语音数据进行解压缩,再通过AMBE进行二次压缩,结合IP包拆分重组技术,保留语音数据中有效载荷,剔除多余开销数据,减小语音数据传输所需带宽。仿真实验验证了该方法的有效性,当G.729和AMBE的语音压缩编码速率分别为8 kb/s、2.4 kb/s,载荷长度为20 ms,IP包打包周期为8包时,实验表明无论在何种光路状态下,平均句子可懂度达85%以上,话音信号等级达3级以上,满足话音传输系统要求。 展开更多
关键词 语音压缩编码 G.729 AMBE IP包拆分重组 窄带通信
在线阅读 下载PDF
听到“牛黄”能想到“黄牛”吗?——口语识别中的语音位置编码机制
2
作者 韩海宾 李兴珊 《心理科学进展》 CSSCI CSCD 北大核心 2024年第9期1488-1501,共14页
在众多语言中,都存在一系列词汇,经过语音位置转置后仍能有效成词,典型如中文中的“牛黄”与“黄牛”。阐明这类可转置词汇在语言理解过程中的编码方式,是一项至关重要的研究课题。在阅读领域,学者们已就词汇的位置编码机制展开了讨论,... 在众多语言中,都存在一系列词汇,经过语音位置转置后仍能有效成词,典型如中文中的“牛黄”与“黄牛”。阐明这类可转置词汇在语言理解过程中的编码方式,是一项至关重要的研究课题。在阅读领域,学者们已就词汇的位置编码机制展开了讨论,然而针对口语加工中语音位置编码的认知机制,至今仍存在序列−灵活编码之争:早期口语识别理论认为语音位置编码主要以序列编码方式为主,而近年来的研究则发现,音位、音节和句子等层面上存在以灵活编码为主的语音位置编码方式。未来研究应深入探索与口语识别中语音编码相关的认知机理、神经机制、语言获得以及人工智能等重要问题,由于汉字词在形音对应关系和语音加工单元等方面独具特殊性,后续研究应对汉字词的语音位置编码予以特别关注。 展开更多
关键词 口语识别 语音位置编码 汉字词
在线阅读 下载PDF
基于Transformer的多编码器端到端语音识别 被引量:2
3
作者 庞江飞 孙占全 《电子科技》 2024年第4期1-7,共7页
当前广泛使用的Transformer模型具有良好的全局依赖关系捕捉能力,但其在浅层时容易忽略局部特征信息。针对该问题,文中提出了一种使用多个编码器来改善语音特征信息提取能力的方法。通过附加一个额外的卷积编码器分支来强化对局部特征... 当前广泛使用的Transformer模型具有良好的全局依赖关系捕捉能力,但其在浅层时容易忽略局部特征信息。针对该问题,文中提出了一种使用多个编码器来改善语音特征信息提取能力的方法。通过附加一个额外的卷积编码器分支来强化对局部特征信息的捕捉,弥补浅层Transformer对局部特征信息的忽视,有效实现音频特征序列全局和局部依赖关系的融合,即提出了基于Transformer的多编码器模型。在开源中文普通话数据集Aishell-1上的实验表明,在没有外部语言模型的情况下,相比于Transformer模型,基于Transformer的多编码器模型的字符错误率降低了4.00%。在内部非公开的上海话方言数据集上,文中所提模型的性能提升更加明显,其字符错误率从19.92%降低至10.31%,降低了48.24%。 展开更多
关键词 TRANSFORMER 语音识别 端到端 深度神经网络 编码 多头注意力 特征融合 卷积分支网络
在线阅读 下载PDF
基于混合语音压缩编码技术的综合通信业务系统设计
4
作者 李凌云 陈奕钊 +3 位作者 王国法 蒋剑伟 周品臣 谢臣 《广东通信技术》 2024年第8期63-69,共7页
压缩编码技术是语音通信的关键技术的之一。针对语音数据传输需采用标准G.729编码格式,且数据通信链路速率为10 kbit/s的窄带数据传输场景,提出了基于G.729+AMBE的混合语音压缩编码技术,研制了综合通信业务系统样机,实现了低速率下的语... 压缩编码技术是语音通信的关键技术的之一。针对语音数据传输需采用标准G.729编码格式,且数据通信链路速率为10 kbit/s的窄带数据传输场景,提出了基于G.729+AMBE的混合语音压缩编码技术,研制了综合通信业务系统样机,实现了低速率下的语音和即时通信业务传输。测试结果表明,在G.729、AMBE的语音压缩编码速率分别为8 kbit/s、2.4 kbit/s时,语音质量MOS主观评价等级为4级,即时通信文件接收延时在2.1 s左右,满足窄带通信链路中语音业务和即时通信业务的传输要求。 展开更多
关键词 语音压缩编码 G.729 AMBE 低速率 数据通信
在线阅读 下载PDF
言语产生中双词素词的语音编码 被引量:7
5
作者 周晓林 庄捷 于淼 《心理学报》 CSSCI CSCD 北大核心 2002年第3期242-247,共6页
采用同音判断和音节监控方法 ,考察言语产生中双词素词语音激活的特点。选用以偏正结构的双词素词为名称的图片和与双词素词中首尾两个词素同音的两组探测字作为实验材料 ,探测字在图片呈现后 5 0毫秒 (实验一 ) ,或图片呈现前 130 0毫... 采用同音判断和音节监控方法 ,考察言语产生中双词素词语音激活的特点。选用以偏正结构的双词素词为名称的图片和与双词素词中首尾两个词素同音的两组探测字作为实验材料 ,探测字在图片呈现后 5 0毫秒 (实验一 ) ,或图片呈现前 130 0毫秒 (实验二 )出现 ,要求被试判断出现的字是否与图片名称中任何一个词素同音。实验结果与绝大部分言语产生理论的预期相反 ,对图片名称第一词素的反应慢于第二词素。考虑到首尾两个词素对整词意义贡献的差别 ,作者把实验结果解释为词素意义对语音激活的作用 :第二词素的语义重要性决定了对应音节激活的快速性 ,双词素词中词素音位激活的速度和时间性受词义和词素意义激活程度的影响 ,而不完全取决于词素发音的序列性。实验不支持音位编码从左到右。 展开更多
关键词 言语产生 音位编码 语音编码 序列性加工 音节监控 同音判断
在线阅读 下载PDF
中低速率语音编码技术的发展及应用 被引量:6
6
作者 温斌 尹建琪 吴善培 《电信科学》 北大核心 1996年第10期35-38,共4页
本文简要介绍了语音编码技术的产生与发展的历史,着重概述了当前中低速率语音编码技术的发展现状及各应用领域所采用的标准算法。
关键词 语音编码 波形编码 声码器 语音压缩
在线阅读 下载PDF
最新的ITU-T嵌入式变速率语音编码关键技术 被引量:9
7
作者 李海婷 范睿 +4 位作者 朱恒 刘泽新 鲍长春 贾懋珅 李锐 《电声技术》 2006年第11期50-55,58,共7页
介绍了ITU-T的新一代语音编码标准G.729.1的编码器、译码器原理,讨论了此标准实现码流嵌入式所采用的关键技术:嵌入式的码激励线性预测编码技术、时域频带扩展技术以及时域混叠抵消的预测变换编码技术,并通过客观评测验证了G.729.1语音... 介绍了ITU-T的新一代语音编码标准G.729.1的编码器、译码器原理,讨论了此标准实现码流嵌入式所采用的关键技术:嵌入式的码激励线性预测编码技术、时域频带扩展技术以及时域混叠抵消的预测变换编码技术,并通过客观评测验证了G.729.1语音编码标准的高性能。 展开更多
关键词 语音编码 音频编码 嵌入式编解码器
在线阅读 下载PDF
基于局部余弦变换的2.4kb/s低比特率语音编码 被引量:3
8
作者 董恩清 汪一鸣 +2 位作者 李宏亮 侯兴松 刘贵忠 《西安交通大学学报》 EI CAS CSCD 北大核心 2003年第4期388-391,共4页
系统地设计了一个基于局部余弦变换的 2 4kb/s低比特率的语音编码器 .对局部余弦变换系数采用分维矢量量化方法进行量化 ,码书设计采用LGB算法 .编码中的码书搜索采用树形快速搜索算法 .通过主观非正式听力测试和客观参数评价 ,从理解... 系统地设计了一个基于局部余弦变换的 2 4kb/s低比特率的语音编码器 .对局部余弦变换系数采用分维矢量量化方法进行量化 ,码书设计采用LGB算法 .编码中的码书搜索采用树形快速搜索算法 .通过主观非正式听力测试和客观参数评价 ,从理解性和自然度两方面来看 ,用设计的 2 4kb/s低比特率的编码方法编码的语音质量比FS10 15 (LPC 10e)编码标准编码的语音质量要好 ,而且具有较强的鲁棒性 。 展开更多
关键词 局部余弦变换 语音编码 低比特率 变换编码 矢量量化
在线阅读 下载PDF
基于奇异值分解的低速率波形内插语音编码算法 被引量:13
9
作者 王贵平 鲍长春 张鹏 《电子学报》 EI CAS CSCD 北大核心 2006年第1期135-140,共6页
波形内插(WI)语音编码模型作为当今最具潜力的低速率语音编码方案之一,因其良好的性能,越来越受到人们的重视.本文基于一种奇异值分解(SVD)的特征波形分解方法,利用语音信号的感知特性,将二维特征波形的幅度谱分成基本矩阵、过渡矩阵和... 波形内插(WI)语音编码模型作为当今最具潜力的低速率语音编码方案之一,因其良好的性能,越来越受到人们的重视.本文基于一种奇异值分解(SVD)的特征波形分解方法,利用语音信号的感知特性,将二维特征波形的幅度谱分成基本矩阵、过渡矩阵和补充矩阵,并采用了不同的量化方法,有效地降低了运算复杂度;另外,本文根据语音信号时变特性,将三个矩阵分为三种组合模式表示特征波形幅度谱,并引入周期因子和能量熵来衡量矩阵周期程度,解决了奇异值分解后参数难于量化的问题,提高了编码效率.主观A/B测试表明,本文提出的2.4kbps SVD-WI编码器的重建语音质量略好于2·4kbps MELP编码器. 展开更多
关键词 语音编码 波形内插 特征波形 奇异值分解 周期因子
在线阅读 下载PDF
汉语口吃者在不出声言语中的语音编码 被引量:11
10
作者 张积家 肖二平 《心理学报》 CSSCI CSCD 北大核心 2008年第3期263-273,共11页
口吃者与非口吃者在不出声言语中语音编码的差异是口吃者语音加工异常的有力证据。通过三个实验,分别考察了口吃者与非口吃者监控汉语拼音中声母、韵母及声调的差异。结果表明,口吃者对声母的监控与非口吃者相比没有显著的差异,但在监... 口吃者与非口吃者在不出声言语中语音编码的差异是口吃者语音加工异常的有力证据。通过三个实验,分别考察了口吃者与非口吃者监控汉语拼音中声母、韵母及声调的差异。结果表明,口吃者对声母的监控与非口吃者相比没有显著的差异,但在监控韵母及声调时,口吃者的反应显著慢于非口吃者。研究结果支持了关于口吃的"内在修正假说",对研究汉语的语音编码有启发,对于口吃的诊断和治疗也有重要的启示。 展开更多
关键词 口吃 语音编码 音素监控 内在修正假说
在线阅读 下载PDF
多带激励低速率语音压缩编码算法研究及实时实现 被引量:6
11
作者 崔慧娟 唐昆 +1 位作者 郑海生 江灏 《电子学报》 EI CAS CSCD 北大核心 1998年第10期129-132,共4页
本文以多带激励声码器为模型,采用了多种技术去降低编码速率和改善音质.我们利用动态规划算法对基音周期进行平滑,去除了声码器中常有的音调噪声.MBE算法对谱包络的量化要花费大量的比特,这里利用LPC全极点模型谱逼近MBE谱包络,并... 本文以多带激励声码器为模型,采用了多种技术去降低编码速率和改善音质.我们利用动态规划算法对基音周期进行平滑,去除了声码器中常有的音调噪声.MBE算法对谱包络的量化要花费大量的比特,这里利用LPC全极点模型谱逼近MBE谱包络,并采用共振峰增强技术来补偿模型误差.对谱幅度参数的量化,采用了分裂矢量量化(SPVQ)和多级矢量量化(MSVQ)的方法.使之在2.4kbps,1.2kbps及800bps等速率上,用单片ADSP2181实时实现了较高质量的语音压缩编解码. 展开更多
关键词 动态规划 多带激励 声码器 语音编码
在线阅读 下载PDF
8~64kbit/s超宽带嵌入式语音频编码方法 被引量:2
12
作者 贾懋珅 鲍长春 李锐 《通信学报》 EI CSCD 北大核心 2009年第5期27-34,共8页
基于国际电信联盟标准化组织(ITU—T)编码标准G729.1和改进的调制叠接变换(MLT,modulated lapped transform)编码技术,提出了一种码率在8-64kbit/s的超宽带嵌入式变速率语音与音频编码方法,其中,8.32kbit/s码率的码流由G729... 基于国际电信联盟标准化组织(ITU—T)编码标准G729.1和改进的调制叠接变换(MLT,modulated lapped transform)编码技术,提出了一种码率在8-64kbit/s的超宽带嵌入式变速率语音与音频编码方法,其中,8.32kbit/s码率的码流由G729.1编码算法生成,编码信号为0—7kHz频段的信息;36、40和48kbit/s码率层及56、64kbiffs码率层码流由MLT变换编码方式生成,编码信号分别为7-14kHz频段的信息和G729.1编码残差的MDCT信息。客观和主观听力测试表明本编码器的性能达到了ITU-T提出的参考指标要求。 展开更多
关键词 语音处理 语音编码 音频编码 嵌入式编码
在线阅读 下载PDF
一种新的8~32kb/s宽带嵌入式变速率语音编码方法 被引量:2
13
作者 刘泽新 鲍长春 贾懋珅 《电子学报》 EI CAS CSCD 北大核心 2008年第5期1013-1018,共6页
本文基于ACELP和TCX编码技术,提出了一种8~32kb/s五层宽带嵌入式变速率语音编码方法,其中,前三层采用ACELP实现了8kb/s、12kb/s和16kb/s的嵌入式编码,后两层采用TCX技术实现了24kb/s和32kb/s嵌入式编码,实验结果表明,该嵌... 本文基于ACELP和TCX编码技术,提出了一种8~32kb/s五层宽带嵌入式变速率语音编码方法,其中,前三层采用ACELP实现了8kb/s、12kb/s和16kb/s的嵌入式编码,后两层采用TCX技术实现了24kb/s和32kb/s嵌入式编码,实验结果表明,该嵌入式语音编码方法的质量在纯净语音、办公室噪声和层间转换方面接近于ITU—TG.VBR的TOR要求. 展开更多
关键词 语音编码 嵌入式语音编码 ACELP编码 TCX编码
在线阅读 下载PDF
高质量4~8kb/s变速率有限状态ACELP 语音编码算法研究 被引量:4
14
作者 唐昆 崔慧娟 +1 位作者 刘志勇 冯重熙 《电子学报》 EI CAS CSCD 北大核心 2000年第1期21-25,共5页
4~8kb/s变速率有限状态代数码激励线性预测语音编码(VR-FS-ACEL)是一种具有延时较短、合成语音质量高、算法复杂度较低的语音编码算法.在线性预测(LP)参数量化上,使用预测式分裂式矢量量化,获得很高的量化效... 4~8kb/s变速率有限状态代数码激励线性预测语音编码(VR-FS-ACEL)是一种具有延时较短、合成语音质量高、算法复杂度较低的语音编码算法.在线性预测(LP)参数量化上,使用预测式分裂式矢量量化,获得很高的量化效率.在自适应码本搜索上,采用了有限状态控制分数延时搜索的算法,有效地降低了运算量.对于随机码本,采用了具有多模结构的代数码本,提高语音合成质量.对于激励码序列的增益,采用了预测式矢量量化,有效地提高了量化精度.经非正式听音测试,其中4kb/s的合成语音质量超过了北美 8kb/s VSELP,接近长途质量,而6kb/s和 8kb/s合成语音质量达到了长途质量,与 G.7298kb/s CSACELP相当. 展开更多
关键词 变速率 有限状态 语音编码算法 ACELP
在线阅读 下载PDF
基于ACELP的嵌入式语音编码算法 被引量:5
15
作者 范睿 鲍长春 李锐 《通信学报》 EI CSCD 北大核心 2007年第10期48-54,共7页
为实现对激励信号的精细描述,提出了一种基于ACELP模型的嵌入式语音编码算法,该算法通过逐层增加脉冲数以及采用一种新的自适应码书结构,能够保证各层编码的相对独立性以及编码器参数的最佳匹配。与以往基于ACELP模型的嵌入式编码算法相... 为实现对激励信号的精细描述,提出了一种基于ACELP模型的嵌入式语音编码算法,该算法通过逐层增加脉冲数以及采用一种新的自适应码书结构,能够保证各层编码的相对独立性以及编码器参数的最佳匹配。与以往基于ACELP模型的嵌入式编码算法相比,实现的编码器能够获得具有嵌入结构的码流,不仅能够保证核心层的合成语音质量,而且在增强层也取得了与对应速率的现有标准编码器相当的合成语音质量。 展开更多
关键词 语音编码 码激励线性预测 嵌入式编码 自适应码书 代数码书
在线阅读 下载PDF
高质量4kb/sFS ACELP语音编码算法及性能 被引量:4
16
作者 唐昆 崔慧娟 +1 位作者 刘志勇 冯重熙 《电子学报》 EI CAS CSCD 北大核心 1999年第10期22-26,共5页
4kb/s 有限状态代数码激励线性预测语音编码算法FSACELP是一种具有延时较短、合成语音质量高、算法复杂度较低的语音编码算法.在线性预测(LP)参数量化上,利用了语音帧内和帧间的相关性,对线谱对(LSP) 参数使... 4kb/s 有限状态代数码激励线性预测语音编码算法FSACELP是一种具有延时较短、合成语音质量高、算法复杂度较低的语音编码算法.在线性预测(LP)参数量化上,利用了语音帧内和帧间的相关性,对线谱对(LSP) 参数使用预测式分裂式矢量量化,获得很高的量化效率.在自适应码本搜索上,采用了有限状态控制分数延时搜索的算法,在保证合成语音质量的同时,有效地降低了运算量.对于随机码本,采用了具有多模结构的代数码本,提高语音合成质量.对于激励码序列的增益,采用了预测式矢量量化,有效地提高了量化精度.经非正式听音测试,4kb/s FSACELP的合成语音质量超过了北美8kb/s VSELP,接近G.729 8kb/s CSACELP,MOS分约为3-9 . 展开更多
关键词 有限状态 多模代数码本 语音编码 FS-ACELP
在线阅读 下载PDF
一种高质量的8kb/s ACELP语音编码算法及其实时实现 被引量:3
17
作者 刘志勇 唐昆 冯重熙 《电子学报》 EI CAS CSCD 北大核心 1997年第7期72-74,共3页
本文介绍了一种编码速率为8kb/s的高质量实时语音编码器.它采用了代数码本激励线性预测(ACELP)的编码方法,并采用高效的码本结构、码本搜索技术和矢量量化技术来获得较高的语音合成质量和较低的算法复杂度.在无需外部R... 本文介绍了一种编码速率为8kb/s的高质量实时语音编码器.它采用了代数码本激励线性预测(ACELP)的编码方法,并采用高效的码本结构、码本搜索技术和矢量量化技术来获得较高的语音合成质量和较低的算法复杂度.在无需外部RAM和ROM的情况下,该算法已用TMS320C50实时实现并用于一个实时的全双工通信系统.通过信噪比及人耳主观听觉实验等性能测试表明,该算法的性能明显优于北美的8kb/sVSELP语音编码算法而算法的复杂度却与VSELP相当. 展开更多
关键词 ACELP 矢量量化 语音编码
在线阅读 下载PDF
G.723.1语音编码器算法的聚类优化策略及其应用 被引量:4
18
作者 杨树堂 周敬利 余胜生 《通信学报》 EI CSCD 北大核心 2001年第2期113-117,共5页
在实现G 72 3 1编码器算法的基础上 ,提出了一种针对码本搜索的聚类优化策略。利用聚类分析的结果 ,对原始码本进行了分组及重构等处理 ,从而实现了快速搜索。测试及系统的实际运行情况表明 ,在使算法复杂度下降约 1 4 6MIPS的条件下 ,... 在实现G 72 3 1编码器算法的基础上 ,提出了一种针对码本搜索的聚类优化策略。利用聚类分析的结果 ,对原始码本进行了分组及重构等处理 ,从而实现了快速搜索。测试及系统的实际运行情况表明 ,在使算法复杂度下降约 1 4 6MIPS的条件下 ,优化结果仍能保证解码端的音质无明显下降。 展开更多
关键词 语音编码 优化 聚类分析
在线阅读 下载PDF
基于M-频带小波变换的宽带语音编码算法 被引量:2
19
作者 马鸿飞 樊昌信 宋国乡 《通信学报》 EI CSCD 北大核心 1998年第6期20-25,共6页
任何能量有限信号可以用M-频带紧支撑正交小波基展开,这有助于研究快速信号处理算法和高效编码算法。本文设计了一种基于M-频带正交小波变换的宽带语音编码算法,该算法语音质量好,编码时延小。
关键词 小波变换 宽带语音 语音编码 信源编码
在线阅读 下载PDF
超低速率MELP语音编码算法研究 被引量:7
20
作者 戚银城 张巍 苑津莎 《声学技术》 CSCD 北大核心 2007年第6期1196-1200,共5页
在语音编码算法中,混和激励线性预测(MELP)算法因为能更好的模拟自然语言特征,在低速率上能合成较高质量的语音,而成为现代低速率语音编码中最有潜力的算法之一。但在无线通信、卫星通信以及军用和保密通信中,信道带宽成为一个突出的问... 在语音编码算法中,混和激励线性预测(MELP)算法因为能更好的模拟自然语言特征,在低速率上能合成较高质量的语音,而成为现代低速率语音编码中最有潜力的算法之一。但在无线通信、卫星通信以及军用和保密通信中,信道带宽成为一个突出的问题,因此对更低速率语音压缩编码技术乃至超低速率的语音压缩编码技术的研究是非常有必要的。针对语音通信中关于极低速率的要求,深入分析了现今的几种基于MELP的低速率语音编码算法,对其原理以及关键技术进行了归纳总结,并对语音质量进行了比较。 展开更多
关键词 语音编码 线性预测 多帧联合量化 混合激励 线谱对频率
在线阅读 下载PDF
上一页 1 2 40 下一页 到第
使用帮助 返回顶部