期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
无人机搜救场景下语声增强技术进展综述
1
作者 雷菁 杨飞然 杨军 《应用声学》 北大核心 2025年第3期539-547,共9页
随着无人机技术的快速发展,无人机在各类场景中的应用日益广泛。在搜救任务中,无人机能够深入人力难以到达的区域,搜寻潜在的受困人员。无人机的应用不仅显著提升了搜救效率,还有效降低了救援人员面临的风险。相比图像信息,无人机搭载... 随着无人机技术的快速发展,无人机在各类场景中的应用日益广泛。在搜救任务中,无人机能够深入人力难以到达的区域,搜寻潜在的受困人员。无人机的应用不仅显著提升了搜救效率,还有效降低了救援人员面临的风险。相比图像信息,无人机搭载的传声器采集的声频信号在照明不足或视野受限的情况下,能够提供更加丰富和关键的线索。然而,由于环境噪声和无人机自噪声的干扰,采集到的信号通常信噪比极低,需要进行有效的增强处理。该文综述了无人机搜救场景下语声增强技术的最新研究进展,并重点探讨了无人机自噪声的特性、无人机场景中的语声增强技术及其面临的挑战。此外,该文还回顾了目前与无人机噪声相关的开源数据集,并展望了未来可能的发展方向。 展开更多
关键词 无人机搜救 语声增强 噪声消除
在线阅读 下载PDF
应用于助听器的频域双通道语声增强算法 被引量:1
2
作者 陈新漪 原建平 +1 位作者 崔杰 理华 《应用声学》 CSCD 北大核心 2024年第4期880-891,共12页
在助听器的日常使用环境中,干扰噪声与期望语声往往来自不同的方向,因此将多通道语声增强技术应用于数字助听器可以有效地降低干扰噪声的影响。自适应的多通道语声增强技术可以在复杂环境中实现指向模式的动态调整,提高助听器的消噪性... 在助听器的日常使用环境中,干扰噪声与期望语声往往来自不同的方向,因此将多通道语声增强技术应用于数字助听器可以有效地降低干扰噪声的影响。自适应的多通道语声增强技术可以在复杂环境中实现指向模式的动态调整,提高助听器的消噪性能。该文设计了一种基于频域广义旁瓣抵消的双通道语声增强系统,利用噪声参考信号与语声参考信号在频域的相关性对系统阻塞矩阵以及传统自适应部分进行改进,防止阻塞矩阵产生较大的语声泄露,且在语声段选择较小的步长而在噪声段选择较大的步长进行自适应权系数更新,保留期望语声同时抑制干扰噪声。仿真实验中,利用多种干扰环境中的两种客观评价指标验证了所提算法的有效性。 展开更多
关键词 助听器 双通道语声增强 广义旁瓣抵消 自适应滤波 相关性
在线阅读 下载PDF
深度复卷积递归网络模型的师生学习语声增强方法 被引量:1
3
作者 卞金洪 吴瑞琦 +1 位作者 周锋 赵力 《应用声学》 CSCD 北大核心 2023年第2期269-275,共7页
基于深度神经网络的方法已经在语声增强领域得到了广泛的应用,然而若想取得理想的性能,一般需要规模较大且复杂度较高的模型。因此,在计算资源有限的设备或对延时要求高的环境下容易出现部署困难的问题。为了解决此问题,提出了一种基于... 基于深度神经网络的方法已经在语声增强领域得到了广泛的应用,然而若想取得理想的性能,一般需要规模较大且复杂度较高的模型。因此,在计算资源有限的设备或对延时要求高的环境下容易出现部署困难的问题。为了解决此问题,提出了一种基于深度复卷积递归网络的师生学习语声增强方法。在师生深度复卷积递归网络模型结构中间的复长短时记忆递归模块提取实部和虚部特征流,并分别计算帧级师生距离损失以进行知识转移。同时使用多分辨率频谱损失以进一步提升低复杂度学生模型的性能。实验在公开数据集Voice Bank Demand和DNS Challenge上进行,结果显示所提方法相对于基线学生模型在各项指标上均有明显提升。 展开更多
关键词 语声增强 递归神经网络 长短期记忆网络 知识蒸馏
在线阅读 下载PDF
稀疏重构的压缩感知语声增强模型与算法 被引量:2
4
作者 李洋 李双田 《信号处理》 CSCD 北大核心 2013年第9期1120-1126,共7页
语声增强的目的在于消除带噪语声信号中的噪声干扰,提高语声信号的可听度与可懂度。与传统语声增强算法不同,本文利用语声信号与噪声信号的稀疏性差异,提出了一种基于稀疏重构的压缩感知语声增强模型,并导出该模型的数学表达式。基于此... 语声增强的目的在于消除带噪语声信号中的噪声干扰,提高语声信号的可听度与可懂度。与传统语声增强算法不同,本文利用语声信号与噪声信号的稀疏性差异,提出了一种基于稀疏重构的压缩感知语声增强模型,并导出该模型的数学表达式。基于此语声增强模型,本文还融入了语声信号的稀疏性与非平稳性,提出了语声存在概率为加权因子的加权正交匹配追踪语声增强算法。仿真实验表明本文提出的语声增强模型与算法具有可行性、有效性以及优越性。本算法不仅可以有效的抑制噪声干扰,还可以保留大部分语声信号,达到语声增强的目的。此外,与谱减法和最小均方误差算法比较,虽然本文算法计算量较大,但是其性能优越。 展开更多
关键词 语声增强 稀疏重构 压缩感知 加权因子 加权正交匹配追踪
在线阅读 下载PDF
基于轻量级卷积门控循环神经网络的语声增强方法 被引量:3
5
作者 王玫 李江和 +1 位作者 宋浠瑜 刘小娟 《应用声学》 CSCD 北大核心 2023年第3期652-658,共7页
针对在基于深度学习语声增强方法中因采用因果式的网络输入导致语声增强性能下降的问题,提出了一种基于轻量级卷积门控循环神经网络的语声增强方法。门控循环神经网络能够建模语声信号的时间相关性,但是其全连接结构忽略了语声信号的时... 针对在基于深度学习语声增强方法中因采用因果式的网络输入导致语声增强性能下降的问题,提出了一种基于轻量级卷积门控循环神经网络的语声增强方法。门控循环神经网络能够建模语声信号的时间相关性,但是其全连接结构忽略了语声信号的时频结构特征,并且参数数量庞大,不利于网络的训练。对此,该文采用卷积核替代门控循环神经网络中的全连接结构,在对语声信号时间相关性建模的同时保留了语声信号的时频结构特征,同时降低了网络的参数数量。为充分利用先前帧的特征信息,该网络单元当前时刻的输入融合了上一时刻的输入与输出。针对网络训练过程中容易产生过拟合的问题,该文采用了线性门控机制来控制信息的传输,这缓解了网络训练过程中的过拟合问题,提高了网络的语声增强性能。实验结果表明,该文所提出的网络结构在增强后的语声感知质量、语声短时客观可懂度、分段信噪比等指标上均优于传统的网络结构。 展开更多
关键词 卷积门控循环神经网络 固定时延 因果式语声增强 语声质量 语声可懂度
在线阅读 下载PDF
自适应噪声抵消语声增强的实时后处理算法
6
作者 连兵 黄杰 王宏禹 《大连理工大学学报》 CAS CSCD 北大核心 1996年第1期94-99,共6页
对自适应噪声抵消系统中两路噪声相关性较弱的情况,采用相于函数作为频域增益因子,对自适应噪声抵消作进一步处理(或后处理),以改善语声增强效果.提出一种实时迭代算法取代现有的基于短时傅氏变换的算法,新算法可简化计算且便于... 对自适应噪声抵消系统中两路噪声相关性较弱的情况,采用相于函数作为频域增益因子,对自适应噪声抵消作进一步处理(或后处理),以改善语声增强效果.提出一种实时迭代算法取代现有的基于短时傅氏变换的算法,新算法可简化计算且便于与自适应系统一起实时实现.在计算机模拟实验中,后处理算法的有效性得到了验证. 展开更多
关键词 自适应滤波 噪声消除 相干函数 语声增强
在线阅读 下载PDF
人耳听觉相关代价函数深度学习单通道语声增强算法
7
作者 程琳娟 彭任华 +1 位作者 郑成诗 李晓东 《应用声学》 CSCD 北大核心 2022年第4期654-666,共13页
均方误差函数是深度学习单通道语声增强算法最常用的一种代价函数。然而,均方误差值的大小与语声质量好坏并非完全相关。为了提高算法性能,该文在深度神经网络训练中引入了两类与人耳听觉相关的代价函数。第一类是加权欧氏距离代价函数... 均方误差函数是深度学习单通道语声增强算法最常用的一种代价函数。然而,均方误差值的大小与语声质量好坏并非完全相关。为了提高算法性能,该文在深度神经网络训练中引入了两类与人耳听觉相关的代价函数。第一类是加权欧氏距离代价函数,考虑了人耳听觉掩蔽效应;第二类是Itakura-Satio代价函数、COSH代价函数和加权似然比代价函数,强调语声谱峰的重要性,侧重于恢复干净语声谱峰信息。基于长短期记忆网络结构分析比较了两类代价函数在深度学习单通道语声增强算法中的性能,并与均方误差代价函数进行对比。实验结果表明,基于加权欧式距离代价函数的深度神经网络单通道语声增强算法能够获得更好的语声质量和更低的噪声残留。 展开更多
关键词 语声增强 深度学习 人耳听觉
在线阅读 下载PDF
Att-U-Net:融合注意力机制的U-Net骨导语声增强
8
作者 邦锦阳 张玥 +3 位作者 张雄伟 孙蒙 刘伟 栾合禹 《应用声学》 CSCD 北大核心 2023年第4期814-824,共11页
近年来,大量全卷积网络、U-Net等编解码网络结构应用于语声增强,然而,此类结构不能充分利用先后时间与高低频率之间的关联信息,对于处理长序列数据存在信息丢失的问题。为保持计算效率的同时实现更充分的时频关联信息建模,该文提出一种... 近年来,大量全卷积网络、U-Net等编解码网络结构应用于语声增强,然而,此类结构不能充分利用先后时间与高低频率之间的关联信息,对于处理长序列数据存在信息丢失的问题。为保持计算效率的同时实现更充分的时频关联信息建模,该文提出一种融合注意力机制的U-Net网络的骨导语声增强方法(Att-U-Net),通过在跳跃连接中引入注意力机制,生成一个权重矩阵,将编码层中的全局信息根据权重融入对应的解码层中,使网络在编解码过程中能够关注输入数据中与增强目标相关程度高的重要信息,同时抑制不相关的信息。在骨导语声数据集上的实验表明,融合注意力机制的U-Net网络能在保持模型轻量化的同时有效提升骨导语声的增强效果,增强后的语声在各项客观评价指标上均优于基线模型。 展开更多
关键词 骨导语声增强 深度学习 注意力机制 U-Net
在线阅读 下载PDF
语声通信降噪研究 被引量:1
9
作者 田玉静 左红伟 王超 《应用声学》 CSCD 北大核心 2020年第6期932-939,共8页
语声通信系统中,语声通过信道传输将不可避免地引入码间串扰和信号畸变,同时受到噪声污染。该文在分析自适应常数模盲均衡算法和改进盲均衡算法的基础上,考虑到自适应盲均衡技术在语声噪声控制方面能力有限,将自适应盲均衡技术与小波包... 语声通信系统中,语声通过信道传输将不可避免地引入码间串扰和信号畸变,同时受到噪声污染。该文在分析自适应常数模盲均衡算法和改进盲均衡算法的基础上,考虑到自适应盲均衡技术在语声噪声控制方面能力有限,将自适应盲均衡技术与小波包掩蔽阈值降噪算法联合使用,形成一种基带语声增强新方法。仿真试验结果显示自适应盲均衡技术可以使星座图变得清晰而紧凑,有效减小误码率。研究证实该方法在语声信号码间串扰和畸变严重情况下,在白噪声及有色噪声的不同噪声环境中都具有稳定的降噪能力,消噪同时可获得汉语普通话良好的听觉效果。 展开更多
关键词 盲均衡 自适应算法 通信系统 语声增强
在线阅读 下载PDF
Improved speech absence probability estimation based on environmental noise classification 被引量:2
10
作者 SON Young-ho LEE Sang-min 《Journal of Central South University》 SCIE EI CAS 2012年第9期2548-2553,共6页
An improved speech absence probability estimation was proposed using environmental noise classification for speech enhancement.A relevant noise estimation approach,known as the speech presence uncertainty tracking met... An improved speech absence probability estimation was proposed using environmental noise classification for speech enhancement.A relevant noise estimation approach,known as the speech presence uncertainty tracking method,requires seeking the "a priori" probability of speech absence that is derived by applying microphone input signal and the noise signal based on the estimated value of the "a posteriori" signal-to-noise ratio(SNR).To overcome this problem,first,the optimal values in terms of the perceived speech quality of a variety of noise types are derived.Second,the estimated optimal values are assigned according to the determined noise type which is classified by a real-time noise classification algorithm based on the Gaussian mixture model(GMM).The proposed algorithm estimates the speech absence probability using a noise classification algorithm which is based on GMM to apply the optimal parameter of each noise type,unlike the conventional approach which uses a fixed threshold and smoothing parameter.The performance of the proposed method was evaluated by objective tests,such as the perceptual evaluation of speech quality(PESQ) and composite measure.Performance was then evaluated by a subjective test,namely,mean opinion scores(MOS) under various noise environments.The proposed method show better results than existing methods. 展开更多
关键词 speech enhancement soft decision speech absence probability Gaussian mixture model (GMM)
在线阅读 下载PDF
Filter algorithm based on cochlear mechanics and neuron filter mechanism and application on enhancement of audio signals 被引量:2
11
作者 GAO Wa KAN Yue ZHA Fu-sheng 《Journal of Central South University》 SCIE EI CAS CSCD 2021年第6期1813-1828,共16页
A filter algorithm based on cochlear mechanics and neuron filter mechanism is proposed from the view point of vibration.It helps to solve the problem that the non-linear amplification is rarely considered in studying ... A filter algorithm based on cochlear mechanics and neuron filter mechanism is proposed from the view point of vibration.It helps to solve the problem that the non-linear amplification is rarely considered in studying the auditory filters.A cochlear mechanical transduction model is built to illustrate the audio signals processing procedure in cochlea,and then the neuron filter mechanism is modeled to indirectly obtain the outputs with the cochlear properties of frequency tuning and non-linear amplification.The mathematic description of the proposed algorithm is derived by the two models.The parameter space,the parameter selection rules and the error correction of the proposed algorithm are discussed.The unit impulse responses in the time domain and the frequency domain are simulated and compared to probe into the characteristics of the proposed algorithm.Then a 24-channel filter bank is built based on the proposed algorithm and applied to the enhancements of the audio signals.The experiments and comparisons verify that,the proposed algorithm can effectively divide the audio signals into different frequencies,significantly enhance the high frequency parts,and provide positive impacts on the performance of speech enhancement in different noise environments,especially for the babble noise and the volvo noise. 展开更多
关键词 COCHLEA neuron filter audio signal processing speech enhancement
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部