期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于Dual-Path Skip-Transformer的轻量级语音增强网络
1
作者
琚吴涵
孙成立
+2 位作者
陈飞龙
丁碧云
郭桥生
《计算机工程与应用》
北大核心
2025年第15期209-217,共9页
解耦式语音增强方法将语音去噪任务解耦为幅度估计与复频谱估计两个子任务,可以获得比传统幅度谱语音增强更好的效果。Transformer由于其捕获长距离依赖关系的能力,成为解耦式语音增强模型的关键组件。然而,Transformer较高的计算复杂...
解耦式语音增强方法将语音去噪任务解耦为幅度估计与复频谱估计两个子任务,可以获得比传统幅度谱语音增强更好的效果。Transformer由于其捕获长距离依赖关系的能力,成为解耦式语音增强模型的关键组件。然而,Transformer较高的计算复杂度限制了其在边缘设备的应用。提出了一种解耦式语音增强网络DPST-SENet(dualpath skip-Transformer speech enhancement network)。具体而言,DPST-SENet能够在幅度分支中抑制主要噪声分量,同时在复频谱分支中消除残余噪声并隐式增强相位信息。该网络引入Dual-Path Skip-Transformer模块,它能有效重用Dual-Path Transformer模块建模的信息,在降低参数量和计算复杂度的同时保持出色的性能。实验结果表明,DPST-SENet在48 kHz全频带语音数据集VoiceBank+DEMAND上的语音质量感知评估(perceptual evaluation of speech quality,PESQ)得分为3.16,优于ICASSP 2022深度噪声抑制挑战赛冠军模型MTFAA,且模型参数更少。
展开更多
关键词
语音增强
全频带
双路径网络
并行去噪
轻量化
在线阅读
下载PDF
职称材料
结合LSTM与ResNet的声学回声消除
被引量:
3
2
作者
许春冬
徐锦武
+3 位作者
王茹霞
凌贤鹏
黄乔月
郭桥生
《传感器与微系统》
CSCD
北大核心
2023年第5期29-32,共4页
针对传统的声学回声消除(AEC)方法在双端讲话场景下较难实现快速收敛和动态自适应的问题,提出了一种结合长短时记忆(LSTM)与残差神经网络(ResNet)的AEC方法。通过使用LSTM和ResNet相结合的特征提取方法,同时提取到声学回声的时序特征和...
针对传统的声学回声消除(AEC)方法在双端讲话场景下较难实现快速收敛和动态自适应的问题,提出了一种结合长短时记忆(LSTM)与残差神经网络(ResNet)的AEC方法。通过使用LSTM和ResNet相结合的特征提取方法,同时提取到声学回声的时序特征和不同级别的抽象特征,且充分利用近端语音、近端麦克风语音和声学回声之间的幅度谱相似性的特点,引入它们之间的谱归一化互相关系数,构造了一种改进的理想二值掩蔽(iIBM)作为训练目标,此外引入深度可分离卷积使模型参数量减少了3.42 MB。实验结果表明:双端通话环境下所提出的方法相比参考算法取得了更高的客观评价得分。
展开更多
关键词
声学回声消除
双端讲话场景
长短时记忆网络
残差神经网络
理想二值掩蔽
深度可分离卷积
在线阅读
下载PDF
职称材料
基于退化四元数注意力机制的轻量化Transformer去雨网络
3
作者
熊贡鹤
陈飞龙
+1 位作者
孙成立
郭桥生
《计算机工程与应用》
CSCD
北大核心
2024年第19期250-258,共9页
现有主流图像去雨方法专注于提升去雨性能,而忽略了网络计算开销过大的问题。少数轻量化网络的研究只局限于修改网络结构来简化网络计算。针对上述问题,利用退化四元数可以获得更多图像先验信息的特性提出了一个基于退化四元数图像去雨...
现有主流图像去雨方法专注于提升去雨性能,而忽略了网络计算开销过大的问题。少数轻量化网络的研究只局限于修改网络结构来简化网络计算。针对上述问题,利用退化四元数可以获得更多图像先验信息的特性提出了一个基于退化四元数图像去雨网络。网络使用退化四元数Swin-Transformer块(reduced biquaternion Swin-Transformer block,RQSTB)作为主要特征提取模块。其中设计了使用基于退化四元数多头注意力机制的Transformer块提取全局特征信息,同时穿插使用退化四元数多尺度卷积模块提取局部多尺度特征信息,用以弥补Transformer缺乏卷积神经网络自带的一些归纳偏置的缺陷。经实验证明,该方法在网络参数和计算复杂度方面都优于很多现有的图像去雨方法,并且在去雨性能方面也达到了先进的水平,无论是从定量还是定性的指标来看,都展现了显著的效果。
展开更多
关键词
图像去雨
退化四元数网络
TRANSFORMER
轻量化
在线阅读
下载PDF
职称材料
题名
基于Dual-Path Skip-Transformer的轻量级语音增强网络
1
作者
琚吴涵
孙成立
陈飞龙
丁碧云
郭桥生
机构
南昌航空大学
信
息工程学院
广州航海学院
信
息与通
信
工程学院
朝阳
聚
声
泰
(
信
丰
)
科技
有限公司
出处
《计算机工程与应用》
北大核心
2025年第15期209-217,共9页
基金
国家自然科学基金(61861033)
赣鄱俊才支持计划(20232BCJ22050)
+4 种基金
赣州市揭榜挂帅制项目
江西省自然科学基金重点项目(20202ACBL202007)
南昌航空大学博士启动基金(EA201904283,EA202404070)
广东省高校重点领域专项(2023ZDZX3017)
广州市教育局高等教育科研项目(202234607)。
文摘
解耦式语音增强方法将语音去噪任务解耦为幅度估计与复频谱估计两个子任务,可以获得比传统幅度谱语音增强更好的效果。Transformer由于其捕获长距离依赖关系的能力,成为解耦式语音增强模型的关键组件。然而,Transformer较高的计算复杂度限制了其在边缘设备的应用。提出了一种解耦式语音增强网络DPST-SENet(dualpath skip-Transformer speech enhancement network)。具体而言,DPST-SENet能够在幅度分支中抑制主要噪声分量,同时在复频谱分支中消除残余噪声并隐式增强相位信息。该网络引入Dual-Path Skip-Transformer模块,它能有效重用Dual-Path Transformer模块建模的信息,在降低参数量和计算复杂度的同时保持出色的性能。实验结果表明,DPST-SENet在48 kHz全频带语音数据集VoiceBank+DEMAND上的语音质量感知评估(perceptual evaluation of speech quality,PESQ)得分为3.16,优于ICASSP 2022深度噪声抑制挑战赛冠军模型MTFAA,且模型参数更少。
关键词
语音增强
全频带
双路径网络
并行去噪
轻量化
Keywords
speech enhancement
full-band
dual-path network
parallel denoising
lightweighting
分类号
TP183 [自动化与计算机技术—控制理论与控制工程]
TN912.35 [电子电信—通信与信息系统]
在线阅读
下载PDF
职称材料
题名
结合LSTM与ResNet的声学回声消除
被引量:
3
2
作者
许春冬
徐锦武
王茹霞
凌贤鹏
黄乔月
郭桥生
机构
江西理工大学
信
息工程学院
安克创新
科技
股份
有限公司
朝阳
聚
声
泰
(
信
丰
)
科技
有限公司
出处
《传感器与微系统》
CSCD
北大核心
2023年第5期29-32,共4页
基金
国家自然科学基金资助项目(11864016,61671442)。
文摘
针对传统的声学回声消除(AEC)方法在双端讲话场景下较难实现快速收敛和动态自适应的问题,提出了一种结合长短时记忆(LSTM)与残差神经网络(ResNet)的AEC方法。通过使用LSTM和ResNet相结合的特征提取方法,同时提取到声学回声的时序特征和不同级别的抽象特征,且充分利用近端语音、近端麦克风语音和声学回声之间的幅度谱相似性的特点,引入它们之间的谱归一化互相关系数,构造了一种改进的理想二值掩蔽(iIBM)作为训练目标,此外引入深度可分离卷积使模型参数量减少了3.42 MB。实验结果表明:双端通话环境下所提出的方法相比参考算法取得了更高的客观评价得分。
关键词
声学回声消除
双端讲话场景
长短时记忆网络
残差神经网络
理想二值掩蔽
深度可分离卷积
Keywords
acoustic echo cancellation(AEC)
double-ended speech scenarios
long short-term memory(LSTM)
residual neural network(ResNet)
ideal binary mask
depthwise separable convolution(DSC)
分类号
TN912 [电子电信—通信与信息系统]
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于退化四元数注意力机制的轻量化Transformer去雨网络
3
作者
熊贡鹤
陈飞龙
孙成立
郭桥生
机构
南昌航空大学
信
息工程学院
南昌航空大学江西省图像处理与模式识别重点实验室
朝阳
聚
声
泰
(
信
丰
)
科技
有限公司
出处
《计算机工程与应用》
CSCD
北大核心
2024年第19期250-258,共9页
基金
国家自然科学基金(61861033)
江西省教育厅科技项目(DA202104170)
+1 种基金
南昌航空大学博士启动基金(EA201904283)
南昌航空大学研究生创新基金(YC2022-044)。
文摘
现有主流图像去雨方法专注于提升去雨性能,而忽略了网络计算开销过大的问题。少数轻量化网络的研究只局限于修改网络结构来简化网络计算。针对上述问题,利用退化四元数可以获得更多图像先验信息的特性提出了一个基于退化四元数图像去雨网络。网络使用退化四元数Swin-Transformer块(reduced biquaternion Swin-Transformer block,RQSTB)作为主要特征提取模块。其中设计了使用基于退化四元数多头注意力机制的Transformer块提取全局特征信息,同时穿插使用退化四元数多尺度卷积模块提取局部多尺度特征信息,用以弥补Transformer缺乏卷积神经网络自带的一些归纳偏置的缺陷。经实验证明,该方法在网络参数和计算复杂度方面都优于很多现有的图像去雨方法,并且在去雨性能方面也达到了先进的水平,无论是从定量还是定性的指标来看,都展现了显著的效果。
关键词
图像去雨
退化四元数网络
TRANSFORMER
轻量化
Keywords
image deraining
reduced biquaternion network
Transformer
lightweight
分类号
TP391.4 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于Dual-Path Skip-Transformer的轻量级语音增强网络
琚吴涵
孙成立
陈飞龙
丁碧云
郭桥生
《计算机工程与应用》
北大核心
2025
0
在线阅读
下载PDF
职称材料
2
结合LSTM与ResNet的声学回声消除
许春冬
徐锦武
王茹霞
凌贤鹏
黄乔月
郭桥生
《传感器与微系统》
CSCD
北大核心
2023
3
在线阅读
下载PDF
职称材料
3
基于退化四元数注意力机制的轻量化Transformer去雨网络
熊贡鹤
陈飞龙
孙成立
郭桥生
《计算机工程与应用》
CSCD
北大核心
2024
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部