-
题名稀疏卷积非负矩阵分解的语音增强算法
被引量:13
- 1
-
-
作者
张立伟
贾冲
张雄伟
闵刚
曾理
-
机构
解放军理工大学指挥信息系统学院
西安通信学院基础部
-
出处
《数据采集与处理》
CSCD
北大核心
2014年第2期259-264,共6页
-
基金
江苏省自然科学基金(BK2012510)资助项目
-
文摘
鉴于卷积非负矩阵分解在语音增强算法中的成功应用,进一步考虑语音信号在时频域的稀疏性,提出了稀疏卷积非负矩阵分解(Sparse convolutive nonnegative matrix factorization,SCNMF)的语音增强算法。该算法包括训练和增强两个阶段。训练阶段通过SCNMF算法分别对纯净语音和噪声的频谱进行训练,得到纯净语音和噪声字典,并将其作为增强阶段的先验信息。增强阶段首先通过SCNMF算法对带噪语音的频谱进行分解,然后利用纯净语音和噪声联合字典以及相应的迭代公式对语音编码矩阵进行估计,重构增强语音。通过实验仿真分析了稀疏因子对增强语音质量的影响。实验结果表明,在非平稳噪声和低信噪比条件下,本文算法增强效果均优于多带谱减、非负矩阵分解和卷积非负矩阵分解等传统的算法。
-
关键词
语音增强
稀疏卷积
非负矩阵
字典训练
稀疏因子
-
Keywords
speech enhancement
sparse convolutive
nonnegative matrix
dictionary training
sparse factor
-
分类号
TN912.3
[电子电信—通信与信息系统]
-
-
题名结合Transformer的轻量化中文语音识别
被引量:14
- 2
-
-
作者
沈逸文
孙俊
-
机构
江南大学人工智能与计算机学院
-
出处
《计算机应用研究》
CSCD
北大核心
2023年第2期424-429,共6页
-
基金
国家自然科学基金资助项目(61672263)
国家自然科学基金委员会联合基金资助项目(U1836218)。
-
文摘
近年来,深度神经网络模型在语音识别领域成为热门研究对象。然而,深层神经网络的构建依赖庞大的参数和计算开销,过大的模型体积也增加了其在边缘设备上部署的难度。针对上述问题,提出了基于Transformer的轻量化语音识别模型。首先使用深度可分离卷积获得音频特征信息;其次构建了双半步剩余权重前馈神经网络,即Macaron-Net结构,并引入低秩矩阵分解,实现了模型压缩;最后使用稀疏注意力机制,提升了模型的训练速度和解码速度。为了验证模型,在Aishell-1和aidatatang_200zh数据集上进行了测试。实验结果显示,与Open-Transformer相比,所提模型在字错误率上相对下降了19.8%,在实时率上相对下降了32.1%。
-
关键词
语音识别
TRANSFORMER
低秩矩阵分解
轻量卷积
模型压缩
稀疏注意力
-
Keywords
speech recognition
Transformer
low-rank matrix factorization
lightweight convolution
model compression
sparse attention
-
分类号
TN912.34
[电子电信—通信与信息系统]
-
-
题名非对称代价函数的稀疏卷积非负矩阵分解方法
- 3
-
-
作者
张倩敏
陶亮
周健
王华彬
-
机构
安徽大学计算智能与信号处理教育部重点实验室
-
出处
《信号处理》
CSCD
北大核心
2015年第1期95-102,共8页
-
基金
国家自然科学基金(61372137
61301295
+2 种基金
61003131)
安徽省自然科学基金(1308085QF100
1408085MF113)资助项目
-
文摘
提出一种基于非对称代价函数的稀疏卷积非负矩阵分解方法。该方法利用板仓-斋藤距离作为目标代价函数来衡量目标矩阵与重建矩阵的差异,使得较小的矩阵元素具有较小的重建误差,并且该代价函数具有尺度不变性的特点。为了考察其在弱语音成分重建方面的优势,将本文提出的算法应用于耳语音谱分解及重建实验。实验结果表明,与基于欧氏距离和基于Kullback-Leibler(K-L)散度的卷积非负矩阵分解算法相比,本文算法对于弱语音成分具有更好的重构效果,重建后的语音信号具有较大的可懂度。
-
关键词
稀疏卷积非负矩阵分解
非对称代价函数
板仓-斋藤距离
语音可懂度
-
Keywords
sparse convolutive non-negative matrix factorization
asymmetric cost function
Itakura-Saito distance
speech intelligibility
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名基于时频图像特征约简的柴油机故障特征提取新方法
被引量:2
- 4
-
-
作者
岳应娟
王旭
蔡艳平
牟伟杰
-
机构
火箭军工程大学理学院
火箭军工程大学五系
-
出处
《汽车工程》
EI
CSCD
北大核心
2018年第1期114-120,126,共8页
-
基金
国家自然科学基金(51405498)
陕西省自然科学基金(2013JQ8023)
中国博士后基金(2015M582642)资助
-
文摘
针对柴油机振动响应信号时频表示特征提取困难的问题,提出了一种直接对柴油机振动谱图像进行特征约简的时频特征提取新方法。通过现有的时频分析方法生成柴油机振动谱图像,采用三次卷积插值法对图像矩阵的维度进行压缩,并将矩阵分块计算的方法与稀疏非负矩阵分解算法(sparse non-negative matrix factorization,SNMF)相结合,用来直接对压缩后的振动谱图像进行特征约简以获取蕴含在其内的低维特征。将提出的方法应用于4种不同状态的柴油机气门故障特征提取试验中,结果证明该方法可准确、快速提取柴油机气门故障特征。
-
关键词
柴油机
振动谱图像
特征提取
稀疏非负矩阵分解
三次卷积插值法
-
Keywords
diesel engine
vibration spectra images
feature extraction
sparse non-negative matrix factorization
cubic convolution interpolation
-
分类号
TK428
[动力工程及工程热物理—动力机械及工程]
TP391.41
[自动化与计算机技术—计算机应用技术]
-