期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
一种融合Transformer的多尺度结构图像去模糊方法
1
作者 郭业才 阳刚 毛湘南 《电光与控制》 北大核心 2025年第3期62-68,共7页
针对现有图像去模糊模型对于全局特征信息学习的不足以及感受野受限的问题,提出一种改进的融合Transformer的多尺度结构图像去模糊方法。首先,为了提高模型对全局特征学习以及远程像素捕获的能力,设计了一个多特征多尺度融合模块,该模... 针对现有图像去模糊模型对于全局特征信息学习的不足以及感受野受限的问题,提出一种改进的融合Transformer的多尺度结构图像去模糊方法。首先,为了提高模型对全局特征学习以及远程像素捕获的能力,设计了一个多特征多尺度融合模块,该模块利用双旁路结构将局部特征信息和全局特征信息有效地结合起来,同时简化Transformer以提升计算效率;其次,为了缓解卷积操作缺乏输入内容自适应的缺点,将通道注意力引入到特征融合模块中来动态地学习有用信息;最后,在基准数据集GoPro上,所提方法取得的峰值信噪比为31.87 dB,结构相似度为0.952。实验结果表明,所提方法与主流方法相比能够有效地复原图像细节特征,并且能够提升后续计算机视觉任务的鲁棒性。 展开更多
关键词 图像去模糊 多尺度结构 TRANSFORMER 卷积神经网络 注意力机制
在线阅读 下载PDF
基于深度复数门控扩张循环卷积网络的语音增强
2
作者 郭业才 周雪 +1 位作者 赵涵优 毛湘南 《中国电子科学研究院学报》 2025年第2期194-202,共9页
为了解决语音增强任务中语音信息未充分利用的问题,提出一种基于深度学习的方法,即深度复数门控扩张循环卷积网络(Deep Complex Gated Dilated Recurrent Convolutional Network,DCGDRCN)。该网络使用复数卷积和复数循环层处理复数域信... 为了解决语音增强任务中语音信息未充分利用的问题,提出一种基于深度学习的方法,即深度复数门控扩张循环卷积网络(Deep Complex Gated Dilated Recurrent Convolutional Network,DCGDRCN)。该网络使用复数卷积和复数循环层处理复数域信号,同时处理语音信号的幅度和相位信息,从而更精确地捕捉和还原语音信号。DCGDRCN由编码器、复数循环卷积层和解码器三部分组成,还在编码器中引入了有效通道注意力机制,增加了模型的非线性特征提取能力和参数效率,以更准确地分离出有用的语音信号,并抑制噪音和干扰信号。实验数据表明,GDRCNN网络在参数量和模型大小方面明显优于深度神经网络(Deep Neural Network,DNN)、卷积循环神经网络(Convolutional Recurrent Neural Network,CRN)、深度复数卷积循环网络(Reep Complex Convdution Recurrent Network,DCCRN)等网络,PESQ平均提高了0.68、0.47、0.3,STOI平均提高了0.14、0.08、0.05,在语音增强方面表现出色。 展开更多
关键词 语音增强 深度学习 复数卷积 扩张卷积 门控机制 循环卷积
在线阅读 下载PDF
基于高效双流输入结构的自动调制识别方法
3
作者 郭业才 毛湘南 +2 位作者 胡晓伟 周雪 赵涵优 《中国电子科学研究院学报》 2024年第3期248-256,295,共10页
自动调制识别是现代通信系统中一项重要技术。为提高通信系统对不同调制信号间的识别性能,文中首先探索了包含11类调制信号的公开数据集RML2016.10A上原始同相正交(In-phase and Quadrature,IQ)格式数据和经过数据预处理后的幅度和相位(... 自动调制识别是现代通信系统中一项重要技术。为提高通信系统对不同调制信号间的识别性能,文中首先探索了包含11类调制信号的公开数据集RML2016.10A上原始同相正交(In-phase and Quadrature,IQ)格式数据和经过数据预处理后的幅度和相位(Amplitude and Phase,AP)格式数据的差异;随后,依据原始IQ格式数据和AP格式数据在特征提取过程中对局部相关性及时序特征敏感性的差异,设计了针对空间特征提取的SFE-Block模块、针对长期依赖关系提取的TFE-Block模块,以及联合时空特征提取模块STFE-Block,并将前两者的输出特征作为STFE-Block模块输出特征的重要补充进行特征融合,以全连接(Fully Connected)层负责最终分类。实验结果表明,本模型在数据集RML2016.10A上表现良好。当信噪比(Signal to Noise Ratio,SNR)低于-8 dB时,平均识别精度比其他模型提升7%,而SNR在0~18 dB时,平均识别精度比其他模型提高1%~8%,且在SNR为16 dB时,最高识别精度达92.95%。此外,在RML2016.10B数据集上重复了实验以检验模型泛化性,所得结果同样最优,且当SNR为12 dB时,最高识别精度达到93.6%。 展开更多
关键词 自动调制识别 深度学习 双流输入
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部