摘要
随着人工智能技术的快速进步,计算机视觉技术在音频信号处理领域展现出较大的应用潜力。通过分析计算机视觉技术在音频信号处理中的最新研究进展,重点探讨视觉信息在音频源分离、音频增强、跨模态音频生成等任务中的应用。通过结合视觉和音频信息,可以显著提升音频处理的性能,为相关研究提供新的思路和方法。
With the rapid progress of artificial intelligence technology,computer vision technology shows great application potential in the field of audio signal processing.By analyzing the latest research progress of computer vision technology in audio signal processing,this paper focuses on the application of visual information in audio source separation,audio enhancement and cross-modal audio generation.By combining visual and audio information,the performance of audio processing can be significantly improved,which provides new ideas and methods for related research.
作者
陆霞
LU Xia(Jiangsu Danyang Secondary Vocational School,Zhenjiang 212300,China)
出处
《电声技术》
2024年第12期89-91,共3页
Audio Engineering
基金
2024年度省教育科学规划课题立项重点课题(B-b/2024/02/97)。
关键词
计算机视觉
音频信号处理
音频源分离
computer vision
audio signal processing
audio source separation
作者简介
陆霞(1982-),女,本科,高级讲师,研究方向为数字媒体技术。