基于内容的音频与音乐分析综述被引量：18

A Review of Content-Based Audio and Music Analysis

在线阅读下载PDF

导出

摘要机器听觉包括三大研究领域:语音信号处理与识别、一般音频信号分析、基于内容的音乐信号分析.其中,语音信号处理与识别早已成为一个传统的研究热点.随着信息科学与技术的迅速发展,基于内容的音频与音乐信号分析也逐渐成为一个新的研究热点,近几年来取得了大量研究成果.文章将对1990年以后该领域上所取得的研究成果进行综述,包括基于内容的音频或音乐信号自动分类、分割、检索以及音乐作品自动分析等内容. Machine hearing includes three fields： Speech signal processing and recognition, general audio signal processing, and content-based music analysis. Speech signal processing and recognition has been a traditional research field for many years. There are many summarizing works about it. With the rapid progress of the information science and techniques, the content-based music analysis, and general audio signal processing have gradually become hotspots of research in the fields of pattern recognition, and multimedia data processing. Lots of research productions have been reported in recent years, but summarizing works are lacked. This paper gives a detailed review of content-based audio and music analysis, mainly aiming at the latest progress.

作者张一彬周杰边肇祺郭军

机构地区北京邮电大学信息工程学院清华大学自动化系

出处《计算机学报》 EI CSCD 北大核心 2007年第5期712-728,共17页 Chinese Journal of Computers

基金国家自然科学基金(60573060)资助.

关键词音乐分类识别分割检索音乐分析自动摘要音频信号处理模式识别 music classification recognition segmentation retrieval analysis of music automatic music summary audio processing pattern recognition

分类号 TP391 [自动化与计算机技术—计算机应用技术]

作者简介张一彬，男，1974年生，博士，从事博士后研究工作，研究兴趣包括模式识别、基于内容的音频及音乐信号分析、语音信号处理、图像分析和信息挖掘等．E—mail：ext-Yibin．1．zhang@nokia．com．周杰，男，1968年生，教授，博士生导师，研究领域包括模式识别、信息融合、图像处理和计算机视觉．边肇祺，男，教授，博士生导师，研究兴趣包括模式识别和智能信息处理等．郭军，1959年生，教授，博士生导师，主要从事文字识别、语音识别、网络管理与控制等领域的研究工作．

引文网络
相关文献

参考文献103

1Young S. A review of large-vocabulary continuous-speech. IEEE Signal Processing Magazine, 1996, 13(5): 45.
2Chibelushi C C, Deravi F, Mason J S D. A review of speechbased bimodal recognition. IEEE Transactions on Multimedia, 2002, 4(1): 23-37.
3Dannenberg R. Music understanding. Computer Science Research Review, 1987/1988: 19-28.
4Burton A R, Vladimirova T. Generation of musical sequences with genetic techniques. Computer Music Journal, 1999, 23(4): 59-73.
5Bickerstaffe A C, Makalic E. MML classification of music genres//Proceedings of the Australian Conference on Artificial Intelligence. Perth, Australia, 2003: 1063-1071.
6Berenzweig A L, Ellis D P W. Locating singing voice segments within music signals//Proceedings of the IEEE Workshop on Applications of Signal Processing to Audio and Acoustics. New Platz, USA, 2001: 119-122.
7Tzanetakis G, Cook P. Musical genre classification of audio signals. IEEE Transactions on Speech and Audio Processing, 2002, 10(5) : 293-302.
8Lambrou T, Kudumakis P, Speller R, Sandier M, Linney A. Classification of audio signals using statistical features on time and wavelet transform domains//Proceedings of the IEEE ICASSP'98. Seattle, USA, 1998, 6: 3621-3624.
9Bigerelle M, Iost A. Fractal dimension and classification of music. Chaos, Solitons and Fractals, 2000, 11(14): 2179- 2192.
10Zhang Y-B, Zhou J. A study on content-based music classification//Proceedings of the IEEE the 7th International Symposium on Signal Processing and Its Applications. Paris, 2003, 2:113-116.

二级参考文献20

1J Foote. An overview of audio information retrieval. Multimedia Systems, 1999, 7(1): 2-11.
2A J Ghias, Logan D Chamberlain, B C Smith. Query by humming-musical information retrieval in an audio database. ACM Multimedia'95, San Francisco, 1995.
3R J McNab, L A Smith, I H Witten et al. Towards the digital music library: Tune retrieval from acoustic input. The ACM Digital Libraries Conference ( Digital Libraries' 96 ), Bethesda,Maryland, 1996.
4Ricardo A Baesa-Yates, Chris H Perleberg. Fast and practical approximate string matching. In: Combinatorial Pattern Matching, Third Annual Symposium. Berlin: Springer-Verlag,1992. 185- 192.
5Lie Lu, Hong You, Hong-Jiang Zhang. A new approach to query by humming in music retrieval. IEEE Int' 1 Conf on Multimedia and Expo (ICME 2001 ), Waseda University, Tokyo, Japan,2001.
6Jyh-Shing Roger Jang, Hong-Ru Lee. Hierarchical filtering method for content-based music retrieval via acoustic input. ACM Multimedia 2001, New York, 2001.
7Tom Brondsted et al. A system for recogition of hummed tunes.The COST G-6 Cord on Digital Audio Effects (DAFX-01),Limerick, Ireland, 2001.
8N Kosugi, Y Nishihara, T Sakata et al. A practical query-byhumming system for a large music database. The ACM Multimedia 2000, Los Angeles, CA, 2000.
9William Rand, William Birmingham. Statistical analysis in music information retrieval. The 2nd Annual Int'l Symp on Music Information Retrieval, Bloomington, Indiana, USA, 2001.
10Shyarnala Doraisamy, Stefan M Ruger. An approach towards a polyphonic music retrieval system. The 2nd Annual Int'l Symposium on Music Information Retrieval, Bloomington,Indiana, USA, 2001.

共引文献27

1赖国明,杨圣云.基于内容的音乐检索研究[J].计算机工程与设计,2006,27(23):4467-4468. 被引量：1
2赵芳,吴亚栋,宿继奎.基于音轨特征量的多音轨MIDI主旋律抽取方法[J].计算机工程,2007,33(2):165-167. 被引量：17
3韩圣龙.一种新的音乐旋律提取方法及其应用[J].现代图书情报技术,2007(3):77-79. 被引量：1
4秦静,周明全,王醒策,沈复兴.基于动态分割和加权综合匹配的音乐检索算法[J].计算机工程,2007,33(13):194-196. 被引量：10
5郑贵滨,刘艳,刘胜,韩纪庆.基于两级神经网络的连续哼唱特征提取[J].计算机工程与应用,2008,44(18):246-248. 被引量：1
6兰帆,黄明和.一种改进旋律匹配算法在MIDI演奏系统中的应用[J].计算机与现代化,2009(6):151-154.
7冯国杰,王吉军.基于分层次聚类的MIDI音乐主旋律提取方法[J].计算机工程与应用,2009,45(26):233-235. 被引量：6
8郭敏,刘加.一个基于哼唱的歌曲检索系统[J].电声技术,2009,33(12):62-64. 被引量：1
9秦静,王醒策,周明全,刘新宇.基于遗传算法的旋律匹配模型研究[J].哈尔滨工程大学学报,2010,21(2):249-256.
10万程程,汪伟,舒棚,张朋,袁锋.哼唱检索中一种实用哼唱信号处理方法[J].现代电子技术,2010,33(10):33-36.

同被引文献204

1齐俊英,孙劲光,高爱东.基于内容的音频自动分类方法[J].辽宁工程技术大学学报（自然科学版）,2005,24(z1):170-172. 被引量：5
2彭文雄,侯世英,卓娅,梁健,蔡佳.音乐彩灯控制器的设计与实现[J].电气电子教学学报,2012,34(S1):135-138. 被引量：1
3黎星星,黄小琴,朱庆生.电子商务推荐系统研究[J].计算机工程与科学,2004,26(5):7-10. 被引量：46
4刘功申,李宁.一种基于有序二叉树的多模式匹配算法(英文)[J].小型微型计算机系统,2004,25(7):1387-1392. 被引量：3
5徐国庆,杨丹,王彬洁,文俊浩.乐音识别方法及应用[J].计算机应用,2005,25(4):968-970. 被引量：9
6李辉,戴蓓■,陆伟.基于前置滤波和小波变换的带噪语音基音周期检测方法[J].数据采集与处理,2005,20(1):100-104. 被引量：13
7梁志强,谢志文.钢琴声音频谱中的非谐和分音的分析[J].电声技术,2005,29(3):4-6. 被引量：1
8姚洪兴,姜桂仁,耿霞.相空间重构中参数确定方法的新探讨[J].江苏大学学报（自然科学版）,2005,26(B12):82-85. 被引量：5
9马志欣,付少锋,周利华.哼唱检索中一种新的旋律模糊匹配方法[J].西安电子科技大学学报,2006,33(1):85-88. 被引量：8
10张一彬,周杰,边肇祺.基于样本的流行歌曲关键段分割方法[J].电子学报,2006,34(2):220-225. 被引量：4

引证文献18

1曹西征,刘春红,孙林.基于WAV文件的独奏乐曲信号中的乐谱识别[J].计算机应用,2009,29(3):768-770. 被引量：4
2曹西征,张聪品,冯乃勤.计算机乐器的梯形波音色模型分析[J].计算机工程与应用,2009,45(6):232-235. 被引量：3
3曹西征,冯乃勤,张聪品.基于双全正弦的计算机乐器音色建模[J].计算机科学,2009,36(4):279-281.
4兰帆,黄明和.一种改进旋律匹配算法在MIDI演奏系统中的应用[J].计算机与现代化,2009(6):151-154.
5曹西征,张磊,范海菊.一种可控虚拟乐器音色模型[J].计算机技术与发展,2009,19(7):203-205.
6曹西征,曹英,孙林.面向学前教育教学的钢琴音色的计算机模拟[J].河南师范大学学报（自然科学版）,2010,38(1):47-50. 被引量：2
7曹西征,曹英,范海菊.学前儿童乐曲的计算机生成研究[J].计算机应用与软件,2010,27(6):11-13. 被引量：1
8蒋盛益,李霞,李碧,王连喜.音乐情感自动分析研究[J].计算机工程与设计,2010,31(18):4112-4115. 被引量：8
9郭奕,徐红兵,唐继勇,何俐.自动音乐标注系统综述[J].计算机应用研究,2011,28(4):1201-1205. 被引量：2
10陈雅茜.音乐推荐系统及相关技术研究[J].计算机工程与应用,2012,48(18):9-16. 被引量：14

二级引证文献47

1尹昊喆,曹西征,杜浩翠,乔锟.悲伤型乐器的音色建模技术研究[J].计算机工程与应用,2011,47(1):156-158.
2徐鹏进,郭莉,刘书昌.基于音高与端点联合检测的音符识别算法[J].计算机应用,2011,31(A02):172-175. 被引量：5
3唐晓萍.音乐评论中情感的挖掘[J].科技资讯,2012,10(4):237-237.
4陈雅茜.音乐推荐系统及相关技术研究[J].计算机工程与应用,2012,48(18):9-16. 被引量：14
5廖金菊.情感音色模型测试实验平台的搭建[J].商情,2014(23):208-209.
6廖金菊.基于音符频谱特征的情感音色建模[J].电脑迷（数码生活）（上旬刊）,2014(3):52-54.
7魏华珍,赵姝,陈洁,刘峰.特征组合的中文音乐情感识别研究[J].安徽大学学报（自然科学版）,2014,38(6):30-36. 被引量：5
8蒋盛益,阳垚,廖静欣.中文音乐情感词典构建及情感分类方法研究[J].计算机工程与应用,2014,50(24):118-121. 被引量：12
9姜书浩,潘旭华,薛福亮.一种基于项目聚类的自主推荐多样性优化算法[J].现代图书情报技术,2015(5):34-41. 被引量：3
10邵曦,陶凯云.基于音乐内容和歌词的音乐情感分类研究[J].计算机技术与发展,2015,25(8):184-187. 被引量：5

1独孤水手.让酷狗做你的音乐分类专家[J].电脑知识与技术（经验技巧）,2011(7):25-25.
2赵亮.改进极限学习机的电子音乐分类模型[J].现代电子技术,2017,40(5):155-158. 被引量：2
3图片新闻[J].软件世界,2007(14):8-8.
4吴淦洲.基于特征提取与神经网络的音乐分类方法[J].数学的实践与认识,2014,44(5):94-100. 被引量：7
5翟景瞳,王玲,杜秀伟,肖华.基于DSP的便携式音乐分析仪的设计与实现[J].电子技术应用,2008,34(11):100-102.
6邵曦,姚磊.基于SVM主动学习的音乐分类[J].计算机工程与应用,2016,52(6):127-133. 被引量：8
7张键锋,王劲.基于文本挖掘与神经网络的音乐风格分类建模方法[J].电信科学,2015,31(7):80-85. 被引量：9
8韩浩,王寅潇,王博,谯妍,田京京.基于概率神经网络的流行音乐分类研究[J].数字技术与应用,2013,31(8):64-65. 被引量：4
9谢刚,张文生.概率逻辑程序研究综述[J].山西大学学报（自然科学版）,2016,39(3):333-341.
10高林杰,张明.基于熵和支持向量机的音乐分类方法[J].计算机系统应用,2014,23(5):83-88. 被引量：7

计算机学报

2007年第5期

浏览历史

内容加载中请稍等...

基于内容的音频与音乐分析综述被引量：18

参考文献103

二级参考文献20

共引文献27

同被引文献204

引证文献18

二级引证文献47

相关作者

相关机构

相关主题

浏览历史

基于内容的音频与音乐分析综述 被引量：18

参考文献103

二级参考文献20

共引文献27

同被引文献204

引证文献18

二级引证文献47

相关作者

相关机构

相关主题

浏览历史

基于内容的音频与音乐分析综述被引量：18