期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于ViT-集成学习的音乐情感识别研究
1
作者 吴丹 王仁武 周杰 《信息技术》 2025年第1期47-55,共9页
针对常规机器学习与深度学习方法对音乐情感识别准确率低的问题,提出一种采用视觉转换器(Vision Transformer,简称ViT)做特征提取器,使用集成学习方法做分类器的短音乐情感分类模型。构造经过严格质量把关的人工标注的短音乐数据集,将... 针对常规机器学习与深度学习方法对音乐情感识别准确率低的问题,提出一种采用视觉转换器(Vision Transformer,简称ViT)做特征提取器,使用集成学习方法做分类器的短音乐情感分类模型。构造经过严格质量把关的人工标注的短音乐数据集,将短音乐情感分为快乐(Happy)、悲伤(Sad)、愤怒(Angry)和平静(Calm)4类;基于改进的ViT模型提取短音乐的音频图谱特征,使用集成学习的XGBoost、LightGBM等算法进行短音乐情感分类。实验表明,ViT-集成学习模型在测试集上达到了87.5%的准确率,优于文中所测试的其他模型,且模型通用性较强,可以较好地应用在音乐情感识别的下游任务之中。 展开更多
关键词 音乐情感识别 视觉转换器 集成学习 卷积神经网络 语谱图
在线阅读 下载PDF
基于宽深学习网络的音乐情感识别 被引量:7
2
作者 王晶晶 黄如 《华东理工大学学报(自然科学版)》 CAS CSCD 北大核心 2022年第3期373-380,共8页
将梅尔频率倒谱系数(Mel Frequency Cepstral Coefficient,MFCC)和残差相位(Residual Phase, RP)进行加权结合来提取音乐情感特征,提高了音乐情感特征的挖掘效率;同时为了提高音乐情感的分类精度,缩短模型训练时间,将长短期记忆网络(Lon... 将梅尔频率倒谱系数(Mel Frequency Cepstral Coefficient,MFCC)和残差相位(Residual Phase, RP)进行加权结合来提取音乐情感特征,提高了音乐情感特征的挖掘效率;同时为了提高音乐情感的分类精度,缩短模型训练时间,将长短期记忆网络(Long Short-Term Memory,LSTM)和宽度学习系统(Broad Learning System,BLS)相结合,使用LSTM作为BLS的特征映射节点,搭建了一种新型宽深学习网络(LSTM-BLS)进行音乐情感识别分类训练。在Emotion数据集上的实验结果表明,本文算法取得了比其他复杂网络更高的识别准确率,为音乐情感识别的发展提供了新的可行性思路。 展开更多
关键词 音乐情感识别 残差相位 宽度学习 深度学习 长短期记忆网络
在线阅读 下载PDF
基于音乐情感识别的舞台灯光控制方法研究
3
作者 汤玉琦 《大众标准化》 2021年第20期245-246,249,共3页
演艺文化节目的主要场地是剧场,剧场的状况会直接影响观众的体验。因此,在演艺文化节目的过程中,必须对舞台灯光进行有效控制。从音乐的情感动机角度出发,分析舞台灯光控制的方法,希望能有效地推广舞台灯光艺术,进一步提高舞台节目的表... 演艺文化节目的主要场地是剧场,剧场的状况会直接影响观众的体验。因此,在演艺文化节目的过程中,必须对舞台灯光进行有效控制。从音乐的情感动机角度出发,分析舞台灯光控制的方法,希望能有效地推广舞台灯光艺术,进一步提高舞台节目的表现力。 展开更多
关键词 音乐情感识别 舞台灯光控制 灯光音乐情感驱动
在线阅读 下载PDF
拉赫玛尼诺夫《g小调钢琴前奏曲》中的情感识别与表现探究
4
作者 王湘琦 《乐器》 2025年第4期30-33,共4页
本文以拉赫玛尼诺夫的《g小调钢琴前奏曲》为研究对象,深入分析该作品中的音乐情感识别与表现。通过对作品的创作背景、音乐结构、节奏、旋律与音色特点等方面的研究,识别出其中所蕴含的深沉、忧郁、激昂等复杂情感。同时,探讨了演奏者... 本文以拉赫玛尼诺夫的《g小调钢琴前奏曲》为研究对象,深入分析该作品中的音乐情感识别与表现。通过对作品的创作背景、音乐结构、节奏、旋律与音色特点等方面的研究,识别出其中所蕴含的深沉、忧郁、激昂等复杂情感。同时,探讨了演奏者在诠释该作品时如何通过技巧运用、节奏把握、力度控制等方面来表现作品的情感内涵,旨在为更好地理解和演绎这首经典作品提供理论与实践支持。 展开更多
关键词 音乐情感识别与表现 拉赫玛尼诺夫 钢琴教学 钢琴演奏技巧
在线阅读 下载PDF
音乐多模态数据情感识别方法的研究
5
作者 韩东红 孔彦茹 +1 位作者 展艺萌 刘源 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第6期776-785,792,共11页
音乐情感识别研究在音乐智能推荐和音乐可视化等领域有着广阔的应用前景.针对该研究中存在的仅利用低层音频特征进行情感识别时效果有限且可解释性差的问题,首先,构建能够学习音符语义信息的基于乐器数字接口(MIDI)数据的情感识别模型ER... 音乐情感识别研究在音乐智能推荐和音乐可视化等领域有着广阔的应用前景.针对该研究中存在的仅利用低层音频特征进行情感识别时效果有限且可解释性差的问题,首先,构建能够学习音符语义信息的基于乐器数字接口(MIDI)数据的情感识别模型ERMSLM(emotion recognition model based on skip-gram and LSTM using MIDI data),该模型的特征是由基于跳字模型(skip-gram)和长短期记忆(LSTM)网络提取的旋律特征,利用预训练的多层感知机(MLP)提取的调性特征以及手动构建的特征3部分连接而成;其次,构建融合歌词和社交标签的基于文本数据的情感识别模型ERMBT(emotion recognition model based on BERT using text data),其中歌词特征是由基于BERT(bidirectional encoder representations from trans formers)提取的情感特征、利用英文单词情感标准(ANEW)列表所构建的情感词典特征以及歌词的词频—逆文本频率(TF-IDF)特征所组成;最后,围绕MIDI和文本两种数据构建特征级融合和决策级融合两种多模态融合模型.实验结果表明,ERMSLM和ERMBT模型分别可达到56.93%,72.62%的准确率,决策级多模态融合模型效果更优. 展开更多
关键词 音乐情感识别 深度学习 多模态 长短期记忆
在线阅读 下载PDF
基于改进多模态RCNN的音频情感识别与分类模型设计 被引量:3
6
作者 文星林 白涛 《现代电子技术》 2023年第11期114-118,共5页
在海量音乐素材库的建设和音乐应用的自动推荐等场景中,由于乐曲特征具有复杂性与非线性的特点,因此计算机对音乐情感的自动识别效果并不理想。针对传统机器学习算法存在准确率偏低、鲁棒性较差的问题,文中基于改进的RCNN网络提出一种... 在海量音乐素材库的建设和音乐应用的自动推荐等场景中,由于乐曲特征具有复杂性与非线性的特点,因此计算机对音乐情感的自动识别效果并不理想。针对传统机器学习算法存在准确率偏低、鲁棒性较差的问题,文中基于改进的RCNN网络提出一种多模态的音乐情感识别及分类算法模型设计方案。该模型通过加重、分帧和加窗等手段对多模态数据进行预处理,并使用MFCC提取乐曲频率的特征向量,同时采用RCNN网络提取特征向量的全局及局部特征,利用双向LSTM算法获取数据的时序特征,再将训练得到的数据经自注意力机制加权后输出分类结果。在实验测试中,所提算法的二分类和四分类测试结果均优于对比算法,且平均分类准确率领先同类算法1.9%,证明其具有较为理想的综合性能。 展开更多
关键词 音乐情感识别 分类模型 多模态RCNN 数据预处理 特征提取 数字音频 分类结果输出
在线阅读 下载PDF
MEF融合HFF的戏剧视频关键情节自动提取
7
作者 尚雪莲 秦健勇 《电视技术》 北大核心 2015年第8期50-54,共5页
为了更好地从戏剧视频提取关键情节,提出了一种基于音乐情感特征(MEF)融合人脸特征(HFF)的自动提取方法。首先,利用基于音频指纹技术的二级音乐情感识别方法进行音频识别,并利用人脸特征进行视频识别;然后,利用音频和视频识别得到的各... 为了更好地从戏剧视频提取关键情节,提出了一种基于音乐情感特征(MEF)融合人脸特征(HFF)的自动提取方法。首先,利用基于音频指纹技术的二级音乐情感识别方法进行音频识别,并利用人脸特征进行视频识别;然后,利用音频和视频识别得到的各元素获取关键情节值,从而提取关键情节;最后,提出了一种量化评估方法评估关键情节提取方法的一致性。在四个戏剧视频上的评估实验验证了该方法的有效性及可靠性,相比其他几种较新的提取模型,该方法提取效果更好。 展开更多
关键词 音乐情感特征 人脸特征 视频关键情节 二级音乐情感识别 定量评估
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部