期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
融合音频、文本、表情动作的多模态情感识别 被引量:14
1
作者 贾宁 郑纯军 《应用科学学报》 CAS CSCD 北大核心 2023年第1期55-70,共16页
针对机器识别人类情感过程中的精度不高、泛化能力不强等问题,提出了一种基于语音、文本和表情动作的3种模态情感识别融合方法。在语音模态中,设计深度波场延拓和改进波动物理模型,模拟长短期记忆(long short-term memory,LSTM)网络的... 针对机器识别人类情感过程中的精度不高、泛化能力不强等问题,提出了一种基于语音、文本和表情动作的3种模态情感识别融合方法。在语音模态中,设计深度波场延拓和改进波动物理模型,模拟长短期记忆(long short-term memory,LSTM)网络的序列信息挖掘过程;在文本模态中,利用含有多头注意力机制的Transformer模型捕捉语义上潜在的情感表达;在表情动作模态中,将提取面部表情和手部动作的序列特征与双向三层含有注意力机制的LSTM模型相结合。最终提出一种多性能指标下的模态融合方案,以实现高精度的、强泛化能力的情感识别。在通用的交互式情感二元运动捕捉语料库IEMOCAP中,将所提出的方法与现有的情感识别算法进行对比,实验结果表明:所提出的算法在单个模态和多个模态中的识别精度均较高,平均精度改善达到16.4%和10.5%,有效提升了人机交互中情感识别的能力。 展开更多
关键词 语音情感识别 文本情感识别 动作情感识别 Transformer模型 注意力机制
在线阅读 下载PDF
一种改进复杂场景下小目标检测模型的方法 被引量:7
2
作者 周慧 严凤龙 +1 位作者 褚娜 刘振宇 《计算机工程与应用》 CSCD 北大核心 2022年第11期187-192,共6页
复杂场景下小目标检测是目标检测领域的研究难点和热点。传统的two-stage和one-stage检测模型都是通过预先设定锚点框与真实目标框的交并比(intersection over union,IoU)阈值来划分正负样本集,同时这组预定义的固定锚点框还用于获取候... 复杂场景下小目标检测是目标检测领域的研究难点和热点。传统的two-stage和one-stage检测模型都是通过预先设定锚点框与真实目标框的交并比(intersection over union,IoU)阈值来划分正负样本集,同时这组预定义的固定锚点框还用于获取候选框,进而得到检测结果。然而,在复杂场景下,预先设定的IoU阈值会带来正负样本不均衡问题;针对小尺寸目标(船舶)检测,预定义的锚点框也很难保证覆盖目标的位置和密度,因此限制了检测模型的准确率。为了解决上述问题,提出自适应锚点框(adaptive anchor boxes,AAB)的方法优化目标检测网络,采用基于形状相似度距离的聚类算法生成锚点框,提高目标区域定位技术;采用利用聚类的锚点框计算自适应IoU阈值(adaptive threshold selection,ATS),划分正负样本,保证样本均衡。对复杂场景下的小目标(船舶目标)进行检测,实验结果表明,采用自适应锚点框方法和自适应阈值选择方法的目标检测模型在复杂场景中检测均能提升准确,对比faster R-CNN、FPN、Yolo3和pp-Yolo,融合了上述新方法的模型均提升了检测准确率,分别提升了9.6、2.6、9.8和9.9个百分点。 展开更多
关键词 小目标检测 自适应阈值选择 自适应锚点框
在线阅读 下载PDF
利用柔性注意力分割模型的X频段航海雷达图像海面溢油检测 被引量:2
3
作者 周慧 严凤龙 +2 位作者 褚娜 陈明华 刘振宇 《电讯技术》 北大核心 2022年第12期1774-1779,共6页
X频段航海雷达图像广泛应用于溢油探测中,但是目前仅用于判断是否有溢油,对油污区域的精确计算较少。针对上述问题,引入了基于柔性注意力机制的图像分割的模型。首先建立以基于特征金字塔的目标检测模型为主干模型的语义分割模型,将多... X频段航海雷达图像广泛应用于溢油探测中,但是目前仅用于判断是否有溢油,对油污区域的精确计算较少。针对上述问题,引入了基于柔性注意力机制的图像分割的模型。首先建立以基于特征金字塔的目标检测模型为主干模型的语义分割模型,将多尺度特征进行充分融合,包括高层次的语义信息和低层次的位置信息;然后针对每一个特征层分别引入通道注意力机制,计算特征层中通道之间的权重关系,提高模型对溢油特征提取的表达能力,同时采用像素级别的语义分割打分函数作为评价分割区域质量的指标。对大连区域海面溢油数据集进行检测的实验结果表明,该方法能够提高溢油区域的分割精度,同时与PSPNet、DeepLab V3+和Attention U-net等分割模型相比,基于像素级别的分割准确率提高至85.77%。 展开更多
关键词 X频段航海雷达 海面溢油检测 图像分割 柔性注意力机制
在线阅读 下载PDF
融合图像显著性的声波动方程情感识别模型 被引量:1
4
作者 贾宁 郑纯军 《数据采集与处理》 CSCD 北大核心 2021年第5期1062-1072,共11页
语音情感识别(Speech emotion recognition,SER)是计算机理解人类情感的关键之处,也是人机交互的重要组成部分。当情感语音信号在不同的介质传播时,使用深度学习模型获得的识别精度不高,识别模型的迁移能力不强。为此,设计了一种融合图... 语音情感识别(Speech emotion recognition,SER)是计算机理解人类情感的关键之处,也是人机交互的重要组成部分。当情感语音信号在不同的介质传播时,使用深度学习模型获得的识别精度不高,识别模型的迁移能力不强。为此,设计了一种融合图像显著性和门控循环的声波动方程情感识别(Image saliency gated recurrent acoustic wave equation emotion recognition,ISGR-AWEER)模型,该模型由图像显著性提取和基于门控循环的声波动模型构成。前者模拟注意力机制,用于提取语音中情感表达的有效区域,后者设计了一个声波动情感识别模型,该模型模拟循环神经网络的流程,可以有效提升跨介质下语音情感识别的精度,同时可快速地实现跨介质下的模型迁移。通过实验,在交互情感二元动作捕捉(Interactive emotional dyadic motion capture,IEMOCAP)情感语料库和自建多介质情感语音语料库上验证了当前模型的有效性,与传统的循环神经网络相比,情感识别精度获得了25%的改善,并且具有较强的跨媒介迁移能力。 展开更多
关键词 语音情感识别 图像显著性和门控循环的声波动方程情感识别 图像显著性 声波动方程 门控循环 多介质情感语音语料库
在线阅读 下载PDF
关于带运输的单机调度在线问题的研究 被引量:6
5
作者 王银玲 韩鑫 邵欣欣 《运筹学学报》 CSCD 北大核心 2022年第1期125-133,共9页
本文研究了带运输机的单机在线调度问题。问题假设工件实时在线到达,系统中有一台运输机,该运输机每次最多运输k个工件,每个工件需要先在单机上完成加工,然后再被运输机运往目的地,问题的优化目标为最小化完工时间,即所有工件被加工完... 本文研究了带运输机的单机在线调度问题。问题假设工件实时在线到达,系统中有一台运输机,该运输机每次最多运输k个工件,每个工件需要先在单机上完成加工,然后再被运输机运往目的地,问题的优化目标为最小化完工时间,即所有工件被加工完并且运往目的地的时间最短。针对该问题,作者研究了工件满足一致性条件的模型,并且基于贪心思想给出了竞争比为√5+1/2的在线算法,并且证明该算法是最优在线算法。 展开更多
关键词 运输机 单机调度 在线算法
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部