期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
结合时间注意力机制和单模态标签自动生成策略的自监督多模态情感识别 被引量:1
1
作者 孙强 王姝玉 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第2期588-601,共14页
大多数多模态情感识别方法旨在寻求一种有效的融合机制,构建异构模态的特征,从而学习到具有语义一致性的特征表示。然而,这些方法通常忽略了模态间情感语义的差异性信息。为解决这一问题,提出了一种多任务学习框架,联合训练1个多模态任... 大多数多模态情感识别方法旨在寻求一种有效的融合机制,构建异构模态的特征,从而学习到具有语义一致性的特征表示。然而,这些方法通常忽略了模态间情感语义的差异性信息。为解决这一问题,提出了一种多任务学习框架,联合训练1个多模态任务和3个单模态任务,分别学习多模态特征间的情感语义一致性信息和各个模态所含情感语义的差异性信息。首先,为了学习情感语义一致性信息,提出了一种基于多层循环神经网络的时间注意力机制(TAM),通过赋予时间序列特征向量不同的权重来描述情感特征的贡献度。然后,针对多模态融合,在语义空间进行了逐语义维度的细粒度特征融合。其次,为了有效学习各个模态所含情感语义的差异性信息,提出了一种基于模态间特征向量相似度的自监督单模态标签自动生成策略(ULAG)。通过在CMU-MOSI,CMU-MOSEI, CH-SIMS 3个数据集上的大量实验结果证实,提出的TAM-ULAG模型具有很强的竞争力:在分类指标(Acc_(2),F_(1))和回归指标(MAE, Corr)上与基准模型的指标相比均有所提升;对于二分类识别准确率,在CMUMOSI和CMU-MOSEI数据集上分别为87.2%和85.8%,而在CH-SIMS数据集上达到81.47%。这些研究结果表明,同时学习多模态间的情感语义一致性信息和各模态情感语义的差异性信息,有助于提高自监督多模态情感识别方法的性能。 展开更多
关键词 多模态情感识别 自监督标签生成 多任务学习 时间注意力机制 多模态融合
在线阅读 下载PDF
多层次时空特征自适应集成与特有-共享特征融合的双模态情感识别 被引量:5
2
作者 孙强 陈远 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第2期574-587,共14页
在结合脑电(EEG)信号与人脸图像的双模态情感识别领域中,通常存在两个挑战性问题:(1)如何从EEG信号中以端到端方式学习到更具显著性的情感语义特征;(2)如何充分利用双模态信息,捕捉双模态特征中情感语义的一致性与互补性。为此,提出了... 在结合脑电(EEG)信号与人脸图像的双模态情感识别领域中,通常存在两个挑战性问题:(1)如何从EEG信号中以端到端方式学习到更具显著性的情感语义特征;(2)如何充分利用双模态信息,捕捉双模态特征中情感语义的一致性与互补性。为此,提出了多层次时空特征自适应集成与特有-共享特征融合的双模态情感识别模型。一方面,为从EEG信号中获得更具显著性的情感语义特征,设计了多层次时空特征自适应集成模块。该模块首先通过双流结构捕捉EEG信号的时空特征,再通过特征相似度加权并集成各层次的特征,最后利用门控机制自适应地学习各层次相对重要的情感特征。另一方面,为挖掘EEG信号与人脸图像之间的情感语义一致性与互补性,设计了特有-共享特征融合模块,通过特有特征的学习和共享特征的学习来联合学习情感语义特征,并结合损失函数实现各模态特有语义信息和模态间共享语义信息的自动提取。在DEAP和MAHNOB-HCI两种数据集上,采用跨实验验证和5折交叉验证两种实验手段验证了提出模型的性能。实验结果表明,该模型取得了具有竞争力的结果,为基于EEG信号与人脸图像的双模态情感识别提供了一种有效的解决方案。 展开更多
关键词 双模态情感识别 脑电 人脸图像 多层次时空特征 特征融合
在线阅读 下载PDF
嵌入多阶泰勒微分知识的多尺度注意力循环网络深度时空序列预测方法 被引量:1
3
作者 孙强 赵珂 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第6期2605-2618,共14页
融合先验物理知识的深度时空序列预测方法通常使用偏微分方程(PDE)进行建模,这种做法通常存在两大问题:(1)偏微分方程的近似精度低;(2)无法在循环网络中有效捕捉多种空间尺度的时空特征和时空序列的边缘相关空间信息。为此,该文提出了... 融合先验物理知识的深度时空序列预测方法通常使用偏微分方程(PDE)进行建模,这种做法通常存在两大问题:(1)偏微分方程的近似精度低;(2)无法在循环网络中有效捕捉多种空间尺度的时空特征和时空序列的边缘相关空间信息。为此,该文提出了融合泰勒微分的卷积循环神经网络(TDI-CRNN)。首先,为了提高高阶偏微分方程的近似精度并缓解偏微分方程应用的局限性,设计了一种多阶泰勒近似物理模块。该模块首先使用泰勒展开式对输入序列作微分逼近,再将不同阶数之间的微分卷积层使用微分系数耦合,最后动态调整泰勒展开结果的截断阶数与微分项数。其次,为了捕获循环网络隐藏状态的多种空间尺度特征并更好地捕捉时空序列的边缘相关空间信息,设计了一种多尺度注意力循环模块(MSARM),在该模块的多尺度卷积空间注意力UNet(即MCSA-UNet)的卷积层中使用了多尺度卷积和空间注意力机制,目的是关注时空序列的局部空间区域。在Moving MNIST,KTH以及CIKM数据集上开展了大量实验,Moving MNIST数据集的均方误差(MSE)指标下降到42.7,结构相似性指数(SSIM)提高到0.912;KTH数据集的SSIM和峰值信噪比(PSNR)分别提高到0.882和29.03;CIKM数据集上的临界成功指数(CSI)提高到0.515。最终的可视化和定量预测结果均验证了TDI-CRNN模型的合理性和有效性。 展开更多
关键词 时空序列预测 长短期记忆网络 知识引导 偏微分方程 泰勒展开式
在线阅读 下载PDF
基于面部全局抑郁特征局部感知力增强和全局-局部语义相关性特征融合的抑郁强度识别
4
作者 孙强 李正 何浪 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第5期2249-2263,共15页
现有基于深度学习的大多数方法在实现患者抑郁程度自动识别的过程中,主要存在两大挑战:(1)难以利用深度模型自动地从面部表情有效学习到抑郁强度相关的全局上下文信息,(2)往往忽略抑郁强度相关的全局和局部信息之间的语义一致性。为此,... 现有基于深度学习的大多数方法在实现患者抑郁程度自动识别的过程中,主要存在两大挑战:(1)难以利用深度模型自动地从面部表情有效学习到抑郁强度相关的全局上下文信息,(2)往往忽略抑郁强度相关的全局和局部信息之间的语义一致性。为此,该文提出一种全局抑郁特征局部感知力增强和全局-局部语义相关性特征融合(PLEGDF-FGLSCF)的抑郁强度识别深度模型。首先,设计了全局抑郁特征局部感知力增强(PLEGDF)模块,用于提取面部局部区域之间的语义相关性信息,促进不同局部区域与抑郁相关的信息之间的交互,从而增强局部抑郁特征驱动的全局抑郁特征表达力。然后,提出了全局-局部语义相关性特征融合(FGLSCF)模块,用于捕捉全局和局部语义信息之间的关联性,实现全局和局部抑郁特征之间的语义一致性描述。最后,在AVEC2013和AVEC2014数据集上,利用PLEGDF-FGLSCF模型获得的识别结果在均方根误差(RMSE)和平均绝对误差(MAE)指标上的值分别是7.75/5.96和7.49/5.99,优于大多数已有的基准模型,证实了该方法的合理性和有效性。 展开更多
关键词 抑郁强度 人脸图像 局部感知力增强 全局和局部特征融合 语义一致性
在线阅读 下载PDF
空间光-光纤耦合技术进展与实验研究
5
作者 梁静远 惠玉泽 +1 位作者 董可 柯熙政 《激光杂志》 CAS 北大核心 2023年第4期1-18,共18页
总结了国内外空间光-光纤耦合技术在无线光通信中的研究进展,以提高空间光-光纤耦合效率为主线,介绍了西安理工大学在该领域的工作,包括空间光光纤耦合自动对准技术、自由空间光模式转换技术、空间光光纤耦合自适应光学波前校正技术、... 总结了国内外空间光-光纤耦合技术在无线光通信中的研究进展,以提高空间光-光纤耦合效率为主线,介绍了西安理工大学在该领域的工作,包括空间光光纤耦合自动对准技术、自由空间光模式转换技术、空间光光纤耦合自适应光学波前校正技术、马卡天线的收发一体化技术。介绍了大气湍流中透镜阵列和单透镜耦合至单模光纤的耦合性能、大气湍流中马卡天线作为接收天线时的空间光耦合性能方面的研究进展。最后展望了无线光通信中的空间光-光纤耦合技术的发展前景。 展开更多
关键词 无线光通信 光纤耦合 自动对准 模式转换 波前校正
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部