期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
面向智能交通的人车识别无线感知方法研究
1
作者 张石清 宋铭心 +3 位作者 陈鑫权 楼亮亮 赵小明 钱小鸿 《传感技术学报》 CAS CSCD 北大核心 2024年第7期1186-1192,共7页
基于无线感知技术的人车识别方法,具有部署成本低、无侵入性等优点,是智能交通系统智慧水平提升的关键手段。然而,现存人车识别无线感知方法,多以2.4 GHz无线能量数据为基础,忽视sub-GHz在该领域中的应用,且鲜有工作探讨天线高度和人车... 基于无线感知技术的人车识别方法,具有部署成本低、无侵入性等优点,是智能交通系统智慧水平提升的关键手段。然而,现存人车识别无线感知方法,多以2.4 GHz无线能量数据为基础,忽视sub-GHz在该领域中的应用,且鲜有工作探讨天线高度和人车识别性能内在联系。为此,旨在厘清载波频段、天线高度与算法性能关联关系,提出基于卷积神经网络的人车识别无线感知方法(Wireless Sensing-Based Human-Vehicle Recognition with Convolutional Neural Network,WsHVR-CNN),阐明人车识别无线感知方法设计依据与多参数影响机理。实验表明,sub-GHz与2.4 GHz无线能量数据均可为人车识别无线感知方法建构奠定基础,而基于2.4 GHz频段所构的WsHVR-CNN性能最优,在天线高度为0.8 m时准确度达到98.15%。此外,所开发的数据集公开于https://github.com/TZ-mx/WiParam,为相关工作深入研究提供基础。 展开更多
关键词 人车识别 无线感知 交通参数测量 卷积神经网络
在线阅读 下载PDF
面向听视觉信息的多模态人格识别研究进展 被引量:4
2
作者 赵小明 唐志伟 张石清 《智能系统学报》 CSCD 北大核心 2021年第2期189-201,共13页
人格识别分析是人格计算研究中一个重要的研究内容,在人类行为分析、人工智能、人机交互、个性化推荐等方面具有重要的应用价值,是近年来心理学、认知学、计算机科学等领域中的一个多学科交叉的热点研究课题。本文介绍了与人格识别相关... 人格识别分析是人格计算研究中一个重要的研究内容,在人类行为分析、人工智能、人机交互、个性化推荐等方面具有重要的应用价值,是近年来心理学、认知学、计算机科学等领域中的一个多学科交叉的热点研究课题。本文介绍了与人格识别相关的各种人格类型表示理论和人格识别数据库,阐述了面向听视觉信息的各种听视觉人格特征提取技术,如手工特征和深度特征,并在此基础上对面向听视觉信息人格识别的多模态融合方法做了详细的分类和归纳,最后概括了面向听视觉信息的多模态人格识别发展趋势,并进行了展望。 展开更多
关键词 人格识别 人格计算 人格类型 听视觉信息 特征提取 手工特征 深度特征 多模态融合
在线阅读 下载PDF
基于跨模态特征重构与解耦网络的多模态抑郁症检测方法 被引量:1
3
作者 赵小明 谌自强 张石清 《计算机应用研究》 北大核心 2025年第1期236-241,共6页
抑郁症是一种广泛而严重的心理健康障碍,需要早期检测以便进行有效的干预。因为跨模态之间存在的信息冗余和模态间的异质性,集成音频和文本模态的自动化抑郁症检测是一个具有挑战性但重要的问题,先前的研究通常未能充分地明确学习音频-... 抑郁症是一种广泛而严重的心理健康障碍,需要早期检测以便进行有效的干预。因为跨模态之间存在的信息冗余和模态间的异质性,集成音频和文本模态的自动化抑郁症检测是一个具有挑战性但重要的问题,先前的研究通常未能充分地明确学习音频-文本模态的相互作用以用于抑郁症检测。为了解决这些问题,提出了基于跨模态特征重构与解耦网络的多模态抑郁症检测方法(CFRDN)。该方法以文本作为核心模态,引导模型重构音频特征用于跨模态特征解耦任务。该框架旨在从文本引导重构的音频特征中解离共享和私有特征,以供后续的多模态融合使用。在DAIC-WoZ和E-DAIC数据集上进行了充分的实验,结果显示所提方法在多模态抑郁症检测任务上优于现有技术。 展开更多
关键词 多模态 抑郁症检测 特征重构 特征解耦 特征融合
在线阅读 下载PDF
基于深度特征交互与层次化多模态融合的情感识别模型
4
作者 王健 赵小明 +2 位作者 王成龙 张石清 赵舒畅 《计算机应用研究》 北大核心 2025年第7期1978-1985,共8页
多模态情感识别近年来成为情感计算领域的重要研究方向,旨在通过融合语音、文本等多种模态以更精确地识别和理解人类情感状态。然而,现有方法在提取特征时缺乏模态间的关联性处理以及融合特征时忽视多尺度情感线索。为了解决上述问题,... 多模态情感识别近年来成为情感计算领域的重要研究方向,旨在通过融合语音、文本等多种模态以更精确地识别和理解人类情感状态。然而,现有方法在提取特征时缺乏模态间的关联性处理以及融合特征时忽视多尺度情感线索。为了解决上述问题,提出一种基于深度特征交互与层次化多模态融合的情感识别模型(DFIHMF)。在特征提取阶段,该模型通过引入本地知识令牌(local knowledge token,LKT)与跨模态交互令牌(cross-modal interaction token,CIT)来增强不同模态之间的交互并提取多尺度信息。在特征融合阶段,该模型利用层次化融合策略来融合模态间复杂的多模态特征与多尺度情感线索。在MOSI与MOSEI数据集上的实验结果显示,该模型在ACC7评价指标上的准确率分别达45.6%和53.5%,证明了所提方法在多模态情感识别任务上优于现有技术。 展开更多
关键词 多模态情感识别 层次化融合 多尺度融合 特征融合
在线阅读 下载PDF
面向深度学习的多模态情感识别研究进展 被引量:22
5
作者 赵小明 杨轶娇 张石清 《计算机科学与探索》 CSCD 北大核心 2022年第7期1479-1503,共25页
多模态情感识别是指通过与人类情感表达相关的语音、视觉、文本等不同模态信息来识别人的情感状态。该研究在人机交互、人工智能、情感计算等领域有着重要的研究意义,备受研究者关注。鉴于近年来发展起来的深度学习方法在各种任务中所... 多模态情感识别是指通过与人类情感表达相关的语音、视觉、文本等不同模态信息来识别人的情感状态。该研究在人机交互、人工智能、情感计算等领域有着重要的研究意义,备受研究者关注。鉴于近年来发展起来的深度学习方法在各种任务中所取得的巨大成功,目前各种深度神经网络已被用于学习高层次的情感特征表示,用于多模态情感识别。为了系统地总结深度学习方法在多模态情感识别领域中的研究现状,拟对近年来面向深度学习的多模态情感识别研究文献进行分析与归纳。首先,给出了多模态情感识别的一般框架,并介绍了常用的多模态情感数据集。然后,简要回顾了代表性深度学习技术的原理及其进展。随后,重点详细介绍了多模态情感识别中的两个关键步骤的研究进展:与语音、视觉、文本等不同模态相关的情感特征提取方法,包括手工特征和深度特征;融合不同模态信息的多模态信息融合策略。最后,分析了该领域面临的挑战和机遇,并指出了未来的发展方向。 展开更多
关键词 情感识别 多模态 深度学习 手工特征 深度特征 融合
在线阅读 下载PDF
采用双阶段多示例学习网络的语音情感识别 被引量:2
6
作者 张石清 陈晨 赵小明 《计算机科学与探索》 CSCD 北大核心 2024年第12期3300-3310,共11页
在语音情感识别任务中,当处理不同时长的语音信号时,通常将每句语音信号分割成若干等长片段,然后根据所有片段预测结果的平均值来获得最终的情感分类。然而,这种处理方法要求用户的情绪表达在整个语音信号中是均匀分布的,但是这并不符... 在语音情感识别任务中,当处理不同时长的语音信号时,通常将每句语音信号分割成若干等长片段,然后根据所有片段预测结果的平均值来获得最终的情感分类。然而,这种处理方法要求用户的情绪表达在整个语音信号中是均匀分布的,但是这并不符合实际情况。针对上述问题,提出一种采用双阶段多示例学习网络的语音情感识别方法。第一阶段,将每句语音信号视为“包”,并将其分割成若干等长片段。每个语音片段视为“示例”,并提取多种声学特征,输入到相应的局部声学特征编码器,学习出各自对应的深度特征向量。然后,使用一致性注意力对不同的声学特征进行特征交互和增强。第二阶段,设计一个基于多示例学习的混合聚合器,用于在全局尺度上融合示例预测和示例特征,计算“包”级预测得分。提出一种示例蒸馏模块,用于过滤情感信息较弱的冗余示例。将蒸馏结果组成伪包,采用一种自适应特征聚合策略对伪包进行特征聚合,并通过分类器获得预测结果。将示例级和伪包预测结果进行自适应决策聚合,以获得最终的情感分类结果。该方法在IEMOCAP和MELD公开数据集分别获得73.02%和44.92%的识别率,实验结果表明了该方法的有效性。 展开更多
关键词 语音情感识别 多示例学习 示例蒸馏 一致性注意力 聚合
在线阅读 下载PDF
多模深度卷积神经网络应用于视频表情识别 被引量:19
7
作者 潘仙张 张石清 郭文平 《光学精密工程》 EI CAS CSCD 北大核心 2019年第4期963-970,共8页
由于视频中的手工特征和主观情感之间的直接相关性很小,识别视频序列中的面部表情是一项很有挑战性的任务,为了克服这个缺陷,有效提高视频中的人脸表情识别性能。本方法采用两个深度卷积神经网络,即空间卷积神经网络和时间卷积神经网络... 由于视频中的手工特征和主观情感之间的直接相关性很小,识别视频序列中的面部表情是一项很有挑战性的任务,为了克服这个缺陷,有效提高视频中的人脸表情识别性能。本方法采用两个深度卷积神经网络,即空间卷积神经网络和时间卷积神经网络,用于视频中的时空表情特征学习。其中,空间卷积神经网络用于提取视频中每一帧静态的表情图像的空间信息特征,而时间卷积神经网络用于从视频中多帧表情图像的光流信息中提取动态信息特征。然后,将这两个深度卷积神经网络学习到的时空特征进行基于深度信念网络(DBN)的特征层融合,输入到支持向量机实现视频中的人脸表情分类任务。在公共的RML和BAUM-1s视频情感数据集的测试结果表明,该方法分别取得了71.06%和52.18%的正确识别率,明显优于现有文献报导的结果。多模深度卷积神经网络的人脸表情识别方法能提高视频中人脸表情的识别性能。 展开更多
关键词 深度卷积神经网络 多模深度学习 表情识别 时空特征 深度信念神经网络
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部