期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
融合时空特征的视频序列表情识别 被引量:6
1
作者 王晓华 夏晨 +1 位作者 胡敏 任福继 《电子与信息学报》 EI CSCD 北大核心 2018年第3期626-632,共7页
针对视频表情识别,静态特征不能有效描述人脸区域沿时间轴动态变化信息的局限,该文提出一种融合动态纹理信息和运动信息的表情识别方法,借鉴LBP-TOP原理,提出具有时空域描述能力的时空韦伯局部描述子(STWLD)来提取动态纹理信息,同时采... 针对视频表情识别,静态特征不能有效描述人脸区域沿时间轴动态变化信息的局限,该文提出一种融合动态纹理信息和运动信息的表情识别方法,借鉴LBP-TOP原理,提出具有时空域描述能力的时空韦伯局部描述子(STWLD)来提取动态纹理信息,同时采用分块光流直方图(BHOF)描述运动信息,最后利用SVM对融合后的纹理和运动信息完成表情分类。在CK+和MMI表情数据库上的交叉实验结果表明,相比基于单一特征的识别方法,所提方法取得了更好的效果;与其他相关方法的对比实验也验证了该方法的优越性。 展开更多
关键词 视频序列 表情识别 时空韦伯局部描述子 分块光流直方图特征
在线阅读 下载PDF
基于层级注意力模型的视频序列表情识别 被引量:3
2
作者 王晓华 潘丽娟 +3 位作者 彭穆子 胡敏 金春花 任福继 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2020年第1期27-35,共9页
长短期记忆网络(LSTM)广泛应用于视频序列的人脸表情识别,针对单层LSTM表达能力有限,在解决复杂问题时其泛化能力易受制约的不足,提出一种层级注意力模型:使用堆叠LSTM学习时间序列数据的分层表示,利用自注意力机制构建差异化的层级关系... 长短期记忆网络(LSTM)广泛应用于视频序列的人脸表情识别,针对单层LSTM表达能力有限,在解决复杂问题时其泛化能力易受制约的不足,提出一种层级注意力模型:使用堆叠LSTM学习时间序列数据的分层表示,利用自注意力机制构建差异化的层级关系,并通过构造惩罚项,进一步结合损失函数优化网络结构,提升网络性能.在CK+和MMI数据集上的实验结果表明,由于构建了良好的层次级别特征,时间序列上的每一步都从更感兴趣的特征层级上挑选信息,相较于普通的单层LSTM,层级注意力模型能够更加有效地表达视频序列的情感信息. 展开更多
关键词 视频序列 人脸表情识别 堆叠长短期记忆网络 自注意力机制
在线阅读 下载PDF
图像分割中改进空间约束贝叶斯网络模型的应用 被引量:3
3
作者 张海艳 高尚兵 《计算机应用》 CSCD 北大核心 2017年第3期823-826,831,共5页
针对马尔可夫链蒙特卡罗方法普遍存在的迭代收敛性问题,在具有空间平滑约束的高斯混合模型条件上提出改进空间约束贝叶斯网络模型并在图像分割领域进行具体应用。所提模型应用隐狄利克雷分布(LDA)概率密度模型和高斯-马尔可夫定理的随... 针对马尔可夫链蒙特卡罗方法普遍存在的迭代收敛性问题,在具有空间平滑约束的高斯混合模型条件上提出改进空间约束贝叶斯网络模型并在图像分割领域进行具体应用。所提模型应用隐狄利克雷分布(LDA)概率密度模型和高斯-马尔可夫定理的随机域参数混合过程来实现参数平滑。所提方法根据空间信息先验平滑变换操作,在待处理像素点的上下文混合结构中引入LDA符合多项式分布,用来替换传统期望最大化算法中映射操作。LDA参数采用闭合形式将有利于准确估计最大后验概率(MAP)框架与上下文混合结构的相关比例。实验结果表明,应用PRI、Vo I、GCE和BDE指标进行效果比较,该方法比联合系统工程组(JSEG)、当前变换矩阵(CTM)和最大后验概率-最大似然法(MM)方法的图像分割应用效果较好,高斯噪声对于该算法的鲁棒性影响较小。 展开更多
关键词 隐狄利克雷分布 期望最大化方法 贝叶斯模型 高斯混合模型 图像分割
在线阅读 下载PDF
多聚点子空间下的时空信息融合及其在行为识别中的应用 被引量:4
4
作者 杨天金 侯振杰 +3 位作者 李兴 梁久祯 宦娟 郑纪翔 《自动化学报》 EI CAS CSCD 北大核心 2022年第11期2823-2835,共13页
基于深度序列的人体行为识别,一般通过提取特征图来提高识别精度,但这类特征图通常存在时序信息缺失的问题.针对上述问题,本文提出了一种新的深度图序列表示方式,即深度时空图(Depth space time maps,DSTM).DSTM降低了特征图的冗余度,... 基于深度序列的人体行为识别,一般通过提取特征图来提高识别精度,但这类特征图通常存在时序信息缺失的问题.针对上述问题,本文提出了一种新的深度图序列表示方式,即深度时空图(Depth space time maps,DSTM).DSTM降低了特征图的冗余度,弥补了时序信息缺失的问题.本文通过融合空间信息占优的深度运动图(Depth motion maps,DMM)与时序信息占优的DSTM,进行高精度的人体行为研究,并提出了多聚点子空间学习(Multi-center subspace learning,MCSL)的多模态数据融合算法.该算法为各类数据构建多个投影聚点,以此增大样本的类间距离,降低了投影目标区域维度.本文在MSR-Action3D数据集和UTD-MHAD数据集上进行人体行为识别.最后实验结果表明,本文方法相较于现有人体行为识别方法有着较高的识别率. 展开更多
关键词 行为识别 信息融合 深度时空图 多聚点子空间学习
在线阅读 下载PDF
FIRE-DET:一种高效的火焰检测模型 被引量:6
5
作者 陈浩霖 高尚兵 +2 位作者 相林 蔡创新 汪长春 《南京信息工程大学学报(自然科学版)》 CAS 北大核心 2023年第1期76-84,共9页
模型的效率在计算机视觉中变得越来越重要.本文通过研究用于火焰检测的神经网络结构,提出了几个关键的优化方案,以提高模型效率和检测效果.第一,提出一种由多卷积组合结构构建的主干网络(FIRE-Net),它能高效地从多个尺度上提取丰富的火... 模型的效率在计算机视觉中变得越来越重要.本文通过研究用于火焰检测的神经网络结构,提出了几个关键的优化方案,以提高模型效率和检测效果.第一,提出一种由多卷积组合结构构建的主干网络(FIRE-Net),它能高效地从多个尺度上提取丰富的火焰特征;第二,提出一种改进的加权双向特征金字塔网络(BiFPN-mini)以快速地实现多尺度特征融合;第三,提出一种新的注意力机制(FIRE-Attention),让检测器对火焰特征更敏感.基于上述优化,本文开发出了一种全新的火焰检测器FIRE-DET,它在硬件资源有限的条件下能够取得比现有基于深度学习的火焰检测方法更高的检测效率.FIRE-DET模型在自建数据集上进行训练后,最终对火焰检测的准确率和帧率分别达到97%和85 FPS.实验结果表明,与主流算法相比,本文火焰检测模型检测性能更优.本文为解决火焰探测问题提供了一个更通用的解决方案. 展开更多
关键词 特征提取 特征融合 注意力机制 火焰检测
在线阅读 下载PDF
分段双向去除反向重力加速度算法 被引量:1
6
作者 李兴 侯振杰 +1 位作者 梁久祯 常兴治 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2019年第4期560-572,共13页
针对角度法在滤除反向重力加速度过程中数据误差导致的线性加速精度不高的问题,提出一种分段双向去除反向重力加速度算法.首先提出一种基于静止点的数据分段法,将静止点作为端点将运动数据分段,以避免角速度积分过程中误差的段间积累;... 针对角度法在滤除反向重力加速度过程中数据误差导致的线性加速精度不高的问题,提出一种分段双向去除反向重力加速度算法.首先提出一种基于静止点的数据分段法,将静止点作为端点将运动数据分段,以避免角速度积分过程中误差的段间积累;然后设计一种改进于角度法的双向角度法,以数据段为单位去除反向重力加速度,减小了由段内角速度积分过程带来的积累误差对线性加速度结果精度的影响.使用集成三轴加速度传感器和三轴陀螺仪的六轴传感器,搭配微型电脑树莓派,在不同量程下制作2个数据集;并在2个数据集上进行不同算法的精确度对比实验.结果表明,该算法比角度法获取的线性加速度更精确. 展开更多
关键词 反向重力加速度 积累误差 静止点 数据分段
在线阅读 下载PDF
视觉协同的违规驾驶行为分析方法 被引量:2
7
作者 高尚兵 黄子赫 +2 位作者 耿璇 臧晨 沈晓坤 《智能系统学报》 CSCD 北大核心 2021年第6期1158-1165,共8页
本文针对危险驾驶识别中主流行为检测算法可靠性差的问题,提出了一种快速、可靠的视觉协同分析方法。对手机、水杯、香烟等敏感物体进行目标检测,提出的LW(low weight)-Yolov4(You only look once v4)通过去除CSPDarknet53(cross stage ... 本文针对危险驾驶识别中主流行为检测算法可靠性差的问题,提出了一种快速、可靠的视觉协同分析方法。对手机、水杯、香烟等敏感物体进行目标检测,提出的LW(low weight)-Yolov4(You only look once v4)通过去除CSPDarknet53(cross stage partial Darknet53)卷积层中不重要的要素通道提升了检测速度,并L1正则化产生稀疏权值矩阵,添加到BN(batch normalization)层的梯度中,实现优化网络模型的目的;提出姿态检测算法对驾驶员指关节关键点进行检测,经过仿射逆变换得到原始帧中的坐标;通过视觉协同分析对比敏感物品的检测框位置与驾驶员手部坐标是否重合,判定驾驶员是否出现违规驾驶行为及类别。实验结果表明,该方法在识别精度与检测速度方面均优于主流的算法,能够满足实时性和可靠性的检测要求。 展开更多
关键词 驾驶行为识别 模型剪枝 目标检测 姿态估计 协同检测 模型优化 深度学习 卷积神经网络
在线阅读 下载PDF
一种适用于广电网的属性基广播加密方案 被引量:2
8
作者 李学俊 袁亚文 金春花 《计算机研究与发展》 EI CSCD 北大核心 2018年第7期1409-1420,共12页
广电网在战略转型阶段中,协同"云管端"统一布局,规划服务云平台.但是,云的开放使广电网中信息安全无法得到保证.属性基广播加密技术融合了广播加密和属性基加密技术的优点,可将消息安全传送给多个用户的同时实现灵活的密文访... 广电网在战略转型阶段中,协同"云管端"统一布局,规划服务云平台.但是,云的开放使广电网中信息安全无法得到保证.属性基广播加密技术融合了广播加密和属性基加密技术的优点,可将消息安全传送给多个用户的同时实现灵活的密文访问控制,适用于多用户、多服务的广电网.然而,目前属性基广播加密技术中仍存在一些缺陷,如广播密文长度过大、用户私钥数量过多、加解密计算复杂、访问策略不够灵活以及未考虑属性权重等.针对以上不足,提出一种适用于广电网的属性基广播加密方案.方案基于经典的广播加密方案,发送方可自由选择接收用户集,实现了高效的用户撤销;采用权重门限访问结构并引入通配符机制,实现了广播密文长度固定的同时增强了密文访问结构灵活性,权重思想也使方案更符合现实应用场景;引入一种基于中间人的属性基加密技术,同时实现了外包存储和外包解密,有效地降低了私钥存储和计算开销.最后通过安全性分析和实验仿真证明:该方案达到选择明文安全并具有较高效率. 展开更多
关键词 广电网 属性基广播加密 权重属性 长度固定密文 计算开销小 存储开销小 选择明文安全
在线阅读 下载PDF
融合多粒度动态语义表征的文本分类模型 被引量:1
9
作者 张骏强 高尚兵 +1 位作者 苏睿 李文婷 《南京信息工程大学学报(自然科学版)》 CAS 北大核心 2023年第2期148-159,共12页
在对化工领域类文本进行分类任务时,由于文本的专业性以及复杂多样性,仅仅依靠现有的词向量表征方式,很难对其中的专业术语以及其他化工领域内相关字词的语义进行充分表征,从而导致分类任务的准确率不高.本文提出一种融合多粒度动态语... 在对化工领域类文本进行分类任务时,由于文本的专业性以及复杂多样性,仅仅依靠现有的词向量表征方式,很难对其中的专业术语以及其他化工领域内相关字词的语义进行充分表征,从而导致分类任务的准确率不高.本文提出一种融合多粒度动态语义表征的文本分类模型,首先在词嵌入层使用动态词向量表征语义信息并引入对抗扰动,使得词向量具有更好的表征能力,然后利用多头注意力机制进行词向量权重分配,获得带有关键语义信息的文本表示,最后使用提出的多尺度残差收缩深层金字塔形的卷积神经网络与混合注意力胶囊双向LSTM网络模型分别提取不同粒度的文本表示,融合后对得到的最终文本表示进行分类.实验结果表明,相比于现有模型,所提出的模型使用不同词向量表示时,在化工领域文本数据集上F1-Score最高可达84.62%,提升了0.38~5.58个百分点;在公开中文数据集THUCNews和谭松波酒店评论数据集ChnSentiCorp上进行模型泛化性能评估,模型也有较好表现. 展开更多
关键词 文本分类 对抗扰动 多粒度 多头注意力机制 深度残差收缩 预训练语言模型
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部