期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
融合空间-时间双网络流和视觉注意的人体行为识别 被引量:14
1
作者 刘天亮 谯庆伟 +2 位作者 万俊伟 戴修斌 罗杰波 《电子与信息学报》 EI CSCD 北大核心 2018年第10期2395-2401,共7页
该文受人脑视觉感知机理启发,在深度学习框架下提出融合时空双网络流和视觉注意的行为识别方法。首先,采用由粗到细Lucas-Kanade估计法逐帧提取视频中人体运动的光流特征。然后,利用预训练模型微调的GoogLeNet神经网络分别逐层卷积并聚... 该文受人脑视觉感知机理启发,在深度学习框架下提出融合时空双网络流和视觉注意的行为识别方法。首先,采用由粗到细Lucas-Kanade估计法逐帧提取视频中人体运动的光流特征。然后,利用预训练模型微调的GoogLeNet神经网络分别逐层卷积并聚合给定时间窗口视频中外观图像和相应光流特征。接着,利用长短时记忆多层递归网络交叉感知即得含高层显著结构的时空流语义特征序列;解码时间窗口内互相依赖的隐状态;输出空间流视觉特征描述和视频窗口中每帧标签概率分布。其次,利用相对熵计算时间维每帧注意力置信度,并融合空间网络流感知序列标签概率分布。最后,利用softmax分类视频中行为类别。实验结果表明,与其他现有方法相比,该文行为识别方法在分类准确度上具有显著优势。 展开更多
关键词 人体行为识别 光流 双重时空网络流 视觉注意力 卷积神经网络 长短时记忆神经网络
在线阅读 下载PDF
一种由粗至精的RGB-D室内场景语义分割方法 被引量:8
2
作者 刘天亮 冯希龙 +2 位作者 顾雁秋 戴修斌 罗杰波 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2016年第4期681-687,共7页
为了标注室内场景中可见物体,提出一种基于RGB-D数据由粗至精的室内场景语义分割方法.首先,利用分层显著度导引的简单线性迭代聚类过分割和鲁棒多模态区域特征,构建面向语义类别的超像素区域池,基于随机决策森林分类器判决各个超像素区... 为了标注室内场景中可见物体,提出一种基于RGB-D数据由粗至精的室内场景语义分割方法.首先,利用分层显著度导引的简单线性迭代聚类过分割和鲁棒多模态区域特征,构建面向语义类别的超像素区域池,基于随机决策森林分类器判决各个超像素区域的语义类别,实现粗粒度区域级语义标签推断.然后,为了改善粗粒度级的语义标签,利用几何深度导引和内部反馈机制改进像素级稠密全连接条件随机场模型,以求精细粒度像素级语义标注.最后,在粗、细粒度语义标注之间引入全局递归式反馈,渐进式迭代更新室内场景的语义类别标签.2个公开的RGBD室内场景数据集上的实验结果表明,与其他方法相比,所提出的语义分割方法无论在主观还是客观评估上,均具有较好的效果. 展开更多
关键词 RGB-D室内场景 语义分割 SLIC过分割 稠密CRFs 递归式反馈
在线阅读 下载PDF
多线索非参数化融合的单目视频深度估计 被引量:1
3
作者 刘天亮 莫一鸣 +3 位作者 徐高帮 戴修斌 朱秀昌 罗杰波 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2015年第5期834-839,共6页
为解决二维视频的三维转化问题,提出了一种基于非参数化学习和多线索融合的单目视频深度图提取方法.首先,利用单目图像的区域边界轮廓和几何透视结构线索,基于前景背景融合来估计单目视频中各帧的深度图像;然后,利用视频帧间空时相关性... 为解决二维视频的三维转化问题,提出了一种基于非参数化学习和多线索融合的单目视频深度图提取方法.首先,利用单目图像的区域边界轮廓和几何透视结构线索,基于前景背景融合来估计单目视频中各帧的深度图像;然后,利用视频帧间空时相关性,借助非参数学习实现单目视频深度估计;最后,利用全局背景深度分段约束和去抖动来增强深度视频序列.实验结果表明,与其他现有方法相比,该方法能得到更为准确的单目视频深度图序列,无论在主观质量还是均方根误差(RMS)和结构相似性度量(SSIM)上,均能取得较好的效果. 展开更多
关键词 深度图 非参数化融合 多线索 线性透视 空时相关
在线阅读 下载PDF
稀疏字典驱动高阶依赖的RGB-D室内场景语义分割 被引量:1
4
作者 刘天亮 徐高帮 +2 位作者 戴修斌 曹旦旦 罗杰波 《南京邮电大学学报(自然科学版)》 北大核心 2017年第5期13-18,共6页
为利用高阶条件随机场有效标注室内场景,文中提出一种稀疏字典驱动高阶依赖的RGB-D颜色-深度图像语义分割法。首先,利用融合深度的多尺度组合成组的全局概率边缘超度量图分层法过分割彩色-深度图像。然后,提取场景中各个超像素区域的视... 为利用高阶条件随机场有效标注室内场景,文中提出一种稀疏字典驱动高阶依赖的RGB-D颜色-深度图像语义分割法。首先,利用融合深度的多尺度组合成组的全局概率边缘超度量图分层法过分割彩色-深度图像。然后,提取场景中各个超像素区域的视觉特征,构建超像素标签池并用于训练支持向量机分类器。接着,计算超像素一元势能和相邻超像素成对项势能;同时,以每一类超像素区域内关键点特征的稀疏编码子之和的直方图统计作为高阶势能。最后,利用融合自顶向下的判别性类别成本的条件随机场模型推理实现语义标注。实验表明,与其他方法相比,该方法能得到视觉表现力更强、准确率更高的语义标签图。 展开更多
关键词 语义分割 条件随机场模型 稀疏字典学习 结构化支持向量机
在线阅读 下载PDF
融合信息化边界和多模态特征的室内空间布局估计
5
作者 刘天亮 陆泮宇 +2 位作者 戴修斌 刘峰 罗杰波 《南京信息工程大学学报(自然科学版)》 CAS 2019年第6期735-742,共8页
为感知室内空间布局,提出一种基于信息化边界和多模态特征的场景布局估计方法.首先,采用VGG-16全卷积神经网络预测蕴含空间布局先验的信息化边界图.其次,采用Canny边缘检测和投票策略估计水平和竖直方向消失点,从消失点等角度间隔引出... 为感知室内空间布局,提出一种基于信息化边界和多模态特征的场景布局估计方法.首先,采用VGG-16全卷积神经网络预测蕴含空间布局先验的信息化边界图.其次,采用Canny边缘检测和投票策略估计水平和竖直方向消失点,从消失点等角度间隔引出射线细采样信息化边界能量高的区域.接着,采用VGG空间多尺度卷积神经网络估计几何深度和法向特征.然后,积分几何求和候选布局多边形中多模特征描述一元共生,候选布局的表面法向平滑和位置关系确定二元标记约束.最后,采用结构化支持向量机学习模型,最大布局候选得分以推理布局.实验结果表明,与经典方法相比,本估计方法可以有效改善布局的完整度. 展开更多
关键词 空间布局 卷积神经网络 场景理解 信息化边界
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部