检索结果-维普期刊中文期刊服务平台

融合空间-时间双网络流和视觉注意的人体行为识别被引量：14: 1; 作者刘天亮谯庆伟 +2 位作者万俊伟戴修斌罗杰波《电子与信息学报》 EI CSCD 北大核心 2018年第10期2395-2401,共7页; 该文受人脑视觉感知机理启发,在深度学习框架下提出融合时空双网络流和视觉注意的行为识别方法。首先,采用由粗到细Lucas-Kanade估计法逐帧提取视频中人体运动的光流特征。然后,利用预训练模型微调的GoogLeNet神经网络分别逐层卷积并聚... 展开更多; 关键词人体行为识别光流双重时空网络流视觉注意力卷积神经网络长短时记忆神经网络; 在线阅读下载PDF 职称材料

一种由粗至精的RGB-D室内场景语义分割方法被引量：8: 2; 作者刘天亮冯希龙 +2 位作者顾雁秋戴修斌罗杰波《东南大学学报（自然科学版）》 EI CAS CSCD 北大核心 2016年第4期681-687,共7页; 为了标注室内场景中可见物体,提出一种基于RGB-D数据由粗至精的室内场景语义分割方法.首先,利用分层显著度导引的简单线性迭代聚类过分割和鲁棒多模态区域特征,构建面向语义类别的超像素区域池,基于随机决策森林分类器判决各个超像素区... 展开更多; 关键词 RGB-D室内场景语义分割 SLIC过分割稠密CRFs 递归式反馈; 在线阅读下载PDF 职称材料

多线索非参数化融合的单目视频深度估计被引量：2: 3; 作者刘天亮莫一鸣 +3 位作者徐高帮戴修斌朱秀昌罗杰波《东南大学学报（自然科学版）》 EI CAS CSCD 北大核心 2015年第5期834-839,共6页; 为解决二维视频的三维转化问题,提出了一种基于非参数化学习和多线索融合的单目视频深度图提取方法.首先,利用单目图像的区域边界轮廓和几何透视结构线索,基于前景背景融合来估计单目视频中各帧的深度图像;然后,利用视频帧间空时相关性... 展开更多; 关键词深度图非参数化融合多线索线性透视空时相关; 在线阅读下载PDF 职称材料

稀疏字典驱动高阶依赖的RGB-D室内场景语义分割被引量：1: 4; 作者刘天亮徐高帮 +2 位作者戴修斌曹旦旦罗杰波《南京邮电大学学报（自然科学版）》北大核心 2017年第5期13-18,共6页; 为利用高阶条件随机场有效标注室内场景,文中提出一种稀疏字典驱动高阶依赖的RGB-D颜色-深度图像语义分割法。首先,利用融合深度的多尺度组合成组的全局概率边缘超度量图分层法过分割彩色-深度图像。然后,提取场景中各个超像素区域的视... 展开更多; 关键词语义分割条件随机场模型稀疏字典学习结构化支持向量机; 在线阅读下载PDF 职称材料

融合信息化边界和多模态特征的室内空间布局估计: 5; 作者刘天亮陆泮宇 +2 位作者戴修斌刘峰罗杰波《南京信息工程大学学报（自然科学版）》 CAS 2019年第6期735-742,共8页; 为感知室内空间布局,提出一种基于信息化边界和多模态特征的场景布局估计方法.首先,采用VGG-16全卷积神经网络预测蕴含空间布局先验的信息化边界图.其次,采用Canny边缘检测和投票策略估计水平和竖直方向消失点,从消失点等角度间隔引出... 展开更多; 关键词空间布局卷积神经网络场景理解信息化边界; 在线阅读下载PDF 职称材料

题名融合空间-时间双网络流和视觉注意的人体行为识别被引量：14: 1; 作者刘天亮谯庆伟万俊伟戴修斌罗杰波; 机构南京邮电大学江苏省图像处理与图像通信重点实验室罗彻斯特大学计算机科学系; 出处《电子与信息学报》 EI CSCD 北大核心 2018年第10期2395-2401,共7页; 基金国家自然科学基金(61001152 31200747 +5 种基金 61071091 61071166 61172118) 江苏省自然科学基金(BK2012437) 国家留学基金~~; 文摘该文受人脑视觉感知机理启发,在深度学习框架下提出融合时空双网络流和视觉注意的行为识别方法。首先,采用由粗到细Lucas-Kanade估计法逐帧提取视频中人体运动的光流特征。然后,利用预训练模型微调的GoogLeNet神经网络分别逐层卷积并聚合给定时间窗口视频中外观图像和相应光流特征。接着,利用长短时记忆多层递归网络交叉感知即得含高层显著结构的时空流语义特征序列;解码时间窗口内互相依赖的隐状态;输出空间流视觉特征描述和视频窗口中每帧标签概率分布。其次,利用相对熵计算时间维每帧注意力置信度,并融合空间网络流感知序列标签概率分布。最后,利用softmax分类视频中行为类别。实验结果表明,与其他现有方法相比,该文行为识别方法在分类准确度上具有显著优势。; 关键词人体行为识别光流双重时空网络流视觉注意力卷积神经网络长短时记忆神经网络; Keywords Human action recognition Optical flow Spatio-temporal dual network flow Visual attention Convolution Neural Network （CNN） Long Short-Term Memory （LSTM）; 分类号 TP391.41 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名一种由粗至精的RGB-D室内场景语义分割方法被引量：8: 2; 作者刘天亮冯希龙顾雁秋戴修斌罗杰波; 机构南京邮电大学江苏省图像处理与图像通信重点实验室罗彻斯特大学计算机科学系; 出处《东南大学学报（自然科学版）》 EI CAS CSCD 北大核心 2016年第4期681-687,共7页; 基金国家自然科学基金资助项目(31200747 61001152 +8 种基金 61071091 61071166 61172118) BK2012437) NY214037) 国家留学基金资助项目教育部互联网应用创新开放平台示范基地(气象云平台及应用)资助项目(KJRP1407); 文摘为了标注室内场景中可见物体,提出一种基于RGB-D数据由粗至精的室内场景语义分割方法.首先,利用分层显著度导引的简单线性迭代聚类过分割和鲁棒多模态区域特征,构建面向语义类别的超像素区域池,基于随机决策森林分类器判决各个超像素区域的语义类别,实现粗粒度区域级语义标签推断.然后,为了改善粗粒度级的语义标签,利用几何深度导引和内部反馈机制改进像素级稠密全连接条件随机场模型,以求精细粒度像素级语义标注.最后,在粗、细粒度语义标注之间引入全局递归式反馈,渐进式迭代更新室内场景的语义类别标签.2个公开的RGBD室内场景数据集上的实验结果表明,与其他方法相比,所提出的语义分割方法无论在主观还是客观评估上,均具有较好的效果.; 关键词 RGB-D室内场景语义分割 SLIC过分割稠密CRFs 递归式反馈; Keywords RGB-D indoor scene semantic parsing simple linear iterative clustering（SLIC） segmentation dense conditional random fields（CRFs） recursive feedback; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名多线索非参数化融合的单目视频深度估计被引量：2: 3; 作者刘天亮莫一鸣徐高帮戴修斌朱秀昌罗杰波; 机构南京邮电大学江苏省图像处理与图像通信重点实验室罗彻斯特大学计算机科学系; 出处《东南大学学报（自然科学版）》 EI CAS CSCD 北大核心 2015年第5期834-839,共6页; 基金国家自然科学基金青年科学基金资助项目(61001152 31200747) +7 种基金 61071166 61172118) BK2012437) NY214037) 国家留学基金委资助项目; 文摘为解决二维视频的三维转化问题,提出了一种基于非参数化学习和多线索融合的单目视频深度图提取方法.首先,利用单目图像的区域边界轮廓和几何透视结构线索,基于前景背景融合来估计单目视频中各帧的深度图像;然后,利用视频帧间空时相关性,借助非参数学习实现单目视频深度估计;最后,利用全局背景深度分段约束和去抖动来增强深度视频序列.实验结果表明,与其他现有方法相比,该方法能得到更为准确的单目视频深度图序列,无论在主观质量还是均方根误差(RMS)和结构相似性度量(SSIM)上,均能取得较好的效果.; 关键词深度图非参数化融合多线索线性透视空时相关; Keywords depth map non-parametric fusion multiple cues linear perspective spatial-temporal correlation; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名稀疏字典驱动高阶依赖的RGB-D室内场景语义分割被引量：1: 4; 作者刘天亮徐高帮戴修斌曹旦旦罗杰波; 机构南京邮电大学江苏省图像处理与图像通信重点实验室罗彻斯特大学计算机科学系; 出处《南京邮电大学学报（自然科学版）》北大核心 2017年第5期13-18,共6页; 基金国家自然科学基金(61001152 31200747 +5 种基金 61071091 61071166 61172118) 江苏省自然科学基金(BK2012437) 国家留学基金南京邮电大学校级科研基金(NY214037)资助项目; 文摘为利用高阶条件随机场有效标注室内场景,文中提出一种稀疏字典驱动高阶依赖的RGB-D颜色-深度图像语义分割法。首先,利用融合深度的多尺度组合成组的全局概率边缘超度量图分层法过分割彩色-深度图像。然后,提取场景中各个超像素区域的视觉特征,构建超像素标签池并用于训练支持向量机分类器。接着,计算超像素一元势能和相邻超像素成对项势能;同时,以每一类超像素区域内关键点特征的稀疏编码子之和的直方图统计作为高阶势能。最后,利用融合自顶向下的判别性类别成本的条件随机场模型推理实现语义标注。实验表明,与其他方法相比,该方法能得到视觉表现力更强、准确率更高的语义标签图。; 关键词语义分割条件随机场模型稀疏字典学习结构化支持向量机; Keywords semantic segmentation conditional random field models sparse dictionary learning structural support vector machine; 分类号 TN919.81 [电子电信—通信与信息系统] TP391.41 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名融合信息化边界和多模态特征的室内空间布局估计: 5; 作者刘天亮陆泮宇戴修斌刘峰罗杰波; 机构南京邮电大学江苏省图像处理与图像通信重点实验室罗彻斯特大学计算机科学系; 出处《南京信息工程大学学报（自然科学版）》 CAS 2019年第6期735-742,共8页; 基金国家自然科学基金(61001152,31200747,61071091,61071166,61172118) 江苏省自然科学基金(BK2012437) +1 种基金国家留学基金(201208320219); 文摘为感知室内空间布局,提出一种基于信息化边界和多模态特征的场景布局估计方法.首先,采用VGG-16全卷积神经网络预测蕴含空间布局先验的信息化边界图.其次,采用Canny边缘检测和投票策略估计水平和竖直方向消失点,从消失点等角度间隔引出射线细采样信息化边界能量高的区域.接着,采用VGG空间多尺度卷积神经网络估计几何深度和法向特征.然后,积分几何求和候选布局多边形中多模特征描述一元共生,候选布局的表面法向平滑和位置关系确定二元标记约束.最后,采用结构化支持向量机学习模型,最大布局候选得分以推理布局.实验结果表明,与经典方法相比,本估计方法可以有效改善布局的完整度.; 关键词空间布局卷积神经网络场景理解信息化边界; Keywords spatial layout convolutional neural network scene understanding informative edge; 分类号 TP391.41 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	融合空间-时间双网络流和视觉注意的人体行为识别	刘天亮谯庆伟万俊伟戴修斌罗杰波	《电子与信息学报》 EI CSCD 北大核心	2018	14	在线阅读下载PDF 职称材料
2	一种由粗至精的RGB-D室内场景语义分割方法	刘天亮冯希龙顾雁秋戴修斌罗杰波	《东南大学学报（自然科学版）》 EI CAS CSCD 北大核心	2016	8	在线阅读下载PDF 职称材料
3	多线索非参数化融合的单目视频深度估计	刘天亮莫一鸣徐高帮戴修斌朱秀昌罗杰波	《东南大学学报（自然科学版）》 EI CAS CSCD 北大核心	2015	2	在线阅读下载PDF 职称材料
4	稀疏字典驱动高阶依赖的RGB-D室内场景语义分割	刘天亮徐高帮戴修斌曹旦旦罗杰波	《南京邮电大学学报（自然科学版）》北大核心	2017	1	在线阅读下载PDF 职称材料
5	融合信息化边界和多模态特征的室内空间布局估计	刘天亮陆泮宇戴修斌刘峰罗杰波	《南京信息工程大学学报（自然科学版）》 CAS	2019	0	在线阅读下载PDF 职称材料