期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
5
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
融合空间-时间双网络流和视觉注意的人体行为识别
被引量:
14
1
作者
刘天亮
谯庆伟
+2 位作者
万俊伟
戴修斌
罗杰波
《电子与信息学报》
EI
CSCD
北大核心
2018年第10期2395-2401,共7页
该文受人脑视觉感知机理启发,在深度学习框架下提出融合时空双网络流和视觉注意的行为识别方法。首先,采用由粗到细Lucas-Kanade估计法逐帧提取视频中人体运动的光流特征。然后,利用预训练模型微调的GoogLeNet神经网络分别逐层卷积并聚...
该文受人脑视觉感知机理启发,在深度学习框架下提出融合时空双网络流和视觉注意的行为识别方法。首先,采用由粗到细Lucas-Kanade估计法逐帧提取视频中人体运动的光流特征。然后,利用预训练模型微调的GoogLeNet神经网络分别逐层卷积并聚合给定时间窗口视频中外观图像和相应光流特征。接着,利用长短时记忆多层递归网络交叉感知即得含高层显著结构的时空流语义特征序列;解码时间窗口内互相依赖的隐状态;输出空间流视觉特征描述和视频窗口中每帧标签概率分布。其次,利用相对熵计算时间维每帧注意力置信度,并融合空间网络流感知序列标签概率分布。最后,利用softmax分类视频中行为类别。实验结果表明,与其他现有方法相比,该文行为识别方法在分类准确度上具有显著优势。
展开更多
关键词
人体行为识别
光流
双重时空网络流
视觉注意力
卷积神经网络
长短时记忆神经网络
在线阅读
下载PDF
职称材料
一种由粗至精的RGB-D室内场景语义分割方法
被引量:
8
2
作者
刘天亮
冯希龙
+2 位作者
顾雁秋
戴修斌
罗杰波
《东南大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2016年第4期681-687,共7页
为了标注室内场景中可见物体,提出一种基于RGB-D数据由粗至精的室内场景语义分割方法.首先,利用分层显著度导引的简单线性迭代聚类过分割和鲁棒多模态区域特征,构建面向语义类别的超像素区域池,基于随机决策森林分类器判决各个超像素区...
为了标注室内场景中可见物体,提出一种基于RGB-D数据由粗至精的室内场景语义分割方法.首先,利用分层显著度导引的简单线性迭代聚类过分割和鲁棒多模态区域特征,构建面向语义类别的超像素区域池,基于随机决策森林分类器判决各个超像素区域的语义类别,实现粗粒度区域级语义标签推断.然后,为了改善粗粒度级的语义标签,利用几何深度导引和内部反馈机制改进像素级稠密全连接条件随机场模型,以求精细粒度像素级语义标注.最后,在粗、细粒度语义标注之间引入全局递归式反馈,渐进式迭代更新室内场景的语义类别标签.2个公开的RGBD室内场景数据集上的实验结果表明,与其他方法相比,所提出的语义分割方法无论在主观还是客观评估上,均具有较好的效果.
展开更多
关键词
RGB-D室内场景
语义分割
SLIC过分割
稠密CRFs
递归式反馈
在线阅读
下载PDF
职称材料
多线索非参数化融合的单目视频深度估计
被引量:
1
3
作者
刘天亮
莫一鸣
+3 位作者
徐高帮
戴修斌
朱秀昌
罗杰波
《东南大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2015年第5期834-839,共6页
为解决二维视频的三维转化问题,提出了一种基于非参数化学习和多线索融合的单目视频深度图提取方法.首先,利用单目图像的区域边界轮廓和几何透视结构线索,基于前景背景融合来估计单目视频中各帧的深度图像;然后,利用视频帧间空时相关性...
为解决二维视频的三维转化问题,提出了一种基于非参数化学习和多线索融合的单目视频深度图提取方法.首先,利用单目图像的区域边界轮廓和几何透视结构线索,基于前景背景融合来估计单目视频中各帧的深度图像;然后,利用视频帧间空时相关性,借助非参数学习实现单目视频深度估计;最后,利用全局背景深度分段约束和去抖动来增强深度视频序列.实验结果表明,与其他现有方法相比,该方法能得到更为准确的单目视频深度图序列,无论在主观质量还是均方根误差(RMS)和结构相似性度量(SSIM)上,均能取得较好的效果.
展开更多
关键词
深度图
非参数化融合
多线索
线性透视
空时相关
在线阅读
下载PDF
职称材料
稀疏字典驱动高阶依赖的RGB-D室内场景语义分割
被引量:
1
4
作者
刘天亮
徐高帮
+2 位作者
戴修斌
曹旦旦
罗杰波
《南京邮电大学学报(自然科学版)》
北大核心
2017年第5期13-18,共6页
为利用高阶条件随机场有效标注室内场景,文中提出一种稀疏字典驱动高阶依赖的RGB-D颜色-深度图像语义分割法。首先,利用融合深度的多尺度组合成组的全局概率边缘超度量图分层法过分割彩色-深度图像。然后,提取场景中各个超像素区域的视...
为利用高阶条件随机场有效标注室内场景,文中提出一种稀疏字典驱动高阶依赖的RGB-D颜色-深度图像语义分割法。首先,利用融合深度的多尺度组合成组的全局概率边缘超度量图分层法过分割彩色-深度图像。然后,提取场景中各个超像素区域的视觉特征,构建超像素标签池并用于训练支持向量机分类器。接着,计算超像素一元势能和相邻超像素成对项势能;同时,以每一类超像素区域内关键点特征的稀疏编码子之和的直方图统计作为高阶势能。最后,利用融合自顶向下的判别性类别成本的条件随机场模型推理实现语义标注。实验表明,与其他方法相比,该方法能得到视觉表现力更强、准确率更高的语义标签图。
展开更多
关键词
语义分割
条件随机场模型
稀疏字典学习
结构化支持向量机
在线阅读
下载PDF
职称材料
融合信息化边界和多模态特征的室内空间布局估计
5
作者
刘天亮
陆泮宇
+2 位作者
戴修斌
刘峰
罗杰波
《南京信息工程大学学报(自然科学版)》
CAS
2019年第6期735-742,共8页
为感知室内空间布局,提出一种基于信息化边界和多模态特征的场景布局估计方法.首先,采用VGG-16全卷积神经网络预测蕴含空间布局先验的信息化边界图.其次,采用Canny边缘检测和投票策略估计水平和竖直方向消失点,从消失点等角度间隔引出...
为感知室内空间布局,提出一种基于信息化边界和多模态特征的场景布局估计方法.首先,采用VGG-16全卷积神经网络预测蕴含空间布局先验的信息化边界图.其次,采用Canny边缘检测和投票策略估计水平和竖直方向消失点,从消失点等角度间隔引出射线细采样信息化边界能量高的区域.接着,采用VGG空间多尺度卷积神经网络估计几何深度和法向特征.然后,积分几何求和候选布局多边形中多模特征描述一元共生,候选布局的表面法向平滑和位置关系确定二元标记约束.最后,采用结构化支持向量机学习模型,最大布局候选得分以推理布局.实验结果表明,与经典方法相比,本估计方法可以有效改善布局的完整度.
展开更多
关键词
空间布局
卷积神经网络
场景理解
信息化边界
在线阅读
下载PDF
职称材料
题名
融合空间-时间双网络流和视觉注意的人体行为识别
被引量:
14
1
作者
刘天亮
谯庆伟
万俊伟
戴修斌
罗杰波
机构
南京邮电
大学
江苏省图像处理与图像通信重点实验室
罗彻斯特大学计算机科学系
出处
《电子与信息学报》
EI
CSCD
北大核心
2018年第10期2395-2401,共7页
基金
国家自然科学基金(61001152
31200747
+5 种基金
61071091
61071166
61172118)
江苏省自然科学基金(BK2012437)
南京邮电大学校级科研基金(NY214037)
国家留学基金~~
文摘
该文受人脑视觉感知机理启发,在深度学习框架下提出融合时空双网络流和视觉注意的行为识别方法。首先,采用由粗到细Lucas-Kanade估计法逐帧提取视频中人体运动的光流特征。然后,利用预训练模型微调的GoogLeNet神经网络分别逐层卷积并聚合给定时间窗口视频中外观图像和相应光流特征。接着,利用长短时记忆多层递归网络交叉感知即得含高层显著结构的时空流语义特征序列;解码时间窗口内互相依赖的隐状态;输出空间流视觉特征描述和视频窗口中每帧标签概率分布。其次,利用相对熵计算时间维每帧注意力置信度,并融合空间网络流感知序列标签概率分布。最后,利用softmax分类视频中行为类别。实验结果表明,与其他现有方法相比,该文行为识别方法在分类准确度上具有显著优势。
关键词
人体行为识别
光流
双重时空网络流
视觉注意力
卷积神经网络
长短时记忆神经网络
Keywords
Human action recognition
Optical flow
Spatio-temporal dual network flow
Visual attention
Convolution Neural Network (CNN)
Long Short-Term Memory (LSTM)
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
一种由粗至精的RGB-D室内场景语义分割方法
被引量:
8
2
作者
刘天亮
冯希龙
顾雁秋
戴修斌
罗杰波
机构
南京邮电
大学
江苏省图像处理与图像通信重点实验室
罗彻斯特大学计算机科学系
出处
《东南大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2016年第4期681-687,共7页
基金
国家自然科学基金资助项目(31200747
61001152
+8 种基金
61071091
61071166
61172118)
江苏省自然科学基金资助项目(BK2010523
BK2012437)
南京邮电大学校级科研基金资助项目(NY210069
NY214037)
国家留学基金资助项目
教育部互联网应用创新开放平台示范基地(气象云平台及应用)资助项目(KJRP1407)
文摘
为了标注室内场景中可见物体,提出一种基于RGB-D数据由粗至精的室内场景语义分割方法.首先,利用分层显著度导引的简单线性迭代聚类过分割和鲁棒多模态区域特征,构建面向语义类别的超像素区域池,基于随机决策森林分类器判决各个超像素区域的语义类别,实现粗粒度区域级语义标签推断.然后,为了改善粗粒度级的语义标签,利用几何深度导引和内部反馈机制改进像素级稠密全连接条件随机场模型,以求精细粒度像素级语义标注.最后,在粗、细粒度语义标注之间引入全局递归式反馈,渐进式迭代更新室内场景的语义类别标签.2个公开的RGBD室内场景数据集上的实验结果表明,与其他方法相比,所提出的语义分割方法无论在主观还是客观评估上,均具有较好的效果.
关键词
RGB-D室内场景
语义分割
SLIC过分割
稠密CRFs
递归式反馈
Keywords
RGB-D indoor scene
semantic parsing
simple linear iterative clustering(SLIC) segmentation
dense conditional random fields(CRFs)
recursive feedback
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
多线索非参数化融合的单目视频深度估计
被引量:
1
3
作者
刘天亮
莫一鸣
徐高帮
戴修斌
朱秀昌
罗杰波
机构
南京邮电
大学
江苏省图像处理与图像通信重点实验室
罗彻斯特大学计算机科学系
出处
《东南大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2015年第5期834-839,共6页
基金
国家自然科学基金青年科学基金资助项目(61001152
31200747)
+7 种基金
国家自然科学基金资助项目(61071091
61071166
61172118)
江苏省自然科学基金资助项目(BK2010523
BK2012437)
南京邮电大学校级科研基金资助项目(NY210069
NY214037)
国家留学基金委资助项目
文摘
为解决二维视频的三维转化问题,提出了一种基于非参数化学习和多线索融合的单目视频深度图提取方法.首先,利用单目图像的区域边界轮廓和几何透视结构线索,基于前景背景融合来估计单目视频中各帧的深度图像;然后,利用视频帧间空时相关性,借助非参数学习实现单目视频深度估计;最后,利用全局背景深度分段约束和去抖动来增强深度视频序列.实验结果表明,与其他现有方法相比,该方法能得到更为准确的单目视频深度图序列,无论在主观质量还是均方根误差(RMS)和结构相似性度量(SSIM)上,均能取得较好的效果.
关键词
深度图
非参数化融合
多线索
线性透视
空时相关
Keywords
depth map
non-parametric fusion
multiple cues
linear perspective
spatial-temporal correlation
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
稀疏字典驱动高阶依赖的RGB-D室内场景语义分割
被引量:
1
4
作者
刘天亮
徐高帮
戴修斌
曹旦旦
罗杰波
机构
南京邮电
大学
江苏省图像处理与图像通信重点实验室
罗彻斯特大学计算机科学系
出处
《南京邮电大学学报(自然科学版)》
北大核心
2017年第5期13-18,共6页
基金
国家自然科学基金(61001152
31200747
+5 种基金
61071091
61071166
61172118)
江苏省自然科学基金(BK2012437)
国家留学基金
南京邮电大学校级科研基金(NY214037)资助项目
文摘
为利用高阶条件随机场有效标注室内场景,文中提出一种稀疏字典驱动高阶依赖的RGB-D颜色-深度图像语义分割法。首先,利用融合深度的多尺度组合成组的全局概率边缘超度量图分层法过分割彩色-深度图像。然后,提取场景中各个超像素区域的视觉特征,构建超像素标签池并用于训练支持向量机分类器。接着,计算超像素一元势能和相邻超像素成对项势能;同时,以每一类超像素区域内关键点特征的稀疏编码子之和的直方图统计作为高阶势能。最后,利用融合自顶向下的判别性类别成本的条件随机场模型推理实现语义标注。实验表明,与其他方法相比,该方法能得到视觉表现力更强、准确率更高的语义标签图。
关键词
语义分割
条件随机场模型
稀疏字典学习
结构化支持向量机
Keywords
semantic segmentation
conditional random field models
sparse dictionary learning
structural support vector machine
分类号
TN919.81 [电子电信—通信与信息系统]
TP391.41 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
融合信息化边界和多模态特征的室内空间布局估计
5
作者
刘天亮
陆泮宇
戴修斌
刘峰
罗杰波
机构
南京邮电
大学
江苏省图像处理与图像通信重点实验室
罗彻斯特大学计算机科学系
出处
《南京信息工程大学学报(自然科学版)》
CAS
2019年第6期735-742,共8页
基金
国家自然科学基金(61001152,31200747,61071091,61071166,61172118)
江苏省自然科学基金(BK2012437)
+1 种基金
南京邮电大学校级科研基金(NY214037)
国家留学基金(201208320219)
文摘
为感知室内空间布局,提出一种基于信息化边界和多模态特征的场景布局估计方法.首先,采用VGG-16全卷积神经网络预测蕴含空间布局先验的信息化边界图.其次,采用Canny边缘检测和投票策略估计水平和竖直方向消失点,从消失点等角度间隔引出射线细采样信息化边界能量高的区域.接着,采用VGG空间多尺度卷积神经网络估计几何深度和法向特征.然后,积分几何求和候选布局多边形中多模特征描述一元共生,候选布局的表面法向平滑和位置关系确定二元标记约束.最后,采用结构化支持向量机学习模型,最大布局候选得分以推理布局.实验结果表明,与经典方法相比,本估计方法可以有效改善布局的完整度.
关键词
空间布局
卷积神经网络
场景理解
信息化边界
Keywords
spatial layout
convolutional neural network
scene understanding
informative edge
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
融合空间-时间双网络流和视觉注意的人体行为识别
刘天亮
谯庆伟
万俊伟
戴修斌
罗杰波
《电子与信息学报》
EI
CSCD
北大核心
2018
14
在线阅读
下载PDF
职称材料
2
一种由粗至精的RGB-D室内场景语义分割方法
刘天亮
冯希龙
顾雁秋
戴修斌
罗杰波
《东南大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2016
8
在线阅读
下载PDF
职称材料
3
多线索非参数化融合的单目视频深度估计
刘天亮
莫一鸣
徐高帮
戴修斌
朱秀昌
罗杰波
《东南大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2015
1
在线阅读
下载PDF
职称材料
4
稀疏字典驱动高阶依赖的RGB-D室内场景语义分割
刘天亮
徐高帮
戴修斌
曹旦旦
罗杰波
《南京邮电大学学报(自然科学版)》
北大核心
2017
1
在线阅读
下载PDF
职称材料
5
融合信息化边界和多模态特征的室内空间布局估计
刘天亮
陆泮宇
戴修斌
刘峰
罗杰波
《南京信息工程大学学报(自然科学版)》
CAS
2019
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部