-
题名多媒体数据的知识关联与理解专题前言
- 1
-
-
作者
蒋树强
刘青山
孙立峰
李波
-
机构
中国科学院计算技术研究所智能信息处理重点实验室
江苏省大数据分析技术重点实验室(南京信息工程大学自动化学院)
清华大学计算机科学与技术系
北京航空航天大学计算机学院
-
出处
《软件学报》
EI
CSCD
北大核心
2019年第4期865-866,共2页
-
文摘
近年来,不同来源的多媒体数据产生量剧增,成为用户信息获取、信息交换与信息消费的主要对象,多媒体数据具有广泛的应用需求和重大的应用价值.相对于其他数据类型,图像、视频等多媒体数据具有关系繁杂、冗余性强、信息隐藏深、全面理解困难等特点,因此,全面和准确地分析和理解多媒体内容是一个非常重要和具有挑战性的问题.最近,基于知识关联与理解的多媒体计算正逐渐得到研究者的关注,呈现出新的发展动态,这项研究可以使得多媒体内容的分析与理解更加深入,建立从多媒体内容感知到全面认知理解的桥梁.
-
关键词
多媒体数据
知识
多媒体内容
多媒体计算
信息获取
信息消费
信息交换
数据类型
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名多媒体内容的多维度相似性计算与搜索专题前言
被引量:1
- 2
-
-
作者
蒋树强
刘青山
孙立峰
李波
-
机构
中国科学院计算技术研究所智能信息处理重点实验室
江苏省大数据分析技术重点实验室(南京信息工程大学自动化学院)
清华大学计算机科学与技术系
北京航空航天大学计算机学院
-
出处
《软件学报》
EI
CSCD
北大核心
2020年第7期1931-1932,共2页
-
文摘
图像、视音频等多媒体数据包含的信息量非常丰富.近年来,随着研究的不断深入,根据不同应用需求,多媒体搜索可以从不同维度展开,包括从底层特征到高层语义的表示维度、从实例到类别的物体维度、从单个概念到多个概念直至语言的描述维度、从全局内容到局部区域的尺度维度等,并且这些维度之间也相互关联与交叉.多维度的多媒体相似性计算与搜索研究可以深入挖掘多媒体内容的相似性,建立更加全面的多媒体内容搜索方案.
-
关键词
相似性计算
多媒体内容
底层特征
多维度
搜索方案
视音频
不同维度
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名联合姿态先验的人体精确解析双分支网络模型
被引量:2
- 3
-
-
作者
高明达
孙玉宝
刘青山
邵晓雯
-
机构
江苏省大数据分析技术重点实验室(南京信息工程大学自动化学院)
江苏省大气环境与装备技术协同创新中心(南京信息工程大学自动化学院)
-
出处
《软件学报》
EI
CSCD
北大核心
2020年第7期1959-1968,共10页
-
基金
国家自然科学基金(61825601,61532009,61672292)
江苏省级项目(BRA2019077,DZXX-037)。
-
文摘
人体解析旨在将人体图像分割成多个具有细粒度语义的部件区域,进行形成对人体图像的语义理解.然而,由于人体姿态的复杂性,现有的人体解析算法容易对人体四肢部件形成误判,且对于小目标区域的分割不够精确.针对上述问题,联合人体姿态估计信息,提出了一种人体精确解析的双分支网络模型.该模型首先使用基干网络表征人体图像,将人体姿态估计模型预测到的姿态先验作为基干网络的注意力信息,进而形成人体结构先验驱动的多尺度特征表达,并将提取的特征分别输入至全卷积网络解析分支与检测解析分支.全卷积网络解析分支获得全局分割结果,检测解析分支更关注小尺度目标的检测与分割,融合两个分支的预测信息可以获得更为精确的分割结果.实验结果验证了该算法的有效性,在当前主流的人体解析数据集LIP和ATR上,所提方法的m Io U评测指标分别为52.19%和68.29%,有效提升了解析精度,在人体四肢部件以及小目标部件区域获得了更为准确的分割结果.
-
关键词
人体解析
语义分割
人体姿态估计
部件检测
卷积神经网络
-
Keywords
human parsing
semantic segmentation
human pose estimation
object detection
convolution neural network
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-