期刊文献+

基于卷积神经网络的立体图像舒适度客观评价 被引量:5

Objective Assessment of Stereoscopic Image Comfort Based on Convolutional Neural Network
原文传递
导出
摘要 基于卷积神经网络模型,提出一种立体图像舒适度评价方法。该方法无须提前根据特定的任务从图像中人工提取具体的特征,而是模拟人脑处理机制对图像进行层次化的抽象处理,自主提取特征。该方法采用三通道卷积神经网络结构,分别对原始图像进行主成分分析,以及32×32、256×256两种尺度的分块处理得到三条通道的输入数据集,根据输入数据设计每条通道的网络结构。采用两种尺寸分块处理得到不同尺寸的图像块特征信息,采用主成分分析降维处理得到原始图像的整体信息。此外,通过随机丢弃、局部响应归一化等方法提升算法的评价性能。实验结果表明,以修正线性单元为激活函数、输出层用Softmax分类器,对天津大学TJU立体图像数据库中400幅不同舒适度等级的立体图像样本进行测试,等级分类率正确达94.52%,优于极限学习机、支持向量机算法。 We propose a new method for stereoscopic image comfort assessment based on convolutional neural network,which does not need to extract specific manual features from images in advance according to specific tasks,but simulates hierarchical abstract processing mechanism of human brain to extract image features autonomously.This method adopts three channel convolutional neural network structure,and the input data sets of the three channel are obtained by reducing the dimension of the original data samples through principal component analysis,and chopping the original data samples into two size image patches(32×32,256×256),respectively.The network structure of each channel is designed according to the input data sets.In addition,the classification accuracy of this method is improved by introducing dropout and local response normalization,etc.With rectified linear unit as the activation function and Softmax as the classifier in the output layer,experiment results on 400 stereo image samples in TJU database with different comfortable levels show that,the correct classification rate of this method is94.52%,which is higher than that of the extreme learning machine and support vector machine.
作者 李素梅 常永莉 段志成 Li Sumei;Chang Yongli;Duan Zhicheng(School of Electrical and Information Engineering, Tianjin University, Tianjin 300072, Chin)
出处 《光学学报》 EI CAS CSCD 北大核心 2018年第6期130-136,共7页 Acta Optica Sinica
基金 国家自然科学基金(61520106002 161471262)
关键词 图像处理 立体图像舒适度 客观评价 卷积神经网络 主成分分析 多尺度分块 image processing stereoscopic image comfort objective assessment convolutional neural network principal component analysis multi-scale blocking
作者简介 李素梅(1975-),女,博士后,副教授,硕士生导师,主要从事立体信息处理和计算机视觉方面的研究。E—mail:tjnklsm@163.com;通信联系人。E-mail:cyl92061l@163.com
  • 相关文献

参考文献7

二级参考文献73

  • 1赵树森,陈思嘉,沈京玲.用支持向量机识别毒品的太赫兹吸收光谱[J].中国激光,2009,36(3):752-757. 被引量:19
  • 2侯春萍,阿陆南,俞斯乐.立体成像系统数学模型和视差控制方法[J].天津大学学报(自然科学与工程技术版),2005,38(5):455-460. 被引量:10
  • 3李畅.体视图像生成算法的研究及应用[J].计算机工程,2005,31(22):197-198. 被引量:1
  • 4周印,谢叻.虚拟现实场景中立体视差生成算法的研究[J].计算机仿真,2005,22(12):185-190. 被引量:7
  • 5吴乐南.数据压缩的原理与应用[M].北京:电子工业出版社,1994..
  • 6Morvan Y,Farin D, Dewith P. System architecture for free-viewpoint video and 3D-TV[J].Digital Object Identifier, 2008,54 ( 2 ) : 925-932.
  • 7Seuntiens P J H. Visual Experience of 3D TV[M].Eindhoven. Eindhoven University Press Facilities, 2006.
  • 8Ijsselsteijn W, Seuntiens in human factors and P,Meesters L. State-of-the-art quality issues of stereoscopic broadcast television EB/OL ]. http: //www.extra. research.philips.com/euproj ects/attest/deliverables/Attest-D01.pdf. 2002.
  • 9Winkler S. Digital Video Quality Vision Models and Metrics [ M ] . Switzerland:John Wiley & Sons Ltd, 2005.
  • 10Julesz B. Binocular depth perception of computergenerated patterns [J].Bell System Technical Journal, 1960,39 (2):1125-1162.

共引文献104

同被引文献27

引证文献5

二级引证文献24

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部