-
题名单幅图像超分辨重建的深度学习方法综述
被引量:10
- 1
-
-
作者
张德
林青宇
郭茂祖
-
机构
北京建筑大学电气与信息工程学院&建筑大数据智能处理方法研究北京市重点实验室
-
出处
《计算机工程与应用》
CSCD
北大核心
2021年第22期28-41,共14页
-
基金
国家自然科学基金(61871020)
北京市教育委员会科技计划重点项目(KZ201810016019)。
-
文摘
图像超分辨重建(Super-Resolution,SR)是指利用信号处理和机器学习等方法,从单幅或者多幅低分辨率图像(LowResolution,LR)中重建对应的高分辨率图像(HighResolution,HR)的技术。由于多幅LR图像之间亚像素位移的不可预知性,单幅图像超分辨重建(SingleImageSuper-Resolution,SISR)逐渐成为超分辨研究的主要方向。近年来,深度学习方法得到迅速发展,并广泛应用到图像处理领域。因此,针对单幅图像超分辨重建所使用的深度学习相关算法和网络模型进行系统的总结。介绍图像超分辨问题的设置和评价指标;讨论和比较单幅图像超分辨重建的深度学习算法,主要从网络结构设计、损失函数和上采样方式三方面进行论述;介绍常用的标准数据集,并选用基于不同网络模型的几种典型算法进行实验对比分析;展望图像超分辨技术未来的研究趋势和发展方向。
-
关键词
图像超分辨
深度学习
卷积神经网络(CNN)
图像处理
-
Keywords
image super-resolution
deep learning
Convolutional Neural Network(CNN)
image processing
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于组合-卷积神经网络的中文新闻文本分类
被引量:24
- 2
-
-
作者
张昱
刘开峰
张全新
王艳歌
高凯龙
-
机构
北京建筑大学电气与信息工程学院&建筑大数据智能处理方法研究北京市重点实验室
中国矿业大学深部岩土力学与地下工程国家重点实验室
北京理工大学计算机科学与技术学院
-
出处
《电子学报》
EI
CAS
CSCD
北大核心
2021年第6期1059-1067,共9页
-
基金
北京建筑大学优秀主讲教师培育计划(No.21082718041)
国家重点研发计划(No.2016YFC0600901)
+2 种基金
教育部2018产学合作协同育人项目(No.201801113001)
市属高校基本科研业务费(No.30850919027)
北京建筑大学研究生创新项目(No.PG2020051)。
-
文摘
目前的新闻分类研究以英文居多,而且常用的传统机器学习方法在长文本处理方面,存在局部文本块特征提取不完善的问题.为了解决中文新闻分类缺乏专门术语集的问题,采用构造数据索引的方法,制作了适合中文新闻分类的词汇表,并结合word2vec预训练词向量进行文本特征构建.为了解决特征提取不完善的问题,通过改进经典卷积神经网络模型结构,研究不同的卷积和池化操作对分类结果的影响.为提高新闻文本分类的精确率,本文提出并实现了一种组合-卷积神经网络模型,设计了有效的模型正则化和优化方法.实验结果表明,组合-卷积神经网络模型对中文新闻文本分类的精确率达到93.69%,相比最优的传统机器学习方法和经典卷积神经网络模型精确率分别提升6.34%和1.19%,并在召回率和F值两项指标上均优于对比模型.
-
关键词
自然语言处理
词向量
组合-卷积神经网络
中文新闻
文本分类
-
Keywords
natural language processing
word vector
combined-convolutional neural network
Chinese news
text classification
-
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
-
-
题名结合自适应图卷积与时态建模的骨架动作识别
被引量:3
- 3
-
-
作者
甄昊宇
张德
-
机构
北京建筑大学电气与信息工程学院&建筑大数据智能处理方法研究北京市重点实验室
-
出处
《计算机工程与应用》
CSCD
北大核心
2023年第18期137-144,共8页
-
基金
国家自然科学基金(61871020)
北京建筑大学研究生创新项目。
-
文摘
图卷积神经网络在基于三维骨架数据的人体动作识别中得到了广泛的应用,自适应图卷积可以有效地学习和反映不同动作数据内部的相对位置关系,用于提取空间特征。在时间特征方面,多数方法通过叠加多层一维局部卷积来提取相邻时间步长之间的时间关系,而忽略了非相邻时间步长的关键时间信息。因此,提出一种结合自适应图卷积与多尺度时态建模的动作识别模型。其中,自适应图卷积以端到端的方式学习不同卷积层和数据样本的图拓扑结构,增加了图建模的灵活性;多尺度时态建模构建相邻时间步长和非相邻时间步长之间的时态关系,充分提取了骨架序列的时间动态特征。结果表明,与主流算法相比,该模型在NTU RGB+D和NTU RGB+D 120基准数据集上的准确率均有较大提升。
-
关键词
人体骨架
动作识别
自适应图卷积
多尺度时态建模
-
Keywords
human skeleton
action recognition
adaptive graph convolution
multi-scale temporal modeling
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于图结构的级联注意力视觉问答模型
被引量:1
- 4
-
-
作者
张昊雨
张德
-
机构
北京建筑大学电气与信息工程学院&建筑大数据智能处理方法研究北京市重点实验室
-
出处
《计算机工程与应用》
CSCD
北大核心
2023年第6期155-161,共7页
-
基金
国家自然科学基金(61871020)。
-
文摘
视觉问答是一个具有挑战性的问题,需要结合计算机视觉和自然语言处理的概念。大多数现有的方法使用双流方式,先分别计算图像和问题特征,然后再采取不同的技术和策略进行融合。目前,尚缺乏能够直接捕获问题语义和图像空间关系的更高层次的表示方法。提出一种基于图结构的级联注意力学习模型,该模型结合了图学习模块(学习输入图像问题的特定图表示)、图卷积层和级联注意力层,目的是捕捉不同候选框区域图像的空间信息,以及其与问题之间的更高层次的关系。在大规模数据集VQA v2.0上进行了实验,结果表明,跟主流算法相比较,是/否、计数和其他类型问题的回答准确率均有明显提升,总体准确率达到了68.34%,从而验证了提出模型的有效性。
-
关键词
视觉问答
注意力机制
图卷积神经网络
特征融合
-
Keywords
visual question answering
attention mechanism
graph convolutional network
feature fusion
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-