期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
单幅图像超分辨重建的深度学习方法综述 被引量:10
1
作者 张德 林青宇 郭茂祖 《计算机工程与应用》 CSCD 北大核心 2021年第22期28-41,共14页
图像超分辨重建(Super-Resolution,SR)是指利用信号处理和机器学习等方法,从单幅或者多幅低分辨率图像(LowResolution,LR)中重建对应的高分辨率图像(HighResolution,HR)的技术。由于多幅LR图像之间亚像素位移的不可预知性,单幅图像超分... 图像超分辨重建(Super-Resolution,SR)是指利用信号处理和机器学习等方法,从单幅或者多幅低分辨率图像(LowResolution,LR)中重建对应的高分辨率图像(HighResolution,HR)的技术。由于多幅LR图像之间亚像素位移的不可预知性,单幅图像超分辨重建(SingleImageSuper-Resolution,SISR)逐渐成为超分辨研究的主要方向。近年来,深度学习方法得到迅速发展,并广泛应用到图像处理领域。因此,针对单幅图像超分辨重建所使用的深度学习相关算法和网络模型进行系统的总结。介绍图像超分辨问题的设置和评价指标;讨论和比较单幅图像超分辨重建的深度学习算法,主要从网络结构设计、损失函数和上采样方式三方面进行论述;介绍常用的标准数据集,并选用基于不同网络模型的几种典型算法进行实验对比分析;展望图像超分辨技术未来的研究趋势和发展方向。 展开更多
关键词 图像超分辨 深度学习 卷积神经网络(CNN) 图像处理
在线阅读 下载PDF
基于组合-卷积神经网络的中文新闻文本分类 被引量:24
2
作者 张昱 刘开峰 +2 位作者 张全新 王艳歌 高凯龙 《电子学报》 EI CAS CSCD 北大核心 2021年第6期1059-1067,共9页
目前的新闻分类研究以英文居多,而且常用的传统机器学习方法在长文本处理方面,存在局部文本块特征提取不完善的问题.为了解决中文新闻分类缺乏专门术语集的问题,采用构造数据索引的方法,制作了适合中文新闻分类的词汇表,并结合word2vec... 目前的新闻分类研究以英文居多,而且常用的传统机器学习方法在长文本处理方面,存在局部文本块特征提取不完善的问题.为了解决中文新闻分类缺乏专门术语集的问题,采用构造数据索引的方法,制作了适合中文新闻分类的词汇表,并结合word2vec预训练词向量进行文本特征构建.为了解决特征提取不完善的问题,通过改进经典卷积神经网络模型结构,研究不同的卷积和池化操作对分类结果的影响.为提高新闻文本分类的精确率,本文提出并实现了一种组合-卷积神经网络模型,设计了有效的模型正则化和优化方法.实验结果表明,组合-卷积神经网络模型对中文新闻文本分类的精确率达到93.69%,相比最优的传统机器学习方法和经典卷积神经网络模型精确率分别提升6.34%和1.19%,并在召回率和F值两项指标上均优于对比模型. 展开更多
关键词 自然语言处理 词向量 组合-卷积神经网络 中文新闻 文本分类
在线阅读 下载PDF
结合自适应图卷积与时态建模的骨架动作识别 被引量:3
3
作者 甄昊宇 张德 《计算机工程与应用》 CSCD 北大核心 2023年第18期137-144,共8页
图卷积神经网络在基于三维骨架数据的人体动作识别中得到了广泛的应用,自适应图卷积可以有效地学习和反映不同动作数据内部的相对位置关系,用于提取空间特征。在时间特征方面,多数方法通过叠加多层一维局部卷积来提取相邻时间步长之间... 图卷积神经网络在基于三维骨架数据的人体动作识别中得到了广泛的应用,自适应图卷积可以有效地学习和反映不同动作数据内部的相对位置关系,用于提取空间特征。在时间特征方面,多数方法通过叠加多层一维局部卷积来提取相邻时间步长之间的时间关系,而忽略了非相邻时间步长的关键时间信息。因此,提出一种结合自适应图卷积与多尺度时态建模的动作识别模型。其中,自适应图卷积以端到端的方式学习不同卷积层和数据样本的图拓扑结构,增加了图建模的灵活性;多尺度时态建模构建相邻时间步长和非相邻时间步长之间的时态关系,充分提取了骨架序列的时间动态特征。结果表明,与主流算法相比,该模型在NTU RGB+D和NTU RGB+D 120基准数据集上的准确率均有较大提升。 展开更多
关键词 人体骨架 动作识别 自适应图卷积 多尺度时态建模
在线阅读 下载PDF
基于图结构的级联注意力视觉问答模型 被引量:1
4
作者 张昊雨 张德 《计算机工程与应用》 CSCD 北大核心 2023年第6期155-161,共7页
视觉问答是一个具有挑战性的问题,需要结合计算机视觉和自然语言处理的概念。大多数现有的方法使用双流方式,先分别计算图像和问题特征,然后再采取不同的技术和策略进行融合。目前,尚缺乏能够直接捕获问题语义和图像空间关系的更高层次... 视觉问答是一个具有挑战性的问题,需要结合计算机视觉和自然语言处理的概念。大多数现有的方法使用双流方式,先分别计算图像和问题特征,然后再采取不同的技术和策略进行融合。目前,尚缺乏能够直接捕获问题语义和图像空间关系的更高层次的表示方法。提出一种基于图结构的级联注意力学习模型,该模型结合了图学习模块(学习输入图像问题的特定图表示)、图卷积层和级联注意力层,目的是捕捉不同候选框区域图像的空间信息,以及其与问题之间的更高层次的关系。在大规模数据集VQA v2.0上进行了实验,结果表明,跟主流算法相比较,是/否、计数和其他类型问题的回答准确率均有明显提升,总体准确率达到了68.34%,从而验证了提出模型的有效性。 展开更多
关键词 视觉问答 注意力机制 图卷积神经网络 特征融合
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部