期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
基于多尺度-多方向Transformer的图像识别 被引量:5
1
作者 杨育婷 李玲玲 +3 位作者 刘旭 焦李成 刘芳 马文萍 《计算机学报》 北大核心 2025年第2期249-265,共17页
有效的特征表示对提升深度学习模型的表征能力和图像识别性能至关重要。例如,多尺度特征表示方法能够捕捉不同尺度的丰富信息,有助于提高深度学习模型的图像识别性能。然而,当前的多尺度深度学习方法仍存在对图像方向特征建模不明确的局... 有效的特征表示对提升深度学习模型的表征能力和图像识别性能至关重要。例如,多尺度特征表示方法能够捕捉不同尺度的丰富信息,有助于提高深度学习模型的图像识别性能。然而,当前的多尺度深度学习方法仍存在对图像方向特征建模不明确的局限,导致对具有方向性目标的误识别。为了更好地表示图像中蕴含的多方向特征,本文提出了一种基于多尺度-多方向Transformer的网络框架(MSMDFormer)。首先,该框架中设计了一种能够捕获并增强多个方向特征的多方向特征编码器。在此基础上,本文联合了不同尺度的Gabor表征与多头注意力机制,设计了一种多尺度多方向Transformer编码器,以有效地聚合图像的多尺度和多方向特征。最后,该框架对卷积特征和多尺度-多方向特征进行融合,然后将融合特征用于图像识别。实验结果表明,MSMDFormer在CIFAR10、CIFAR100和SVHN数据集上分别取得了95.65%、77.46%和96.87%的整体准确率,在与19种基准方法的对比中显示出具有竞争力的图像分类性能。与11种图像分割基准方法相比,MSMDFormer在ADE20K数据集上展现出0.33%至6.58%mIoU的性能增益。综上所述,本文提出的MSMDFormer在深度学习图像识别任务中展现了卓越的特征表示能力,具有广泛的应用前景。另外,探索更有效的方向特征表示方法将成为未来研究的重要方向。 展开更多
关键词 TRANSFORMER 多尺度 多方向 特征表示 图像识别
在线阅读 下载PDF
深度神经网络并行化研究综述 被引量:63
2
作者 朱虎明 李佩 +2 位作者 焦李成 杨淑媛 侯彪 《计算机学报》 EI CSCD 北大核心 2018年第8期1861-1881,共21页
神经网络是人工智能领域的核心研究内容之一.在七十年的发展历史中,神经网络经历了从浅层神经网络到深度神经网络的重要变革.深度神经网络通过增加模型深度来提高其特征提取和数据拟合的能力,在自然语言处理、自动驾驶、图像分析等问题... 神经网络是人工智能领域的核心研究内容之一.在七十年的发展历史中,神经网络经历了从浅层神经网络到深度神经网络的重要变革.深度神经网络通过增加模型深度来提高其特征提取和数据拟合的能力,在自然语言处理、自动驾驶、图像分析等问题上相较浅层模型具有显著优势.随着训练数据规模的增加和模型的日趋复杂,深度神经网络的训练成本越来越高,并行化成为增强其应用时效性的重要技术手段.近年来计算平台的硬件架构更新迭代,计算能力飞速提高,特别是多核众核以及分布式异构计算平台发展迅速,为深度神经网络的并行化提供了硬件基础;另一方面,日趋丰富的并行编程框架也为计算设备和深度神经网络的并行化架起了桥梁.该文首先介绍了深度神经网络发展背景和常用的计算模型,然后对多核处理器、众核处理器和异构计算设备分别从功耗、计算能力、并行算法的开发难度等角度进行对比分析,对并行编程框架分别从支持的编程语言和硬件设备、编程难度等角度进行阐述.然后以AlexNet为例分析了深度神经网络模型并行和数据并行两种方法的实施过程.接下来,从支持硬件、并行接口、并行模式等角度比较了常用的深度神经网络开源软件,并且通过实验比较和分析了卷积神经网络在多核CPU和GPU上的并行性能.最后,对并行深度神经网络的未来发展趋势和面临的挑战进行展望. 展开更多
关键词 深度神经网络 并行计算 异构计算 模型并行 数据并行
在线阅读 下载PDF
神经网络七十年:回顾与展望 被引量:399
3
作者 焦李成 杨淑媛 +2 位作者 刘芳 王士刚 冯志玺 《计算机学报》 EI CSCD 北大核心 2016年第8期1697-1716,共20页
作为联接主义智能实现的典范,神经网络采用广泛互联的结构与有效的学习机制来模拟人脑信息处理的过程,是人工智能发展中的重要方法,也是当前类脑智能研究中的有效工具.在七十年的发展历程中,神经网络曾历经质疑、批判与冷落,同时也几度... 作为联接主义智能实现的典范,神经网络采用广泛互联的结构与有效的学习机制来模拟人脑信息处理的过程,是人工智能发展中的重要方法,也是当前类脑智能研究中的有效工具.在七十年的发展历程中,神经网络曾历经质疑、批判与冷落,同时也几度繁荣并取得了许多瞩目的成就.从20世纪40年代的M-P神经元和Hebb学习规则,到50年代的Hodykin-Huxley方程、感知器模型与自适应滤波器,再到60年代的自组织映射网络、神经认知机、自适应共振网络,许多神经计算模型都发展成为信号处理、计算机视觉、自然语言处理与优化计算等领域的经典方法,为该领域带来了里程碑式的影响.目前,模拟人脑复杂的层次化认知特点的深度学习已经成为类脑智能中的一个重要研究方向.通过增加网络层数所构造的"深层神经网络"使机器能够获得"抽象概念"能力,在诸多领域都取得了巨大的成功,又掀起了神经网络研究的一个新高潮.文中回顾了神经网络的发展历程,综述了其当前研究进展以及存在的问题,展望了未来神经网络的发展方向. 展开更多
关键词 类脑智能 神经网络 深度学习 大数据 并行计算 机器学习
在线阅读 下载PDF
基于深度支撑值学习网络的遥感图像融合 被引量:41
4
作者 李红 刘芳 +1 位作者 杨淑媛 张凯 《计算机学报》 EI CSCD 北大核心 2016年第8期1583-1596,共14页
该文将深度学习用于遥感图像融合,在训练深度网络时加入了结构风险最小化的损失函数,提出了一种基于深度支撑值学习网络的融合方法.为了避免图像融合过程中的信息损失,在传统卷积神经网络的基础上,取消了特征映射层的下采样过程,构建了... 该文将深度学习用于遥感图像融合,在训练深度网络时加入了结构风险最小化的损失函数,提出了一种基于深度支撑值学习网络的融合方法.为了避免图像融合过程中的信息损失,在传统卷积神经网络的基础上,取消了特征映射层的下采样过程,构建了深度支撑值学习网络(Deep Support Value Learning Networks,DSVL Nets),DSVL Nets网络模型包含5个隐藏层,每一层的基本结构由卷积层和线性层构成,该基本单元提供了一种多尺度、多方向、各向异性、非下采样的冗余变换,该模型在网络训练完毕之后,取出各卷积层和第5个隐藏层的线性层作为网络模型的输出层.输出层的各卷积层图像融合采用绝对值取大法,得到融合后的各卷积层图像;另外,将线性层图像分别在过完备字典上进行稀疏表示,并对稀疏系数采用绝对值取大法进行融合,得到融合后的线性层图像;最后将融合后的各卷积层和线性层图像重构得到结果图像.文中使用QuickBird和Geoeye卫星数据验证本文所提方法的有效性,实验结果表明,与PCA、AWLP、PN-TSSC和SVT算法相比较,该文所提方法的融合结果无论在主观视觉还是客观评价指标上均优于对比算法,较好地保持了图像的光谱信息和空间信息. 展开更多
关键词 深度学习 卷积神经网络 深度支撑值学习网络 过完备字典 遥感图像融合 机器学习
在线阅读 下载PDF
基于小波融合和PCA-核模糊聚类的遥感图像变化检测 被引量:28
5
作者 慕彩红 霍利利 +2 位作者 刘逸 刘若辰 焦李成 《电子学报》 EI CAS CSCD 北大核心 2015年第7期1375-1381,共7页
本文提出了一种变化检测方法以提高算法的鲁棒性、检测精度以及抗噪性.首先对差值法构造的差异图和比值法构造的差异图进行小波融合.然后将融合图像分成互不重叠的小块,并用主成分分析得到图像块的正交基.通过将融合图像中每个像素的邻... 本文提出了一种变化检测方法以提高算法的鲁棒性、检测精度以及抗噪性.首先对差值法构造的差异图和比值法构造的差异图进行小波融合.然后将融合图像分成互不重叠的小块,并用主成分分析得到图像块的正交基.通过将融合图像中每个像素的邻域小块映射到正交基上使得每个像素用一个特征向量来表示.最后用基于核的模糊C均值对特征向量进行聚类.实验结果显示与使用单一类型差异图的聚类方法相比,本方法由于采用了图像融合的策略而增强了鲁棒性,且由于采用了核模糊聚类,进一步提高了变化检测精度.此外由于使用了特征提取的技术,本方法具有一定的抗噪性能. 展开更多
关键词 遥感图像 变化检测 特征提取 核模糊聚类 小波融合
在线阅读 下载PDF
深度神经网络FPGA设计进展、实现与展望 被引量:23
6
作者 焦李成 孙其功 +2 位作者 杨育婷 冯雨歆 李秀芳 《计算机学报》 EI CAS CSCD 北大核心 2022年第3期441-471,共31页
近年来,随着人工智能与大数据技术的发展,深度神经网络在语音识别、自然语言处理、图像理解、视频分析等应用领域取得了突破性进展.深度神经网络的模型层数多、参数量大且计算复杂,对硬件的计算能力、内存带宽及数据存储等有较高的要求.... 近年来,随着人工智能与大数据技术的发展,深度神经网络在语音识别、自然语言处理、图像理解、视频分析等应用领域取得了突破性进展.深度神经网络的模型层数多、参数量大且计算复杂,对硬件的计算能力、内存带宽及数据存储等有较高的要求.FPGA作为一种可编程逻辑器件,具有可编程、高性能、低能耗、高稳定、可并行和安全性的特点.FPGA与深度神经网络的结合成为推动人工智能产业应用的研究热点.本文首先简述了人工神经网络坎坷的七十年发展历程与目前主流的深度神经网络模型,并介绍了支持深度神经网络发展与应用的主流硬件;接下来,在介绍FPGA的发展历程、开发方式、开发流程及型号选取的基础上,从六个方向分析了FPGA与深度神经网络结合的产业应用研究热点;然后,基于FPGA的硬件结构与深度神经网络的模型特点,总结了基于FPGA的深度神经网络的设计思路、优化方向和学习策略;接下来,归纳了FPGA型号选择以及相关研究的评价指标与度量分析原则;最后,我们总结了影响FPGA应用于深度神经网络的五个主要因素并进行了概要分析. 展开更多
关键词 深度神经网络 FPGA 产业应用 硬件结构 设计思路 度量分析
在线阅读 下载PDF
混合多目标算法用于柔性作业车间调度问题 被引量:7
7
作者 左益 公茂果 +1 位作者 曾久琳 焦李成 《计算机科学》 CSCD 北大核心 2015年第9期220-225,共6页
在生产调度领域,柔性作业车间调度问题是一个非常重要的优化问题。大多数研究通常优化的目标只是最大完工时间,而在实际中,往往要考虑多个目标。因此,提出了一种新的混合多目标算法用于解决柔性作业车间调度问题,其中考虑了3个目标,分别... 在生产调度领域,柔性作业车间调度问题是一个非常重要的优化问题。大多数研究通常优化的目标只是最大完工时间,而在实际中,往往要考虑多个目标。因此,提出了一种新的混合多目标算法用于解决柔性作业车间调度问题,其中考虑了3个目标,分别是:最大完工时间、机器总负载和瓶颈机器负荷。算法设计了有效的编码方式和遗传算子,并采用非支配近邻免疫算法求解非支配最优解。为了提高算法性能,提出了3种不同的局部搜索策略,并将其结合在多目标算法中。在多个数据集上的实验对比结果表明,所提算法优于其它代表性的算法。此外,实验结果还验证了局部搜索技术的有效性。 展开更多
关键词 柔性作业车间调度问题 多目标 局部搜索 非支配近邻免疫算法
在线阅读 下载PDF
基于矩阵对数累积量的极化合成孔径雷达数据去噪方法 被引量:3
8
作者 刘坤 马文萍 +1 位作者 刘红英 王爽 《兵工学报》 EI CAS CSCD 北大核心 2014年第9期1400-1407,共8页
噪声抑制是极化合成孔径雷达(PolSAR)数据处理中的重要步骤,首次将矩阵的对数累积量应用于PolSAR去噪当中,由数据点的子视数据集计算滤波系数并结合非局部方法的思想实现了PolSAR的斑点噪声抑制。所用方法基于非局部策略选取同质区域,... 噪声抑制是极化合成孔径雷达(PolSAR)数据处理中的重要步骤,首次将矩阵的对数累积量应用于PolSAR去噪当中,由数据点的子视数据集计算滤波系数并结合非局部方法的思想实现了PolSAR的斑点噪声抑制。所用方法基于非局部策略选取同质区域,然后利用相干矩阵对数累积量计算得到的滤波系数进行加权滤波。该方法的优点在于同质区域选取和滤波系数的计算均是针对相干矩阵进行的,相对于仅使用主对角线上的元素或SPAN图像,其对极化数据的处理更具合理性。与其他PolSAR去噪算法的对比实验结果表明,该方法在有效平滑同质区域的同时,能够更好地保留地物结构、细节以及纹理信息,并能更好地保持数据的极化相关性。 展开更多
关键词 信息处理技术 遥感图像 极化合成孔径雷达 相干斑 噪声抑制 对数累积量 梅林变换
在线阅读 下载PDF
基于多任务学习和身份约束的生成对抗网络人脸校正识别方法 被引量:3
9
作者 黄欣研 刘芳 +5 位作者 鲍骞月 李任鹏 刘旭 李玲玲 陈璞花 刘洋 《电子学报》 EI CAS CSCD 北大核心 2023年第10期2936-2949,共14页
针对DR-GAN(Disentangled Representation learning-Generative Adversarial Network)方法在将大偏转角度侧脸图像生成其正脸图像的整个生成过程中,没有考虑身份类别信息,从而导致在身份和姿态的解耦中存在真实的侧脸图像与其生成的正... 针对DR-GAN(Disentangled Representation learning-Generative Adversarial Network)方法在将大偏转角度侧脸图像生成其正脸图像的整个生成过程中,没有考虑身份类别信息,从而导致在身份和姿态的解耦中存在真实的侧脸图像与其生成的正脸图像身份一致性较弱的问题,本文提出了一种基于多任务学习和身份约束的生成对抗网络人脸校正识别方法.该方法通过借鉴多任务学习机制,在生成网络的编码器与解码器之间构建了角度姿态分类模块和身份约束识别模块.这两个模块不但在生成过程中实现了人脸身份和姿态的解耦,更重要的是在由侧脸生成正脸的过程中加入了人脸身份监督信息.在训练过程中,该方法将身份和姿态类别直接作为身份编码特征和姿态编码特征的监督信息,并通过设计身份特征损失函数来约束侧脸的身份编码特征逼近其正脸的身份编码特征,实现了侧脸编码特征中身份信息和姿态信息的有效解耦,使解码器能更准确地生成与原侧脸图像保持身份一致的正脸图像.在M2FPA数据集上,对不同角度的侧脸图像使用所提方法生成的正脸图像进行识别,达到了更高的人脸识别准确率.实验结果表明,即使在偏转角度较大时,所提方法仍然能够较好地生成保持身份一致的正脸图像,显著提升了较大偏转角下人脸识别准确率. 展开更多
关键词 多任务学习 身份约束 生成对抗网络 人脸校正 人脸识别
在线阅读 下载PDF
基于子视数据相关性的极化合成孔径雷达图像噪声抑制 被引量:1
10
作者 刘坤 马文萍 刘红英 《兵工学报》 EI CAS CSCD 北大核心 2015年第7期1288-1294,共7页
基于极化合成孔径雷达(Pol SAR)的子视数据相关性提出了一种新的非局部滤波器。非局部算法在一个较大的空域中搜寻待滤波元素所在图像块的相似图像块,并以基于它们的相似程度来对图像数据进行加权滤波。因而相似度计算在非局部滤波器里... 基于极化合成孔径雷达(Pol SAR)的子视数据相关性提出了一种新的非局部滤波器。非局部算法在一个较大的空域中搜寻待滤波元素所在图像块的相似图像块,并以基于它们的相似程度来对图像数据进行加权滤波。因而相似度计算在非局部滤波器里起到至关重要的作用。PolSAR图像子视数据之间的相关性包含有较对应的多视数据点之间更多的信息,这些信息有利于更加精准的计算非局部滤波器中相似度的估计。新提出的滤波器通过假设检验来估计两组子视数据集是否同质,并以此为依据估计图像块之间的相似性。通过对同质区域的加权滤波实现对Pol SAR数据的噪声抑制。对比实验证实了新提出的滤波器的有效性和优异性能。 展开更多
关键词 信息处理技术 遥感图像 极化合成孔径雷达 相干斑 非局部 子视数据 假设检验
在线阅读 下载PDF
基于稀疏自编码器和边缘保持的Wishart马尔科夫随机场的极化SAR图像分类(英文) 被引量:1
11
作者 张姝茵 侯彪 +1 位作者 焦李成 吴倩 《红外与毫米波学报》 SCIE EI CAS CSCD 北大核心 2018年第2期177-183,共7页
针对极化SAR图像训练样本数目较少问题以及极化SAR图像同质区域较多的特性,提出了一种新的两层分类框架,结合了稀疏自编码器和边缘保持的Wishart马尔科夫随机场对极化SAR图像进行分类.该框架包括个步骤,第一个步骤使用稀疏自编码器来获... 针对极化SAR图像训练样本数目较少问题以及极化SAR图像同质区域较多的特性,提出了一种新的两层分类框架,结合了稀疏自编码器和边缘保持的Wishart马尔科夫随机场对极化SAR图像进行分类.该框架包括个步骤,第一个步骤使用稀疏自编码器来获得一个初始分类;第二个步骤使用边缘保持的Wishart马尔科夫随机场对第一层的分类结果进行修正.在应用Wishart马尔科夫随机场的过程中,由稀疏自编码器分类得到的边缘得以保持,并且提出了新的分类错误纠正策略确保分类的准确性.因此,通过稀疏自编码器得到的精确分类边缘可用于不同的区域并且在应用Wishart马尔科夫的过程中得以保持.和其他分类方法相比,该方法得到较高的分类精度,证明了新方法的有效性. 展开更多
关键词 稀疏自编码器 极化SAR图像 Wishart距离 马尔科夫随机场
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部