期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
一种多层次抽象语义决策图像分类方法 被引量:3
1
作者 刘鹏 叶志鹏 +1 位作者 赵巍 唐降龙 《自动化学报》 EI CSCD 北大核心 2015年第5期960-969,共10页
视觉词包(Bag-of-visual-words,Bo VW)模型是一种有效的图像分类方法.本文提出一种基于语义抽象的多层次决策(Multiple layer decision,MLD)方法,通过在Bo VW中引入抽象语义进行多层次扩展,采用语义保留方法生成具有语义的视觉词典,利... 视觉词包(Bag-of-visual-words,Bo VW)模型是一种有效的图像分类方法.本文提出一种基于语义抽象的多层次决策(Multiple layer decision,MLD)方法,通过在Bo VW中引入抽象语义进行多层次扩展,采用语义保留方法生成具有语义的视觉词典,利用自底向上的方式逐层传递语义,训练上层语义分类器;分类时采用自顶向下方式逐层判断待测样本的类别.用标准数据集验证方法的分类性能.结果表明,本文提出的方法与主流分类方法相比具有更好的分类性能. 展开更多
关键词 图像分类 图像模糊分类 视觉词包模型 决策树 多层次决策
在线阅读 下载PDF
深度域适应综述:一般情况与复杂情况 被引量:47
2
作者 范苍宁 刘鹏 +2 位作者 肖婷 赵巍 唐降龙 《自动化学报》 EI CAS CSCD 北大核心 2021年第3期515-548,共34页
信息时代产生的大量数据使机器学习技术成功地应用于许多领域.大多数机器学习技术需要满足训练集与测试集独立同分布的假设,但在实际应用中这个假设很难满足.域适应是一种在训练集和测试集不满足独立同分布条件下的机器学习技术.一般情... 信息时代产生的大量数据使机器学习技术成功地应用于许多领域.大多数机器学习技术需要满足训练集与测试集独立同分布的假设,但在实际应用中这个假设很难满足.域适应是一种在训练集和测试集不满足独立同分布条件下的机器学习技术.一般情况下的域适应只适用于源域目标域特征空间与标签空间都相同的情况,然而实际上这个条件很难满足.为了增强域适应技术的适用性,复杂情况下的域适应逐渐成为研究热点,其中标签空间不一致和复杂目标域情况下的域适应技术是近年来的新兴方向.随着深度学习技术的崛起,深度域适应已经成为域适应研究领域中的主流方法.本文对一般情况与复杂情况下的深度域适应的研究进展进行综述,对其缺点进行总结,并对其未来的发展趋势进行预测.首先对迁移学习相关概念进行介绍,然后分别对一般情况与复杂情况下的域适应、域适应技术的应用以及域适应方法性能的实验结果进行综述,最后对域适应领域的未来发展趋势进行展望并对全文内容进行总结. 展开更多
关键词 域适应 迁移学习 深度域适应 深度学习 机器学习
在线阅读 下载PDF
基于TD-error自适应校正的深度Q学习主动采样方法 被引量:12
3
作者 白辰甲 刘鹏 +1 位作者 赵巍 唐降龙 《计算机研究与发展》 EI CSCD 北大核心 2019年第2期262-280,共19页
强化学习中智能体与环境交互的成本较高.针对深度Q学习中经验池样本利用效率的问题,提出基于TD-error自适应校正的主动采样方法.深度Q学习训练中样本存储优先级的更新滞后于Q网络参数的更新,存储优先级不能准确反映经验池中样本TD-erro... 强化学习中智能体与环境交互的成本较高.针对深度Q学习中经验池样本利用效率的问题,提出基于TD-error自适应校正的主动采样方法.深度Q学习训练中样本存储优先级的更新滞后于Q网络参数的更新,存储优先级不能准确反映经验池中样本TD-error的真实分布.提出的TD-error自适应校正主动采样方法利用样本回放周期和Q网络状态建立优先级偏差模型,估计经验池中样本的真实优先级.在Q网络迭代中使用校正后的优先级选择样本,偏差模型在学习过程中分段更新.分析了Q网络学习性能与偏差模型阶数和模型更新周期之间的依赖关系,并对算法复杂度进行了分析.方法在Atari 2600平台进行了实验,结果表明,使用TD-error自适应校正的主动采样方法选择样本提高了智能体的学习速度,减少了智能体与环境的交互次数,同时改善了智能体的学习效果,提升了最优策略的质量. 展开更多
关键词 样本优先级 TD-error校正 自适应 主动采样 深度Q学习 强化学习
在线阅读 下载PDF
深度Q学习的二次主动采样方法 被引量:17
4
作者 赵英男 刘鹏 +1 位作者 赵巍 唐降龙 《自动化学报》 EI CSCD 北大核心 2019年第10期1870-1882,共13页
实现深度Q学习的一种方式是深度Q网络(Deep Q-networks,DQN).经验回放方法利用经验池中的样本训练深度Q网络,构造经验池需要智能体与环境进行大量交互,这样会增加成本和风险.一种减少智能体与环境交互次数的有效方式是高效利用样本.样... 实现深度Q学习的一种方式是深度Q网络(Deep Q-networks,DQN).经验回放方法利用经验池中的样本训练深度Q网络,构造经验池需要智能体与环境进行大量交互,这样会增加成本和风险.一种减少智能体与环境交互次数的有效方式是高效利用样本.样本所在序列的累积回报对深度Q网络训练有影响.累积回报大的序列中的样本相对于累积回报小的序列中的样本更能加速深度Q网络的收敛速度,并提升策略的质量.本文提出深度Q学习的二次主动采样方法.首先,根据序列累积回报的分布构造优先级对经验池中的序列进行采样.然后,在已采样的序列中根据样本的TD-error(Temporal-difference error)分布构造优先级对样本采样.随后用两次采样得到的样本训练深度Q网络.该方法从序列累积回报和TD-error两个方面选择样本,以达到加速深度Q网络收敛,提升策略质量的目的.在Atari平台上进行了验证.实验结果表明,用经过二次主动采样得到的样本训练深度Q网络取得了良好的效果. 展开更多
关键词 优先经验回放 TD-error 深度Q网络 累积回报
在线阅读 下载PDF
一种大气湍流环境下的运动目标自适应检测方法
5
作者 杜飞 金野 +1 位作者 刘鹏 唐降龙 《自动化学报》 EI CSCD 北大核心 2018年第9期1590-1605,共16页
在远距离成像过程中,图像序列受到湍流的影响会出现像素点亮度的随机起伏、闪烁和图像中物体的位置漂移,这使得传统的背景建模方法在湍流环境下难以准确检测运动目标.针对图像受到湍流影响在不同区域表现出的不同性质,提出分层次决策判... 在远距离成像过程中,图像序列受到湍流的影响会出现像素点亮度的随机起伏、闪烁和图像中物体的位置漂移,这使得传统的背景建模方法在湍流环境下难以准确检测运动目标.针对图像受到湍流影响在不同区域表现出的不同性质,提出分层次决策判别方法.首先,用高斯模型建模背景平坦区域,用双高斯模型建模背景中的物体边缘区域,设定判别式对每个像素点进行判别,并在线更新模型参数;然后,针对由于湍流影响出现的亮度突变点建立自适应判别模型,结合前一层次的判别结果,构造判别条件消除亮度突变点,分割得到目标点;最后,通过连通区域约束得到目标区域.实验结果表明,本文方法在不同湍流强度下对不同数量和不同运动方向的目标取得了良好的检测效果. 展开更多
关键词 大气湍流 运动目标检测 分层次决策 自适应检测
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部