检索结果-维普期刊中文期刊服务平台

一种多层次抽象语义决策图像分类方法被引量：3: 1; 作者刘鹏叶志鹏 +1 位作者赵巍唐降龙《自动化学报》 EI CSCD 北大核心 2015年第5期960-969,共10页; 视觉词包(Bag-of-visual-words,Bo VW)模型是一种有效的图像分类方法.本文提出一种基于语义抽象的多层次决策(Multiple layer decision,MLD)方法,通过在Bo VW中引入抽象语义进行多层次扩展,采用语义保留方法生成具有语义的视觉词典,利... 展开更多; 关键词图像分类图像模糊分类视觉词包模型决策树多层次决策; 在线阅读下载PDF 职称材料

深度域适应综述:一般情况与复杂情况被引量：47: 2; 作者范苍宁刘鹏 +2 位作者肖婷赵巍唐降龙《自动化学报》 EI CAS CSCD 北大核心 2021年第3期515-548,共34页; 信息时代产生的大量数据使机器学习技术成功地应用于许多领域.大多数机器学习技术需要满足训练集与测试集独立同分布的假设,但在实际应用中这个假设很难满足.域适应是一种在训练集和测试集不满足独立同分布条件下的机器学习技术.一般情... 展开更多; 关键词域适应迁移学习深度域适应深度学习机器学习; 在线阅读下载PDF 职称材料

基于TD-error自适应校正的深度Q学习主动采样方法被引量：12: 3; 作者白辰甲刘鹏 +1 位作者赵巍唐降龙《计算机研究与发展》 EI CSCD 北大核心 2019年第2期262-280,共19页; 强化学习中智能体与环境交互的成本较高.针对深度Q学习中经验池样本利用效率的问题,提出基于TD-error自适应校正的主动采样方法.深度Q学习训练中样本存储优先级的更新滞后于Q网络参数的更新,存储优先级不能准确反映经验池中样本TD-erro... 展开更多; 关键词样本优先级 TD-error校正自适应主动采样深度Q学习强化学习; 在线阅读下载PDF 职称材料

深度Q学习的二次主动采样方法被引量：17: 4; 作者赵英男刘鹏 +1 位作者赵巍唐降龙《自动化学报》 EI CSCD 北大核心 2019年第10期1870-1882,共13页; 实现深度Q学习的一种方式是深度Q网络(Deep Q-networks,DQN).经验回放方法利用经验池中的样本训练深度Q网络,构造经验池需要智能体与环境进行大量交互,这样会增加成本和风险.一种减少智能体与环境交互次数的有效方式是高效利用样本.样... 展开更多; 关键词优先经验回放 TD-error 深度Q网络累积回报; 在线阅读下载PDF 职称材料

一种大气湍流环境下的运动目标自适应检测方法: 5; 作者杜飞金野 +1 位作者刘鹏唐降龙《自动化学报》 EI CSCD 北大核心 2018年第9期1590-1605,共16页; 在远距离成像过程中,图像序列受到湍流的影响会出现像素点亮度的随机起伏、闪烁和图像中物体的位置漂移,这使得传统的背景建模方法在湍流环境下难以准确检测运动目标.针对图像受到湍流影响在不同区域表现出的不同性质,提出分层次决策判... 展开更多; 关键词大气湍流运动目标检测分层次决策自适应检测; 在线阅读下载PDF 职称材料

题名一种多层次抽象语义决策图像分类方法被引量：3: 1; 作者刘鹏叶志鹏赵巍唐降龙; 机构哈尔滨工业大学计算机科学与技术学院模式识别与智能系统研究中心; 出处《自动化学报》 EI CSCD 北大核心 2015年第5期960-969,共10页; 基金国家自然科学基金(61171184 61201309 61440025)资助~~; 文摘视觉词包(Bag-of-visual-words,Bo VW)模型是一种有效的图像分类方法.本文提出一种基于语义抽象的多层次决策(Multiple layer decision,MLD)方法,通过在Bo VW中引入抽象语义进行多层次扩展,采用语义保留方法生成具有语义的视觉词典,利用自底向上的方式逐层传递语义,训练上层语义分类器;分类时采用自顶向下方式逐层判断待测样本的类别.用标准数据集验证方法的分类性能.结果表明,本文提出的方法与主流分类方法相比具有更好的分类性能.; 关键词图像分类图像模糊分类视觉词包模型决策树多层次决策; Keywords Image classification image fuzzy classification decision tree; 分类号 TP391.41 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名深度域适应综述:一般情况与复杂情况被引量：47: 2; 作者范苍宁刘鹏肖婷赵巍唐降龙; 机构哈尔滨工业大学计算机科学与技术学院模式识别与智能系统研究中心; 出处《自动化学报》 EI CAS CSCD 北大核心 2021年第3期515-548,共34页; 基金国家自然科学基金(61671175) 四川省科技计划项目基金(2019YFS0069) 空间智能控制技术重点实验室基金(ZDSXS-2018-02)资助。; 文摘信息时代产生的大量数据使机器学习技术成功地应用于许多领域.大多数机器学习技术需要满足训练集与测试集独立同分布的假设,但在实际应用中这个假设很难满足.域适应是一种在训练集和测试集不满足独立同分布条件下的机器学习技术.一般情况下的域适应只适用于源域目标域特征空间与标签空间都相同的情况,然而实际上这个条件很难满足.为了增强域适应技术的适用性,复杂情况下的域适应逐渐成为研究热点,其中标签空间不一致和复杂目标域情况下的域适应技术是近年来的新兴方向.随着深度学习技术的崛起,深度域适应已经成为域适应研究领域中的主流方法.本文对一般情况与复杂情况下的深度域适应的研究进展进行综述,对其缺点进行总结,并对其未来的发展趋势进行预测.首先对迁移学习相关概念进行介绍,然后分别对一般情况与复杂情况下的域适应、域适应技术的应用以及域适应方法性能的实验结果进行综述,最后对域适应领域的未来发展趋势进行展望并对全文内容进行总结.; 关键词域适应迁移学习深度域适应深度学习机器学习; Keywords Domain adaptation transfer learning deep domain adaptation deep learning machine learning; 分类号 TP181 [自动化与计算机技术—控制理论与控制工程]; 在线阅读下载PDF 职称材料

题名基于TD-error自适应校正的深度Q学习主动采样方法被引量：12: 3; 作者白辰甲刘鹏赵巍唐降龙; 机构哈尔滨工业大学计算机科学与技术学院模式识别与智能系统研究中心; 出处《计算机研究与发展》 EI CSCD 北大核心 2019年第2期262-280,共19页; 基金国家自然科学基金项目(61671175 61672190)~~; 文摘强化学习中智能体与环境交互的成本较高.针对深度Q学习中经验池样本利用效率的问题,提出基于TD-error自适应校正的主动采样方法.深度Q学习训练中样本存储优先级的更新滞后于Q网络参数的更新,存储优先级不能准确反映经验池中样本TD-error的真实分布.提出的TD-error自适应校正主动采样方法利用样本回放周期和Q网络状态建立优先级偏差模型,估计经验池中样本的真实优先级.在Q网络迭代中使用校正后的优先级选择样本,偏差模型在学习过程中分段更新.分析了Q网络学习性能与偏差模型阶数和模型更新周期之间的依赖关系,并对算法复杂度进行了分析.方法在Atari 2600平台进行了实验,结果表明,使用TD-error自适应校正的主动采样方法选择样本提高了智能体的学习速度,减少了智能体与环境的交互次数,同时改善了智能体的学习效果,提升了最优策略的质量.; 关键词样本优先级 TD-error校正自适应主动采样深度Q学习强化学习; Keywords sample priority TD-error correction adaption active sampling deep Q-learning reinforcement learning; 分类号 TP181 [自动化与计算机技术—控制理论与控制工程]; 在线阅读下载PDF 职称材料

题名深度Q学习的二次主动采样方法被引量：17: 4; 作者赵英男刘鹏赵巍唐降龙; 机构哈尔滨工业大学计算机科学与技术学院模式识别与智能系统研究中心; 出处《自动化学报》 EI CSCD 北大核心 2019年第10期1870-1882,共13页; 基金国家自然科学基金(61671175,61672190)资助~~; 文摘实现深度Q学习的一种方式是深度Q网络(Deep Q-networks,DQN).经验回放方法利用经验池中的样本训练深度Q网络,构造经验池需要智能体与环境进行大量交互,这样会增加成本和风险.一种减少智能体与环境交互次数的有效方式是高效利用样本.样本所在序列的累积回报对深度Q网络训练有影响.累积回报大的序列中的样本相对于累积回报小的序列中的样本更能加速深度Q网络的收敛速度,并提升策略的质量.本文提出深度Q学习的二次主动采样方法.首先,根据序列累积回报的分布构造优先级对经验池中的序列进行采样.然后,在已采样的序列中根据样本的TD-error(Temporal-difference error)分布构造优先级对样本采样.随后用两次采样得到的样本训练深度Q网络.该方法从序列累积回报和TD-error两个方面选择样本,以达到加速深度Q网络收敛,提升策略质量的目的.在Atari平台上进行了验证.实验结果表明,用经过二次主动采样得到的样本训练深度Q网络取得了良好的效果.; 关键词优先经验回放 TD-error 深度Q网络累积回报; Keywords Prioritized experience replay temporal-difference error (TD-error) deep Q-networks (DQN) cumulative reward; 分类号 TP181 [自动化与计算机技术—控制理论与控制工程]; 在线阅读下载PDF 职称材料

题名一种大气湍流环境下的运动目标自适应检测方法: 5; 作者杜飞金野刘鹏唐降龙; 机构哈尔滨工业大学计算机科学与技术学院模式识别与智能系统研究中心; 出处《自动化学报》 EI CSCD 北大核心 2018年第9期1590-1605,共16页; 基金国家自然科学基金(61671175) 国防科工局重大专项(50-Y20A08-0508-15/16 公开)资助~~; 文摘在远距离成像过程中,图像序列受到湍流的影响会出现像素点亮度的随机起伏、闪烁和图像中物体的位置漂移,这使得传统的背景建模方法在湍流环境下难以准确检测运动目标.针对图像受到湍流影响在不同区域表现出的不同性质,提出分层次决策判别方法.首先,用高斯模型建模背景平坦区域,用双高斯模型建模背景中的物体边缘区域,设定判别式对每个像素点进行判别,并在线更新模型参数;然后,针对由于湍流影响出现的亮度突变点建立自适应判别模型,结合前一层次的判别结果,构造判别条件消除亮度突变点,分割得到目标点;最后,通过连通区域约束得到目标区域.实验结果表明,本文方法在不同湍流强度下对不同数量和不同运动方向的目标取得了良好的检测效果.; 关键词大气湍流运动目标检测分层次决策自适应检测; Keywords Atmospheric turbulence moving object detection multi-hierarchy decision adaptive detection; 分类号 TP391.41 [自动化与计算机技术—计算机应用技术] O357.5 [理学—流体力学]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	一种多层次抽象语义决策图像分类方法	刘鹏叶志鹏赵巍唐降龙	《自动化学报》 EI CSCD 北大核心	2015	3	在线阅读下载PDF 职称材料
2	深度域适应综述:一般情况与复杂情况	范苍宁刘鹏肖婷赵巍唐降龙	《自动化学报》 EI CAS CSCD 北大核心	2021	47	在线阅读下载PDF 职称材料
3	基于TD-error自适应校正的深度Q学习主动采样方法	白辰甲刘鹏赵巍唐降龙	《计算机研究与发展》 EI CSCD 北大核心	2019	12	在线阅读下载PDF 职称材料
4	深度Q学习的二次主动采样方法	赵英男刘鹏赵巍唐降龙	《自动化学报》 EI CSCD 北大核心	2019	17	在线阅读下载PDF 职称材料
5	一种大气湍流环境下的运动目标自适应检测方法	杜飞金野刘鹏唐降龙	《自动化学报》 EI CSCD 北大核心	2018	0	在线阅读下载PDF 职称材料