期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
启发式强化学习机制的异构双种群蚁群算法
被引量:
6
1
作者
刘中强
游晓明
刘升
《计算机科学与探索》
CSCD
北大核心
2020年第3期460-469,共10页
针对传统蚁群算法在解决TSP问题时易陷入局部最优、收敛速度较慢的问题,提出了一种基于启发式强化学习的异构双种群蚁群算法。蚁群分为主种群和子种群,主种群负责解的构建和信息素的更新,子种群则是在构建解的同时对主种群的解集进行替...
针对传统蚁群算法在解决TSP问题时易陷入局部最优、收敛速度较慢的问题,提出了一种基于启发式强化学习的异构双种群蚁群算法。蚁群分为主种群和子种群,主种群负责解的构建和信息素的更新,子种群则是在构建解的同时对主种群的解集进行替换。算法初期利用启发式算子自适应地控制两个种群的交流频率,通过偏离度系数控制解的交换方式。前期让子种群的最优解去替换主种群的随机解,增加解的多样性,同时引入强化学习机制对交流后主种群最优路径上的信息素进行自适应的奖赏,以增大最优公共路径以后被选择的概率。后期则控制子种群的最优解去替换主种群的最差解,强化最优路径上信息素的量,并对主种群最优路径上的信息素进行奖赏,进一步提高算法的收敛速度。实验仿真表明,算法能够有效地跳出局部最优,并且解的质量在大规模测试集上有明显的改善。
展开更多
关键词
商旅问题(TSP)
异构双种群
偏离度系数
启发式强化学习
在线阅读
下载PDF
职称材料
移动机器人自主寻路避障启发式动态规划算法
被引量:
7
2
作者
方啸
郑德忠
《农业机械学报》
EI
CAS
CSCD
北大核心
2014年第7期73-78,共6页
用启发式动态规划算法解决移动机器人自主寻路、避障问题。提出了传感器检测环境状态的方法,以及对传感器检测信息进行归一化处理的方案。对输入、输出量以及学习系统的强化信号进行定义,设计了机器人自主学习寻路、避障的控制策略。定...
用启发式动态规划算法解决移动机器人自主寻路、避障问题。提出了传感器检测环境状态的方法,以及对传感器检测信息进行归一化处理的方案。对输入、输出量以及学习系统的强化信号进行定义,设计了机器人自主学习寻路、避障的控制策略。定义了连续型强化信号,使机器人通过学习,对优先寻路还是优先避障做出决策判断。为验证启发式动态规划算法在移动机器人寻路、避障问题上的学习能力,设计了3种不同的寻路、避障仿真实验:同目标、不同起始点,同起始点、不同目标,和移动目标仿真实验。仿真结果表明,对于不同的寻路、避障要求,基于启发式动态规划算法的移动机器人具有良好的学习及适应能力。
展开更多
关键词
移动机器人
寻路避障
启发
式
动态规划
强化
学习
在线阅读
下载PDF
职称材料
系列决策任务中的策略转换:来自爱荷华赌博任务的证据
被引量:
1
3
作者
胡馨允
沈悦
戴俊毅
《心理学报》
CSSCI
CSCD
北大核心
2023年第11期1793-1805,共13页
已有大量研究使用系列决策任务探讨了各类决策的决策策略。通过假定个体采用单一策略完成所有任务试次,并比较对应的计算认知模型拟合实证数据的能力,这些研究发现各种决策任务都涉及多种可能的决策策略。但是,此类研究的一个共同缺陷...
已有大量研究使用系列决策任务探讨了各类决策的决策策略。通过假定个体采用单一策略完成所有任务试次,并比较对应的计算认知模型拟合实证数据的能力,这些研究发现各种决策任务都涉及多种可能的决策策略。但是,此类研究的一个共同缺陷在于忽视了个体在任务过程中转换决策策略的可能性。通过开发允许在强化学习策略和启发式策略间转换的针对爱荷华赌博任务的计算认知模型,并将此类模型同单一策略模型进行对比,研究1提供了个体在该系列决策任务中会改变决策策略的明确证据。研究2则发现,随着试次数的增加,发生策略转换的可能性也会上升。这些结果表明,为了正确认识各种决策任务的决策策略,需要充分考虑在系列决策任务过程中发生策略转换的可能性,尤其是试次较多的系列任务。未来研究可以探讨策略转换的多种可能形式,以及导致策略转换的任务和个体因素,以便进一步深化对于系列决策任务的心理机制的认识。
展开更多
关键词
系列决策任务
爱荷华赌博任务
策略转换
计算认知建模
强化
学习
和
启发
式
策略
在线阅读
下载PDF
职称材料
题名
启发式强化学习机制的异构双种群蚁群算法
被引量:
6
1
作者
刘中强
游晓明
刘升
机构
上海工程技术大学电子电气工程学院
上海工程技术大学管理学院
出处
《计算机科学与探索》
CSCD
北大核心
2020年第3期460-469,共10页
基金
国家自然科学基金 Nos.61673258,61075115,61403249,61603242~~
文摘
针对传统蚁群算法在解决TSP问题时易陷入局部最优、收敛速度较慢的问题,提出了一种基于启发式强化学习的异构双种群蚁群算法。蚁群分为主种群和子种群,主种群负责解的构建和信息素的更新,子种群则是在构建解的同时对主种群的解集进行替换。算法初期利用启发式算子自适应地控制两个种群的交流频率,通过偏离度系数控制解的交换方式。前期让子种群的最优解去替换主种群的随机解,增加解的多样性,同时引入强化学习机制对交流后主种群最优路径上的信息素进行自适应的奖赏,以增大最优公共路径以后被选择的概率。后期则控制子种群的最优解去替换主种群的最差解,强化最优路径上信息素的量,并对主种群最优路径上的信息素进行奖赏,进一步提高算法的收敛速度。实验仿真表明,算法能够有效地跳出局部最优,并且解的质量在大规模测试集上有明显的改善。
关键词
商旅问题(TSP)
异构双种群
偏离度系数
启发式强化学习
Keywords
travelling salesman problem(TSP)
heterogeneous dual population
deviation coefficient
heuristic reinforcement learning
分类号
TP301 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
移动机器人自主寻路避障启发式动态规划算法
被引量:
7
2
作者
方啸
郑德忠
机构
燕山大学电气工程学院
罗德岛大学电气工程学院
出处
《农业机械学报》
EI
CAS
CSCD
北大核心
2014年第7期73-78,共6页
基金
国家火炬计划资助项目
国家重点新产品专项基金资助项目(2009GJA20001)
文摘
用启发式动态规划算法解决移动机器人自主寻路、避障问题。提出了传感器检测环境状态的方法,以及对传感器检测信息进行归一化处理的方案。对输入、输出量以及学习系统的强化信号进行定义,设计了机器人自主学习寻路、避障的控制策略。定义了连续型强化信号,使机器人通过学习,对优先寻路还是优先避障做出决策判断。为验证启发式动态规划算法在移动机器人寻路、避障问题上的学习能力,设计了3种不同的寻路、避障仿真实验:同目标、不同起始点,同起始点、不同目标,和移动目标仿真实验。仿真结果表明,对于不同的寻路、避障要求,基于启发式动态规划算法的移动机器人具有良好的学习及适应能力。
关键词
移动机器人
寻路避障
启发
式
动态规划
强化
学习
Keywords
Mobile robot Goal seeking with obstacle avoidance Heuristic dynamic programming Reinforcement learning
分类号
O221.3 [理学—运筹学与控制论]
TP242 [自动化与计算机技术—检测技术与自动化装置]
在线阅读
下载PDF
职称材料
题名
系列决策任务中的策略转换:来自爱荷华赌博任务的证据
被引量:
1
3
作者
胡馨允
沈悦
戴俊毅
机构
浙江大学心理与行为科学系
出处
《心理学报》
CSSCI
CSCD
北大核心
2023年第11期1793-1805,共13页
基金
中央高校基本科研业务费专项资金(2018QNA3014)资助。
文摘
已有大量研究使用系列决策任务探讨了各类决策的决策策略。通过假定个体采用单一策略完成所有任务试次,并比较对应的计算认知模型拟合实证数据的能力,这些研究发现各种决策任务都涉及多种可能的决策策略。但是,此类研究的一个共同缺陷在于忽视了个体在任务过程中转换决策策略的可能性。通过开发允许在强化学习策略和启发式策略间转换的针对爱荷华赌博任务的计算认知模型,并将此类模型同单一策略模型进行对比,研究1提供了个体在该系列决策任务中会改变决策策略的明确证据。研究2则发现,随着试次数的增加,发生策略转换的可能性也会上升。这些结果表明,为了正确认识各种决策任务的决策策略,需要充分考虑在系列决策任务过程中发生策略转换的可能性,尤其是试次较多的系列任务。未来研究可以探讨策略转换的多种可能形式,以及导致策略转换的任务和个体因素,以便进一步深化对于系列决策任务的心理机制的认识。
关键词
系列决策任务
爱荷华赌博任务
策略转换
计算认知建模
强化
学习
和
启发
式
策略
Keywords
decision task with a sequence of trials
The Iowa Gambling Task
strategy switching
computational cognitive modeling
reinforcement learning and heuristic strategies
分类号
B842.1 [哲学宗教—基础心理学]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
启发式强化学习机制的异构双种群蚁群算法
刘中强
游晓明
刘升
《计算机科学与探索》
CSCD
北大核心
2020
6
在线阅读
下载PDF
职称材料
2
移动机器人自主寻路避障启发式动态规划算法
方啸
郑德忠
《农业机械学报》
EI
CAS
CSCD
北大核心
2014
7
在线阅读
下载PDF
职称材料
3
系列决策任务中的策略转换:来自爱荷华赌博任务的证据
胡馨允
沈悦
戴俊毅
《心理学报》
CSSCI
CSCD
北大核心
2023
1
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部