期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
基于蒙特卡罗树搜索-强化学习的列车运行智能调整方法 被引量:5
1
作者 王荣笙 张琦 +2 位作者 张涛 王涛 丁舒忻 《中国铁道科学》 EI CAS CSCD 北大核心 2022年第5期146-156,共11页
为提升突发事件下高速铁路应急处置效率,以列车运行图为研究对象,提出晚点场景下蒙特卡罗树搜索-强化学习(MCTS-RL)的列车运行智能调整方法,包括MCTS-RL的列车运行智能调整离线训练模型、强化学习方法、MCTS的发车次序决策方法和冲突消... 为提升突发事件下高速铁路应急处置效率,以列车运行图为研究对象,提出晚点场景下蒙特卡罗树搜索-强化学习(MCTS-RL)的列车运行智能调整方法,包括MCTS-RL的列车运行智能调整离线训练模型、强化学习方法、MCTS的发车次序决策方法和冲突消解启发式规则。基于高速铁路列车运行调整数学模型构建强化学习环境,包括状态集、动作集、状态转移概率和奖励函数。先设计启发式规则,生成可行发车次序,作为蒙特卡罗树搜索博弈树结构的节点,应用MCTS输出列车运行调整的最优发车次序。之后再设计启发式规则,消解列车在车站和区间的运行冲突。以线路上列车总晚点时间最短为目标函数,基于MCTS-RL一次性离线训练生成在线调整模型,用于实时调整各次列车在各个车站的发车次序。以京沪高速铁路北京南—泰安段为例,设置到站晚点和发车晚点场景,分别应用先到先服务、CPLEX求解器和MCTS-RL方法进行求解。结果表明:与CPLEX求解器下的方案相比,MCTS-RL方法能在0.001 s内给出同样最优的列车运行调整方案。 展开更多
关键词 高速铁路 列车运行调整 人工智能 强化学习 蒙特卡罗树搜索
在线阅读 下载PDF
基于蒙特卡罗树搜索的多载具自动化存取系统优化算法
2
作者 陈俭新 宁蒙 +2 位作者 黄予洛 张蕾 赵新灿 《舰船科学技术》 北大核心 2022年第8期169-173,共5页
针对某型多载具自动化存取系统优化分配问题,分析该自动化存取系统的运行特点,建立了该自动化存取系统优化问题的马尔科夫决策过程模型,并提出了求解模型的基于改进蒙特卡罗树搜索算法。首先,以总搬运量和同类型货箱距离最小为目标建立... 针对某型多载具自动化存取系统优化分配问题,分析该自动化存取系统的运行特点,建立了该自动化存取系统优化问题的马尔科夫决策过程模型,并提出了求解模型的基于改进蒙特卡罗树搜索算法。首先,以总搬运量和同类型货箱距离最小为目标建立货位优化模型,为了更好控制蒙特卡罗树搜索分支合理性,对算法节点选择部分进行优化。最后,对改进的蒙特卡罗树搜索算法进行货位优化及对比测试。实验结果表明:改进的蒙特卡罗树搜索算法较采用贪心思想、采用魔方还原思想以及基于传统蒙特卡罗树搜索的算法在货位优化运行效果上更优。 展开更多
关键词 多载具自动化存取系统 马尔科夫模型 蒙特卡罗树搜索
在线阅读 下载PDF
混合蒙特卡罗搜索的特征选择算法的优化 被引量:1
3
作者 刘云 肖雪 黄荣乘 《信息技术》 2020年第5期28-31,36,共5页
特征选择是机器学习和数据挖掘中处理高维数据的初步步骤,通过消除冗余或不相关的特征来识别数据集中最重要和最相关的特征,从而提高分类精度和降低计算复杂度。文中提出混合蒙特卡罗树搜索特征选择算法(HMCTS),首先,根据蒙特卡罗树搜... 特征选择是机器学习和数据挖掘中处理高维数据的初步步骤,通过消除冗余或不相关的特征来识别数据集中最重要和最相关的特征,从而提高分类精度和降低计算复杂度。文中提出混合蒙特卡罗树搜索特征选择算法(HMCTS),首先,根据蒙特卡罗树搜索方法迭代生成一个初始特征子集,利用ReliefF算法过滤选择前k个特征形成候选特征子集;然后,利用KNN分类器的分类精度评估候选特征,通过反向传播将模拟结果更新到迭代路径上所有选择的节点;最后,选择高精度的候选特征作为最佳特征子集。仿真结果表明,对比HPSO-LS和MOTiFS算法,HMCTS算法具有良好的可扩展性,且分类精度高。 展开更多
关键词 高维数据 特征选择 相关特征 蒙特卡罗树搜索 可扩展性
在线阅读 下载PDF
考虑综合性能最优的非短视快速天基雷达多目标跟踪资源调度算法
4
作者 王增福 杨广宇 金术玲 《雷达学报(中英文)》 EI CSCD 北大核心 2024年第1期253-269,共17页
合理有效的资源调度是天基雷达效能得以充分发挥的关键。针对天基雷达多目标跟踪资源调度问题,建立了综合考虑目标威胁度、跟踪精度与低截获概率(LPI)的代价函数;考虑目标的不确定、天基平台约束以及长远期期望代价,建立了多约束下的基... 合理有效的资源调度是天基雷达效能得以充分发挥的关键。针对天基雷达多目标跟踪资源调度问题,建立了综合考虑目标威胁度、跟踪精度与低截获概率(LPI)的代价函数;考虑目标的不确定、天基平台约束以及长远期期望代价,建立了多约束下的基于部分可观测的马尔可夫决策过程(POMDP)的资源调度模型;采用拉格朗日松弛法将多约束下的多目标跟踪资源调度问题转换分解为多个无约束的子问题;针对连续状态空间、连续动作空间及连续观测空间引起的维数灾难问题,采用基于蒙特卡罗树搜索(MCTS)的在线POMDP算法—POMCPOW算法进行求解,最终提出了一种综合多指标性能的非短视快速天基雷达多目标跟踪资源调度算法。仿真表明,与已有调度算法相比,所提算法资源分配更合理,系统性能更优。 展开更多
关键词 天基雷达 资源调度 多目标跟踪 部分可观测的马尔可夫决策过程 蒙特卡罗树搜索(MCTS)
在线阅读 下载PDF
空战机动飞行轨迹生成与控制 被引量:4
5
作者 刘佩 王维嘉 +1 位作者 陈向 朱雪耀 《兵工自动化》 2018年第11期76-80,96,共6页
针对依赖于标准机动动作库或者驾驶员经验的机动控制问题,提出一种基于蒙特卡罗树搜索算法生成机动轨迹的方法,只需给定目标机动动作的初始和终止状态,通过反复搜索即可得到达成机动目标的操作序列;并设计前馈加反馈的复合控制器来提高... 针对依赖于标准机动动作库或者驾驶员经验的机动控制问题,提出一种基于蒙特卡罗树搜索算法生成机动轨迹的方法,只需给定目标机动动作的初始和终止状态,通过反复搜索即可得到达成机动目标的操作序列;并设计前馈加反馈的复合控制器来提高轨迹跟踪的效果。实验以筋斗机动为例进行验证,仿真结果表明:得到的筋斗参考轨迹各项指标均接近职业战斗机飞行员的最佳表现;同时与传统的PID控制器进行对比,证明了复合控制器能显著提高筋斗轨迹的跟踪效果,为解决机动控制问题提出了一种有效的解决方案。 展开更多
关键词 机动飞行控制 强化学习 蒙特卡罗树搜索 复合控制
在线阅读 下载PDF
基于MCTS-RAVE的智能博弈 被引量:1
6
作者 芮雄星 王一莉 《江南大学学报(自然科学版)》 CAS 2011年第2期175-178,共4页
针对蒙特卡罗树搜索(MCTS)算法对蒙特卡罗模拟次数的依赖性较强,为获得较高智能必须进行多次模拟的情况,提出了结合在线强化学习知识以减少MCTS算法对蒙特卡罗模拟次数的依赖,在搜索过程中积累强化学习知识,并快速对动作值作出估计。实... 针对蒙特卡罗树搜索(MCTS)算法对蒙特卡罗模拟次数的依赖性较强,为获得较高智能必须进行多次模拟的情况,提出了结合在线强化学习知识以减少MCTS算法对蒙特卡罗模拟次数的依赖,在搜索过程中积累强化学习知识,并快速对动作值作出估计。实例表明,该种方法较MCTS具有更高的智能表现,并有一定的实用价值。 展开更多
关键词 博弈搜索 蒙特卡罗树搜索 快速动作值估计
在线阅读 下载PDF
AlphaZero原理与启示 被引量:8
7
作者 唐川 陶业荣 麻曰亮 《航空兵器》 CSCD 北大核心 2020年第3期27-36,共10页
近几年,计算机围棋成功引发了又一轮的人工智能热潮,从计算机围棋中发展出来的AlphaZero框架成功地应用在其他完全信息条件下的二人有限零和博弈问题,进而展示出了深度学习和强化学习在智能决策领域的优异性能。本文首先介绍了AlphaZer... 近几年,计算机围棋成功引发了又一轮的人工智能热潮,从计算机围棋中发展出来的AlphaZero框架成功地应用在其他完全信息条件下的二人有限零和博弈问题,进而展示出了深度学习和强化学习在智能决策领域的优异性能。本文首先介绍了AlphaZero框架中三个核心技术:深度学习、强化学习以及蒙特卡罗树搜索,然后详细说明了AlphaZero框架两个关键阶段——AlphaGo和AlphaGo Zero的基本原理,最后,对AlphaZero框架提出了自己的思考,并基于对AlphaZero原理的剖析讨论了其对军事决策智能化的启示。 展开更多
关键词 深度学习 强化学习 蒙特卡罗树搜索 AlphaZero 军事决策智能化 人工智能
在线阅读 下载PDF
并行计算在机动飞行轨迹生成中的应用
8
作者 蒋超 王维嘉 王昊 《兵工自动化》 2020年第8期25-31,36,共8页
针对现有通用机动轨迹需要较长的预规划时间,无法在机载计算平台实时解算的问题,提出一种利用并行计算的方式对通用机动框架进行加速的方法。对现有的MCTS算法叶子节点并行、根节点并行和树并行方式进行分析,结合叶子节点并行和根节点... 针对现有通用机动轨迹需要较长的预规划时间,无法在机载计算平台实时解算的问题,提出一种利用并行计算的方式对通用机动框架进行加速的方法。对现有的MCTS算法叶子节点并行、根节点并行和树并行方式进行分析,结合叶子节点并行和根节点并行方式各自的优点,对每棵搜索树采用叶子节点并行方法,分别利用Pthread和CUDA对并行通用机动框架进行加速,并以筋斗机动为例对加速效果进行测试。实验结果表明:并行通用机动框架不仅性能优于串行框架,而且可大幅缩短机动解算时间。 展开更多
关键词 并行计算 蒙特卡罗树搜索算法 GPU 众核 通用机动框架
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部