期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
基于蒙特卡罗树搜索-强化学习的列车运行智能调整方法 被引量:6
1
作者 王荣笙 张琦 +2 位作者 张涛 王涛 丁舒忻 《中国铁道科学》 EI CAS CSCD 北大核心 2022年第5期146-156,共11页
为提升突发事件下高速铁路应急处置效率,以列车运行图为研究对象,提出晚点场景下蒙特卡罗树搜索-强化学习(MCTS-RL)的列车运行智能调整方法,包括MCTS-RL的列车运行智能调整离线训练模型、强化学习方法、MCTS的发车次序决策方法和冲突消... 为提升突发事件下高速铁路应急处置效率,以列车运行图为研究对象,提出晚点场景下蒙特卡罗树搜索-强化学习(MCTS-RL)的列车运行智能调整方法,包括MCTS-RL的列车运行智能调整离线训练模型、强化学习方法、MCTS的发车次序决策方法和冲突消解启发式规则。基于高速铁路列车运行调整数学模型构建强化学习环境,包括状态集、动作集、状态转移概率和奖励函数。先设计启发式规则,生成可行发车次序,作为蒙特卡罗树搜索博弈树结构的节点,应用MCTS输出列车运行调整的最优发车次序。之后再设计启发式规则,消解列车在车站和区间的运行冲突。以线路上列车总晚点时间最短为目标函数,基于MCTS-RL一次性离线训练生成在线调整模型,用于实时调整各次列车在各个车站的发车次序。以京沪高速铁路北京南—泰安段为例,设置到站晚点和发车晚点场景,分别应用先到先服务、CPLEX求解器和MCTS-RL方法进行求解。结果表明:与CPLEX求解器下的方案相比,MCTS-RL方法能在0.001 s内给出同样最优的列车运行调整方案。 展开更多
关键词 高速铁路 列车运行调整 人工智能 强化学习 蒙特卡罗搜索
在线阅读 下载PDF
基于蒙特卡罗树搜索的多载具自动化存取系统优化算法
2
作者 陈俭新 宁蒙 +2 位作者 黄予洛 张蕾 赵新灿 《舰船科学技术》 北大核心 2022年第8期169-173,共5页
针对某型多载具自动化存取系统优化分配问题,分析该自动化存取系统的运行特点,建立了该自动化存取系统优化问题的马尔科夫决策过程模型,并提出了求解模型的基于改进蒙特卡罗树搜索算法。首先,以总搬运量和同类型货箱距离最小为目标建立... 针对某型多载具自动化存取系统优化分配问题,分析该自动化存取系统的运行特点,建立了该自动化存取系统优化问题的马尔科夫决策过程模型,并提出了求解模型的基于改进蒙特卡罗树搜索算法。首先,以总搬运量和同类型货箱距离最小为目标建立货位优化模型,为了更好控制蒙特卡罗树搜索分支合理性,对算法节点选择部分进行优化。最后,对改进的蒙特卡罗树搜索算法进行货位优化及对比测试。实验结果表明:改进的蒙特卡罗树搜索算法较采用贪心思想、采用魔方还原思想以及基于传统蒙特卡罗树搜索的算法在货位优化运行效果上更优。 展开更多
关键词 多载具自动化存取系统 马尔科夫模型 蒙特卡罗搜索
在线阅读 下载PDF
混合蒙特卡罗搜索的特征选择算法的优化 被引量:1
3
作者 刘云 肖雪 黄荣乘 《信息技术》 2020年第5期28-31,36,共5页
特征选择是机器学习和数据挖掘中处理高维数据的初步步骤,通过消除冗余或不相关的特征来识别数据集中最重要和最相关的特征,从而提高分类精度和降低计算复杂度。文中提出混合蒙特卡罗树搜索特征选择算法(HMCTS),首先,根据蒙特卡罗树搜... 特征选择是机器学习和数据挖掘中处理高维数据的初步步骤,通过消除冗余或不相关的特征来识别数据集中最重要和最相关的特征,从而提高分类精度和降低计算复杂度。文中提出混合蒙特卡罗树搜索特征选择算法(HMCTS),首先,根据蒙特卡罗树搜索方法迭代生成一个初始特征子集,利用ReliefF算法过滤选择前k个特征形成候选特征子集;然后,利用KNN分类器的分类精度评估候选特征,通过反向传播将模拟结果更新到迭代路径上所有选择的节点;最后,选择高精度的候选特征作为最佳特征子集。仿真结果表明,对比HPSO-LS和MOTiFS算法,HMCTS算法具有良好的可扩展性,且分类精度高。 展开更多
关键词 高维数据 特征选择 相关特征 蒙特卡罗搜索 可扩展性
在线阅读 下载PDF
基于蒙特卡洛树搜索的智能天车倒垛优化方法
4
作者 董砚 康学斌 +1 位作者 雷兆明 卢禹 《高技术通讯》 CAS 2021年第7期705-712,共8页
智能天车倒垛优化是提高钢卷库堆场利用率的重要手段,同时对提升钢铁仓库物流效率具有重要意义。针对该问题,建立最小倒垛次数为目标的天车作业负荷数学模型。在对模型求解过程中,借鉴了Alpha Go-Zero中树搜索方法,设计了蒙特卡洛钢卷... 智能天车倒垛优化是提高钢卷库堆场利用率的重要手段,同时对提升钢铁仓库物流效率具有重要意义。针对该问题,建立最小倒垛次数为目标的天车作业负荷数学模型。在对模型求解过程中,借鉴了Alpha Go-Zero中树搜索方法,设计了蒙特卡洛钢卷搜索树(MCRST)。为了提升搜索树的收敛速度和结果的准确性,将树的置信度上界(UCT)改为快速动作值估计(RAVE),同时引入绝对剪枝策略避免节点盲目扩展。通过不同规模算例实验,将改进算法与原树搜索和粒子群算法(PSO)进行比较,证明了该算法在大规模问题上的优越性;同时该算法也考虑了订单钢卷出库顺序和出库量等因素,验证了算法的适用性。 展开更多
关键词 钢卷库 倒垛 天车作业 蒙特卡洛搜索(mcts) 出库任务
在线阅读 下载PDF
基于MCTS-RAVE的智能博弈 被引量:1
5
作者 芮雄星 王一莉 《江南大学学报(自然科学版)》 CAS 2011年第2期175-178,共4页
针对蒙特卡罗树搜索(MCTS)算法对蒙特卡罗模拟次数的依赖性较强,为获得较高智能必须进行多次模拟的情况,提出了结合在线强化学习知识以减少MCTS算法对蒙特卡罗模拟次数的依赖,在搜索过程中积累强化学习知识,并快速对动作值作出估计。实... 针对蒙特卡罗树搜索(MCTS)算法对蒙特卡罗模拟次数的依赖性较强,为获得较高智能必须进行多次模拟的情况,提出了结合在线强化学习知识以减少MCTS算法对蒙特卡罗模拟次数的依赖,在搜索过程中积累强化学习知识,并快速对动作值作出估计。实例表明,该种方法较MCTS具有更高的智能表现,并有一定的实用价值。 展开更多
关键词 博弈搜索 蒙特卡罗搜索 快速动作值估计
在线阅读 下载PDF
考虑综合性能最优的非短视快速天基雷达多目标跟踪资源调度算法
6
作者 王增福 杨广宇 金术玲 《雷达学报(中英文)》 EI CSCD 北大核心 2024年第1期253-269,共17页
合理有效的资源调度是天基雷达效能得以充分发挥的关键。针对天基雷达多目标跟踪资源调度问题,建立了综合考虑目标威胁度、跟踪精度与低截获概率(LPI)的代价函数;考虑目标的不确定、天基平台约束以及长远期期望代价,建立了多约束下的基... 合理有效的资源调度是天基雷达效能得以充分发挥的关键。针对天基雷达多目标跟踪资源调度问题,建立了综合考虑目标威胁度、跟踪精度与低截获概率(LPI)的代价函数;考虑目标的不确定、天基平台约束以及长远期期望代价,建立了多约束下的基于部分可观测的马尔可夫决策过程(POMDP)的资源调度模型;采用拉格朗日松弛法将多约束下的多目标跟踪资源调度问题转换分解为多个无约束的子问题;针对连续状态空间、连续动作空间及连续观测空间引起的维数灾难问题,采用基于蒙特卡罗树搜索(MCTS)的在线POMDP算法—POMCPOW算法进行求解,最终提出了一种综合多指标性能的非短视快速天基雷达多目标跟踪资源调度算法。仿真表明,与已有调度算法相比,所提算法资源分配更合理,系统性能更优。 展开更多
关键词 天基雷达 资源调度 多目标跟踪 部分可观测的马尔可夫决策过程 蒙特卡罗搜索(mcts)
在线阅读 下载PDF
空战机动飞行轨迹生成与控制 被引量:4
7
作者 刘佩 王维嘉 +1 位作者 陈向 朱雪耀 《兵工自动化》 2018年第11期76-80,96,共6页
针对依赖于标准机动动作库或者驾驶员经验的机动控制问题,提出一种基于蒙特卡罗树搜索算法生成机动轨迹的方法,只需给定目标机动动作的初始和终止状态,通过反复搜索即可得到达成机动目标的操作序列;并设计前馈加反馈的复合控制器来提高... 针对依赖于标准机动动作库或者驾驶员经验的机动控制问题,提出一种基于蒙特卡罗树搜索算法生成机动轨迹的方法,只需给定目标机动动作的初始和终止状态,通过反复搜索即可得到达成机动目标的操作序列;并设计前馈加反馈的复合控制器来提高轨迹跟踪的效果。实验以筋斗机动为例进行验证,仿真结果表明:得到的筋斗参考轨迹各项指标均接近职业战斗机飞行员的最佳表现;同时与传统的PID控制器进行对比,证明了复合控制器能显著提高筋斗轨迹的跟踪效果,为解决机动控制问题提出了一种有效的解决方案。 展开更多
关键词 机动飞行控制 强化学习 蒙特卡罗搜索 复合控制
在线阅读 下载PDF
基于边装边卸工艺的集装箱船配载决策 被引量:1
8
作者 金健 宓为建 夏孟珏 《上海海事大学学报》 北大核心 2019年第3期6-13,共8页
针对超大型集装箱船边装边卸(dual cycling,DC)工艺下的配载问题,以DC工艺下集装箱船舱内配载规划为研究对象,构建以最小化场内翻箱数、设备移动次数等为目标的配载模型,并提出一种可行的蒙特卡洛树搜索(Monte Carlo tree search,MCTS)... 针对超大型集装箱船边装边卸(dual cycling,DC)工艺下的配载问题,以DC工艺下集装箱船舱内配载规划为研究对象,构建以最小化场内翻箱数、设备移动次数等为目标的配载模型,并提出一种可行的蒙特卡洛树搜索(Monte Carlo tree search,MCTS)算法对该模型进行求解。通过实际算例证明了模型和算法的有效性,且本研究的相关成果已应用于码头实际生产,应用效果良好。本研究思路对集装箱码头相关计划调度研究及实现有借鉴意义。 展开更多
关键词 集装箱码头 船舶配载规划 边装边卸工艺 蒙特卡洛搜索(mcts)
在线阅读 下载PDF
AlphaZero原理与启示 被引量:8
9
作者 唐川 陶业荣 麻曰亮 《航空兵器》 CSCD 北大核心 2020年第3期27-36,共10页
近几年,计算机围棋成功引发了又一轮的人工智能热潮,从计算机围棋中发展出来的AlphaZero框架成功地应用在其他完全信息条件下的二人有限零和博弈问题,进而展示出了深度学习和强化学习在智能决策领域的优异性能。本文首先介绍了AlphaZer... 近几年,计算机围棋成功引发了又一轮的人工智能热潮,从计算机围棋中发展出来的AlphaZero框架成功地应用在其他完全信息条件下的二人有限零和博弈问题,进而展示出了深度学习和强化学习在智能决策领域的优异性能。本文首先介绍了AlphaZero框架中三个核心技术:深度学习、强化学习以及蒙特卡罗树搜索,然后详细说明了AlphaZero框架两个关键阶段——AlphaGo和AlphaGo Zero的基本原理,最后,对AlphaZero框架提出了自己的思考,并基于对AlphaZero原理的剖析讨论了其对军事决策智能化的启示。 展开更多
关键词 深度学习 强化学习 蒙特卡罗搜索 AlphaZero 军事决策智能化 人工智能
在线阅读 下载PDF
集装箱码头岸桥突发故障情况下装卸船作业重调度研究 被引量:3
10
作者 夏孟珏 史学鑫 李美贞 《上海海事大学学报》 北大核心 2022年第1期30-37,共8页
为解决在集装箱码头岸桥突发故障情况下装卸船作业的快速重调度问题,考虑故障岸桥对其他岸桥作业的时空约束,在满足作业安全和作业顺序的要求下,以最小化最大完工时间为目标,构建装卸船作业重调度序贯决策模型。为求解该模型,对基于离... 为解决在集装箱码头岸桥突发故障情况下装卸船作业的快速重调度问题,考虑故障岸桥对其他岸桥作业的时空约束,在满足作业安全和作业顺序的要求下,以最小化最大完工时间为目标,构建装卸船作业重调度序贯决策模型。为求解该模型,对基于离散事件仿真的蒙特卡洛树搜索(Monte Carlo tree search,MCTS)算法进行改进。仿真实验证明,提出的装卸船作业重调度方法有效,能够保证在岸桥突发故障情况下装卸船作业的有序进行。 展开更多
关键词 岸桥调度 不确定性 重调度 岸桥故障 蒙特卡洛搜索(mcts)算法
在线阅读 下载PDF
并行计算在机动飞行轨迹生成中的应用
11
作者 蒋超 王维嘉 王昊 《兵工自动化》 2020年第8期25-31,36,共8页
针对现有通用机动轨迹需要较长的预规划时间,无法在机载计算平台实时解算的问题,提出一种利用并行计算的方式对通用机动框架进行加速的方法。对现有的MCTS算法叶子节点并行、根节点并行和树并行方式进行分析,结合叶子节点并行和根节点... 针对现有通用机动轨迹需要较长的预规划时间,无法在机载计算平台实时解算的问题,提出一种利用并行计算的方式对通用机动框架进行加速的方法。对现有的MCTS算法叶子节点并行、根节点并行和树并行方式进行分析,结合叶子节点并行和根节点并行方式各自的优点,对每棵搜索树采用叶子节点并行方法,分别利用Pthread和CUDA对并行通用机动框架进行加速,并以筋斗机动为例对加速效果进行测试。实验结果表明:并行通用机动框架不仅性能优于串行框架,而且可大幅缩短机动解算时间。 展开更多
关键词 并行计算 蒙特卡罗搜索算法 GPU 众核 通用机动框架
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部