期刊文献+
共找到61篇文章
< 1 2 4 >
每页显示 20 50 100
基于强化学习-蒙特卡洛树搜索的铁路线路优化
1
作者 王光辉 蒲浩 +3 位作者 宋陶然 李伟 张洪 胡光常 《铁道学报》 北大核心 2025年第5期102-110,共9页
铁路线路智能搜索方法是实现高效线路优化的关键。现有铁路线路优化方法强于局部计算,缺乏对后续未知及全局态势的感知能力,导致线路智能搜索算法出现“智能”不智的现象。为解决上述问题,提出一种用于铁路线路优化的强化学习-蒙特卡洛... 铁路线路智能搜索方法是实现高效线路优化的关键。现有铁路线路优化方法强于局部计算,缺乏对后续未知及全局态势的感知能力,导致线路智能搜索算法出现“智能”不智的现象。为解决上述问题,提出一种用于铁路线路优化的强化学习-蒙特卡洛树搜索(RL-MCTS)融合方法,构建一种蒙特卡洛树搜索线路优化框架,提出先广度优先-后深度优先的选择方法以权衡线路的全局与局部利益;为准确评估线路的全局利益,定制一种强化学习模拟方法,为RL-MCTS提供线路优化的大局观。将该方法应用于实际的铁路案例,相较于人工方案,RL-MCTS生成的优化线路方案工程造价降低8.2%,验证了本文提出方法的有效性。 展开更多
关键词 铁路线路优化 强化学习 蒙特卡洛搜索 时变选择方法 全局奖励评估
在线阅读 下载PDF
基于混合蒙特卡洛树搜索的电缆盘装箱方法
2
作者 肖泽远 林剑 《计算机集成制造系统》 北大核心 2025年第1期355-366,共12页
电缆盘装箱问题广泛存在于线缆企业的生产实际中,本质上属于带载重约束和正交旋转的多箱型二维装箱问题。针对电缆盘装箱问题,建立以装箱成本最小化为目标的混合整数规划模型,提出一种混合蒙特卡洛树搜索(HMCTS)算法。在蒙特卡洛树搜索... 电缆盘装箱问题广泛存在于线缆企业的生产实际中,本质上属于带载重约束和正交旋转的多箱型二维装箱问题。针对电缆盘装箱问题,建立以装箱成本最小化为目标的混合整数规划模型,提出一种混合蒙特卡洛树搜索(HMCTS)算法。在蒙特卡洛树搜索框架下,通过融入高效邻域搜索策略,寻找得到较优的箱子选择方案,并确定每个箱子中货物的装箱位置和方式。在此基础上,构建电缆盘装箱问题的松弛模型,有效降低算法的计算成本。基于线缆企业生产实际中6种不同规模的数据集,对HMCTS算法进行仿真实验和对比分析,结果表明所提算法在求解电缆盘装箱问题中具有较高的有效性和鲁棒性。 展开更多
关键词 蒙特卡洛搜索 混合整数规划模型 松弛模型 电缆盘装箱问题 多箱型
在线阅读 下载PDF
基于大语言模型蒙特卡洛树搜索的智算网络故障根因分析系统
3
作者 罗子秋 苗宇铠 李丹 《中兴通讯技术》 北大核心 2025年第2期21-30,共10页
提出了一种基于大语言模型(LLM)进行蒙特卡洛树搜索的智算网络故障根因分析系统(RCA-MCTS)。利用LLM推理研究领域在蒙特卡洛树搜索上的前沿研究,面向智算网络复杂故障场景,设计了适用于故障根因分析任务的多策略提示语扩展机制,并基于... 提出了一种基于大语言模型(LLM)进行蒙特卡洛树搜索的智算网络故障根因分析系统(RCA-MCTS)。利用LLM推理研究领域在蒙特卡洛树搜索上的前沿研究,面向智算网络复杂故障场景,设计了适用于故障根因分析任务的多策略提示语扩展机制,并基于与故障模拟环境交互反馈的方式设计了模拟机制,使得LLM推理时的蒙特卡洛树搜索过程适配于故障根因分析任务场景。实验表明,RCA-MCTS在故障根因分析任务准确率上提升33%~43%,在故障推理动作序列平均匹配度上提升18%~34%。 展开更多
关键词 智算网络 故障根因分析 大语言模型 蒙特卡洛搜索
在线阅读 下载PDF
六足机器人双向并行蒙特卡洛树搜索步态规划
4
作者 胡立坤 刘恒佳 +2 位作者 王一飞 徐大也 王小勇 《控制理论与应用》 EI CAS CSCD 北大核心 2024年第12期2345-2355,共11页
为了解决稀疏立足点地形中六足机器人步态规划问题,本文提高规划时间效率、通过能力、抵达精度和运动速度,提出了一种双向并行蒙特卡洛树搜索算法(BPMCTS).将步态规划问题转化成马尔科夫序列优化过程,构建相向并行拓展蒙特卡洛树结构,... 为了解决稀疏立足点地形中六足机器人步态规划问题,本文提高规划时间效率、通过能力、抵达精度和运动速度,提出了一种双向并行蒙特卡洛树搜索算法(BPMCTS).将步态规划问题转化成马尔科夫序列优化过程,构建相向并行拓展蒙特卡洛树结构,搜索最佳立足位置形成步态序列;在模拟阶段搜索过程采用深度根并行化模拟方式,提高算法收敛速度;在奖励评估机制引入相遇评估指标,增强算法拓展导向性.仿真对比实验结果表明,所提算法规划时间效率提高46.9%,机器人通过能力提高7.7%,抵达精度提高32.6%,运动速度提高16.8%,验证了所提算法的可行性和优势性. 展开更多
关键词 六足机器人 步态规划 强化学习 蒙特卡洛搜索
在线阅读 下载PDF
维护全局博弈图的蒙特卡洛图搜索
5
作者 徐长明 周其磊 +3 位作者 王一川 王栋年 金张根 王军伟 《重庆理工大学学报(自然科学)》 CAS 北大核心 2024年第5期130-136,共7页
AlphaGo系列算法利用具备学习价值神经网络和策略神经网络主导蒙特卡洛树搜索的方法,成功地推动了棋类游戏人工智能的迅速发展。而最近,已有成果表明采用蒙特卡洛图搜索替代蒙特卡洛树搜索能够进一步提高程序的对弈水平。在此基础上,提... AlphaGo系列算法利用具备学习价值神经网络和策略神经网络主导蒙特卡洛树搜索的方法,成功地推动了棋类游戏人工智能的迅速发展。而最近,已有成果表明采用蒙特卡洛图搜索替代蒙特卡洛树搜索能够进一步提高程序的对弈水平。在此基础上,提出了一种新的基于蒙特卡洛图搜索的方法——维护全局博弈图的蒙特卡洛图搜索算法。该方法通过维护一个全局的博弈图,采用过期结点删除算法清除无价值的结点和边,并利用对手的时间进行推理计算等措施,提高了程序的博弈水平。以海克斯棋为实验对象,结果证明,在计算资源受限情况下相比其他搜索算法胜率有所提升。 展开更多
关键词 AlphaGo系列算法 计算机博弈 蒙特卡洛搜索 计算资源
在线阅读 下载PDF
蒙特卡洛树搜索下的整合多目标可持续闭环供应链网络优化 被引量:12
6
作者 邱云飞 于智龙 +2 位作者 郭羽含 刘雨诗 吕爽 《计算机集成制造系统》 EI CSCD 北大核心 2022年第1期269-293,共25页
针对现有可持续供应链网络中指标陈旧,且未能充分利用最新可持续指标对网络进行准确衡量与优化的问题,基于《CITI评价指南7.0》,提出一种将经济成本、合规整改与节能减排、绿色供应链、推动公众绿色选择、供应链沟通与透明5项指标进行... 针对现有可持续供应链网络中指标陈旧,且未能充分利用最新可持续指标对网络进行准确衡量与优化的问题,基于《CITI评价指南7.0》,提出一种将经济成本、合规整改与节能减排、绿色供应链、推动公众绿色选择、供应链沟通与透明5项指标进行层次分析加权整合的五位一体可持续闭环供应链网络模型,并设计了一种采用蒙特卡洛树搜索改进的分支定界算法MCTS_BB进行高效求解。首先,对5项指标按相互关联影响及隶属度关系进行归一化并构造多目标决策矩阵。然后,使用决策矩阵中最大特征值对应的特征向量对多目标函数进行线性组合,建立混合整数线性规划模型。最后,通过MCTS_BB中的分支选择、随机模拟搜索和剪枝策略求解模型。通过不同规模算例验证了模型和算法的有效性,实验结果表明,五位一体模型实现了多目标函数间的有效最优平衡,为各层级决策者对模型指标与参数进行统筹管理提供决策指导。 展开更多
关键词 可持续供应链 组合优化 蒙特卡洛搜索 分支定界
在线阅读 下载PDF
基于蒙特卡洛树搜索的符号回归算法 被引量:3
7
作者 鲁强 张洋 《计算机工程与设计》 北大核心 2020年第8期2158-2164,共7页
为克服符号回归问题经典算法具有搜索时间过长和容易陷入局部最优的缺点,提出一种基于蒙特卡洛树搜索的符号回归算法。将符号空间划分为模型空间和系数空间;在深度策略网络指导下通过蒙特卡洛树搜索实现在模型空间内寻找合适数据集特征... 为克服符号回归问题经典算法具有搜索时间过长和容易陷入局部最优的缺点,提出一种基于蒙特卡洛树搜索的符号回归算法。将符号空间划分为模型空间和系数空间;在深度策略网络指导下通过蒙特卡洛树搜索实现在模型空间内寻找合适数据集特征的公式模型;在此基础上,使用粒子群算法搜索公式模型下的系数空间,得到适应度最高的公式。实验结果表明,与GP算法相比,该算法具有适应度值更低、不易陷入局部最优的特点。 展开更多
关键词 符号回归 深度策略网络 蒙特卡洛搜索 粒子群算法 卷积神经网络 循环神经网络
在线阅读 下载PDF
基于蒙特卡洛树搜索的视频异常场景监测方法 被引量:3
8
作者 付燕 李珍珍 叶鸥 《现代电子技术》 2023年第2期96-100,共5页
通过视频监控可以更快速地发现异常场景,并尽快制止违法暴力行动。为保证监测精度,文中设计一种基于蒙特卡洛树搜索的视频异常场景监测方法。首先对行人轨迹特征进行提取,计算目标预测位置与实际位置的空间距离,判定二者的相对位置,建... 通过视频监控可以更快速地发现异常场景,并尽快制止违法暴力行动。为保证监测精度,文中设计一种基于蒙特卡洛树搜索的视频异常场景监测方法。首先对行人轨迹特征进行提取,计算目标预测位置与实际位置的空间距离,判定二者的相对位置,建立三级异常图像;再基于蒙特卡洛树搜索算法设计行人行为判别方法,构建不确定判别网络,标记残差函数,对数据进行归一化处理,同时获得激活函数以及函数的输出值;最后,设计视频异常场景监测算法,基于协方差矩阵将多个判别结果汇总成一个整体,并以此得到监控视频内异常场景的监测结果。该方法能够通过目标提取得到视频内的异常目标。目标识别精度的测试结果表明,所提方法在简单场景与复杂场景内的AUC值分别为0.952和0.886,说明其监测精度较高,在简单场景与复杂场景下均可正常使用。 展开更多
关键词 视频监测 蒙特卡洛搜索 异常场景监测 异常行为判定 特征提取 数据处理 环境测试
在线阅读 下载PDF
基于蒙特卡洛树搜索方法的空战机动决策 被引量:15
9
作者 何旭 景小宁 冯超 《空军工程大学学报(自然科学版)》 CSCD 北大核心 2017年第5期36-41,共6页
针对空战中双方的机动决策问题,考虑角度、距离、速度变化以及高度优势函数,以赢取最大空战优势期望为目标,建立了空战双方机动决策模型,并引入蒙特卡洛树搜索方法进行求解,搜索策略采取极大极小搜索算法。针对双机对抗,通过仿真给出空... 针对空战中双方的机动决策问题,考虑角度、距离、速度变化以及高度优势函数,以赢取最大空战优势期望为目标,建立了空战双方机动决策模型,并引入蒙特卡洛树搜索方法进行求解,搜索策略采取极大极小搜索算法。针对双机对抗,通过仿真给出空战态势及空战优势变化曲线,结果表明:我机在整个空战过程中绝大部分是处于优势地位的,验证了使用蒙特卡洛树搜索方法进行空战机动决策的可行性,同时对算法的实时性进行了仿真,计算机动动作所用时间众数位于50~100ms区间内,达到了实时性要求。 展开更多
关键词 空战 机动决策 空战优势 蒙特卡洛搜索
在线阅读 下载PDF
基于蒙特卡洛树搜索方法的空战机动决策 被引量:6
10
作者 何旭 景小宁 冯超 《火力与指挥控制》 CSCD 北大核心 2018年第3期34-39,共6页
针对空战中双方的机动决策问题,考虑角度、距离、速度变化以及高度优势函数,以赢取最大空战优势期望为目标,建立空战双方机动决策模型,并引入蒙特卡洛树搜索方法进行求解,搜索策略采取极大极小搜索算法。针对双机对抗,通过仿真给出空战... 针对空战中双方的机动决策问题,考虑角度、距离、速度变化以及高度优势函数,以赢取最大空战优势期望为目标,建立空战双方机动决策模型,并引入蒙特卡洛树搜索方法进行求解,搜索策略采取极大极小搜索算法。针对双机对抗,通过仿真给出空战态势及空战优势变化曲线,结果表明我机在整个空战过程中绝大部分是处于优势地位的,验证了使用蒙特卡洛树搜索方法进行空战机动决策的可行性,同时对算法的实时性进行了仿真,结果表明算法计算机动动作所用时较短,达到了算法的实时性要求。 展开更多
关键词 空战 机动决策 空战优势 蒙特卡洛搜索
在线阅读 下载PDF
基于深度学习和蒙特卡洛树搜索的机组恢复在线决策 被引量:27
11
作者 孙润稼 刘玉田 《电力系统自动化》 EI CSCD 北大核心 2018年第14期40-47,共8页
针对大停电后电力系统初始状态和恢复过程中线路恢复状况的不确定性,提出一种基于深度学习和蒙特卡洛树搜索(MCTS)的机组恢复在线决策方法。采用一种深度学习算法——稀疏自动编码器(SAE)对自动生成的训练集进行训练,建立估值网络;根据... 针对大停电后电力系统初始状态和恢复过程中线路恢复状况的不确定性,提出一种基于深度学习和蒙特卡洛树搜索(MCTS)的机组恢复在线决策方法。采用一种深度学习算法——稀疏自动编码器(SAE)对自动生成的训练集进行训练,建立估值网络;根据系统状态,利用改进的上限置信区间(UCT)算法、支路修剪技术和估值网络对机组恢复措施进行MCTS;汇总并行的多次MCTS结果,以加权机组发电量为决策指标确定最终的恢复措施。以新英格兰10机39节点系统和山东西部电网为例验证了所提方法的可行性和有效性;相比于传统方法,所提方法能够获得具有较高鲁棒性的恢复方案,并有效应对机组恢复过程中的多种不确定性状况。 展开更多
关键词 电力系统恢复 机组恢复 深度学习 蒙特卡洛搜索 在线决策
在线阅读 下载PDF
双人博弈问题中的蒙特卡洛树搜索算法的改进 被引量:11
12
作者 季辉 丁泽军 《计算机科学》 CSCD 北大核心 2018年第1期140-143,共4页
蒙特卡洛树搜索(MCTS)是一种针对决策类博弈游戏,运用蒙特卡洛模拟方法进行评估博弈策略的启发式搜索算法。但是,在面对计算机围棋这种复杂的决策过程时,简单的蒙特卡洛树搜索过程往往由于计算量大,收敛速度非常慢。由于双人博弈游戏中... 蒙特卡洛树搜索(MCTS)是一种针对决策类博弈游戏,运用蒙特卡洛模拟方法进行评估博弈策略的启发式搜索算法。但是,在面对计算机围棋这种复杂的决策过程时,简单的蒙特卡洛树搜索过程往往由于计算量大,收敛速度非常慢。由于双人博弈游戏中的蒙特卡洛树搜索不能收敛于双人博弈的最佳决策策略,因此提出蒙特卡洛树搜索结合极大极小值算法的改进算法,使得搜索结果不会因为蒙特卡洛方法的随机性而失真。为了进一步提高复杂双人博弈游戏中搜索算法的计算效率,还结合了几种常见的剪枝策略。实验结果说明,所提算法显著改进了蒙特卡洛树搜索的准确性和效率。 展开更多
关键词 蒙特卡洛搜索 剪枝策略 双人博弈问题
在线阅读 下载PDF
基于手牌拆分的“斗地主”蒙特卡洛树搜索 被引量:5
13
作者 彭啟文 王以松 +2 位作者 于小民 刘满义 徐方婧 《南京师大学报(自然科学版)》 CAS CSCD 北大核心 2019年第3期107-114,共8页
“斗地主”是典型的多人合作非完全信息博弈,蒙特卡洛树搜索是求解博弈(围棋、国际象棋等)问题的重要工具.本文首先提出基于“斗地主”规则的手牌拆分算法,通过选择较小拆分以解决其动作空间较大问题;其次,通过蒙特卡洛抽样法,对“斗地... “斗地主”是典型的多人合作非完全信息博弈,蒙特卡洛树搜索是求解博弈(围棋、国际象棋等)问题的重要工具.本文首先提出基于“斗地主”规则的手牌拆分算法,通过选择较小拆分以解决其动作空间较大问题;其次,通过蒙特卡洛抽样法,对“斗地主”非完全合作博弈进行不断抽样模拟,在满足一定预设条件后,选择收益最佳的节点作为本次最佳决策.实验结果表明,基于手牌拆分的“斗地主”蒙特卡洛树搜索能较好地实现“斗地主”自动博弈. 展开更多
关键词 斗地主 计算机博弈 强化学习 蒙特卡洛搜索
在线阅读 下载PDF
面向多智能体博弈的并行蒙特卡洛树搜索算法研究 被引量:4
14
作者 管延霞 刘逊韵 +2 位作者 刘运韬 谢旻 徐新海 《计算机工程与科学》 CSCD 北大核心 2022年第12期2128-2133,共6页
蒙特卡洛树搜索算法是一种常用的强化学习算法,博弈过程中动态空间的指数级增长是制约该算法学习效率的因素。基于并行方法对蒙特卡洛树搜索算法进行优化,提出基于胜率估值传递的并行蒙特卡洛树搜索算法。改进后的并行博弈搜索策略框架... 蒙特卡洛树搜索算法是一种常用的强化学习算法,博弈过程中动态空间的指数级增长是制约该算法学习效率的因素。基于并行方法对蒙特卡洛树搜索算法进行优化,提出基于胜率估值传递的并行蒙特卡洛树搜索算法。改进后的并行博弈搜索策略框架包含一个主进程和多个子进程,其中子进程用于探索,主进程根据子进程传递的胜率估值数据进行决策。结合多智能体博弈平台Pommerman进行实验验证,与传统的蒙特卡罗树搜索算法相比,并行蒙特卡罗树搜索算法有效提高了资源利用率、博弈胜率及决策效率。 展开更多
关键词 多智能体博弈 Pommerman 多进程 并行蒙特卡洛搜索
在线阅读 下载PDF
基于改进蒙特卡洛树搜索的无人机目标分配与突防决策方法 被引量:2
15
作者 熊韫文 魏才盛 +2 位作者 许丹 周亮 薛晓鹏 《中南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2023年第8期3132-3144,共13页
针对多无人机任务规划问题,在多种约束与机动动作下,进行目标分配和突防决策统一建模与优化求解方法研究。首先,基于无人机自身优势、目标威胁以及突防概率分别建立目标分配优化函数和突防决策优化函数;然后,利用线性加权法将两者融合,... 针对多无人机任务规划问题,在多种约束与机动动作下,进行目标分配和突防决策统一建模与优化求解方法研究。首先,基于无人机自身优势、目标威胁以及突防概率分别建立目标分配优化函数和突防决策优化函数;然后,利用线性加权法将两者融合,形成多无人机协同任务规划统一目标函数;其次,在强化学习框架下,分阶段构建协同任务规划的状态空间和动作空间,并根据统一目标函数设计奖励函数;提出一种改进的蒙特卡洛树搜索强化学习算法,在统一目标函数最大收益下实现对无人机目标分配和突防决策问题的求解;最后,通过对比仿真实验验证所提出的方法的时效性和最优性。研究结果表明:相较于传统方法,所提出的方法在提升收敛程度的同时,将训练时间减少了15%。 展开更多
关键词 无人机任务规划 目标分配 多阶段决策 蒙特卡洛搜索
在线阅读 下载PDF
给定预算下基于相对熵置信区间的蒙特卡洛树搜索最优动作识别算法 被引量:2
16
作者 刘郭庆 钱宇华 +1 位作者 张亚宇 王婕婷 《计算机研究与发展》 EI CSCD 北大核心 2023年第8期1780-1794,共15页
蒙特卡洛树搜索(Monte Carlo tree search, MCTS)将强化学习的反馈优化与生长树的动态规划相结合,在输出当前状态的最佳动作的同时极大地减少了计算量,因此成为开放环境下众多领域智能系统的关键通用方法.但由于计算资源匮乏或者计算成... 蒙特卡洛树搜索(Monte Carlo tree search, MCTS)将强化学习的反馈优化与生长树的动态规划相结合,在输出当前状态的最佳动作的同时极大地减少了计算量,因此成为开放环境下众多领域智能系统的关键通用方法.但由于计算资源匮乏或者计算成本昂贵等原因,完全充分地对树结构进行搜索是难以实现的,因此在有限的预算下高效合理地分配计算资源从而获得当前状态下的最优动作是目前研究的一个重要问题.现有大多数算法仅以识别准确率作为性能指标,通过实验对比验证算法性能,缺少对算法的识别误差和影响因素的分析,从而降低了算法的可信性和可解释性.针对该问题,选择基础核心的2名玩家、完全信息、零和博弈场景,提出了固定预算设定下MCTS抽象模型的最优行动识别算法DLU——基于相对熵置信区间的纯探索(relative entropy confidence interval based pure exploration).首先提出了基于相对熵置信区间的估值方法对叶子节点胜率进行估计,其可以从底层提高树节点估值准确性;其次给出了第1层节点值估计、最优节点选择策略以形成完整算法流程;然后推导了DLU算法的识别误差上界,并分析了算法性能的影响因素;最后在人造树模型和井字棋2种场景下验证算法性能.实验结果表明,在人造树模型上基于相对熵的算法类具有更高的准确度,且模型越复杂识别难度越高时,该算法类的性能优势越显著.在井字棋场景下,DLU算法能有效地识别最优动作. 展开更多
关键词 蒙特卡洛搜索 最优动作识别 多臂赌博机 误差最小化 强化学习
在线阅读 下载PDF
基于蒙特卡洛树搜索的全域指挥控制协同 被引量:3
17
作者 许珺怡 季明 +1 位作者 郭域峰 李乐 《指挥与控制学报》 CSCD 2022年第1期37-43,共7页
面向未来全域联合作战概念下的智能化指挥控制协同需求,重点研究针对具体作战任务的作战单元协同,通过利用复杂网络建模方法,构建指挥控制协同网络模型,并设计3种指挥控制协同模式.在此基础上,借鉴强化学习思想,提出基于蒙特卡洛树搜索... 面向未来全域联合作战概念下的智能化指挥控制协同需求,重点研究针对具体作战任务的作战单元协同,通过利用复杂网络建模方法,构建指挥控制协同网络模型,并设计3种指挥控制协同模式.在此基础上,借鉴强化学习思想,提出基于蒙特卡洛树搜索的指挥控制协同算法,来实现指挥控制协同决策过程的最佳策略选择,最终生成面向具体任务的最优作战簇,降低指挥控制协同网络的搜索代价,提高全域指挥控制协同的智能化水平.以联合反舰作战为背景,通过仿真实验,构建不同指挥控制协同模式下的指挥控制协同网络,并验证基于蒙特卡洛树搜索的指挥控制协同算法的有效性. 展开更多
关键词 全域联合作战 指挥控制协同 蒙特卡洛搜索 网络建模
在线阅读 下载PDF
基于蒙特卡洛树搜索的电缆线径控制 被引量:1
18
作者 周克良 洪智慧 胡梁眉 《计算机工程与设计》 北大核心 2019年第8期2389-2395,共7页
针对具有滞后特性的线径控制系统,提出一种基于蒙特卡洛树搜索(MCTS)的线径控制器。采用改进型最小二乘法对线径控制系统的输入输出数据进行拟合得到预测模型,在此基础上,利用蒙特卡洛树搜索算法对系统进行寻优控制。将该控制器与传统... 针对具有滞后特性的线径控制系统,提出一种基于蒙特卡洛树搜索(MCTS)的线径控制器。采用改进型最小二乘法对线径控制系统的输入输出数据进行拟合得到预测模型,在此基础上,利用蒙特卡洛树搜索算法对系统进行寻优控制。将该控制器与传统控制器(PID、模糊PID和动态矩阵)进行仿真对比实验,实验结果表明,该控制器在牺牲一定训练学习时间的代价下,控制效果明显优于传统控制器。采用该控制器的线径控制系统,响应速度和收敛速度更快,几乎没有超调,有一定的实用性。 展开更多
关键词 滞后特性 线径控制 蒙特卡洛搜索 改进型最小二乘法 拟合预测 寻优控制
在线阅读 下载PDF
基于蒙特卡洛树搜索算法实现轨道交通车辆多功能车辆总线周期调度表优化 被引量:1
19
作者 耿力 耿强 《城市轨道交通研究》 北大核心 2023年第11期70-75,共6页
目的:为改善轨道车辆MVB(多功能车辆总线)周期调度表的负载均衡度,提高MVB带宽利用率和车辆的通信系统实时性,需要对MVB周期调度表进行优化。方法:简述了MVB周期信息通信原理,明确了MVB调度表的2个约束条件,建立将MCTS(蒙特卡洛树搜索)... 目的:为改善轨道车辆MVB(多功能车辆总线)周期调度表的负载均衡度,提高MVB带宽利用率和车辆的通信系统实时性,需要对MVB周期调度表进行优化。方法:简述了MVB周期信息通信原理,明确了MVB调度表的2个约束条件,建立将MCTS(蒙特卡洛树搜索)算法应用于MVB调度表优化的理论方法,并通过Python软件编程实现该算法。明确了MCTS算法的优化目标,结合MVB调度表的约束条件设计了优化MCTS算法的预剪枝策略。选取了RMS(单调速率调度)算法、MCTS算法和GA(遗传算法)三种算法进行仿真试验,并对各算法的结果进行对比分析。结果及结论:优化后的MCTS算法有效避免了大量无效的搜索,搜索效率非常高。与RMS算法、GA相比,优化后的MCTS算法能在相同的搜索时间内获得更均衡的解。如果车辆通信设备增加,需要生成包含更多变量的调度表时,MCTS算法更能凸显其搜索优势。 展开更多
关键词 轨道车辆 多功能车辆总线 周期调度表 蒙特卡洛搜索算法 强化学习
在线阅读 下载PDF
基于蒙特卡洛树搜索的智能天车倒垛优化方法
20
作者 董砚 康学斌 +1 位作者 雷兆明 卢禹 《高技术通讯》 CAS 2021年第7期705-712,共8页
智能天车倒垛优化是提高钢卷库堆场利用率的重要手段,同时对提升钢铁仓库物流效率具有重要意义。针对该问题,建立最小倒垛次数为目标的天车作业负荷数学模型。在对模型求解过程中,借鉴了Alpha Go-Zero中树搜索方法,设计了蒙特卡洛钢卷... 智能天车倒垛优化是提高钢卷库堆场利用率的重要手段,同时对提升钢铁仓库物流效率具有重要意义。针对该问题,建立最小倒垛次数为目标的天车作业负荷数学模型。在对模型求解过程中,借鉴了Alpha Go-Zero中树搜索方法,设计了蒙特卡洛钢卷搜索树(MCRST)。为了提升搜索树的收敛速度和结果的准确性,将树的置信度上界(UCT)改为快速动作值估计(RAVE),同时引入绝对剪枝策略避免节点盲目扩展。通过不同规模算例实验,将改进算法与原树搜索和粒子群算法(PSO)进行比较,证明了该算法在大规模问题上的优越性;同时该算法也考虑了订单钢卷出库顺序和出库量等因素,验证了算法的适用性。 展开更多
关键词 钢卷库 倒垛 天车作业 蒙特卡洛搜索(MCTS) 出库任务
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部