期刊文献+
共找到32篇文章
< 1 2 >
每页显示 20 50 100
基于DL-MCTS的超视距空战战术智能决策方法研究
1
作者 宋祺 左家亮 +3 位作者 张滢 闫孟达 吴傲 李乐言 《兵器装备工程学报》 北大核心 2025年第2期145-156,共12页
现有超视距空战智能决策研究多侧重于机动决策,而战术决策研究较少。针对机动决策难理解、战术决策难生成的问题,提出了一种融合深度学习(DL)和蒙特卡洛搜索(MCTS)的算法,通过构建空战智能体自主学习和决策框架,融合智能体的离线战术学... 现有超视距空战智能决策研究多侧重于机动决策,而战术决策研究较少。针对机动决策难理解、战术决策难生成的问题,提出了一种融合深度学习(DL)和蒙特卡洛搜索(MCTS)的算法,通过构建空战智能体自主学习和决策框架,融合智能体的离线战术学习和在线战术决策,实现了一种基于DL-MCTS的超视距空战战术决策方法。在离线学习阶段,利用神经网络学习先验战术规划数据集,包含感知数据集、策略数据集和评估数据集,并为智能体构建感知器、规划器和评估器3种功能模块。在实时对抗阶段,提出战术感知和决策双线并行处理模式,建立对抗博弈树。利用蒙特卡洛搜索方法融合智能体3种网络,在每个博弈节点上实现选择、扩展、仿真和信息回溯,实时搜索当前态势的最优策略。在迎头攻击任务实验中,离线训练后的智能体具备基本的决策能力,经过50次循环迭代搜索后,智能体能够消除对手的首发导弹优势,并逐步获取自身导弹发射条件。实验结果表明该战术决策方法的决策结果可解释性强、决策速度较满意。 展开更多
关键词 超视距空战 战术决策 智能决策 深度学习 蒙特卡洛树搜索
在线阅读 下载PDF
回合制轨道博弈中MCTS算法的改进与应用
2
作者 郑鑫宇 张轶 +3 位作者 周杰 唐佩佳 彭升人 党朝辉 《中国空间科学技术(中英文)》 CSCD 北大核心 2024年第5期75-82,共8页
航天器回合制追逃博弈中的变轨感知延迟使得微分对策法求解困难,基于深度强化学习的博弈算法可解释性弱,在工程上的运用仍存在风险。针对航天器回合制追逃博弈问题,提出了一种预测价值积累的蒙特卡洛树搜索(PVA-MCTS)算法。该算法基于... 航天器回合制追逃博弈中的变轨感知延迟使得微分对策法求解困难,基于深度强化学习的博弈算法可解释性弱,在工程上的运用仍存在风险。针对航天器回合制追逃博弈问题,提出了一种预测价值积累的蒙特卡洛树搜索(PVA-MCTS)算法。该算法基于航天器轨道运动的可预知性,对博弈过程中的决策价值进行预测并积累,解决了航天器回合制追逃博弈奖励稀疏、时间跨度大的问题,采用的自适应扩展方法提升了学习效率。将其用于求解航天器回合制追逃博弈问题,并与蒙特卡洛树搜索(MCTS)算法求解得到的结果对比,结果表明PVA-MCTS算法对追踪航天器和逃逸航天器分别有约27.6%的追捕用时缩短和约6.8%的逃逸时间延长。该算法的提出可加快推进后续轨道博弈技术在非合作目标接近、碰撞规避等领域应用的落实落地。 展开更多
关键词 航天器追逃 回合制追逃博弈 蒙特卡洛树搜索 变轨感知延迟 预测价值积累
在线阅读 下载PDF
异质交通流下高速公路CAV合流次序优化与轨迹规划方法
3
作者 程国柱 陈永胜 +1 位作者 王文志 徐亮 《北京交通大学学报》 北大核心 2025年第1期100-109,共10页
为提升高速公路合流区交通运行效率及驾乘人员舒适性,在保障安全的前提下,面向人工驾驶车辆(Human Driven Vehicles,HDV)和智能网联车辆(Connected and Autonomous Vehicles,CAV)混行的异质交通流环境,提出高速公路CAV合流次序优化与轨... 为提升高速公路合流区交通运行效率及驾乘人员舒适性,在保障安全的前提下,面向人工驾驶车辆(Human Driven Vehicles,HDV)和智能网联车辆(Connected and Autonomous Vehicles,CAV)混行的异质交通流环境,提出高速公路CAV合流次序优化与轨迹规划方法.首先,以车辆通行时间和延误作为合流区交通运行效率表征指标,建立合流次序优化函数,采用并调整蒙特卡洛树搜索(Monte Carlo Tree Search,MCTS)算法,获得最优合流次序;其次,依据合流次序,建立最小化加速度和急动度的CAV合流轨迹规划(Minimize Acceleration and Jerk Trajectory Planning,MAJTP)函数,运用最优控制理论,求解车辆纵向最优轨迹解析解,进而形成高速公路合流区CAV协同控制方法;最后,联合运用SUMO软件和PYTHON库,对本文所提方法进行交通仿真验证.仿真结果表明:在CAV渗透率分别为0.2、0.4、0.6和0.8时,相较于先进先出(First In First Out,FIFO)算法,基于MCTS算法的合流次序优化方法累积延误分别降低5.75%、8.84%、12.24%和11.06%;相较于最小化加速度的车辆轨迹规划(Minimize Acceleration Trajectory Planning,MATP)方法,MAJTP方法平均急动度更趋近于零,驾乘人员舒适性有所提升,验证了方法的有效性.研究成果可为高速公路合流区交通运行管控研究提供理论支持. 展开更多
关键词 交通工程 合流区 合流次序 轨迹规划 蒙特卡洛树搜索 最优控制
在线阅读 下载PDF
基于MCTS-HM的重型汽车多参数运行工况高效构建方法
4
作者 文继泽 张曼 +1 位作者 林楠 施树明 《汽车工程学报》 2022年第5期654-661,共8页
提出了一种基于蒙特卡洛树搜索(Monte Carlo Tree Search,MCTS)和启发式方法 (Heuristic Method,HM)的多参数运行工况高效构建方法。根据工况质量要求,选取表征行驶工况特征的速度、加速度和坡度参数相关指标,设计工况的目标函数;改进... 提出了一种基于蒙特卡洛树搜索(Monte Carlo Tree Search,MCTS)和启发式方法 (Heuristic Method,HM)的多参数运行工况高效构建方法。根据工况质量要求,选取表征行驶工况特征的速度、加速度和坡度参数相关指标,设计工况的目标函数;改进多个启发式方法,确保被作用后的工况序列仍可满足行驶工况动态转移特性;采用MCTS选择更适合的启发式方法,进而高效地收敛至多参数目标行驶工况。基于重型汽车实际采集的试验数据,多次分析结果表明,生成的多参数行驶工况所有特征指标相对偏差均可保持在设定阈值以内,表明生成工况与原始数据特征具备一致性;相比于纯随机启发式方法,该方法能快速构建多参数期望运行工况。 展开更多
关键词 重型车辆 道路坡度 运行工况 生成效率 蒙特卡洛树搜索 启法式方法
在线阅读 下载PDF
考虑综合性能最优的非短视快速天基雷达多目标跟踪资源调度算法
5
作者 王增福 杨广宇 金术玲 《雷达学报(中英文)》 EI CSCD 北大核心 2024年第1期253-269,共17页
合理有效的资源调度是天基雷达效能得以充分发挥的关键。针对天基雷达多目标跟踪资源调度问题,建立了综合考虑目标威胁度、跟踪精度与低截获概率(LPI)的代价函数;考虑目标的不确定、天基平台约束以及长远期期望代价,建立了多约束下的基... 合理有效的资源调度是天基雷达效能得以充分发挥的关键。针对天基雷达多目标跟踪资源调度问题,建立了综合考虑目标威胁度、跟踪精度与低截获概率(LPI)的代价函数;考虑目标的不确定、天基平台约束以及长远期期望代价,建立了多约束下的基于部分可观测的马尔可夫决策过程(POMDP)的资源调度模型;采用拉格朗日松弛法将多约束下的多目标跟踪资源调度问题转换分解为多个无约束的子问题;针对连续状态空间、连续动作空间及连续观测空间引起的维数灾难问题,采用基于蒙特卡罗树搜索(MCTS)的在线POMDP算法—POMCPOW算法进行求解,最终提出了一种综合多指标性能的非短视快速天基雷达多目标跟踪资源调度算法。仿真表明,与已有调度算法相比,所提算法资源分配更合理,系统性能更优。 展开更多
关键词 天基雷达 资源调度 多目标跟踪 部分可观测的马尔可夫决策过程 蒙特卡罗树搜索(mcts)
在线阅读 下载PDF
露天矿作业区无人矿车协同通行决策方法研究
6
作者 倪浩原 余贵珍 +3 位作者 李涵 陈鹏 刘喜 王文达 《交通运输系统工程与信息》 EI CSCD 北大核心 2024年第3期277-289,共13页
露天矿无人矿车在装卸载作业区内运输过程中的长时间停车等待是制约露天矿无人运输系统效率提升的瓶颈。为提高无人矿车的运输效率,本文结合作业区内的运输作业流程,提出一种基于动态可行驶距离的多车协同通行决策方法。首先,将决策模... 露天矿无人矿车在装卸载作业区内运输过程中的长时间停车等待是制约露天矿无人运输系统效率提升的瓶颈。为提高无人矿车的运输效率,本文结合作业区内的运输作业流程,提出一种基于动态可行驶距离的多车协同通行决策方法。首先,将决策模型建模为混合整数线性规划(Mixed Integer Linear Programming, MILP)模型,表述优化目标和问题约束;其次,考虑到求解MILP模型存在难以满足动态决策实时性的问题,基于蒙特卡洛树搜索(Monte Carlo Tree Search,MCTS)实现多车冲突消解,核心思想是利用搜索树的推演能力进行多车通行前瞻模拟,计算多车的最优通行优先级,动态调整多车的可行驶距离;此外,根据无人矿车在作业区内的作业特征设计不同的MCTS节点价值函数,实现综合考虑运输效率与作业特征的通行优先级排序;最后,设计作业区4,8,12个停车位场景下的多车通行仿真实验,与基于先到先服务(First-Come-FirstServed, FCFS)的方法进行对比,吞吐量提升22.03%~28.00%,平均停车等待时间缩短31.71%~50.79%。同时,搭建微缩智能车辆的6停车位作业区场景实验平台,多车单次运输作业总用时相比FCFS缩短了18.84%。仿真与微缩智能车辆的实验结果表明,本文提出的方法能够提升露天矿作业区多车运输效率。 展开更多
关键词 智能交通 协同通行决策 蒙特卡洛树搜索 无人矿车 动态可行驶距离 露天矿作业区
在线阅读 下载PDF
基于强化学习的新型列控系统区间行车间隔控制方法 被引量:4
7
作者 付文秀 李亚 +2 位作者 吕继东 李丹勇 李洋 《北京交通大学学报》 CAS CSCD 北大核心 2021年第5期63-73,共11页
列车间隔控制是保证列车运行安全和提高列车行车密度的关键.基于车-车通信的新型列控系统能够感知更多的列车运行环境信息,缩小列车行车间隔,提升列车运行效率.本文将列车速度控制视为一个决策过程,采用强化学习算法来实现新型列控系统... 列车间隔控制是保证列车运行安全和提高列车行车密度的关键.基于车-车通信的新型列控系统能够感知更多的列车运行环境信息,缩小列车行车间隔,提升列车运行效率.本文将列车速度控制视为一个决策过程,采用强化学习算法来实现新型列控系统中列车区间速度的实时控制.首先,结合车-车通信获得所处环境的列车状态信息,采用蒙特卡洛树搜索算法实时生成列车动态速度调整序列;然后,通过动态规划算法对序列进行分析处理,并在此基础上,确定列车当前时刻所应采取的速度控制策略;最后,仿真模拟了多车在不同初始条件下的列车间隔控制运行场景.仿真结果表明,在相同场景下强化学习算法对比模糊控制算法在行车间隔控制的响应速度、调节时间、总体波动以及超调量上具有一定的优势. 展开更多
关键词 新型列控系统 间隔控制 强化学习 蒙特卡洛树搜索算法 动态规划
在线阅读 下载PDF
未知环境下基于深度序列蒙特卡罗树搜索的信源导航方法 被引量:2
8
作者 段世红 何昊 +2 位作者 徐诚 殷楠 王然 《电子学报》 EI CAS CSCD 北大核心 2022年第7期1744-1752,共9页
信源导航在应急救援、工业巡检及其他危险作业中具有重要应用意义.在实际应用中,环境的状态信息往往是难以完全观测的,即部分可观测环境.如何利用观测到的部分环境信息做出实时决策,并基于历史序列信息对系统未来状态进行有效的预测,成... 信源导航在应急救援、工业巡检及其他危险作业中具有重要应用意义.在实际应用中,环境的状态信息往往是难以完全观测的,即部分可观测环境.如何利用观测到的部分环境信息做出实时决策,并基于历史序列信息对系统未来状态进行有效的预测,成为信源导航相关研究所面临的挑战性问题.本文提出一种基于深度序列蒙特卡洛树搜索(Deep Sequential Monte-Carlo Tree Search,DS-MCTS)的信源导航算法和系统框架,基于序列动作预测(Sequential Action Prediction,SAP)网络为MCTS决策提供先验知识,构建奖励分配预测(Reward Allocation Prediction,RAP)网络提高奖励分配精度,最终实现系统的最优化决策.仿真实验表明,DS-MCTS方法提供了一种端到端的信源导航解决方案,可以实现智能体动作的有效预测,实现高效、鲁棒的路径规划. 展开更多
关键词 信源导航 蒙特卡洛树搜索 序贯决策 路径规划 深度强化学习
在线阅读 下载PDF
基于序贯博弈多智能体强化学习的综合模块化航空电子系统重构方法 被引量:6
9
作者 张涛 张文涛 +3 位作者 代凌 陈婧怡 王丽 魏倩茹 《电子学报》 EI CAS CSCD 北大核心 2022年第4期954-966,共13页
动态重构是一种有效的综合模块化航空电子系统故障容错方法.重构蓝图定义了系统故障环境下的应用迁移与资源重配置方案,是以最小代价重构恢复系统功能的关键.在复杂多级关联故障模式下,如何快速自动生成有效重构蓝图是其难点.针对该问题... 动态重构是一种有效的综合模块化航空电子系统故障容错方法.重构蓝图定义了系统故障环境下的应用迁移与资源重配置方案,是以最小代价重构恢复系统功能的关键.在复杂多级关联故障模式下,如何快速自动生成有效重构蓝图是其难点.针对该问题,本文提出一种基于序贯博弈多智能体强化学习的综合模块化航空电子系统重构方法.该方法引入序贯博弈模型,将因受故障影响而需要迁移重构的应用软件定义为博弈中的智能体,根据应用软件优先级确定序贯博弈的顺序.针对序贯博弈过程中多智能体间竞争与合作的问题,算法使用强化学习中的策略梯度,通过控制与环境交互中的动作选择概率来优化重构效果.应用基于有偏估计的策略梯度蒙特卡洛树搜索算法更新博弈策略,解决了传统策略梯度算法震荡难收敛、计算耗时长问题.实验结果表明,与差分进化、Q学习等方法相比,所提算法的优化性能和稳定性均具有显著优势. 展开更多
关键词 综合模块化航空电子系统 序贯博弈 策略梯度 多智能体强化学习 蒙特卡洛树搜索 重构
在线阅读 下载PDF
基于蒙特卡洛树搜索的视频异常场景监测方法 被引量:2
10
作者 付燕 李珍珍 叶鸥 《现代电子技术》 2023年第2期96-100,共5页
通过视频监控可以更快速地发现异常场景,并尽快制止违法暴力行动。为保证监测精度,文中设计一种基于蒙特卡洛树搜索的视频异常场景监测方法。首先对行人轨迹特征进行提取,计算目标预测位置与实际位置的空间距离,判定二者的相对位置,建... 通过视频监控可以更快速地发现异常场景,并尽快制止违法暴力行动。为保证监测精度,文中设计一种基于蒙特卡洛树搜索的视频异常场景监测方法。首先对行人轨迹特征进行提取,计算目标预测位置与实际位置的空间距离,判定二者的相对位置,建立三级异常图像;再基于蒙特卡洛树搜索算法设计行人行为判别方法,构建不确定判别网络,标记残差函数,对数据进行归一化处理,同时获得激活函数以及函数的输出值;最后,设计视频异常场景监测算法,基于协方差矩阵将多个判别结果汇总成一个整体,并以此得到监控视频内异常场景的监测结果。该方法能够通过目标提取得到视频内的异常目标。目标识别精度的测试结果表明,所提方法在简单场景与复杂场景内的AUC值分别为0.952和0.886,说明其监测精度较高,在简单场景与复杂场景下均可正常使用。 展开更多
关键词 视频监测 蒙特卡洛树搜索 异常场景监测 异常行为判定 特征提取 数据处理 环境测试
在线阅读 下载PDF
一种基于随机游走的A~*算法
11
作者 刘浩翰 郭晶晶 +2 位作者 李建伏 冯梅 贺怀清 《中国民航大学学报》 CAS 2017年第6期61-64,共4页
针对A~*算法中出现的高原搜索现象,结合蒙特卡罗随机游走思想提出了一种基于随机游走的A~*算法。其基本思想是当A~*算法陷入高原搜索期时,通过随机游走策略及时找到一个节点逃离该高原搜索期。针对A~*算法何时陷入高原搜索期的问题提出... 针对A~*算法中出现的高原搜索现象,结合蒙特卡罗随机游走思想提出了一种基于随机游走的A~*算法。其基本思想是当A~*算法陷入高原搜索期时,通过随机游走策略及时找到一个节点逃离该高原搜索期。针对A~*算法何时陷入高原搜索期的问题提出了一种新的检测高原搜索期的方法,即当连续扩展n次节点的启发值都比上一次最后扩展出节点的启发值大时,则认为搜索陷入了高原搜索期。实验结果验证了该方法的有效性。 展开更多
关键词 最短路径 启发式搜索 A*算法 高原搜索 蒙特卡罗随机游走
在线阅读 下载PDF
空战机动飞行轨迹生成与控制 被引量:4
12
作者 刘佩 王维嘉 +1 位作者 陈向 朱雪耀 《兵工自动化》 2018年第11期76-80,96,共6页
针对依赖于标准机动动作库或者驾驶员经验的机动控制问题,提出一种基于蒙特卡罗树搜索算法生成机动轨迹的方法,只需给定目标机动动作的初始和终止状态,通过反复搜索即可得到达成机动目标的操作序列;并设计前馈加反馈的复合控制器来提高... 针对依赖于标准机动动作库或者驾驶员经验的机动控制问题,提出一种基于蒙特卡罗树搜索算法生成机动轨迹的方法,只需给定目标机动动作的初始和终止状态,通过反复搜索即可得到达成机动目标的操作序列;并设计前馈加反馈的复合控制器来提高轨迹跟踪的效果。实验以筋斗机动为例进行验证,仿真结果表明:得到的筋斗参考轨迹各项指标均接近职业战斗机飞行员的最佳表现;同时与传统的PID控制器进行对比,证明了复合控制器能显著提高筋斗轨迹的跟踪效果,为解决机动控制问题提出了一种有效的解决方案。 展开更多
关键词 机动飞行控制 强化学习 蒙特卡罗树搜索 复合控制
在线阅读 下载PDF
离岸集装箱码头新装卸工艺模式下陆域集疏运堆场堆存空间分配 被引量:2
13
作者 杨晓斌 余思勤 沈一帆 《上海海事大学学报》 北大核心 2020年第4期8-14,共7页
离岸集装箱码头因其岛屿面积限制,难以通过扩建码头内部堆场增加吞吐能力。为解决这个问题,提出一种离岸集装箱码头新装卸工艺模式。新装卸工艺模式是通过在离岸集装箱码头附近的陆域地带建设陆域集疏运堆场,与离岸集装箱码头进行协同... 离岸集装箱码头因其岛屿面积限制,难以通过扩建码头内部堆场增加吞吐能力。为解决这个问题,提出一种离岸集装箱码头新装卸工艺模式。新装卸工艺模式是通过在离岸集装箱码头附近的陆域地带建设陆域集疏运堆场,与离岸集装箱码头进行协同装卸作业的模式。陆域集疏运堆场堆存空间分配的目标是满足离岸集装箱码头装卸作业预翻倒要求;单批次输送集装箱的量受到陆岛运输最大通行能力限制。根据上述目标与特点,构建新装卸工艺模式下陆域集疏运堆场堆存空间分配模型,并设计蒙特卡洛树搜索算法进行求解。通过算例分析验证模型的有效性。结果表明该方法能够满足陆域集疏运堆场堆存空间分配需求并提高离岸集装箱码头的吞吐能力。 展开更多
关键词 陆域集疏运堆场 堆存空间分配 脉冲式输出 蒙特卡洛树搜索
在线阅读 下载PDF
基于无人机的移动边缘计算任务卸载 被引量:6
14
作者 刘建华 林柯蒙 +2 位作者 衡振宇 刘佳嘉 谢家雨 《南京邮电大学学报(自然科学版)》 北大核心 2023年第2期36-45,共10页
无人机具有高移动性,能帮助移动用户在基础通信设施缺乏的环境中快速部署边缘云。为降低基于无人机的边缘计算成本,提高能量利用效率,提出了一种移动边缘计算(Mobile Edge Computing, MEC)系统的任务卸载方案。首先基于排队论模型构建... 无人机具有高移动性,能帮助移动用户在基础通信设施缺乏的环境中快速部署边缘云。为降低基于无人机的边缘计算成本,提高能量利用效率,提出了一种移动边缘计算(Mobile Edge Computing, MEC)系统的任务卸载方案。首先基于排队论模型构建了多用户边缘计算模型,引入等待概率构造了移动边缘计算系统的成本函数,然后采用权重系数将多目标优化问题转化为求解卸载策略的单目标非线性规划问题,最后采用蒙特卡洛剪枝算法进行求解,并引入决策树剪枝算法降低了算法的复杂度。实验结果表明,文中提出的任务卸载方案在CPU性能较低、任务到达率较大的情况下均能降低成本开销,为基于无人机的边缘计算提供了一种低成本的解决方案。 展开更多
关键词 无人机 移动边缘计算 蒙特卡洛树搜索算法 决策树剪枝
在线阅读 下载PDF
一种未知动态环境下异构无人机集群分布式联盟形成方法 被引量:4
15
作者 郑红星 郭继峰 +1 位作者 谢旭东 颜鹏 《宇航学报》 EI CAS CSCD 北大核心 2022年第2期189-197,共9页
针对未知动态环境下异构无人机集群的分布式联盟形成问题,首先构建了异构无人机集群的联盟任务自动机,实现了异构无人机集群在未知动态环境下的自主任务协调。在此基础之上,提出了一种基于蒙特卡洛树搜索的分布式联盟形成算法,该算法通... 针对未知动态环境下异构无人机集群的分布式联盟形成问题,首先构建了异构无人机集群的联盟任务自动机,实现了异构无人机集群在未知动态环境下的自主任务协调。在此基础之上,提出了一种基于蒙特卡洛树搜索的分布式联盟形成算法,该算法通过两阶段的蒙特卡洛树搜索来增量式地对联盟结构进行分布式优化,算法可在分布式框架下实施,并在任意时间内终止返回当前的最优解。最后,仿真实验表明,提出的算法可有效处理异构无人机集群在未知动态环境下的分布式联盟形成问题,并在较大规模的联盟形成问题中仍能保持较优的性能表现。 展开更多
关键词 异构无人机集群 分布式联盟形成 蒙特卡洛树搜索 分布式协同控制 未知环境
在线阅读 下载PDF
基于改进梯度提升决策树-蒙特卡罗法的超大型集装箱船绑扎桥可靠性分析 被引量:4
16
作者 李放 王德禹 《中国舰船研究》 CSCD 北大核心 2020年第2期63-69,共7页
[目的]对超大型集装箱船绑扎桥结构而言,复杂的设计结构和恶劣的载荷环境对其可靠性提出了更高的要求。针对大型船舶结构可靠性分析时计算效率低、计算精度差等问题,提出基于改进梯度提升决策树—蒙特卡罗(GBDT-MC)方法。[方法]首先,通... [目的]对超大型集装箱船绑扎桥结构而言,复杂的设计结构和恶劣的载荷环境对其可靠性提出了更高的要求。针对大型船舶结构可靠性分析时计算效率低、计算精度差等问题,提出基于改进梯度提升决策树—蒙特卡罗(GBDT-MC)方法。[方法]首先,通过Python库建立改进梯度提升决策树(GBDT)的近似模型,根据实验生成较少的样本点,并筛选位于失效面附近的样本点;接着,运用SMOTE算法合成新的样本点并参与有限元计算,进而结合原有的样本点形成训练集;然后,采用已训练的近似模型预测蒙特卡罗(MC)方法所产生的样本点信息,完成结构的可靠性分析;最后,运用算例验证改进GBDT-MC方法的可行性和准确性,并将其应用于超大型集装箱船绑扎桥结构的可靠性分析。[结果]计算结果表明:案例中超大型集装箱船绑扎桥在静态绑扎力作用下的失效概率误差为3.5%,改进GBDT-MC方法的计算耗时为2.55 h,而MC方法则需要416.7 h,可见在允许的计算误差范围内,改进GBDT-MC方法可以大为缩减可靠性分析的计算时间。[结论]改进GBDT-MC方法能显著提高计算精度并缩短计算时间,可为结构可靠性的优化设计提供支持。 展开更多
关键词 绑扎桥 可靠性分析 SMOTE算法 梯度提升决策树 蒙特卡罗方法
在线阅读 下载PDF
基于改进蒙特卡洛树搜索的无人机目标分配与突防决策方法 被引量:2
17
作者 熊韫文 魏才盛 +2 位作者 许丹 周亮 薛晓鹏 《中南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2023年第8期3132-3144,共13页
针对多无人机任务规划问题,在多种约束与机动动作下,进行目标分配和突防决策统一建模与优化求解方法研究。首先,基于无人机自身优势、目标威胁以及突防概率分别建立目标分配优化函数和突防决策优化函数;然后,利用线性加权法将两者融合,... 针对多无人机任务规划问题,在多种约束与机动动作下,进行目标分配和突防决策统一建模与优化求解方法研究。首先,基于无人机自身优势、目标威胁以及突防概率分别建立目标分配优化函数和突防决策优化函数;然后,利用线性加权法将两者融合,形成多无人机协同任务规划统一目标函数;其次,在强化学习框架下,分阶段构建协同任务规划的状态空间和动作空间,并根据统一目标函数设计奖励函数;提出一种改进的蒙特卡洛树搜索强化学习算法,在统一目标函数最大收益下实现对无人机目标分配和突防决策问题的求解;最后,通过对比仿真实验验证所提出的方法的时效性和最优性。研究结果表明:相较于传统方法,所提出的方法在提升收敛程度的同时,将训练时间减少了15%。 展开更多
关键词 无人机任务规划 目标分配 多阶段决策 蒙特卡洛树搜索
在线阅读 下载PDF
基于蒙特卡洛树搜索的全域指挥控制协同 被引量:3
18
作者 许珺怡 季明 +1 位作者 郭域峰 李乐 《指挥与控制学报》 CSCD 2022年第1期37-43,共7页
面向未来全域联合作战概念下的智能化指挥控制协同需求,重点研究针对具体作战任务的作战单元协同,通过利用复杂网络建模方法,构建指挥控制协同网络模型,并设计3种指挥控制协同模式.在此基础上,借鉴强化学习思想,提出基于蒙特卡洛树搜索... 面向未来全域联合作战概念下的智能化指挥控制协同需求,重点研究针对具体作战任务的作战单元协同,通过利用复杂网络建模方法,构建指挥控制协同网络模型,并设计3种指挥控制协同模式.在此基础上,借鉴强化学习思想,提出基于蒙特卡洛树搜索的指挥控制协同算法,来实现指挥控制协同决策过程的最佳策略选择,最终生成面向具体任务的最优作战簇,降低指挥控制协同网络的搜索代价,提高全域指挥控制协同的智能化水平.以联合反舰作战为背景,通过仿真实验,构建不同指挥控制协同模式下的指挥控制协同网络,并验证基于蒙特卡洛树搜索的指挥控制协同算法的有效性. 展开更多
关键词 全域联合作战 指挥控制协同 蒙特卡洛树搜索 网络建模
在线阅读 下载PDF
考虑拥堵关联的城市主干道运行可靠性建模 被引量:2
19
作者 董可然 朱自博 +1 位作者 封春房 唐克双 《武汉理工大学学报(交通科学与工程版)》 2018年第5期862-867,共6页
城市主干道交通流运行有显著的随机性和不确定性.在拥堵情况下,连续路段间的交通状态关联显著影响城市主干道的运行可靠性.为准确描述和定量分析路段间拥堵关联对主干道运行可靠性的影响,基于网格搜索算法的拥堵关联判别方法被提出,结... 城市主干道交通流运行有显著的随机性和不确定性.在拥堵情况下,连续路段间的交通状态关联显著影响城市主干道的运行可靠性.为准确描述和定量分析路段间拥堵关联对主干道运行可靠性的影响,基于网格搜索算法的拥堵关联判别方法被提出,结合不同交通状态出现概率与对应交通状态下的行程时间分布特征,通过双层蒙特卡洛仿真建立了主干道行程时间可靠性模型.并以青岛市福州南路为实例,利用定点检测器和卡口电警数据的多源融合,对模型进行了验证.结果表明,新建模型更加符合主干道交通拥堵时空演化机理及其可靠性评价. 展开更多
关键词 主干道 行程时间可靠性 拥堵关联 网格搜索算法 蒙特卡洛仿真
在线阅读 下载PDF
集装箱码头岸桥突发故障情况下装卸船作业重调度研究 被引量:3
20
作者 夏孟珏 史学鑫 李美贞 《上海海事大学学报》 北大核心 2022年第1期30-37,共8页
为解决在集装箱码头岸桥突发故障情况下装卸船作业的快速重调度问题,考虑故障岸桥对其他岸桥作业的时空约束,在满足作业安全和作业顺序的要求下,以最小化最大完工时间为目标,构建装卸船作业重调度序贯决策模型。为求解该模型,对基于离... 为解决在集装箱码头岸桥突发故障情况下装卸船作业的快速重调度问题,考虑故障岸桥对其他岸桥作业的时空约束,在满足作业安全和作业顺序的要求下,以最小化最大完工时间为目标,构建装卸船作业重调度序贯决策模型。为求解该模型,对基于离散事件仿真的蒙特卡洛树搜索(Monte Carlo tree search,MCTS)算法进行改进。仿真实验证明,提出的装卸船作业重调度方法有效,能够保证在岸桥突发故障情况下装卸船作业的有序进行。 展开更多
关键词 岸桥调度 不确定性 重调度 岸桥故障 蒙特卡洛树搜索(mcts)算法
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部