检索结果-维普期刊中文期刊服务平台

基于蒙特卡罗树搜索-强化学习的列车运行智能调整方法被引量：5: 1; 作者王荣笙张琦 +2 位作者张涛王涛丁舒忻《中国铁道科学》 EI CAS CSCD 北大核心 2022年第5期146-156,共11页; 为提升突发事件下高速铁路应急处置效率,以列车运行图为研究对象,提出晚点场景下蒙特卡罗树搜索-强化学习(MCTS-RL)的列车运行智能调整方法,包括MCTS-RL的列车运行智能调整离线训练模型、强化学习方法、MCTS的发车次序决策方法和冲突消... 展开更多; 关键词高速铁路列车运行调整人工智能强化学习蒙特卡罗树搜索; 在线阅读下载PDF 职称材料

基于蒙特卡罗树搜索的多载具自动化存取系统优化算法: 2; 作者陈俭新宁蒙 +2 位作者黄予洛张蕾赵新灿《舰船科学技术》北大核心 2022年第8期169-173,共5页; 针对某型多载具自动化存取系统优化分配问题,分析该自动化存取系统的运行特点,建立了该自动化存取系统优化问题的马尔科夫决策过程模型,并提出了求解模型的基于改进蒙特卡罗树搜索算法。首先,以总搬运量和同类型货箱距离最小为目标建立... 展开更多; 关键词多载具自动化存取系统马尔科夫模型蒙特卡罗树搜索; 在线阅读下载PDF 职称材料

混合蒙特卡罗搜索的特征选择算法的优化被引量：1: 3; 作者刘云肖雪黄荣乘《信息技术》 2020年第5期28-31,36,共5页; 特征选择是机器学习和数据挖掘中处理高维数据的初步步骤,通过消除冗余或不相关的特征来识别数据集中最重要和最相关的特征,从而提高分类精度和降低计算复杂度。文中提出混合蒙特卡罗树搜索特征选择算法(HMCTS),首先,根据蒙特卡罗树搜... 展开更多; 关键词高维数据特征选择相关特征蒙特卡罗树搜索可扩展性; 在线阅读下载PDF 职称材料

考虑综合性能最优的非短视快速天基雷达多目标跟踪资源调度算法: 4; 作者王增福杨广宇金术玲《雷达学报（中英文）》 EI CSCD 北大核心 2024年第1期253-269,共17页; 合理有效的资源调度是天基雷达效能得以充分发挥的关键。针对天基雷达多目标跟踪资源调度问题,建立了综合考虑目标威胁度、跟踪精度与低截获概率(LPI)的代价函数;考虑目标的不确定、天基平台约束以及长远期期望代价,建立了多约束下的基... 展开更多; 关键词天基雷达资源调度多目标跟踪部分可观测的马尔可夫决策过程蒙特卡罗树搜索(MCTS); 在线阅读下载PDF 职称材料

空战机动飞行轨迹生成与控制被引量：4: 5; 作者刘佩王维嘉 +1 位作者陈向朱雪耀《兵工自动化》 2018年第11期76-80,96,共6页; 针对依赖于标准机动动作库或者驾驶员经验的机动控制问题,提出一种基于蒙特卡罗树搜索算法生成机动轨迹的方法,只需给定目标机动动作的初始和终止状态,通过反复搜索即可得到达成机动目标的操作序列;并设计前馈加反馈的复合控制器来提高... 展开更多; 关键词机动飞行控制强化学习蒙特卡罗树搜索复合控制; 在线阅读下载PDF 职称材料

基于MCTS-RAVE的智能博弈被引量：1: 6; 作者芮雄星王一莉《江南大学学报（自然科学版）》 CAS 2011年第2期175-178,共4页; 针对蒙特卡罗树搜索(MCTS)算法对蒙特卡罗模拟次数的依赖性较强,为获得较高智能必须进行多次模拟的情况,提出了结合在线强化学习知识以减少MCTS算法对蒙特卡罗模拟次数的依赖,在搜索过程中积累强化学习知识,并快速对动作值作出估计。实... 展开更多; 关键词博弈搜索蒙特卡罗树搜索快速动作值估计; 在线阅读下载PDF 职称材料

AlphaZero原理与启示被引量：8: 7; 作者唐川陶业荣麻曰亮《航空兵器》 CSCD 北大核心 2020年第3期27-36,共10页; 近几年,计算机围棋成功引发了又一轮的人工智能热潮,从计算机围棋中发展出来的AlphaZero框架成功地应用在其他完全信息条件下的二人有限零和博弈问题,进而展示出了深度学习和强化学习在智能决策领域的优异性能。本文首先介绍了AlphaZer... 展开更多; 关键词深度学习强化学习蒙特卡罗树搜索 AlphaZero 军事决策智能化人工智能; 在线阅读下载PDF 职称材料

并行计算在机动飞行轨迹生成中的应用: 8; 作者蒋超王维嘉王昊《兵工自动化》 2020年第8期25-31,36,共8页; 针对现有通用机动轨迹需要较长的预规划时间,无法在机载计算平台实时解算的问题,提出一种利用并行计算的方式对通用机动框架进行加速的方法。对现有的MCTS算法叶子节点并行、根节点并行和树并行方式进行分析,结合叶子节点并行和根节点... 展开更多; 关键词并行计算蒙特卡罗树搜索算法 GPU 众核通用机动框架; 在线阅读下载PDF 职称材料

题名基于蒙特卡罗树搜索-强化学习的列车运行智能调整方法被引量：5: 1; 作者王荣笙张琦张涛王涛丁舒忻; 机构中国铁道科学研究院研究生部中国铁道科学研究院集团有限公司通信信号研究所中国铁道科学研究院集团有限公司国家铁路智能运输系统工程技术研究中心; 出处《中国铁道科学》 EI CAS CSCD 北大核心 2022年第5期146-156,共11页; 基金国家自然科学基金高铁联合基金资助项目(U1834211,U1934220) 中国国家铁路集团有限公司科技研究开发计划重大课题(K2019G043)。; 文摘为提升突发事件下高速铁路应急处置效率,以列车运行图为研究对象,提出晚点场景下蒙特卡罗树搜索-强化学习(MCTS-RL)的列车运行智能调整方法,包括MCTS-RL的列车运行智能调整离线训练模型、强化学习方法、MCTS的发车次序决策方法和冲突消解启发式规则。基于高速铁路列车运行调整数学模型构建强化学习环境,包括状态集、动作集、状态转移概率和奖励函数。先设计启发式规则,生成可行发车次序,作为蒙特卡罗树搜索博弈树结构的节点,应用MCTS输出列车运行调整的最优发车次序。之后再设计启发式规则,消解列车在车站和区间的运行冲突。以线路上列车总晚点时间最短为目标函数,基于MCTS-RL一次性离线训练生成在线调整模型,用于实时调整各次列车在各个车站的发车次序。以京沪高速铁路北京南—泰安段为例,设置到站晚点和发车晚点场景,分别应用先到先服务、CPLEX求解器和MCTS-RL方法进行求解。结果表明:与CPLEX求解器下的方案相比,MCTS-RL方法能在0.001 s内给出同样最优的列车运行调整方案。; 关键词高速铁路列车运行调整人工智能强化学习蒙特卡罗树搜索; Keywords High-speed railway Train operation adjustment Artificial intelligence Reinforcement learning Monte Carlo Tree Search; 分类号 U292.41 [交通运输工程—交通运输规划与管理]; 在线阅读下载PDF 职称材料

题名基于蒙特卡罗树搜索的多载具自动化存取系统优化算法: 2; 作者陈俭新宁蒙黄予洛张蕾赵新灿; 机构中国船舶集团有限公司第七一三研究所郑州大学信息工程学院; 出处《舰船科学技术》北大核心 2022年第8期169-173,共5页; 基金航空科学基金资助项目(2018ZC41002)。; 文摘针对某型多载具自动化存取系统优化分配问题,分析该自动化存取系统的运行特点,建立了该自动化存取系统优化问题的马尔科夫决策过程模型,并提出了求解模型的基于改进蒙特卡罗树搜索算法。首先,以总搬运量和同类型货箱距离最小为目标建立货位优化模型,为了更好控制蒙特卡罗树搜索分支合理性,对算法节点选择部分进行优化。最后,对改进的蒙特卡罗树搜索算法进行货位优化及对比测试。实验结果表明:改进的蒙特卡罗树搜索算法较采用贪心思想、采用魔方还原思想以及基于传统蒙特卡罗树搜索的算法在货位优化运行效果上更优。; 关键词多载具自动化存取系统马尔科夫模型蒙特卡罗树搜索; Keywords multi vehicle automatic access system Markov model Monte Carlo tree search; 分类号 U671.99 [交通运输工程—船舶及航道工程]; 在线阅读下载PDF 职称材料

题名混合蒙特卡罗搜索的特征选择算法的优化被引量：1: 3; 作者刘云肖雪黄荣乘; 机构昆明理工大学信息工程与自动化学院; 出处《信息技术》 2020年第5期28-31,36,共5页; 基金国家自然基金资助项目(61761025)。; 文摘特征选择是机器学习和数据挖掘中处理高维数据的初步步骤,通过消除冗余或不相关的特征来识别数据集中最重要和最相关的特征,从而提高分类精度和降低计算复杂度。文中提出混合蒙特卡罗树搜索特征选择算法(HMCTS),首先,根据蒙特卡罗树搜索方法迭代生成一个初始特征子集,利用ReliefF算法过滤选择前k个特征形成候选特征子集;然后,利用KNN分类器的分类精度评估候选特征,通过反向传播将模拟结果更新到迭代路径上所有选择的节点;最后,选择高精度的候选特征作为最佳特征子集。仿真结果表明,对比HPSO-LS和MOTiFS算法,HMCTS算法具有良好的可扩展性,且分类精度高。; 关键词高维数据特征选择相关特征蒙特卡罗树搜索可扩展性; Keywords high dimensional data feature selection related features MCTS scalability; 分类号 TP311 [自动化与计算机技术—计算机软件与理论]; 在线阅读下载PDF 职称材料

题名考虑综合性能最优的非短视快速天基雷达多目标跟踪资源调度算法: 4; 作者王增福杨广宇金术玲; 机构西北工业大学自动化学院中国电子科技集团公司第三十八研究所; 出处《雷达学报（中英文）》 EI CSCD 北大核心 2024年第1期253-269,共17页; 基金国家自然科学基金(U21B2008)。; 文摘合理有效的资源调度是天基雷达效能得以充分发挥的关键。针对天基雷达多目标跟踪资源调度问题,建立了综合考虑目标威胁度、跟踪精度与低截获概率(LPI)的代价函数;考虑目标的不确定、天基平台约束以及长远期期望代价,建立了多约束下的基于部分可观测的马尔可夫决策过程(POMDP)的资源调度模型;采用拉格朗日松弛法将多约束下的多目标跟踪资源调度问题转换分解为多个无约束的子问题;针对连续状态空间、连续动作空间及连续观测空间引起的维数灾难问题,采用基于蒙特卡罗树搜索(MCTS)的在线POMDP算法—POMCPOW算法进行求解,最终提出了一种综合多指标性能的非短视快速天基雷达多目标跟踪资源调度算法。仿真表明,与已有调度算法相比,所提算法资源分配更合理,系统性能更优。; 关键词天基雷达资源调度多目标跟踪部分可观测的马尔可夫决策过程蒙特卡罗树搜索(MCTS); Keywords Space-based radar Resource scheduling Multi-target tracking Partially observable Markov decision process Monte Carlo Tree Search(MCTS); 分类号 TN95 [电子电信—信号与信息处理]; 在线阅读下载PDF 职称材料

题名空战机动飞行轨迹生成与控制被引量：4: 5; 作者刘佩王维嘉陈向朱雪耀; 机构中国航空工业集团公司西安飞行自动控制研究所; 出处《兵工自动化》 2018年第11期76-80,96,共6页; 文摘针对依赖于标准机动动作库或者驾驶员经验的机动控制问题,提出一种基于蒙特卡罗树搜索算法生成机动轨迹的方法,只需给定目标机动动作的初始和终止状态,通过反复搜索即可得到达成机动目标的操作序列;并设计前馈加反馈的复合控制器来提高轨迹跟踪的效果。实验以筋斗机动为例进行验证,仿真结果表明:得到的筋斗参考轨迹各项指标均接近职业战斗机飞行员的最佳表现;同时与传统的PID控制器进行对比,证明了复合控制器能显著提高筋斗轨迹的跟踪效果,为解决机动控制问题提出了一种有效的解决方案。; 关键词机动飞行控制强化学习蒙特卡罗树搜索复合控制; Keywords maneuvering flight control reinforcement learning Monte-Carlo tree search hybrid controln; 分类号 TJ85 [兵器科学与技术—武器系统与运用工程]; 在线阅读下载PDF 职称材料

题名基于MCTS-RAVE的智能博弈被引量：1: 6; 作者芮雄星王一莉; 机构南京工业大学电子与信息工程学院; 出处《江南大学学报（自然科学版）》 CAS 2011年第2期175-178,共4页; 文摘针对蒙特卡罗树搜索(MCTS)算法对蒙特卡罗模拟次数的依赖性较强,为获得较高智能必须进行多次模拟的情况,提出了结合在线强化学习知识以减少MCTS算法对蒙特卡罗模拟次数的依赖,在搜索过程中积累强化学习知识,并快速对动作值作出估计。实例表明,该种方法较MCTS具有更高的智能表现,并有一定的实用价值。; 关键词博弈搜索蒙特卡罗树搜索快速动作值估计; Keywords gaming search MCTS RAVE; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名AlphaZero原理与启示被引量：8: 7; 作者唐川陶业荣麻曰亮; 机构中国洛阳电子装备试验中心; 出处《航空兵器》 CSCD 北大核心 2020年第3期27-36,共10页; 文摘近几年,计算机围棋成功引发了又一轮的人工智能热潮,从计算机围棋中发展出来的AlphaZero框架成功地应用在其他完全信息条件下的二人有限零和博弈问题,进而展示出了深度学习和强化学习在智能决策领域的优异性能。本文首先介绍了AlphaZero框架中三个核心技术:深度学习、强化学习以及蒙特卡罗树搜索,然后详细说明了AlphaZero框架两个关键阶段——AlphaGo和AlphaGo Zero的基本原理,最后,对AlphaZero框架提出了自己的思考,并基于对AlphaZero原理的剖析讨论了其对军事决策智能化的启示。; 关键词深度学习强化学习蒙特卡罗树搜索 AlphaZero 军事决策智能化人工智能; Keywords deep learning reinforcement learning Monte Carlo tree search AlphaZero intelligence of military decision artificial intelligence; 分类号 TJ760 [兵器科学与技术—武器系统与运用工程] TP242.6 [自动化与计算机技术—检测技术与自动化装置]; 在线阅读下载PDF 职称材料

题名并行计算在机动飞行轨迹生成中的应用: 8; 作者蒋超王维嘉王昊; 机构航空工业西安飞行自动控制研究所飞控部; 出处《兵工自动化》 2020年第8期25-31,36,共8页; 文摘针对现有通用机动轨迹需要较长的预规划时间,无法在机载计算平台实时解算的问题,提出一种利用并行计算的方式对通用机动框架进行加速的方法。对现有的MCTS算法叶子节点并行、根节点并行和树并行方式进行分析,结合叶子节点并行和根节点并行方式各自的优点,对每棵搜索树采用叶子节点并行方法,分别利用Pthread和CUDA对并行通用机动框架进行加速,并以筋斗机动为例对加速效果进行测试。实验结果表明:并行通用机动框架不仅性能优于串行框架,而且可大幅缩短机动解算时间。; 关键词并行计算蒙特卡罗树搜索算法 GPU 众核通用机动框架; Keywords parallel computing Monte Carlo tree search algorithm GPU multi-core general maneuvering frame; 分类号 TP301 [自动化与计算机技术—计算机系统结构]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	基于蒙特卡罗树搜索-强化学习的列车运行智能调整方法	王荣笙张琦张涛王涛丁舒忻	《中国铁道科学》 EI CAS CSCD 北大核心	2022	5	在线阅读下载PDF 职称材料
2	基于蒙特卡罗树搜索的多载具自动化存取系统优化算法	陈俭新宁蒙黄予洛张蕾赵新灿	《舰船科学技术》北大核心	2022	0	在线阅读下载PDF 职称材料
3	混合蒙特卡罗搜索的特征选择算法的优化	刘云肖雪黄荣乘	《信息技术》	2020	1	在线阅读下载PDF 职称材料
4	考虑综合性能最优的非短视快速天基雷达多目标跟踪资源调度算法	王增福杨广宇金术玲	《雷达学报（中英文）》 EI CSCD 北大核心	2024	0	在线阅读下载PDF 职称材料
5	空战机动飞行轨迹生成与控制	刘佩王维嘉陈向朱雪耀	《兵工自动化》	2018	4	在线阅读下载PDF 职称材料
6	基于MCTS-RAVE的智能博弈	芮雄星王一莉	《江南大学学报（自然科学版）》 CAS	2011	1	在线阅读下载PDF 职称材料
7	AlphaZero原理与启示	唐川陶业荣麻曰亮	《航空兵器》 CSCD 北大核心	2020	8	在线阅读下载PDF 职称材料
8	并行计算在机动飞行轨迹生成中的应用	蒋超王维嘉王昊	《兵工自动化》	2020	0	在线阅读下载PDF 职称材料