期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
8
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于蒙特卡罗树搜索-强化学习的列车运行智能调整方法
被引量:
5
1
作者
王荣笙
张琦
+2 位作者
张涛
王涛
丁舒忻
《中国铁道科学》
EI
CAS
CSCD
北大核心
2022年第5期146-156,共11页
为提升突发事件下高速铁路应急处置效率,以列车运行图为研究对象,提出晚点场景下蒙特卡罗树搜索-强化学习(MCTS-RL)的列车运行智能调整方法,包括MCTS-RL的列车运行智能调整离线训练模型、强化学习方法、MCTS的发车次序决策方法和冲突消...
为提升突发事件下高速铁路应急处置效率,以列车运行图为研究对象,提出晚点场景下蒙特卡罗树搜索-强化学习(MCTS-RL)的列车运行智能调整方法,包括MCTS-RL的列车运行智能调整离线训练模型、强化学习方法、MCTS的发车次序决策方法和冲突消解启发式规则。基于高速铁路列车运行调整数学模型构建强化学习环境,包括状态集、动作集、状态转移概率和奖励函数。先设计启发式规则,生成可行发车次序,作为蒙特卡罗树搜索博弈树结构的节点,应用MCTS输出列车运行调整的最优发车次序。之后再设计启发式规则,消解列车在车站和区间的运行冲突。以线路上列车总晚点时间最短为目标函数,基于MCTS-RL一次性离线训练生成在线调整模型,用于实时调整各次列车在各个车站的发车次序。以京沪高速铁路北京南—泰安段为例,设置到站晚点和发车晚点场景,分别应用先到先服务、CPLEX求解器和MCTS-RL方法进行求解。结果表明:与CPLEX求解器下的方案相比,MCTS-RL方法能在0.001 s内给出同样最优的列车运行调整方案。
展开更多
关键词
高速铁路
列车运行调整
人工智能
强化学习
蒙特卡罗树搜索
在线阅读
下载PDF
职称材料
基于蒙特卡罗树搜索的多载具自动化存取系统优化算法
2
作者
陈俭新
宁蒙
+2 位作者
黄予洛
张蕾
赵新灿
《舰船科学技术》
北大核心
2022年第8期169-173,共5页
针对某型多载具自动化存取系统优化分配问题,分析该自动化存取系统的运行特点,建立了该自动化存取系统优化问题的马尔科夫决策过程模型,并提出了求解模型的基于改进蒙特卡罗树搜索算法。首先,以总搬运量和同类型货箱距离最小为目标建立...
针对某型多载具自动化存取系统优化分配问题,分析该自动化存取系统的运行特点,建立了该自动化存取系统优化问题的马尔科夫决策过程模型,并提出了求解模型的基于改进蒙特卡罗树搜索算法。首先,以总搬运量和同类型货箱距离最小为目标建立货位优化模型,为了更好控制蒙特卡罗树搜索分支合理性,对算法节点选择部分进行优化。最后,对改进的蒙特卡罗树搜索算法进行货位优化及对比测试。实验结果表明:改进的蒙特卡罗树搜索算法较采用贪心思想、采用魔方还原思想以及基于传统蒙特卡罗树搜索的算法在货位优化运行效果上更优。
展开更多
关键词
多载具自动化存取系统
马尔科夫模型
蒙特卡罗树搜索
在线阅读
下载PDF
职称材料
混合蒙特卡罗搜索的特征选择算法的优化
被引量:
1
3
作者
刘云
肖雪
黄荣乘
《信息技术》
2020年第5期28-31,36,共5页
特征选择是机器学习和数据挖掘中处理高维数据的初步步骤,通过消除冗余或不相关的特征来识别数据集中最重要和最相关的特征,从而提高分类精度和降低计算复杂度。文中提出混合蒙特卡罗树搜索特征选择算法(HMCTS),首先,根据蒙特卡罗树搜...
特征选择是机器学习和数据挖掘中处理高维数据的初步步骤,通过消除冗余或不相关的特征来识别数据集中最重要和最相关的特征,从而提高分类精度和降低计算复杂度。文中提出混合蒙特卡罗树搜索特征选择算法(HMCTS),首先,根据蒙特卡罗树搜索方法迭代生成一个初始特征子集,利用ReliefF算法过滤选择前k个特征形成候选特征子集;然后,利用KNN分类器的分类精度评估候选特征,通过反向传播将模拟结果更新到迭代路径上所有选择的节点;最后,选择高精度的候选特征作为最佳特征子集。仿真结果表明,对比HPSO-LS和MOTiFS算法,HMCTS算法具有良好的可扩展性,且分类精度高。
展开更多
关键词
高维数据
特征选择
相关特征
蒙特卡罗树搜索
可扩展性
在线阅读
下载PDF
职称材料
考虑综合性能最优的非短视快速天基雷达多目标跟踪资源调度算法
4
作者
王增福
杨广宇
金术玲
《雷达学报(中英文)》
EI
CSCD
北大核心
2024年第1期253-269,共17页
合理有效的资源调度是天基雷达效能得以充分发挥的关键。针对天基雷达多目标跟踪资源调度问题,建立了综合考虑目标威胁度、跟踪精度与低截获概率(LPI)的代价函数;考虑目标的不确定、天基平台约束以及长远期期望代价,建立了多约束下的基...
合理有效的资源调度是天基雷达效能得以充分发挥的关键。针对天基雷达多目标跟踪资源调度问题,建立了综合考虑目标威胁度、跟踪精度与低截获概率(LPI)的代价函数;考虑目标的不确定、天基平台约束以及长远期期望代价,建立了多约束下的基于部分可观测的马尔可夫决策过程(POMDP)的资源调度模型;采用拉格朗日松弛法将多约束下的多目标跟踪资源调度问题转换分解为多个无约束的子问题;针对连续状态空间、连续动作空间及连续观测空间引起的维数灾难问题,采用基于蒙特卡罗树搜索(MCTS)的在线POMDP算法—POMCPOW算法进行求解,最终提出了一种综合多指标性能的非短视快速天基雷达多目标跟踪资源调度算法。仿真表明,与已有调度算法相比,所提算法资源分配更合理,系统性能更优。
展开更多
关键词
天基雷达
资源调度
多目标跟踪
部分可观测的马尔可夫决策过程
蒙特卡罗树搜索
(MCTS)
在线阅读
下载PDF
职称材料
空战机动飞行轨迹生成与控制
被引量:
4
5
作者
刘佩
王维嘉
+1 位作者
陈向
朱雪耀
《兵工自动化》
2018年第11期76-80,96,共6页
针对依赖于标准机动动作库或者驾驶员经验的机动控制问题,提出一种基于蒙特卡罗树搜索算法生成机动轨迹的方法,只需给定目标机动动作的初始和终止状态,通过反复搜索即可得到达成机动目标的操作序列;并设计前馈加反馈的复合控制器来提高...
针对依赖于标准机动动作库或者驾驶员经验的机动控制问题,提出一种基于蒙特卡罗树搜索算法生成机动轨迹的方法,只需给定目标机动动作的初始和终止状态,通过反复搜索即可得到达成机动目标的操作序列;并设计前馈加反馈的复合控制器来提高轨迹跟踪的效果。实验以筋斗机动为例进行验证,仿真结果表明:得到的筋斗参考轨迹各项指标均接近职业战斗机飞行员的最佳表现;同时与传统的PID控制器进行对比,证明了复合控制器能显著提高筋斗轨迹的跟踪效果,为解决机动控制问题提出了一种有效的解决方案。
展开更多
关键词
机动飞行控制
强化学习
蒙特卡罗树搜索
复合控制
在线阅读
下载PDF
职称材料
基于MCTS-RAVE的智能博弈
被引量:
1
6
作者
芮雄星
王一莉
《江南大学学报(自然科学版)》
CAS
2011年第2期175-178,共4页
针对蒙特卡罗树搜索(MCTS)算法对蒙特卡罗模拟次数的依赖性较强,为获得较高智能必须进行多次模拟的情况,提出了结合在线强化学习知识以减少MCTS算法对蒙特卡罗模拟次数的依赖,在搜索过程中积累强化学习知识,并快速对动作值作出估计。实...
针对蒙特卡罗树搜索(MCTS)算法对蒙特卡罗模拟次数的依赖性较强,为获得较高智能必须进行多次模拟的情况,提出了结合在线强化学习知识以减少MCTS算法对蒙特卡罗模拟次数的依赖,在搜索过程中积累强化学习知识,并快速对动作值作出估计。实例表明,该种方法较MCTS具有更高的智能表现,并有一定的实用价值。
展开更多
关键词
博弈
搜索
蒙特卡罗树搜索
快速动作值估计
在线阅读
下载PDF
职称材料
AlphaZero原理与启示
被引量:
8
7
作者
唐川
陶业荣
麻曰亮
《航空兵器》
CSCD
北大核心
2020年第3期27-36,共10页
近几年,计算机围棋成功引发了又一轮的人工智能热潮,从计算机围棋中发展出来的AlphaZero框架成功地应用在其他完全信息条件下的二人有限零和博弈问题,进而展示出了深度学习和强化学习在智能决策领域的优异性能。本文首先介绍了AlphaZer...
近几年,计算机围棋成功引发了又一轮的人工智能热潮,从计算机围棋中发展出来的AlphaZero框架成功地应用在其他完全信息条件下的二人有限零和博弈问题,进而展示出了深度学习和强化学习在智能决策领域的优异性能。本文首先介绍了AlphaZero框架中三个核心技术:深度学习、强化学习以及蒙特卡罗树搜索,然后详细说明了AlphaZero框架两个关键阶段——AlphaGo和AlphaGo Zero的基本原理,最后,对AlphaZero框架提出了自己的思考,并基于对AlphaZero原理的剖析讨论了其对军事决策智能化的启示。
展开更多
关键词
深度学习
强化学习
蒙特卡罗树搜索
AlphaZero
军事决策智能化
人工智能
在线阅读
下载PDF
职称材料
并行计算在机动飞行轨迹生成中的应用
8
作者
蒋超
王维嘉
王昊
《兵工自动化》
2020年第8期25-31,36,共8页
针对现有通用机动轨迹需要较长的预规划时间,无法在机载计算平台实时解算的问题,提出一种利用并行计算的方式对通用机动框架进行加速的方法。对现有的MCTS算法叶子节点并行、根节点并行和树并行方式进行分析,结合叶子节点并行和根节点...
针对现有通用机动轨迹需要较长的预规划时间,无法在机载计算平台实时解算的问题,提出一种利用并行计算的方式对通用机动框架进行加速的方法。对现有的MCTS算法叶子节点并行、根节点并行和树并行方式进行分析,结合叶子节点并行和根节点并行方式各自的优点,对每棵搜索树采用叶子节点并行方法,分别利用Pthread和CUDA对并行通用机动框架进行加速,并以筋斗机动为例对加速效果进行测试。实验结果表明:并行通用机动框架不仅性能优于串行框架,而且可大幅缩短机动解算时间。
展开更多
关键词
并行计算
蒙特卡罗树搜索
算法
GPU
众核
通用机动框架
在线阅读
下载PDF
职称材料
题名
基于蒙特卡罗树搜索-强化学习的列车运行智能调整方法
被引量:
5
1
作者
王荣笙
张琦
张涛
王涛
丁舒忻
机构
中国铁道科学研究院研究生部
中国铁道科学研究院集团有限公司通信信号研究所
中国铁道科学研究院集团有限公司国家铁路智能运输系统工程技术研究中心
出处
《中国铁道科学》
EI
CAS
CSCD
北大核心
2022年第5期146-156,共11页
基金
国家自然科学基金高铁联合基金资助项目(U1834211,U1934220)
中国国家铁路集团有限公司科技研究开发计划重大课题(K2019G043)。
文摘
为提升突发事件下高速铁路应急处置效率,以列车运行图为研究对象,提出晚点场景下蒙特卡罗树搜索-强化学习(MCTS-RL)的列车运行智能调整方法,包括MCTS-RL的列车运行智能调整离线训练模型、强化学习方法、MCTS的发车次序决策方法和冲突消解启发式规则。基于高速铁路列车运行调整数学模型构建强化学习环境,包括状态集、动作集、状态转移概率和奖励函数。先设计启发式规则,生成可行发车次序,作为蒙特卡罗树搜索博弈树结构的节点,应用MCTS输出列车运行调整的最优发车次序。之后再设计启发式规则,消解列车在车站和区间的运行冲突。以线路上列车总晚点时间最短为目标函数,基于MCTS-RL一次性离线训练生成在线调整模型,用于实时调整各次列车在各个车站的发车次序。以京沪高速铁路北京南—泰安段为例,设置到站晚点和发车晚点场景,分别应用先到先服务、CPLEX求解器和MCTS-RL方法进行求解。结果表明:与CPLEX求解器下的方案相比,MCTS-RL方法能在0.001 s内给出同样最优的列车运行调整方案。
关键词
高速铁路
列车运行调整
人工智能
强化学习
蒙特卡罗树搜索
Keywords
High-speed railway
Train operation adjustment
Artificial intelligence
Reinforcement learning
Monte Carlo Tree Search
分类号
U292.41 [交通运输工程—交通运输规划与管理]
在线阅读
下载PDF
职称材料
题名
基于蒙特卡罗树搜索的多载具自动化存取系统优化算法
2
作者
陈俭新
宁蒙
黄予洛
张蕾
赵新灿
机构
中国船舶集团有限公司第七一三研究所
郑州大学信息工程学院
出处
《舰船科学技术》
北大核心
2022年第8期169-173,共5页
基金
航空科学基金资助项目(2018ZC41002)。
文摘
针对某型多载具自动化存取系统优化分配问题,分析该自动化存取系统的运行特点,建立了该自动化存取系统优化问题的马尔科夫决策过程模型,并提出了求解模型的基于改进蒙特卡罗树搜索算法。首先,以总搬运量和同类型货箱距离最小为目标建立货位优化模型,为了更好控制蒙特卡罗树搜索分支合理性,对算法节点选择部分进行优化。最后,对改进的蒙特卡罗树搜索算法进行货位优化及对比测试。实验结果表明:改进的蒙特卡罗树搜索算法较采用贪心思想、采用魔方还原思想以及基于传统蒙特卡罗树搜索的算法在货位优化运行效果上更优。
关键词
多载具自动化存取系统
马尔科夫模型
蒙特卡罗树搜索
Keywords
multi vehicle automatic access system
Markov model
Monte Carlo tree search
分类号
U671.99 [交通运输工程—船舶及航道工程]
在线阅读
下载PDF
职称材料
题名
混合蒙特卡罗搜索的特征选择算法的优化
被引量:
1
3
作者
刘云
肖雪
黄荣乘
机构
昆明理工大学信息工程与自动化学院
出处
《信息技术》
2020年第5期28-31,36,共5页
基金
国家自然基金资助项目(61761025)。
文摘
特征选择是机器学习和数据挖掘中处理高维数据的初步步骤,通过消除冗余或不相关的特征来识别数据集中最重要和最相关的特征,从而提高分类精度和降低计算复杂度。文中提出混合蒙特卡罗树搜索特征选择算法(HMCTS),首先,根据蒙特卡罗树搜索方法迭代生成一个初始特征子集,利用ReliefF算法过滤选择前k个特征形成候选特征子集;然后,利用KNN分类器的分类精度评估候选特征,通过反向传播将模拟结果更新到迭代路径上所有选择的节点;最后,选择高精度的候选特征作为最佳特征子集。仿真结果表明,对比HPSO-LS和MOTiFS算法,HMCTS算法具有良好的可扩展性,且分类精度高。
关键词
高维数据
特征选择
相关特征
蒙特卡罗树搜索
可扩展性
Keywords
high dimensional data
feature selection
related features
MCTS
scalability
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
考虑综合性能最优的非短视快速天基雷达多目标跟踪资源调度算法
4
作者
王增福
杨广宇
金术玲
机构
西北工业大学自动化学院
中国电子科技集团公司第三十八研究所
出处
《雷达学报(中英文)》
EI
CSCD
北大核心
2024年第1期253-269,共17页
基金
国家自然科学基金(U21B2008)。
文摘
合理有效的资源调度是天基雷达效能得以充分发挥的关键。针对天基雷达多目标跟踪资源调度问题,建立了综合考虑目标威胁度、跟踪精度与低截获概率(LPI)的代价函数;考虑目标的不确定、天基平台约束以及长远期期望代价,建立了多约束下的基于部分可观测的马尔可夫决策过程(POMDP)的资源调度模型;采用拉格朗日松弛法将多约束下的多目标跟踪资源调度问题转换分解为多个无约束的子问题;针对连续状态空间、连续动作空间及连续观测空间引起的维数灾难问题,采用基于蒙特卡罗树搜索(MCTS)的在线POMDP算法—POMCPOW算法进行求解,最终提出了一种综合多指标性能的非短视快速天基雷达多目标跟踪资源调度算法。仿真表明,与已有调度算法相比,所提算法资源分配更合理,系统性能更优。
关键词
天基雷达
资源调度
多目标跟踪
部分可观测的马尔可夫决策过程
蒙特卡罗树搜索
(MCTS)
Keywords
Space-based radar
Resource scheduling
Multi-target tracking
Partially observable Markov decision process
Monte Carlo Tree Search(MCTS)
分类号
TN95 [电子电信—信号与信息处理]
在线阅读
下载PDF
职称材料
题名
空战机动飞行轨迹生成与控制
被引量:
4
5
作者
刘佩
王维嘉
陈向
朱雪耀
机构
中国航空工业集团公司西安飞行自动控制研究所
出处
《兵工自动化》
2018年第11期76-80,96,共6页
文摘
针对依赖于标准机动动作库或者驾驶员经验的机动控制问题,提出一种基于蒙特卡罗树搜索算法生成机动轨迹的方法,只需给定目标机动动作的初始和终止状态,通过反复搜索即可得到达成机动目标的操作序列;并设计前馈加反馈的复合控制器来提高轨迹跟踪的效果。实验以筋斗机动为例进行验证,仿真结果表明:得到的筋斗参考轨迹各项指标均接近职业战斗机飞行员的最佳表现;同时与传统的PID控制器进行对比,证明了复合控制器能显著提高筋斗轨迹的跟踪效果,为解决机动控制问题提出了一种有效的解决方案。
关键词
机动飞行控制
强化学习
蒙特卡罗树搜索
复合控制
Keywords
maneuvering flight control
reinforcement learning
Monte-Carlo tree search
hybrid controln
分类号
TJ85 [兵器科学与技术—武器系统与运用工程]
在线阅读
下载PDF
职称材料
题名
基于MCTS-RAVE的智能博弈
被引量:
1
6
作者
芮雄星
王一莉
机构
南京工业大学电子与信息工程学院
出处
《江南大学学报(自然科学版)》
CAS
2011年第2期175-178,共4页
文摘
针对蒙特卡罗树搜索(MCTS)算法对蒙特卡罗模拟次数的依赖性较强,为获得较高智能必须进行多次模拟的情况,提出了结合在线强化学习知识以减少MCTS算法对蒙特卡罗模拟次数的依赖,在搜索过程中积累强化学习知识,并快速对动作值作出估计。实例表明,该种方法较MCTS具有更高的智能表现,并有一定的实用价值。
关键词
博弈
搜索
蒙特卡罗树搜索
快速动作值估计
Keywords
gaming search
MCTS
RAVE
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
AlphaZero原理与启示
被引量:
8
7
作者
唐川
陶业荣
麻曰亮
机构
中国洛阳电子装备试验中心
出处
《航空兵器》
CSCD
北大核心
2020年第3期27-36,共10页
文摘
近几年,计算机围棋成功引发了又一轮的人工智能热潮,从计算机围棋中发展出来的AlphaZero框架成功地应用在其他完全信息条件下的二人有限零和博弈问题,进而展示出了深度学习和强化学习在智能决策领域的优异性能。本文首先介绍了AlphaZero框架中三个核心技术:深度学习、强化学习以及蒙特卡罗树搜索,然后详细说明了AlphaZero框架两个关键阶段——AlphaGo和AlphaGo Zero的基本原理,最后,对AlphaZero框架提出了自己的思考,并基于对AlphaZero原理的剖析讨论了其对军事决策智能化的启示。
关键词
深度学习
强化学习
蒙特卡罗树搜索
AlphaZero
军事决策智能化
人工智能
Keywords
deep learning
reinforcement learning
Monte Carlo tree search
AlphaZero
intelligence of military decision
artificial intelligence
分类号
TJ760 [兵器科学与技术—武器系统与运用工程]
TP242.6 [自动化与计算机技术—检测技术与自动化装置]
在线阅读
下载PDF
职称材料
题名
并行计算在机动飞行轨迹生成中的应用
8
作者
蒋超
王维嘉
王昊
机构
航空工业西安飞行自动控制研究所飞控部
出处
《兵工自动化》
2020年第8期25-31,36,共8页
文摘
针对现有通用机动轨迹需要较长的预规划时间,无法在机载计算平台实时解算的问题,提出一种利用并行计算的方式对通用机动框架进行加速的方法。对现有的MCTS算法叶子节点并行、根节点并行和树并行方式进行分析,结合叶子节点并行和根节点并行方式各自的优点,对每棵搜索树采用叶子节点并行方法,分别利用Pthread和CUDA对并行通用机动框架进行加速,并以筋斗机动为例对加速效果进行测试。实验结果表明:并行通用机动框架不仅性能优于串行框架,而且可大幅缩短机动解算时间。
关键词
并行计算
蒙特卡罗树搜索
算法
GPU
众核
通用机动框架
Keywords
parallel computing
Monte Carlo tree search algorithm
GPU
multi-core
general maneuvering frame
分类号
TP301 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于蒙特卡罗树搜索-强化学习的列车运行智能调整方法
王荣笙
张琦
张涛
王涛
丁舒忻
《中国铁道科学》
EI
CAS
CSCD
北大核心
2022
5
在线阅读
下载PDF
职称材料
2
基于蒙特卡罗树搜索的多载具自动化存取系统优化算法
陈俭新
宁蒙
黄予洛
张蕾
赵新灿
《舰船科学技术》
北大核心
2022
0
在线阅读
下载PDF
职称材料
3
混合蒙特卡罗搜索的特征选择算法的优化
刘云
肖雪
黄荣乘
《信息技术》
2020
1
在线阅读
下载PDF
职称材料
4
考虑综合性能最优的非短视快速天基雷达多目标跟踪资源调度算法
王增福
杨广宇
金术玲
《雷达学报(中英文)》
EI
CSCD
北大核心
2024
0
在线阅读
下载PDF
职称材料
5
空战机动飞行轨迹生成与控制
刘佩
王维嘉
陈向
朱雪耀
《兵工自动化》
2018
4
在线阅读
下载PDF
职称材料
6
基于MCTS-RAVE的智能博弈
芮雄星
王一莉
《江南大学学报(自然科学版)》
CAS
2011
1
在线阅读
下载PDF
职称材料
7
AlphaZero原理与启示
唐川
陶业荣
麻曰亮
《航空兵器》
CSCD
北大核心
2020
8
在线阅读
下载PDF
职称材料
8
并行计算在机动飞行轨迹生成中的应用
蒋超
王维嘉
王昊
《兵工自动化》
2020
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部