期刊文献+
共找到54篇文章
< 1 2 3 >
每页显示 20 50 100
多目标多智能体路径规划方法
1
作者 张静 王祎 +1 位作者 陈子龙 李云松 《浙江大学学报(工学版)》 北大核心 2025年第8期1689-1697,共9页
为了实现高效地将任务分配给每个智能体,为智能体规划出尽可能短且不与其他智能体发生碰撞的路径,提出多目标多智能体路径规划方法.针对传统路径规划算法使用离散时间导致成功率低的问题,该算法定义连续时间下智能体间的冲突定义与解冲... 为了实现高效地将任务分配给每个智能体,为智能体规划出尽可能短且不与其他智能体发生碰撞的路径,提出多目标多智能体路径规划方法.针对传统路径规划算法使用离散时间导致成功率低的问题,该算法定义连续时间下智能体间的冲突定义与解冲突方式,在A^(*)算法的基础上引入安全间隔与标签的概念,使得A^(*)算法可以规划出满足连续时间约束的最优路径.针对多智能体路径规划问题中因碰撞检测、冲突避免造成的较大计算量,提出冲突分级策略,减少了算法求解过程中扩展的节点数量.实验结果表明,利用所提出的算法能够求解得到更优的解决方案,且该算法具有更好的适用性;在智能体分布密集的场景下,该算法表现出更低的路径总成本和更高的求解成功率. 展开更多
关键词 多智能系统 路径规划 任务分配 改进A^(*)算法 冲突搜索
在线阅读 下载PDF
基于拥塞感知和缓存通信的多智能体路径规划
2
作者 张永良 李子文 +2 位作者 许家豪 江雨宸 崔滢 《计算机科学》 北大核心 2025年第8期317-325,共9页
多智能体路径规划任务(MAPF)是大规模机器人系统的重要组成部分。基于冲突搜索的传统规划器受限于计算时间,导致可扩展性低,而基于通信机制的多智能体强化学习策略显著改善了这一问题。随着任务规模的扩大,如何有效通信和避免拥塞成为... 多智能体路径规划任务(MAPF)是大规模机器人系统的重要组成部分。基于冲突搜索的传统规划器受限于计算时间,导致可扩展性低,而基于通信机制的多智能体强化学习策略显著改善了这一问题。随着任务规模的扩大,如何有效通信和避免拥塞成为基于学习方法的主要障碍。针对这些问题,提出了一种基于缓存通信并具备拥塞感知能力的分布式规划器(C3MAP),在合理降低通信频率的同时保持优异的求解成功率。具体而言,当且仅当智能体的可观测信息与上一次通信内容存在显著差异或接收到其他智能体传来的广播请求信号时,才对局部视野内的智能体进行广播通信;同时,引入拥塞信息作为局部可观测信息,以指导智能体避开拥塞区域。基准测试的实验结果表明,C3MAP在结构化场景中的求解成功率均高于90%,显著优于现有基于学习的方法,且在大规模场景实验中进一步验证了缓存通信机制优越的稳定性以及拥塞感知的有效性。 展开更多
关键词 多智能系统 路径规划 深度强化学习 拥塞感知 缓存通信
在线阅读 下载PDF
一种结合选择性通信与冲突解决的多智能体路径规划方法
3
作者 王昱 张旭秀 《电子与信息学报》 北大核心 2025年第8期2830-2840,共11页
在动态密集场景中,路径规划方法面临计算复杂度高、系统可扩展性差等问题,尤其在障碍物密度大、智能体数量多的结构化环境中,易出现寻路效果不佳及碰撞死锁等现象。针对复杂场景下多智能体路径规划通信与动态冲突的双重挑战,该文提出一... 在动态密集场景中,路径规划方法面临计算复杂度高、系统可扩展性差等问题,尤其在障碍物密度大、智能体数量多的结构化环境中,易出现寻路效果不佳及碰撞死锁等现象。针对复杂场景下多智能体路径规划通信与动态冲突的双重挑战,该文提出一种基于选择性通信与冲突解决的多智能体路径规划方式(DCCPR)。该方法构建动态联合屏蔽补充决策机制,通过融合A^(*)算法生成的期望路径与双惩罚项强化学习,在实现任务目标的同时减少路径偏差;引入基于多层次动态加权的优先级冲突解决策略,结合初始距离优先级、任务Q值动态调整及轮流通行机制,有效处理系统中冲突情境。通过在训练期间从未见过的结构化地图上测试,相比决策因果通信(DCC)任务成功率提高约79%,平均回合步长降低了46.4%。 展开更多
关键词 多智能路径规划 强化学习 选择性通信 冲突解决
在线阅读 下载PDF
基于冲突避让的多智能体有效旁路规划
4
作者 刘春玲 裴萌韶 《计算机应用研究》 北大核心 2025年第7期2103-2108,共6页
针对狭窄环境中的多个智能体无法规避关键通道上的冲突,导致多智能体寻路效率低下的问题,提出了基于视场的冲突搜索有效旁路规划算法。在基于冲突搜索算法框架上层引入视场表示智能体的通信范围;通过扫描智能体通信范围内所有智能体的... 针对狭窄环境中的多个智能体无法规避关键通道上的冲突,导致多智能体寻路效率低下的问题,提出了基于视场的冲突搜索有效旁路规划算法。在基于冲突搜索算法框架上层引入视场表示智能体的通信范围;通过扫描智能体通信范围内所有智能体的多值决策图,判断智能体之间是否有共享资源的竞争,导致智能体之间的冲突;针对关键通道上多个智能体之间的冲突实施多值决策回溯冲突规避策略,通过扫描其多值决策图为阻碍关键通道的智能体找到次优路径或临时等待位置作为有效旁路进行避让。通过不同规模和结构的地图测试结果表明,多值决策回溯冲突规避策略可以有效减少智能体之间冲突的发生。在random-64-64-10和maze-128-128-10地图环境中,多个智能体求解路径的平均成功率相较于CBS-BP分别提高了10%和15.2%,证明所提算法可以有效避免冲突的发生,提高寻路成功率。 展开更多
关键词 基于冲突搜索 狭窄路段 有效旁路 多智能路径规划 临时等待位置 次优路径
在线阅读 下载PDF
基于图神经网络的多智能体路径规划方法
5
作者 禹鑫燚 刘飞 欧林林 《高技术通讯》 CAS 北大核心 2024年第10期1081-1090,共10页
在多智能体路径规划问题中,每个智能体需要互相协调来完成共同的全局目标,智能体之间通常需要显式的通信策略。传统的多智能体路径规划算法受限于实时性、扩展性、不完全通信等问题,很难适用于复杂的工作环境中。为了解决多智能体工作... 在多智能体路径规划问题中,每个智能体需要互相协调来完成共同的全局目标,智能体之间通常需要显式的通信策略。传统的多智能体路径规划算法受限于实时性、扩展性、不完全通信等问题,很难适用于复杂的工作环境中。为了解决多智能体工作环境中的通信问题,本文提出了一种基于图神经网络(GNN)的路径规划方法。该方法首先通过卷积神经网络(CNN)在局部观测中采集特征数据,由图神经网络在智能体之间传递这些数据。其次,为了减少智能体的惰性,提出了一种新的奖励函数,鼓励智能体更积极地探索并学习有效的协调策略。接着通过集中式收集数据训练、分布式执行提高学习效率。最后,进行多个环境下的仿真实验评估本文提出的算法,并与其他算法进行对比,验证了算法的有效性和可扩展性。 展开更多
关键词 路径规划 多智能强化学习 图神经网络(GNN) 多智能通信
在线阅读 下载PDF
启发式搜索的多智能体异速轨迹规划
6
作者 鲁宇 匡金骏 +1 位作者 肖峣 龚建伟 《计算机工程与应用》 北大核心 2025年第2期344-354,共11页
在多智能体系统研究中,多智能体路径规划(multi-agent path finding,MAPF)是一个核心难题,其目标是为各个智能体规定独立路径,确保智能体在移动过程中不发生碰撞。这是一个NP难题,亟须高效解决算法。创新性地提出了一种多智能体路径规... 在多智能体系统研究中,多智能体路径规划(multi-agent path finding,MAPF)是一个核心难题,其目标是为各个智能体规定独立路径,确保智能体在移动过程中不发生碰撞。这是一个NP难题,亟须高效解决算法。创新性地提出了一种多智能体路径规划算法——启发式导向冲突搜索(heuristic guided conflict-based search,HG-CBS),以解决复杂的MAPF场景,如智能体移动速度不同或各条边的道路长度不同。为优化HG-CBS算法,构建了三种独特的启发式计算方法:(1)加权求和法,以所有启发式的加权总和作为最终启发式;(2)帕累托集合法,构建一个帕累托集并从中选择节点;(3)交替法,在搜索迭代过程中交替使用各种启发式。实验结果显示,相比于传统方法,带有启发值的HG-CBS在成功率、运行时间及扩展节点数量等关键性能指标上均表现更优。例如,在包含16个智能体的复杂场景下,HG-CBS-h3(交替法)将运行时间缩短了89%,将拓展节点的数目减少了95%。此外,随着场景复杂度的提升,HG-CBS-h3的性能优势更加明显。这些结果证明了HG-CBS算法的有效性和高效性,对多智能体轨迹规划问题具有显著的理论和应用价值。 展开更多
关键词 多智能路径规划 启发式导向冲突搜索 启发式搜索 帕累托集
在线阅读 下载PDF
基于博弈论与强化学习的多智能体路径规划算法 被引量:5
7
作者 熊文博 郭磊 焦彤宇 《深圳大学学报(理工版)》 CAS CSCD 北大核心 2024年第3期274-282,共9页
针对平面上多个智能体构成的路径规划求解算法普遍存在的速度慢效率低等问题进行研究,将多智能体路径规划问题归结为非零和随机博弈,使用多智能体强化学习算法赢或快速学习-策略爬山(win or learn fast-policy hill-climbing,WoLF-PHC)... 针对平面上多个智能体构成的路径规划求解算法普遍存在的速度慢效率低等问题进行研究,将多智能体路径规划问题归结为非零和随机博弈,使用多智能体强化学习算法赢或快速学习-策略爬山(win or learn fast-policy hill-climbing,WoLF-PHC)得到纳什均衡策略,为各智能体做出无冲突的最优路径决策,提出能够快速自适应的WoLF-PHC(fast adaptive WoLF-PHC,FA-WoLF-PHC)算法,通过构建目标函数,使用梯度下降对学习率进行自适应更新.在猜硬币和自定义收益矩阵2个博弈场景中使用FA-WoLF-PHC,并与策略爬山(policy hill-climbing,PHC)算法和Wolf-PHC算法进行比较.结果表明,FA-WoLF-PHC算法的学习速度较WoLF-PHC算法有所提升,并有效减小了WoLF-PHC算法和PHC算法在学习过程中出现的振荡现象.在多智能体路径规划问题中,FA-WoLF-PHC算法的学习速度比WoLF-PHC算法提高了16.01%.将路径规划问题的环境栅格地图扩大为6×6,智能体数量增加为3个时,FA-WoLF-PHC、WoLF-PSP和多头绒泡菌-人工势场Sarsa(physarum polycephalum-artificial potential state-action-reward-state-action,PP-AP Sarsa)算法在10次实验中学习到最终策略需要的平均时间分别为16.30、20.59和17.72 s.在多智能体路径规划问题中,FA-WoLF-PHC算法能够得到各智能体的纳什均衡策略,学习速度较WoLF-PSP和PP-AP Sarsa算法有显著提高.FA-WoLF-PHC算法在常见的博弈场景中能够快速获得纳什策略,在多智能体路径规划问题中可为多个智能体生成无冲突的最优路径,并且在学习速度等方面较其他算法有显著提高. 展开更多
关键词 人工智能 博弈论 动态规划 纳什均衡策略 强化学习 多智能路径规划
在线阅读 下载PDF
多智能体路径规划技术研究综述 被引量:2
8
作者 吴文君 王腾达 +1 位作者 孙阳 高强 《北京工业大学学报》 CAS CSCD 北大核心 2024年第10期1263-1272,共10页
针对多智能体路径规划(multi-agent path finding, MAPF)问题研究的算法在户外危险场地、智能仓储系统和城市道路网络等领域有着广泛的应用。根据不同的求解思路,关于MAPF问题研究设计的算法主要可以分为基于搜索的传统算法和基于学习... 针对多智能体路径规划(multi-agent path finding, MAPF)问题研究的算法在户外危险场地、智能仓储系统和城市道路网络等领域有着广泛的应用。根据不同的求解思路,关于MAPF问题研究设计的算法主要可以分为基于搜索的传统算法和基于学习的智能算法2类。在基于搜索的传统算法研究中,按照路径规划效果不同,又可分为最优MAPF算法和次优MAPF算法。最优MAPF算法主要分为基于A~*的搜索、基于代价增长树的搜索(increasing cost tree search, ICTS)和基于冲突的搜索(conflict-based search, CBS)这3类;次优MAPF算法主要分为无边界次优的算法和有边界次优的算法2类。基于学习的智能MAPF算法可以大致分为结合专家经验的算法和基于图神经网络(graph neural network, GNN)的算法2类。根据上述分类介绍了近年来具有代表性的研究成果,分析了各种算法的特点,并对MAPF问题未来的研究方向进行了展望。 展开更多
关键词 机器学习 多智能系统 路径规划 最优路径集合 人工智能 移动机器人
在线阅读 下载PDF
多智能体中央式协同路径规划算法综述 被引量:1
9
作者 赵小涵 史小露 +3 位作者 陈璐 何思凡 段岁军 李大伟 《农业装备与车辆工程》 2024年第6期144-150,共7页
协同路径规划是实现多智能体协同作业的一项关键技术,需要保证行进至目标点前智能体间无碰撞,同时满足规划轨迹平滑性、规划时间有效性等要求。在明确多智能体协同规划问题的基础上,根据算法原理,将中央式协同路径规划算法分为基于A~*... 协同路径规划是实现多智能体协同作业的一项关键技术,需要保证行进至目标点前智能体间无碰撞,同时满足规划轨迹平滑性、规划时间有效性等要求。在明确多智能体协同规划问题的基础上,根据算法原理,将中央式协同路径规划算法分为基于A~*搜索、基于冲突搜索、基于安全间隔路径、基于代价增长树、基于规约算法以及其他算法,简单阐述各算法原理。研究发现,基于冲突搜索的协同路径规划算法因其计算质量及速度优势成为当前的主流算法,以此为基础进行改进成为当前研究热点。单一类型的算法对不同智能体规模及场景下的适应能力有限,多类型算法融合及智能化方法的介入将成为未来多智能体协同规划的发展趋势。 展开更多
关键词 多智能 中央式协同路径规划 算法综述 搜索算法 混合算法
在线阅读 下载PDF
航母航空保障作业中异质群体的动态路径规划算法
10
作者 孙迪迪 李超超 《计算机科学》 CSCD 北大核心 2024年第3期226-234,共9页
航母保障作业中路径规划任务存在着场景高动态性以及智能体的强异质性问题,传统的全局路径规划算法虽然能获得全局最优的结果,但无法适应高度动态变化的场景,且不能很好解决智能体的异质性所带来的安全性问题;当前的局部路径规划算法能... 航母保障作业中路径规划任务存在着场景高动态性以及智能体的强异质性问题,传统的全局路径规划算法虽然能获得全局最优的结果,但无法适应高度动态变化的场景,且不能很好解决智能体的异质性所带来的安全性问题;当前的局部路径规划算法能够很好地解决智能体体型差异,但是异质群体行为控制表示难以统一表达。为了解决以上问题,提出了一种航母航空保障作业中的异质群体的动态路径规划算法。首先,将优化的全局和局部路径规划算法融合,解决航空保障作业场景的高动态性问题,根据动态环境信息及时调整路径,并充分考虑场景的高动态性给异质智能体带来的安全性问题。然后,该方法考虑异质智能体不同的行为特性,在局部碰撞避免过程中采用基于运动学特性的异质智能体行为控制模型。最后,以美国尼米兹号航母为例,使用UE4进行仿真实验,从路径长度、平滑度、安全性和避障能力等方面对该算法进行了评价。仿真实验结果表明,与其他路径规划算法相比,所提算法不仅可以生成航母甲板异质群体的安全路径,还能够满足异质群体在动态航空保障作业场景中的应用需求。 展开更多
关键词 A*算法 路径规划 异质智能 GAMMA算法 行为控制
在线阅读 下载PDF
基于递阶强化学习的自主机器人路径规划智能体 被引量:6
11
作者 王文玺 肖世德 +2 位作者 孟祥印 陈应松 张卫华 《计算机集成制造系统》 EI CSCD 北大核心 2009年第6期1215-1221,共7页
递阶强化学习是解决状态空间庞大的复杂系统智能体决策的有效方法。通过引入启发式算法思想,对一种递阶强化学习方法进行改进,使得智能体在学习过程中融入了历史信息,提高了学习效率,解决了在庞大状态空间和动态变化环境中对智能体进行... 递阶强化学习是解决状态空间庞大的复杂系统智能体决策的有效方法。通过引入启发式算法思想,对一种递阶强化学习方法进行改进,使得智能体在学习过程中融入了历史信息,提高了学习效率,解决了在庞大状态空间和动态变化环境中对智能体进行最优行为策略学习的问题。以扩展的信念、愿望和意图意识模型为基础,提出了一种具有主动性、自治性、反应性、社会性的自主机器人路径规划智能体体系结构,通过仿真实验,证明了路径规划智能体的可行性和有效性。 展开更多
关键词 智能 强化学习 意识模型 路径规划
在线阅读 下载PDF
一种基于多智能体的二层路径规划模型研究 被引量:4
12
作者 熊慕舟 黎勇 《计算机科学》 CSCD 北大核心 2016年第6期59-64,共6页
随着人群运动仿真技术的日趋成熟,其应用也得到了很好的推广,人群运动特征开始成为研究热点。路径规划系统作为人群仿真中的重要组成部分,为行人决定自身在环境中的行走路线提供了决策依据。为了仿真行人路径决策的过程,提出了一种二层... 随着人群运动仿真技术的日趋成熟,其应用也得到了很好的推广,人群运动特征开始成为研究热点。路径规划系统作为人群仿真中的重要组成部分,为行人决定自身在环境中的行走路线提供了决策依据。为了仿真行人路径决策的过程,提出了一种二层路径规划模型,其中第一层模型产生一条粗略的路径,第二层模型根据第一层的粗略路径做精细的导航。实验结果表明,所提出的二层路径规划模型能够综合考虑环境中的静态和动态因素,为仿真模型提供了较好的路径规划,并且具有较高的仿真执行效率。 展开更多
关键词 人群仿真 路径规划 全局规划 局部规划 基于智能的仿真
在线阅读 下载PDF
一种双阶段多智能体路径规划算法 被引量:5
13
作者 李庆华 王佳慧 +1 位作者 李海明 冯超 《科学技术与工程》 北大核心 2021年第22期9425-9431,共7页
多智能体路径规划旨在解决多个智能体在同一工作空间内生成无碰撞路径的问题,是智能体无人化工作的关键支撑技术。基于回溯思想和自适应局部避障策略,提出了一种双阶段多智能体路径规划算法。在全局路径规划阶段,基于回溯思想改进的RRT*... 多智能体路径规划旨在解决多个智能体在同一工作空间内生成无碰撞路径的问题,是智能体无人化工作的关键支撑技术。基于回溯思想和自适应局部避障策略,提出了一种双阶段多智能体路径规划算法。在全局路径规划阶段,基于回溯思想改进的RRT*(rapidly-exploring random trees star)算法(back tracking rapidly-exploring random trees star,BT-RRT*),减少无效父节点,并确保各智能体生成优化的无碰撞路径。在协作避障阶段,智能体依据自身的任务优先级制定局部避障策略,避开动态障碍物和其他智能体。实验结果表明,该算法可成功寻找较优路径,还可降低避障时间。 展开更多
关键词 多智能 路径规划 BT-RRT*(back tracking rapidly-exploring random trees star)算法 优先级 局部避障
在线阅读 下载PDF
Web3D山地场景中多智能体mACO路径规划算法 被引量:1
14
作者 闫丰亭 贾金原 《系统仿真学报》 CAS CSCD 北大核心 2016年第10期2312-2320,共9页
山地场景数据量大,路径规划算法复杂,难以在网页上精确显示,通常采用的基于等高线的势能路径规划,往往得不到最优路径,且容易被隔断在悬崖下面。为解决以上问题,提出并实现了Web3D上的mACO(mountain ACO)路径规划算法,并在Web3D上实现... 山地场景数据量大,路径规划算法复杂,难以在网页上精确显示,通常采用的基于等高线的势能路径规划,往往得不到最优路径,且容易被隔断在悬崖下面。为解决以上问题,提出并实现了Web3D上的mACO(mountain ACO)路径规划算法,并在Web3D上实现了基于平面网格的pgACO(planar grid ACO)路径规划算法,以及一个Web3D上的A*路径规划算法。再以典型战斗场景为案例,针对mACO算法、pgACO算法以及A*算法,就实现效果、效率、网页刷新率(FPS)做了对比实验,结果显示,三种算法均可达到实时性,但mACO算法规划的路径更加精确。最后根据规划出来的最优路径,采用leader-follower思想,在Web3D上实现了实时高效的多智能体路径规划方案。 展开更多
关键词 Web3D山地场景 mACO算法 平面网格pgACO算法 A*算法 多智能路径规划
在线阅读 下载PDF
改进分层合作A*的无人机交通管理中路径规划
15
作者 陈明 何宁 +2 位作者 宏晨 肖明明 景竑元 《计算机工程与应用》 北大核心 2025年第6期361-368,共8页
针对无人机交通管理中飞行前冲突探测与解脱问题,表示为一种新的多智能体路径规划扩展模型,提出一种连续时间分层合作A*(continuous-time hierarchical cooperative A*,CHCA*)算法。面向连续时间,智能体在度量空间中的位置之间以最大速... 针对无人机交通管理中飞行前冲突探测与解脱问题,表示为一种新的多智能体路径规划扩展模型,提出一种连续时间分层合作A*(continuous-time hierarchical cooperative A*,CHCA*)算法。面向连续时间,智能体在度量空间中的位置之间以最大速度持续移动;考虑智能体的大小形状,以空间是否覆盖判定智能体冲突;优化搜索启发值计算。实验表明,CHCA*单次路径规划成功率高于CCBS,适合大规模智能体路径规划求解;在日本仙台2030无人机空运预测模型上仿真实验表明,对于一天内32887个随机请求,CHCA*算法规划成功率可达96%。 展开更多
关键词 多智能路径规划(mapf) 无人机交通管理(UTM) 改进分层合作A*算法 冲突探测 冲突解脱 连续时间
在线阅读 下载PDF
面向多网联无人机的MADRL协同路径规划算法
16
作者 李安 余传鑫 陈成 《西安电子科技大学学报》 北大核心 2025年第3期163-175,共13页
针对多架网联无人机执行多个动态目标点巡航监测任务的协同路径规划问题,文中提出了一种基于多智能体深度强化学习的协同动态目标分配与路径规划算法。具体而言,首先对多架CUAV对地通信系统环境建模,在CUAV与蜂窝网络通信连接约束、防... 针对多架网联无人机执行多个动态目标点巡航监测任务的协同路径规划问题,文中提出了一种基于多智能体深度强化学习的协同动态目标分配与路径规划算法。具体而言,首先对多架CUAV对地通信系统环境建模,在CUAV与蜂窝网络通信连接约束、防碰撞等移动性约束下,构建多架CUAV任务完成总时间和总中断时间加权和最小化优化问题。然后把优化问题离散化并转为马尔可夫博弈。为解决所构建的组合优化问题,提出了基于深度确定性策略梯度的系列算法,有效地处理CUAV之间的合作与竞争关系,且引入一个共享经验池,以提高算法的稳定性和学习效率。仿真实验验证了所提出的MADRL框架在多架CUAV协同路径规划的可行性、有效性和鲁棒性。研究表明:多智能体双延迟-确定策略梯度算法在动态目标位置的协同目标分配与路径规划中具有更好的效果。 展开更多
关键词 无人机 强化学习 网联无人机 多智能深度强化学习 路径规划 动态目标分配
在线阅读 下载PDF
多智能体强化学习飞行路径规划算法 被引量:8
17
作者 李东华 江驹 姜长生 《电光与控制》 北大核心 2009年第10期10-14,共5页
为了减轻现代空战中大量信息处理给飞行员带来的负担,同时为了实现无人机航路自主规划,提出了一种基于多智能体强化学习理论的飞行路径规划算法。该算法采用多智能体强化学习的方法,采用两个功能不同的智能体,分别对应局部和全局路径规... 为了减轻现代空战中大量信息处理给飞行员带来的负担,同时为了实现无人机航路自主规划,提出了一种基于多智能体强化学习理论的飞行路径规划算法。该算法采用多智能体强化学习的方法,采用两个功能不同的智能体,分别对应局部和全局路径规划。该算法对状态和动作空间进行划分和抽象,有效地减少了状态的数量,解决了强化学习维数灾难的问题。最后用Matlab对此算法进行了数字仿真,验证了算法的可行性,仿真实验结果显示该算法收敛速度快,能够解决飞行路径规划的任务。 展开更多
关键词 多智能系统 强化学习 路径规划 无人机 自主规划
在线阅读 下载PDF
基于多智能体系统的飞机滑行路径规划 被引量:9
18
作者 唐勇 何东林 朱新平 《江苏大学学报(自然科学版)》 EI CAS 北大核心 2019年第5期559-565,共7页
为解决先进场面活动引导与控制系统中的飞机滑行初始路径规划问题,提出一种基于多智能体系统(multi-agent system,MAS)仿真的方法实现飞机在场面上任意起始点到目的地的最短路径规划.首先,针对传统的有向图模型对机场场面运行刻画不足... 为解决先进场面活动引导与控制系统中的飞机滑行初始路径规划问题,提出一种基于多智能体系统(multi-agent system,MAS)仿真的方法实现飞机在场面上任意起始点到目的地的最短路径规划.首先,针对传统的有向图模型对机场场面运行刻画不足的问题,提出滑行资源图模型对机场控制区进行建模,既能对机场控制区进行高效建模又使模型不过于复杂.其次,设计最短路径规划多智能体系统,通过飞机Agent在资源节点Agent的繁殖能力与对资源的独占属性限制,实现对资源节点遍历并同时又保证每个节点最多被访问一次;最后,利用Anylogic实现机场场面初始路径规划多智能体仿真系统开发.仿真结果表明,设计的多智能体系统不但能快速计算出最短路径,且路径规划过程直观可视,算法复杂度与Dijkstra算法相同,满足初始路径规划要求. 展开更多
关键词 机场滑行路径规划 先进场面活动引导与控制系统 多智能系统 滑行资源图 系统仿真
在线阅读 下载PDF
基于改进CBS算法的多智能体路径规划 被引量:1
19
作者 王卓然 文家燕 +1 位作者 谢广明 蒋文宇 《智能系统学报》 CSCD 北大核心 2023年第6期1336-1343,共8页
在基于冲突的搜索(conflict-based search,CBS)算法中,冲突的选择具有随机性,导致CBS算法在多智能体路径规划方面的求解效率不佳。为此,本文提出一种改进CBS算法的多智能体路径规划算法。首先,基于冲突子节点的相关信息,提出了一种新的... 在基于冲突的搜索(conflict-based search,CBS)算法中,冲突的选择具有随机性,导致CBS算法在多智能体路径规划方面的求解效率不佳。为此,本文提出一种改进CBS算法的多智能体路径规划算法。首先,基于冲突子节点的相关信息,提出了一种新的冲突选择策略;然后,为发挥新策略的优势和进一步减少算法的运行时间,采用基于神经网络的RankNet算法来学习新策略,从而得到一个训练好的排序模型;最后,利用训练好的排序模型为CBS算法选择冲突。通过设计实验对改进CBS算法进行仿真验证,结果表明,所提改进算法相比于已有的改进算法,能够有效提高算法的求解效率。 展开更多
关键词 多智能 全局路径规划 基于冲突的搜索算法 改进基于冲突的搜索算法 机器学习 排序学习 RankNet算法 冲突选择策略
在线阅读 下载PDF
多智能体路径规划研究进展 被引量:24
20
作者 刘庆周 吴锋 《计算机工程》 CAS CSCD 北大核心 2020年第4期1-10,共10页
多智能体路径规划是一类寻找多个智能体从起始位置到目标位置且无冲突的最优路径集合的问题,针对该问题的研究在物流、军事和安防等领域有着大量的应用场景.对国内外关于多智能体路径规划问题的研究进展进行系统整理和分类,按照结果最... 多智能体路径规划是一类寻找多个智能体从起始位置到目标位置且无冲突的最优路径集合的问题,针对该问题的研究在物流、军事和安防等领域有着大量的应用场景.对国内外关于多智能体路径规划问题的研究进展进行系统整理和分类,按照结果最优性的不同,多智能体路径规划算法被分为最优算法和近似算法2类.最优的多智能体路径规划算法主要分为基于A*搜索、基于代价增长树、基于冲突搜索和基于规约的4种算法.近似的多智能体路径规划算法主要分为无边界次优的算法和有边界次优的算法2类.基于上述分类,分析各种算法的特点,介绍近年来具有代表性的研究成果,并对多智能体路径规划问题未来的研究方向进行展望. 展开更多
关键词 多智能路径规划 人工智能 搜索 最优路径集合 多机器人
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部