期刊文献+
共找到170篇文章
< 1 2 9 >
每页显示 20 50 100
人工智能赋能智慧国土空间规划的关键路径:AI智能体的构建 被引量:1
1
作者 陈志远 吴洪涛 +2 位作者 罗亚 余铁桥 李海禹 《规划师》 北大核心 2025年第2期28-36,共9页
通过分析AI智能体在国土空间规划行业领域的应用前景,提出国土空间规划智能体的定义、构建路径,探索国土空间规划智能问答、报告生成、智能核验、监测评估等智慧规划场景,为AI智能体技术在国土空间规划业务工作中的应用提供路径参考和... 通过分析AI智能体在国土空间规划行业领域的应用前景,提出国土空间规划智能体的定义、构建路径,探索国土空间规划智能问答、报告生成、智能核验、监测评估等智慧规划场景,为AI智能体技术在国土空间规划业务工作中的应用提供路径参考和方向指引。 展开更多
关键词 人工智能 智慧国土 国土空间规划 AI智能
在线阅读 下载PDF
人工智能赋能智慧国土空间规划的技术框架与业务应用
2
作者 柴勋 张姗琪 +2 位作者 侯静轩 雷庆雨 刘海涛 《规划师》 北大核心 2025年第2期1-9,共9页
深入研究人工智能在智慧国土空间规划中的应用,详细分析其在业务流程自动化、规划分析科学化与决策智能化等方面的作用。基于数据驱动和数字孪生技术,通过构建统一的国土空间信息底座、建设智能模型体系、构建国土空间规划智能体,赋能... 深入研究人工智能在智慧国土空间规划中的应用,详细分析其在业务流程自动化、规划分析科学化与决策智能化等方面的作用。基于数据驱动和数字孪生技术,通过构建统一的国土空间信息底座、建设智能模型体系、构建国土空间规划智能体,赋能“规划编制—规划审查—规划实施—公众参与”的全流程自动化,提出在规划全生命周期中运用人工智能提升工作效率和科学性的路径。应用实践表明,人工智能技术显著优化了规划分析过程,提升了决策质量,并有效促进了规划过程中的风险评估与方案优化。 展开更多
关键词 人工智能 智慧国土空间规划 智能模型 智能决策
在线阅读 下载PDF
基于数据驱动的多智能体规划识别与博弈围捕
3
作者 王勇 李尚昊 +1 位作者 徐伯辰 方浩 《北京理工大学学报》 北大核心 2025年第5期521-530,共10页
在进行实时对抗的任务中,对于敌方的动作识别较为困难,需要根据对方的移动轨迹或行为来分析对方的意图,预测其未来目标,构建规划策略库.针对此问题,提出基于数据驱动的多智能体识别算法,该算法首先采用基于自动机的特征提取方法,获得规... 在进行实时对抗的任务中,对于敌方的动作识别较为困难,需要根据对方的移动轨迹或行为来分析对方的意图,预测其未来目标,构建规划策略库.针对此问题,提出基于数据驱动的多智能体识别算法,该算法首先采用基于自动机的特征提取方法,获得规划需要的位置和任务信息;然后将规划识别问题转换为多分类问题,并从单智能体角度切入,给出了一种基于极端梯度提升(extreme gradient boosting,XGBoost)的多分类模型;之后,对于多智能体之间可能存在的合作行为,使用无监督学习的一种基于密度对噪声鲁棒的空间聚类算法(density-based spatial clustering of applications with noise,DBSCAN)对多智能体进行分簇,以促进协同合作.对于同簇智能体,构建了一种针对多智能体的多分类模型,完成对多智能体的目标预测.在获悉敌方目标后,提出基于博弈的围捕逼停算法,构建非合作动态博弈模型,通过求解纳什均衡得到应对敌方的最优策略.最后,通过仿真验证了所提出算法的有效性. 展开更多
关键词 数据驱动 多智能 规划识别 非合作博弈 纳什均衡
在线阅读 下载PDF
HEDAC的多智能体无人机轨迹规划
4
作者 李寅杰 常新宇 张淼 《机械设计与制造》 北大核心 2025年第5期327-334,340,共9页
为了实现高效多智能体的三维复杂结构检测,提出了一种基于热量方程驱动面积覆盖算法的多智能体无人机轨迹规划。多智能体热量方程驱动面积覆盖算法考虑了无人机参数和环境约束,产生了一些平滑、无碰撞的轨迹,它基于潜在视场方法,最大限... 为了实现高效多智能体的三维复杂结构检测,提出了一种基于热量方程驱动面积覆盖算法的多智能体无人机轨迹规划。多智能体热量方程驱动面积覆盖算法考虑了无人机参数和环境约束,产生了一些平滑、无碰撞的轨迹,它基于潜在视场方法,最大限度地减少了所需覆盖的空间,并且减少了检测时间。另外使用相机方向控制提升了轨迹生成的质量,该控制始终将相机引导到离结构的最近点。防撞目标被公式化为一个非线性优化问题,成功地防止了无人机之间以及有域边界的无人机之间的碰撞达到距离阈值。最后通过两个应用实例证明了提出方法的有效性。 展开更多
关键词 无人机 多智能 轨迹规划 结构检测
在线阅读 下载PDF
多目标多智能体路径规划方法
5
作者 张静 王祎 +1 位作者 陈子龙 李云松 《浙江大学学报(工学版)》 北大核心 2025年第8期1689-1697,共9页
为了实现高效地将任务分配给每个智能体,为智能体规划出尽可能短且不与其他智能体发生碰撞的路径,提出多目标多智能体路径规划方法.针对传统路径规划算法使用离散时间导致成功率低的问题,该算法定义连续时间下智能体间的冲突定义与解冲... 为了实现高效地将任务分配给每个智能体,为智能体规划出尽可能短且不与其他智能体发生碰撞的路径,提出多目标多智能体路径规划方法.针对传统路径规划算法使用离散时间导致成功率低的问题,该算法定义连续时间下智能体间的冲突定义与解冲突方式,在A^(*)算法的基础上引入安全间隔与标签的概念,使得A^(*)算法可以规划出满足连续时间约束的最优路径.针对多智能体路径规划问题中因碰撞检测、冲突避免造成的较大计算量,提出冲突分级策略,减少了算法求解过程中扩展的节点数量.实验结果表明,利用所提出的算法能够求解得到更优的解决方案,且该算法具有更好的适用性;在智能体分布密集的场景下,该算法表现出更低的路径总成本和更高的求解成功率. 展开更多
关键词 多智能系统 路径规划 任务分配 改进A^(*)算法 冲突搜索
在线阅读 下载PDF
基于自适应动态规划的一类非线性多智能体的事件触发控制
6
作者 陈炯 张飞建 王凯 《计算机应用与软件》 北大核心 2025年第7期155-160,共6页
针对一类非线性多智能体系统的最优控制设计基于事件触发的自适应动态规划的控制策略。该文设计基于事件触发的分布式最优控制器,不仅避免了冗余数据的传输还最小化每个智能体的性能函数;设计分布式多智能体性能指标函数并通过强化学习... 针对一类非线性多智能体系统的最优控制设计基于事件触发的自适应动态规划的控制策略。该文设计基于事件触发的分布式最优控制器,不仅避免了冗余数据的传输还最小化每个智能体的性能函数;设计分布式多智能体性能指标函数并通过强化学习的方法求得多智能体系统的HJB方程,从而获得系统的最优控制策略。通过Lyapunov方法和梯度下降法获得了基于事件触发的评价网络更新率,并证明了闭环控制系统的稳定性。最后通过MATLAB仿真实验验证了控制方法的有效性。 展开更多
关键词 非线性多智能 事件触发 自适应动态规划 神经网络
在线阅读 下载PDF
基于拥塞感知和缓存通信的多智能体路径规划
7
作者 张永良 李子文 +2 位作者 许家豪 江雨宸 崔滢 《计算机科学》 北大核心 2025年第8期317-325,共9页
多智能体路径规划任务(MAPF)是大规模机器人系统的重要组成部分。基于冲突搜索的传统规划器受限于计算时间,导致可扩展性低,而基于通信机制的多智能体强化学习策略显著改善了这一问题。随着任务规模的扩大,如何有效通信和避免拥塞成为... 多智能体路径规划任务(MAPF)是大规模机器人系统的重要组成部分。基于冲突搜索的传统规划器受限于计算时间,导致可扩展性低,而基于通信机制的多智能体强化学习策略显著改善了这一问题。随着任务规模的扩大,如何有效通信和避免拥塞成为基于学习方法的主要障碍。针对这些问题,提出了一种基于缓存通信并具备拥塞感知能力的分布式规划器(C3MAP),在合理降低通信频率的同时保持优异的求解成功率。具体而言,当且仅当智能体的可观测信息与上一次通信内容存在显著差异或接收到其他智能体传来的广播请求信号时,才对局部视野内的智能体进行广播通信;同时,引入拥塞信息作为局部可观测信息,以指导智能体避开拥塞区域。基准测试的实验结果表明,C3MAP在结构化场景中的求解成功率均高于90%,显著优于现有基于学习的方法,且在大规模场景实验中进一步验证了缓存通信机制优越的稳定性以及拥塞感知的有效性。 展开更多
关键词 多智能系统 路径规划 深度强化学习 拥塞感知 缓存通信
在线阅读 下载PDF
基于冲突避让的多智能体有效旁路规划
8
作者 刘春玲 裴萌韶 《计算机应用研究》 北大核心 2025年第7期2103-2108,共6页
针对狭窄环境中的多个智能体无法规避关键通道上的冲突,导致多智能体寻路效率低下的问题,提出了基于视场的冲突搜索有效旁路规划算法。在基于冲突搜索算法框架上层引入视场表示智能体的通信范围;通过扫描智能体通信范围内所有智能体的... 针对狭窄环境中的多个智能体无法规避关键通道上的冲突,导致多智能体寻路效率低下的问题,提出了基于视场的冲突搜索有效旁路规划算法。在基于冲突搜索算法框架上层引入视场表示智能体的通信范围;通过扫描智能体通信范围内所有智能体的多值决策图,判断智能体之间是否有共享资源的竞争,导致智能体之间的冲突;针对关键通道上多个智能体之间的冲突实施多值决策回溯冲突规避策略,通过扫描其多值决策图为阻碍关键通道的智能体找到次优路径或临时等待位置作为有效旁路进行避让。通过不同规模和结构的地图测试结果表明,多值决策回溯冲突规避策略可以有效减少智能体之间冲突的发生。在random-64-64-10和maze-128-128-10地图环境中,多个智能体求解路径的平均成功率相较于CBS-BP分别提高了10%和15.2%,证明所提算法可以有效避免冲突的发生,提高寻路成功率。 展开更多
关键词 基于冲突搜索 狭窄路段 有效旁路 多智能路径规划 临时等待位置 次优路径
在线阅读 下载PDF
基于多智能体强化学习的可移动基站智能规划与优化
9
作者 赵欣然 陈美娟 +1 位作者 袁志伟 朱晓荣 《电信科学》 北大核心 2025年第2期68-83,共16页
为了在城市环境中快速部署可移动基站并实现运维优化,针对终端用户移动带来的网络覆盖率下降问题与密集部署基站带来的干扰问题,提出了一种基于多智能体强化学习的网络覆盖规划与优化方法。在部署阶段,使用粒子群与果蝇混合优化算法,在... 为了在城市环境中快速部署可移动基站并实现运维优化,针对终端用户移动带来的网络覆盖率下降问题与密集部署基站带来的干扰问题,提出了一种基于多智能体强化学习的网络覆盖规划与优化方法。在部署阶段,使用粒子群与果蝇混合优化算法,在建站成本最小化的情况下确定基站最优站址;在运维阶段,设计了多智能体深度确定性策略梯度算法与轻量级梯度提升机算法的联合优化算法,根据终端接收信号强度优化站址,在性能指标仍无法达到要求时,能自动在合适位置新增基站。仿真结果表明,所提出的站址规划算法在覆盖率与服务率方面均优于传统启发式算法;所设计的联合运维优化算法在网络覆盖率恢复能力方面优于传统k均值(k-means)聚类算法,并且能适应更多场景。 展开更多
关键词 可移动基站 站址 规划 优化 多智能强化学习
在线阅读 下载PDF
一种结合选择性通信与冲突解决的多智能体路径规划方法
10
作者 王昱 张旭秀 《电子与信息学报》 北大核心 2025年第8期2830-2840,共11页
在动态密集场景中,路径规划方法面临计算复杂度高、系统可扩展性差等问题,尤其在障碍物密度大、智能体数量多的结构化环境中,易出现寻路效果不佳及碰撞死锁等现象。针对复杂场景下多智能体路径规划通信与动态冲突的双重挑战,该文提出一... 在动态密集场景中,路径规划方法面临计算复杂度高、系统可扩展性差等问题,尤其在障碍物密度大、智能体数量多的结构化环境中,易出现寻路效果不佳及碰撞死锁等现象。针对复杂场景下多智能体路径规划通信与动态冲突的双重挑战,该文提出一种基于选择性通信与冲突解决的多智能体路径规划方式(DCCPR)。该方法构建动态联合屏蔽补充决策机制,通过融合A^(*)算法生成的期望路径与双惩罚项强化学习,在实现任务目标的同时减少路径偏差;引入基于多层次动态加权的优先级冲突解决策略,结合初始距离优先级、任务Q值动态调整及轮流通行机制,有效处理系统中冲突情境。通过在训练期间从未见过的结构化地图上测试,相比决策因果通信(DCC)任务成功率提高约79%,平均回合步长降低了46.4%。 展开更多
关键词 多智能路径规划 强化学习 选择性通信 冲突解决
在线阅读 下载PDF
启发式搜索的多智能体异速轨迹规划
11
作者 鲁宇 匡金骏 +1 位作者 肖峣 龚建伟 《计算机工程与应用》 北大核心 2025年第2期344-354,共11页
在多智能体系统研究中,多智能体路径规划(multi-agent path finding,MAPF)是一个核心难题,其目标是为各个智能体规定独立路径,确保智能体在移动过程中不发生碰撞。这是一个NP难题,亟须高效解决算法。创新性地提出了一种多智能体路径规... 在多智能体系统研究中,多智能体路径规划(multi-agent path finding,MAPF)是一个核心难题,其目标是为各个智能体规定独立路径,确保智能体在移动过程中不发生碰撞。这是一个NP难题,亟须高效解决算法。创新性地提出了一种多智能体路径规划算法——启发式导向冲突搜索(heuristic guided conflict-based search,HG-CBS),以解决复杂的MAPF场景,如智能体移动速度不同或各条边的道路长度不同。为优化HG-CBS算法,构建了三种独特的启发式计算方法:(1)加权求和法,以所有启发式的加权总和作为最终启发式;(2)帕累托集合法,构建一个帕累托集并从中选择节点;(3)交替法,在搜索迭代过程中交替使用各种启发式。实验结果显示,相比于传统方法,带有启发值的HG-CBS在成功率、运行时间及扩展节点数量等关键性能指标上均表现更优。例如,在包含16个智能体的复杂场景下,HG-CBS-h3(交替法)将运行时间缩短了89%,将拓展节点的数目减少了95%。此外,随着场景复杂度的提升,HG-CBS-h3的性能优势更加明显。这些结果证明了HG-CBS算法的有效性和高效性,对多智能体轨迹规划问题具有显著的理论和应用价值。 展开更多
关键词 多智能路径规划 启发式导向冲突搜索 启发式搜索 帕累托集
在线阅读 下载PDF
基于自适应动态规划的多智能体系统协同控制研究
12
作者 杨晓惠 王彩霞 尹晓琳 《农机使用与维修》 2025年第6期37-41,共5页
传统多智能体系统(Multi-Agent Systems, MAS)控制方法难以应对复杂环境下的不确定性和动态性,本研究基于自适应动态规划理论,构建一个适用于MAS的自适应动态规划框架,并结合强化学习技术,设计一种基于数据驱动的分布式控制策略。其次... 传统多智能体系统(Multi-Agent Systems, MAS)控制方法难以应对复杂环境下的不确定性和动态性,本研究基于自适应动态规划理论,构建一个适用于MAS的自适应动态规划框架,并结合强化学习技术,设计一种基于数据驱动的分布式控制策略。其次利用神经网络逼近策略函数与值函数,实现智能体在未知环境中的在线学习与最优控制。相比于传统控制方法,基于自适应动态规划的协同控制策略能够在较少的先验知识下,自主学习最优策略,实现更优的控制性能。研究成果可为智能机器人、无人系统以及其他分布式控制场景提供新的理论与技术支持。 展开更多
关键词 智能系统 自适应动态规划 协同控制 强化学习 分布式控制
在线阅读 下载PDF
国土空间规划“新质人才”培养的科教创新综合体模式研究 被引量:3
13
作者 鲍海君 曹伟 《中国土地科学》 CSSCI CSCD 北大核心 2024年第8期135-144,共10页
研究目的:梳理数字生态文明时代国土空间规划人才培养的需求,结合国际经验、历史演进和现状特征,提出未来国土空间规划“新质人才”培养的主要思路和实现路径,以期为新质生产力时期国土空间规划人才培养提供理论支撑与实践参考。研究方... 研究目的:梳理数字生态文明时代国土空间规划人才培养的需求,结合国际经验、历史演进和现状特征,提出未来国土空间规划“新质人才”培养的主要思路和实现路径,以期为新质生产力时期国土空间规划人才培养提供理论支撑与实践参考。研究方法:文献理论研究法和系统实践分析法。研究结果:(1)数字生态文明背景下的国土空间规划亟需构建目标重塑、内容重构、模式重建的学科体系以及知识整合、通专融合、理践结合的人才培养体系;(2)当前国际规划学科体系与人才培养具有学科交叉、注重实践、满足社会、体系贯通、错位发展等特点;(3)我国规划学科先后经历古代规划知识延续与传承、近代规划理论引入与消化、现代规划学科雏形与形成、现代规划学科发展与成熟、现代规划学科转型与创新5个阶段。研究结论:(1)科教创新综合体人才培养模式遵循紧密植入型生态文明的现实逻辑、高度协调型空间治理的支撑逻辑、深度融合型精神传承的历史逻辑、系统耦合型人地关系的底层逻辑、持续颠覆型技术变革的发展逻辑5大学理逻辑;(2)科教创新综合体人才培养模式具有以深度协作为突出特征的专业融合、以优势互补为突出特征的校际融合、以双向奔赴为突出特征的城教融合、以需求导向为突出特征的产教融合、以创新赋能为突出特征的科教融合5大本质特征;(3)基于“战略引领、学科交叉、资源协同、机制创新”提出了国土空间规划“新质人才”培养的科教创新综合体模式的具体实施路径。 展开更多
关键词 新质生产力 国土空间规划 人才培养 科教创新综合模式
在线阅读 下载PDF
基于分层多智能体的多星联合任务规划架构研究 被引量:3
14
作者 付伟 贾洪志 +3 位作者 林晓勇 陈金勇 张超 岳群彬 《无线电通信技术》 北大核心 2024年第5期993-999,共7页
随着卫星规模、种类的不断增长,现有卫星任务规划技术架构已很难满足多类型卫星联合运用的有效性及可扩展性要求。通过深入分析多星任务筹划、单星任务规划、数传资源规划等环节,建立了基于分层多智能体的多星联合任务规划技术架构,设... 随着卫星规模、种类的不断增长,现有卫星任务规划技术架构已很难满足多类型卫星联合运用的有效性及可扩展性要求。通过深入分析多星任务筹划、单星任务规划、数传资源规划等环节,建立了基于分层多智能体的多星联合任务规划技术架构,设计了与架构匹配的相关优化算法及智能体功能实现机制,实现了多星联合任务规划能力。仿真实验及分析结果表明,该架构对多类型卫星联合任务规划场景有良好的适用性。 展开更多
关键词 卫星任务规划 多星联合任务规划 智能技术
在线阅读 下载PDF
基于图神经网络的多智能体路径规划方法
15
作者 禹鑫燚 刘飞 欧林林 《高技术通讯》 CAS 北大核心 2024年第10期1081-1090,共10页
在多智能体路径规划问题中,每个智能体需要互相协调来完成共同的全局目标,智能体之间通常需要显式的通信策略。传统的多智能体路径规划算法受限于实时性、扩展性、不完全通信等问题,很难适用于复杂的工作环境中。为了解决多智能体工作... 在多智能体路径规划问题中,每个智能体需要互相协调来完成共同的全局目标,智能体之间通常需要显式的通信策略。传统的多智能体路径规划算法受限于实时性、扩展性、不完全通信等问题,很难适用于复杂的工作环境中。为了解决多智能体工作环境中的通信问题,本文提出了一种基于图神经网络(GNN)的路径规划方法。该方法首先通过卷积神经网络(CNN)在局部观测中采集特征数据,由图神经网络在智能体之间传递这些数据。其次,为了减少智能体的惰性,提出了一种新的奖励函数,鼓励智能体更积极地探索并学习有效的协调策略。接着通过集中式收集数据训练、分布式执行提高学习效率。最后,进行多个环境下的仿真实验评估本文提出的算法,并与其他算法进行对比,验证了算法的有效性和可扩展性。 展开更多
关键词 路径规划 多智能强化学习 图神经网络(GNN) 多智能通信
在线阅读 下载PDF
多智能体模拟在规划师知识构建及空间规划决策支持中的应用--以日本地方城市老年人日护理中心空间战略规划为例 被引量:2
16
作者 马妍 沈振江 王珺玥 《现代城市研究》 CSSCI 北大核心 2016年第11期28-38,共11页
面向城市问题的复杂性和动态性,大量模拟仿真、定量分析等手段被广泛应用于城乡规划方案的预测与评价中,而其相应的预测评价结果也往往被认为有助于规划方案的调整与决策。在此过程中,仿真模型的构建逐渐从宏观向微观方向发展,对研究对... 面向城市问题的复杂性和动态性,大量模拟仿真、定量分析等手段被广泛应用于城乡规划方案的预测与评价中,而其相应的预测评价结果也往往被认为有助于规划方案的调整与决策。在此过程中,仿真模型的构建逐渐从宏观向微观方向发展,对研究对象的分析也逐渐体现出从群体性描述向个体行为特征、机理的刻画转变。但是这其中却鲜有学者探讨基于微观个体行为的仿真模拟究竟在规划方案的生成与决策过程中发挥怎样的作用,对规划师的知识构建是否能够有效地达到规划决策支持的目的。本研究从这一科学问题出发,基于一个面向养老日护理中心空间分布模拟的多智能体模型(Agent-Based Model,ABM)的构建与应用,探讨多智能体模拟仿真在空间规划实践中的应用可能及其构建机制。研究结果表明,多智能体模拟用于规划实践首先必须具有可信的、完整的数据支持;要达到辅助规划师建立对规划问题的科学认识,模型构建则应该在规划工作的最初开始介入,并让规划师参与其中;同时,多智能体模型的构建必须基于面向规划问题的现实决策过程。总体而言,多智能体模型可用于规划决策支持,但是模拟结果却不能代替规划方案。 展开更多
关键词 多智能模型 规划支持系统 日护理中心 生命周期
在线阅读 下载PDF
基于元启发式优化的机器人智能体无碰撞轨迹规划
17
作者 谢宗武 马博宇 +3 位作者 孙万东 杨晓航 姬一明 谢光虎 《载人航天》 CSCD 北大核心 2024年第4期510-515,共6页
针对机器人智能体在复杂三维环境中的安全运动,提出一种基于元启发式优化的无碰撞轨迹规划方案。轨迹点采用五次样条插值,以确保运动轨迹足够平滑,且起始点和目标点的速度与加速度均为零。以轨迹长度最短为优化目标,将轨迹与障碍物的最... 针对机器人智能体在复杂三维环境中的安全运动,提出一种基于元启发式优化的无碰撞轨迹规划方案。轨迹点采用五次样条插值,以确保运动轨迹足够平滑,且起始点和目标点的速度与加速度均为零。以轨迹长度最短为优化目标,将轨迹与障碍物的最近距离限制在约束条件中,从而表述为一个优化问题,并采用基于元启发式的灰狼算法进行求解。随后,在复杂的三维地形中对该方案开展2个模拟仿真。结果表明:该方案能够有效地在规划空间内求解出预定数目的最优轨迹插值点,通过五次样条插值形成的轨迹长度达到最短,且不与障碍物发生任何碰撞。 展开更多
关键词 机器人智能 轨迹规划 无碰撞 五次样条插值 灰狼算法 元启发式
在线阅读 下载PDF
基于博弈论与强化学习的多智能体路径规划算法 被引量:5
18
作者 熊文博 郭磊 焦彤宇 《深圳大学学报(理工版)》 CAS CSCD 北大核心 2024年第3期274-282,共9页
针对平面上多个智能体构成的路径规划求解算法普遍存在的速度慢效率低等问题进行研究,将多智能体路径规划问题归结为非零和随机博弈,使用多智能体强化学习算法赢或快速学习-策略爬山(win or learn fast-policy hill-climbing,WoLF-PHC)... 针对平面上多个智能体构成的路径规划求解算法普遍存在的速度慢效率低等问题进行研究,将多智能体路径规划问题归结为非零和随机博弈,使用多智能体强化学习算法赢或快速学习-策略爬山(win or learn fast-policy hill-climbing,WoLF-PHC)得到纳什均衡策略,为各智能体做出无冲突的最优路径决策,提出能够快速自适应的WoLF-PHC(fast adaptive WoLF-PHC,FA-WoLF-PHC)算法,通过构建目标函数,使用梯度下降对学习率进行自适应更新.在猜硬币和自定义收益矩阵2个博弈场景中使用FA-WoLF-PHC,并与策略爬山(policy hill-climbing,PHC)算法和Wolf-PHC算法进行比较.结果表明,FA-WoLF-PHC算法的学习速度较WoLF-PHC算法有所提升,并有效减小了WoLF-PHC算法和PHC算法在学习过程中出现的振荡现象.在多智能体路径规划问题中,FA-WoLF-PHC算法的学习速度比WoLF-PHC算法提高了16.01%.将路径规划问题的环境栅格地图扩大为6×6,智能体数量增加为3个时,FA-WoLF-PHC、WoLF-PSP和多头绒泡菌-人工势场Sarsa(physarum polycephalum-artificial potential state-action-reward-state-action,PP-AP Sarsa)算法在10次实验中学习到最终策略需要的平均时间分别为16.30、20.59和17.72 s.在多智能体路径规划问题中,FA-WoLF-PHC算法能够得到各智能体的纳什均衡策略,学习速度较WoLF-PSP和PP-AP Sarsa算法有显著提高.FA-WoLF-PHC算法在常见的博弈场景中能够快速获得纳什策略,在多智能体路径规划问题中可为多个智能体生成无冲突的最优路径,并且在学习速度等方面较其他算法有显著提高. 展开更多
关键词 人工智能 博弈论 动态规划 纳什均衡策略 强化学习 多智能路径规划
在线阅读 下载PDF
基于智能规划的多智能体强化学习算法 被引量:3
19
作者 辛沅霞 华道阳 张犁 《计算机科学》 CSCD 北大核心 2024年第5期179-192,共14页
目前深度强化学习算法在不同应用领域中已经取得诸多成果,然而在多智能体任务领域中,往往面临大规模的具有稀疏奖励的非稳态环境,低探索效率问题仍是一大挑战。由于智能规划能够根据任务的初始状态和目标状态快速制定出决策方案,该方案... 目前深度强化学习算法在不同应用领域中已经取得诸多成果,然而在多智能体任务领域中,往往面临大规模的具有稀疏奖励的非稳态环境,低探索效率问题仍是一大挑战。由于智能规划能够根据任务的初始状态和目标状态快速制定出决策方案,该方案能够作为各智能体的初始策略,并为其探索过程提供有效指导,因此尝试将智能规划与多智能体强化学习进行结合求解,并且提出统一模型UniMP(a Unified model for Multi-agent Reinforcement Learning and AI Planning)。在此基础上,设计并建立相应的问题求解机制。首先,将多智能体强化学习任务转化为智能决策任务;其次,对其执行启发式搜索,以得到一组宏观目标,进而指导强化学习的训练,使得各智能体能够进行更加高效的探索。在多智能体即时战略对抗场景StarCraftⅡ的各地图以及RMAICS战车模拟对战环境下进行实验,结果表明累计奖励值和胜率均有显著提升,从而验证了统一模型的可行性、求解机制的有效性以及所提算法灵活应对强化学习环境突发情况的能力。 展开更多
关键词 多智能强化学习 智能规划 启发式搜索 探索效率
在线阅读 下载PDF
面向空间布局优化的智能规划系统与应用
20
作者 晏龙旭 张尚武 +3 位作者 王颖 王德 胡杨 牟聆汀 《城市规划》 CSSCI CSCD 北大核心 2024年第10期26-35,共10页
国土空间规划需要加强空间布局优化研究,规划师应具备分析和评价方案空间绩效的能力。构建面向空间布局优化的智能规划模拟评价系统SimPlan,集成二十多种模型和七大维度评价体系,通过“智能模拟—智能评价—迭代优化”工作流,全面支持... 国土空间规划需要加强空间布局优化研究,规划师应具备分析和评价方案空间绩效的能力。构建面向空间布局优化的智能规划模拟评价系统SimPlan,集成二十多种模型和七大维度评价体系,通过“智能模拟—智能评价—迭代优化”工作流,全面支持总体空间布局统筹优化和向详细规划的精准传导落实。以鄂尔多斯市中心城区开发边界内详规统筹为案例开展应用,通过对总规空间布局方案的模拟评价和系统诊断,在用地调整、交通系统规划、空间结构、设施布局等多个方面提出了优化策略和指引,有效支撑了上下联动的空间布局统筹优化。认为SimPlan基本实现了可解释、善学习、能推广、高效率的设计目标,能够在国土空间规划实践中发挥重要作用,也为智能方案生成与优化奠定了方法论基础。 展开更多
关键词 国土空间规划 空间布局 方案评估 智能规划 SimPlan
在线阅读 下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部