期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
智能优化策略的比较 被引量:2
1
作者 崔明义 叶克江 上官艳丽 《计算机应用与软件》 CSCD 北大核心 2004年第7期10-11,119,共3页
智能优化是从诸多新兴学科衍生出来的前沿科学 ,本文研究了智能优化的策略 ,对计算智能策略进行了分析比较 ,并举出了在工程实践中用这些策略进行智能优化的实例 ,从中得出有意义的结论。
关键词 智能控制策略 启发式搜索策略 人工智能 智能优化策略 自动控制 数学模型
在线阅读 下载PDF
智能协调优化策略在预焙铝电解控制中的应用 被引量:1
2
作者 袁艳 张泰山 《小型微型计算机系统》 CSCD 北大核心 2009年第6期1244-1248,共5页
设计预焙铝电解生产过程先进控制系统的总体结构,针对电解槽有关参数的优化控制和产量质量能耗优化控制问题,提出基于模糊专家控制技术的智能协调优化控制策略以满足全局优化的控制目标.实验结果表明,系统能有效地实现预焙铝电解槽的优... 设计预焙铝电解生产过程先进控制系统的总体结构,针对电解槽有关参数的优化控制和产量质量能耗优化控制问题,提出基于模糊专家控制技术的智能协调优化控制策略以满足全局优化的控制目标.实验结果表明,系统能有效地实现预焙铝电解槽的优化控制,实现槽状态在线解析,并能达到优良的生产控制指标. 展开更多
关键词 预焙铝电解智 智能协调优化控制策略 模糊专家控制技术
在线阅读 下载PDF
一种基于深度强化学习的协同制导策略
3
作者 谭明虎 艾文洁 +2 位作者 何昊麟 李浩宇 王靖宇 《宇航学报》 北大核心 2025年第6期1203-1213,共11页
针对在速度不可控条件下的多弹协同打击问题,提出了一种基于深度强化学习的多弹协同制导策略生成方法。基于多智能体近端策略优化算法,通过构建连续动作空间的智能协同制导框架,设计了一种启发式重塑的奖励函数来引导多枚导弹有效协同... 针对在速度不可控条件下的多弹协同打击问题,提出了一种基于深度强化学习的多弹协同制导策略生成方法。基于多智能体近端策略优化算法,通过构建连续动作空间的智能协同制导框架,设计了一种启发式重塑的奖励函数来引导多枚导弹有效协同打击目标,以解决对制导环境因奖励信号稀疏导致的学习效率低下问题。最后,提出基于多阶段课程学习的智能体平滑动作方法,有效解决强化学习中由独立采样引起的动作抖动问题。仿真实验表明,在随机初始条件范围内,基于深度强化学习制导律生成的协同制导策略可以成功实现对目标的协同攻击。 展开更多
关键词 导弹 协同制导 深度强化学习 智能体近端策略优化
在线阅读 下载PDF
基于多智能体深度强化学习的无人机路径规划 被引量:9
4
作者 司鹏搏 吴兵 +2 位作者 杨睿哲 李萌 孙艳华 《北京工业大学学报》 CAS CSCD 北大核心 2023年第4期449-458,共10页
为解决多无人机(unmanned aerial vehicle, UAV)在复杂环境下的路径规划问题,提出一个多智能体深度强化学习UAV路径规划框架.该框架首先将路径规划问题建模为部分可观测马尔可夫过程,采用近端策略优化算法将其扩展至多智能体,通过设计UA... 为解决多无人机(unmanned aerial vehicle, UAV)在复杂环境下的路径规划问题,提出一个多智能体深度强化学习UAV路径规划框架.该框架首先将路径规划问题建模为部分可观测马尔可夫过程,采用近端策略优化算法将其扩展至多智能体,通过设计UAV的状态观测空间、动作空间及奖赏函数等实现多UAV无障碍路径规划;其次,为适应UAV搭载的有限计算资源条件,进一步提出基于网络剪枝的多智能体近端策略优化(network pruning-based multi-agent proximal policy optimization, NP-MAPPO)算法,提高了训练效率.仿真结果验证了提出的多UAV路径规划框架在各参数配置下的有效性及NP-MAPPO算法在训练时间上的优越性. 展开更多
关键词 无人机(unmanned aerial vehicle UAV) 复杂环境 路径规划 马尔可夫决策过程 智能体近端策略优化算法(multi-agent proximal policy optimization MAPPO) 网络剪枝(network pruning NP)
在线阅读 下载PDF
基于强化学习的多园区综合能源系统经济调度 被引量:1
5
作者 王丙文 付明 黄堃 《电测与仪表》 北大核心 2024年第9期32-39,共8页
多园区综合能源系统中新能源出力与负荷的波动性以及多种能量之间的耦合关系,给多园区综合能源系统的优化调度带来诸多挑战。为此提出一种基于数据驱动的多智能体近端策略优化(multi-agent proximal policy optimization,MAPPO)多园区... 多园区综合能源系统中新能源出力与负荷的波动性以及多种能量之间的耦合关系,给多园区综合能源系统的优化调度带来诸多挑战。为此提出一种基于数据驱动的多智能体近端策略优化(multi-agent proximal policy optimization,MAPPO)多园区综合能源系统经济调度方法。文章综合考虑园区间的能量交易与碳市场交易,以园区日运行成本最小为目标,建立多园区综合能源系统实时优化调度模型;将该优化问题建模为马尔科夫决策过程,并设计状态空间、动作空间以及奖励函数,通过大量历史数据的训练得到多园区综合能源系统优化调度神经网络模型,实现多园区分散式实时优化调度。仿真结果表明:在新能源出力与负荷随机性波动影响下,所提方法能够在降低各园区运行成本的同时减少园区间的信息交互,有助于提高各园区隐私信息的安全性。 展开更多
关键词 多园区综合能源系统 实时经济调度 强化学习 智能体近端策略优化
在线阅读 下载PDF
基于自监督任务最优选择的无监督域自适应方法
6
作者 吴兰 王涵 李斌全 《计算机科学》 CSCD 北大核心 2021年第S01期357-363,共7页
无监督域自适应方法通过源域标签数据学习到的知识对目标域无标签数据进行分类,成为目前迁移学习中解决两个域特征对齐的主流方法。针对现实中存在已标签数据量少且质量不高造成提取的特征不完备的情况,文中提出了基于自监督任务最优选... 无监督域自适应方法通过源域标签数据学习到的知识对目标域无标签数据进行分类,成为目前迁移学习中解决两个域特征对齐的主流方法。针对现实中存在已标签数据量少且质量不高造成提取的特征不完备的情况,文中提出了基于自监督任务最优选择的无监督域自适应方法。为使特征具有更强的语义信息,在两个域未标记数据上使用了多个自监督任务;此外,针对进行自监督任务时的易混淆特征,提出了一种新的智能组合优化策略自适应地选择有效特征;最后通过两个域沿着任务相关方向靠近使得源域标记数据训练的分类器能够更好地推广到目标域。仿真实验在公开的6个基准数据集上分别从分类精度、训练集数据使用量、自监督任务使用效果3个方面进行了对比分析。实验结果表明,所提方法在3个方面上的表现都优于现有的先进方法,使用相同数据集时分类精度提高8%;在相同的分类精度要求下,所用数据量减少12%;与单个自监督任务对比时精度提高了11%。 展开更多
关键词 迁移学习 自监督任务 无监督域自适应 语义信息 智能组合优化策略
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部