-
题名智能优化策略的比较
被引量:2
- 1
-
-
作者
崔明义
叶克江
上官艳丽
-
机构
河南财经学院计算机科学系
-
出处
《计算机应用与软件》
CSCD
北大核心
2004年第7期10-11,119,共3页
-
基金
国家自然科学基金资助 (编号 :50 1 0 4 0 1 1 )
-
文摘
智能优化是从诸多新兴学科衍生出来的前沿科学 ,本文研究了智能优化的策略 ,对计算智能策略进行了分析比较 ,并举出了在工程实践中用这些策略进行智能优化的实例 ,从中得出有意义的结论。
-
关键词
智能控制策略
启发式搜索策略
人工智能
智能优化策略
自动控制
数学模型
-
Keywords
Intelligence optimization Strategy Comparison Computational intelligence
-
分类号
TP273.5
[自动化与计算机技术—检测技术与自动化装置]
-
-
题名智能协调优化策略在预焙铝电解控制中的应用
被引量:1
- 2
-
-
作者
袁艳
张泰山
-
机构
中南大学信息科学与工程学院
-
出处
《小型微型计算机系统》
CSCD
北大核心
2009年第6期1244-1248,共5页
-
基金
国家杰出青年科学基金资助项目(60425310)资助
-
文摘
设计预焙铝电解生产过程先进控制系统的总体结构,针对电解槽有关参数的优化控制和产量质量能耗优化控制问题,提出基于模糊专家控制技术的智能协调优化控制策略以满足全局优化的控制目标.实验结果表明,系统能有效地实现预焙铝电解槽的优化控制,实现槽状态在线解析,并能达到优良的生产控制指标.
-
关键词
预焙铝电解智
智能协调优化控制策略
模糊专家控制技术
-
Keywords
pre-baked aluminium electrolysis ~ intelligent coordination optimizing control strategy
fuzzy-expert control technology
-
分类号
TP273.4
[自动化与计算机技术—检测技术与自动化装置]
TP273.5
[自动化与计算机技术—检测技术与自动化装置]
-
-
题名一种基于深度强化学习的协同制导策略
- 3
-
-
作者
谭明虎
艾文洁
何昊麟
李浩宇
王靖宇
-
机构
西北工业大学航天学院
-
出处
《宇航学报》
北大核心
2025年第6期1203-1213,共11页
-
文摘
针对在速度不可控条件下的多弹协同打击问题,提出了一种基于深度强化学习的多弹协同制导策略生成方法。基于多智能体近端策略优化算法,通过构建连续动作空间的智能协同制导框架,设计了一种启发式重塑的奖励函数来引导多枚导弹有效协同打击目标,以解决对制导环境因奖励信号稀疏导致的学习效率低下问题。最后,提出基于多阶段课程学习的智能体平滑动作方法,有效解决强化学习中由独立采样引起的动作抖动问题。仿真实验表明,在随机初始条件范围内,基于深度强化学习制导律生成的协同制导策略可以成功实现对目标的协同攻击。
-
关键词
导弹
协同制导
深度强化学习
多智能体近端策略优化
-
Keywords
Missile
Cooperative guidance
Deep reinforcement learning
Multi-agent proximal policy optimization
-
分类号
V249.7
[航空宇航科学与技术—飞行器设计]
-
-
题名基于多智能体深度强化学习的无人机路径规划
被引量:9
- 4
-
-
作者
司鹏搏
吴兵
杨睿哲
李萌
孙艳华
-
机构
北京工业大学信息学部
-
出处
《北京工业大学学报》
CAS
CSCD
北大核心
2023年第4期449-458,共10页
-
基金
国家自然科学基金资助项目(61901011)
北京市教育委员会科技项目(KM202010005017,KM202110005021)。
-
文摘
为解决多无人机(unmanned aerial vehicle, UAV)在复杂环境下的路径规划问题,提出一个多智能体深度强化学习UAV路径规划框架.该框架首先将路径规划问题建模为部分可观测马尔可夫过程,采用近端策略优化算法将其扩展至多智能体,通过设计UAV的状态观测空间、动作空间及奖赏函数等实现多UAV无障碍路径规划;其次,为适应UAV搭载的有限计算资源条件,进一步提出基于网络剪枝的多智能体近端策略优化(network pruning-based multi-agent proximal policy optimization, NP-MAPPO)算法,提高了训练效率.仿真结果验证了提出的多UAV路径规划框架在各参数配置下的有效性及NP-MAPPO算法在训练时间上的优越性.
-
关键词
无人机(unmanned
aerial
vehicle
UAV)
复杂环境
路径规划
马尔可夫决策过程
多智能体近端策略优化算法(multi-agent
proximal
policy
optimization
MAPPO)
网络剪枝(network
pruning
NP)
-
Keywords
unmanned aerial vehicle(UAV)
complex environment
path planning
Markov decision process
multi-agent proximal policy optimization(MAPPO)algorithm
network pruning(NP)
-
分类号
U461
[机械工程—车辆工程]
TP308
[自动化与计算机技术—计算机系统结构]
-
-
题名基于强化学习的多园区综合能源系统经济调度
被引量:1
- 5
-
-
作者
王丙文
付明
黄堃
-
机构
南瑞集团有限公司(国网电力科学研究院)
-
出处
《电测与仪表》
北大核心
2024年第9期32-39,共8页
-
基金
国家重点研发计划项目(2018YFB0905000)。
-
文摘
多园区综合能源系统中新能源出力与负荷的波动性以及多种能量之间的耦合关系,给多园区综合能源系统的优化调度带来诸多挑战。为此提出一种基于数据驱动的多智能体近端策略优化(multi-agent proximal policy optimization,MAPPO)多园区综合能源系统经济调度方法。文章综合考虑园区间的能量交易与碳市场交易,以园区日运行成本最小为目标,建立多园区综合能源系统实时优化调度模型;将该优化问题建模为马尔科夫决策过程,并设计状态空间、动作空间以及奖励函数,通过大量历史数据的训练得到多园区综合能源系统优化调度神经网络模型,实现多园区分散式实时优化调度。仿真结果表明:在新能源出力与负荷随机性波动影响下,所提方法能够在降低各园区运行成本的同时减少园区间的信息交互,有助于提高各园区隐私信息的安全性。
-
关键词
多园区综合能源系统
实时经济调度
强化学习
多智能体近端策略优化
-
Keywords
multi-area integrated energy system
real-time economic dispatch
reinforcement learning
multi-agent proximal policy optimization
-
分类号
TM73
[电气工程—电力系统及自动化]
TK018
[动力工程及工程热物理]
-
-
题名基于自监督任务最优选择的无监督域自适应方法
- 6
-
-
作者
吴兰
王涵
李斌全
-
机构
河南工业大学电气工程学院
-
出处
《计算机科学》
CSCD
北大核心
2021年第S01期357-363,共7页
-
基金
国家自然科学基金(61973103)
河南省中原青年拔尖人才计划(19A120002)。
-
文摘
无监督域自适应方法通过源域标签数据学习到的知识对目标域无标签数据进行分类,成为目前迁移学习中解决两个域特征对齐的主流方法。针对现实中存在已标签数据量少且质量不高造成提取的特征不完备的情况,文中提出了基于自监督任务最优选择的无监督域自适应方法。为使特征具有更强的语义信息,在两个域未标记数据上使用了多个自监督任务;此外,针对进行自监督任务时的易混淆特征,提出了一种新的智能组合优化策略自适应地选择有效特征;最后通过两个域沿着任务相关方向靠近使得源域标记数据训练的分类器能够更好地推广到目标域。仿真实验在公开的6个基准数据集上分别从分类精度、训练集数据使用量、自监督任务使用效果3个方面进行了对比分析。实验结果表明,所提方法在3个方面上的表现都优于现有的先进方法,使用相同数据集时分类精度提高8%;在相同的分类精度要求下,所用数据量减少12%;与单个自监督任务对比时精度提高了11%。
-
关键词
迁移学习
自监督任务
无监督域自适应
语义信息
智能组合优化策略
-
Keywords
Transfer learning
Self-supervised task
Unsupervised domain adaptation
Semantic information
Intelligent combination optimization strategy
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-