期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于次优策略的动态分步强化学习路径规划算法
1
作者 王天孜 史红权 +1 位作者 张思洁 陈爱国 《电子科技大学学报》 2025年第5期671-675,共5页
强化学习允许智能体在未知环境中进行路径规划,智能体能够使用与环境交互所得到的信息自主调整策略并找到最优路径。然而,大多数基于强化学习的路径规划任务都面临着稀疏奖励的问题,即获取外部奖励以及有效训练样本的难度大,这使得算法... 强化学习允许智能体在未知环境中进行路径规划,智能体能够使用与环境交互所得到的信息自主调整策略并找到最优路径。然而,大多数基于强化学习的路径规划任务都面临着稀疏奖励的问题,即获取外部奖励以及有效训练样本的难度大,这使得算法迭代缓慢,甚至难以收敛。为此,提出了一种基于次优策略的动态分步强化学习路径规划算法,该算法通过动态分步的方法将次优策略引入到强化学习框架下,并设计内在奖励鼓励智能体探索优于次优策略的新策略。实验结果表明,与基线算法相比,该算法有着更好的表现,智能体系统获得的奖励更高,策略收敛速度更快。 展开更多
关键词 动态分步 路径规划 强化学习 次优策略
在线阅读 下载PDF
插电式混合动力汽车的次优能量管理策略 被引量:6
2
作者 吴进军 颜丙杰 +4 位作者 方继根 王西峰 谢志鹏 史洋 李亮 《中国机械工程》 EI CAS CSCD 北大核心 2019年第11期1336-1342,共7页
从实际应用角度出发,针对插电式混合动力汽车提出了一种次优能量管理策略,借助随机动态规划获得了最优的挡位与功率分配,提出了算法内部约束与外部修正相结合的方法来解决最优策略在实际应用中可能出现的频繁升降挡问题,并采用瞬时优化... 从实际应用角度出发,针对插电式混合动力汽车提出了一种次优能量管理策略,借助随机动态规划获得了最优的挡位与功率分配,提出了算法内部约束与外部修正相结合的方法来解决最优策略在实际应用中可能出现的频繁升降挡问题,并采用瞬时优化算法解决换挡过程中的最优功率分配问题。研究结果表明:与传统的瞬时优化控制策略相比,所提策略的燃油经济性有显著的提升效果。 展开更多
关键词 插电式混合动力汽车 次优能量管理策略 随机动态规划 瞬时优化
在线阅读 下载PDF
火电厂主蒸汽压力的LQ次优调节策略
3
作者 李阳春 施可登 杨启文 《动力工程》 CSCD 北大核心 2004年第3期375-378,共4页
主蒸汽压力是火电厂热工自动化中非常重要的参数,但是具有大惯性、纯迟延等特性,是一个比较难调的对象。基于主蒸汽压力降阶近似模型和二次型最优控制原理,给出了主蒸汽压力的LQ次优调节策略。实验研究表明:该策略调节效果令人满意,非... 主蒸汽压力是火电厂热工自动化中非常重要的参数,但是具有大惯性、纯迟延等特性,是一个比较难调的对象。基于主蒸汽压力降阶近似模型和二次型最优控制原理,给出了主蒸汽压力的LQ次优调节策略。实验研究表明:该策略调节效果令人满意,非常适用于变压运行的机组。 展开更多
关键词 自动控制技术 火电厂 主蒸汽压力 LQ次优调节策略 降阶近似模型 二次型最优控制原理
在线阅读 下载PDF
考虑随机返工与紧急插单的可抢占设计项目群调度
4
作者 王小明 朱松平 +1 位作者 陈庆新 毛宁 《计算机集成制造系统》 EI CSCD 北大核心 2024年第6期2044-2055,共12页
鉴于多项目并行以及因随机返工和紧急插单而导致的任务抢占特征,使设计项目群调度问题难以求解,而传统随机动态规划方法因维数灾难只能获得小规模问题的最优策略,为构造面向大规模问题的高效近似方法,提出将原随机调度问题近似分解为各... 鉴于多项目并行以及因随机返工和紧急插单而导致的任务抢占特征,使设计项目群调度问题难以求解,而传统随机动态规划方法因维数灾难只能获得小规模问题的最优策略,为构造面向大规模问题的高效近似方法,提出将原随机调度问题近似分解为各个状态下的确定性调度子问题,从而获得原问题的次优策略。建立了确定性调度子问题的混合整数规划模型,并提出基于元启发式算法和优先规则的求解方法。基于标准测试集PSPLIB设计了多组计算实验,在不同调度环境下验证了所构建模型和算法的有效性。实验结果表明,元启发式算法不但在单项目平均拖期比目标下较最优规则提升了12%以上,而且具有较高的计算效率,能够满足实际决策需求。 展开更多
关键词 设计项目 随机返工 紧急插单 可抢占调度 次优策略
在线阅读 下载PDF
基于连锁环网与改进离散粒子群算法的多目标配电网重构 被引量:29
5
作者 徐泽 杨伟 +1 位作者 张文强 陈盛凯 《电力系统保护与控制》 CSCD 北大核心 2021年第6期114-123,共10页
配电网重构本质上是一个复杂的高维数非线性组合优化问题。为避免其不可行解的影响,同时实现快速寻优,提出了一种通过连锁环网矩阵快速判断粒子是否满足配电网拓扑约束的方法。采用基于Pareto准则的离散二进制粒子群算法(Binary Particl... 配电网重构本质上是一个复杂的高维数非线性组合优化问题。为避免其不可行解的影响,同时实现快速寻优,提出了一种通过连锁环网矩阵快速判断粒子是否满足配电网拓扑约束的方法。采用基于Pareto准则的离散二进制粒子群算法(Binary Particle Swarm Optimization,BPSO)以求解配电网重构多目标优化问题。从三方面对BPSO算法进行改进:改进粒子更新策略以提升新代粒子的可行概率;改进sigmoid函数同时提出邻域搜索机制以强化算法后期的收敛能力;提出基于次优解保留策略的小生境共享机制以改进群体最优粒子更新方式,进而强化算法的全局搜索能力。对IEEE33系统算例进行仿真,结果表明改进BPSO算法在求解含分布式电源(Distributed Generation,DG)的配电网重构多目标优化问题时,能够更加精确高效地收敛至Pareto最优前沿。 展开更多
关键词 连锁环网矩阵 多目标配电网重构 Pareto准则 改进离散粒子群算法 次优解保留策略 小生境共享机制 邻域搜索机制
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部