检索结果-维普期刊中文期刊服务平台

基于次优策略的动态分步强化学习路径规划算法: 1; 作者王天孜史红权 +1 位作者张思洁陈爱国《电子科技大学学报》 2025年第5期671-675,共5页; 强化学习允许智能体在未知环境中进行路径规划,智能体能够使用与环境交互所得到的信息自主调整策略并找到最优路径。然而,大多数基于强化学习的路径规划任务都面临着稀疏奖励的问题,即获取外部奖励以及有效训练样本的难度大,这使得算法... 展开更多; 关键词动态分步路径规划强化学习次优策略; 在线阅读下载PDF 职称材料

插电式混合动力汽车的次优能量管理策略被引量：6: 2; 作者吴进军颜丙杰 +4 位作者方继根王西峰谢志鹏史洋李亮《中国机械工程》 EI CAS CSCD 北大核心 2019年第11期1336-1342,共7页; 从实际应用角度出发,针对插电式混合动力汽车提出了一种次优能量管理策略,借助随机动态规划获得了最优的挡位与功率分配,提出了算法内部约束与外部修正相结合的方法来解决最优策略在实际应用中可能出现的频繁升降挡问题,并采用瞬时优化... 展开更多; 关键词插电式混合动力汽车次优能量管理策略随机动态规划瞬时优化; 在线阅读下载PDF 职称材料

火电厂主蒸汽压力的LQ次优调节策略: 3; 作者李阳春施可登杨启文《动力工程》 CSCD 北大核心 2004年第3期375-378,共4页; 主蒸汽压力是火电厂热工自动化中非常重要的参数,但是具有大惯性、纯迟延等特性,是一个比较难调的对象。基于主蒸汽压力降阶近似模型和二次型最优控制原理,给出了主蒸汽压力的LQ次优调节策略。实验研究表明:该策略调节效果令人满意,非... 展开更多; 关键词自动控制技术火电厂主蒸汽压力 LQ次优调节策略降阶近似模型二次型最优控制原理; 在线阅读下载PDF 职称材料

考虑随机返工与紧急插单的可抢占设计项目群调度: 4; 作者王小明朱松平 +1 位作者陈庆新毛宁《计算机集成制造系统》 EI CSCD 北大核心 2024年第6期2044-2055,共12页; 鉴于多项目并行以及因随机返工和紧急插单而导致的任务抢占特征,使设计项目群调度问题难以求解,而传统随机动态规划方法因维数灾难只能获得小规模问题的最优策略,为构造面向大规模问题的高效近似方法,提出将原随机调度问题近似分解为各... 展开更多; 关键词设计项目随机返工紧急插单可抢占调度次优策略; 在线阅读下载PDF 职称材料

基于连锁环网与改进离散粒子群算法的多目标配电网重构被引量：29: 5; 作者徐泽杨伟 +1 位作者张文强陈盛凯《电力系统保护与控制》 CSCD 北大核心 2021年第6期114-123,共10页; 配电网重构本质上是一个复杂的高维数非线性组合优化问题。为避免其不可行解的影响,同时实现快速寻优,提出了一种通过连锁环网矩阵快速判断粒子是否满足配电网拓扑约束的方法。采用基于Pareto准则的离散二进制粒子群算法(Binary Particl... 展开更多; 关键词连锁环网矩阵多目标配电网重构 Pareto准则改进离散粒子群算法次优解保留策略小生境共享机制邻域搜索机制; 在线阅读下载PDF 职称材料

题名基于次优策略的动态分步强化学习路径规划算法: 1; 作者王天孜史红权张思洁陈爱国; 机构电子科技大学计算机科学与工程学院; 出处《电子科技大学学报》 2025年第5期671-675,共5页; 基金国家自然科学基金(U19A2059) 四川省科技计划(206999977)。; 文摘强化学习允许智能体在未知环境中进行路径规划,智能体能够使用与环境交互所得到的信息自主调整策略并找到最优路径。然而,大多数基于强化学习的路径规划任务都面临着稀疏奖励的问题,即获取外部奖励以及有效训练样本的难度大,这使得算法迭代缓慢,甚至难以收敛。为此,提出了一种基于次优策略的动态分步强化学习路径规划算法,该算法通过动态分步的方法将次优策略引入到强化学习框架下,并设计内在奖励鼓励智能体探索优于次优策略的新策略。实验结果表明,与基线算法相比,该算法有着更好的表现,智能体系统获得的奖励更高,策略收敛速度更快。; 关键词动态分步路径规划强化学习次优策略; Keywords dynamic stepwise path planning reinforcement learning suboptimal policy; 分类号 TP391 [自动化与计算机技术]; 在线阅读下载PDF 职称材料

题名插电式混合动力汽车的次优能量管理策略被引量：6: 2; 作者吴进军颜丙杰方继根王西峰谢志鹏史洋李亮; 机构中机生产力促进中心清华大学汽车安全与节能国家重点实验室宁波吉利汽车研究开发有限公司东风汽车集团股份有限公司技术中心; 出处《中国机械工程》 EI CAS CSCD 北大核心 2019年第11期1336-1342,共7页; 基金国家智能制造专项(2317004S1J) 国家自然科学基金资助项目(51675293 +3 种基金 51475197) 2017YFB0103502 2017YFB0103902); 文摘从实际应用角度出发,针对插电式混合动力汽车提出了一种次优能量管理策略,借助随机动态规划获得了最优的挡位与功率分配,提出了算法内部约束与外部修正相结合的方法来解决最优策略在实际应用中可能出现的频繁升降挡问题,并采用瞬时优化算法解决换挡过程中的最优功率分配问题。研究结果表明:与传统的瞬时优化控制策略相比,所提策略的燃油经济性有显著的提升效果。; 关键词插电式混合动力汽车次优能量管理策略随机动态规划瞬时优化; Keywords plug-in hybrid electric vehicle sub-optimal energy management strategy stochastic dynamic programming(SDP) instantaneous optimization; 分类号 TP182 [自动化与计算机技术—控制理论与控制工程]; 在线阅读下载PDF 职称材料

题名火电厂主蒸汽压力的LQ次优调节策略: 3; 作者李阳春施可登杨启文; 机构浙江省火电建设公司河海大学常州分校; 出处《动力工程》 CSCD 北大核心 2004年第3期375-378,共4页; 文摘主蒸汽压力是火电厂热工自动化中非常重要的参数,但是具有大惯性、纯迟延等特性,是一个比较难调的对象。基于主蒸汽压力降阶近似模型和二次型最优控制原理,给出了主蒸汽压力的LQ次优调节策略。实验研究表明:该策略调节效果令人满意,非常适用于变压运行的机组。; 关键词自动控制技术火电厂主蒸汽压力 LQ次优调节策略降阶近似模型二次型最优控制原理; Keywords autocontrol technique power plant main steam pressure LQ sub-optimal regulation strategy degraded and approximate model linear quadratic optimal control theory; 分类号 TK39 [动力工程及工程热物理—热能工程]; 在线阅读下载PDF 职称材料

题名考虑随机返工与紧急插单的可抢占设计项目群调度: 4; 作者王小明朱松平陈庆新毛宁; 机构广东工业大学广东省计算机集成制造重点实验室; 出处《计算机集成制造系统》 EI CSCD 北大核心 2024年第6期2044-2055,共12页; 基金国家自然科学基金资助项目(71972053,61973089,51505090)。; 文摘鉴于多项目并行以及因随机返工和紧急插单而导致的任务抢占特征,使设计项目群调度问题难以求解,而传统随机动态规划方法因维数灾难只能获得小规模问题的最优策略,为构造面向大规模问题的高效近似方法,提出将原随机调度问题近似分解为各个状态下的确定性调度子问题,从而获得原问题的次优策略。建立了确定性调度子问题的混合整数规划模型,并提出基于元启发式算法和优先规则的求解方法。基于标准测试集PSPLIB设计了多组计算实验,在不同调度环境下验证了所构建模型和算法的有效性。实验结果表明,元启发式算法不但在单项目平均拖期比目标下较最优规则提升了12%以上,而且具有较高的计算效率,能够满足实际决策需求。; 关键词设计项目随机返工紧急插单可抢占调度次优策略; Keywords design project random rework urgent task preemptive scheduling suboptimal policy; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名基于连锁环网与改进离散粒子群算法的多目标配电网重构被引量：29: 5; 作者徐泽杨伟张文强陈盛凯; 机构南京理工大学自动化学院; 出处《电力系统保护与控制》 CSCD 北大核心 2021年第6期114-123,共10页; 基金国家电网公司科技项目资助(JSDL-XLFW-SQ-2016-10-092)。; 文摘配电网重构本质上是一个复杂的高维数非线性组合优化问题。为避免其不可行解的影响,同时实现快速寻优,提出了一种通过连锁环网矩阵快速判断粒子是否满足配电网拓扑约束的方法。采用基于Pareto准则的离散二进制粒子群算法(Binary Particle Swarm Optimization,BPSO)以求解配电网重构多目标优化问题。从三方面对BPSO算法进行改进:改进粒子更新策略以提升新代粒子的可行概率;改进sigmoid函数同时提出邻域搜索机制以强化算法后期的收敛能力;提出基于次优解保留策略的小生境共享机制以改进群体最优粒子更新方式,进而强化算法的全局搜索能力。对IEEE33系统算例进行仿真,结果表明改进BPSO算法在求解含分布式电源(Distributed Generation,DG)的配电网重构多目标优化问题时,能够更加精确高效地收敛至Pareto最优前沿。; 关键词连锁环网矩阵多目标配电网重构 Pareto准则改进离散粒子群算法次优解保留策略小生境共享机制邻域搜索机制; Keywords chain loops matrix multi-objective distribution network reconfiguration Pareto criterion improved BPSO sub-optimal solution retention strategy niche sharing mechanism neighborhood search mechanism; 分类号 TM73 [电气工程—电力系统及自动化] TP18 [自动化与计算机技术—控制理论与控制工程]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	基于次优策略的动态分步强化学习路径规划算法	王天孜史红权张思洁陈爱国	《电子科技大学学报》	2025		在线阅读下载PDF 职称材料
2	插电式混合动力汽车的次优能量管理策略	吴进军颜丙杰方继根王西峰谢志鹏史洋李亮	《中国机械工程》 EI CAS CSCD 北大核心	2019	6	在线阅读下载PDF 职称材料
3	火电厂主蒸汽压力的LQ次优调节策略	李阳春施可登杨启文	《动力工程》 CSCD 北大核心	2004	0	在线阅读下载PDF 职称材料
4	考虑随机返工与紧急插单的可抢占设计项目群调度	王小明朱松平陈庆新毛宁	《计算机集成制造系统》 EI CSCD 北大核心	2024	0	在线阅读下载PDF 职称材料
5	基于连锁环网与改进离散粒子群算法的多目标配电网重构	徐泽杨伟张文强陈盛凯	《电力系统保护与控制》 CSCD 北大核心	2021	29	在线阅读下载PDF 职称材料