期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
5
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于次优策略的动态分步强化学习路径规划算法
1
作者
王天孜
史红权
+1 位作者
张思洁
陈爱国
《电子科技大学学报》
2025年第5期671-675,共5页
强化学习允许智能体在未知环境中进行路径规划,智能体能够使用与环境交互所得到的信息自主调整策略并找到最优路径。然而,大多数基于强化学习的路径规划任务都面临着稀疏奖励的问题,即获取外部奖励以及有效训练样本的难度大,这使得算法...
强化学习允许智能体在未知环境中进行路径规划,智能体能够使用与环境交互所得到的信息自主调整策略并找到最优路径。然而,大多数基于强化学习的路径规划任务都面临着稀疏奖励的问题,即获取外部奖励以及有效训练样本的难度大,这使得算法迭代缓慢,甚至难以收敛。为此,提出了一种基于次优策略的动态分步强化学习路径规划算法,该算法通过动态分步的方法将次优策略引入到强化学习框架下,并设计内在奖励鼓励智能体探索优于次优策略的新策略。实验结果表明,与基线算法相比,该算法有着更好的表现,智能体系统获得的奖励更高,策略收敛速度更快。
展开更多
关键词
动态分步
路径规划
强化学习
次优策略
在线阅读
下载PDF
职称材料
插电式混合动力汽车的次优能量管理策略
被引量:
6
2
作者
吴进军
颜丙杰
+4 位作者
方继根
王西峰
谢志鹏
史洋
李亮
《中国机械工程》
EI
CAS
CSCD
北大核心
2019年第11期1336-1342,共7页
从实际应用角度出发,针对插电式混合动力汽车提出了一种次优能量管理策略,借助随机动态规划获得了最优的挡位与功率分配,提出了算法内部约束与外部修正相结合的方法来解决最优策略在实际应用中可能出现的频繁升降挡问题,并采用瞬时优化...
从实际应用角度出发,针对插电式混合动力汽车提出了一种次优能量管理策略,借助随机动态规划获得了最优的挡位与功率分配,提出了算法内部约束与外部修正相结合的方法来解决最优策略在实际应用中可能出现的频繁升降挡问题,并采用瞬时优化算法解决换挡过程中的最优功率分配问题。研究结果表明:与传统的瞬时优化控制策略相比,所提策略的燃油经济性有显著的提升效果。
展开更多
关键词
插电式混合动力汽车
次优
能量管理
策略
随机动态规划
瞬时优化
在线阅读
下载PDF
职称材料
火电厂主蒸汽压力的LQ次优调节策略
3
作者
李阳春
施可登
杨启文
《动力工程》
CSCD
北大核心
2004年第3期375-378,共4页
主蒸汽压力是火电厂热工自动化中非常重要的参数,但是具有大惯性、纯迟延等特性,是一个比较难调的对象。基于主蒸汽压力降阶近似模型和二次型最优控制原理,给出了主蒸汽压力的LQ次优调节策略。实验研究表明:该策略调节效果令人满意,非...
主蒸汽压力是火电厂热工自动化中非常重要的参数,但是具有大惯性、纯迟延等特性,是一个比较难调的对象。基于主蒸汽压力降阶近似模型和二次型最优控制原理,给出了主蒸汽压力的LQ次优调节策略。实验研究表明:该策略调节效果令人满意,非常适用于变压运行的机组。
展开更多
关键词
自动控制技术
火电厂
主蒸汽压力
LQ
次优
调节
策略
降阶近似模型
二次型最优控制原理
在线阅读
下载PDF
职称材料
考虑随机返工与紧急插单的可抢占设计项目群调度
4
作者
王小明
朱松平
+1 位作者
陈庆新
毛宁
《计算机集成制造系统》
EI
CSCD
北大核心
2024年第6期2044-2055,共12页
鉴于多项目并行以及因随机返工和紧急插单而导致的任务抢占特征,使设计项目群调度问题难以求解,而传统随机动态规划方法因维数灾难只能获得小规模问题的最优策略,为构造面向大规模问题的高效近似方法,提出将原随机调度问题近似分解为各...
鉴于多项目并行以及因随机返工和紧急插单而导致的任务抢占特征,使设计项目群调度问题难以求解,而传统随机动态规划方法因维数灾难只能获得小规模问题的最优策略,为构造面向大规模问题的高效近似方法,提出将原随机调度问题近似分解为各个状态下的确定性调度子问题,从而获得原问题的次优策略。建立了确定性调度子问题的混合整数规划模型,并提出基于元启发式算法和优先规则的求解方法。基于标准测试集PSPLIB设计了多组计算实验,在不同调度环境下验证了所构建模型和算法的有效性。实验结果表明,元启发式算法不但在单项目平均拖期比目标下较最优规则提升了12%以上,而且具有较高的计算效率,能够满足实际决策需求。
展开更多
关键词
设计项目
随机返工
紧急插单
可抢占调度
次优策略
在线阅读
下载PDF
职称材料
基于连锁环网与改进离散粒子群算法的多目标配电网重构
被引量:
29
5
作者
徐泽
杨伟
+1 位作者
张文强
陈盛凯
《电力系统保护与控制》
CSCD
北大核心
2021年第6期114-123,共10页
配电网重构本质上是一个复杂的高维数非线性组合优化问题。为避免其不可行解的影响,同时实现快速寻优,提出了一种通过连锁环网矩阵快速判断粒子是否满足配电网拓扑约束的方法。采用基于Pareto准则的离散二进制粒子群算法(Binary Particl...
配电网重构本质上是一个复杂的高维数非线性组合优化问题。为避免其不可行解的影响,同时实现快速寻优,提出了一种通过连锁环网矩阵快速判断粒子是否满足配电网拓扑约束的方法。采用基于Pareto准则的离散二进制粒子群算法(Binary Particle Swarm Optimization,BPSO)以求解配电网重构多目标优化问题。从三方面对BPSO算法进行改进:改进粒子更新策略以提升新代粒子的可行概率;改进sigmoid函数同时提出邻域搜索机制以强化算法后期的收敛能力;提出基于次优解保留策略的小生境共享机制以改进群体最优粒子更新方式,进而强化算法的全局搜索能力。对IEEE33系统算例进行仿真,结果表明改进BPSO算法在求解含分布式电源(Distributed Generation,DG)的配电网重构多目标优化问题时,能够更加精确高效地收敛至Pareto最优前沿。
展开更多
关键词
连锁环网矩阵
多目标配电网重构
Pareto准则
改进离散粒子群算法
次优
解保留
策略
小生境共享机制
邻域搜索机制
在线阅读
下载PDF
职称材料
题名
基于次优策略的动态分步强化学习路径规划算法
1
作者
王天孜
史红权
张思洁
陈爱国
机构
电子科技大学计算机科学与工程学院
出处
《电子科技大学学报》
2025年第5期671-675,共5页
基金
国家自然科学基金(U19A2059)
四川省科技计划(206999977)。
文摘
强化学习允许智能体在未知环境中进行路径规划,智能体能够使用与环境交互所得到的信息自主调整策略并找到最优路径。然而,大多数基于强化学习的路径规划任务都面临着稀疏奖励的问题,即获取外部奖励以及有效训练样本的难度大,这使得算法迭代缓慢,甚至难以收敛。为此,提出了一种基于次优策略的动态分步强化学习路径规划算法,该算法通过动态分步的方法将次优策略引入到强化学习框架下,并设计内在奖励鼓励智能体探索优于次优策略的新策略。实验结果表明,与基线算法相比,该算法有着更好的表现,智能体系统获得的奖励更高,策略收敛速度更快。
关键词
动态分步
路径规划
强化学习
次优策略
Keywords
dynamic stepwise
path planning
reinforcement learning
suboptimal policy
分类号
TP391 [自动化与计算机技术]
在线阅读
下载PDF
职称材料
题名
插电式混合动力汽车的次优能量管理策略
被引量:
6
2
作者
吴进军
颜丙杰
方继根
王西峰
谢志鹏
史洋
李亮
机构
中机生产力促进中心
清华大学汽车安全与节能国家重点实验室
宁波吉利汽车研究开发有限公司
东风汽车集团股份有限公司技术中心
出处
《中国机械工程》
EI
CAS
CSCD
北大核心
2019年第11期1336-1342,共7页
基金
国家智能制造专项(2317004S1J)
国家自然科学基金资助项目(51675293
+3 种基金
51475197)
国家重点研发计划资助项目(2016YFB010140X
2017YFB0103502
2017YFB0103902)
文摘
从实际应用角度出发,针对插电式混合动力汽车提出了一种次优能量管理策略,借助随机动态规划获得了最优的挡位与功率分配,提出了算法内部约束与外部修正相结合的方法来解决最优策略在实际应用中可能出现的频繁升降挡问题,并采用瞬时优化算法解决换挡过程中的最优功率分配问题。研究结果表明:与传统的瞬时优化控制策略相比,所提策略的燃油经济性有显著的提升效果。
关键词
插电式混合动力汽车
次优
能量管理
策略
随机动态规划
瞬时优化
Keywords
plug-in hybrid electric vehicle
sub-optimal energy management strategy
stochastic dynamic programming(SDP)
instantaneous optimization
分类号
TP182 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
火电厂主蒸汽压力的LQ次优调节策略
3
作者
李阳春
施可登
杨启文
机构
浙江省火电建设公司
河海大学常州分校
出处
《动力工程》
CSCD
北大核心
2004年第3期375-378,共4页
文摘
主蒸汽压力是火电厂热工自动化中非常重要的参数,但是具有大惯性、纯迟延等特性,是一个比较难调的对象。基于主蒸汽压力降阶近似模型和二次型最优控制原理,给出了主蒸汽压力的LQ次优调节策略。实验研究表明:该策略调节效果令人满意,非常适用于变压运行的机组。
关键词
自动控制技术
火电厂
主蒸汽压力
LQ
次优
调节
策略
降阶近似模型
二次型最优控制原理
Keywords
autocontrol technique
power plant
main steam pressure
LQ sub-optimal regulation strategy
degraded and approximate model
linear quadratic optimal control theory
分类号
TK39 [动力工程及工程热物理—热能工程]
在线阅读
下载PDF
职称材料
题名
考虑随机返工与紧急插单的可抢占设计项目群调度
4
作者
王小明
朱松平
陈庆新
毛宁
机构
广东工业大学广东省计算机集成制造重点实验室
出处
《计算机集成制造系统》
EI
CSCD
北大核心
2024年第6期2044-2055,共12页
基金
国家自然科学基金资助项目(71972053,61973089,51505090)。
文摘
鉴于多项目并行以及因随机返工和紧急插单而导致的任务抢占特征,使设计项目群调度问题难以求解,而传统随机动态规划方法因维数灾难只能获得小规模问题的最优策略,为构造面向大规模问题的高效近似方法,提出将原随机调度问题近似分解为各个状态下的确定性调度子问题,从而获得原问题的次优策略。建立了确定性调度子问题的混合整数规划模型,并提出基于元启发式算法和优先规则的求解方法。基于标准测试集PSPLIB设计了多组计算实验,在不同调度环境下验证了所构建模型和算法的有效性。实验结果表明,元启发式算法不但在单项目平均拖期比目标下较最优规则提升了12%以上,而且具有较高的计算效率,能够满足实际决策需求。
关键词
设计项目
随机返工
紧急插单
可抢占调度
次优策略
Keywords
design project
random rework
urgent task
preemptive scheduling
suboptimal policy
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于连锁环网与改进离散粒子群算法的多目标配电网重构
被引量:
29
5
作者
徐泽
杨伟
张文强
陈盛凯
机构
南京理工大学自动化学院
出处
《电力系统保护与控制》
CSCD
北大核心
2021年第6期114-123,共10页
基金
国家电网公司科技项目资助(JSDL-XLFW-SQ-2016-10-092)。
文摘
配电网重构本质上是一个复杂的高维数非线性组合优化问题。为避免其不可行解的影响,同时实现快速寻优,提出了一种通过连锁环网矩阵快速判断粒子是否满足配电网拓扑约束的方法。采用基于Pareto准则的离散二进制粒子群算法(Binary Particle Swarm Optimization,BPSO)以求解配电网重构多目标优化问题。从三方面对BPSO算法进行改进:改进粒子更新策略以提升新代粒子的可行概率;改进sigmoid函数同时提出邻域搜索机制以强化算法后期的收敛能力;提出基于次优解保留策略的小生境共享机制以改进群体最优粒子更新方式,进而强化算法的全局搜索能力。对IEEE33系统算例进行仿真,结果表明改进BPSO算法在求解含分布式电源(Distributed Generation,DG)的配电网重构多目标优化问题时,能够更加精确高效地收敛至Pareto最优前沿。
关键词
连锁环网矩阵
多目标配电网重构
Pareto准则
改进离散粒子群算法
次优
解保留
策略
小生境共享机制
邻域搜索机制
Keywords
chain loops matrix
multi-objective distribution network reconfiguration
Pareto criterion
improved BPSO
sub-optimal solution retention strategy
niche sharing mechanism
neighborhood search mechanism
分类号
TM73 [电气工程—电力系统及自动化]
TP18 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于次优策略的动态分步强化学习路径规划算法
王天孜
史红权
张思洁
陈爱国
《电子科技大学学报》
2025
在线阅读
下载PDF
职称材料
2
插电式混合动力汽车的次优能量管理策略
吴进军
颜丙杰
方继根
王西峰
谢志鹏
史洋
李亮
《中国机械工程》
EI
CAS
CSCD
北大核心
2019
6
在线阅读
下载PDF
职称材料
3
火电厂主蒸汽压力的LQ次优调节策略
李阳春
施可登
杨启文
《动力工程》
CSCD
北大核心
2004
0
在线阅读
下载PDF
职称材料
4
考虑随机返工与紧急插单的可抢占设计项目群调度
王小明
朱松平
陈庆新
毛宁
《计算机集成制造系统》
EI
CSCD
北大核心
2024
0
在线阅读
下载PDF
职称材料
5
基于连锁环网与改进离散粒子群算法的多目标配电网重构
徐泽
杨伟
张文强
陈盛凯
《电力系统保护与控制》
CSCD
北大核心
2021
29
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部