-
题名基于无模型深度强化学习的煤泥浮选智能控制研究
- 1
-
-
作者
秦新凯
王然风
付翔
窦治衡
李品钰
-
机构
太原理工大学矿业工程学院
-
出处
《工矿自动化》
2025年第8期25-33,58,共10页
-
基金
国家自然科学基金项目(52274157)
“科技兴蒙”行动重点专项项目(2022EEDSKJXM010)。
-
文摘
在煤泥浮选工业现场中,传统基于机理模型的控制方法因其依赖近似模型,存在控制精度受限与泛化能力不足的问题。而经典无模型深度强化学习算法如深度确定性策略梯度(DDPG),在处理高维时变状态时易受无关变量干扰,难以精准捕捉核心特征,导致策略稳定性下降。针对上述问题,提出一种基于融合注意力机制(AS)的无模型深度强化学习(AS−DDPG)的煤泥浮选智能控制方法。该方法采用AS−DDPG算法构建浮选智能控制器:以尾煤灰分为控制目标,在Actor−Critic网络基础上引入AS以精准捕捉核心特征,通过在线学习优化控制策略,建立了包含矿浆浓度、灰分、流量等关键参数的多维状态空间,设计了兼顾产品质量与药剂回收率的多目标奖励函数,直接通过智能体与环境的实时交互学习控制策略,能自适应捕捉过程动态特性,在实际浮选过程中保持稳定的控制效果。采集浮选工业现场的实时数据,经预处理后进行仿真实验,结果表明:相较于DDPG算法,AS−DDPG算法的训练误差降低27%,其奖励曲线收敛更快且波动幅度更小,有效策略比例提升2倍以上,表明其对高效药剂组合的探索更具方向性。工业性试验结果表明:相较于模糊PID与DDPG算法,AS−DDPG算法控制下的灰分标准差降至0.66,有效降低了浮选产品质量波动;捕收剂与起泡剂消耗分别优化至0.56,0.25 kg/t,表明基于AS−DDPG算法的智能控制器能以更低的药剂投入达到稳定分选的效果。
-
关键词
煤泥浮选过程控制
无模型深度强化学习
深度确定性策略梯度
注意力机制
Actor−Critic
AS−DDPG
-
Keywords
coal slime flotation process control
model-free deep reinforcement learning
Deep Deterministic Policy Gradient
Attention State
Actor-Critic
AS-DDPG
-
分类号
TD923
[矿业工程]
-