基于模糊深度Q网络的放煤智能决策方法被引量：2

Intelligent decision-making method for coal caving based on fuzzy deep Q-network

在线阅读下载PDF

导出

摘要在综放工作面放煤过程中,由于煤尘和降尘水雾对工作人员视线的影响,人工控制放煤存在过放、欠放问题。针对该问题,将液压支架尾梁看作智能体,把放煤过程抽象为马尔可夫最优决策,利用深度Q网络(DQN)对放煤口动作进行决策。然而DQN算法中存在过估计问题,因此提出了一种模糊深度Q网络(FDQN)算法,并应用于放煤智能决策。利用放煤过程中煤层状态的模糊特征构建模糊控制系统,以煤层状态中的煤炭数量和煤矸比例作为模糊控制系统的输入,并将模糊控制系统的输出动作代替DQN算法采用max操作选取目标网络输出Q值的动作,从而提高智能体的在线学习速率和增加放煤动作奖赏值。搭建综放工作面放煤模型,对分别基于DQN算法、双深度Q网络(DDQN)算法、FDQN算法的放煤工艺进行三维数值仿真,结果表明:FDQN算法的收敛速度最快,相对于DQN算法提高了31.6%,增加了智能体的在线学习速率;综合煤矸分界线直线度、尾梁上方余煤和放出体中的矸石数量3个方面,基于FDQN算法的放煤效果最好;基于FDQN算法的采出率最高、含矸率最低,相比基于DQN算法、DDQN算法的采出率分别提高了2.8%,0.7%,含矸率分别降低了2.1%,13.2%。基于FDQN算法的放煤智能决策方法可根据煤层赋存状态对液压支架尾梁动作进行调整,较好地解决了放煤过程中的过放、欠放问题。 During the coal caving process in the fully mechanized caving face,due to the impact of coal dust and dust water mist on the workers'line of sight,there are problems of over-caving and under-caving in manually controlled coal caving.In order to solve this problem,the tail beam of the hydraulic support is regarded as an intelligent agent,and the coal caving process is abstracted as a Markov optimal decision.A deep Q-network(DQN)is used to make decisions on the action of the coal drawing port.However,there is an overestimation problem in the DQN algorithm.A fuzzy deep Q-network(FDQN)algorithm is proposed and applied to intelligent decision-making of coal caving.The fuzzy control system is constructed by using the fuzzy features of the coal seam status in the coal caving process.The coal quantity and the coal gangue ratio in the coal seam state are taken as the inputs of the fuzzy control system.The output action of the fuzzy control system is replaced with the action of the DQN algorithm using the max operation to select the output Q value of the target network.It improves the online learning rate of the agent and increases the reward value of coal caving action.The coal caving model for the fully mechanized caving face is constructed.The three-dimensional numerical simulation of the coal caving process based on DQN,double depth Q-network(DDQN),and FDQN algorithms is conducted respectively.The results show that the FDQN algorithm has the fastest convergence speed,which is 31.6%faster than the DQN algorithm.It increases the online learning rate of the intelligent agent.The coal caving effect based on the FDQN algorithm is the best from three aspects:the straightness of the coal gangue boundary,the remaining coal above the tail beam,and the amount of gangue in the released body.The extraction rate based on the FDQN algorithm is the highest and the gangue content is the lowest.Compared with the DQN algorithm and DDQN algorithm,the extraction rate of the FDQN algorithm has increased by 2.8%and 0.7%respectively,and the gangue content has decreased by 2.1%and 13.2%respectively.The FDQN-based intelligent decision-making method for coal caving can adjust the action of the hydraulic support tail beam based on the coal seam occurrence status.It effectively solves the problems of over-caving and under-caving during the coal caving process.

作者杨艺王圣文崔科飞费树岷 YANG Yi;WANG Shengwen;CUI Kefei;FEI Shumin(School of Electrical Engineering and Automation,Henan Polytechnic University,Jiaozuo 454003,China;Henan Key Laboratory of Intelligent Detection and Control of Coal Mine Equipment,Henan Polytechnic University,Jiaozuo 454003,China;Zhengzhou Coal Mining Machinery Group Co.,Ltd.,Zhengzhou 450000,China;Zhengzhou Coal Machine Hydraulic Control Group Co.,Ltd.,Zhengzhou 450013,China;School of Automation,Southeast University,Nanjing 210096,China)

机构地区河南理工大学电气工程与自动化学院河南理工大学河南煤矿装备智能检测与控制重点实验室郑州煤矿机械集团股份有限公司郑州煤机液压电控有限公司东南大学自动化学院

出处《工矿自动化》 CSCD 北大核心 2023年第4期78-85,共8页 Journal Of Mine Automation

基金河南省科技攻关计划项目(212102210390) 河南省煤矿智能开采技术创新中心支撑项目(2021YD01)。

关键词综放工作面智能放煤深度强化学习模糊深度Q网络模糊控制马尔可夫 fully mechanized caving face intelligent coal caving deep reinforcement learning fuzzy deep Q-network fuzzy control Markov

分类号 TD823.97 [矿业工程—煤矿开采] TD823.67 [矿业工程—煤矿开采]

作者简介杨艺(1980-),男,湖南利川人,副教授,博士,主要研究方向为深度学习、强化学习和智能控制,E-mail:yangyi@hpu.edu.cn;通信作者:王圣文(1996-),男,河南平顶山人,硕士研究生,主要研究方向为强化学习、信息处理与网络控制,E-mail:1286535923@qq.com。

引文网络
相关文献

参考文献14

1张虎雄,李红卫,马祥.模糊控制在煤矿智能化开采中的应用[J].煤矿机械,2022,43(12):206-210. 被引量：6
2沈志熙,代东林,赵凯.基于多特征分步模糊推理的边缘检测算法[J].电子科技大学学报,2014,43(3):381-387. 被引量：7
3李忠信,王大龙,庄佳才,刘志恒,姚琦,周振波.基于遗传模糊控制的风电机组偏航系统疲劳载荷研究[J].动力工程学报,2022,42(8):745-752. 被引量：14
4黎声益,马玉敏,刘鹃.基于双深度Q学习网络的面向设备负荷稳定的智能车间调度方法[J].计算机集成制造系统,2023,29(1):91-99. 被引量：3
5封硕,舒红,谢步庆.基于改进深度强化学习的三维环境路径规划[J].计算机应用与软件,2021,38(1):250-255. 被引量：18
6袁甜甜,李凤莲,张雪英,胡风云,贾文辉.特征降维的深度强化学习脑卒中分类预测研究[J].重庆理工大学学报（自然科学）,2023,37(3):194-203. 被引量：5
7杨艺,李庆元,李化敏,李东印,杨延麟,费树岷.基于批量式强化学习的群组放煤智能决策研究[J].煤炭科学技术,2022,50(10):188-197. 被引量：1
8罗开成,高阳,杨艺,常亚军,袁瑞甫.基于均值偏差奖赏函数的放煤口控制策略研究[J].煤炭工程,2022,54(9):105-111. 被引量：2
9李庆元,杨艺,李化敏,费树岷.基于Q-learning模型的智能化放顶煤控制策略[J].工矿自动化,2020,46(1):72-79. 被引量：12
10马英.基于记忆放煤时序控制的智能放煤模式研究[J].煤矿机电,2015,36(2):1-5. 被引量：8

二级参考文献228

1于雷,闫少宏,毛德兵,夏永学,祝凌甫,张震.基于ARAMIS M/E微震监测的大采高综放顶板活动规律[J].煤炭学报,2011,36(S2):293-298. 被引量：21
2王家臣.我国综放开采技术及其深层次发展问题的探讨[J].煤炭科学技术,2005,33(1):14-17. 被引量：164
3唐少先,陈建二,张泰山.Mamdani模糊系统I/O关系的表示及隶属函数优化[J].控制理论与应用,2005,22(4):520-526. 被引量：9
4田山岗,尚冠雄,唐辛.中国煤炭资源的“井”字型分布格局——地域分异性与资源经济地理区划[J].中国煤田地质,2006,18(3):1-5. 被引量：32
5黄炳香,刘长友,程庆迎.低位综放开采顶煤放出率与含矸率的关系[J].煤炭学报,2007,32(8):789-793. 被引量：33
6邵平,杨路明.基于模板分解和积分图像的快速Kirsch边缘检测[J].自动化学报,2007,33(8):795-800. 被引量：17
7袁曾任.人工神经元网络及其应用[M].北京:清华大学出版社,广西科学技术出版社,1998.66-273.
8张守祥,张艳丽,王永强,张岩,刘伟,王言前.综采工作面煤矸频谱特征[J].煤炭学报,2007,32(9):971-974. 被引量：27
9王国法.液压支架技术[M].北京:煤炭工业出版社,1998.
10王小平,曹立明.遗传算法一理论、应用与软件实现[M].西安:西安交通大学出版社,2000.

共引文献429

1刘镇.智慧煤矿2025情景目标和发展路径[J].冶金管理,2020(19):19-20.
2张银虎.大倾角放顶煤智能化工作面建设方案研究[J].内蒙古石油化工,2021,47(11):29-31.
3薛霜思,曹晖,贾立新,李欢,谭浚楷,石天卓.矿用电机分布式远程智能在线监测系统设计[J].煤炭学报,2023,48(S01):368-380. 被引量：2
4雷孟宇,张旭辉,杨文娟,沈奇峰,张超,万继成,王恒.煤矿掘进装备视觉位姿检测与控制研究现状与趋势[J].煤炭学报,2021,46(S02):1135-1148. 被引量：24
5宋国栋,魏立科,马宏伟,付霁野,刘希梁.六轴式小臂机器人运动学理论研究及其在掘锚作业中的应用[J].煤炭学报,2021,46(S02):1114-1123. 被引量：5
6魏文艳.综采工作面智能化开采技术发展现状及展望[J].煤炭科学技术,2022,50(S02):244-253. 被引量：22
7张新战,张帅,崔峰.急倾斜大段高综放开采煤矸混合流动规律研究[J].煤炭科学技术,2022,50(S02):16-25. 被引量：2
8吕延森,张学亮,阮进林,高鹏.保德煤矿智能综放开采关键技术及展望[J].煤炭科学技术,2022,50(S01):233-243. 被引量：4
9郭瑞瑞,王文,王祖洸.神东矿区布尔台矿厚煤层开采方法优化及设备配套研究[J].煤炭科学技术,2022,50(S01):14-22. 被引量：2
10梁耍,王世博,谢洋,葛世荣.基于LSTM的煤层厚度动态预测方法研究[J].煤炭科学技术,2021,49(S01):150-157. 被引量：9

同被引文献67

1潘卫东,李新源,员明涛,袁永康,杨克虎.基于顶煤运移跟踪仪的自动化放煤技术原理及应用[J].煤炭学报,2020(S01):23-30. 被引量：18
2贺海涛,王佳豪,张海峰,荣耀,崔耀.基于U-Net的放煤状态控制关键技术研究[J].煤炭科学技术,2022,50(S02):237-243. 被引量：5
3史洪恺,张国恩,姜晓宇,何向,郝赫,孙远航,岳刘杰.基于5G驱动的煤矿机电设备安全管理平台研究[J].煤炭科学技术,2022,50(S01):257-263. 被引量：14
4高强,高小强,任文清,郝俊信.主煤流运输无人化智能视频管控系统[J].工矿自动化,2021,47(S02):60-61. 被引量：7
5张艳丽,张守祥.基于Hilbert-Huang变换的煤矸声波信号分析[J].煤炭学报,2010,35(1):165-168. 被引量：23
6李伟,詹振江.淮北矿区“三软”极复杂煤层综采技术研究与实践[J].煤炭学报,2010,35(11):1800-1808. 被引量：21
7贺超,宋学锋,李贤功.煤矿安全监管信息管理系统的研究及探讨[J].工矿自动化,2013,39(1):96-99. 被引量：14
8张良,牛剑峰,代刚,赵文生.综放工作面煤矸自动识别系统设计及应用[J].工矿自动化,2014,40(9):121-124. 被引量：15
9宋庆军,肖兴明,张天顺,王建立.基于声波的放顶煤过程自动控制系统[J].计算机工程与设计,2015,36(11):3123-3127. 被引量：9
10王宇,吴智恒,刘泓滨,陈启愉,童季刚.机器视觉的煤自燃智能预警系统设计[J].煤矿机械,2016,37(8):16-17. 被引量：4

引证文献2

1杨科,范超尘,刘静波,吴劲松,池小楼,张杰.极复杂条件煤层智能化开采安全保障体系及关键技术[J].矿业研究与开发,2024,44(3):164-170. 被引量：2
2王祖洸,王伸,李东印,李化敏,王文,岳帅帅,李东辉.基于支架结构运动学的放煤机构精准控制研究[J].工矿自动化,2024,50(9):28-40.

二级引证文献2

1康宇博.S煤矿薄煤层智能化开采技术研究[J].产业创新研究,2024(14):102-104.
2赵晨.煤层智能化开采技术的应用研究[J].自动化应用,2024,65(18):117-119.

1张子影,廖天琪.“两膺上将”洪学智的传奇人生(八)[J].党史纵览,2022(9):23-26.
2史占东,王亚军,渠文忠.特厚煤层综放工作面放煤工艺研究及应用[J].煤炭技术,2022,41(12):51-54. 被引量：2
3李建基.大数据时代人工智能在计算机网络技术中的运用[J].电子元器件与信息技术,2023,7(2):135-138. 被引量：8
4邬喜仓,张学亮,阮进林,王志强.保德煤矿智能综放工作面建设关键技术研究[J].工矿自动化,2023,49(2):141-148. 被引量：5
5张锦旺,程东亮,王家臣,杨胜利.水平分段综放开采顶煤放出体理论计算模型[J].煤炭学报,2023,48(2):576-592. 被引量：4
6吕洪武,高栋.基于模糊控制和节点可信的安全分簇路由协议[J].长春工程学院学报（自然科学版）,2022,23(4):94-97.
7曾祥斌.超声波法预测冒放性分析及放煤方式的确定[J].西部探矿工程,2023,35(3):113-114.

工矿自动化

2023年第4期

浏览历史

内容加载中请稍等...

基于模糊深度Q网络的放煤智能决策方法被引量：2

参考文献14

二级参考文献228

共引文献429

同被引文献67

引证文献2

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于模糊深度Q网络的放煤智能决策方法 被引量：2

参考文献14

二级参考文献228

共引文献429

同被引文献67

引证文献2

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于模糊深度Q网络的放煤智能决策方法被引量：2