期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于深度强化学习的动态核应急撤离优化决策模型研发
1
作者 李鸣野 姚仁太 +5 位作者 郭欢 张俊芳 吕明华 徐向军 牛嫣静 贾博慧 《辐射防护》 北大核心 2025年第5期517-529,共13页
核事故情景下人员的及时、有效撤离对减少辐射暴露、保障公众安全至关重要。传统路径规划算法虽然能够快速计算静态最短路径,但难以适应辐射剂量场动态变化带来的挑战。本文提出了一种基于深度强化学习的动态核应急撤离优化决策模型(MD-... 核事故情景下人员的及时、有效撤离对减少辐射暴露、保障公众安全至关重要。传统路径规划算法虽然能够快速计算静态最短路径,但难以适应辐射剂量场动态变化带来的挑战。本文提出了一种基于深度强化学习的动态核应急撤离优化决策模型(MD-DQN算法模型),通过建立马尔可夫决策过程(MDP)模型,以动态辐射剂量场信息、路网信息和实时位置为状态空间,设计了一种综合考虑路径长度、辐射暴露及方向性引导的多因素奖励函数,驱动智能体自主地学习最优的动态撤离决策策略。同时,通过优化网络结构设计和即时奖励机制,提高了算法的收敛性与泛化性能。仿真实验表明,与传统的Dijkstra算法和A^(*)算法相比,MD-DQN算法能够及时避开高辐射风险区域,显著降低撤离过程中人员的辐射暴露,且具有更优的实时路径调整能力和环境适应性。研究成果可为核应急撤离决策提供高效、智能的辅助支持工具,并为未来在多源辐射、多智能体协同以及实时数据驱动的智能化决策领域提供新的研究思路。 展开更多
关键词 深度强化学习 核应急撤离 动态撤离决策 马尔可夫决策过程 MD-DQN
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部