期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于深度强化学习的动态核应急撤离优化决策模型研发
1
作者
李鸣野
姚仁太
+5 位作者
郭欢
张俊芳
吕明华
徐向军
牛嫣静
贾博慧
《辐射防护》
北大核心
2025年第5期517-529,共13页
核事故情景下人员的及时、有效撤离对减少辐射暴露、保障公众安全至关重要。传统路径规划算法虽然能够快速计算静态最短路径,但难以适应辐射剂量场动态变化带来的挑战。本文提出了一种基于深度强化学习的动态核应急撤离优化决策模型(MD-...
核事故情景下人员的及时、有效撤离对减少辐射暴露、保障公众安全至关重要。传统路径规划算法虽然能够快速计算静态最短路径,但难以适应辐射剂量场动态变化带来的挑战。本文提出了一种基于深度强化学习的动态核应急撤离优化决策模型(MD-DQN算法模型),通过建立马尔可夫决策过程(MDP)模型,以动态辐射剂量场信息、路网信息和实时位置为状态空间,设计了一种综合考虑路径长度、辐射暴露及方向性引导的多因素奖励函数,驱动智能体自主地学习最优的动态撤离决策策略。同时,通过优化网络结构设计和即时奖励机制,提高了算法的收敛性与泛化性能。仿真实验表明,与传统的Dijkstra算法和A^(*)算法相比,MD-DQN算法能够及时避开高辐射风险区域,显著降低撤离过程中人员的辐射暴露,且具有更优的实时路径调整能力和环境适应性。研究成果可为核应急撤离决策提供高效、智能的辅助支持工具,并为未来在多源辐射、多智能体协同以及实时数据驱动的智能化决策领域提供新的研究思路。
展开更多
关键词
深度强化学习
核应急
撤离
动态撤离决策
马尔可夫
决策
过程
MD-DQN
在线阅读
下载PDF
职称材料
题名
基于深度强化学习的动态核应急撤离优化决策模型研发
1
作者
李鸣野
姚仁太
郭欢
张俊芳
吕明华
徐向军
牛嫣静
贾博慧
机构
中国辐射防护研究院
中核核环境模拟与评价技术重点实验室
保定飞凌嵌入式技术有限公司
出处
《辐射防护》
北大核心
2025年第5期517-529,共13页
文摘
核事故情景下人员的及时、有效撤离对减少辐射暴露、保障公众安全至关重要。传统路径规划算法虽然能够快速计算静态最短路径,但难以适应辐射剂量场动态变化带来的挑战。本文提出了一种基于深度强化学习的动态核应急撤离优化决策模型(MD-DQN算法模型),通过建立马尔可夫决策过程(MDP)模型,以动态辐射剂量场信息、路网信息和实时位置为状态空间,设计了一种综合考虑路径长度、辐射暴露及方向性引导的多因素奖励函数,驱动智能体自主地学习最优的动态撤离决策策略。同时,通过优化网络结构设计和即时奖励机制,提高了算法的收敛性与泛化性能。仿真实验表明,与传统的Dijkstra算法和A^(*)算法相比,MD-DQN算法能够及时避开高辐射风险区域,显著降低撤离过程中人员的辐射暴露,且具有更优的实时路径调整能力和环境适应性。研究成果可为核应急撤离决策提供高效、智能的辅助支持工具,并为未来在多源辐射、多智能体协同以及实时数据驱动的智能化决策领域提供新的研究思路。
关键词
深度强化学习
核应急
撤离
动态撤离决策
马尔可夫
决策
过程
MD-DQN
Keywords
deep reinforced learning
nuclear emergency evacuation
dynamic evacuation decision
Markov decision process
MD-DQN
分类号
TL73 [核科学技术—辐射防护及环境保护]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于深度强化学习的动态核应急撤离优化决策模型研发
李鸣野
姚仁太
郭欢
张俊芳
吕明华
徐向军
牛嫣静
贾博慧
《辐射防护》
北大核心
2025
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部