期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
基于D3QN的目标驱动移动机器人自主导航方法
1
作者 卢赵清 王宏伟 +2 位作者 何丽 司盼召 陈耀华 《电子测量技术》 北大核心 2025年第9期9-18,共10页
在未知或危险环境中(如应急救灾、抢险救援),传统导航方法因无法预先获得先验地图和位置信息,难以实现特定目标的导航。本文提出了一种基于竞争双深度Q网络(D3QN)的目标驱动移动机器人自主导航方法。该方法的跨模态融合模块对不同模态... 在未知或危险环境中(如应急救灾、抢险救援),传统导航方法因无法预先获得先验地图和位置信息,难以实现特定目标的导航。本文提出了一种基于竞争双深度Q网络(D3QN)的目标驱动移动机器人自主导航方法。该方法的跨模态融合模块对不同模态特征动态加权融合,在整合观测数据的同时充分捕捉环境信息,增强了对环境的感知能力。在此基础上,设计了一种通用的目标驱动导航方法,使用YOLOv5识别特定目标(如火焰、烟雾)并获取其位置,用识别出的目标位置替代深度强化学习导航中的预设位置点,实现自主导航至特定目标。仿真实验结果表明,本文方法在导航成功率等指标上具有显著优势,在简单、复杂和动态场景中,成功率分别提高了9%、27%和38%。此外,在简单仿真环境中训练的模型,能够直接部署在复杂的仿真环境和真实场景中,表现出良好的泛化能力。 展开更多
关键词 深度强化学习 d3qn算法 多模态融合 识别与定位 目标驱动导航
在线阅读 下载PDF
基于改进型D3QN深度强化学习的铁路智能选线方法 被引量:12
2
作者 袁泉 曾文驱 +3 位作者 李子涵 高天赐 杨冬营 何庆 《铁道科学与工程学报》 EI CAS CSCD 北大核心 2022年第2期344-350,共7页
传统的人工选线方法劳动强度大,设计效率低,随着我国铁路建设重心向西部复杂艰险山区转移,人工选线面临的困难日趋凸显。为缩减铁路选线的人力物力成本,提高设计效率,亟需发展结合了人工智能和信息技术的现代选线技术。为此,提出一种基... 传统的人工选线方法劳动强度大,设计效率低,随着我国铁路建设重心向西部复杂艰险山区转移,人工选线面临的困难日趋凸显。为缩减铁路选线的人力物力成本,提高设计效率,亟需发展结合了人工智能和信息技术的现代选线技术。为此,提出一种基于深度强化学习理论的铁路智能选线方法。以带有空间属性信息的数字高程模型为选线环境,以相邻空间点间的建造费用为即时奖励,以工程建造费用最小为优化目标,设置离散化的备选动作,考虑多种约束条件,构建面向铁路选线的深度强化学习模型。结合深度学习的感知能力和强化学习的决策能力,利用双竞争深度Q学习网络(Dueling-Double-Deep Q Network,D3QN)对模型进行训练,既克服强化学习问题对复杂状态和动作空间难以收敛的缺点,同时解决了传统DQN算法易于出现过估计、训练不稳定的问题,实现自动对选线环境进行感知、搜索、判断、决策,最终寻得目标函数最优的线路方案。以某山区铁路对本方法进行验证,实验结果表明:该方法能搜索到多样化的线路备选方案,可以为设计人员提供新的设计思路;有效降低了铁路建设的经济费用,较人工选线方案节约最多达17.5%。智能选线方法可以帮助节省选线工作成本,不遗漏有价值的方案,提高工作效率。 展开更多
关键词 深度强化学习 智能选线 d3qn算法 信息化
在线阅读 下载PDF
深度强化学习求解动态柔性作业车间调度问题 被引量:1
3
作者 杨丹 舒先涛 +3 位作者 余震 鲁光涛 纪松霖 王家兵 《现代制造工程》 北大核心 2025年第2期10-16,共7页
随着智慧车间等智能制造技术的不断发展,人工智能算法在解决车间调度问题上的研究备受关注,其中车间运行过程中的动态事件是影响调度效果的一个重要扰动因素,为此提出一种采用深度强化学习方法来解决含有工件随机抵达的动态柔性作业车... 随着智慧车间等智能制造技术的不断发展,人工智能算法在解决车间调度问题上的研究备受关注,其中车间运行过程中的动态事件是影响调度效果的一个重要扰动因素,为此提出一种采用深度强化学习方法来解决含有工件随机抵达的动态柔性作业车间调度问题。首先以最小化总延迟为目标建立动态柔性作业车间的数学模型,然后提取8个车间状态特征,建立6个复合型调度规则,采用ε-greedy动作选择策略并对奖励函数进行设计,最后利用先进的D3QN算法进行求解并在不同规模车间算例上进行了有效性验证。结果表明,提出的D3QN算法能非常有效地解决含有工件随机抵达的动态柔性作业车间调度问题,在所有车间算例中的求优胜率为58.3%,相较于传统的DQN和DDQN算法车间延迟分别降低了11.0%和15.4%,进一步提升车间的生产制造效率。 展开更多
关键词 深度强化学习 d3qn算法 工件随机抵达 柔性作业车间调度 动态调度
在线阅读 下载PDF
基于相邻分区可用转供能力的配电网分区间互济运行优化方法
4
作者 罗龙波 陈明辉 +2 位作者 王仁浚 高红均 刘俊勇 《南方电网技术》 北大核心 2025年第10期99-110,共12页
在大规模配电网中,负荷转供可以有效缓解单个分区供电紧张的问题。然而,由于网格规模过大,传统的数学优化方法难以解决这一问题。首先提出了一种基于网络化简的分区可用转供能力量化评估模型,以选取互济运行的分区规模。其次,提出了一... 在大规模配电网中,负荷转供可以有效缓解单个分区供电紧张的问题。然而,由于网格规模过大,传统的数学优化方法难以解决这一问题。首先提出了一种基于网络化简的分区可用转供能力量化评估模型,以选取互济运行的分区规模。其次,提出了一种基于深度强化学习的配电网分区间互济运行优化方法以快速寻找到分区间互济运行方案。该方法改进了传统的奖励函数以提升智能体对不同负荷场景的适应能力与泛化特性。然后,采用对决双深度Q网络(dueling double deep Q network,D3QN)算法进行策略学习,以应对大规模系统的复杂性。最后,通过对IEEE 33节点系统和实际445节点系统进行仿真验证,验证了所提方法的有效性。 展开更多
关键词 配电网运行优化 可用转供能力量化评估 深度强化学习 d3qn算法
在线阅读 下载PDF
基于深度强化学习的风电拉挤板生产智能排程
5
作者 杨逢海 杨晓英 +2 位作者 裴志杰 武亚琪 张志伟 《现代制造工程》 北大核心 2025年第1期23-32,共10页
针对具有包装顺序齐套和产品换型调整等复杂特征的风电拉挤板生产排程问题,构建了最大化当期开动设备平均利用率和最大化订单履约率的多目标协同优化模型;将风电拉挤板生产排程问题转化为马尔科夫序列决策问题,设计了10种不同排程策略... 针对具有包装顺序齐套和产品换型调整等复杂特征的风电拉挤板生产排程问题,构建了最大化当期开动设备平均利用率和最大化订单履约率的多目标协同优化模型;将风电拉挤板生产排程问题转化为马尔科夫序列决策问题,设计了10种不同排程策略作为动作空间,提炼适当的状态特征和奖励函数;提出一种基于决斗双深度Q网络(D3QN)的排程算法。通过某企业实际数据的仿真试验,与Double DQN和Dueling DQN算法对比验证所提算法有效性;并比较4种不同求解方法在10个算例下得到的目标值,验证了所提出的改进D3QN算法可以得到问题的高质量解,为风电拉挤板制造企业生产排程提供了一种智能化的方法和参考。 展开更多
关键词 风电 拉挤板 生产排程 深度强化学习 d3qn算法
在线阅读 下载PDF
好奇心蒸馏双Q网络移动机器人路径规划方法 被引量:2
6
作者 张凤 顾琦然 袁帅 《计算机工程与应用》 CSCD 北大核心 2023年第19期316-322,共7页
针对移动机器人的路径规划中DQN算法存在过估计、样本利用率低、奖励稀疏等,从而影响机器人获取最优路径的问题,提出基于好奇心蒸馏模块竞争架构的双Q网络(curiosity distillation module dueling deep double Q-network prioritized ex... 针对移动机器人的路径规划中DQN算法存在过估计、样本利用率低、奖励稀疏等,从而影响机器人获取最优路径的问题,提出基于好奇心蒸馏模块竞争架构的双Q网络(curiosity distillation module dueling deep double Q-network prioritized experience replay,CDM-D3QN-PER)方法。该方法以D3QN为基础,在输入端添加长短时记忆网络(long short term memory,LSTM)处理雷达和相机的信息,降低过估计的影响,获得更有利的环境信息;采用优先经验回放机制(prioritized experience replay,PER)作为采样方法,使样本得到充分利用,提高样本利用率;引入好奇心蒸馏模块(curiosity distillation module,CDM),缓解奖励稀疏的问题。通过仿真实验与DQN、DDQN、D3QN相比,CDM-D3QN-PER算法训练的机器人到达目标点的次数明显增加,为DQN算法的3倍。该算法使奖励值得到提升,加快了收敛速度,能够在复杂的未知环境中获得最优路径。 展开更多
关键词 DQN算法 d3qn算法 好奇心蒸馏模块 长短时记忆网络(LSTM) 最优路径
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部