检索结果-维普期刊中文期刊服务平台

基于D3QN的目标驱动移动机器人自主导航方法: 1; 作者卢赵清王宏伟 +2 位作者何丽司盼召陈耀华《电子测量技术》北大核心 2025年第9期9-18,共10页; 在未知或危险环境中(如应急救灾、抢险救援),传统导航方法因无法预先获得先验地图和位置信息,难以实现特定目标的导航。本文提出了一种基于竞争双深度Q网络(D3QN)的目标驱动移动机器人自主导航方法。该方法的跨模态融合模块对不同模态... 展开更多; 关键词深度强化学习 d3qn算法多模态融合识别与定位目标驱动导航; 在线阅读下载PDF 职称材料

基于改进型D3QN深度强化学习的铁路智能选线方法被引量：12: 2; 作者袁泉曾文驱 +3 位作者李子涵高天赐杨冬营何庆《铁道科学与工程学报》 EI CAS CSCD 北大核心 2022年第2期344-350,共7页; 传统的人工选线方法劳动强度大,设计效率低,随着我国铁路建设重心向西部复杂艰险山区转移,人工选线面临的困难日趋凸显。为缩减铁路选线的人力物力成本,提高设计效率,亟需发展结合了人工智能和信息技术的现代选线技术。为此,提出一种基... 展开更多; 关键词深度强化学习智能选线 d3qn算法信息化; 在线阅读下载PDF 职称材料

深度强化学习求解动态柔性作业车间调度问题被引量：1: 3; 作者杨丹舒先涛 +3 位作者余震鲁光涛纪松霖王家兵《现代制造工程》北大核心 2025年第2期10-16,共7页; 随着智慧车间等智能制造技术的不断发展,人工智能算法在解决车间调度问题上的研究备受关注,其中车间运行过程中的动态事件是影响调度效果的一个重要扰动因素,为此提出一种采用深度强化学习方法来解决含有工件随机抵达的动态柔性作业车... 展开更多; 关键词深度强化学习 d3qn算法工件随机抵达柔性作业车间调度动态调度; 在线阅读下载PDF 职称材料

基于相邻分区可用转供能力的配电网分区间互济运行优化方法: 4; 作者罗龙波陈明辉 +2 位作者王仁浚高红均刘俊勇《南方电网技术》北大核心 2025年第10期99-110,共12页; 在大规模配电网中,负荷转供可以有效缓解单个分区供电紧张的问题。然而,由于网格规模过大,传统的数学优化方法难以解决这一问题。首先提出了一种基于网络化简的分区可用转供能力量化评估模型,以选取互济运行的分区规模。其次,提出了一... 展开更多; 关键词配电网运行优化可用转供能力量化评估深度强化学习 d3qn算法; 在线阅读下载PDF 职称材料

基于深度强化学习的风电拉挤板生产智能排程: 5; 作者杨逢海杨晓英 +2 位作者裴志杰武亚琪张志伟《现代制造工程》北大核心 2025年第1期23-32,共10页; 针对具有包装顺序齐套和产品换型调整等复杂特征的风电拉挤板生产排程问题,构建了最大化当期开动设备平均利用率和最大化订单履约率的多目标协同优化模型;将风电拉挤板生产排程问题转化为马尔科夫序列决策问题,设计了10种不同排程策略... 展开更多; 关键词风电拉挤板生产排程深度强化学习 d3qn算法; 在线阅读下载PDF 职称材料

好奇心蒸馏双Q网络移动机器人路径规划方法被引量：2: 6; 作者张凤顾琦然袁帅《计算机工程与应用》 CSCD 北大核心 2023年第19期316-322,共7页; 针对移动机器人的路径规划中DQN算法存在过估计、样本利用率低、奖励稀疏等,从而影响机器人获取最优路径的问题,提出基于好奇心蒸馏模块竞争架构的双Q网络(curiosity distillation module dueling deep double Q-network prioritized ex... 展开更多; 关键词 DQN算法 d3qn算法好奇心蒸馏模块长短时记忆网络(LSTM) 最优路径; 在线阅读下载PDF 职称材料

题名基于D3QN的目标驱动移动机器人自主导航方法: 1; 作者卢赵清王宏伟何丽司盼召陈耀华; 机构新疆大学机械工程学院; 出处《电子测量技术》北大核心 2025年第9期9-18,共10页; 基金新疆维吾尔自治区自然科学基金(2022D01C392) 国家自然科学基金(62063033) 新疆维吾尔自治区重点研发计划项目(2022B01050-2)资助。; 文摘在未知或危险环境中(如应急救灾、抢险救援),传统导航方法因无法预先获得先验地图和位置信息,难以实现特定目标的导航。本文提出了一种基于竞争双深度Q网络(D3QN)的目标驱动移动机器人自主导航方法。该方法的跨模态融合模块对不同模态特征动态加权融合,在整合观测数据的同时充分捕捉环境信息,增强了对环境的感知能力。在此基础上,设计了一种通用的目标驱动导航方法,使用YOLOv5识别特定目标(如火焰、烟雾)并获取其位置,用识别出的目标位置替代深度强化学习导航中的预设位置点,实现自主导航至特定目标。仿真实验结果表明,本文方法在导航成功率等指标上具有显著优势,在简单、复杂和动态场景中,成功率分别提高了9%、27%和38%。此外,在简单仿真环境中训练的模型,能够直接部署在复杂的仿真环境和真实场景中,表现出良好的泛化能力。; 关键词深度强化学习 d3qn算法多模态融合识别与定位目标驱动导航; Keywords deep reinforcement learning d3qn algorithm multimodal fusion identification and location target-driven navigation; 分类号 TP242.6 [自动化与计算机技术—检测技术与自动化装置] TN711 [电子电信—电路与系统]; 在线阅读下载PDF 职称材料

题名基于改进型D3QN深度强化学习的铁路智能选线方法被引量：12: 2; 作者袁泉曾文驱李子涵高天赐杨冬营何庆; 机构广州地铁设计研究院股份有限公司西南交通大学土木工程学院; 出处《铁道科学与工程学报》 EI CAS CSCD 北大核心 2022年第2期344-350,共7页; 基金高铁联合基金重点资助项目项目(U1934214) 国家自然科学基金资助项目(51878576) +1 种基金四川省科技厅重点研发项目(2020YFG0049)。; 文摘传统的人工选线方法劳动强度大,设计效率低,随着我国铁路建设重心向西部复杂艰险山区转移,人工选线面临的困难日趋凸显。为缩减铁路选线的人力物力成本,提高设计效率,亟需发展结合了人工智能和信息技术的现代选线技术。为此,提出一种基于深度强化学习理论的铁路智能选线方法。以带有空间属性信息的数字高程模型为选线环境,以相邻空间点间的建造费用为即时奖励,以工程建造费用最小为优化目标,设置离散化的备选动作,考虑多种约束条件,构建面向铁路选线的深度强化学习模型。结合深度学习的感知能力和强化学习的决策能力,利用双竞争深度Q学习网络(Dueling-Double-Deep Q Network,D3QN)对模型进行训练,既克服强化学习问题对复杂状态和动作空间难以收敛的缺点,同时解决了传统DQN算法易于出现过估计、训练不稳定的问题,实现自动对选线环境进行感知、搜索、判断、决策,最终寻得目标函数最优的线路方案。以某山区铁路对本方法进行验证,实验结果表明:该方法能搜索到多样化的线路备选方案,可以为设计人员提供新的设计思路;有效降低了铁路建设的经济费用,较人工选线方案节约最多达17.5%。智能选线方法可以帮助节省选线工作成本,不遗漏有价值的方案,提高工作效率。; 关键词深度强化学习智能选线 d3qn算法信息化; Keywords deep reinforcement learning intelligent railway location design d3qn algorithm informatization; 分类号 U212.3 [交通运输工程—道路与铁道工程]; 在线阅读下载PDF 职称材料

题名深度强化学习求解动态柔性作业车间调度问题被引量：1: 3; 作者杨丹舒先涛余震鲁光涛纪松霖王家兵; 机构武汉科技大学冶金装备及其控制省部共建教育部重点实验室武汉科技大学机械传动与制造工程湖北省重点实验室武汉科技大学精密制造研究院; 出处《现代制造工程》北大核心 2025年第2期10-16,共7页; 基金国家自然科学基金项目(51808417)。; 文摘随着智慧车间等智能制造技术的不断发展,人工智能算法在解决车间调度问题上的研究备受关注,其中车间运行过程中的动态事件是影响调度效果的一个重要扰动因素,为此提出一种采用深度强化学习方法来解决含有工件随机抵达的动态柔性作业车间调度问题。首先以最小化总延迟为目标建立动态柔性作业车间的数学模型,然后提取8个车间状态特征,建立6个复合型调度规则,采用ε-greedy动作选择策略并对奖励函数进行设计,最后利用先进的D3QN算法进行求解并在不同规模车间算例上进行了有效性验证。结果表明,提出的D3QN算法能非常有效地解决含有工件随机抵达的动态柔性作业车间调度问题,在所有车间算例中的求优胜率为58.3%,相较于传统的DQN和DDQN算法车间延迟分别降低了11.0%和15.4%,进一步提升车间的生产制造效率。; 关键词深度强化学习 d3qn算法工件随机抵达柔性作业车间调度动态调度; Keywords deep reinforcement learning d3qn algorithm random job arrival flexible job shop scheduling problem dynamic scheduling; 分类号 TP181 [自动化与计算机技术—控制理论与控制工程]; 在线阅读下载PDF 职称材料

题名基于相邻分区可用转供能力的配电网分区间互济运行优化方法: 4; 作者罗龙波陈明辉王仁浚高红均刘俊勇; 机构广东电网有限责任公司广州供电局四川大学电气工程学院; 出处《南方电网技术》北大核心 2025年第10期99-110,共12页; 基金国家自然科学基金资助项目(52077146) 中国南方电网有限责任公司创新项目(030100KK52222069)。; 文摘在大规模配电网中,负荷转供可以有效缓解单个分区供电紧张的问题。然而,由于网格规模过大,传统的数学优化方法难以解决这一问题。首先提出了一种基于网络化简的分区可用转供能力量化评估模型,以选取互济运行的分区规模。其次,提出了一种基于深度强化学习的配电网分区间互济运行优化方法以快速寻找到分区间互济运行方案。该方法改进了传统的奖励函数以提升智能体对不同负荷场景的适应能力与泛化特性。然后,采用对决双深度Q网络(dueling double deep Q network,D3QN)算法进行策略学习,以应对大规模系统的复杂性。最后,通过对IEEE 33节点系统和实际445节点系统进行仿真验证,验证了所提方法的有效性。; 关键词配电网运行优化可用转供能力量化评估深度强化学习 d3qn算法; Keywords distribution network operation optimization quantitative assessment of available transfer capacity deep reinforcement learning d3qn algorithm; 分类号 TM726 [电气工程—电力系统及自动化]; 在线阅读下载PDF 职称材料

题名基于深度强化学习的风电拉挤板生产智能排程: 5; 作者杨逢海杨晓英裴志杰武亚琪张志伟; 机构河南科技大学机电工程学院机械装备先进制造河南省协同创新中心河南科技大学商学院; 出处《现代制造工程》北大核心 2025年第1期23-32,共10页; 基金河南省重点研发专项项目(231111222600)。; 文摘针对具有包装顺序齐套和产品换型调整等复杂特征的风电拉挤板生产排程问题,构建了最大化当期开动设备平均利用率和最大化订单履约率的多目标协同优化模型;将风电拉挤板生产排程问题转化为马尔科夫序列决策问题,设计了10种不同排程策略作为动作空间,提炼适当的状态特征和奖励函数;提出一种基于决斗双深度Q网络(D3QN)的排程算法。通过某企业实际数据的仿真试验,与Double DQN和Dueling DQN算法对比验证所提算法有效性;并比较4种不同求解方法在10个算例下得到的目标值,验证了所提出的改进D3QN算法可以得到问题的高质量解,为风电拉挤板制造企业生产排程提供了一种智能化的方法和参考。; 关键词风电拉挤板生产排程深度强化学习 d3qn算法; Keywords wind power extrusion panels production scheduling deep reinforcement learning d3qn algorithm; 分类号 TB497 [一般工业技术]; 在线阅读下载PDF 职称材料

题名好奇心蒸馏双Q网络移动机器人路径规划方法被引量：2: 6; 作者张凤顾琦然袁帅; 机构沈阳建筑大学电气与控制工程学院; 出处《计算机工程与应用》 CSCD 北大核心 2023年第19期316-322,共7页; 基金国家自然科学基金面上项目(62073227) 辽宁省教育厅基金(LJKZ0581)。; 文摘针对移动机器人的路径规划中DQN算法存在过估计、样本利用率低、奖励稀疏等,从而影响机器人获取最优路径的问题,提出基于好奇心蒸馏模块竞争架构的双Q网络(curiosity distillation module dueling deep double Q-network prioritized experience replay,CDM-D3QN-PER)方法。该方法以D3QN为基础,在输入端添加长短时记忆网络(long short term memory,LSTM)处理雷达和相机的信息,降低过估计的影响,获得更有利的环境信息;采用优先经验回放机制(prioritized experience replay,PER)作为采样方法,使样本得到充分利用,提高样本利用率;引入好奇心蒸馏模块(curiosity distillation module,CDM),缓解奖励稀疏的问题。通过仿真实验与DQN、DDQN、D3QN相比,CDM-D3QN-PER算法训练的机器人到达目标点的次数明显增加,为DQN算法的3倍。该算法使奖励值得到提升,加快了收敛速度,能够在复杂的未知环境中获得最优路径。; 关键词 DQN算法 d3qn算法好奇心蒸馏模块长短时记忆网络(LSTM) 最优路径; Keywords deep Q-network(DQN)algorithm d3qn algorithm curiosity distillation module long short term memory(LSTM) optimal path; 分类号 TP39 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	基于D3QN的目标驱动移动机器人自主导航方法	卢赵清王宏伟何丽司盼召陈耀华	《电子测量技术》北大核心	2025	0	在线阅读下载PDF 职称材料
2	基于改进型D3QN深度强化学习的铁路智能选线方法	袁泉曾文驱李子涵高天赐杨冬营何庆	《铁道科学与工程学报》 EI CAS CSCD 北大核心	2022	12	在线阅读下载PDF 职称材料
3	深度强化学习求解动态柔性作业车间调度问题	杨丹舒先涛余震鲁光涛纪松霖王家兵	《现代制造工程》北大核心	2025	1	在线阅读下载PDF 职称材料
4	基于相邻分区可用转供能力的配电网分区间互济运行优化方法	罗龙波陈明辉王仁浚高红均刘俊勇	《南方电网技术》北大核心	2025	0	在线阅读下载PDF 职称材料
5	基于深度强化学习的风电拉挤板生产智能排程	杨逢海杨晓英裴志杰武亚琪张志伟	《现代制造工程》北大核心	2025	0	在线阅读下载PDF 职称材料
6	好奇心蒸馏双Q网络移动机器人路径规划方法	张凤顾琦然袁帅	《计算机工程与应用》 CSCD 北大核心	2023	2	在线阅读下载PDF 职称材料