期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
6
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于D3QN的目标驱动移动机器人自主导航方法
1
作者
卢赵清
王宏伟
+2 位作者
何丽
司盼召
陈耀华
《电子测量技术》
北大核心
2025年第9期9-18,共10页
在未知或危险环境中(如应急救灾、抢险救援),传统导航方法因无法预先获得先验地图和位置信息,难以实现特定目标的导航。本文提出了一种基于竞争双深度Q网络(D3QN)的目标驱动移动机器人自主导航方法。该方法的跨模态融合模块对不同模态...
在未知或危险环境中(如应急救灾、抢险救援),传统导航方法因无法预先获得先验地图和位置信息,难以实现特定目标的导航。本文提出了一种基于竞争双深度Q网络(D3QN)的目标驱动移动机器人自主导航方法。该方法的跨模态融合模块对不同模态特征动态加权融合,在整合观测数据的同时充分捕捉环境信息,增强了对环境的感知能力。在此基础上,设计了一种通用的目标驱动导航方法,使用YOLOv5识别特定目标(如火焰、烟雾)并获取其位置,用识别出的目标位置替代深度强化学习导航中的预设位置点,实现自主导航至特定目标。仿真实验结果表明,本文方法在导航成功率等指标上具有显著优势,在简单、复杂和动态场景中,成功率分别提高了9%、27%和38%。此外,在简单仿真环境中训练的模型,能够直接部署在复杂的仿真环境和真实场景中,表现出良好的泛化能力。
展开更多
关键词
深度强化学习
d3qn
算法
多模态融合
识别与定位
目标驱动导航
在线阅读
下载PDF
职称材料
基于改进型D3QN深度强化学习的铁路智能选线方法
被引量:
12
2
作者
袁泉
曾文驱
+3 位作者
李子涵
高天赐
杨冬营
何庆
《铁道科学与工程学报》
EI
CAS
CSCD
北大核心
2022年第2期344-350,共7页
传统的人工选线方法劳动强度大,设计效率低,随着我国铁路建设重心向西部复杂艰险山区转移,人工选线面临的困难日趋凸显。为缩减铁路选线的人力物力成本,提高设计效率,亟需发展结合了人工智能和信息技术的现代选线技术。为此,提出一种基...
传统的人工选线方法劳动强度大,设计效率低,随着我国铁路建设重心向西部复杂艰险山区转移,人工选线面临的困难日趋凸显。为缩减铁路选线的人力物力成本,提高设计效率,亟需发展结合了人工智能和信息技术的现代选线技术。为此,提出一种基于深度强化学习理论的铁路智能选线方法。以带有空间属性信息的数字高程模型为选线环境,以相邻空间点间的建造费用为即时奖励,以工程建造费用最小为优化目标,设置离散化的备选动作,考虑多种约束条件,构建面向铁路选线的深度强化学习模型。结合深度学习的感知能力和强化学习的决策能力,利用双竞争深度Q学习网络(Dueling-Double-Deep Q Network,D3QN)对模型进行训练,既克服强化学习问题对复杂状态和动作空间难以收敛的缺点,同时解决了传统DQN算法易于出现过估计、训练不稳定的问题,实现自动对选线环境进行感知、搜索、判断、决策,最终寻得目标函数最优的线路方案。以某山区铁路对本方法进行验证,实验结果表明:该方法能搜索到多样化的线路备选方案,可以为设计人员提供新的设计思路;有效降低了铁路建设的经济费用,较人工选线方案节约最多达17.5%。智能选线方法可以帮助节省选线工作成本,不遗漏有价值的方案,提高工作效率。
展开更多
关键词
深度强化学习
智能选线
d3qn
算法
信息化
在线阅读
下载PDF
职称材料
深度强化学习求解动态柔性作业车间调度问题
被引量:
1
3
作者
杨丹
舒先涛
+3 位作者
余震
鲁光涛
纪松霖
王家兵
《现代制造工程》
北大核心
2025年第2期10-16,共7页
随着智慧车间等智能制造技术的不断发展,人工智能算法在解决车间调度问题上的研究备受关注,其中车间运行过程中的动态事件是影响调度效果的一个重要扰动因素,为此提出一种采用深度强化学习方法来解决含有工件随机抵达的动态柔性作业车...
随着智慧车间等智能制造技术的不断发展,人工智能算法在解决车间调度问题上的研究备受关注,其中车间运行过程中的动态事件是影响调度效果的一个重要扰动因素,为此提出一种采用深度强化学习方法来解决含有工件随机抵达的动态柔性作业车间调度问题。首先以最小化总延迟为目标建立动态柔性作业车间的数学模型,然后提取8个车间状态特征,建立6个复合型调度规则,采用ε-greedy动作选择策略并对奖励函数进行设计,最后利用先进的D3QN算法进行求解并在不同规模车间算例上进行了有效性验证。结果表明,提出的D3QN算法能非常有效地解决含有工件随机抵达的动态柔性作业车间调度问题,在所有车间算例中的求优胜率为58.3%,相较于传统的DQN和DDQN算法车间延迟分别降低了11.0%和15.4%,进一步提升车间的生产制造效率。
展开更多
关键词
深度强化学习
d3qn
算法
工件随机抵达
柔性作业车间调度
动态调度
在线阅读
下载PDF
职称材料
基于相邻分区可用转供能力的配电网分区间互济运行优化方法
4
作者
罗龙波
陈明辉
+2 位作者
王仁浚
高红均
刘俊勇
《南方电网技术》
北大核心
2025年第10期99-110,共12页
在大规模配电网中,负荷转供可以有效缓解单个分区供电紧张的问题。然而,由于网格规模过大,传统的数学优化方法难以解决这一问题。首先提出了一种基于网络化简的分区可用转供能力量化评估模型,以选取互济运行的分区规模。其次,提出了一...
在大规模配电网中,负荷转供可以有效缓解单个分区供电紧张的问题。然而,由于网格规模过大,传统的数学优化方法难以解决这一问题。首先提出了一种基于网络化简的分区可用转供能力量化评估模型,以选取互济运行的分区规模。其次,提出了一种基于深度强化学习的配电网分区间互济运行优化方法以快速寻找到分区间互济运行方案。该方法改进了传统的奖励函数以提升智能体对不同负荷场景的适应能力与泛化特性。然后,采用对决双深度Q网络(dueling double deep Q network,D3QN)算法进行策略学习,以应对大规模系统的复杂性。最后,通过对IEEE 33节点系统和实际445节点系统进行仿真验证,验证了所提方法的有效性。
展开更多
关键词
配电网运行优化
可用转供能力量化评估
深度强化学习
d3qn
算法
在线阅读
下载PDF
职称材料
基于深度强化学习的风电拉挤板生产智能排程
5
作者
杨逢海
杨晓英
+2 位作者
裴志杰
武亚琪
张志伟
《现代制造工程》
北大核心
2025年第1期23-32,共10页
针对具有包装顺序齐套和产品换型调整等复杂特征的风电拉挤板生产排程问题,构建了最大化当期开动设备平均利用率和最大化订单履约率的多目标协同优化模型;将风电拉挤板生产排程问题转化为马尔科夫序列决策问题,设计了10种不同排程策略...
针对具有包装顺序齐套和产品换型调整等复杂特征的风电拉挤板生产排程问题,构建了最大化当期开动设备平均利用率和最大化订单履约率的多目标协同优化模型;将风电拉挤板生产排程问题转化为马尔科夫序列决策问题,设计了10种不同排程策略作为动作空间,提炼适当的状态特征和奖励函数;提出一种基于决斗双深度Q网络(D3QN)的排程算法。通过某企业实际数据的仿真试验,与Double DQN和Dueling DQN算法对比验证所提算法有效性;并比较4种不同求解方法在10个算例下得到的目标值,验证了所提出的改进D3QN算法可以得到问题的高质量解,为风电拉挤板制造企业生产排程提供了一种智能化的方法和参考。
展开更多
关键词
风电
拉挤板
生产排程
深度强化学习
d3qn
算法
在线阅读
下载PDF
职称材料
好奇心蒸馏双Q网络移动机器人路径规划方法
被引量:
2
6
作者
张凤
顾琦然
袁帅
《计算机工程与应用》
CSCD
北大核心
2023年第19期316-322,共7页
针对移动机器人的路径规划中DQN算法存在过估计、样本利用率低、奖励稀疏等,从而影响机器人获取最优路径的问题,提出基于好奇心蒸馏模块竞争架构的双Q网络(curiosity distillation module dueling deep double Q-network prioritized ex...
针对移动机器人的路径规划中DQN算法存在过估计、样本利用率低、奖励稀疏等,从而影响机器人获取最优路径的问题,提出基于好奇心蒸馏模块竞争架构的双Q网络(curiosity distillation module dueling deep double Q-network prioritized experience replay,CDM-D3QN-PER)方法。该方法以D3QN为基础,在输入端添加长短时记忆网络(long short term memory,LSTM)处理雷达和相机的信息,降低过估计的影响,获得更有利的环境信息;采用优先经验回放机制(prioritized experience replay,PER)作为采样方法,使样本得到充分利用,提高样本利用率;引入好奇心蒸馏模块(curiosity distillation module,CDM),缓解奖励稀疏的问题。通过仿真实验与DQN、DDQN、D3QN相比,CDM-D3QN-PER算法训练的机器人到达目标点的次数明显增加,为DQN算法的3倍。该算法使奖励值得到提升,加快了收敛速度,能够在复杂的未知环境中获得最优路径。
展开更多
关键词
DQN算法
d3qn
算法
好奇心蒸馏模块
长短时记忆网络(LSTM)
最优路径
在线阅读
下载PDF
职称材料
题名
基于D3QN的目标驱动移动机器人自主导航方法
1
作者
卢赵清
王宏伟
何丽
司盼召
陈耀华
机构
新疆大学机械工程学院
出处
《电子测量技术》
北大核心
2025年第9期9-18,共10页
基金
新疆维吾尔自治区自然科学基金(2022D01C392)
国家自然科学基金(62063033)
新疆维吾尔自治区重点研发计划项目(2022B01050-2)资助。
文摘
在未知或危险环境中(如应急救灾、抢险救援),传统导航方法因无法预先获得先验地图和位置信息,难以实现特定目标的导航。本文提出了一种基于竞争双深度Q网络(D3QN)的目标驱动移动机器人自主导航方法。该方法的跨模态融合模块对不同模态特征动态加权融合,在整合观测数据的同时充分捕捉环境信息,增强了对环境的感知能力。在此基础上,设计了一种通用的目标驱动导航方法,使用YOLOv5识别特定目标(如火焰、烟雾)并获取其位置,用识别出的目标位置替代深度强化学习导航中的预设位置点,实现自主导航至特定目标。仿真实验结果表明,本文方法在导航成功率等指标上具有显著优势,在简单、复杂和动态场景中,成功率分别提高了9%、27%和38%。此外,在简单仿真环境中训练的模型,能够直接部署在复杂的仿真环境和真实场景中,表现出良好的泛化能力。
关键词
深度强化学习
d3qn
算法
多模态融合
识别与定位
目标驱动导航
Keywords
deep reinforcement learning
d3qn algorithm
multimodal fusion
identification and location
target-driven navigation
分类号
TP242.6 [自动化与计算机技术—检测技术与自动化装置]
TN711 [电子电信—电路与系统]
在线阅读
下载PDF
职称材料
题名
基于改进型D3QN深度强化学习的铁路智能选线方法
被引量:
12
2
作者
袁泉
曾文驱
李子涵
高天赐
杨冬营
何庆
机构
广州地铁设计研究院股份有限公司
西南交通大学土木工程学院
出处
《铁道科学与工程学报》
EI
CAS
CSCD
北大核心
2022年第2期344-350,共7页
基金
高铁联合基金重点资助项目项目(U1934214)
国家自然科学基金资助项目(51878576)
+1 种基金
国家重点研发计划资助项目(2017YFB1201102)
四川省科技厅重点研发项目(2020YFG0049)。
文摘
传统的人工选线方法劳动强度大,设计效率低,随着我国铁路建设重心向西部复杂艰险山区转移,人工选线面临的困难日趋凸显。为缩减铁路选线的人力物力成本,提高设计效率,亟需发展结合了人工智能和信息技术的现代选线技术。为此,提出一种基于深度强化学习理论的铁路智能选线方法。以带有空间属性信息的数字高程模型为选线环境,以相邻空间点间的建造费用为即时奖励,以工程建造费用最小为优化目标,设置离散化的备选动作,考虑多种约束条件,构建面向铁路选线的深度强化学习模型。结合深度学习的感知能力和强化学习的决策能力,利用双竞争深度Q学习网络(Dueling-Double-Deep Q Network,D3QN)对模型进行训练,既克服强化学习问题对复杂状态和动作空间难以收敛的缺点,同时解决了传统DQN算法易于出现过估计、训练不稳定的问题,实现自动对选线环境进行感知、搜索、判断、决策,最终寻得目标函数最优的线路方案。以某山区铁路对本方法进行验证,实验结果表明:该方法能搜索到多样化的线路备选方案,可以为设计人员提供新的设计思路;有效降低了铁路建设的经济费用,较人工选线方案节约最多达17.5%。智能选线方法可以帮助节省选线工作成本,不遗漏有价值的方案,提高工作效率。
关键词
深度强化学习
智能选线
d3qn
算法
信息化
Keywords
deep reinforcement learning
intelligent railway location design
d3qn algorithm
informatization
分类号
U212.3 [交通运输工程—道路与铁道工程]
在线阅读
下载PDF
职称材料
题名
深度强化学习求解动态柔性作业车间调度问题
被引量:
1
3
作者
杨丹
舒先涛
余震
鲁光涛
纪松霖
王家兵
机构
武汉科技大学冶金装备及其控制省部共建教育部重点实验室
武汉科技大学机械传动与制造工程湖北省重点实验室
武汉科技大学精密制造研究院
出处
《现代制造工程》
北大核心
2025年第2期10-16,共7页
基金
国家自然科学基金项目(51808417)。
文摘
随着智慧车间等智能制造技术的不断发展,人工智能算法在解决车间调度问题上的研究备受关注,其中车间运行过程中的动态事件是影响调度效果的一个重要扰动因素,为此提出一种采用深度强化学习方法来解决含有工件随机抵达的动态柔性作业车间调度问题。首先以最小化总延迟为目标建立动态柔性作业车间的数学模型,然后提取8个车间状态特征,建立6个复合型调度规则,采用ε-greedy动作选择策略并对奖励函数进行设计,最后利用先进的D3QN算法进行求解并在不同规模车间算例上进行了有效性验证。结果表明,提出的D3QN算法能非常有效地解决含有工件随机抵达的动态柔性作业车间调度问题,在所有车间算例中的求优胜率为58.3%,相较于传统的DQN和DDQN算法车间延迟分别降低了11.0%和15.4%,进一步提升车间的生产制造效率。
关键词
深度强化学习
d3qn
算法
工件随机抵达
柔性作业车间调度
动态调度
Keywords
deep reinforcement learning
d3qn algorithm
random job arrival
flexible job shop scheduling problem
dynamic scheduling
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
基于相邻分区可用转供能力的配电网分区间互济运行优化方法
4
作者
罗龙波
陈明辉
王仁浚
高红均
刘俊勇
机构
广东电网有限责任公司广州供电局
四川大学电气工程学院
出处
《南方电网技术》
北大核心
2025年第10期99-110,共12页
基金
国家自然科学基金资助项目(52077146)
中国南方电网有限责任公司创新项目(030100KK52222069)。
文摘
在大规模配电网中,负荷转供可以有效缓解单个分区供电紧张的问题。然而,由于网格规模过大,传统的数学优化方法难以解决这一问题。首先提出了一种基于网络化简的分区可用转供能力量化评估模型,以选取互济运行的分区规模。其次,提出了一种基于深度强化学习的配电网分区间互济运行优化方法以快速寻找到分区间互济运行方案。该方法改进了传统的奖励函数以提升智能体对不同负荷场景的适应能力与泛化特性。然后,采用对决双深度Q网络(dueling double deep Q network,D3QN)算法进行策略学习,以应对大规模系统的复杂性。最后,通过对IEEE 33节点系统和实际445节点系统进行仿真验证,验证了所提方法的有效性。
关键词
配电网运行优化
可用转供能力量化评估
深度强化学习
d3qn
算法
Keywords
distribution network operation optimization
quantitative assessment of available transfer capacity
deep reinforcement learning
d3qn algorithm
分类号
TM726 [电气工程—电力系统及自动化]
在线阅读
下载PDF
职称材料
题名
基于深度强化学习的风电拉挤板生产智能排程
5
作者
杨逢海
杨晓英
裴志杰
武亚琪
张志伟
机构
河南科技大学机电工程学院
机械装备先进制造河南省协同创新中心
河南科技大学商学院
出处
《现代制造工程》
北大核心
2025年第1期23-32,共10页
基金
河南省重点研发专项项目(231111222600)。
文摘
针对具有包装顺序齐套和产品换型调整等复杂特征的风电拉挤板生产排程问题,构建了最大化当期开动设备平均利用率和最大化订单履约率的多目标协同优化模型;将风电拉挤板生产排程问题转化为马尔科夫序列决策问题,设计了10种不同排程策略作为动作空间,提炼适当的状态特征和奖励函数;提出一种基于决斗双深度Q网络(D3QN)的排程算法。通过某企业实际数据的仿真试验,与Double DQN和Dueling DQN算法对比验证所提算法有效性;并比较4种不同求解方法在10个算例下得到的目标值,验证了所提出的改进D3QN算法可以得到问题的高质量解,为风电拉挤板制造企业生产排程提供了一种智能化的方法和参考。
关键词
风电
拉挤板
生产排程
深度强化学习
d3qn
算法
Keywords
wind power
extrusion panels
production scheduling
deep reinforcement learning
d3qn algorithm
分类号
TB497 [一般工业技术]
在线阅读
下载PDF
职称材料
题名
好奇心蒸馏双Q网络移动机器人路径规划方法
被引量:
2
6
作者
张凤
顾琦然
袁帅
机构
沈阳建筑大学电气与控制工程学院
出处
《计算机工程与应用》
CSCD
北大核心
2023年第19期316-322,共7页
基金
国家自然科学基金面上项目(62073227)
辽宁省教育厅基金(LJKZ0581)。
文摘
针对移动机器人的路径规划中DQN算法存在过估计、样本利用率低、奖励稀疏等,从而影响机器人获取最优路径的问题,提出基于好奇心蒸馏模块竞争架构的双Q网络(curiosity distillation module dueling deep double Q-network prioritized experience replay,CDM-D3QN-PER)方法。该方法以D3QN为基础,在输入端添加长短时记忆网络(long short term memory,LSTM)处理雷达和相机的信息,降低过估计的影响,获得更有利的环境信息;采用优先经验回放机制(prioritized experience replay,PER)作为采样方法,使样本得到充分利用,提高样本利用率;引入好奇心蒸馏模块(curiosity distillation module,CDM),缓解奖励稀疏的问题。通过仿真实验与DQN、DDQN、D3QN相比,CDM-D3QN-PER算法训练的机器人到达目标点的次数明显增加,为DQN算法的3倍。该算法使奖励值得到提升,加快了收敛速度,能够在复杂的未知环境中获得最优路径。
关键词
DQN算法
d3qn
算法
好奇心蒸馏模块
长短时记忆网络(LSTM)
最优路径
Keywords
deep Q-network(DQN)
algorithm
d3qn algorithm
curiosity distillation module
long short term memory(LSTM)
optimal path
分类号
TP39 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于D3QN的目标驱动移动机器人自主导航方法
卢赵清
王宏伟
何丽
司盼召
陈耀华
《电子测量技术》
北大核心
2025
0
在线阅读
下载PDF
职称材料
2
基于改进型D3QN深度强化学习的铁路智能选线方法
袁泉
曾文驱
李子涵
高天赐
杨冬营
何庆
《铁道科学与工程学报》
EI
CAS
CSCD
北大核心
2022
12
在线阅读
下载PDF
职称材料
3
深度强化学习求解动态柔性作业车间调度问题
杨丹
舒先涛
余震
鲁光涛
纪松霖
王家兵
《现代制造工程》
北大核心
2025
1
在线阅读
下载PDF
职称材料
4
基于相邻分区可用转供能力的配电网分区间互济运行优化方法
罗龙波
陈明辉
王仁浚
高红均
刘俊勇
《南方电网技术》
北大核心
2025
0
在线阅读
下载PDF
职称材料
5
基于深度强化学习的风电拉挤板生产智能排程
杨逢海
杨晓英
裴志杰
武亚琪
张志伟
《现代制造工程》
北大核心
2025
0
在线阅读
下载PDF
职称材料
6
好奇心蒸馏双Q网络移动机器人路径规划方法
张凤
顾琦然
袁帅
《计算机工程与应用》
CSCD
北大核心
2023
2
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部