期刊文献+
共找到28篇文章
< 1 2 >
每页显示 20 50 100
基于双深度Q网络算法的无人机辅助密集网络资源优化策略
1
作者 陈佳美 孙慧雯 +2 位作者 李玉峰 王宇鹏 别玉霞 《电子与信息学报》 北大核心 2025年第8期2621-2629,共9页
为顺应未来网络向密集化与空间化方向的发展趋势,该文提出构建一种多基站共存的空地结合超密集复杂网络,并开发半分布式方案以优化网络资源。首先,建立包括宏基站、微基站和无人机(UAV)空中基站在内的多种基站共存的超密集复杂网络构架... 为顺应未来网络向密集化与空间化方向的发展趋势,该文提出构建一种多基站共存的空地结合超密集复杂网络,并开发半分布式方案以优化网络资源。首先,建立包括宏基站、微基站和无人机(UAV)空中基站在内的多种基站共存的超密集复杂网络构架。在此基础上,针对传统完全集中式方案存在的计算负担重、响应速度慢以及分布式方案缺乏全局优化视角等问题,提出一种半分布式的双深度Q网络(DDQN)功率控制方案。该方案旨在优化网络能效,通过分布式决策与集中训练相结合的方式,有效平衡了计算复杂度和性能优化。具体而言,半分布式方案利用DDQN算法在基站侧进行分布式决策,同时引入集中式网络训练器以确保整体网络的能效最优。仿真结果表明,所提出的半分布式DDQN方案能够很好地适应密集复杂网络结构,与传统深度Q网络(DQN)相比,在能效和总吞吐量方面均取得了显著提升。 展开更多
关键词 空地密集网络 半分布式 深度Q网络算法 资源优化
在线阅读 下载PDF
基于改进深度强化学习算法的农业机器人路径规划
2
作者 赵威 张万枝 +4 位作者 侯加林 侯瑞 李玉华 赵乐俊 程进 《浙江大学学报(工学版)》 北大核心 2025年第7期1492-1503,共12页
农业机器人采用深度强化学习算法进行路径规划时存在难以找到目标点、稀疏奖励、收敛缓慢等问题,为此提出基于多目标点导航融合改进深度Q网络算法(MPN-DQN)的路径规划方法.利用激光同步定位与建图(SLAM)扫描全局环境以构建先验地图,划... 农业机器人采用深度强化学习算法进行路径规划时存在难以找到目标点、稀疏奖励、收敛缓慢等问题,为此提出基于多目标点导航融合改进深度Q网络算法(MPN-DQN)的路径规划方法.利用激光同步定位与建图(SLAM)扫描全局环境以构建先验地图,划分行走行和作物行区域;对地图边界进行膨胀拟合处理,形成前向弓字形作业走廊.利用中间目标点分割全局环境,将复杂环境划分为多阶段短程导航环境以简化目标点搜索过程.从动作空间、探索策略和奖励函数3个方面改进深度Q网络算法以改善奖励稀疏问题,加快算法收敛速度,提高导航成功率.实验结果表明,搭载MPN-DQN的农业机器人自主行驶的总碰撞次数为1,平均导航时间为104.27 s,平均导航路程为16.58 m,平均导航成功率为95%. 展开更多
关键词 深度强化学习 农业机器人 中间目标点 多目标点导航融合改进深度Q网络算法(MPN-DQN) 路径规划
在线阅读 下载PDF
无人机高光谱遥感和集成深度置信神经网络算法用于密云水库水质参数反演 被引量:5
3
作者 乔智 姜群鸥 +1 位作者 律可心 高峰 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2024年第7期2066-2074,共9页
随工业化及社会经济迅速发展,水源地面临的水体污染、恶化不断加剧,开展有效的水质监测是水源保护的重要前提。密云水库是北京重要的地表水源地,在保护首都水源安全方面发挥着重要作用。为更精准的监测密云水库水质参数及污染程度,采用... 随工业化及社会经济迅速发展,水源地面临的水体污染、恶化不断加剧,开展有效的水质监测是水源保护的重要前提。密云水库是北京重要的地表水源地,在保护首都水源安全方面发挥着重要作用。为更精准的监测密云水库水质参数及污染程度,采用4期无人机高光谱遥感数据,基于随机子空间的集成深度置信神经网络算法(EDBN),构建密云水库水质参数反演模型,对密云水库总氮(TN)、总磷(TP)两项水质参数进行反演。首先,采用基于递归特征消除法对高光谱影像降维处理,将光谱数据与地面水质监测数据进行叠加,通过最小化训练过程中误差来确定隐藏层数、神经节点数等网络结构参数;然后采用由知识源域向网络迁移方式逐步拓展网络,对密云水库总氮和总磷两个水质参数进行训练并对结果进行验证;最后,反演密云水库潮河大坝和白河大坝区域水质参数,揭示其主要水质参数时空演变规律。研究结果显示:(1)构建总氮、总磷反演模型R^(2)分别为0.8355、0.7703,MSE分别为0.0153、0.0008,这表明基于随机子空间的集成深度置信神经网络算法模型对密云水库水质参数反演效果较好;(2)密云水库总氮浓度变化随季节发生一定波动,在夏季浓度较低,秋季相对较高。总磷浓度变化相对平稳,表明密云水库周边区域对磷污染控制效果良好;(3)白河大坝区域水质优于潮河大坝区域,总氮浓度相对偏高,整体处于Ⅲ类水平。而总磷浓度较低,整体处于Ⅱ类水平,较好时可以达到Ⅰ类水平。整体水质可以满足饮用水源的标准,但仍需加强对氮、磷污染物有效监管。研究结果将为密云水库水质高效监测与水源保护提供重要科学依据。 展开更多
关键词 无人机高光谱 深度神经网络算法 水质反演 密云水库
在线阅读 下载PDF
煤矿采空区智能充填深度神经网络算法 被引量:4
4
作者 周忠斌 梁卫国 +1 位作者 郭凤岐 阎雾龙 《太原理工大学学报》 CAS 北大核心 2024年第2期223-230,共8页
【目的】采空区智能充填是煤炭资源绿色安全智能高效开采的重要方向,其关键在于对井下采空区矸石充填过程进行智能决策与控制。【方法】为实现该目标,以采空区充填后围岩应力及变形作为监测指标,建立了一种采空区智能充填深度神经网络算... 【目的】采空区智能充填是煤炭资源绿色安全智能高效开采的重要方向,其关键在于对井下采空区矸石充填过程进行智能决策与控制。【方法】为实现该目标,以采空区充填后围岩应力及变形作为监测指标,建立了一种采空区智能充填深度神经网络算法,该算法可以通过输入煤层埋深、厚度、工作面长度、直接顶厚度等关键基本参数,进行相应条件下不同充填方案的采场应力及围岩变形计算分析。将FLAC3D模拟400种不同条件下的充填开采结果作为数据集,对建立的智能充填深度神经网络算法进行训练测试,并和其余3种不同算法进行对比分析。【结果】结果表明:建立的智能充填深度神经网络算法总体优于随机森林、决策树和多元线性回归算法,每组数据运算平均速度仅为0.013 s;智能充填深度神经网络算法计算的顶板最大变形、工作面煤壁压力峰值、巷道超前支护距离等关键参数误差均值介于2%~8%之间;应用该算法针对现场实际条件进行测试,结果与现场实际结果基本吻合,表明该算法科学可行。【结论】本研究对煤矿绿色智能开采具有重要意义与价值。 展开更多
关键词 采空区充填 绿色开采 智能充填 深度神经网络算法
在线阅读 下载PDF
基于双深度Q网络算法的多用户端对端能源共享机制研究
5
作者 武东昊 王国烽 +2 位作者 毛毳 陈玉萍 张有兵 《高技术通讯》 CAS 北大核心 2024年第7期755-764,共10页
端对端(P2P)电力交易作为用户侧能源市场的一种新的能源平衡和互动方式,可以有效促进用户群体内的能源共享,提高参与能源市场用户的经济效益。然而传统求解用户间P2P交易的方法依赖对于光伏、负荷数据的预测,难以实时响应用户间的源荷... 端对端(P2P)电力交易作为用户侧能源市场的一种新的能源平衡和互动方式,可以有效促进用户群体内的能源共享,提高参与能源市场用户的经济效益。然而传统求解用户间P2P交易的方法依赖对于光伏、负荷数据的预测,难以实时响应用户间的源荷变动问题。为此,本文建立了一种以多类型用户为基础的多用户P2P能源社区交易模型,并引入基于双深度Q网络(DDQN)的强化学习(RL)算法对其进行求解。所提方法通过DDQN算法中的预测网络以及目标网络读取多用户P2P能源社区中的环境信息,训练后的神经网络可通过实时的光伏、负荷以及电价数据对当前社区内的多用户P2P交易问题进行求解。案例仿真结果表明,所提方法在促进社区内用户间P2P能源交易共享的同时,保证了多用户P2P能源社区的经济性。 展开更多
关键词 端对端(P2P)能源共享 强化学习(RL) 能源交易市场 深度Q网络(DDQN)算法
在线阅读 下载PDF
基于Im2col的并行深度卷积神经网络优化算法 被引量:12
6
作者 胡健 龚克 +2 位作者 毛伊敏 陈志刚 陈亮 《计算机应用研究》 CSCD 北大核心 2022年第10期2950-2956,2961,共8页
针对大数据环境下并行深度卷积神经网络(DCNN)算法中存在数据冗余特征多、卷积层运算速度慢、损失函数收敛性差等问题,提出了一种基于Im2col方法的并行深度卷积神经网络优化算法IA-PDCNNOA。首先,提出基于Marr-Hildreth算子的并行特征... 针对大数据环境下并行深度卷积神经网络(DCNN)算法中存在数据冗余特征多、卷积层运算速度慢、损失函数收敛性差等问题,提出了一种基于Im2col方法的并行深度卷积神经网络优化算法IA-PDCNNOA。首先,提出基于Marr-Hildreth算子的并行特征提取策略MHO-PFES,提取数据中的目标特征作为卷积神经网络的输入,有效避免了数据冗余特征多的问题;其次,设计基于Im2col方法的并行模型训练策略IM-PMTS,通过设计马氏距离中心值去除冗余卷积核,并结合MapReduce和Im2col方法并行训练模型,提高了卷积层运算速度;最后提出改进的小批量梯度下降策略IM-BGDS,排除异常节点的训练数据对批梯度的影响,解决了损失函数收敛性差的问题。实验结果表明,IA-PDCNNOA算法在大数据环境下进行深度卷积神经网络计算具有较好的性能表现,适用于大规模数据集的并行化深度卷积神经网络模型训练。 展开更多
关键词 大数据 深度卷积神经网络算法 并行计算 特征提取 图像分类
在线阅读 下载PDF
基于ABWO的并行DCNN优化算法 被引量:1
7
作者 毛伊敏 刘映兴 《计算机工程与设计》 北大核心 2025年第2期353-359,共7页
针对并行DCNN算法在大数据环境下存在特征差异性较小、模型性能不足、参数更新慢和集群并行效率低等问题,提出一种基于ABWO的并行DCNN优化算法PDCNN-ABWO。提出一种基于自适应密度峰值聚类的特征选择策略FS-ADPC划分原始特征,筛选差异... 针对并行DCNN算法在大数据环境下存在特征差异性较小、模型性能不足、参数更新慢和集群并行效率低等问题,提出一种基于ABWO的并行DCNN优化算法PDCNN-ABWO。提出一种基于自适应密度峰值聚类的特征选择策略FS-ADPC划分原始特征,筛选差异性较大的特征;设计一种ResNet-CBAMDW模型,提升模型性能;提出一种基于自适应黑寡妇优化算法的并行训练策略PT-ABWO优化初始参数,加快参数更新速度;提出一种基于大数据基准测试的动态负载均衡策略DLB-BDB,合理分配任务负载,提升集群并行效率。实验结果表明,该算法能够有效提升DCNN在大数据环境下的训练效率。 展开更多
关键词 大数据 并行深度卷积神经网络算法 密度峰值聚类 自适应黑寡妇优化算法 并行训练 基准测试 负载均衡
在线阅读 下载PDF
基于联合增强图像对的红外可见光深度展开图像融合网络 被引量:1
8
作者 袁天蕙 干宗良 《计算机科学》 CSCD 北大核心 2024年第10期311-319,共9页
受到采集环境的影响,红外可见光融合图像有时会存在亮度不足、细节信息不够的问题。为此,提出了一种基于联合增强图像对的红外可见光深度展开图像融合网络,同时将原始红外-可见光图像对和红外-可见光图像增强对作为输入,提高网络信息融... 受到采集环境的影响,红外可见光融合图像有时会存在亮度不足、细节信息不够的问题。为此,提出了一种基于联合增强图像对的红外可见光深度展开图像融合网络,同时将原始红外-可见光图像对和红外-可见光图像增强对作为输入,提高网络信息融合能力。文中首先提出了一种残差展开模块,在此基础上构建了基于迭代的残差展开卷积网络用于特征提取,使其根据不同的初始化参数提取对应图像的背景和细节信息。此外,在特征融合卷积融合网络中引入了维度拼接操作和上下采样卷积块,实现联合红外-可见光图像增强对的特性汇聚,最大限度地保留源图像的差异特征。同时,优化了损失函数权重设计,以获得最佳的融合结果。在多个数据库上进行了大量实验,结果表明,与现有典型的融合方法相比,所提算法的融合图像在主观视觉和客观指标评价上均具有较好性能,在暗照度环境下优于其他方法。 展开更多
关键词 图像融合 深度算法展开网络 图像增强 特征提取 特征融合
在线阅读 下载PDF
基于多新息理论的深度信念网络算法 被引量:5
9
作者 李萌 秦品乐 李传朋 《计算机应用》 CSCD 北大核心 2016年第9期2521-2525,2534,共6页
针对深度信念网络(DBN)算法在采用反向传播修正网络的连接权值和偏置的过程中,容易产生梯度小、学习率低、误差收敛速度慢等问题,提出一种结合多新息理论对标准DBN算法进行改进的算法,即多新息DBN(MIDBN)。MI-DBN算法是对标准DBN算法中... 针对深度信念网络(DBN)算法在采用反向传播修正网络的连接权值和偏置的过程中,容易产生梯度小、学习率低、误差收敛速度慢等问题,提出一种结合多新息理论对标准DBN算法进行改进的算法,即多新息DBN(MIDBN)。MI-DBN算法是对标准DBN算法中反向传播的过程重新建模,使得算法在原先只利用单个新息的情况下,扩展为能够充分利用之前多个周期的新息,从而大幅提高误差收敛速度。通过实验对MI-DBN算法和其他分类算法进行了数据集分类的比较,实验结果表明,MI-DBN算法相较其他分类算法,其误差收敛速度较快,而且最终对MNIST数据集和Caltech101数据集的识别中误差结果相对更小。 展开更多
关键词 深度信念网络算法 误差收敛速度 多新息理论 反向传播
在线阅读 下载PDF
基于深度置信网络算法的面向铁磁材料旋转磁滞损耗的矢量磁滞模型 被引量:3
10
作者 马阳阳 李永建 +2 位作者 孙鹤 杨明 窦润田 《电工技术学报》 EI CSCD 北大核心 2023年第15期4063-4075,共13页
铁磁材料磁滞建模是电气工程领域的基础性理论研究之一。该文基于深度置信网络(DBN)算法结合磁滞算子空间理论提出一种矢量磁滞模型。在模型结构中,引入郎之万函数作为映射函数对磁滞数据进行输入转换计算。利用多个磁滞算子构建算子空... 铁磁材料磁滞建模是电气工程领域的基础性理论研究之一。该文基于深度置信网络(DBN)算法结合磁滞算子空间理论提出一种矢量磁滞模型。在模型结构中,引入郎之万函数作为映射函数对磁滞数据进行输入转换计算。利用多个磁滞算子构建算子空间生成高维算子数据,算子空间的数据输出作为DBN模型的输入,结合DBN算法表征算子数据与模型输出的非线性关系。利用样本的磁感应强度数据和生成的算子数据训练模型,获得模型参数。通过仿真表明构建的模型可以有效地描述铁磁材料在旋转磁化情况下的非线性特性和各项异性。同时,结合磁损分离理论改进磁损模型中相应的损耗系数,构建动态磁损计算模型,并将磁滞模型获得的数据应用于动态损耗计算。仿真表明,构建的磁滞模型可以有效地表征铁磁材料的实际磁化特性和损耗情况。 展开更多
关键词 磁滞模型 深度置信网络算法 磁滞算子 磁滞损耗
在线阅读 下载PDF
基于改进竞争深度Q网络算法的微电网能量管理与优化策略 被引量:24
11
作者 黎海涛 申保晨 +3 位作者 杨艳红 裴玮 吕鑫 韩雨庭 《电力系统自动化》 EI CSCD 北大核心 2022年第7期42-49,共8页
可再生能源发电的随机波动性和储能运行控制的时间序列耦合特性给微电网的能量管理与最优运行带来了诸多挑战,成为学术界研究的热点问题。文中提出一种基于改进竞争深度Q网络算法的微电网能量管理与优化方法,采用多参数动作探索机制和... 可再生能源发电的随机波动性和储能运行控制的时间序列耦合特性给微电网的能量管理与最优运行带来了诸多挑战,成为学术界研究的热点问题。文中提出一种基于改进竞争深度Q网络算法的微电网能量管理与优化方法,采用多参数动作探索机制和优化设计的神经网络结构,对分布式可再生能源的功率输出、能源交易市场的电价和电力负荷的状态等环境信息进行学习,并运用学习到的策略进行微电网能量管理与优化。仿真结果表明,基于改进竞争深度Q网络算法的微电网能量管理与优化策略的性能优于基于场景的随机规划算法、深度Q网络算法和竞争深度Q网络算法。 展开更多
关键词 微电网 能量管理 深度强化学习 竞争深度Q网络算法 神经网络结构 多参数动作探索机制
在线阅读 下载PDF
基于Dueling-DQN的协同进化算法求解绿色分布式异构柔性作业车间调度问题
12
作者 夏良才 陈仕军 《现代制造工程》 北大核心 2025年第7期8-19,共12页
针对绿色分布式异构柔性作业车间调度问题(Green Distributed Heterogeneous Flexible Job shop Scheduling Problem,GDHFJSP),提出了基于竞争构架深度Q网络算法(Dueling Deep Q-Network,Dueling-DQN)的协同进化算法(Dueling-DQNCE),以... 针对绿色分布式异构柔性作业车间调度问题(Green Distributed Heterogeneous Flexible Job shop Scheduling Problem,GDHFJSP),提出了基于竞争构架深度Q网络算法(Dueling Deep Q-Network,Dueling-DQN)的协同进化算法(Dueling-DQNCE),以最小化最大完工时间和最小化总能耗为目标,选择Pareto前沿解,获得优质的解决方案。首先,在该算法的初始化阶段提出了两种初始化种群方法,有效改善初始解种群的质量。其次,在解码阶段使用活动调度方案能更全面地探索解空间,获取高质量的解。针对多目标问题,提出了快速比较法,能快速高效地得到Pareto前沿解。接着,提出了10种基于知识驱动的邻域搜索策略,并使用Dueling-DQN智能学习来为每个解选择合适的局部搜索策略,加快种群的收敛速度。为了验证Dueling-DQNCE的有效性,将Dueling-DQNCE与文献中最先进的基于深度Q网络的协同进化算法(Co-Evolution with Deep-Q-network,DQCE)在20个算例上进行比较。计算结果表明,Dueling-DQNCE在计算资源和解质量上都优于DQCE,验证了所提出算法的有效性和优越性。 展开更多
关键词 绿色分布式异构作业车间调度 协同进化 Pareto前沿解 竞争架构深度Q网络算法
在线阅读 下载PDF
基于改进DQN强化学习算法的弹性光网络资源分配研究 被引量:3
13
作者 尚晓凯 韩龙龙 翟慧鹏 《光通信技术》 2023年第5期12-15,共4页
针对光网络资源分配中频谱资源利用率不高的问题,提出了一种改进的深度Q网络(DQN)强化学习算法。该算法基于ε-greedy策略,根据动作价值函数和状态价值函数的差异来设定损失函数,并不断调整ε值,以改变代理的探索率。通过这种方式,实现... 针对光网络资源分配中频谱资源利用率不高的问题,提出了一种改进的深度Q网络(DQN)强化学习算法。该算法基于ε-greedy策略,根据动作价值函数和状态价值函数的差异来设定损失函数,并不断调整ε值,以改变代理的探索率。通过这种方式,实现了最优的动作值函数,并较好地解决了路由与频谱分配问题。此外,采用了不同的经验池取样方法,以提高迭代训练的收敛速度。仿真结果表明:改进DQN强化学习算法不仅能够使弹性光网络训练模型快速收敛,当业务量为300 Erlang时,比DQN算法频谱资源利用率提高了10.09%,阻塞率降低了12.41%,平均访问时延减少了1.27 ms。 展开更多
关键词 弹性光网络 改进深度Q网络强化学习算法 资源分配
在线阅读 下载PDF
多车道复杂环境下前方车辆检测算法 被引量:4
14
作者 孔栋 黄江亮 +2 位作者 孙亮 钟志伟 孙一帆 《河南科技大学学报(自然科学版)》 CAS 北大核心 2018年第2期25-30,35,共7页
为了解决智能车安全辅助驾驶系统中前方车辆目标的检测问题,提出了一种基于改进阴影多特征与深度网络学习的车辆检测算法。基于前方车辆与本车存在安全距离,选取道路图像底部几行作为候选道路背景并对其预处理排除干扰,通过差分得到车... 为了解决智能车安全辅助驾驶系统中前方车辆目标的检测问题,提出了一种基于改进阴影多特征与深度网络学习的车辆检测算法。基于前方车辆与本车存在安全距离,选取道路图像底部几行作为候选道路背景并对其预处理排除干扰,通过差分得到车底阴影增强图像。利用自适应阈值法确定图像灰度分割阈值并对道路二值化图像进行形态学预处理。然后,利用最小外接矩形框选候选车辆目标,结合车底阴影几何位置特征、对称度特征进行滤波生成车辆假设。最后,基于局部二值模式纹理特征和深度学习方法验证车辆假设。实验结果表明:在复杂干扰的多车道环境中,算法可以有效地检测前方车辆目标。 展开更多
关键词 车辆检测 改进阴影多特征 局部二值模式纹理 深度网络算法 机器视觉
在线阅读 下载PDF
基于CPBOA的并行DCNN优化算法
15
作者 温占卿 毛伊敏 彭喆 《计算机工程与设计》 北大核心 2024年第11期3296-3303,共8页
针对大数据环境下并行DCNN算法存在的冗余特征图过多、卷积运算效率低下以及节点负载不均衡等问题,提出一种基于Spark和CPBOA的并行DCNN优化算法PDCNN-SCPBOA。提出一种基于奇异值分解与JS散度的特征压缩策略对特征图进行分组压缩,消除... 针对大数据环境下并行DCNN算法存在的冗余特征图过多、卷积运算效率低下以及节点负载不均衡等问题,提出一种基于Spark和CPBOA的并行DCNN优化算法PDCNN-SCPBOA。提出一种基于奇异值分解与JS散度的特征压缩策略对特征图进行分组压缩,消除过多的冗余特征图;结合Spark提出一种基于蝴蝶优化算法的并行CP分解策略,利用分解后的卷积核并行训练,提高卷积运算效率;提出一种基于簇分割的负载均衡策略,对中间数据簇进行均匀分配后再进行处理,平衡节点负载。实验结果表明,所提算法具有良好的训练效果,适用于大规模图像数据的分类。 展开更多
关键词 深度卷积神经网络算法 并行计算 分布式框架 特征压缩 张量分解 蝴蝶优化算法 负载均衡
在线阅读 下载PDF
缓存辅助的移动边缘计算任务卸载与资源分配
16
作者 李致远 陈品润 《计算机工程与设计》 北大核心 2025年第5期1248-1255,共8页
针对边缘计算网络环境下的计算任务卸载与资源分配问题,提出一种基于分层强化学习的联合优化缓存、卸载与资源分配(HRLJCORA)算法。以时延和能耗为优化目标,将原优化问题分解为两个子问题,下层利用深度Q-learning网络算法进行缓存决策,... 针对边缘计算网络环境下的计算任务卸载与资源分配问题,提出一种基于分层强化学习的联合优化缓存、卸载与资源分配(HRLJCORA)算法。以时延和能耗为优化目标,将原优化问题分解为两个子问题,下层利用深度Q-learning网络算法进行缓存决策,上层使用软动作评价算法进行计算任务卸载与资源分配决策。仿真实验结果表明,HRLJCORA算法与现有基线算法相比,有效降低了总开销,相较于联合优化计算任务卸载与资源分配(JORA)算法,卸载决策奖励值提高了13.11%,为用户提供了更优质的服务。 展开更多
关键词 移动边缘计算 缓存辅助 卸载决策 资源分配 分层强化学习 深度Q-learning网络算法 软动作评价算法
在线阅读 下载PDF
双足机器人步态控制的深度强化学习方法 被引量:11
17
作者 冯春 张祎伟 +2 位作者 黄成 姜文彪 武之炜 《计算机集成制造系统》 EI CSCD 北大核心 2021年第8期2341-2349,共9页
针对双足机器人行走过程中的步态稳定控制问题,提出一种改进深度Q网络的深度强化学习方法。首先,将深度Q网络算法与确定性策略梯度相结合,提出用修正Double-Q网络优化操作—评论网络的评论网络,给出一种改进的深度Q网络;然后,建立双足... 针对双足机器人行走过程中的步态稳定控制问题,提出一种改进深度Q网络的深度强化学习方法。首先,将深度Q网络算法与确定性策略梯度相结合,提出用修正Double-Q网络优化操作—评论网络的评论网络,给出一种改进的深度Q网络;然后,建立双足机器人连杆模型,在常规的平整路面上将改进的深度Q网络用于作为智能体的双足机器人进行步态控制训练。MATLAB仿真结果表明,与深度Q网络和深度确定性策略梯度算法相比,所提算法有更好的训练速度且其回报曲线具有良好的平滑性。在CPU训练下,经过20 h左右深度强化学习能够完成智能体训练。双足机器人在较小的力矩和长距离下能够稳定快步行走。 展开更多
关键词 双足机器人 步态控制 深度强化学习 智能体 操作—评论 改进深度Q网络算法
在线阅读 下载PDF
融合MLP和DBN的光伏发电预测算法 被引量:8
18
作者 徐先峰 蔡路路 张丽 《计算机工程与应用》 CSCD 北大核心 2021年第3期266-272,共7页
精确的光伏发电预测对提高电力系统稳定性、保证电能质量、优化电网运行具有重大意义。为了解决现存光伏预测算法精度较低、性能较差的问题,同时为了综合利用多层感知器(MLP)解决非线性问题的能力以及深度信念网络(DBN)有效处理大量复... 精确的光伏发电预测对提高电力系统稳定性、保证电能质量、优化电网运行具有重大意义。为了解决现存光伏预测算法精度较低、性能较差的问题,同时为了综合利用多层感知器(MLP)解决非线性问题的能力以及深度信念网络(DBN)有效处理大量复杂数据的优势,构建了一种融合MLP和DBN的光伏预测算法(MLP-DBN),其基本思想是先利用MLP模型进行初步预测,再将观测值与预测值的残差输入DBN预测模型进行预测,最后用残差预测值对MLP模型的预测值进行修正。利用光伏发电实测数据仿真,探究了不同学习率下模型的预测性能,并对模型的各参数进行了寻找优化设置。使用均方根误差、平均绝对误差以及决定系数等性能指标评估结果表明,与传统的预测算法支持向量机(SVM)以及具有较高预测精度的深度学习算法长短期记忆网络(LSTM)相比,MLP-DBN算法性能有明显的提升,为光伏发电提供了一种高精度高性能的预测算法,可以有效解决光伏发电预测问题。 展开更多
关键词 光伏发电预测 深度学习 支持向量机(SVM) 长短期记忆网络(LSTM) 多层感知器-深度信念网络(MLP-DBN)算法
在线阅读 下载PDF
航空混合动力系统能量管理策略研究综述
19
作者 张丁予 沈挺 《航空发动机》 北大核心 2025年第1期12-20,共9页
能量管理策略作为航空混合动力系统的顶层控制,用于对混合动力系统不同动力源进行能量分流,是保证系统高效运行的基础。详细论述了各类航空混合动力系统能量管理策略,系统总结了基于规则、优化和智能3类能量管理策略的特点和研究现状。... 能量管理策略作为航空混合动力系统的顶层控制,用于对混合动力系统不同动力源进行能量分流,是保证系统高效运行的基础。详细论述了各类航空混合动力系统能量管理策略,系统总结了基于规则、优化和智能3类能量管理策略的特点和研究现状。通过阐述强化学习原理,分析了深度Q网络算法和深度确定性策略梯度算法的奖励原理、神经网络更新原理、以及各自优缺点及适用场景,并提出基于规则类能量管理策略对于专家经验依赖性较高等缺陷,可以通过将其与基于智能算法内部创新融合进行缓解的措施。在此基础上,展望了能量管理策略的未来发展趋势为智能内部算法、智能与其他类型算法的融合创新等,可以为后续航空混动系统能量管理策略研究提供一定的参考。 展开更多
关键词 能量管理策略 深度Q网络算法 深度确定性策略梯度算法 强化学习 航空混合动力系统
在线阅读 下载PDF
基于深度强化学习的无人机集群协同信息筛选方法研究 被引量:9
20
作者 李欣童 熊智 +2 位作者 陈明星 熊骏 李文龙 《电光与控制》 CSCD 北大核心 2021年第10期6-10,共5页
针对未知复杂环境下无人机集群协同定位导航中算法计算量过大的问题,提出了两种基于深度强化学习的无人机集群协同信息筛选方法,将多无人机定位问题映射为部分可观的马尔可夫决策过程(POMDP),通过克拉美罗下界(CRLB)设置的精度阈值,使... 针对未知复杂环境下无人机集群协同定位导航中算法计算量过大的问题,提出了两种基于深度强化学习的无人机集群协同信息筛选方法,将多无人机定位问题映射为部分可观的马尔可夫决策过程(POMDP),通过克拉美罗下界(CRLB)设置的精度阈值,使用最少协同信息满足所有无人机的定位精度要求。仿真结果表明,同无筛选情形相比,基于深度强化学习的筛选策略可以在不牺牲定位精度的同时,有效提高协同定位算法的实时性,解决协同信息冗余问题,显著提高了协同定位算法的执行效率。 展开更多
关键词 协同定位 无人机集群 深度Q网络算法 策略梯度算法
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部