期刊文献+
共找到14篇文章
< 1 >
每页显示 20 50 100
基于深度增强学习的软件定义网络路由优化机制 被引量:16
1
作者 兰巨龙 于倡和 +1 位作者 胡宇翔 李子勇 《电子与信息学报》 EI CSCD 北大核心 2019年第11期2669-2674,共6页
为优化软件定义网络(SDN)的路由选路,该文将深度增强学习原理引入到软件定义网络的选路过程,提出一种基于深度增强学习的路由优化选路机制,用以削减网络运行时延、提高吞吐量等网络性能,实现连续时间上的黑盒优化,减少网络运维成本。此... 为优化软件定义网络(SDN)的路由选路,该文将深度增强学习原理引入到软件定义网络的选路过程,提出一种基于深度增强学习的路由优化选路机制,用以削减网络运行时延、提高吞吐量等网络性能,实现连续时间上的黑盒优化,减少网络运维成本。此外,该文通过实验对所提出的路由优化机制进行评估,实验结果表明,路由优化机制具有良好的收敛性与有效性,较传统路由协议可提供更优的路由方案与实现更稳定的性能。 展开更多
关键词 软件定义网络 路由优化 深度增强学习
在线阅读 下载PDF
电动汽车充电控制的深度增强学习优化方法 被引量:28
2
作者 杜明秋 李妍 +3 位作者 王标 张艺涵 罗潘 王少荣 《中国电机工程学报》 EI CSCD 北大核心 2019年第14期4042-4048,共7页
随着用电信息采集系统的广泛推广,数据驱动的机器学习方法在电力系统优化运行领域的应用已引起广泛关注。该文基于电网在线运行状态数据采集,采用竞争深度 Q 网络(dueling deep Q network,DDQN)结构的深度增强学习方法开展电动汽车充电... 随着用电信息采集系统的广泛推广,数据驱动的机器学习方法在电力系统优化运行领域的应用已引起广泛关注。该文基于电网在线运行状态数据采集,采用竞争深度 Q 网络(dueling deep Q network,DDQN)结构的深度增强学习方法开展电动汽车充电控制优化。首先选取观测状态与执行动作,定义状态动作估值函数,其次针对动作和状态维度上的绝对数值相差过大的问题,采用 DDQN 的 Q 函数,引入ε-greedy 策略、记忆存储单元以及批量梯度下降法进行神经网络的分层学习,然后基于 DDQN 训练后的神经网络,开展电动汽车充电控制的深度增强学习优化。最后,结合IEEE33 节点扩展算例说明所提电动汽车充电控制优化方法在满足各类用户出行的充电需求条件下,实现合理消纳可再生能源发电。 展开更多
关键词 电动汽车 状态动作估值函数 竞争深度估值网络 深度增强学习 优化控制
在线阅读 下载PDF
一种基于深度增强学习的智能路由技术 被引量:6
3
作者 孙鹏浩 兰巨龙 +1 位作者 申涓 胡宇翔 《电子学报》 EI CAS CSCD 北大核心 2020年第11期2170-2177,共8页
随着网络规模的不断增大以及网络复杂度的不断提高,传统路由算法面对网络流量在时空分布上的剧烈波动难以兼顾计算复杂度和算法效率.近年来,随着软件定义网络和人工智能技术的兴起,基于机器学习的自动路由策略生成逐渐受到关注.本文提... 随着网络规模的不断增大以及网络复杂度的不断提高,传统路由算法面对网络流量在时空分布上的剧烈波动难以兼顾计算复杂度和算法效率.近年来,随着软件定义网络和人工智能技术的兴起,基于机器学习的自动路由策略生成逐渐受到关注.本文提出一种基于深度增强学习的智能路由技术SmartPath,通过动态收集网络状态,使用深度增强学习自动生成路由策略,从而保证路由策略能够动态适应网络流量变化.实验结果表明,本文所提出的方案能够不依赖人工流量建模动态更新网络路由,在测试环境下比当前最优方案减少至少10%的平均端到端传输时延. 展开更多
关键词 路由优化 软件定义网络 人工智能 深度增强学习
在线阅读 下载PDF
基于深度增强学习与子流耦合感知的多路传输控制机制 被引量:11
4
作者 秦久人 许长桥 +2 位作者 杨树杰 高楷 张宏科 《电子学报》 EI CAS CSCD 北大核心 2022年第2期346-357,共12页
为了解决多路传输中子流耦合感知缺乏与传输控制效率低下等的问题,针对未来异构、动态的网络环境,提出了一种基于耦合感知与深度Q网络的多路传输控制机制(WaveLet and Deep Q Network based multipath transmission control mechanism,W... 为了解决多路传输中子流耦合感知缺乏与传输控制效率低下等的问题,针对未来异构、动态的网络环境,提出了一种基于耦合感知与深度Q网络的多路传输控制机制(WaveLet and Deep Q Network based multipath transmission control mechanism,WL-DQN).利用小波去噪技术,消除子流单向传输时延中由非耦合路段及系统随机产生的噪声,并基于子流互相关系数对子流耦合特性进行提取;在此基础上,依据深度增强学习理论对多路传输控制进行建模,并提出多路DQN拥塞控制算法,实现了异构、动态网络环境下的智能多路拥塞控制.仿真结果表明,所提算法在传输吞吐量、传输时延、数据包重传避免等方面均优于标准及相似的代表性解决方案. 展开更多
关键词 多路传输 耦合识别 深度增强学习 拥塞控制 网络感知体
在线阅读 下载PDF
基于深度增强学习的卫星姿态控制方法 被引量:4
5
作者 王月娇 马钟 +2 位作者 杨一岱 王竹平 唐磊 《中国空间科学技术》 EI CSCD 北大核心 2019年第4期36-42,共7页
针对卫星在执行丢弃载荷或捕获目标等复杂任务时遭遇的姿态突然发生变化的问题,采用深度增强学习方法对卫星姿态进行控制,使卫星恢复稳定状态。具体来说,首先搭建飞行器的姿态动力学环境,并将连续的控制力矩输出离散化,然后采用Deep Q N... 针对卫星在执行丢弃载荷或捕获目标等复杂任务时遭遇的姿态突然发生变化的问题,采用深度增强学习方法对卫星姿态进行控制,使卫星恢复稳定状态。具体来说,首先搭建飞行器的姿态动力学环境,并将连续的控制力矩输出离散化,然后采用Deep Q Network算法进行卫星自主姿态控制训练,以姿态角速度趋于稳定作为奖励获得离散行为的最优智能输出。仿真试验表明,面向空间卫星姿态控制的深度增强学习算法能够在卫星受到突发随机扰动后稳定卫星姿态,并能有效解决传统PD控制器依赖被控对象质量参数的难题。所提出的方法采用自主学习的方式对卫星姿态进行控制,具有很强的智能性和一定的普适性,在未来卫星执行复杂空间任务中的智能控制方面有着很好的应用潜力。 展开更多
关键词 深度增强学习 卫星姿态控制 动力学环境 自主姿态控制 质量参数
在线阅读 下载PDF
基于深度增强学习和多目标优化改进的卫星资源分配算法 被引量:13
6
作者 张沛 刘帅军 +2 位作者 马治国 王晓晖 宋俊德 《通信学报》 EI CSCD 北大核心 2020年第6期51-60,共10页
针对多波束卫星系统中资源分配序列决策的多目标优化(MOP)问题,为了在提升卫星系统性能的同时,提高用户业务需求的满意度,提出了一种基于深度增强学习(DRL)的DRL-MOP算法。所提算法基于DRL和MOP技术,对动态变化的系统环境和用户到达模... 针对多波束卫星系统中资源分配序列决策的多目标优化(MOP)问题,为了在提升卫星系统性能的同时,提高用户业务需求的满意度,提出了一种基于深度增强学习(DRL)的DRL-MOP算法。所提算法基于DRL和MOP技术,对动态变化的系统环境和用户到达模型建模,以归一化处理后的频谱效率、能量效率和业务满意度指数的加权和作为优化目标,实现了系统和用户累计性能的优化。仿真对比表明,所提算法可以更好地解决面向多波束卫星系统的多目标优化问题,系统性能和用户满意度优化结果较好,且收敛快、复杂度低。 展开更多
关键词 多波束卫星系统 资源分配 序列决策 深度增强学习 多目标优化
在线阅读 下载PDF
基于分层编码的深度增强学习对话生成 被引量:7
7
作者 赵宇晴 向阳 《计算机应用》 CSCD 北大核心 2017年第10期2813-2818,2853,共7页
面向对话生成问题,提出一种构建对话生成模型的方法——基于分层编码的深度增强学习对话模型(EHRED),用以解决当前标准序列到序列(seq2seq)结构采用最大似然函数作为目标函数所带来的易生成通用回答的问题。该方法结合了分层编码和增强... 面向对话生成问题,提出一种构建对话生成模型的方法——基于分层编码的深度增强学习对话模型(EHRED),用以解决当前标准序列到序列(seq2seq)结构采用最大似然函数作为目标函数所带来的易生成通用回答的问题。该方法结合了分层编码和增强学习技术,利用分层编码来对多轮对话进行建模,在标准seq2seq的基础上新增了中间层来加强对历史对话语句的记忆,而后采用了语言模型来构建奖励函数,进而用增强学习中的策略梯度方法代替原有的最大似然损失函数进行训练。实验结果表明EHRED能生成语义信息更丰富的回答,在标准的人工测评中,其效果优于当前广泛采用的标准seq2seq循环神经网络(RNN)模型5.7~11.1个百分点。 展开更多
关键词 对话生成 深度增强学习 分层编码 循环神经网络 序列到序列
在线阅读 下载PDF
物理增强的流场深度学习建模与模拟方法 被引量:16
8
作者 金晓威 赖马树金 李惠 《力学学报》 EI CAS CSCD 北大核心 2021年第10期2616-2629,共14页
流体运动理论上可用Navier-Stokes方程描述,但由于对流项带来的非线性,仅在少数情况可求得方程解析解.对于复杂工程流动问题,数值模拟难以高效精准计算高雷诺数流场,实验或现场测量难以获得流场丰富细节.近年来,人工智能技术快速发展,... 流体运动理论上可用Navier-Stokes方程描述,但由于对流项带来的非线性,仅在少数情况可求得方程解析解.对于复杂工程流动问题,数值模拟难以高效精准计算高雷诺数流场,实验或现场测量难以获得流场丰富细节.近年来,人工智能技术快速发展,深度学习等数据驱动技术可利用灵活网络结构,借助高效优化算法,获得对高维、非线性问题的强大逼近能力,为研究流体力学计算方法带来新机遇.有别于传统图像识别、自然语言处理等典型人工智能任务,深度学习模型预测的流场需满足流体物理规律,如Navier-Stokes方程、典型能谱等.近期,物理增强的流场深度学习建模与模拟方法快速发展,正逐渐成为流体力学全新研究范式:根据流体物理规律选取网络输入特征或设计网络架构的方法称为物理启发的深度学习方法,直接将流体物理规律显式融入网络损失函数或网络架构的方法称为物理融合的深度学习方法.研究内容涵盖流体力学降阶模型、流动控制方程求解领域. 展开更多
关键词 物理增强深度学习 降阶模型 方程求解 湍流
在线阅读 下载PDF
无蜂窝大规模MIMO中基于深度强化学习的无人机辅助通信与资源调度 被引量:8
9
作者 王朝炜 邓丹昊 +1 位作者 王卫东 江帆 《电子与信息学报》 EI CSCD 北大核心 2022年第3期835-843,共9页
无蜂窝大规模多入多出(MIMO)网络中分布式接入点(AP)同时服务多个用户,可以实现较大区域内虚拟MIMO的大容量传输;而无人机辅助通信能够为该目标区域热点或边缘用户提供覆盖增强。为了降低反馈链路负载,并有效提升无人机辅助通信的频谱... 无蜂窝大规模多入多出(MIMO)网络中分布式接入点(AP)同时服务多个用户,可以实现较大区域内虚拟MIMO的大容量传输;而无人机辅助通信能够为该目标区域热点或边缘用户提供覆盖增强。为了降低反馈链路负载,并有效提升无人机辅助通信的频谱利用率,该文研究了基于AP功率分配、无人机服务区选择和接入用户选择的联合调度;首先将AP功率分配和无人机服务区选择问题联合建模为双动作马尔可夫决策过程(DAMDP),提出了基于Q-learning和卷积神经网络(CNN)的深度强化学习(DRL)算法;然后将用户调度构造为一个0-1优化问题,并分解成子问题来求解。仿真结果表明,该文提出的基于DRL的资源调度方案与现有方案相比,可以有效提升无蜂窝大规模MIMO网络中频谱利用率。 展开更多
关键词 无蜂窝大规模MIMO 无人机辅助通信 资源调度 深度增强学习
在线阅读 下载PDF
面向簇化移动机器人的网络资源调度算法 被引量:1
10
作者 丁嘉伟 《机床与液压》 北大核心 2024年第11期47-52,共6页
工厂自动化要求超可靠低时延通信,使控制中心能够可靠实时地向移动机器人传输控制指令。为此,面向移动机器人作业的工厂环境,提出基于深度增强学习的资源调度算法(DRL-RS)。DRL-RS算法由两个阶段构成:在第一阶段,一起作业的移动机器人... 工厂自动化要求超可靠低时延通信,使控制中心能够可靠实时地向移动机器人传输控制指令。为此,面向移动机器人作业的工厂环境,提出基于深度增强学习的资源调度算法(DRL-RS)。DRL-RS算法由两个阶段构成:在第一阶段,一起作业的移动机器人形成簇群,将簇群内多个移动机器人的指令包融合成一个包,再将此包传输至簇群的领导者;在第二阶段,领导者向它簇群成员广播指令包。DRL-RS算法引用深度增强学习算法优化资源调度。领导者扮演Agent,通过向环境学习,择优选择接入点以及子信道和传输功率,进而最大化向所有机器人传输指令包的成功率。性能分析结果表明,DRL-RS算法传输指令包成功率逼近于穷搜索法。 展开更多
关键词 工厂自动化 移动机器人 深度增强学习 资源调度 传输指令包成功率
在线阅读 下载PDF
一种改进dueling网络的机器人避障方法 被引量:5
11
作者 周翼 陈渤 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2019年第1期46-50,63,共6页
针对传统增强学习方法在运动规划领域,尤其是机器人避障问题上存在容易过估计、难以适应复杂环境等不足,提出了一种基于深度增强学习的提升机器人避障性能的新算法模型。该模型将dueling神经网络架构与传统增强学习算法Q学习相结合,并... 针对传统增强学习方法在运动规划领域,尤其是机器人避障问题上存在容易过估计、难以适应复杂环境等不足,提出了一种基于深度增强学习的提升机器人避障性能的新算法模型。该模型将dueling神经网络架构与传统增强学习算法Q学习相结合,并利用两个独立训练的dueling网络处理环境数据来预测动作值,在输出层分别输出状态值和动作优势值,并将两者结合输出最终动作值。该模型能处理较高维度数据以适应复杂多变的环境,并输出优势动作供机器人选择以获得更高的累积奖励。实验结果表明,该新算法模型能有效地提升机器人避障性能。 展开更多
关键词 机器人避障 深度增强学习 dueling网络 独立训练
在线阅读 下载PDF
智能电网中两阶段网络切片资源分配技术 被引量:5
12
作者 尚芳剑 李信 +3 位作者 翟迪 陆阳 张东磊 钱玉文 《计算机应用》 CSCD 北大核心 2021年第7期2033-2038,共6页
为满足网络切片在智能电网中的多样化需求,提出了一个在智能电网中基于云-边协同的切片资源分配模型。为优化网络切片分配,提出一种两阶段的切片分配模型:在第一阶段中,以用户体验最优为目标,建立了本地边缘网络的资源分配问题的优化模... 为满足网络切片在智能电网中的多样化需求,提出了一个在智能电网中基于云-边协同的切片资源分配模型。为优化网络切片分配,提出一种两阶段的切片分配模型:在第一阶段中,以用户体验最优为目标,建立了本地边缘网络的资源分配问题的优化模型,并采用拉格朗日乘子法对此最优问题进行了求解;在第二阶段中,首先将网络切片资源分配系统建模成Markov决策过程,然后提出使用深度增强学习方法对核心云的切片自适应地进行资源分配。实验结果表明所提的两阶段切片资源优化分配模型可有效减少网络延迟,提高用户满意度。 展开更多
关键词 智能电网 5G通信网络 网络切片 马尔可夫决策过程 深度增强学习
在线阅读 下载PDF
一种新的基于隐喻地图的RPA路径规划算法
13
作者 李超群 黄晓芳 +1 位作者 周祖宏 廖敏 《计算机应用研究》 CSCD 北大核心 2023年第4期1006-1011,共6页
智能化地制定机器人流程自动化(robotic process automation, RPA)执行路径有利于企业节约相关人力成本以及提高RPA的推广,提出基于改进深度双Q网络(double deep Q-learning algorithms, DDQN)算法进行RPA路径规划。首先针对存在RPA的... 智能化地制定机器人流程自动化(robotic process automation, RPA)执行路径有利于企业节约相关人力成本以及提高RPA的推广,提出基于改进深度双Q网络(double deep Q-learning algorithms, DDQN)算法进行RPA路径规划。首先针对存在RPA的作业环境即Web页面,不满足深度增强算法的探索条件的问题,借助隐喻地图的思想,通过构建虚拟环境来满足路径规划实验要求。同时为了提高DDQN算法探索效率,提出利用样本之间的位置信息的杰卡德系数,将其作为样本优先度结合基于排名的优先级(rank-based prioritization)构建新的采样方式。通过随机采用任务样本在虚拟环境上进行验证,证明其符合实验要求。进一步比较改进DDQN、深度Q网络(deep Q network, DQN)、DDQN、PPO以及SAC-Discrete算法的实验结果,结果显示改进算法的迭代次数更少、收敛速度更快以及回报值更高,验证了改进DDQN的有效性和可行性。 展开更多
关键词 深度增强学习 DDQN RPA 业务流程自动化 路径规划 采样策略
在线阅读 下载PDF
无人机倾斜摄影测量技术提升测绘工程精度的优化应用研究
14
作者 周丹 《测绘通报》 2025年第S1期229-232,242,共5页
本文聚焦无人机倾斜摄影测量技术在测绘工程精度提升方面的应用。通过分析技术原理、关键影响因素,采用构建精度控制框架、基于人工智能的数据增强、多技术协同融合等方法进行优化。研究结果显示,优化后的技术在多场景下测绘精度显著提... 本文聚焦无人机倾斜摄影测量技术在测绘工程精度提升方面的应用。通过分析技术原理、关键影响因素,采用构建精度控制框架、基于人工智能的数据增强、多技术协同融合等方法进行优化。研究结果显示,优化后的技术在多场景下测绘精度显著提升,如城市测绘平面精度达2.1 cm,地质监测高程精度为6.9 cm。研究表明,这些优化策略有效解决了技术局限性,提高了测绘效率与精度,为相关领域提供了可靠的技术支持。 展开更多
关键词 无人机倾斜摄影测量 测绘精度优化 多源数据融合 深度学习增强 地质灾害监测
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部