期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
基于Q学习的蜂窝车联网边缘计算系统PC-5/Uu接口联合卸载策略 被引量:1
1
作者 冯伟杨 林思雨 +3 位作者 冯婧涛 李赟 孔繁鹏 艾渤 《电子学报》 EI CAS CSCD 北大核心 2024年第2期385-395,共11页
智能驾驶等智能交通服务对时延要求高,在车辆本身算力不足的情况下,车辆需要周围车辆和路旁边缘计算单元帮助其一起完成任务的计算处理.本文在既有车联网边缘计算卸载策略基础上,考虑了蜂窝车联网系统5G-NR接口与PC-5接口链路的特征差异... 智能驾驶等智能交通服务对时延要求高,在车辆本身算力不足的情况下,车辆需要周围车辆和路旁边缘计算单元帮助其一起完成任务的计算处理.本文在既有车联网边缘计算卸载策略基础上,考虑了蜂窝车联网系统5G-NR接口与PC-5接口链路的特征差异,提出了一种基于Q学习的PC-5/Uu接口联合边缘计算卸载策略.在对蜂窝车联网PC-5链路传输成功率进行建模的基础上,推导了PC-5链路的传输速率表征方法.以最小化蜂窝车联网任务处理时延为目标,以任务车辆发射功率与边缘计算车辆的计算能量损耗为约束,构建了系统时延最小化的有约束马尔科夫决策过程.通过拉格朗日方法,将有约束马尔科夫决策过程问题转化为一个等价的极小极大的无约束马尔科夫决策过程,引入Q学习设计卸载策略,进而提出基于Q学习的蜂窝车联网边缘计算系统卸载策略.仿真结果表明,与其他基线方案相比,本文提出的算法可以降低系统时延27.3%以上. 展开更多
关键词 蜂窝车联网 边缘计算 有约束马尔科夫过程 计算迁移 Q学习
在线阅读 下载PDF
基于安全深度强化学习的电网有功频率协同优化控制
2
作者 周毅 周良才 +2 位作者 史迪 赵小英 闪鑫 《上海交通大学学报》 EI CAS CSCD 北大核心 2024年第5期682-692,共11页
可再生能源占比不断增加给互联电网频率控制带来严峻考验.由于常规的自动发电控制(AGC)策略没有考虑电网潮流安全约束,所以传统方法根据专家知识和经验进行尝试性发电机功率调整,需耗费较多时间;基于最优电力潮流的互联电网AGC优化模型... 可再生能源占比不断增加给互联电网频率控制带来严峻考验.由于常规的自动发电控制(AGC)策略没有考虑电网潮流安全约束,所以传统方法根据专家知识和经验进行尝试性发电机功率调整,需耗费较多时间;基于最优电力潮流的互联电网AGC优化模型由于非凸性和大规模性,求解时间较长且存在收敛性问题.鉴于常规深度强化学习具有“离线训练、在线端对端形成策略”的优点,但在动作探索过程中无法保证系统安全性,提出一种基于安全深度强化学习的电网有功频率协同优化控制方法.首先,将电网频率控制建模为约束马尔可夫决策过程,对决策过程添加相关安全约束进行智能体设计;然后,基于华东电网实际系统算例对智能体进行训练和性能提升;最后,对比智能体决策与常规AGC策略效果.结果表明:所提方法在多种运行方式下可快速生成有功频率控制策略,且保证系统频率恢复过程中电网的安全性,可辅助调度员在线决策. 展开更多
关键词 有功频率协同控制 人工智能 深度强化学习 约束马尔可夫决策过程 智能体
在线阅读 下载PDF
非正交多址接入系统中基于受限马尔科夫决策过程的网络切片虚拟资源分配算法 被引量:6
3
作者 唐伦 施颖洁 +1 位作者 杨希希 陈前斌 《电子与信息学报》 EI CSCD 北大核心 2018年第12期2962-2969,共8页
针对无线接入网络切片虚拟资源分配优化问题,该文提出基于受限马尔可夫决策过程(CMDP)的网络切片自适应虚拟资源分配算法。首先,该算法在非正交多址接入(NOMA)系统中以用户中断概率和切片队列积压为约束,切片的总速率作为回报,运用受限... 针对无线接入网络切片虚拟资源分配优化问题,该文提出基于受限马尔可夫决策过程(CMDP)的网络切片自适应虚拟资源分配算法。首先,该算法在非正交多址接入(NOMA)系统中以用户中断概率和切片队列积压为约束,切片的总速率作为回报,运用受限马尔可夫决策过程理论构建资源自适应问题的动态优化模型;其次定义后决策状态,规避最优值函数中的期望运算;进一步地,针对马尔科夫决策过程(MDP)的"维度灾难"问题,基于近似动态规划理论,定义关于分配行为的基函数,替代决策后状态空间,减少计算维度;最后设计了一种自适应虚拟资源分配算法,通过与外部环境的不断交互学习,动态调整资源分配策略,优化切片性能。仿真结果表明,该算法可以较好地提高系统的性能,满足切片的服务需求。 展开更多
关键词 5G网络切片 资源分配 受限马尔可夫决策过程 非正交多址接入
在线阅读 下载PDF
接入与回传一体化小基站的接入控制与资源分配联合优化算法 被引量:2
4
作者 唐伦 马润琳 +2 位作者 刘云龙 王耀玮 陈前斌 《电子与信息学报》 EI CSCD 北大核心 2019年第6期1389-1396,共8页
针对全双工无线接入与回传一体化小基站场景下长期的频谱效率和能效同时最大化问题,该文提出一种基于近似动态规划理论的接入与回传一体化小基站接入控制与资源分配联合优化算法。该算法首先联合考虑当前基站的资源使用和功率配置情况,... 针对全双工无线接入与回传一体化小基站场景下长期的频谱效率和能效同时最大化问题,该文提出一种基于近似动态规划理论的接入与回传一体化小基站接入控制与资源分配联合优化算法。该算法首先联合考虑当前基站的资源使用和功率配置情况,在任一用户需求动态到达以及平均时延、小基站回传速率和传输功率约束下,使用受限马尔科夫决策过程(CMDP)建立频谱效率最大化和功率消耗最小化的多目标优化模型,其次运用切比雪夫理论将多目标优化问题转化为单目标问题,并使用拉格朗日对偶分解法进一步转化为非受限的马尔科夫决策过程(MDP)问题。最后,为了解决其求解时存在的“维度灾”爆炸问题,该文提出基于近似动态规划的无线接入与回传一体化小基站资源动态分配算法进行求解,得到此时的接入与资源分配策略。仿真结果表明,所提算法能在保证平均时延约束、小基站回传速率约束和传输功率约束的同时最大化长期平均频谱效率和能效。 展开更多
关键词 接入与回传一体化小基站 近似动态规划理论 受限马尔科夫决策过程 切比雪夫理论
在线阅读 下载PDF
Timely Updates in MEC-Assisted Status Update Systems: Joint Task Generation and Computation Offloading Scheme 被引量:3
5
作者 Long Liu Xiaoqi Qin +1 位作者 Yunzheng Tao Zhi Zhang 《China Communications》 SCIE CSCD 2020年第8期168-186,共19页
Fresh status updates are vital to the efficient operation of network monitoring and real-time control applications. In this paper, we consider a mobile edge computing(MEC)-assisted status update system, where smart de... Fresh status updates are vital to the efficient operation of network monitoring and real-time control applications. In this paper, we consider a mobile edge computing(MEC)-assisted status update system, where smart devices extract valuable status updates from sensed data to achieve timely awareness of the surroundings by exploiting computational resources at the device and edge server. To quantify the freshness of status updates obtained by executing computation tasks, we employ the concept of age of information(Ao I) to characterize the timeliness of status updates. To cope with the limited energy at devices, we investigate a joint task generation and computation offloading scheme under a given energy budget for minimizing the age of obtained status updates. The age minimization problem is modeled as a constrained Markov decision process(CMDP). To obtain the optimal policy, we derive the structural properties of the optimal deterministic policy and propose a lightweight structure-based status update algorithm in the case of known channel statistics. Moreover, we consider a more realistic scenario without prior knowledge of channel statistics, and propose a Q-learning-based status update algorithm to make online decisions. Simulation results show that the performance of our proposed algorithms is competitive when compared with existing schemes. 展开更多
关键词 mobile edge computing age of information constrained markov decision process structural analysis Q-LEARNING
在线阅读 下载PDF
基于约束型TD3的动态探索噪声改进算法
6
作者 陈春甫 穆煜 韩凯涛 《现代信息科技》 2025年第7期103-108,共6页
本研究针对无约束探索可能致使移动小车受损的问题,提出一种融合自适应噪声探索与拉格朗日乘子约束的强化学习方法,旨在优化小车到达目标点的轨迹规划。此方法通过动态调节噪声来提升探索效率,运用TD3算法应对连续动作空间,借助拉格朗... 本研究针对无约束探索可能致使移动小车受损的问题,提出一种融合自适应噪声探索与拉格朗日乘子约束的强化学习方法,旨在优化小车到达目标点的轨迹规划。此方法通过动态调节噪声来提升探索效率,运用TD3算法应对连续动作空间,借助拉格朗日乘子法处理约束条件,这与直接在马尔科夫决策过程(MDP)中添加非期望行为惩罚的方式有所不同。仿真实验表明,该方法能够有效地引导小车避开障碍物,减少违反约束的情形,同时保障任务的安全性与可靠性,呈现出良好的训练收敛特性。 展开更多
关键词 安全强化学习 约束马尔科夫决策过程 轨迹规划 TD3算法
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部