期刊文献+
共找到73篇文章
< 1 2 4 >
每页显示 20 50 100
基于非线性模型预测控制的拖挂车系统泊车轨迹规划方法
1
作者 杨毅 贾博铂 +2 位作者 高亮 李岱伟 谢杉杉 《中国惯性技术学报》 北大核心 2025年第2期179-188,共10页
拖挂车是欠驱动与非完整约束高度耦合的非线性系统,具有状态维度高、约束复杂、内部稳定性差等特点,导致其泊车轨迹规划的求解时间长。因此,设计了一种基于非线性模型预测控制的拖挂车泊车轨迹规划方法,通过融合系统多元约束,构建优化问... 拖挂车是欠驱动与非完整约束高度耦合的非线性系统,具有状态维度高、约束复杂、内部稳定性差等特点,导致其泊车轨迹规划的求解时间长。因此,设计了一种基于非线性模型预测控制的拖挂车泊车轨迹规划方法,通过融合系统多元约束,构建优化问题,规划无碰撞的泊车轨迹。为加速优化问题的求解,首先,在系统的高维状态空间中使用结合Reed-Shepp(RS)曲线的改进快速扩展随机树(RRT*-RS)进行随机采样,以RS曲线满足反向行驶的特性,找到一条近似最优路径作为优化问题热启动的参考解。然后,在求解优化问题时,选用近似平均牛顿法以节约求解时间,提升系统实时性。最后,进行了倒库泊车、侧方泊车、多障碍物等场景实验仿真验证,仿真结果表明所提方法在不同场景下均可实现拖挂车泊车快速轨迹规划,求解时间与传统内点法和序列二次规划法相比均有40%以上的提升。 展开更多
关键词 拖挂车系统 自主泊车 轨迹规划 非线性模型预测控制 近似平均牛顿法
在线阅读 下载PDF
基于强化学习的舰载机着舰直接升力控制技术 被引量:1
2
作者 柳仁地 江驹 +1 位作者 张哲 刘翔 《北京航空航天大学学报》 北大核心 2025年第6期2165-2175,共11页
针对舰载机自动着舰过程中受甲板运动及舰尾流扰动很容易发生触舰危险的问题,提出了基于近端策略优化(PPO)算法的舰载机自动着舰直接升力控制方法。PPO控制器以俯仰角、高度、航迹倾斜角、俯仰角速率、高度误差和航迹倾斜角速率等6个状... 针对舰载机自动着舰过程中受甲板运动及舰尾流扰动很容易发生触舰危险的问题,提出了基于近端策略优化(PPO)算法的舰载机自动着舰直接升力控制方法。PPO控制器以俯仰角、高度、航迹倾斜角、俯仰角速率、高度误差和航迹倾斜角速率等6个状态变作为输入,以襟翼的舵偏角增量作为输出,实现舰载机在着舰时航迹倾斜角的快速响应。与传统控制器相比,PPO控制器中的Actor-Critic框架大大提高了控制量的计算效率,降低了参数优化的难度。仿真实验基于MATLAB/Simulink中的F/A-18飞机动力学/运动学模型。利用PyCharm平台上构建的深度强化学习训练环境,通过UDP通信实现2个平台之间的数据交互。仿真结果表明:所提方法具有响应速度快、动态误差小的特点,能够将着舰的高度误差稳定在±0.2 m以内,具有较高的控制精度。 展开更多
关键词 舰载机自动着舰 深度强化学习 近端策略优化算法 直接升力控制 UDP通信
在线阅读 下载PDF
基于深度强化学习PPO的车辆智能控制方法
3
作者 叶宝林 王欣 +1 位作者 李灵犀 吴维敏 《计算机工程》 北大核心 2025年第7期385-396,共12页
为提高高速公路上混合环境下车辆的行驶效率、减少交通事故的发生,提出一种基于近端策略优化(PPO)的车辆智能控制方法。首先构建一个融合深度强化学习和传统比例-积分-微分(PID)控制的分层控制框架,上层深度强化学习智能体负责确定控制... 为提高高速公路上混合环境下车辆的行驶效率、减少交通事故的发生,提出一种基于近端策略优化(PPO)的车辆智能控制方法。首先构建一个融合深度强化学习和传统比例-积分-微分(PID)控制的分层控制框架,上层深度强化学习智能体负责确定控制策略,下层PID控制器负责执行控制策略。其次为了提升车辆的行驶效率,通过定义优势距离对观测到的环境状态矩阵进行数据筛选,帮助自主车辆选择具有更长优势距离的车道进行变道。基于定义的优势距离提出一种新的状态采集方法以减少数据处理量,加快深度强化学习模型的收敛速度。另外,为了兼顾车辆的安全性、行驶效率和稳定性,设计一个多目标奖励函数。最后在基于Gym搭建的车辆强化学习任务仿真环境Highway_env中进行测试,对所提方法在不同目标速度下的表现进行分析和讨论。仿真测试结果表明,相比深度Q网络(DQN)方法,所提方法具有更快的收敛速度,且在两种不同目标速度下均能使车辆安全平稳地完成驾驶任务。 展开更多
关键词 近端策略优化 车辆控制 分层控制框架 多目标奖励函数 深度Q网络
在线阅读 下载PDF
基于深度强化学习的四旋翼航迹跟踪控制方法
4
作者 伍国华 曾家恒 +2 位作者 王得志 郑龙 邹伟 《系统仿真学报》 北大核心 2025年第5期1169-1187,共19页
受限于模型方程决定的固定结构,传统四旋翼控制器设计难以有效应对模型参数和环境扰动变化带来的控制误差。提出了基于深度强化学习的四旋翼航迹跟踪控制方法,构建了对应的马尔可夫决策模型,并基于PPO框架提出了PPO-SAG(PPO with self a... 受限于模型方程决定的固定结构,传统四旋翼控制器设计难以有效应对模型参数和环境扰动变化带来的控制误差。提出了基于深度强化学习的四旋翼航迹跟踪控制方法,构建了对应的马尔可夫决策模型,并基于PPO框架提出了PPO-SAG(PPO with self adaptive guide)算法。PPO-SAG在学习过程中加入自适应机制,利用PID专家知识进行引导和学习,提高了训练的收敛效果和稳定性。根据问题特点,设计了带有距离约束惩罚和熵策略的目标函数,提出扰动误差信息补充结构和航迹特征选择结构,补充控制误差信息、提取未来航迹关键要素,提高了收敛效果。并利用状态动态标准化、优势函数批标准化及奖励缩放策略,更合理地处理三维空间中的状态表征和奖励优势表达。单种航迹与混合航迹实验表明,所提出的PPO-SAG算法在收敛效果和稳定性上均取得了最好的效果,消融实验说明所提出的改进机制和结构均起到正向作用。所研究的未知扰动下基于深度强化学习的四旋翼航迹跟踪控制问题,为设计更加鲁棒高效的四旋翼控制器提供了解决方案。 展开更多
关键词 深度强化学习 四旋翼航迹跟踪控制 近端策略优化(PPO) 自适应机制 注意力机制
在线阅读 下载PDF
基于深度强化学习的四旋翼无人机姿态控制
5
作者 赵军 何家政 +2 位作者 孙冰寒 赵会杰 蒙志君 《中国惯性技术学报》 北大核心 2025年第3期284-292,300,共10页
稳定的飞行控制系统是无人机完成各种飞行任务的关键。聚焦于四旋翼无人机的底层姿态控制,针对广泛使用的比例-积分-微分(PID)控制器存在的快速响应能力差、超调大的问题,提出一种基于深度强化学习的四旋翼无人机姿态控制方法。构建了基... 稳定的飞行控制系统是无人机完成各种飞行任务的关键。聚焦于四旋翼无人机的底层姿态控制,针对广泛使用的比例-积分-微分(PID)控制器存在的快速响应能力差、超调大的问题,提出一种基于深度强化学习的四旋翼无人机姿态控制方法。构建了基于Gazebo仿真环境的电子样机模型,并对角速度控制任务进行了马尔可夫决策建模,使用近端策略优化(PPO)算法,完成了四旋翼无人机角速度控制任务。实验结果表明,PPO控制器能对信号变化做出更快响应,同时有更小的超调,其平均上升时间较PID减少了55.4%,调节时间减少了56.7%,超调减少了47.8%,验证了基于深度强化学习的四旋翼无人机姿态控制器的快速性和稳定性。 展开更多
关键词 四旋翼无人机 姿态控制 深度强化学习 近端策略优化
在线阅读 下载PDF
计及变压器寿命的电动汽车分布式控制策略 被引量:1
6
作者 陈佳琦 胡俊杰 马文帅 《电力自动化设备》 北大核心 2025年第4期92-100,共9页
随着大规模电动汽车接入配电网,无序充电在台区层面易导致变压器过载问题。对此,提出一种考虑变压器寿命的电动汽车分布式控制策略。通过温升模型对变压器进行精细化建模,量化电动汽车充放电对变压器寿命损耗的影响,进一步结合分时电价... 随着大规模电动汽车接入配电网,无序充电在台区层面易导致变压器过载问题。对此,提出一种考虑变压器寿命的电动汽车分布式控制策略。通过温升模型对变压器进行精细化建模,量化电动汽车充放电对变压器寿命损耗的影响,进一步结合分时电价制定各辆电动汽车的充电策略;考虑变压器安全运行需求,构建基于分布式模型预测控制的电动汽车实时调度模型,当台区智能融合终端感知到过载风险时,基于快速对偶近端梯度法进行求解,对电动汽车充放电功率进行实时调整,实现台区-终端用户的分布式优化调控;算例仿真结果验证了所提分布式算法具有良好的收敛性,所提策略能够降低电动汽车充放电和变压器寿命损耗成本,有效保护电动汽车用户的信息隐私。 展开更多
关键词 电动汽车 变压器寿命 智能融合终端 分布式模型预测控制 快速对偶近端梯度法
在线阅读 下载PDF
基于混合分布式深度强化学习的电力系统暂态稳定紧急控制
7
作者 陈一熙 朱继忠 +1 位作者 刘嘉媛 黄林莹 《电网技术》 北大核心 2025年第4期1513-1523,I0054,I0055,共13页
“双碳”目标下大规模新能源并网使得电力系统运行方式的时变特性增强,对在线紧急控制策略提出了新的要求。为维持电力系统在受到大扰动后的暂态稳定,提出一种基于混合分布式深度强化学习的在线紧急控制策略。首先,将暂态稳定紧急控制... “双碳”目标下大规模新能源并网使得电力系统运行方式的时变特性增强,对在线紧急控制策略提出了新的要求。为维持电力系统在受到大扰动后的暂态稳定,提出一种基于混合分布式深度强化学习的在线紧急控制策略。首先,将暂态稳定紧急控制问题建模为马尔可夫决策过程。然后,针对常规深度强化学习算法因离散化混合动作空间所导致的维数灾、精度下降等问题,提出了一种离散-连续混合策略架构,并采用近端策略优化算法作为策略更新方法,实现了对紧急控制问题中混合动作空间的直接处理。接着,针对常规深度强化学习算法训练时间长、鲁棒性不足等弊端,引入分布式并行训练架构,并设计了融入紧急控制先验物理知识的非法动作屏蔽机制,显著提高了算法的训练速度和鲁棒性。最后,通过IEEE 39节点系统验证了所提算法在暂态稳定紧急控制决策中的有效性和优越性。 展开更多
关键词 暂态稳定 紧急控制 深度强化学习 离散-连续混合策略 分布式并行训练 近端策略优化
在线阅读 下载PDF
Adaptive distributed formation maintenance for multiple UAVs:Exploiting proximity behavior observations 被引量:6
8
作者 LIU Wei-heng ZHENG Xin DENG Zhi-hong 《Journal of Central South University》 SCIE EI CAS CSCD 2021年第3期784-795,共12页
The formation maintenance of multiple unmanned aerial vehicles(UAVs)based on proximity behavior is explored in this study.Individual decision-making is conducted according to the expected UAV formation structure and t... The formation maintenance of multiple unmanned aerial vehicles(UAVs)based on proximity behavior is explored in this study.Individual decision-making is conducted according to the expected UAV formation structure and the position,velocity,and attitude information of other UAVs in the azimuth area.This resolves problems wherein nodes are necessarily strongly connected and communication is strictly consistent under the traditional distributed formation control method.An adaptive distributed formation flight strategy is established for multiple UAVs by exploiting proximity behavior observations,which remedies the poor flexibility in distributed formation.This technique ensures consistent position and attitude among UAVs.In the proposed method,the azimuth area relative to the UAV itself is established to capture the state information of proximal UAVs.The dependency degree factor is introduced to state update equation based on proximity behavior.Finally,the formation position,speed,and attitude errors are used to form an adaptive dynamic adjustment strategy.Simulations are conducted to demonstrate the effectiveness and robustness of the theoretical results,thus validating the effectiveness of the proposed method. 展开更多
关键词 unmanned aerial vehicle formation maintenance proximity behavior adaptive distributed control formation flight control
在线阅读 下载PDF
Near time optimal control with perturbation estimation for flexible spacecraft slewing maneuvers 被引量:1
9
作者 CenXiaofeng WangQingchao MaXingrui 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2005年第1期84-91,共8页
A feedforward approach for generating near time optimal controller for flexible spacecraft rest-to-rest maneuvers is presented with the objective insensitivity to modeling errors, parameter uncertainty and minimizing ... A feedforward approach for generating near time optimal controller for flexible spacecraft rest-to-rest maneuvers is presented with the objective insensitivity to modeling errors, parameter uncertainty and minimizing the residual energy of the flexible modes. The perturbation estimation of flexible appendages to the rigid-hub is accomplished simply via compare the output of real plant with the reference model, and the approach is based on combine this estimation with the bang-bang control for the rigid-hub modes through analysis the basic constraint and the additional constraint, i.e. zero coupling torque and zero coupling torque derivative for general two orders system and three orders system with considerate attitude acceleration mode near time optimal controls. These time optimal controls with control constraints and state constraints leads to forming a boundary-value problem, and resolved the problem using an iterative numerical algorithm. The near time optimal control with perturbation estimation shows a good robust to parameter uncertainty and can suppress the vibration and minimizing the residual energy. The capability of this approach is demonstrated through a numerical example in detail. 展开更多
关键词 time-optimal control perturbation estimation numerical algorithm robustness.
在线阅读 下载PDF
基于自注意力机制的深度强化学习交通信号控制 被引量:8
10
作者 张玺君 聂生元 +1 位作者 李喆 张红 《交通运输系统工程与信息》 EI CSCD 北大核心 2024年第2期96-104,共9页
交通信号控制(Traffic Signal Control, TSC)仍然是交通领域中最重要的研究课题之一。针对现有基于深度强化学习(Deep Reinforcement Learning, DRL)的交通信号控制方法的状态需要人为设计,导致提取交通状态信息难度大以及交通状态信息... 交通信号控制(Traffic Signal Control, TSC)仍然是交通领域中最重要的研究课题之一。针对现有基于深度强化学习(Deep Reinforcement Learning, DRL)的交通信号控制方法的状态需要人为设计,导致提取交通状态信息难度大以及交通状态信息无法全面表达的问题,为了从有限特征中挖掘潜在交通状态信息,从而降低交通状态设计难度,提出一种引入自注意力网络的DRL算法。首先,仅获取交叉口各进入口车道车辆位置,使用非均匀量化和独热编码方法预处理得到车辆位置分布矩阵;其次,使用自注意力网络挖掘车辆位置分布矩阵的空间相关性和潜在信息,作为DRL算法的输入;最后,在单交叉口学习交通信号自适应控制策略,在多交叉口路网中验证所提算法的适应性和鲁棒性。仿真结果表明,在单交叉口环境下,与3种基准算法相比,所提算法在车辆平均等待时间等指标上具有更好的性能;在多交叉口路网中,所提算法仍然具有良好的适应性。 展开更多
关键词 智能交通 自适应控制 深度强化学习 自注意力网络 近端策略优化
在线阅读 下载PDF
基于自注意力PPO算法的智能配电网多设备协同无功优化控制策略 被引量:2
11
作者 张黎元 宋兴旺 +3 位作者 李冰洁 梁睿 刘长德 彭奕洲 《智慧电力》 北大核心 2024年第10期40-48,共9页
针对智能配电网无功可调控资源多样化场景下的快速趋优难题,提出了一种基于多头自注意力近端策略优化算法的多设备协同无功优化控制方法。首先,将无功优化问题建模为马尔可夫决策过程;然后,在深度强化学习框架下使用多头自注意力改进近... 针对智能配电网无功可调控资源多样化场景下的快速趋优难题,提出了一种基于多头自注意力近端策略优化算法的多设备协同无功优化控制方法。首先,将无功优化问题建模为马尔可夫决策过程;然后,在深度强化学习框架下使用多头自注意力改进近端策略优化(PPO)算法对策略网络进行优化训练,算法采用多头自注意力网络获取配电网的实时状态特征,并通过剪切策略梯度法动态控制策略网络的更新幅度;最后,在改进IEEE69节点系统进行仿真验证。结果表明,所提算法的控制性能优于现有先进强化学习算法。 展开更多
关键词 配电网 分布式光伏 电压无功控制 多头自注意力 近端策略优化算法
在线阅读 下载PDF
基于数据装定的坦克炮毫米波近炸引信炸高控制方法 被引量:3
12
作者 陈志鹏 李豪杰 +3 位作者 严秉谦 张传昊 乔诗翔 张合 《兵工学报》 EI CAS CSCD 北大核心 2024年第6期2034-2043,共10页
为满足打击人员、装甲、掩藏等目标需求,坦克炮毫米波近炸引信需要具备多种炸高,实现弹丸毁伤效能最大化。针对坦克炮弹道低伸,毫米波探测器波束较窄、难以满足近炸引信多种炸高的问题,建立基于装定延时的坦克炮毫米波近炸引信炸高控制... 为满足打击人员、装甲、掩藏等目标需求,坦克炮毫米波近炸引信需要具备多种炸高,实现弹丸毁伤效能最大化。针对坦克炮弹道低伸,毫米波探测器波束较窄、难以满足近炸引信多种炸高的问题,建立基于装定延时的坦克炮毫米波近炸引信炸高控制模型,分析通过增加发火延时的策略实现炸高控制。弹丸发射前根据初速射角等攻击条件解算发火延时,利用武器平台与弹丸的信息交联,向近炸引信装定发火延时从而实现弹丸炸高控制。建立数学模型并仿真分析发火延时与弹丸初速、射角和毫米波探测器波束宽度、探测距离与炸高差之间的关系,总结出发火延时的计算公式,通过实验室静态试验和外场动态试验验证该方法的有效性。 展开更多
关键词 坦克炮近炸引信 数据装定 毫米波探测器 炸高控制
在线阅读 下载PDF
无人机集群联合拓扑控制的智能路由规划方法 被引量:5
13
作者 颜志 易正伦 +1 位作者 欧阳博 王耀南 《通信学报》 EI CSCD 北大核心 2024年第2期137-149,共13页
针对现有无人机集群路由协议拓扑适变能力弱,易产生包重传、能量空洞和高时延,严重恶化了数据路由性能的问题,针对无人机集群中集群拓扑与路由的耦合特性,提出了一种联合拓扑控制的智能路由规划(IRPJTC)方法。该方法由基于虚拟力的自适... 针对现有无人机集群路由协议拓扑适变能力弱,易产生包重传、能量空洞和高时延,严重恶化了数据路由性能的问题,针对无人机集群中集群拓扑与路由的耦合特性,提出了一种联合拓扑控制的智能路由规划(IRPJTC)方法。该方法由基于虚拟力的自适应拓扑控制(VFATC)和基于近端策略优化的地理路由规划(PPO-GRP)组成。其中,VFATC使各无人机根据邻居运动状态信息自适应调整与邻居的距离,保证集群中链路的稳定连接;进一步,PPO-GRP引入VFATC中的链路稳定性指标,并结合端到端时延与能耗指标,设计多目标奖励函数,采用深度强化学习中的近端策略优化算法训练路由策略。仿真实验结果表明,IRPJTC相比于现有路由方法,能在保证分组传输成功率的同时,使端到端时延降低12.11%,无人机集群能耗降低4.56%,且具备更强的能耗均衡能力。 展开更多
关键词 无人机集群 路由协议 拓扑控制 近端策略优化 深度强化学习
在线阅读 下载PDF
时滞影响下压电悬臂梁强化学习振动控制
14
作者 张猛 王晓宇 文浩 《振动与冲击》 EI CSCD 北大核心 2024年第16期77-83,共7页
时滞普遍存在于各种控制系统中,如果忽略控制系统中时滞的影响可能会降低控制器的控制效果,甚至导致发散。因此研究了时滞对强化学习(reinforcement learning,RL)振动控制器性能的影响。首先,利用有限元方法建立了压电悬臂梁的动力学模... 时滞普遍存在于各种控制系统中,如果忽略控制系统中时滞的影响可能会降低控制器的控制效果,甚至导致发散。因此研究了时滞对强化学习(reinforcement learning,RL)振动控制器性能的影响。首先,利用有限元方法建立了压电悬臂梁的动力学模型,通过试验辨识修正了动力学模型参数;进而,仿真分析了不同时滞大小对比例微分控制和基于近端优化策略的RL控制效果的影响;然后,在不同时滞条件下训练了多个RL时滞控制器,并对RL控制效果进行了仿真及试验验证;最后,评估了RL时滞控制器对时滞偏差的鲁棒性。结果显示,RL时滞控制器不仅在所对应的时滞条件下具有良好的控制效果,还对实际时滞偏差有一定容忍范围,具有良好鲁棒性。 展开更多
关键词 强化学习(RL) 近端优化策略 时滞 振动控制
在线阅读 下载PDF
水下旋翼式平台近水底扰动定深控制方法研究
15
作者 宋智斌 黎时宇 戴建生 《中南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第1期116-130,共15页
针对水下旋翼式平台在近水底工作时的时变非线性干扰问题,提出一种基于干扰观测器的动态面控制器以实现水下旋翼式平台的近水底定深控制。首先,采用水下航行器建模理论并结合牛顿欧拉方法建立水下旋翼式平台的运动学和动力学模型;然后,... 针对水下旋翼式平台在近水底工作时的时变非线性干扰问题,提出一种基于干扰观测器的动态面控制器以实现水下旋翼式平台的近水底定深控制。首先,采用水下航行器建模理论并结合牛顿欧拉方法建立水下旋翼式平台的运动学和动力学模型;然后,采用动态面控制方法处理系统的非线性特性,引入一阶滤波器对虚拟控制律进行滤波,以此来代替复杂的微分运算,同时,通过非线性干扰观测器对系统内外部总扰动进行观测估计,并通过李雅普诺夫理论证明系统的稳定性;通过仿真实验验证所设计控制策略在白噪声模拟的随机干扰和参数不确定条件下的有效性;最后,设计开发实验样机,并在不同期望深度的近水底开展定深实验。研究结果表明:在水底反冲击力的作用下,相比动态面控制和串级PID控制,采用所设计的控制策略,平台姿态通道和深度通道的控制精度均有不同程度的提高,说明所提出的控制方法具有较好的鲁棒性,可有效解决近水底扰动问题。 展开更多
关键词 水下旋翼式平台 近水底扰动 定深控制 动态面控制 干扰观测器
在线阅读 下载PDF
无人机辅助MEC车辆任务卸载与功率控制近端策略优化算法 被引量:2
16
作者 谭国平 易文雄 +1 位作者 周思源 胡鹤轩 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第6期2361-2371,共11页
无人机(UAVs)辅助移动边缘计算(MEC)架构是灵活处理车载计算密集、时延敏感型任务的有效模式。但是,如何在处理任务时延与能耗之间达到最佳均衡,一直是此类车联网应用中长期存在的挑战性问题。为了解决该问题,该文基于无人机辅助移动边... 无人机(UAVs)辅助移动边缘计算(MEC)架构是灵活处理车载计算密集、时延敏感型任务的有效模式。但是,如何在处理任务时延与能耗之间达到最佳均衡,一直是此类车联网应用中长期存在的挑战性问题。为了解决该问题,该文基于无人机辅助移动边缘计算架构,考虑无线信道时变特性及车辆高移动性等动态变化特征,构建出基于非正交多址(NOMA)的车载任务卸载与功率控制优化问题模型,然后将该问题建模成马尔可夫决策过程,并提出一种基于近端策略优化(PPO)的分布式深度强化学习算法,使得车辆只需根据自身获取局部信息,自主决策任务卸载量及相关发射功率,从而达到时延与能耗的最佳均衡性能。仿真结果表明,与现有方法相比较,本文所提任务卸载与功率控制近端策略优化方案不仅能够显著获得更优的时延与能耗性能,所提方案平均系统代价性能提升至少13%以上,而且提供一种性能均衡优化方法,能够通过调节用户偏好权重因子,达到系统时延与能耗水平之间的最佳均衡。 展开更多
关键词 无人机辅助计算 移动边缘计算 近端策略优化 深度强化学习 功率控制和任务卸载
在线阅读 下载PDF
盾构隧道上覆基坑近接施工设计研究
17
作者 黄振科 《铁道工程学报》 CSCD 北大核心 2024年第12期109-113,118,共6页
研究目的:既有运营盾构隧道上覆基坑开挖时面临近接施工问题,隧道的变形及稳定性控制要求严格。为探究近接施工保护措施的可行性及效果,结合某地铁出入口基坑开挖工程,采用有限元数值模拟的方式对加固措施进行分析,并提取关键特征点位... 研究目的:既有运营盾构隧道上覆基坑开挖时面临近接施工问题,隧道的变形及稳定性控制要求严格。为探究近接施工保护措施的可行性及效果,结合某地铁出入口基坑开挖工程,采用有限元数值模拟的方式对加固措施进行分析,并提取关键特征点位移与实际监测数据进行对比,揭示上覆基坑开挖引起的隧道变形规律,提出针对性的设计关键要点。研究结论:(1)上覆基坑开挖卸载诱发盾构隧道隆起的工程问题,在“时间”和“空间”上可以采用近接施工全过程措施进行变形及稳定性的有效控制;(2)上覆基坑采用旋喷桩竖向止水帷幕加MJS注浆水平封底的地下水控制措施,能够隔断水力联系,减小基坑降水对盾构隧道的影响;(3)充分利用基坑分段开挖中的时空效应,分段长度应结合基坑宽度、夹层土厚度综合考虑;(4)本研究成果可为周边环境控制严格的隧道及地下通道类工程案例提供借鉴和参考。 展开更多
关键词 盾构隧道 近接施工 上覆基坑 变形控制设计
在线阅读 下载PDF
无线网络邻近图综述 被引量:46
18
作者 路纲 周明天 +3 位作者 牛新征 佘堃 唐勇 秦科 《软件学报》 EI CSCD 北大核心 2008年第4期888-911,共24页
网络拓扑结构可由邻近图表述,定义其为一个包含点集V和边集E的图,某有向边(u,v)属于该图当且仅当点v位于点u的邻城内,这个邻域是在某事先定义的邻近测度作用下产生的.回顾了迄今为止一些重要图结构,内容主要集中在5个方面,包括邻近图的... 网络拓扑结构可由邻近图表述,定义其为一个包含点集V和边集E的图,某有向边(u,v)属于该图当且仅当点v位于点u的邻城内,这个邻域是在某事先定义的邻近测度作用下产生的.回顾了迄今为止一些重要图结构,内容主要集中在5个方面,包括邻近图的定义或概念、构造算法、图例、隶属关系、拓扑参数,还谈到进一步的研究方向. 展开更多
关键词 邻近图 无线网络 拓扑控制 支配集 计算几何
在线阅读 下载PDF
面向虚拟数据空间的智能TCP拥塞控制算法 被引量:10
19
作者 王龙翔 董凯 +5 位作者 李小轩 董小社 张兴军 朱正东 王宇菲 张利平 《西安交通大学学报》 EI CAS CSCD 北大核心 2021年第5期83-91,共9页
为优化虚拟数据空间网络传输性能,提出了基于近端策略优化的智能TCP拥塞控制算法TCP-PPO2。将TCP拥塞控制过程抽象为一个可部分观察的马尔可夫决策过程,在该过程中构建一个智能体,与网络环境进行互动。智能体通过观察网络状态特征对拥... 为优化虚拟数据空间网络传输性能,提出了基于近端策略优化的智能TCP拥塞控制算法TCP-PPO2。将TCP拥塞控制过程抽象为一个可部分观察的马尔可夫决策过程,在该过程中构建一个智能体,与网络环境进行互动。智能体通过观察网络状态特征对拥塞窗口长度进行调节,网络环境向智能体反馈奖励值,智能体尝试最大化回合内获得奖励期望值。设计了包括吞吐率、网络时延等网络特征的状态空间,使智能体能够观察到足够多的信息进行决策并且降低性能开销。通过加权算法设计奖励函数,使智能体能够平衡优化吞吐率与时延。通过近端策略优化算法更新智能体模型参数,对过大的参数更新进行截断,将参数更新限制在一定范围内,减少梯度下降过程中出现的振荡,实现训练过程的快速收敛。在NS3模拟器上实现了基于近端策略优化的TCP拥塞控制算法,并与Cubic、HighSpeed和NewReno等主流拥塞控制算法进行了对比,结果表明:TCP-PPO2吞吐率性能可达对比算法的2~3倍以上;80%的采样点时延相比链路最小时延值只增加了4%。 展开更多
关键词 虚拟数据空间 近端策略优化 拥塞控制 TCP
在线阅读 下载PDF
面向空间近距离操作的机械臂与服务卫星协同控制 被引量:8
20
作者 王兴龙 周志成 +1 位作者 王典军 陈士明 《宇航学报》 EI CAS CSCD 北大核心 2020年第1期101-109,共9页
针对航天器在轨服务任务中涉及的空间近距离操作需求,提出一种机械臂与服务卫星协同控制方法。首先建立了机械臂和服务卫星组合体动力学模型以及服务卫星和目标卫星相对位姿耦合动力学模型。然后采用全局终端滑模控制设计了机械臂轨迹... 针对航天器在轨服务任务中涉及的空间近距离操作需求,提出一种机械臂与服务卫星协同控制方法。首先建立了机械臂和服务卫星组合体动力学模型以及服务卫星和目标卫星相对位姿耦合动力学模型。然后采用全局终端滑模控制设计了机械臂轨迹跟踪控制方法,采用PD控制设计了服务卫星相对位姿耦合控制方法,并将机械臂反作用力和力矩作为前馈补偿叠加到服务卫星控制系统中,实现了两者的协同控制。最后通过数值仿真验证了控制方法的有效性。仿真结果表明,该方法能够满足空间近距离操作任务对机械臂和服务卫星的控制精度、稳定性和误差收敛时间的要求,具有工程实用性。 展开更多
关键词 空间近距离操作 机械臂 服务卫星 协同控制
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部