期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
基于深度强化学习的四旋翼航迹跟踪控制方法
1
作者 伍国华 曾家恒 +2 位作者 王得志 郑龙 邹伟 《系统仿真学报》 北大核心 2025年第5期1169-1187,共19页
受限于模型方程决定的固定结构,传统四旋翼控制器设计难以有效应对模型参数和环境扰动变化带来的控制误差。提出了基于深度强化学习的四旋翼航迹跟踪控制方法,构建了对应的马尔可夫决策模型,并基于PPO框架提出了PPO-SAG(PPO with self a... 受限于模型方程决定的固定结构,传统四旋翼控制器设计难以有效应对模型参数和环境扰动变化带来的控制误差。提出了基于深度强化学习的四旋翼航迹跟踪控制方法,构建了对应的马尔可夫决策模型,并基于PPO框架提出了PPO-SAG(PPO with self adaptive guide)算法。PPO-SAG在学习过程中加入自适应机制,利用PID专家知识进行引导和学习,提高了训练的收敛效果和稳定性。根据问题特点,设计了带有距离约束惩罚和熵策略的目标函数,提出扰动误差信息补充结构和航迹特征选择结构,补充控制误差信息、提取未来航迹关键要素,提高了收敛效果。并利用状态动态标准化、优势函数批标准化及奖励缩放策略,更合理地处理三维空间中的状态表征和奖励优势表达。单种航迹与混合航迹实验表明,所提出的PPO-SAG算法在收敛效果和稳定性上均取得了最好的效果,消融实验说明所提出的改进机制和结构均起到正向作用。所研究的未知扰动下基于深度强化学习的四旋翼航迹跟踪控制问题,为设计更加鲁棒高效的四旋翼控制器提供了解决方案。 展开更多
关键词 深度强化学习 四旋翼航迹跟踪控制 近端策略优化(PPO) 自适应机制 注意力机制
在线阅读 下载PDF
欠驱动水下航行器三维直线航迹跟踪控制 被引量:9
2
作者 王宏健 陈子印 +2 位作者 边信黔 贾鹤鸣 李娟 《控制理论与应用》 EI CAS CSCD 北大核心 2013年第4期443-453,共11页
针对欠驱动水下航行器的三维直线航迹跟踪控制问题,基于虚拟向导建立了三维航迹跟踪误差模型,采用反馈增益反步法设计航迹跟踪控制器,通过合理选择控制器参数消除了部分非线性项,与传统反步法设计相比简化了虚拟控制量的形式,并且能够... 针对欠驱动水下航行器的三维直线航迹跟踪控制问题,基于虚拟向导建立了三维航迹跟踪误差模型,采用反馈增益反步法设计航迹跟踪控制器,通过合理选择控制器参数消除了部分非线性项,与传统反步法设计相比简化了虚拟控制量的形式,并且能够避免基于视线法设计导引律时存在固有奇异值点的问题.基于李雅普诺夫稳定性理论分析了闭环跟踪误差系统的渐近稳定性.最后将设计的控制器应用于欠驱动水下航行器进行仿真实验,结果表明控制器具有精确的三维航迹的跟踪能力,并对外界干扰和模型参数不确定性具有较好的鲁棒性. 展开更多
关键词 欠驱动水下航行器 三维航迹跟踪控制 反步法 反馈增益 虚拟向导
在线阅读 下载PDF
基于深度强化学习的智能船舶航迹跟踪控制 被引量:30
3
作者 祝亢 黄珍 王绪明 《中国舰船研究》 CSCD 北大核心 2021年第1期105-113,共9页
[目的]智能船舶的航迹跟踪控制问题往往面临着控制环境复杂、控制器稳定性不高以及大量的算法计算等问题。为实现对航迹跟踪的精准控制,提出一种引入深度强化学习技术的航向控制器。[方法]首先,结合视线(LOS)算法制导,以船舶的操纵特性... [目的]智能船舶的航迹跟踪控制问题往往面临着控制环境复杂、控制器稳定性不高以及大量的算法计算等问题。为实现对航迹跟踪的精准控制,提出一种引入深度强化学习技术的航向控制器。[方法]首先,结合视线(LOS)算法制导,以船舶的操纵特性和控制要求为基础,将航迹跟踪问题建模成马尔可夫决策过程,设计其状态空间、动作空间、奖励函数;然后,使用深度确定性策略梯度(DDPG)算法作为控制器的实现,采用离线学习方法对控制器进行训练;最后,将训练完成的控制器与BP-PID控制器进行对比研究,分析控制效果。[结果]仿真结果表明,设计的深度强化学习控制器可以从训练学习过程中快速收敛达到控制要求,训练后的网络与BP-PID控制器相比跟踪迅速,具有偏航误差小、舵角变化频率小等优点。[结论]研究成果可为智能船舶航迹跟踪控制提供参考。 展开更多
关键词 智能船舶 航迹跟踪控制 深度强化学习 视线导航法
在线阅读 下载PDF
事件触发的自适应PID海洋水面船舶航迹跟踪控制 被引量:5
4
作者 刘训文 徐超 陈再发 《上海海事大学学报》 北大核心 2023年第2期11-17,共7页
针对不确定动态和未知环境扰动情况下海洋水面船舶(marine surface vehicle,MSV)的航迹跟踪控制问题,在传统PID控制下,引入自适应神经网络和事件触发控制技术,提出一种不依赖船舶模型和环境扰动的事件触发的自适应PID控制方法来实现MSV... 针对不确定动态和未知环境扰动情况下海洋水面船舶(marine surface vehicle,MSV)的航迹跟踪控制问题,在传统PID控制下,引入自适应神经网络和事件触发控制技术,提出一种不依赖船舶模型和环境扰动的事件触发的自适应PID控制方法来实现MSV航迹跟踪。Lyapunov稳定性理论分析结果表明,所提出的控制方法可以保证这个闭环控制系统所有信号的有界性,且可继承传统PID控制的优越性,同时可提高系统的鲁棒性。该研究结果不仅扩宽了PID控制的适用范围,而且为MSV航迹跟踪控制提供了新的设计方法。 展开更多
关键词 海洋水面船舶(MSV) 航迹跟踪控制 PID控制 神经网络 事件触发控制
在线阅读 下载PDF
基于视线导引策略的无人艇航迹跟踪控制算法 被引量:3
5
作者 王潋 李烨 +3 位作者 陈霄 罗荣 完颜娟 唐嘉钰 《兵工学报》 EI CAS CSCD 北大核心 2022年第S02期20-25,共6页
为实现复杂海洋环境下无人艇对期望航迹的精确跟踪和安全航行控制问题,对目前用于无人艇航迹跟踪控制的视线导引策略进行了详细研究,可分为基于前视距离的视线导引策略和基于包围圈的视线导引策略两大类,并分析了两类算法各自的优缺点... 为实现复杂海洋环境下无人艇对期望航迹的精确跟踪和安全航行控制问题,对目前用于无人艇航迹跟踪控制的视线导引策略进行了详细研究,可分为基于前视距离的视线导引策略和基于包围圈的视线导引策略两大类,并分析了两类算法各自的优缺点。建立无人艇数学模型,基于前视距离的视线制导策略和PID控制思想设计无人艇航迹跟踪控制算法。仿真实验结果表明:所提算法具有良好的航迹跟踪控制效果,可为现阶段我国无人艇自主航行控制技术的研究和无人艇装备建设提供参考。 展开更多
关键词 无人艇 视线导引策略 航迹跟踪控制 PID算法
在线阅读 下载PDF
基于参考观测器的无人直升机航迹跟踪控制
6
作者 张瑾 袁锁中 《兵工自动化》 2011年第2期58-61,共4页
为实现无人直升机在工程应用中的精确航迹跟踪控制,从工程应用的角度提出基于参考观测器的航迹跟踪控制方法。根据航迹指令,通过参考观测器实时估算出无人直升机期望跟踪的状态量与控制量,作为航迹跟踪控制器的参考输入,再利用全状态反... 为实现无人直升机在工程应用中的精确航迹跟踪控制,从工程应用的角度提出基于参考观测器的航迹跟踪控制方法。根据航迹指令,通过参考观测器实时估算出无人直升机期望跟踪的状态量与控制量,作为航迹跟踪控制器的参考输入,再利用全状态反馈控制,操纵直升机跟踪期望的航迹,并以某型直升机为控制对象,在典型机动下进行航迹跟踪控制仿真验证。结果表明,该系统具有良好的航迹跟踪性能,且算法简单,易于实现。 展开更多
关键词 无人直升机 航迹跟踪控制 观测器 最优控制
在线阅读 下载PDF
无人艇航迹跟踪GPC-PID串级控制 被引量:18
7
作者 彭艳 吴伟清 +3 位作者 刘梅 国文青 李恒宇 谢少荣 《控制工程》 CSCD 北大核心 2014年第2期245-248,共4页
水面无人艇(unmanned surface vehicle,USV)系统存在有大惯性、长时滞、非线性、难以建立精确模型等问题,易受海浪等外界干扰的影响,采用传统的PID控制难以达到良好的航迹跟踪控制效果。为了实现更好的控制效果,基于广义预测理论,将其与... 水面无人艇(unmanned surface vehicle,USV)系统存在有大惯性、长时滞、非线性、难以建立精确模型等问题,易受海浪等外界干扰的影响,采用传统的PID控制难以达到良好的航迹跟踪控制效果。为了实现更好的控制效果,基于广义预测理论,将其与PID控制相结合,设计了GPC-PID串级控制器,分别控制无人艇的转艏运动和操舵运动,并采用分离式控制方案,通过航向控制间接实现无人艇的航迹跟踪控制。从matlab仿真实验结果可以看出,GPC-PID控制器具有良好的航向控制与航迹跟踪控制效果,具有响应速度快,控制精度高,鲁棒性好,抗干扰能力强等优点。 展开更多
关键词 水面无人艇 航迹跟踪控制 GPC-PID串级控制 分离式控制
在线阅读 下载PDF
综合TF/TA飞行的航迹控制与仿真 被引量:2
8
作者 徐克虎 沈春林 +1 位作者 李宝莉 冯根生 《南京航空航天大学学报》 EI CAS CSCD 北大核心 2001年第2期122-125,共4页
在超低空突防过程中 ,有效的航迹跟踪控制算法是飞行器顺利完成综合地形跟随 /地形回避 ( TF/ TA)飞行任务的保证。在综合 TF/ TA飞行过程中 ,由于飞行器需作大机动飞行 ,纵、横向之间存在严重耦合 ,常规的航迹跟踪控制算法亦不适用。... 在超低空突防过程中 ,有效的航迹跟踪控制算法是飞行器顺利完成综合地形跟随 /地形回避 ( TF/ TA)飞行任务的保证。在综合 TF/ TA飞行过程中 ,由于飞行器需作大机动飞行 ,纵、横向之间存在严重耦合 ,常规的航迹跟踪控制算法亦不适用。本文将六自由度飞机状态方程描述为纵、横向两个子系统所构成的关联大系统 ,并在一定的假设条件下将两者之间的耦合成分分别看作纵、横的控制量的一部分 ,然后利用大系统变结构控制理论 ,对 TF/ TA飞行的纵、横向的轨迹控制律进行独立设计 ,降低了理论研究和工程实现的难度。仿真例子表明这一方法是可行的。 展开更多
关键词 变结构控制 耦合系统 飞行器 飞行控制 航迹跟踪控制算法 地形跟随/地形回避 TF/TA
在线阅读 下载PDF
有人/无人机编队队形集结控制研究 被引量:4
9
作者 吴立尧 苏析超 +1 位作者 王垒 潘子双 《系统工程与电子技术》 EI CSCD 北大核心 2023年第7期2192-2202,共11页
针对有人/无人机(manned/unmanned aerial vehicle,MAV/UAV)编队队形集结控制问题,设计了一种基于航迹规划-跟踪的MAV/UAV编队集结控制策略。首先,考虑编队队形集结边界约束与防碰撞约束条件,设计了一种基于Dubins曲线与协同模拟退火粒... 针对有人/无人机(manned/unmanned aerial vehicle,MAV/UAV)编队队形集结控制问题,设计了一种基于航迹规划-跟踪的MAV/UAV编队集结控制策略。首先,考虑编队队形集结边界约束与防碰撞约束条件,设计了一种基于Dubins曲线与协同模拟退火粒子群优化相结合的编队集结航迹规划算法。然后,以规划得到的集结航迹作为期望航迹,设计了一种双回路结构的非线性路径跟踪控制方法。最后,利用Matlab软件对设计的航迹规划与跟踪控制方法进行了仿真对比实验,仿真结果验证了方法的有效性和优越性。 展开更多
关键词 有人/无人机 队形集结 航迹规划 航迹跟踪控制 Dubins-协同模拟退火粒子群优化算法 非线性控制
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部