期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于一种改进PPO算法的无人机空战自主机动决策方法研究
1
作者 张欣 董文瀚 +3 位作者 尹晖 贺磊 张聘 李敦旺 《空军工程大学学报》 CSCD 北大核心 2024年第6期77-86,共10页
深度强化学习的应用为无人机自主机动决策提供了新的可能。提出一种基于态势评估模型重构与近端策略优化(PPO)算法相结合的无人机自主空战机动决策方法,为一对一近距空战提供了有效策略选择。首先,建立高保真六自由度无人机模型与近距... 深度强化学习的应用为无人机自主机动决策提供了新的可能。提出一种基于态势评估模型重构与近端策略优化(PPO)算法相结合的无人机自主空战机动决策方法,为一对一近距空战提供了有效策略选择。首先,建立高保真六自由度无人机模型与近距空战攻击模型;其次,基于空战状态划分重构角度、速度、距离和高度态势函数,提出一种描述机动潜力的新型态势评估指标;之后,基于态势函数设计塑形奖励,并与基于规则的稀疏奖励、基于状态转换的子目标奖励共同构成算法奖励函数,增强了强化学习算法的引导能力;最后,设计专家系统作为对手,在高保真空战仿真平台(JSBSim)中对本文工作进行了评估。仿真验证,应用本文方法的智能体在对抗固定机动对手与专家系统对手时算法收敛速度与胜率都得到了有效提升。 展开更多
关键词 PPO算法 机动潜力 六自由度飞机模型 态势函数 近距空战 专家系统
在线阅读 下载PDF
基于扩张状态观测器的运输机多故障容错控制 被引量:6
2
作者 董文瀚 童颖裔 +1 位作者 朱鹏 郭佳 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2020年第5期1005-1017,共13页
针对含有传感器与舵面故障的运输机姿态跟踪问题,提出了一种基于扩张状态观测器的反步容错控制方法。采用状态观测器与控制器分开设计的方法,设计含神经网络的扩张状态观测器估计系统状态、传感器和舵面故障信息。在此基础上,利用状态... 针对含有传感器与舵面故障的运输机姿态跟踪问题,提出了一种基于扩张状态观测器的反步容错控制方法。采用状态观测器与控制器分开设计的方法,设计含神经网络的扩张状态观测器估计系统状态、传感器和舵面故障信息。在此基础上,利用状态估计值代替实际状态,采用反步法设计姿态角跟踪控制律,并引入指令滤波器提高反步法的控制性能,基于Lyapunov稳定性理论推导证明了闭环系统跟踪误差的最终有界收敛。仿真结果表明,在系统存在传感器与舵面多故障的条件下,所提方法依然可以实现运输机姿态角的稳定跟踪。 展开更多
关键词 扩张状态观测器 神经网络 运输机 多故障 容错控制
在线阅读 下载PDF
无人机自主引导跟踪与避障的近端策略优化 被引量:5
3
作者 胡多修 董文瀚 解武杰 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2023年第1期195-205,共11页
针对无人机地面动态目标跟踪问题,建立了远距离自主引导与近距离伴飞避障2个阶段的马尔可夫决策过程模型。在此基础上,提出了一种改进的近端策略优化(PPO)算法。考虑到无人机接收到的数据具有时序性且环境状态存在上下文关联,所提算法... 针对无人机地面动态目标跟踪问题,建立了远距离自主引导与近距离伴飞避障2个阶段的马尔可夫决策过程模型。在此基础上,提出了一种改进的近端策略优化(PPO)算法。考虑到无人机接收到的数据具有时序性且环境状态存在上下文关联,所提算法采用长短期记忆(LSTM)网络,通过无人机与目标的实时位置关系等状态信息来计算奖励值,更新网络参数,并进行自适应优化迭代。通过基于ROS系统的仿真测试平台进行试验,结果表明:所提算法安全有效地实现了侦察任务全过程的自主机动,与传统的PPO算法相比,LSTM的引入缩短了模型训练时间,跟踪与避障的效率明显提高,进一步加强了算法的鲁棒性、准确性和实时性。 展开更多
关键词 多旋翼无人机 自主引导 马尔可夫决策过程 近端策略优化 长短期记忆
在线阅读 下载PDF
考虑拓扑故障的无人机编队容错控制方法研究 被引量:11
4
作者 马小山 董文瀚 李炳乾 《西北工业大学学报》 EI CAS CSCD 北大核心 2020年第5期1084-1093,共10页
针对无人机编队在拓扑故障、舵面故障、执行器故障和不确定性情况下的控制问题,提出了一种编队容错控制方法。首先建立了编队运动模型和无人机运动模型;然后在拓扑故障检测方法的基础上,提出了拓扑故障重构优化算法,实现最小通信代价和... 针对无人机编队在拓扑故障、舵面故障、执行器故障和不确定性情况下的控制问题,提出了一种编队容错控制方法。首先建立了编队运动模型和无人机运动模型;然后在拓扑故障检测方法的基础上,提出了拓扑故障重构优化算法,实现最小通信代价和队形重构代价的编队拓扑故障重构优化;在反步容错控制方法的设计过程中,通过执行器故障辨识模块和辅助系统模块来对执行器故障和舵面故障进行估计和补偿,实现执行器故障、舵面故障和不确定性条件下的编队稳定飞行。仿真结果验证了所设计的拓扑故障下无人机编队反步容错控制方法的优越性。 展开更多
关键词 无人机编队 拓扑故障 舵面故障 执行器故障 拓扑故障重构优化算法 反步容错控制
在线阅读 下载PDF
基于CEA-GA的多无人机三维协同曲线航迹规划方法 被引量:1
5
作者 文超 董文瀚 +1 位作者 解武杰 蔡鸣 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2023年第11期3086-3099,共14页
针对多无人机协同航迹规划求解计算复杂度高,收敛效率差等问题,提出一种基于混沌精英适应遗传算法(CEA-GA)的多无人机三维协同曲线航迹规划方法。利用层级规划思想,建立基于单机规划层-航迹平滑层-多机协同规划层的多无人机三维协同曲... 针对多无人机协同航迹规划求解计算复杂度高,收敛效率差等问题,提出一种基于混沌精英适应遗传算法(CEA-GA)的多无人机三维协同曲线航迹规划方法。利用层级规划思想,建立基于单机规划层-航迹平滑层-多机协同规划层的多无人机三维协同曲线航迹层级规划模型,将复杂约束规划问题分解为子函数优化求解问题,减小计算量;考虑到遗传算法(GA)求解高维复杂约束优化问题存在的性能局限,采用Tent混沌映射均匀初始化种群,以扩大个体搜索空间,丰富种群多样性,在此基础上,通过引入自适应遗传算子平衡算法的全局搜索与局部开发能力,帮助个体跳出局部最优,并采用适应度动态更新策略进一步提高算法的局部探索能力和收敛速度。将精英保留策略引入GA以更好地保证改进算法的全局收敛性。将CEA-GA应用于模型求解,仿真实验结果表明:CEA-GA具有较强的鲁棒性、较好的寻优性能和收敛效率,且能够为集群规划满足约束条件的协同曲线航迹,从而验证了所提方法的有效性和CEA-GA的优越性。 展开更多
关键词 协同航迹规划 多无人机 混沌映射 遗传算法 精英保留
在线阅读 下载PDF
基于滑模观测器的无人推力矢量飞机反步容错控制 被引量:3
6
作者 李炳乾 董文瀚 马小山 《西北工业大学学报》 EI CAS CSCD 北大核心 2018年第5期978-987,共10页
针对无人推力矢量飞机,设计了基于滑模观测器的反步容错控制。首先提出执行器故障模型,并将本体方程分为快、慢回路,建立包含不确定性、舵面故障和执行器故障的无人推力矢量飞机故障模型,然后设计包含高阶滑模观测器及不连续投影自适应... 针对无人推力矢量飞机,设计了基于滑模观测器的反步容错控制。首先提出执行器故障模型,并将本体方程分为快、慢回路,建立包含不确定性、舵面故障和执行器故障的无人推力矢量飞机故障模型,然后设计包含高阶滑模观测器及不连续投影自适应律的级联观测器实现补偿不确定性和舵面故障的状态估计,并通过滑模观测器实现故障辨识和故障参数估计,最后结合状态估计及故障参数实现包容不确定性,舵面故障和执行器故障的全局反步容错控制。大迎角机动仿真表明所提方法能够有效实现无人推力矢量飞机的全局容错控制。 展开更多
关键词 无人推力矢量飞机 执行器故障 舵面故障 级联观测器 滑模观测器 反步容错控制
在线阅读 下载PDF
A Distributed Optimal Scheme Based on Local QoS for Web Service Composition 被引量:2
7
作者 DAI Huijun QU Hua +2 位作者 ZHAO Jihong dong wenhan XIE Wujie 《China Communications》 SCIE CSCD 2014年第A01期142-147,共6页
The goal of web service composition is to choose an optimal scheme according to Quantity of Service (QoS) which selects instances in a distributed network. The networks are clustered with some web services such as o... The goal of web service composition is to choose an optimal scheme according to Quantity of Service (QoS) which selects instances in a distributed network. The networks are clustered with some web services such as ontologies, algorithms and rule engines with similar function and interfaces. In this scheme, web services acted as candidate service construct a distributed model which can't obtain the global services' information. The model is utilized to choose instances according to local QoS information in the progress of service composition. Some QoS matrixes are used to record and compare the instance paths and then choose a better one. Simulation result has proven that our ~pproach has a tradeoff between efficiency and ~quality. 展开更多
关键词 local QoS service composition distributed optimal scheme instance path
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部