期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
基于混合模仿学习的多智能体追捕决策方法
1
作者 王焱宁 张锋镝 +1 位作者 肖登敏 孙中奇 《计算机科学》 北大核心 2025年第1期323-330,共8页
针对传统模仿学习方法在处理多样化专家轨迹时的局限性,尤其是难以有效整合质量参差不齐的固定模态专家数据的问题,创新性地融合了多专家轨迹生成对抗模仿学习(Multiple Trajectories Generative Adversarial Imitation Learning, MT-GA... 针对传统模仿学习方法在处理多样化专家轨迹时的局限性,尤其是难以有效整合质量参差不齐的固定模态专家数据的问题,创新性地融合了多专家轨迹生成对抗模仿学习(Multiple Trajectories Generative Adversarial Imitation Learning, MT-GAIL)方法与时序差分误差行为克隆(Temporal-Difference Error Behavioral Cloning, TD-BC)技术,构建了一种混合模仿学习框架。该框架不仅可以增强模型对复杂多变的专家策略的适应能力,还能够提升模型从低质量数据中提炼有用信息的鲁棒性。框架得到的模型具备直接应用于强化学习的能力,仅需经过细微的调整与优化,即可训练出一个直接可用的、基于专家经验的强化学习模型。在二维动静结合的目标追捕场景中进行了实验验证,该方法展现出良好的性能。结果表明,所提方法可以吸取专家经验,为后续的强化学习训练阶段提供一个起点高、效果佳的初始模型。 展开更多
关键词 智能决策 强化学习 行为克隆 生成对抗模仿学习
在线阅读 下载PDF
面向变构型飞行器的强化学习位置姿态一体化控制方法 被引量:2
2
作者 路坤锋 贾晨辉 +3 位作者 黄旭 刘晓东 柳嘉润 王昭磊 《宇航学报》 EI CAS CSCD 北大核心 2024年第7期1100-1110,共11页
针对变构型飞行器在飞行过程中由于构型发生改变导致其质心、气动力、转动惯量和气动力矩以及飞行器的抗扰能力等参数或特性发生变化,对飞行器飞行控制品质产生较大影响的问题,提出一种基于强化学习的变构型飞行器一体化位置姿态控制方... 针对变构型飞行器在飞行过程中由于构型发生改变导致其质心、气动力、转动惯量和气动力矩以及飞行器的抗扰能力等参数或特性发生变化,对飞行器飞行控制品质产生较大影响的问题,提出一种基于强化学习的变构型飞行器一体化位置姿态控制方法,通过孪生延迟深度确定性策略梯度(TD3)强化学习算法训练神经网络控制律,实现变构型飞行器的一体化位置姿态控制。算法通过数学仿真与飞行试验进行了验证,仿真结果与飞行试验结果表明,该算法所设计的神经网络控制律能够实现变构型飞行器的一体化位置姿态控制,并对于外界干扰具有较强的适应能力。 展开更多
关键词 强化学习 变构型飞行器 位置控制 姿态控制
在线阅读 下载PDF
飞行器集群协同控制技术分析与展望 被引量:6
3
作者 郑卓 路坤锋 +1 位作者 王昭磊 姚征 《宇航学报》 EI CAS CSCD 北大核心 2023年第4期538-545,共8页
系统分析和展望了飞行器集群协同控制技术,对先进的集群飞行器和协同控制技术进行了总结和对比,并提出了当前该领域面临的5个主要科学问题。在此基础上提出了飞行器集群自主控制体系架构以及射前任务规划、在线态势感知、协同制导控制等... 系统分析和展望了飞行器集群协同控制技术,对先进的集群飞行器和协同控制技术进行了总结和对比,并提出了当前该领域面临的5个主要科学问题。在此基础上提出了飞行器集群自主控制体系架构以及射前任务规划、在线态势感知、协同制导控制等8项飞行器集群协同核心关键技术。其中,对每项技术进行了简要概括,阐述了它们之间的关系和对于飞行器集群协同控制的作用。最后,从理论研究、技术突破到工程应用方面,对该领域未来发展做出了展望。 展开更多
关键词 飞行器集群 协同控制 协同决策与规划 协同探测
在线阅读 下载PDF
神经网络架构轻量化搜索的飞行器控制律自学习方法
4
作者 王昭磊 王露荻 +3 位作者 路坤锋 禹春梅 李晓敏 林平 《宇航学报》 EI CAS CSCD 北大核心 2024年第5期762-769,共8页
针对在运用Soft actor-critic(SAC)强化学习算法实现复杂的飞行器控制律自学习过程中,超参数设定高度依赖于人工经验进而造成设计难度大的问题,提出一种基于神经网络架构轻量化搜索策略的飞行器控制律自学习方法。该方法在将神经网络架... 针对在运用Soft actor-critic(SAC)强化学习算法实现复杂的飞行器控制律自学习过程中,超参数设定高度依赖于人工经验进而造成设计难度大的问题,提出一种基于神经网络架构轻量化搜索策略的飞行器控制律自学习方法。该方法在将神经网络架构设计问题转化为图拓扑生成问题的基础上,结合LSTM循环神经网络的图拓扑生成算法、基于权重共享的深度强化学习参数轻量化训练与评估机制,以及基于策略梯度的图拓扑生成器参数学习算法,给出了一种面向深度强化学习的轻量化自动搜索框架,实现了SAC训练算法中神经网络架构超参数的自动优化,进而完成了控制律的自学习。以三维空间返回着陆控制为例,验证了所提方法的有效性和实用性。 展开更多
关键词 飞行器 控制律自学习 自动机器学习 网络架构搜索 SAC强化学习
在线阅读 下载PDF
航天器自主任务规划修复技术研究进展 被引量:16
5
作者 徐瑞 陈超 +2 位作者 崔平远 朱圣英 徐帆 《宇航学报》 EI CAS CSCD 北大核心 2019年第7期733-741,共9页
结合航天器自主能力发展的迫切需求,阐述了航天器自主任务规划修复的必要性和难点。给出了航天器自主任务规划修复技术、航天器任务规划稳定性和规划修复问题的定义。根据规划执行失败时采用的修复策略,将自主任务规划修复技术分为规则... 结合航天器自主能力发展的迫切需求,阐述了航天器自主任务规划修复的必要性和难点。给出了航天器自主任务规划修复技术、航天器任务规划稳定性和规划修复问题的定义。根据规划执行失败时采用的修复策略,将自主任务规划修复技术分为规则匹配型、局部调整型、删除/求精型、状态转移型和构造新问题型五类。重点归纳了各类自主任务规划修复技术的研究进展和特点,分析了规划稳定性的定量评价方法。并在对目前任务规划修复方法总结分析的基础上,给出了未来航天器自主任务规划修复技术的研究方向建议。 展开更多
关键词 航天器自主 任务规划 规划修复 规划稳定性
在线阅读 下载PDF
面向WS-BPEL程序的变异测试优化技术 被引量:6
6
作者 孙昌爱 王真 潘琳 《计算机研究与发展》 EI CSCD 北大核心 2019年第4期895-905,共11页
WS-BPEL(business process execution language for Web service)是一种基于XML的、面向过程的可执行服务组装语言.由于Web服务的动态性、松耦合特性、部署与运行于开放的网络环境,如何保证WS-BPEL程序的可靠性尤显重要.尽管变异测试具... WS-BPEL(business process execution language for Web service)是一种基于XML的、面向过程的可执行服务组装语言.由于Web服务的动态性、松耦合特性、部署与运行于开放的网络环境,如何保证WS-BPEL程序的可靠性尤显重要.尽管变异测试具有较强的故障检测能力,但由于变异体数量大、执行时间长、计算开销大,不利于在实践中广泛应用.为了增强变异测试的实用性,针对如何降低面向WS-BPEL程序的变异测试开销问题,从二阶变异和变异算子优先级角度提出了2种面向WS-BPEL程序的变异测试优化技术,开发了相应的集成化支持工具μBPEL.使用6个WS-BPEL程序实例对提出的优化技术的有效性进行验证.实验结果表明:提出的优化技术可以有效地减少变异体数目而并不显著降低变异测试有效性,提高了变异测试的效率. 展开更多
关键词 WS-BPEL语言 变异测试 性能优化 二阶变异测试 变异算子优先级
在线阅读 下载PDF
基于递归神经网络的控制力矩陀螺操纵律设计 被引量:1
7
作者 魏孔明 吴忠 高晓颖 《宇航学报》 EI CAS CSCD 北大核心 2008年第6期1908-1911,共4页
利用递归神经网络对单框架控制力矩陀螺(SGCMG)系统操纵律进行动态求解,设计了一种基于递归神经网络的SGCMG系统操纵律。通过选择适当参数可以使该网络渐近收敛到稳定状态,从而使操纵律具有较小的操纵误差。该操纵律不用计算Jacobi矩阵... 利用递归神经网络对单框架控制力矩陀螺(SGCMG)系统操纵律进行动态求解,设计了一种基于递归神经网络的SGCMG系统操纵律。通过选择适当参数可以使该网络渐近收敛到稳定状态,从而使操纵律具有较小的操纵误差。该操纵律不用计算Jacobi矩阵的伪逆,因此避免了Jacobi矩阵求逆所带来的一系列问题。对某SGC-MG系统的仿真结果表明,上述操纵律是可行的。 展开更多
关键词 控制力矩陀螺 递归神经网络 航天器
在线阅读 下载PDF
反MD攻防对抗系统的建模与仿真技术研究
8
作者 马继峰 张烁 +1 位作者 林金永 张宗梅 《系统仿真学报》 CAS CSCD 北大核心 2014年第2期339-344,共6页
针对MD系统进行攻防对抗仿真技术研究,建立反MD攻防对抗仿真系统对攻防对抗技术和导弹防御技术研究都具有重要意义。分析了反MD攻防对抗仿真系统设计原则、系统组成、主要分系统功能、软硬件环境、仿真系统方案、流程分析以及仿真系统... 针对MD系统进行攻防对抗仿真技术研究,建立反MD攻防对抗仿真系统对攻防对抗技术和导弹防御技术研究都具有重要意义。分析了反MD攻防对抗仿真系统设计原则、系统组成、主要分系统功能、软硬件环境、仿真系统方案、流程分析以及仿真系统评估。在分系统功能分析过程中重点讨论了突防武器、空间信息干扰、导弹拦截、空间信息、仿真支撑/管理等分系统的具体功能组成和建模工作内容。最后给出了主要仿真分系统的实现界面,研究工作可以为反MD系统设计和对抗手段的试验提供平台,为突防策略和对抗方案的分析评估提供技术手段与技术基础。 展开更多
关键词 弹道导弹 导弹防御 攻防对抗 建模仿真
在线阅读 下载PDF
知识与数据混合驱动的高速飞行控制方法综述 被引量:6
9
作者 黄旭 柳嘉润 +3 位作者 张远 张华明 贾晨辉 刘晓东 《宇航学报》 EI CAS CSCD 北大核心 2023年第8期1113-1126,共14页
针对高速飞行器面临的控制问题,分析了知识与数据混合驱动的控制方法的研究必要性,对混合驱动方法的研究进展进行了综述。首先总结了飞行器发展产生的新技术特征,分别对高速飞行器控制中知识驱动方法和数据驱动方法进行了界定及分析,阐... 针对高速飞行器面临的控制问题,分析了知识与数据混合驱动的控制方法的研究必要性,对混合驱动方法的研究进展进行了综述。首先总结了飞行器发展产生的新技术特征,分别对高速飞行器控制中知识驱动方法和数据驱动方法进行了界定及分析,阐述了两类方法的局限性,引出了知识与数据混合驱动的思想;其次根据数据驱动方法在框架中的重要程度和两类方法的结合形式对近年混合驱动的控制方法进行了分类,将其分为基于数据修正的知识驱动控制框架、基于知识补偿的数据驱动控制框架以及知识与数据并联型控制框架,并对各控制框架的内涵和具体研究进行了详细总结;再者,讨论了当前混合驱动的控制方法在工程应用时的若干关键问题;最后从数据利用和拓扑结构设计等角度对混合驱动的控制方法进行了展望。 展开更多
关键词 高速飞行器 知识驱动 数据驱动 混合控制方法
在线阅读 下载PDF
尺度自适应的抗遮挡目标跟踪算法 被引量:3
10
作者 刘福祥 亓贺 +1 位作者 冀瑞静 史晓军 《北京理工大学学报》 EI CAS CSCD 北大核心 2018年第4期376-380,共5页
针对目标跟踪过程中的尺度变化、易被遮挡及跟踪漂移等问题,提出一种跟踪检测一体化的算法,改进算法在最小输出均方误差和(MOSSE)的基础上增加尺度变化更新机制,通过相关计算推算目标的最新位置和最佳尺寸,并融合了判断遮挡、模板自适... 针对目标跟踪过程中的尺度变化、易被遮挡及跟踪漂移等问题,提出一种跟踪检测一体化的算法,改进算法在最小输出均方误差和(MOSSE)的基础上增加尺度变化更新机制,通过相关计算推算目标的最新位置和最佳尺寸,并融合了判断遮挡、模板自适应更新机制.通过对Benchmark上51个测试视频集跟踪实验分析,结果表明本文算法在尺度自适应以及抗遮挡方面优于传统算法. 展开更多
关键词 尺度变化 抗遮挡 模型漂移抑制 长时间跟踪
在线阅读 下载PDF
面向未来运载火箭的新一代综合电子平台设计与研究
11
作者 王苑瑾 张隽 +2 位作者 段然 韩翔宇 柳柱 《导弹与航天运载技术(中英文)》 CSCD 北大核心 2023年第2期58-64,共7页
为满足运载火箭电气系统中智能控制、任务迁移与恢复、大数据量实时通信等需求,对多核处理器与SoPC协同控制架构、接口模块分类与设计、实时分区操作系统及双通道星型冗余拓扑等关键技术进行研究,提出了一种基于实时分区操作系统的综合... 为满足运载火箭电气系统中智能控制、任务迁移与恢复、大数据量实时通信等需求,对多核处理器与SoPC协同控制架构、接口模块分类与设计、实时分区操作系统及双通道星型冗余拓扑等关键技术进行研究,提出了一种基于实时分区操作系统的综合电子平台方案并进行工程实现。通过演示验证试验,对综合电子平台中的功能模块、总线拓扑与通信、任务隔离、迁移与恢复等功能进行验证。目前该方案已应用于运载火箭综合电子产品中,为后续技术的深入研究与优化奠定了基础。 展开更多
关键词 运载火箭 多核处理器与SoPC协同控制架构 接口模块分类与设计 实时分区操作系统 综合电子平台
在线阅读 下载PDF
IMU角变速运动对旋转式SINS定位精度影响分析
12
作者 刘适 王世安 +2 位作者 刘兴章 张义 杨祥龙 《弹箭与制导学报》 CSCD 北大核心 2014年第4期19-24,共6页
针对旋转式捷联惯导中惯性测量单元(IMU)旋转角速度变化过程(以加减速过程为主)对系统定位精度的影响进行分析和研究。建立了基于地理坐标系下的角变速过程的运动模型,并以此为基础推导了旋转运动抵消等效陀螺漂移误差的基本原理。结合... 针对旋转式捷联惯导中惯性测量单元(IMU)旋转角速度变化过程(以加减速过程为主)对系统定位精度的影响进行分析和研究。建立了基于地理坐标系下的角变速过程的运动模型,并以此为基础推导了旋转运动抵消等效陀螺漂移误差的基本原理。结合在工程中普遍使用的单轴四位置八次序转停方案,详细分析了IMU加减速过程对捷联惯导系统定位精度的影响。在理论分析的基础上利用仿真试验比较了不同加减速旋转方案的定位误差,仿真结果验证了角变速运动能够显著影响旋转式捷联惯导系统的定位精度。 展开更多
关键词 捷联惯导系统 惯性测量单元 单轴旋转 角变速运动
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部