期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
具身智能自主无人系统技术 被引量:4
1
作者 孙长银 袁心 +1 位作者 王远大 柳文章 《自动化学报》 北大核心 2025年第4期762-777,共16页
自主无人系统是一类具有自主感知和决策能力的智能系统,在国防安全、航空航天、高性能机器人等方面有着广泛的应用.近年来,基于Transformer架构的各类大模型快速革新,极大地推动了自主无人系统的发展.目前,自主无人系统正迎来一场以“... 自主无人系统是一类具有自主感知和决策能力的智能系统,在国防安全、航空航天、高性能机器人等方面有着广泛的应用.近年来,基于Transformer架构的各类大模型快速革新,极大地推动了自主无人系统的发展.目前,自主无人系统正迎来一场以“具身智能”为核心的新一代技术革命.大模型需要借助无人系统的物理实体来实现“具身化”,无人系统可以利用大模型技术来实现“智能化”.本文阐述具身智能自主无人系统的发展现状,详细探讨包含大模型驱动的多模态感知、面向具身任务的推理与决策、基于动态交互的机器人学习与控制、三维场景具身模拟器等具身智能领域的关键技术.最后,指出目前具身智能无人系统所面临的挑战,并展望未来的研究方向. 展开更多
关键词 自主无人系统 具身智能 大语言模型 人工智能
在线阅读 下载PDF
执行器饱和的离散时间多智能体系统有限时域一致性控制
2
作者 王巍 王珂 +2 位作者 黄自鑫 王乐君 穆朝絮 《自动化学报》 北大核心 2025年第3期617-630,共14页
针对执行器饱和的离散时间线性多智能体系统(Multi-agent systems,MASs)有限时域一致性控制问题,将低增益反馈(Low gain feedback,LGF)方法与Q学习相结合,提出采用后向时间迭代的模型无关控制方法.首先,将执行器饱和的有限时域一致性控... 针对执行器饱和的离散时间线性多智能体系统(Multi-agent systems,MASs)有限时域一致性控制问题,将低增益反馈(Low gain feedback,LGF)方法与Q学习相结合,提出采用后向时间迭代的模型无关控制方法.首先,将执行器饱和的有限时域一致性控制问题的求解转化为执行器饱和的单智能体有限时域最优控制问题的求解,并证明可以通过求解修正的时变黎卡提方程(Modified time-varying Riccati equation,MTVRE)实现有限时域最优控制.随后,引入时变参数化Q函数(Time-varying parameterized Q-function,TVPQF),并提出基于Q学习的模型无关后向时间迭代算法,可以更新低增益参数,同时实现逼近求解MTVRE.另外,证明所提迭代求解算法得到的LGF控制矩阵收敛于MTVRE的最优解,也可以实现全局有限时域一致性控制.最后,通过仿真实验结果验证了该方法的有效性. 展开更多
关键词 有限时域一致性控制 执行器饱和 Q函数 模型无关 多智能体系统
在线阅读 下载PDF
基于平行测试的认知自动驾驶智能架构研究 被引量:10
3
作者 王晓 张翔宇 +4 位作者 周锐 田永林 王建功 陈龙 孙长银 《自动化学报》 EI CAS CSCD 北大核心 2024年第2期356-371,共16页
在大数据、云计算和机器学习等新一代人工智能技术的推动下,自动驾驶的感知智能在近年来得到显著的提升与发展.然而,与人类驾驶过程中隐含的以自我目的实现为引导的自探索性和自主性相比,现阶段自动驾驶技术主要以辅助驾驶功能为主,还... 在大数据、云计算和机器学习等新一代人工智能技术的推动下,自动驾驶的感知智能在近年来得到显著的提升与发展.然而,与人类驾驶过程中隐含的以自我目的实现为引导的自探索性和自主性相比,现阶段自动驾驶技术主要以辅助驾驶功能为主,还停留在以被动感知、规划与控制为主的初级智能自动驾驶阶段.为实现车辆智能从数据驱动的环境感知、辅助决策、被动规划到知识驱动的场景认知、推理决策、主动规划的提升,亟需增强车辆自身对复杂外界信息归纳提炼、推理决策、评价估计等类人能力.首先回顾自动驾驶关键技术演化及其应用发展历程;随后分析测试对车辆智能评估的效用;然后基于平行测试理论,提出自动驾驶车辆认知智能训练、测试与评估空间的构建方法,并设计基于平行测试的认知自动驾驶智能训练框架.该项研究工作预期能为推动自动驾驶从感知智能向认知智能的升级提供可行的技术支撑与实现路径. 展开更多
关键词 认知自动驾驶 平行测试 平行驾驶 车辆认知智能
在线阅读 下载PDF
自适应分布式聚合博弈广义纳什均衡算法 被引量:2
4
作者 时侠圣 任璐 孙长银 《自动化学报》 EI CAS CSCD 北大核心 2024年第6期1210-1220,共11页
随着信息物理系统技术的发展,面向多智能体系统的分布式协同优化问题得到广泛研究.主要研究面向多智能体系统的受约束分布式聚合博弈问题,其中局部智能体成本函数受到全局聚合项约束和全局等式耦合约束.首先,面向一阶积分型多智能体系... 随着信息物理系统技术的发展,面向多智能体系统的分布式协同优化问题得到广泛研究.主要研究面向多智能体系统的受约束分布式聚合博弈问题,其中局部智能体成本函数受到全局聚合项约束和全局等式耦合约束.首先,面向一阶积分型多智能体系统设计一种基于估计梯度下降的纳什均衡求解算法.其中,利用多智能体系统平均一致性方法设计一种自适应估计策略,以实现全局聚合项约束分布式估计,并据此计算出梯度函数估计值.其次,利用状态反馈策略和输出反馈策略将上述算法推广至状态信息可测和状态信息不可测一般线性异构多智能体系统.最后,利用拉萨尔不变性原理证实上述算法收敛性,并提供多组案例仿真用以验证算法有效性. 展开更多
关键词 聚合博弈 自适应 比例积分 梯度跟踪 一般线性多智能体系统
在线阅读 下载PDF
基于解空间降维的大规模约束多目标进化算法 被引量:2
5
作者 王朝 黄慧涛 +1 位作者 张晶 邱剑锋 《电子学报》 EI CAS CSCD 北大核心 2023年第11期3120-3127,共8页
针对大规模约束多目标优化问题呈现的高维度和约束限制的解空间,提出一种基于自编码器的解空间降维方法,用以提升进化算法搜索效率.首先,设计一种可行性标签配对策略训练自编码器,通过同时利用解的可行与不可行两类标签信息,构建包含可... 针对大规模约束多目标优化问题呈现的高维度和约束限制的解空间,提出一种基于自编码器的解空间降维方法,用以提升进化算法搜索效率.首先,设计一种可行性标签配对策略训练自编码器,通过同时利用解的可行与不可行两类标签信息,构建包含可行域拓扑信息的降维子空间;其次,在降维后的子空间中进行遗传操作,通过解码器得到重构输出返回原始空间,快速定位潜在的可行区域;最后,设计一种子代自适应生成策略,通过结合在降维空间和原始空间生成的子代优势,防止模型坍塌同时提高搜索效率.在基准测试问题集上与五种先进算法进行对比,实验结果表明所提方法能获得更快的收敛速度和更好的解集质量. 展开更多
关键词 大规模约束多目标优化 进化算法 自编码器 空间降维 子代生成 可行性
在线阅读 下载PDF
基于因果建模的强化学习控制:现状及展望 被引量:6
6
作者 孙悦雯 柳文章 孙长银 《自动化学报》 EI CAS CSCD 北大核心 2023年第3期661-677,共17页
基于因果建模的强化学习技术在智能控制领域越来越受欢迎.因果技术可以挖掘控制系统中的结构性因果知识,并提供了一个可解释的框架,允许人为对系统进行干预并对反馈进行分析.量化干预的效果使智能体能够在复杂的情况下(例如存在混杂因... 基于因果建模的强化学习技术在智能控制领域越来越受欢迎.因果技术可以挖掘控制系统中的结构性因果知识,并提供了一个可解释的框架,允许人为对系统进行干预并对反馈进行分析.量化干预的效果使智能体能够在复杂的情况下(例如存在混杂因子或非平稳环境)评估策略的性能,提升算法的泛化性.本文旨在探讨基于因果建模的强化学习控制技术(以下简称因果强化学习)的最新进展,阐明其与控制系统各个模块的联系.首先介绍了强化学习的基本概念和经典算法,并讨论强化学习算法在变量因果关系解释和迁移场景下策略泛化性方面存在的缺陷.其次,回顾了因果理论的研究方向,主要包括因果效应估计和因果关系发现,这些内容为解决强化学习的缺陷提供了可行方案.接下来,阐释了如何利用因果理论改善强化学习系统的控制与决策,总结了因果强化学习的四类研究方向及进展,并整理了实际应用场景.最后,对全文进行总结,指出了因果强化学习的缺点和待解决问题,并展望了未来的研究方向. 展开更多
关键词 强化学习控制 因果发现 因果推理 迁移学习 表示学习
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部