-
题名具身智能自主无人系统技术
被引量:4
- 1
-
-
作者
孙长银
袁心
王远大
柳文章
-
机构
安徽大学自主无人系统技术教育部工程研究中心
安徽大学安徽省无人系统与智能技术工程研究中心
东南大学自动化学院
安徽大学人工智能学院
-
出处
《自动化学报》
北大核心
2025年第4期762-777,共16页
-
基金
国家自然科学基金创新研究群体(61921004)
国家自然科学基金重点项目(62236002)
国家自然科学基金(62203113)资助。
-
文摘
自主无人系统是一类具有自主感知和决策能力的智能系统,在国防安全、航空航天、高性能机器人等方面有着广泛的应用.近年来,基于Transformer架构的各类大模型快速革新,极大地推动了自主无人系统的发展.目前,自主无人系统正迎来一场以“具身智能”为核心的新一代技术革命.大模型需要借助无人系统的物理实体来实现“具身化”,无人系统可以利用大模型技术来实现“智能化”.本文阐述具身智能自主无人系统的发展现状,详细探讨包含大模型驱动的多模态感知、面向具身任务的推理与决策、基于动态交互的机器人学习与控制、三维场景具身模拟器等具身智能领域的关键技术.最后,指出目前具身智能无人系统所面临的挑战,并展望未来的研究方向.
-
关键词
自主无人系统
具身智能
大语言模型
人工智能
-
Keywords
Autonomous unmanned systems
embodied intelligence
large language models
artificial intelligence
-
分类号
TP273
[自动化与计算机技术—检测技术与自动化装置]
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于平行测试的认知自动驾驶智能架构研究
被引量:10
- 2
-
-
作者
王晓
张翔宇
周锐
田永林
王建功
陈龙
孙长银
-
机构
安徽大学人工智能学院
自主无人系统技术教育部工程研究中心
安徽省无人系统与智能技术工程研究中心
中国科学院自动化研究所复杂系统管理与控制国家重点实验室
青岛智能产业技术研究院
澳门科技大学创新工程学院系统工程研究所
青岛慧拓智能机器有限公司
-
出处
《自动化学报》
EI
CAS
CSCD
北大核心
2024年第2期356-371,共16页
-
基金
广东省重点领域研发计划(2020B0909050003)
国家自然科学基金(62173329)资助。
-
文摘
在大数据、云计算和机器学习等新一代人工智能技术的推动下,自动驾驶的感知智能在近年来得到显著的提升与发展.然而,与人类驾驶过程中隐含的以自我目的实现为引导的自探索性和自主性相比,现阶段自动驾驶技术主要以辅助驾驶功能为主,还停留在以被动感知、规划与控制为主的初级智能自动驾驶阶段.为实现车辆智能从数据驱动的环境感知、辅助决策、被动规划到知识驱动的场景认知、推理决策、主动规划的提升,亟需增强车辆自身对复杂外界信息归纳提炼、推理决策、评价估计等类人能力.首先回顾自动驾驶关键技术演化及其应用发展历程;随后分析测试对车辆智能评估的效用;然后基于平行测试理论,提出自动驾驶车辆认知智能训练、测试与评估空间的构建方法,并设计基于平行测试的认知自动驾驶智能训练框架.该项研究工作预期能为推动自动驾驶从感知智能向认知智能的升级提供可行的技术支撑与实现路径.
-
关键词
认知自动驾驶
平行测试
平行驾驶
车辆认知智能
-
Keywords
Cognitive autonomous driving
parallel testing
parallel driving
vehicle cognitive intelligence
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
U463.6
[机械工程—车辆工程]
-
-
题名自适应分布式聚合博弈广义纳什均衡算法
被引量:2
- 3
-
-
作者
时侠圣
任璐
孙长银
-
机构
安徽大学自主无人系统技术教育部工程研究中心
安徽大学安徽省无人系统与智能技术工程研究中心
安徽大学人工智能学院
-
出处
《自动化学报》
EI
CAS
CSCD
北大核心
2024年第6期1210-1220,共11页
-
基金
国家自然科学基金创新研究群体科学基金(61921004)
国家自然科学基金重点项目(62236002,62136008)
国家自然科学基金(62303009)资助。
-
文摘
随着信息物理系统技术的发展,面向多智能体系统的分布式协同优化问题得到广泛研究.主要研究面向多智能体系统的受约束分布式聚合博弈问题,其中局部智能体成本函数受到全局聚合项约束和全局等式耦合约束.首先,面向一阶积分型多智能体系统设计一种基于估计梯度下降的纳什均衡求解算法.其中,利用多智能体系统平均一致性方法设计一种自适应估计策略,以实现全局聚合项约束分布式估计,并据此计算出梯度函数估计值.其次,利用状态反馈策略和输出反馈策略将上述算法推广至状态信息可测和状态信息不可测一般线性异构多智能体系统.最后,利用拉萨尔不变性原理证实上述算法收敛性,并提供多组案例仿真用以验证算法有效性.
-
关键词
聚合博弈
自适应
比例积分
梯度跟踪
一般线性多智能体系统
-
Keywords
Aggregative game
adaptive
proportional-integral
gradient tracking
general linear multi-agent system
-
分类号
O225
[理学—运筹学与控制论]
TP13
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于因果建模的强化学习控制:现状及展望
被引量:6
- 4
-
-
作者
孙悦雯
柳文章
孙长银
-
机构
东南大学自动化学院
安徽大学人工智能学院
自主无人系统技术教育部工程研究中心
安徽省无人系统与智能技术工程研究中心
-
出处
《自动化学报》
EI
CAS
CSCD
北大核心
2023年第3期661-677,共17页
-
基金
国家自然科学基金(62236002,61921004)资助。
-
文摘
基于因果建模的强化学习技术在智能控制领域越来越受欢迎.因果技术可以挖掘控制系统中的结构性因果知识,并提供了一个可解释的框架,允许人为对系统进行干预并对反馈进行分析.量化干预的效果使智能体能够在复杂的情况下(例如存在混杂因子或非平稳环境)评估策略的性能,提升算法的泛化性.本文旨在探讨基于因果建模的强化学习控制技术(以下简称因果强化学习)的最新进展,阐明其与控制系统各个模块的联系.首先介绍了强化学习的基本概念和经典算法,并讨论强化学习算法在变量因果关系解释和迁移场景下策略泛化性方面存在的缺陷.其次,回顾了因果理论的研究方向,主要包括因果效应估计和因果关系发现,这些内容为解决强化学习的缺陷提供了可行方案.接下来,阐释了如何利用因果理论改善强化学习系统的控制与决策,总结了因果强化学习的四类研究方向及进展,并整理了实际应用场景.最后,对全文进行总结,指出了因果强化学习的缺点和待解决问题,并展望了未来的研究方向.
-
关键词
强化学习控制
因果发现
因果推理
迁移学习
表示学习
-
Keywords
Reinforcement learning control
causal discovery
causal inference
transfer learning
representation learning
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
TP13
[自动化与计算机技术—控制理论与控制工程]
-