期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
6
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
具身智能自主无人系统技术
被引量:
4
1
作者
孙长银
袁心
+1 位作者
王远大
柳文章
《自动化学报》
北大核心
2025年第4期762-777,共16页
自主无人系统是一类具有自主感知和决策能力的智能系统,在国防安全、航空航天、高性能机器人等方面有着广泛的应用.近年来,基于Transformer架构的各类大模型快速革新,极大地推动了自主无人系统的发展.目前,自主无人系统正迎来一场以“...
自主无人系统是一类具有自主感知和决策能力的智能系统,在国防安全、航空航天、高性能机器人等方面有着广泛的应用.近年来,基于Transformer架构的各类大模型快速革新,极大地推动了自主无人系统的发展.目前,自主无人系统正迎来一场以“具身智能”为核心的新一代技术革命.大模型需要借助无人系统的物理实体来实现“具身化”,无人系统可以利用大模型技术来实现“智能化”.本文阐述具身智能自主无人系统的发展现状,详细探讨包含大模型驱动的多模态感知、面向具身任务的推理与决策、基于动态交互的机器人学习与控制、三维场景具身模拟器等具身智能领域的关键技术.最后,指出目前具身智能无人系统所面临的挑战,并展望未来的研究方向.
展开更多
关键词
自主无人系统
具身智能
大语言模型
人工智能
在线阅读
下载PDF
职称材料
执行器饱和的离散时间多智能体系统有限时域一致性控制
2
作者
王巍
王珂
+2 位作者
黄自鑫
王乐君
穆朝絮
《自动化学报》
北大核心
2025年第3期617-630,共14页
针对执行器饱和的离散时间线性多智能体系统(Multi-agent systems,MASs)有限时域一致性控制问题,将低增益反馈(Low gain feedback,LGF)方法与Q学习相结合,提出采用后向时间迭代的模型无关控制方法.首先,将执行器饱和的有限时域一致性控...
针对执行器饱和的离散时间线性多智能体系统(Multi-agent systems,MASs)有限时域一致性控制问题,将低增益反馈(Low gain feedback,LGF)方法与Q学习相结合,提出采用后向时间迭代的模型无关控制方法.首先,将执行器饱和的有限时域一致性控制问题的求解转化为执行器饱和的单智能体有限时域最优控制问题的求解,并证明可以通过求解修正的时变黎卡提方程(Modified time-varying Riccati equation,MTVRE)实现有限时域最优控制.随后,引入时变参数化Q函数(Time-varying parameterized Q-function,TVPQF),并提出基于Q学习的模型无关后向时间迭代算法,可以更新低增益参数,同时实现逼近求解MTVRE.另外,证明所提迭代求解算法得到的LGF控制矩阵收敛于MTVRE的最优解,也可以实现全局有限时域一致性控制.最后,通过仿真实验结果验证了该方法的有效性.
展开更多
关键词
有限时域一致性控制
执行器饱和
Q函数
模型无关
多智能体系统
在线阅读
下载PDF
职称材料
基于平行测试的认知自动驾驶智能架构研究
被引量:
10
3
作者
王晓
张翔宇
+4 位作者
周锐
田永林
王建功
陈龙
孙长银
《自动化学报》
EI
CAS
CSCD
北大核心
2024年第2期356-371,共16页
在大数据、云计算和机器学习等新一代人工智能技术的推动下,自动驾驶的感知智能在近年来得到显著的提升与发展.然而,与人类驾驶过程中隐含的以自我目的实现为引导的自探索性和自主性相比,现阶段自动驾驶技术主要以辅助驾驶功能为主,还...
在大数据、云计算和机器学习等新一代人工智能技术的推动下,自动驾驶的感知智能在近年来得到显著的提升与发展.然而,与人类驾驶过程中隐含的以自我目的实现为引导的自探索性和自主性相比,现阶段自动驾驶技术主要以辅助驾驶功能为主,还停留在以被动感知、规划与控制为主的初级智能自动驾驶阶段.为实现车辆智能从数据驱动的环境感知、辅助决策、被动规划到知识驱动的场景认知、推理决策、主动规划的提升,亟需增强车辆自身对复杂外界信息归纳提炼、推理决策、评价估计等类人能力.首先回顾自动驾驶关键技术演化及其应用发展历程;随后分析测试对车辆智能评估的效用;然后基于平行测试理论,提出自动驾驶车辆认知智能训练、测试与评估空间的构建方法,并设计基于平行测试的认知自动驾驶智能训练框架.该项研究工作预期能为推动自动驾驶从感知智能向认知智能的升级提供可行的技术支撑与实现路径.
展开更多
关键词
认知自动驾驶
平行测试
平行驾驶
车辆认知智能
在线阅读
下载PDF
职称材料
自适应分布式聚合博弈广义纳什均衡算法
被引量:
2
4
作者
时侠圣
任璐
孙长银
《自动化学报》
EI
CAS
CSCD
北大核心
2024年第6期1210-1220,共11页
随着信息物理系统技术的发展,面向多智能体系统的分布式协同优化问题得到广泛研究.主要研究面向多智能体系统的受约束分布式聚合博弈问题,其中局部智能体成本函数受到全局聚合项约束和全局等式耦合约束.首先,面向一阶积分型多智能体系...
随着信息物理系统技术的发展,面向多智能体系统的分布式协同优化问题得到广泛研究.主要研究面向多智能体系统的受约束分布式聚合博弈问题,其中局部智能体成本函数受到全局聚合项约束和全局等式耦合约束.首先,面向一阶积分型多智能体系统设计一种基于估计梯度下降的纳什均衡求解算法.其中,利用多智能体系统平均一致性方法设计一种自适应估计策略,以实现全局聚合项约束分布式估计,并据此计算出梯度函数估计值.其次,利用状态反馈策略和输出反馈策略将上述算法推广至状态信息可测和状态信息不可测一般线性异构多智能体系统.最后,利用拉萨尔不变性原理证实上述算法收敛性,并提供多组案例仿真用以验证算法有效性.
展开更多
关键词
聚合博弈
自适应
比例积分
梯度跟踪
一般线性多智能体系统
在线阅读
下载PDF
职称材料
基于解空间降维的大规模约束多目标进化算法
被引量:
2
5
作者
王朝
黄慧涛
+1 位作者
张晶
邱剑锋
《电子学报》
EI
CAS
CSCD
北大核心
2023年第11期3120-3127,共8页
针对大规模约束多目标优化问题呈现的高维度和约束限制的解空间,提出一种基于自编码器的解空间降维方法,用以提升进化算法搜索效率.首先,设计一种可行性标签配对策略训练自编码器,通过同时利用解的可行与不可行两类标签信息,构建包含可...
针对大规模约束多目标优化问题呈现的高维度和约束限制的解空间,提出一种基于自编码器的解空间降维方法,用以提升进化算法搜索效率.首先,设计一种可行性标签配对策略训练自编码器,通过同时利用解的可行与不可行两类标签信息,构建包含可行域拓扑信息的降维子空间;其次,在降维后的子空间中进行遗传操作,通过解码器得到重构输出返回原始空间,快速定位潜在的可行区域;最后,设计一种子代自适应生成策略,通过结合在降维空间和原始空间生成的子代优势,防止模型坍塌同时提高搜索效率.在基准测试问题集上与五种先进算法进行对比,实验结果表明所提方法能获得更快的收敛速度和更好的解集质量.
展开更多
关键词
大规模约束多目标优化
进化算法
自编码器
空间降维
子代生成
可行性
在线阅读
下载PDF
职称材料
基于因果建模的强化学习控制:现状及展望
被引量:
6
6
作者
孙悦雯
柳文章
孙长银
《自动化学报》
EI
CAS
CSCD
北大核心
2023年第3期661-677,共17页
基于因果建模的强化学习技术在智能控制领域越来越受欢迎.因果技术可以挖掘控制系统中的结构性因果知识,并提供了一个可解释的框架,允许人为对系统进行干预并对反馈进行分析.量化干预的效果使智能体能够在复杂的情况下(例如存在混杂因...
基于因果建模的强化学习技术在智能控制领域越来越受欢迎.因果技术可以挖掘控制系统中的结构性因果知识,并提供了一个可解释的框架,允许人为对系统进行干预并对反馈进行分析.量化干预的效果使智能体能够在复杂的情况下(例如存在混杂因子或非平稳环境)评估策略的性能,提升算法的泛化性.本文旨在探讨基于因果建模的强化学习控制技术(以下简称因果强化学习)的最新进展,阐明其与控制系统各个模块的联系.首先介绍了强化学习的基本概念和经典算法,并讨论强化学习算法在变量因果关系解释和迁移场景下策略泛化性方面存在的缺陷.其次,回顾了因果理论的研究方向,主要包括因果效应估计和因果关系发现,这些内容为解决强化学习的缺陷提供了可行方案.接下来,阐释了如何利用因果理论改善强化学习系统的控制与决策,总结了因果强化学习的四类研究方向及进展,并整理了实际应用场景.最后,对全文进行总结,指出了因果强化学习的缺点和待解决问题,并展望了未来的研究方向.
展开更多
关键词
强化学习控制
因果发现
因果推理
迁移学习
表示学习
在线阅读
下载PDF
职称材料
题名
具身智能自主无人系统技术
被引量:
4
1
作者
孙长银
袁心
王远大
柳文章
机构
安徽大学
自主无人系统技术教育部工程研究中心
安徽大学安徽省
无人
系统
与智能
技术
工程
研究
中心
东南大学自动化学院
安徽大学人工智能学院
出处
《自动化学报》
北大核心
2025年第4期762-777,共16页
基金
国家自然科学基金创新研究群体(61921004)
国家自然科学基金重点项目(62236002)
国家自然科学基金(62203113)资助。
文摘
自主无人系统是一类具有自主感知和决策能力的智能系统,在国防安全、航空航天、高性能机器人等方面有着广泛的应用.近年来,基于Transformer架构的各类大模型快速革新,极大地推动了自主无人系统的发展.目前,自主无人系统正迎来一场以“具身智能”为核心的新一代技术革命.大模型需要借助无人系统的物理实体来实现“具身化”,无人系统可以利用大模型技术来实现“智能化”.本文阐述具身智能自主无人系统的发展现状,详细探讨包含大模型驱动的多模态感知、面向具身任务的推理与决策、基于动态交互的机器人学习与控制、三维场景具身模拟器等具身智能领域的关键技术.最后,指出目前具身智能无人系统所面临的挑战,并展望未来的研究方向.
关键词
自主无人系统
具身智能
大语言模型
人工智能
Keywords
Autonomous unmanned systems
embodied intelligence
large language models
artificial intelligence
分类号
TP273 [自动化与计算机技术—检测技术与自动化装置]
TP18 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
执行器饱和的离散时间多智能体系统有限时域一致性控制
2
作者
王巍
王珂
黄自鑫
王乐君
穆朝絮
机构
中南财经政法大学信息
工程
学院
天津大学电气自动化与信息
工程
学院
武汉
工程
大学电气信息学院
重庆邮电大学自动化学院
安徽大学
自主无人系统技术教育部工程研究中心
出处
《自动化学报》
北大核心
2025年第3期617-630,共14页
基金
国家自然科学基金(62203009,62473003)
安徽省重点研发计划(2022i01020013)
+1 种基金
安徽省高校协同创新计划(GXXT-2021-010)
安徽省自然科学基金(2108085QF275)资助。
文摘
针对执行器饱和的离散时间线性多智能体系统(Multi-agent systems,MASs)有限时域一致性控制问题,将低增益反馈(Low gain feedback,LGF)方法与Q学习相结合,提出采用后向时间迭代的模型无关控制方法.首先,将执行器饱和的有限时域一致性控制问题的求解转化为执行器饱和的单智能体有限时域最优控制问题的求解,并证明可以通过求解修正的时变黎卡提方程(Modified time-varying Riccati equation,MTVRE)实现有限时域最优控制.随后,引入时变参数化Q函数(Time-varying parameterized Q-function,TVPQF),并提出基于Q学习的模型无关后向时间迭代算法,可以更新低增益参数,同时实现逼近求解MTVRE.另外,证明所提迭代求解算法得到的LGF控制矩阵收敛于MTVRE的最优解,也可以实现全局有限时域一致性控制.最后,通过仿真实验结果验证了该方法的有效性.
关键词
有限时域一致性控制
执行器饱和
Q函数
模型无关
多智能体系统
Keywords
Finite-horizon consensus control
actuator saturation
Q-function
model-free
multi-agent systems(MASs)
分类号
TP13 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
基于平行测试的认知自动驾驶智能架构研究
被引量:
10
3
作者
王晓
张翔宇
周锐
田永林
王建功
陈龙
孙长银
机构
安徽大学人工智能学院
自主无人系统技术教育部工程研究中心
安徽省
无人
系统
与智能
技术
工程
研究
中心
中国科学院自动化
研究
所复杂
系统
管理与控制国家重点实验室
青岛智能产业
技术
研究
院
澳门科技大学创新
工程
学院
系统
工程
研究
所
青岛慧拓智能机器有限公司
出处
《自动化学报》
EI
CAS
CSCD
北大核心
2024年第2期356-371,共16页
基金
广东省重点领域研发计划(2020B0909050003)
国家自然科学基金(62173329)资助。
文摘
在大数据、云计算和机器学习等新一代人工智能技术的推动下,自动驾驶的感知智能在近年来得到显著的提升与发展.然而,与人类驾驶过程中隐含的以自我目的实现为引导的自探索性和自主性相比,现阶段自动驾驶技术主要以辅助驾驶功能为主,还停留在以被动感知、规划与控制为主的初级智能自动驾驶阶段.为实现车辆智能从数据驱动的环境感知、辅助决策、被动规划到知识驱动的场景认知、推理决策、主动规划的提升,亟需增强车辆自身对复杂外界信息归纳提炼、推理决策、评价估计等类人能力.首先回顾自动驾驶关键技术演化及其应用发展历程;随后分析测试对车辆智能评估的效用;然后基于平行测试理论,提出自动驾驶车辆认知智能训练、测试与评估空间的构建方法,并设计基于平行测试的认知自动驾驶智能训练框架.该项研究工作预期能为推动自动驾驶从感知智能向认知智能的升级提供可行的技术支撑与实现路径.
关键词
认知自动驾驶
平行测试
平行驾驶
车辆认知智能
Keywords
Cognitive autonomous driving
parallel testing
parallel driving
vehicle cognitive intelligence
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
U463.6 [机械工程—车辆工程]
在线阅读
下载PDF
职称材料
题名
自适应分布式聚合博弈广义纳什均衡算法
被引量:
2
4
作者
时侠圣
任璐
孙长银
机构
安徽大学
自主无人系统技术教育部工程研究中心
安徽大学安徽省
无人
系统
与智能
技术
工程
研究
中心
安徽大学人工智能学院
出处
《自动化学报》
EI
CAS
CSCD
北大核心
2024年第6期1210-1220,共11页
基金
国家自然科学基金创新研究群体科学基金(61921004)
国家自然科学基金重点项目(62236002,62136008)
国家自然科学基金(62303009)资助。
文摘
随着信息物理系统技术的发展,面向多智能体系统的分布式协同优化问题得到广泛研究.主要研究面向多智能体系统的受约束分布式聚合博弈问题,其中局部智能体成本函数受到全局聚合项约束和全局等式耦合约束.首先,面向一阶积分型多智能体系统设计一种基于估计梯度下降的纳什均衡求解算法.其中,利用多智能体系统平均一致性方法设计一种自适应估计策略,以实现全局聚合项约束分布式估计,并据此计算出梯度函数估计值.其次,利用状态反馈策略和输出反馈策略将上述算法推广至状态信息可测和状态信息不可测一般线性异构多智能体系统.最后,利用拉萨尔不变性原理证实上述算法收敛性,并提供多组案例仿真用以验证算法有效性.
关键词
聚合博弈
自适应
比例积分
梯度跟踪
一般线性多智能体系统
Keywords
Aggregative game
adaptive
proportional-integral
gradient tracking
general linear multi-agent system
分类号
O225 [理学—运筹学与控制论]
TP13 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
基于解空间降维的大规模约束多目标进化算法
被引量:
2
5
作者
王朝
黄慧涛
张晶
邱剑锋
机构
安徽大学信息材料与智能感知安徽省实验室
安徽大学人工智能学院
安徽大学
自主无人系统技术教育部工程研究中心
出处
《电子学报》
EI
CAS
CSCD
北大核心
2023年第11期3120-3127,共8页
基金
国家自然科学基金(No.62106002)
安徽省自然科学基金(No.2008085QF308,No.2308085MF201)。
文摘
针对大规模约束多目标优化问题呈现的高维度和约束限制的解空间,提出一种基于自编码器的解空间降维方法,用以提升进化算法搜索效率.首先,设计一种可行性标签配对策略训练自编码器,通过同时利用解的可行与不可行两类标签信息,构建包含可行域拓扑信息的降维子空间;其次,在降维后的子空间中进行遗传操作,通过解码器得到重构输出返回原始空间,快速定位潜在的可行区域;最后,设计一种子代自适应生成策略,通过结合在降维空间和原始空间生成的子代优势,防止模型坍塌同时提高搜索效率.在基准测试问题集上与五种先进算法进行对比,实验结果表明所提方法能获得更快的收敛速度和更好的解集质量.
关键词
大规模约束多目标优化
进化算法
自编码器
空间降维
子代生成
可行性
Keywords
large-scale constrained multi-objective optimization
evolutionary algorithms
auto-encoder
solution space reduction
offspring generation
feasibility
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
基于因果建模的强化学习控制:现状及展望
被引量:
6
6
作者
孙悦雯
柳文章
孙长银
机构
东南大学自动化学院
安徽大学人工智能学院
自主无人系统技术教育部工程研究中心
安徽省
无人
系统
与智能
技术
工程
研究
中心
出处
《自动化学报》
EI
CAS
CSCD
北大核心
2023年第3期661-677,共17页
基金
国家自然科学基金(62236002,61921004)资助。
文摘
基于因果建模的强化学习技术在智能控制领域越来越受欢迎.因果技术可以挖掘控制系统中的结构性因果知识,并提供了一个可解释的框架,允许人为对系统进行干预并对反馈进行分析.量化干预的效果使智能体能够在复杂的情况下(例如存在混杂因子或非平稳环境)评估策略的性能,提升算法的泛化性.本文旨在探讨基于因果建模的强化学习控制技术(以下简称因果强化学习)的最新进展,阐明其与控制系统各个模块的联系.首先介绍了强化学习的基本概念和经典算法,并讨论强化学习算法在变量因果关系解释和迁移场景下策略泛化性方面存在的缺陷.其次,回顾了因果理论的研究方向,主要包括因果效应估计和因果关系发现,这些内容为解决强化学习的缺陷提供了可行方案.接下来,阐释了如何利用因果理论改善强化学习系统的控制与决策,总结了因果强化学习的四类研究方向及进展,并整理了实际应用场景.最后,对全文进行总结,指出了因果强化学习的缺点和待解决问题,并展望了未来的研究方向.
关键词
强化学习控制
因果发现
因果推理
迁移学习
表示学习
Keywords
Reinforcement learning control
causal discovery
causal inference
transfer learning
representation learning
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
TP13 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
具身智能自主无人系统技术
孙长银
袁心
王远大
柳文章
《自动化学报》
北大核心
2025
4
在线阅读
下载PDF
职称材料
2
执行器饱和的离散时间多智能体系统有限时域一致性控制
王巍
王珂
黄自鑫
王乐君
穆朝絮
《自动化学报》
北大核心
2025
0
在线阅读
下载PDF
职称材料
3
基于平行测试的认知自动驾驶智能架构研究
王晓
张翔宇
周锐
田永林
王建功
陈龙
孙长银
《自动化学报》
EI
CAS
CSCD
北大核心
2024
10
在线阅读
下载PDF
职称材料
4
自适应分布式聚合博弈广义纳什均衡算法
时侠圣
任璐
孙长银
《自动化学报》
EI
CAS
CSCD
北大核心
2024
2
在线阅读
下载PDF
职称材料
5
基于解空间降维的大规模约束多目标进化算法
王朝
黄慧涛
张晶
邱剑锋
《电子学报》
EI
CAS
CSCD
北大核心
2023
2
在线阅读
下载PDF
职称材料
6
基于因果建模的强化学习控制:现状及展望
孙悦雯
柳文章
孙长银
《自动化学报》
EI
CAS
CSCD
北大核心
2023
6
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部