检索结果-维普期刊中文期刊服务平台

具身智能自主无人系统技术被引量：7: 1; 作者孙长银袁心 +1 位作者王远大柳文章《自动化学报》北大核心 2025年第4期762-777,共16页; 自主无人系统是一类具有自主感知和决策能力的智能系统,在国防安全、航空航天、高性能机器人等方面有着广泛的应用.近年来,基于Transformer架构的各类大模型快速革新,极大地推动了自主无人系统的发展.目前,自主无人系统正迎来一场以“... 展开更多; 关键词自主无人系统具身智能大语言模型人工智能; 在线阅读下载PDF 职称材料

移动机器人导航与对抗控制的强化学习方法研究: 2; 作者蒋坤操菁瑜 +2 位作者柳文章孙长银董璐《控制理论与应用》北大核心 2025年第9期1757-1765,共9页; 传统机器人导航和决策方法过度依赖于高精度地图的构建,且难以适应动态复杂的应用场景.此外,现有基于机器学习算法的导航和控制方法在真实系统中存在着泛化和迁移能力不理想的缺陷.针对上述问题,本文提出了一种基于多模信息融合和强化... 展开更多; 关键词强化学习移动机器人导航避障对抗策略; 在线阅读下载PDF 职称材料

执行器饱和的离散时间多智能体系统有限时域一致性控制: 3; 作者王巍王珂 +2 位作者黄自鑫王乐君穆朝絮《自动化学报》北大核心 2025年第3期617-630,共14页; 针对执行器饱和的离散时间线性多智能体系统(Multi-agent systems,MASs)有限时域一致性控制问题,将低增益反馈(Low gain feedback,LGF)方法与Q学习相结合,提出采用后向时间迭代的模型无关控制方法.首先,将执行器饱和的有限时域一致性控... 展开更多; 关键词有限时域一致性控制执行器饱和 Q函数模型无关多智能体系统; 在线阅读下载PDF 职称材料

基于平行测试的认知自动驾驶智能架构研究被引量：11: 4; 作者王晓张翔宇 +4 位作者周锐田永林王建功陈龙孙长银《自动化学报》 EI CAS CSCD 北大核心 2024年第2期356-371,共16页; 在大数据、云计算和机器学习等新一代人工智能技术的推动下,自动驾驶的感知智能在近年来得到显著的提升与发展.然而,与人类驾驶过程中隐含的以自我目的实现为引导的自探索性和自主性相比,现阶段自动驾驶技术主要以辅助驾驶功能为主,还... 展开更多; 关键词认知自动驾驶平行测试平行驾驶车辆认知智能; 在线阅读下载PDF 职称材料

自适应分布式聚合博弈广义纳什均衡算法被引量：2: 5; 作者时侠圣任璐孙长银《自动化学报》 EI CAS CSCD 北大核心 2024年第6期1210-1220,共11页; 随着信息物理系统技术的发展,面向多智能体系统的分布式协同优化问题得到广泛研究.主要研究面向多智能体系统的受约束分布式聚合博弈问题,其中局部智能体成本函数受到全局聚合项约束和全局等式耦合约束.首先,面向一阶积分型多智能体系... 展开更多; 关键词聚合博弈自适应比例积分梯度跟踪一般线性多智能体系统; 在线阅读下载PDF 职称材料

基于解空间降维的大规模约束多目标进化算法被引量：3: 6; 作者王朝黄慧涛 +1 位作者张晶邱剑锋《电子学报》 EI CAS CSCD 北大核心 2023年第11期3120-3127,共8页; 针对大规模约束多目标优化问题呈现的高维度和约束限制的解空间,提出一种基于自编码器的解空间降维方法,用以提升进化算法搜索效率.首先,设计一种可行性标签配对策略训练自编码器,通过同时利用解的可行与不可行两类标签信息,构建包含可... 展开更多; 关键词大规模约束多目标优化进化算法自编码器空间降维子代生成可行性; 在线阅读下载PDF 职称材料

基于因果建模的强化学习控制:现状及展望被引量：7: 7; 作者孙悦雯柳文章孙长银《自动化学报》 EI CAS CSCD 北大核心 2023年第3期661-677,共17页; 基于因果建模的强化学习技术在智能控制领域越来越受欢迎.因果技术可以挖掘控制系统中的结构性因果知识,并提供了一个可解释的框架,允许人为对系统进行干预并对反馈进行分析.量化干预的效果使智能体能够在复杂的情况下(例如存在混杂因... 展开更多; 关键词强化学习控制因果发现因果推理迁移学习表示学习; 在线阅读下载PDF 职称材料

题名具身智能自主无人系统技术被引量：7: 1; 作者孙长银袁心王远大柳文章; 机构安徽大学自主无人系统技术教育部工程研究中心安徽大学安徽省无人系统与智能技术工程研究中心东南大学自动化学院安徽大学人工智能学院; 出处《自动化学报》北大核心 2025年第4期762-777,共16页; 基金国家自然科学基金创新研究群体(61921004) 国家自然科学基金重点项目(62236002) 国家自然科学基金(62203113)资助。; 文摘自主无人系统是一类具有自主感知和决策能力的智能系统,在国防安全、航空航天、高性能机器人等方面有着广泛的应用.近年来,基于Transformer架构的各类大模型快速革新,极大地推动了自主无人系统的发展.目前,自主无人系统正迎来一场以“具身智能”为核心的新一代技术革命.大模型需要借助无人系统的物理实体来实现“具身化”,无人系统可以利用大模型技术来实现“智能化”.本文阐述具身智能自主无人系统的发展现状,详细探讨包含大模型驱动的多模态感知、面向具身任务的推理与决策、基于动态交互的机器人学习与控制、三维场景具身模拟器等具身智能领域的关键技术.最后,指出目前具身智能无人系统所面临的挑战,并展望未来的研究方向.; 关键词自主无人系统具身智能大语言模型人工智能; Keywords Autonomous unmanned systems embodied intelligence large language models artificial intelligence; 分类号 TP273 [自动化与计算机技术—检测技术与自动化装置] TP18 [自动化与计算机技术—控制理论与控制工程]; 在线阅读下载PDF 职称材料

题名移动机器人导航与对抗控制的强化学习方法研究: 2; 作者蒋坤操菁瑜柳文章孙长银董璐; 机构东南大学自动化学院安徽大学人工智能学院自主无人系统技术教育部工程研究中心安徽省无人系统与智能技术工程研究中心东南大学网络空间安全学院; 出处《控制理论与应用》北大核心 2025年第9期1757-1765,共9页; 基金国家自然科学基金项目(62236002,61921004,62173251)资助.; 文摘传统机器人导航和决策方法过度依赖于高精度地图的构建,且难以适应动态复杂的应用场景.此外,现有基于机器学习算法的导航和控制方法在真实系统中存在着泛化和迁移能力不理想的缺陷.针对上述问题,本文提出了一种基于多模信息融合和强化学习框架的移动机器人导航和实时对抗方法.首先,利用不同类型的信息预处理模块对机器人采集到的RGB图像、激光雷达数据和其他向量信息进行预处理并融合,实现了机器人对环境的全面感知.然后,基于动作网络直接输出机器人运动控制指令,完成了无模型情况下对机器人端到端的控制.进一步的,在仿真系统中充分考虑现实环境中的噪声和动态因素,利用迁移到实体机器人上的测试数据对模型进行微调和修正.最后,在仿真环境和真实搭建的环境中开展不同难度导航和实时对抗任务的实验,验证了所提出的基于强化学习的机器人导航和实时对抗策略的有效性.; 关键词强化学习移动机器人导航避障对抗策略; Keywords reinforcement learning mobile robot navigation and obstacle avoidance confrontation policy; 分类号 TP242 [自动化与计算机技术—检测技术与自动化装置] TP18 [自动化与计算机技术—控制理论与控制工程]; 在线阅读下载PDF 职称材料

题名执行器饱和的离散时间多智能体系统有限时域一致性控制: 3; 作者王巍王珂黄自鑫王乐君穆朝絮; 机构中南财经政法大学信息工程学院天津大学电气自动化与信息工程学院武汉工程大学电气信息学院重庆邮电大学自动化学院安徽大学自主无人系统技术教育部工程研究中心; 出处《自动化学报》北大核心 2025年第3期617-630,共14页; 基金国家自然科学基金(62203009,62473003) 安徽省重点研发计划(2022i01020013) +1 种基金安徽省自然科学基金(2108085QF275)资助。; 文摘针对执行器饱和的离散时间线性多智能体系统(Multi-agent systems,MASs)有限时域一致性控制问题,将低增益反馈(Low gain feedback,LGF)方法与Q学习相结合,提出采用后向时间迭代的模型无关控制方法.首先,将执行器饱和的有限时域一致性控制问题的求解转化为执行器饱和的单智能体有限时域最优控制问题的求解,并证明可以通过求解修正的时变黎卡提方程(Modified time-varying Riccati equation,MTVRE)实现有限时域最优控制.随后,引入时变参数化Q函数(Time-varying parameterized Q-function,TVPQF),并提出基于Q学习的模型无关后向时间迭代算法,可以更新低增益参数,同时实现逼近求解MTVRE.另外,证明所提迭代求解算法得到的LGF控制矩阵收敛于MTVRE的最优解,也可以实现全局有限时域一致性控制.最后,通过仿真实验结果验证了该方法的有效性.; 关键词有限时域一致性控制执行器饱和 Q函数模型无关多智能体系统; Keywords Finite-horizon consensus control actuator saturation Q-function model-free multi-agent systems(MASs); 分类号 TP13 [自动化与计算机技术—控制理论与控制工程]; 在线阅读下载PDF 职称材料

题名基于平行测试的认知自动驾驶智能架构研究被引量：11: 4; 作者王晓张翔宇周锐田永林王建功陈龙孙长银; 机构安徽大学人工智能学院自主无人系统技术教育部工程研究中心安徽省无人系统与智能技术工程研究中心中国科学院自动化研究所复杂系统管理与控制国家重点实验室青岛智能产业技术研究院澳门科技大学创新工程学院系统工程研究所青岛慧拓智能机器有限公司; 出处《自动化学报》 EI CAS CSCD 北大核心 2024年第2期356-371,共16页; 基金广东省重点领域研发计划(2020B0909050003) 国家自然科学基金(62173329)资助。; 文摘在大数据、云计算和机器学习等新一代人工智能技术的推动下,自动驾驶的感知智能在近年来得到显著的提升与发展.然而,与人类驾驶过程中隐含的以自我目的实现为引导的自探索性和自主性相比,现阶段自动驾驶技术主要以辅助驾驶功能为主,还停留在以被动感知、规划与控制为主的初级智能自动驾驶阶段.为实现车辆智能从数据驱动的环境感知、辅助决策、被动规划到知识驱动的场景认知、推理决策、主动规划的提升,亟需增强车辆自身对复杂外界信息归纳提炼、推理决策、评价估计等类人能力.首先回顾自动驾驶关键技术演化及其应用发展历程;随后分析测试对车辆智能评估的效用;然后基于平行测试理论,提出自动驾驶车辆认知智能训练、测试与评估空间的构建方法,并设计基于平行测试的认知自动驾驶智能训练框架.该项研究工作预期能为推动自动驾驶从感知智能向认知智能的升级提供可行的技术支撑与实现路径.; 关键词认知自动驾驶平行测试平行驾驶车辆认知智能; Keywords Cognitive autonomous driving parallel testing parallel driving vehicle cognitive intelligence; 分类号 TP18 [自动化与计算机技术—控制理论与控制工程] U463.6 [机械工程—车辆工程]; 在线阅读下载PDF 职称材料

题名自适应分布式聚合博弈广义纳什均衡算法被引量：2: 5; 作者时侠圣任璐孙长银; 机构安徽大学自主无人系统技术教育部工程研究中心安徽大学安徽省无人系统与智能技术工程研究中心安徽大学人工智能学院; 出处《自动化学报》 EI CAS CSCD 北大核心 2024年第6期1210-1220,共11页; 基金国家自然科学基金创新研究群体科学基金(61921004) 国家自然科学基金重点项目(62236002,62136008) 国家自然科学基金(62303009)资助。; 文摘随着信息物理系统技术的发展,面向多智能体系统的分布式协同优化问题得到广泛研究.主要研究面向多智能体系统的受约束分布式聚合博弈问题,其中局部智能体成本函数受到全局聚合项约束和全局等式耦合约束.首先,面向一阶积分型多智能体系统设计一种基于估计梯度下降的纳什均衡求解算法.其中,利用多智能体系统平均一致性方法设计一种自适应估计策略,以实现全局聚合项约束分布式估计,并据此计算出梯度函数估计值.其次,利用状态反馈策略和输出反馈策略将上述算法推广至状态信息可测和状态信息不可测一般线性异构多智能体系统.最后,利用拉萨尔不变性原理证实上述算法收敛性,并提供多组案例仿真用以验证算法有效性.; 关键词聚合博弈自适应比例积分梯度跟踪一般线性多智能体系统; Keywords Aggregative game adaptive proportional-integral gradient tracking general linear multi-agent system; 分类号 O225 [理学—运筹学与控制论] TP13 [自动化与计算机技术—控制理论与控制工程]; 在线阅读下载PDF 职称材料

题名基于解空间降维的大规模约束多目标进化算法被引量：3: 6; 作者王朝黄慧涛张晶邱剑锋; 机构安徽大学信息材料与智能感知安徽省实验室安徽大学人工智能学院安徽大学自主无人系统技术教育部工程研究中心; 出处《电子学报》 EI CAS CSCD 北大核心 2023年第11期3120-3127,共8页; 基金国家自然科学基金(No.62106002) 安徽省自然科学基金(No.2008085QF308,No.2308085MF201)。; 文摘针对大规模约束多目标优化问题呈现的高维度和约束限制的解空间,提出一种基于自编码器的解空间降维方法,用以提升进化算法搜索效率.首先,设计一种可行性标签配对策略训练自编码器,通过同时利用解的可行与不可行两类标签信息,构建包含可行域拓扑信息的降维子空间;其次,在降维后的子空间中进行遗传操作,通过解码器得到重构输出返回原始空间,快速定位潜在的可行区域;最后,设计一种子代自适应生成策略,通过结合在降维空间和原始空间生成的子代优势,防止模型坍塌同时提高搜索效率.在基准测试问题集上与五种先进算法进行对比,实验结果表明所提方法能获得更快的收敛速度和更好的解集质量.; 关键词大规模约束多目标优化进化算法自编码器空间降维子代生成可行性; Keywords large-scale constrained multi-objective optimization evolutionary algorithms auto-encoder solution space reduction offspring generation feasibility; 分类号 TP18 [自动化与计算机技术—控制理论与控制工程]; 在线阅读下载PDF 职称材料

题名基于因果建模的强化学习控制:现状及展望被引量：7: 7; 作者孙悦雯柳文章孙长银; 机构东南大学自动化学院安徽大学人工智能学院自主无人系统技术教育部工程研究中心安徽省无人系统与智能技术工程研究中心; 出处《自动化学报》 EI CAS CSCD 北大核心 2023年第3期661-677,共17页; 基金国家自然科学基金(62236002,61921004)资助。; 文摘基于因果建模的强化学习技术在智能控制领域越来越受欢迎.因果技术可以挖掘控制系统中的结构性因果知识,并提供了一个可解释的框架,允许人为对系统进行干预并对反馈进行分析.量化干预的效果使智能体能够在复杂的情况下(例如存在混杂因子或非平稳环境)评估策略的性能,提升算法的泛化性.本文旨在探讨基于因果建模的强化学习控制技术(以下简称因果强化学习)的最新进展,阐明其与控制系统各个模块的联系.首先介绍了强化学习的基本概念和经典算法,并讨论强化学习算法在变量因果关系解释和迁移场景下策略泛化性方面存在的缺陷.其次,回顾了因果理论的研究方向,主要包括因果效应估计和因果关系发现,这些内容为解决强化学习的缺陷提供了可行方案.接下来,阐释了如何利用因果理论改善强化学习系统的控制与决策,总结了因果强化学习的四类研究方向及进展,并整理了实际应用场景.最后,对全文进行总结,指出了因果强化学习的缺点和待解决问题,并展望了未来的研究方向.; 关键词强化学习控制因果发现因果推理迁移学习表示学习; Keywords Reinforcement learning control causal discovery causal inference transfer learning representation learning; 分类号 TP181 [自动化与计算机技术—控制理论与控制工程] TP13 [自动化与计算机技术—控制理论与控制工程]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	具身智能自主无人系统技术	孙长银袁心王远大柳文章	《自动化学报》北大核心	2025	7	在线阅读下载PDF 职称材料
2	移动机器人导航与对抗控制的强化学习方法研究	蒋坤操菁瑜柳文章孙长银董璐	《控制理论与应用》北大核心	2025	0	在线阅读下载PDF 职称材料
3	执行器饱和的离散时间多智能体系统有限时域一致性控制	王巍王珂黄自鑫王乐君穆朝絮	《自动化学报》北大核心	2025	0	在线阅读下载PDF 职称材料
4	基于平行测试的认知自动驾驶智能架构研究	王晓张翔宇周锐田永林王建功陈龙孙长银	《自动化学报》 EI CAS CSCD 北大核心	2024	11	在线阅读下载PDF 职称材料
5	自适应分布式聚合博弈广义纳什均衡算法	时侠圣任璐孙长银	《自动化学报》 EI CAS CSCD 北大核心	2024	2	在线阅读下载PDF 职称材料
6	基于解空间降维的大规模约束多目标进化算法	王朝黄慧涛张晶邱剑锋	《电子学报》 EI CAS CSCD 北大核心	2023	3	在线阅读下载PDF 职称材料
7	基于因果建模的强化学习控制:现状及展望	孙悦雯柳文章孙长银	《自动化学报》 EI CAS CSCD 北大核心	2023	7	在线阅读下载PDF 职称材料