期刊文献+
共找到144篇文章
< 1 2 8 >
每页显示 20 50 100
医疗人工智能:知识引导与数据挖掘联合驱动 被引量:11
1
作者 巫嘉陵 韩建达 《中国现代神经疾病杂志》 CAS 北大核心 2023年第1期1-4,共4页
医疗人工智能将人工智能技术应用于医疗领域,面向临床需求,结合医师临床经验,依靠人工智能技术计算、分析和决策能力,为临床诊断与治疗提供精确的智能辅助。目前医疗人工智能基于知识引导和数据驱动两大类方法,各有优缺点。将知识引导... 医疗人工智能将人工智能技术应用于医疗领域,面向临床需求,结合医师临床经验,依靠人工智能技术计算、分析和决策能力,为临床诊断与治疗提供精确的智能辅助。目前医疗人工智能基于知识引导和数据驱动两大类方法,各有优缺点。将知识引导型和数据驱动型人工智能结合,利用各自优势,有望突破医疗人工智能的应用瓶颈,推进医疗人工智能的发展与创新。本文概述知识引导与数据挖掘联合驱动的医疗人工智能应用进展并展望未来发展方向,以期推动人工智能技术在医疗领域的创新和应用。 展开更多
关键词 人工智能 医学 知识 数据科学 综述
在线阅读 下载PDF
声波操纵微小物体的人工智能实验课程设计 被引量:2
2
作者 孙昊 许丽 +2 位作者 孙青林 孙明玮 焦晓东 《实验室研究与探索》 CAS 北大核心 2023年第4期175-178,共4页
为了直观、快速地引导学生理解人工智能技术概念,并对进一步研究产生兴趣,设计了一种基于声波操纵微小物体的实验课程。该课程介绍了深度学习、强化学习等人工智能技术在声波操纵领域的应用,针对突破传统控制技术解决微小物体操纵方面... 为了直观、快速地引导学生理解人工智能技术概念,并对进一步研究产生兴趣,设计了一种基于声波操纵微小物体的实验课程。该课程介绍了深度学习、强化学习等人工智能技术在声波操纵领域的应用,针对突破传统控制技术解决微小物体操纵方面的瓶颈,为本科生及研究生分别设计了多阶段课程内容,既可对零基础学生进行人工智能技术的介绍和应用教学,也有助于具备一定基础知识的学生开展科技前沿的声波控制方法研究。 展开更多
关键词 声波操纵 人工智能 实验教学 深度学习 强化学习
在线阅读 下载PDF
ASM^(2):面向海空联合场景的多对手多智能体博弈算法
3
作者 王臆淞 赵铭慧 张雪波 《控制理论与应用》 北大核心 2025年第7期1275-1284,共10页
在复杂的海空联合智能博弈环境下,博弈环境态势信息高维且动态变化,对实现异构作战单元协同决策提出了巨大挑战,且当前现有算法多数存在维数爆炸,泛化性差的问题.因此,如何通过有限的博弈环境态势信息,实现异构作战单元协同决策,是亟待... 在复杂的海空联合智能博弈环境下,博弈环境态势信息高维且动态变化,对实现异构作战单元协同决策提出了巨大挑战,且当前现有算法多数存在维数爆炸,泛化性差的问题.因此,如何通过有限的博弈环境态势信息,实现异构作战单元协同决策,是亟待解决的难题.为此,本文提出了能全面有效地表征博弈环境态势信息、指挥控制异构作战单元、引导算法训练方向的海空联合智能博弈问题的形式化建模方式.其次,提出了ASM2海空联合博弈算法,该算法以MAPPO分布式多智能体博弈算法为基础,设计了嵌入Elo评分系统的多对手多智能体训练框架,提升了模型的泛化能力.最后,在兵棋推演仿真平台进行了验证测试,结果表明所提算法训练后的模型能有效应对多种不同专家对手策略,具有较好的可行性和泛化能力,能够推动未来复杂无人装备作战对抗能力的提升. 展开更多
关键词 无人系统智能对抗 兵棋推演 海空联合作战 智能控制 多智能体强化学习
在线阅读 下载PDF
动态事件触发机制下二阶多智能体系统完全分布式控制 被引量:4
4
作者 邓甲 王付永 +1 位作者 刘忠信 陈增强 《控制理论与应用》 EI CAS CSCD 北大核心 2024年第1期11-20,共10页
本文研究了无向通信拓扑下二阶多智能体系统的一致性问题,分别针对有领导者和无领导者的情形,设计了一类基于辅助动态变量的完全分布式事件触发控制策略,该策略具有参数较少且易调等特点.智能体自身的触发函数满足条件时才向邻居广播自... 本文研究了无向通信拓扑下二阶多智能体系统的一致性问题,分别针对有领导者和无领导者的情形,设计了一类基于辅助动态变量的完全分布式事件触发控制策略,该策略具有参数较少且易调等特点.智能体自身的触发函数满足条件时才向邻居广播自身的状态信息,有效避免了连续通信,减少了系统能量耗散.每个智能体的控制协议和触发函数都只用到自身的状态和邻居触发时刻的状态,不涉及邻居的实时状态信息,也不依赖通信拓扑网络的任何全局信息.利用代数图论以及Lyapunov稳定性理论,证明在所提出的控制策略下,二阶多智能体系统能够实现渐近一致性,且不存在Zeno行为.仿真示例进一步验证了理论结果的有效性. 展开更多
关键词 多智能体系统 一致性 动态事件触发控制 完全分布式控制
在线阅读 下载PDF
概率驱动的动态多目标多智能体协同调度进化优化
5
作者 刘晓芳 张军 《计算机应用》 CSCD 北大核心 2024年第5期1372-1377,共6页
在多智能体系统中,协作任务往往动态变化,且存在多个冲突的优化目标,因此动态多目标多智能体协同调度问题已经成为亟须解决的关键问题之一。针对动态环境下多智能体协同调度需求,提出了概率驱动的动态预测策略,旨在有效利用历史环境概... 在多智能体系统中,协作任务往往动态变化,且存在多个冲突的优化目标,因此动态多目标多智能体协同调度问题已经成为亟须解决的关键问题之一。针对动态环境下多智能体协同调度需求,提出了概率驱动的动态预测策略,旨在有效利用历史环境概率分布,预测决策解在新环境的概率分布,从而生成新的多智能体调度方案,实现调度算法在动态环境下的快速响应。具体来讲,设计了基于元素的概率分布表达,以表示解的构成元素在动态环境的适应性,并根据优化算法迭代最优解逐步更新概率分布以趋近实际分布;构建了基于融合的概率分布预测机制,考虑到环境变化的连续性和相关性,当环境变化时,通过融合历史概率分布预测新环境的概率分布,为新环境优化提供先验知识;提出了基于启发式的新解采样机制,结合概率分布和启发式信息,生成解方案以更新过时种群。将概率驱动的动态预测策略嵌入新型的多目标进化算法,获得概率驱动的动态多目标进化算法。在10个动态多目标多智能体协同调度问题实例上,实验结果表明,所提算法在解最优性和多样性上显著优于已有多目标进化算法,所提的概率驱动的动态预测策略能够提高多目标进化算法对动态环境的适应能力。 展开更多
关键词 动态多目标优化 粒子群优化 进化计算 多智能体协同调度 概率驱动
在线阅读 下载PDF
联邦学习在医学图像处理任务中的研究综述 被引量:1
6
作者 刘育铭 代煜 陈公平 《计算机科学》 北大核心 2025年第1期183-193,共11页
在医学领域,由于患者隐私问题,图像很难集中收集和标注,这给深度学习模型的训练和部署带来了较大困难。联邦学习作为一种能有效保护数据隐私的分布式学习框架,能够在参与方不共享数据的基础上进行联合建模,从技术上打破数据孤岛,其凭借... 在医学领域,由于患者隐私问题,图像很难集中收集和标注,这给深度学习模型的训练和部署带来了较大困难。联邦学习作为一种能有效保护数据隐私的分布式学习框架,能够在参与方不共享数据的基础上进行联合建模,从技术上打破数据孤岛,其凭借这些优势在许多行业已经得到广泛应用。由于与医学图像处理的需求高度契合,近年来也涌现出许多应用于医学图像处理的联邦学习研究,然而大部分新的方法仍未被归纳分析,不利于后续的进一步探索。文中对联邦学习进行了简单的介绍,列举了其在医学图像处理方面的部分应用,并根据改进的方向对目前已有的研究进行了分类总结。最后,讨论了目前医学图像方向联邦学习所面临的问题和挑战,并对未来的研究方向进行了展望,希望给后续研究提供一定的帮助。 展开更多
关键词 联邦学习 医学图像 深度学习 图像处理 分布式学习 隐私保护
在线阅读 下载PDF
具有通信时延和有向网络的多智能体分布式优化 被引量:2
7
作者 杨正全 潘小芳 +1 位作者 张青 陈增强 《控制理论与应用》 EI CAS CSCD 北大核心 2021年第9期1414-1420,共7页
本文对非平衡有向拓扑下一阶多智能体系统的分布式优化问题进行研究.研究的智能体在与邻居的通信过程中都有一个变化的时延.本文的目标是找到使得目标函数f(x)=Σ_(i=1 )/Nfi(xi)最小的智能体的状态.提出了一种基于有向图的拉普拉斯矩... 本文对非平衡有向拓扑下一阶多智能体系统的分布式优化问题进行研究.研究的智能体在与邻居的通信过程中都有一个变化的时延.本文的目标是找到使得目标函数f(x)=Σ_(i=1 )/Nfi(xi)最小的智能体的状态.提出了一种基于有向图的拉普拉斯矩阵的零特征值对应的左特征向量和智能体的局部信息的控制器.在这项研究中,去掉了fi(xi)的梯度有界要求,并且不要求网络平衡.在某些假设下,所有智能体都达到相同的状态,同时最小化目标函数Σ_(i=1 )/N fi(xi).最后,通过数值模拟验证了本文的研究结果. 展开更多
关键词 通信时延 多智能体系统 分布式优化 非平衡有向网络
在线阅读 下载PDF
智能控制及其在复杂机电系统的应用专题序言
8
作者 于金鹏 张雪波 +2 位作者 宋锐 穆朝絮 张秀宇 《控制工程》 CSCD 北大核心 2022年第5期769-771,共3页
随着工业4.0的深入发展,面向个性化定制的各行业领域对机电系统提出了新的需求。同时,核心零部件的不断升级也为高性能机电系统在制造业、农业、军事领域及航空航天领域的应用带来了新的机遇。在人工智能2.0时代背景下,信息化、智能化... 随着工业4.0的深入发展,面向个性化定制的各行业领域对机电系统提出了新的需求。同时,核心零部件的不断升级也为高性能机电系统在制造业、农业、军事领域及航空航天领域的应用带来了新的机遇。在人工智能2.0时代背景下,信息化、智能化与网络化的融合日渐紧密,采用智能控制方法解决各类复杂机电系统的高性能控制问题已成为一种有效的分析与控制综合技术。 展开更多
关键词 个性化定制 核心零部件 复杂机电系统 智能控制 应用专题 高性能控制 信息化 网络化
在线阅读 下载PDF
纤维桩全瓷冠修复虚拟仿真实验的应用及评价
9
作者 廖晓玲 李乐 +4 位作者 王鸿鹏 林欣 彭文涛 戴艳梅 陈春霞 《实用口腔医学杂志》 北大核心 2025年第4期572-576,共5页
文章旨在评价自行研发的纤维桩全瓷冠修复虚拟仿真实验软件在口腔专业本科生教学中的应用及效果。共纳入南开大学口腔医学专业55名本科生,采用理论讲授和纤维桩全瓷冠修复虚拟仿真实验教学,课后对学生开展问卷调查进行教学评价。问卷调... 文章旨在评价自行研发的纤维桩全瓷冠修复虚拟仿真实验软件在口腔专业本科生教学中的应用及效果。共纳入南开大学口腔医学专业55名本科生,采用理论讲授和纤维桩全瓷冠修复虚拟仿真实验教学,课后对学生开展问卷调查进行教学评价。问卷调查结果显示,超过半数的学生对虚拟仿真课程非常感兴趣(56.36%),非常有兴趣尝试其他形式的虚拟仿真课程(52.73%),激发了深入学习口腔修复学的兴趣(52.73%)及对未来工作环境的期待(54.55%),并对虚拟仿真效果表示非常满意(52.73%)。大二与大四学生相对比,其中三项调查问题统计数据存在显著性差异(P<0.05),包括是否有兴趣深入学习口腔修复学、对于未来工作的环境是否有所期待及能否清楚了解“牙的基本解剖结构”以及“桩”、“核”、“根管”等基本概念,其余问卷调查结果不同年级不存在显著性差异。由此可见纤维桩全瓷冠修复虚拟仿真系统应用于口腔本科生教学效果良好,可以在不同年级不同教学进度及时机开展,值得在今后的教学工作中推广。 展开更多
关键词 口腔修复学 纤维桩 虚拟仿真 医学教育
在线阅读 下载PDF
带有完全分布式观测器的多智能体系统自适应容错一致性 被引量:4
10
作者 尹艳辉 王付永 +1 位作者 刘忠信 陈增强 《控制理论与应用》 EI CAS CSCD 北大核心 2021年第7期1082-1090,共9页
针对一类同时带有执行器故障,未知非线性动态和非匹配干扰的多智能体系统,本文提出一种新的自适应容错控制方案.首先,设计一种适用于有向切换拓扑的完全分布式观测器估计领导者的信息,将一致性问题转化为局部的信号跟踪问题.其次,拆解... 针对一类同时带有执行器故障,未知非线性动态和非匹配干扰的多智能体系统,本文提出一种新的自适应容错控制方案.首先,设计一种适用于有向切换拓扑的完全分布式观测器估计领导者的信息,将一致性问题转化为局部的信号跟踪问题.其次,拆解转化后的误差系统为两个耦合的子系统,实现非匹配干扰与匹配因子分离.然后,利用径向基神经网络近似非线性动态,并结合反步法设计3种自适应故障补偿器,使系统能够在线补偿故障和未知动态的影响.最后,数值仿真验证了所提方案的有效性. 展开更多
关键词 多智能体系统 容错控制 一致性 自适应故障补偿器 神经网络 反步法
在线阅读 下载PDF
多翼伞系统智能协同控制研究 被引量:1
11
作者 卢伟涛 孙昊 +1 位作者 滕海山 孙青林 《航天返回与遥感》 CSCD 北大核心 2022年第5期36-47,共12页
为了在实际空投任务中实现大规模的物资、装备补给,采用多翼伞协同是未来翼伞空投的重点发展方向,然而基于多体协同的空投方式也提高了控制的复杂度。为实现大规模多翼伞空投系统协同控制,文章采用了多翼伞系统非线性降阶模型,提出了多... 为了在实际空投任务中实现大规模的物资、装备补给,采用多翼伞协同是未来翼伞空投的重点发展方向,然而基于多体协同的空投方式也提高了控制的复杂度。为实现大规模多翼伞空投系统协同控制,文章采用了多翼伞系统非线性降阶模型,提出了多翼伞系统协同控制算法,并对控制器进行了稳定性分析。通过仿真实验与实际翼伞试验,验证了该控制算法在各翼伞个体分散投放的情况下,各翼伞通过局部信息交互获得其邻居翼伞的位置,可在较短时间内实现具有一定的安全间距的编队协同飞行,避免了相互碰撞的风险,最终雀降着陆。文章研究的方法对多翼伞系统协同控制有较好的效果,可为多翼伞系统的进一步研究提供理论参考。 展开更多
关键词 多系统协同 自抗扰控制 空投任务 多翼伞系统
在线阅读 下载PDF
基于Q-learning的离散时间多智能体系统一致性 被引量:8
12
作者 朱志斌 王付永 +2 位作者 尹艳辉 刘忠信 陈增强 《控制理论与应用》 EI CAS CSCD 北大核心 2021年第7期997-1005,共9页
针对模型未知的一类离散时间多智能体系统,本文提出了一种Q-learning方法实现多智能体系统的一致性控制.该方法不依赖于系统模型,能够利用系统数据迭代求解出可使给定目标函数最小的控制律,使所有智能体的状态实现一致.通过各个智能体... 针对模型未知的一类离散时间多智能体系统,本文提出了一种Q-learning方法实现多智能体系统的一致性控制.该方法不依赖于系统模型,能够利用系统数据迭代求解出可使给定目标函数最小的控制律,使所有智能体的状态实现一致.通过各个智能体所产生的系统数据,采用策略迭代的方法实时更新求解得到多智能体系统的控制律,并对所提Q-learning方法进行了收敛性和稳定性分析.最后,论文给出了计算机仿真验证了所提方法的有效性. 展开更多
关键词 多智能体系统 一致性 离散时间 Q-LEARNING
在线阅读 下载PDF
基于深度Q网络的近距空战智能机动决策研究 被引量:4
13
作者 张婷玉 孙明玮 +1 位作者 王永帅 陈增强 《航空兵器》 CSCD 北大核心 2023年第3期41-48,共8页
针对近距空战对抗中无人机机动决策问题,本文基于深度Q网络(DQN)算法的框架,对强化学习奖励函数设计以及超参数的选择问题进行了研究。对于强化学习中的稀疏奖励问题,采用综合角度、距离、高度和速度等空战因素的辅助奖励,能够精确描述... 针对近距空战对抗中无人机机动决策问题,本文基于深度Q网络(DQN)算法的框架,对强化学习奖励函数设计以及超参数的选择问题进行了研究。对于强化学习中的稀疏奖励问题,采用综合角度、距离、高度和速度等空战因素的辅助奖励,能够精确描述空战任务,正确引导智能体的学习方向。同时,针对应用强化学习超参数选择问题,探究了学习率、网络节点数和网络层数对决策系统的影响,并给出较好的参数选择范围,为后续研究参数选择提供参考。空战场景的仿真结果表明,通过训练智能体能够在不同空战态势下学习到较优的机动策略,但对强化学习超参数较敏感。 展开更多
关键词 空战 自主机动决策 深度强化学习 DQN 奖励函数 智能机动 参数选择
在线阅读 下载PDF
非线性耦合多智能体系统组编队跟踪控制 被引量:3
14
作者 杜向阳 李伟勋 +1 位作者 陈增强 张利民 《复杂系统与复杂性科学》 CAS CSCD 北大核心 2022年第4期72-79,共8页
为研究非线性和双积分器耦合领导跟随多智能体系统的组编队控制问题,在处理多智能体系统的分组时,没有基于传统的保守假设(从一个组中的每个节点到其他组中的所有节点的相邻权值之和为零或其他常数),设计了一种新的控制协议。根据李雅... 为研究非线性和双积分器耦合领导跟随多智能体系统的组编队控制问题,在处理多智能体系统的分组时,没有基于传统的保守假设(从一个组中的每个节点到其他组中的所有节点的相邻权值之和为零或其他常数),设计了一种新的控制协议。根据李雅普诺夫稳定性理论和代数图论,分别给出了双积分和非线性器二阶多智能体系统的组编队控制问题的充分条件,使得多智能体系统能够达到期望的几何结构并随着时间维持下去。最后,用两个数值仿真的例子验证了所得结论的有效性。 展开更多
关键词 多智能体系统 组编队控制 非线性系统 双积分器系统 无向拓扑
在线阅读 下载PDF
采用智能算法参数整定的磁流变减摆自抗扰控制 被引量:1
15
作者 董磊 陈增强 +2 位作者 孙明玮 孙青林 黄朝阳 《智能系统学报》 CSCD 北大核心 2022年第5期951-959,共9页
为了提高飞机起飞和降落过程中的稳定性及安全性,采用磁流变阻尼器进行飞机前轮摆振控制。本文描绘了改进的Bouc-wen模型磁流变阻尼器的力学特性,并将之用于一个三自由度的飞机前起落架模型中,而后为此设计了减摆自抗扰控制器(active di... 为了提高飞机起飞和降落过程中的稳定性及安全性,采用磁流变阻尼器进行飞机前轮摆振控制。本文描绘了改进的Bouc-wen模型磁流变阻尼器的力学特性,并将之用于一个三自由度的飞机前起落架模型中,而后为此设计了减摆自抗扰控制器(active disturbance rejection control,ADRC);然后采用混沌分数阶天牛群算法整定优化自抗扰控制器的参数。最后,仿真结果显示经智能算法优化参数后的减摆自抗扰控制器能够较好地控制摆振现象,并且其性能具有一定的鲁棒性。 展开更多
关键词 飞机前起落架 摆振 磁流变阻尼器 改进的Bouc-wen模型 减摆 自抗扰控制 天牛群算法 混沌分数阶天牛群算法 参数优化 鲁棒性
在线阅读 下载PDF
基于持续-保持机制的多智能体系统跟踪控制
16
作者 陈彤彤 王付永 +1 位作者 夏承遗 陈增强 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2023年第12期3321-3327,共7页
考虑到实际应用中,由于外部干扰或通信能力有限,连续通信有时无法保证,研究了间歇通信下二阶多智能体的跟踪控制问题。在持续性通信无法保证的场景下,为了提升间歇通信下系统的收敛性能,引入非周期性的持续-保持控制机制,设计了一种面... 考虑到实际应用中,由于外部干扰或通信能力有限,连续通信有时无法保证,研究了间歇通信下二阶多智能体的跟踪控制问题。在持续性通信无法保证的场景下,为了提升间歇通信下系统的收敛性能,引入非周期性的持续-保持控制机制,设计了一种面向二阶多智能体系统的一致性跟踪控制协议。基于矩阵论和图论知识,并结合双线性变换证明了非周期性间歇通信结构下系统可以实现一致性跟踪,进而得到了针对无向拓扑网络的一致性跟踪条件。仿真实验验证了理论结果的正确性。 展开更多
关键词 二阶多智能体系统 跟踪控制 间歇通信 非周期性持续-保持控制 一致性
在线阅读 下载PDF
神经网络压缩联合优化方法的研究综述 被引量:3
17
作者 宁欣 赵文尧 +4 位作者 宗易昕 张玉贵 陈灏 周琦 马骏骁 《智能系统学报》 CSCD 北大核心 2024年第1期36-57,共22页
随着人工智能应用的实时性、隐私性和安全性需求增大,在边缘计算平台上部署高性能的神经网络成为研究热点。由于常见的边缘计算平台在存储、算力、功耗上均存在限制,因此深度神经网络的端侧部署仍然是一个巨大的挑战。目前,克服上述挑... 随着人工智能应用的实时性、隐私性和安全性需求增大,在边缘计算平台上部署高性能的神经网络成为研究热点。由于常见的边缘计算平台在存储、算力、功耗上均存在限制,因此深度神经网络的端侧部署仍然是一个巨大的挑战。目前,克服上述挑战的一个思路是对现有的神经网络压缩以适配设备部署条件。现阶段常用的模型压缩算法有剪枝、量化、知识蒸馏,多种方法优势互补同时联合压缩可实现更好的压缩加速效果,正成为研究的热点。本文首先对常用的模型压缩算法进行简要概述,然后总结了“知识蒸馏+剪枝”、“知识蒸馏+量化”和“剪枝+量化”3种常见的联合压缩算法,重点分析论述了联合压缩的基本思想和方法,最后提出了神经网络压缩联合优化方法未来的重点发展方向。 展开更多
关键词 神经网络 压缩 剪枝 量化 知识蒸馏 模型压缩 深度学习
在线阅读 下载PDF
基于局部变分贝叶斯推断的分布式交互式多模型估计
18
作者 胡振涛 杨诗博 侯巍 《控制理论与应用》 EI CAS CSCD 北大核心 2024年第4期681-690,共10页
针对目前部分多模型算法预先设定运动模型转移概率矩阵对状态估计精度的不利影响,本文提出了一种基于局部变分贝叶斯推断的分布式交互式多模型估计算法.不同于传统交互式多模型估计中运动模型转移概率矩阵为先验已知的假设条件,在分布... 针对目前部分多模型算法预先设定运动模型转移概率矩阵对状态估计精度的不利影响,本文提出了一种基于局部变分贝叶斯推断的分布式交互式多模型估计算法.不同于传统交互式多模型估计中运动模型转移概率矩阵为先验已知的假设条件,在分布融合估计框架下,首先基于最小化Kullback-Leibler散度准则的递归优化策略实现对运动模型转移概率矩阵的预测与更新;在此基础上,结合变分贝叶斯推断实现对当前时刻目标状态与模型概率的联合估计;最后依据协方差交叉融合策略完成对局部状态估计融合.仿真结果表明:新算法通过对运动模型转移概率矩阵以及模型概率自适应在线估计,有效提升了机动目标的状态估计精度. 展开更多
关键词 机动目标跟踪 变分贝叶斯推断 模型转移概率矩阵 分布式融合 协方差交叉融合
在线阅读 下载PDF
重大装备制造多机器人任务分配与运动规划技术研究综述 被引量:14
19
作者 张振国 毛建旭 +3 位作者 谭浩然 王耀南 张雪波 江一鸣 《自动化学报》 EI CAS CSCD 北大核心 2024年第1期21-41,共21页
飞机蒙皮、船舶舱体、高铁车身等大型复杂部件高效高品质制造是航空航天、海洋舰船、轨道交通等领域重大装备发展的根基.大型复杂部件具有尺寸超大、型面复杂等特点,传统的人工、单机制造面临着效率低、一致性差、空间有限等问题,多机... 飞机蒙皮、船舶舱体、高铁车身等大型复杂部件高效高品质制造是航空航天、海洋舰船、轨道交通等领域重大装备发展的根基.大型复杂部件具有尺寸超大、型面复杂等特点,传统的人工、单机制造面临着效率低、一致性差、空间有限等问题,多机器人具有高鲁棒性、高效性等优点,为大型复杂部件制造提供了良好的制造基础.任务分配与运动规划是多机器人制造系统的决策中枢,其性能影响整个系统的运行效率.考虑到重大装备部件制造任务分配与运动规划过程中任务工序多、冲突干涉多、精度需求高等挑战,本文首先对复杂环境下多机器人任务分配与运动规划的重要性进行了说明;然后阐述了目前主要的任务分配与运动规划方法,包括其在智能制造领域下的应用;在此基础上,对现阶段复杂场景下任务分配和运动规划存在的问题进行了分析,并使用强化学习与混合优化算法等方法提出了解决思路;最后对重大装备大型复杂部件制造过程多机器人任务分配和动态规划技术及应用的发展进行了总结与展望. 展开更多
关键词 重大装备制造 多机器人 任务分配 运动规划
在线阅读 下载PDF
面向机器人系统的虚实迁移强化学习综述 被引量:2
20
作者 林谦 余超 +4 位作者 伍夏威 董银昭 徐昕 张强 郭宪 《软件学报》 EI CSCD 北大核心 2024年第2期711-738,共28页
近年来,基于环境交互的强化学习方法在机器人相关应用领域取得巨大成功,为机器人行为控制策略优化提供一个现实可行的解决方案.但在真实世界中收集交互样本存在高成本以及低效率等问题,因此仿真环境被广泛应用于机器人强化学习训练过程... 近年来,基于环境交互的强化学习方法在机器人相关应用领域取得巨大成功,为机器人行为控制策略优化提供一个现实可行的解决方案.但在真实世界中收集交互样本存在高成本以及低效率等问题,因此仿真环境被广泛应用于机器人强化学习训练过程中.通过在虚拟仿真环境中以较低成本获取大量训练样本进行策略训练,并将学习策略迁移至真实环境,能有效缓解真实机器人训练中存在的安全性、可靠性以及实时性等问题.然而,由于仿真环境与真实环境存在差异,仿真环境中训练得到的策略直接迁移到真实机器人往往难以获得理想的性能表现.针对这一问题,虚实迁移强化学习方法被提出用以缩小环境差异,进而实现有效的策略迁移.按照迁移强化学习过程中信息的流动方向和智能化方法作用的不同对象,提出一个虚实迁移强化学习系统的流程框架,并基于此框架将现有相关工作分为3大类:基于真实环境的模型优化方法、基于仿真环境的知识迁移方法、基于虚实环境的策略迭代提升方法,并对每一分类中的代表技术与关联工作进行阐述.最后,讨论虚实迁移强化学习研究领域面临的机遇和挑战. 展开更多
关键词 强化学习 迁移学习 虚实迁移 现实差距 机器人控制
在线阅读 下载PDF
上一页 1 2 8 下一页 到第
使用帮助 返回顶部