检索结果-维普期刊中文期刊服务平台

基于最大熵深度强化学习的双足机器人步态控制方法被引量：3: 1; 作者李源潮陶重犇王琛《计算机应用》 CSCD 北大核心 2024年第2期445-451,共7页; 针对双足机器人连续直线行走的步态稳定控制问题,提出一种基于最大熵深度强化学习(DRL)的柔性演员-评论家(SAC)步态控制方法。首先,该方法无需事先建立准确的机器人动力学模型,所有参数均来自关节角而无需额外的传感器;其次,采用余弦相... 展开更多; 关键词双足机器人步态控制深度强化学习最大熵柔性演员-评论家算法; 在线阅读下载PDF 职称材料

一种基于DP-KMP的机器人避障交互式学习方法: 2; 作者肖洒吕勇明吴海彬《仪器仪表学报》 CSCD 北大核心 2024年第11期65-78,共14页; 为了使机器人在执行复杂任务时能够及时避开障碍,提出了一种基于DP-KMP的机器人避障交互式学习方法。首先构建了该方法的整体框架,采用分割泛化策略,实现对示教轨迹的快速分段学习和对分段轨迹的避障规划;针对学习阶段,提出了基于DP算... 展开更多; 关键词模仿学习核化运动基元道格拉斯-普克算法轨迹分割人-机器人交互避障; 在线阅读下载PDF 职称材料

基于最大熵强化学习的电网自主拓扑切换控制技术被引量：1: 3; 作者马世乾黄家凯 +3 位作者崇志强韩枭赟徐娜穆朝絮《电力系统及其自动化学报》 CSCD 北大核心 2022年第12期51-60,共10页; 随着新能源装机量逐年提高,电网结构日趋复杂,针对新能源并网后导致的运行安全问题,本文提出一种基于最大熵强化学习的电网自主拓扑切换控制算法,为变电站和输电线提供切换策略。首先设计了基于模仿学习的神经网络预训练方案,提出了模... 展开更多; 关键词最大熵强化学习算法模仿学习-最大熵算法拓扑鲁棒性电网调控运行; 在线阅读下载PDF 职称材料

基于HMFDE和t-SNE的旋转机械故障诊断方法被引量：4: 4; 作者尹久张杰《机电工程》 CAS 北大核心 2024年第6期1058-1067,共10页; 针对旋转机械的故障特征提取较难,以及单一类型的特征无法全面反映故障特性的问题,提出了一种基于混合多尺度波动散布熵(HMFDE)、t分布-随机邻域嵌入(t-SNE)和郊狼优化算法(COA)优化极限学习机(ELM)的旋转机械故障诊断方法。首先,采用... 展开更多; 关键词旋转机械故障诊断齿轮箱滚动轴承混合多尺度波动散布熵 t分布-随机邻域嵌入郊狼优化算法极限学习机; 在线阅读下载PDF 职称材料

题名基于最大熵深度强化学习的双足机器人步态控制方法被引量：3: 1; 作者李源潮陶重犇王琛; 机构苏州科技大学电子与信息工程学院清华大学苏州汽车研究院; 出处《计算机应用》 CSCD 北大核心 2024年第2期445-451,共7页; 基金国家自然科学基金资助项目(62201375) 中国博士后科学基金资助项目(2021M691848) +1 种基金苏州市科技项目(SS2019029)。; 文摘针对双足机器人连续直线行走的步态稳定控制问题,提出一种基于最大熵深度强化学习(DRL)的柔性演员-评论家(SAC)步态控制方法。首先,该方法无需事先建立准确的机器人动力学模型,所有参数均来自关节角而无需额外的传感器;其次,采用余弦相似度方法对经验样本分类,优化经验回放机制;最后,根据知识和经验设计奖励函数,使双足机器人在直线行走训练过程中不断进行姿态调整,确保直线行走的鲁棒性。在Roboschool仿真环境中与其他先进深度强化学习算法,如近端策略优化(PPO)方法和信赖域策略优化(TRPO)方法的实验对比结果表明,所提方法不仅实现了双足机器人快速稳定的直线行走,而且鲁棒性更好。; 关键词双足机器人步态控制深度强化学习最大熵柔性演员-评论家算法; Keywords biped robot gait control deep reinforcement learning maximum entropy Soft Actor-Critic(SAC)algorithm; 分类号 TP242.6 [自动化与计算机技术—检测技术与自动化装置]; 在线阅读下载PDF 职称材料

题名一种基于DP-KMP的机器人避障交互式学习方法: 2; 作者肖洒吕勇明吴海彬; 机构福州大学机械工程及自动化学院; 出处《仪器仪表学报》 CSCD 北大核心 2024年第11期65-78,共14页; 基金国家重点研发计划(2018YFB1308603)项目资助。; 文摘为了使机器人在执行复杂任务时能够及时避开障碍,提出了一种基于DP-KMP的机器人避障交互式学习方法。首先构建了该方法的整体框架,采用分割泛化策略,实现对示教轨迹的快速分段学习和对分段轨迹的避障规划;针对学习阶段,提出了基于DP算法的轨迹分割策略以提高分割效率,并使用高斯混合模型策略提取各子轨迹的参考数据库;针对轨迹规划阶段,使用KMP模型完成轨迹复现与泛化,并引入基于人机交互反馈的参考数据库更新策略,提升了人机交互避障的成功率;针对该更新策略可能失效导致避障轨迹规划失败的问题,提出了两个相应的适用条件用于检验分割生成的子轨迹。最后,通过仿真验证了所述适用条件的有效性;真实实验结果表明,使用所提出的方法分割两个实验的示教轨迹分别仅用时0.084和0.107 s, KUKA协作机器人在执行不同搬运任务的过程中通过与用户的多次交互成功避开了所有静止和突然变化的障碍。; 关键词模仿学习核化运动基元道格拉斯-普克算法轨迹分割人-机器人交互避障; Keywords imitation learning kernelized movement primitives Douglas-Peucker algorithm trajectory segmentation human-robot interaction obstacle avoidance; 分类号 TH89 [机械工程—精密仪器及机械] TP242 [自动化与计算机技术—检测技术与自动化装置]; 在线阅读下载PDF 职称材料

题名基于最大熵强化学习的电网自主拓扑切换控制技术被引量：1: 3; 作者马世乾黄家凯崇志强韩枭赟徐娜穆朝絮; 机构国网天津市电力公司电力科学研究院天津大学电气自动化与信息工程学院; 出处《电力系统及其自动化学报》 CSCD 北大核心 2022年第12期51-60,共10页; 基金国网天津市电力公司科技项目(KJ21-2-01)。; 文摘随着新能源装机量逐年提高,电网结构日趋复杂,针对新能源并网后导致的运行安全问题,本文提出一种基于最大熵强化学习的电网自主拓扑切换控制算法,为变电站和输电线提供切换策略。首先设计了基于模仿学习的神经网络预训练方案,提出了模仿学习-最大熵算法,解决了电网拓扑切换中面临的爆炸性动作组合空间问题和切换导致的脆弱性问题,智能体可在亚秒级内给出控制指令。基于IEEE 45节点算例对所提算法进行仿真验证,结果表明其具有较强的高效性与鲁棒性。; 关键词最大熵强化学习算法模仿学习-最大熵算法拓扑鲁棒性电网调控运行; Keywords soft actor-critic(SAC)algorithm imitation learning soft actor-critic(IL-SAC)algorithm topological robustness regulation and operation of power grid; 分类号 TM73 [电气工程—电力系统及自动化]; 在线阅读下载PDF 职称材料

题名基于HMFDE和t-SNE的旋转机械故障诊断方法被引量：4: 4; 作者尹久张杰; 机构湖北轻工职业技术学院机电工程学院武汉理工大学机电工程学院; 出处《机电工程》 CAS 北大核心 2024年第6期1058-1067,共10页; 基金国家自然科学基金资助项目(51577065)。; 文摘针对旋转机械的故障特征提取较难,以及单一类型的特征无法全面反映故障特性的问题,提出了一种基于混合多尺度波动散布熵(HMFDE)、t分布-随机邻域嵌入(t-SNE)和郊狼优化算法(COA)优化极限学习机(ELM)的旋转机械故障诊断方法。首先,采用特征加权提出了混合多尺度波动散布熵方法,并将其用于提取旋转机械振动信号的故障特征;随后,采用t-SNE方法对混合故障特征进行了特征降维,挑选出了最能够反映故障特性的特征子集,构建了敏感特征样本;最后,采用郊狼优化算法对极限学习机的输入权重和隐含层阈值进行了优化,完成了旋转机械的故障识别和分类;以齿轮箱和滚动轴承故障数据集为对象,对基于HMFDE、t-SNE和COA-ELM的故障诊断方法进行了实验,验证了方法的有效性。研究结果表明:采用HMFDE-t-SNE-CAO-ELM故障诊断方法可以取得100%的故障识别准确率,该方法能够有效地诊断旋转机械的不同故障类型和损伤;相较于基于单一类型特征的故障诊断方法,其准确率分别可以提高0.68%、22.42%、29.18%(齿轮箱)和1.43%、8.23%、23.67%(滚动轴承),虽然牺牲了一定的计算效率,但准确率得到了明显的提高;相较于其他常规故障分类器,COA-ELM的故障识别准确率具有明显的优势。; 关键词旋转机械故障诊断齿轮箱滚动轴承混合多尺度波动散布熵 t分布-随机邻域嵌入郊狼优化算法极限学习机; Keywords rotating machinery fault diagnosis gear box rolling bearing hybrid multi-scale fluctuation dispersion entropy(HMFDE) t-distributed stochastic neighbor embedding(t-SNE) coyote optimization algorithm(COA) extreme learning machine(ELM); 分类号 TH133.3 [机械工程—机械制造及自动化]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	基于最大熵深度强化学习的双足机器人步态控制方法	李源潮陶重犇王琛	《计算机应用》 CSCD 北大核心	2024	3	在线阅读下载PDF 职称材料
2	一种基于DP-KMP的机器人避障交互式学习方法	肖洒吕勇明吴海彬	《仪器仪表学报》 CSCD 北大核心	2024	0	在线阅读下载PDF 职称材料
3	基于最大熵强化学习的电网自主拓扑切换控制技术	马世乾黄家凯崇志强韩枭赟徐娜穆朝絮	《电力系统及其自动化学报》 CSCD 北大核心	2022	1	在线阅读下载PDF 职称材料
4	基于HMFDE和t-SNE的旋转机械故障诊断方法	尹久张杰	《机电工程》 CAS 北大核心	2024	4	在线阅读下载PDF 职称材料