检索结果-维普期刊中文期刊服务平台

面向稀疏奖励的机器人操作技能学习: 1; 作者吴培良张彦 +2 位作者毛秉毅陈雯柏高国伟《控制理论与应用》 EI CAS CSCD 北大核心 2024年第1期99-108,共10页; 基于深度强化学习的机器人操作技能学习成为研究热点,但由于任务的稀疏奖励性质,学习效率较低.本文提出了基于元学习的双经验池自适应软更新事后经验回放方法,并将其应用于稀疏奖励的机器人操作技能学习问题求解.首先,在软更新事后经验... 展开更多; 关键词机器人操作技能学习强化学习稀疏奖励最大熵方法自适应温度参数元学习; 在线阅读下载PDF 职称材料

操作技能学习中成绩反馈对不同成就动机倾向学生后继成绩的影响被引量：4: 2; 作者周亚琴曾芊《广州体育学院学报》北大核心 2003年第2期36-38,共3页; 本研究通过实验室中的双手协调技能学习 ,探讨目标协调或目标差异的成绩反馈对不同成就动机倾向的学生后继操作成绩的影响。结果表明 :( 1)成绩反馈和成就动机倾向都不能独立地影响学生后继成绩的提高或降低。 ( 2 )两种成绩反馈对不同... 展开更多; 关键词体育教育操作技能学习成绩反馈成就动机倾向后继成绩运动心理学; 在线阅读下载PDF 职称材料

基于元生成内在奖励的机器人操作技能学习方法被引量：1: 3; 作者吴培良渠有源 +2 位作者李瑶陈雯柏高国伟《计量学报》 CSCD 北大核心 2023年第6期923-930,共8页; 针对稀疏奖励下,复杂任务学习效率低的问题,在离线策略(off-policy)强化学习思想基础上,提出了元生成内在奖励算法(meta generative intrinsic reward, MGIR),并将其应用在机器人操作技能学习问题求解方面。具体步骤为先使用一个可将复... 展开更多; 关键词计量学机器人操作技能学习稀疏奖励强化学习元学习生成内在奖励; 在线阅读下载PDF 职称材料

智能微装配技术研究综述被引量：6: 4; 作者程俊森吴文荣 +1 位作者杨毅张娟《现代制造工程》 CSCD 北大核心 2022年第6期142-152,共11页; 随着微装配技术的发展,微装配系统的智能化趋势日益明显。介绍了微装配系统智能化的研究背景及国内外相关技术研究成果,结合人工智能技术及机器人技术建立了智能微装配机器人的技术框架。然后对于智能微装配系统中的智能显微机器视觉技... 展开更多; 关键词微装配机器人目标检测操作技能学习智能控制数字化装配; 在线阅读下载PDF 职称材料

题名面向稀疏奖励的机器人操作技能学习: 1; 作者吴培良张彦毛秉毅陈雯柏高国伟; 机构燕山大学信息科学与工程学院河北省计算机虚拟技术与系统集成重点实验室北京信息科技大学自动化学院; 出处《控制理论与应用》 EI CAS CSCD 北大核心 2024年第1期99-108,共10页; 基金国家重点研发计划项目(2018YFB1308300) 国家自然科学基金区域联合基金项目(U20A20167) +1 种基金河北省自然科学基金项目(F202103079)资助.; 文摘基于深度强化学习的机器人操作技能学习成为研究热点,但由于任务的稀疏奖励性质,学习效率较低.本文提出了基于元学习的双经验池自适应软更新事后经验回放方法,并将其应用于稀疏奖励的机器人操作技能学习问题求解.首先,在软更新事后经验回放算法的基础上推导出可以提高算法效率的精简值函数,并加入温度自适应调整策略,动态调整温度参数以适应不同的任务环境;其次,结合元学习思想对经验回放进行分割,训练时动态调整选取真实采样数据和构建虚拟数的比例,提出了DAS-HER方法;然后,将DAS-HER算法应用到机器人操作技能学习中,构建了一个稀疏奖励环境下具有通用性的机器人操作技能学习框架;最后,在Mujoco下的Fetch和Hand环境中,进行了8项任务的对比实验,实验结果表明,无论是在训练效率还是在成功率方面,本文算法表现均优于其他算法.; 关键词机器人操作技能学习强化学习稀疏奖励最大熵方法自适应温度参数元学习; Keywords robot manipulation skills learning reinforcement learning sparse reward maximum entropy methods adaptive temperature parameters meta-learning; 分类号 TP18 [自动化与计算机技术—控制理论与控制工程] TP242 [自动化与计算机技术—检测技术与自动化装置]; 在线阅读下载PDF 职称材料

题名操作技能学习中成绩反馈对不同成就动机倾向学生后继成绩的影响被引量：4: 2; 作者周亚琴曾芊; 机构江苏南通师范学院体育系广州体育学院心理教研室; 出处《广州体育学院学报》北大核心 2003年第2期36-38,共3页; 文摘本研究通过实验室中的双手协调技能学习 ,探讨目标协调或目标差异的成绩反馈对不同成就动机倾向的学生后继操作成绩的影响。结果表明 :( 1)成绩反馈和成就动机倾向都不能独立地影响学生后继成绩的提高或降低。 ( 2 )两种成绩反馈对不同成就动机倾向学生的后继成绩具有不同的影响 ,在目标协调时 ,两类学生的后继成绩非常接近 ;但在目标差异时 ,追求成功者的后继成绩优于避免失败者。; 关键词体育教育操作技能学习成绩反馈成就动机倾向后继成绩运动心理学; Keywords feedback of performance achievement oriented operative skills; 分类号 G804.85 [文化科学—运动人体科学]; 在线阅读下载PDF 职称材料

题名基于元生成内在奖励的机器人操作技能学习方法被引量：1: 3; 作者吴培良渠有源李瑶陈雯柏高国伟; 机构燕山大学信息科学与工程学院河北省计算机虚拟技术与系统集成重点实验室北京信息科技大学自动化学院; 出处《计量学报》 CSCD 北大核心 2023年第6期923-930,共8页; 基金国家重点研发计划(2018YFB1308300) 国家自然科学基金(62276028,U20A20167) +2 种基金北京市自然科学基金(4202026) 河北省自然科学基金(F202103079) 河北省创新能力提升计划(22567626H)。; 文摘针对稀疏奖励下,复杂任务学习效率低的问题,在离线策略(off-policy)强化学习思想基础上,提出了元生成内在奖励算法(meta generative intrinsic reward, MGIR),并将其应用在机器人操作技能学习问题求解方面。具体步骤为先使用一个可将复杂任务分解为多个子任务的元生成内在奖励框架,对子任务进行能力评价;再引入生成内在奖励模块,将智能体探索得到状态的新颖性作为内在奖励,并联合环境奖励共同指导智能体完成对环境的探索和特定任务的学习;最后,在MuJoCo仿真环境Fetch中对离线策略强化学习进行对比实验。实验结果表明,无论是在训练效率还是在成功率方面,提出的元生成内在奖励算法均表现较好。; 关键词计量学机器人操作技能学习稀疏奖励强化学习元学习生成内在奖励; Keywords metrology robot operation skills learning sparse reward reinforcement learning meta learning generative intrinsic reward; 分类号 TB93 [机械工程—测试计量技术及仪器] TB973 [机械工程—测试计量技术及仪器]; 在线阅读下载PDF 职称材料

题名智能微装配技术研究综述被引量：6: 4; 作者程俊森吴文荣杨毅张娟; 机构中国工程物理研究院激光聚变研究中心; 出处《现代制造工程》 CSCD 北大核心 2022年第6期142-152,共11页; 基金国家重点研发计划项目(2019YFB1310905) 国家自然科学基金项目(61803354)。; 文摘随着微装配技术的发展,微装配系统的智能化趋势日益明显。介绍了微装配系统智能化的研究背景及国内外相关技术研究成果,结合人工智能技术及机器人技术建立了智能微装配机器人的技术框架。然后对于智能微装配系统中的智能显微机器视觉技术、智能控制与决策技术和数字化微装配技术取得的研究成果分别进行了综述与总结,对存在的问题与技术难点进行了分析,提出了未来发展的思路。最后对智能微装配技术的发展前景进行了展望。; 关键词微装配机器人目标检测操作技能学习智能控制数字化装配; Keywords micro-assembly robot object detection manipulation skills learning intelligent control digital assembly; 分类号 TP181 [自动化与计算机技术—控制理论与控制工程]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	面向稀疏奖励的机器人操作技能学习	吴培良张彦毛秉毅陈雯柏高国伟	《控制理论与应用》 EI CAS CSCD 北大核心	2024	0	在线阅读下载PDF 职称材料
2	操作技能学习中成绩反馈对不同成就动机倾向学生后继成绩的影响	周亚琴曾芊	《广州体育学院学报》北大核心	2003	4	在线阅读下载PDF 职称材料
3	基于元生成内在奖励的机器人操作技能学习方法	吴培良渠有源李瑶陈雯柏高国伟	《计量学报》 CSCD 北大核心	2023	1	在线阅读下载PDF 职称材料
4	智能微装配技术研究综述	程俊森吴文荣杨毅张娟	《现代制造工程》 CSCD 北大核心	2022	6	在线阅读下载PDF 职称材料