期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
面向稀疏奖励的机器人操作技能学习
1
作者
吴培良
张彦
+2 位作者
毛秉毅
陈雯柏
高国伟
《控制理论与应用》
EI
CAS
CSCD
北大核心
2024年第1期99-108,共10页
基于深度强化学习的机器人操作技能学习成为研究热点,但由于任务的稀疏奖励性质,学习效率较低.本文提出了基于元学习的双经验池自适应软更新事后经验回放方法,并将其应用于稀疏奖励的机器人操作技能学习问题求解.首先,在软更新事后经验...
基于深度强化学习的机器人操作技能学习成为研究热点,但由于任务的稀疏奖励性质,学习效率较低.本文提出了基于元学习的双经验池自适应软更新事后经验回放方法,并将其应用于稀疏奖励的机器人操作技能学习问题求解.首先,在软更新事后经验回放算法的基础上推导出可以提高算法效率的精简值函数,并加入温度自适应调整策略,动态调整温度参数以适应不同的任务环境;其次,结合元学习思想对经验回放进行分割,训练时动态调整选取真实采样数据和构建虚拟数的比例,提出了DAS-HER方法;然后,将DAS-HER算法应用到机器人操作技能学习中,构建了一个稀疏奖励环境下具有通用性的机器人操作技能学习框架;最后,在Mujoco下的Fetch和Hand环境中,进行了8项任务的对比实验,实验结果表明,无论是在训练效率还是在成功率方面,本文算法表现均优于其他算法.
展开更多
关键词
机器人
操作技能学习
强化
学习
稀疏奖励
最大熵方法
自适应温度参数
元
学习
在线阅读
下载PDF
职称材料
操作技能学习中成绩反馈对不同成就动机倾向学生后继成绩的影响
被引量:
4
2
作者
周亚琴
曾芊
《广州体育学院学报》
北大核心
2003年第2期36-38,共3页
本研究通过实验室中的双手协调技能学习 ,探讨目标协调或目标差异的成绩反馈对不同成就动机倾向的学生后继操作成绩的影响。结果表明 :( 1)成绩反馈和成就动机倾向都不能独立地影响学生后继成绩的提高或降低。 ( 2 )两种成绩反馈对不同...
本研究通过实验室中的双手协调技能学习 ,探讨目标协调或目标差异的成绩反馈对不同成就动机倾向的学生后继操作成绩的影响。结果表明 :( 1)成绩反馈和成就动机倾向都不能独立地影响学生后继成绩的提高或降低。 ( 2 )两种成绩反馈对不同成就动机倾向学生的后继成绩具有不同的影响 ,在目标协调时 ,两类学生的后继成绩非常接近 ;但在目标差异时 ,追求成功者的后继成绩优于避免失败者。
展开更多
关键词
体育教育
操作技能学习
成绩反馈
成就动机倾向
后继成绩
运动心理学
在线阅读
下载PDF
职称材料
基于元生成内在奖励的机器人操作技能学习方法
被引量:
1
3
作者
吴培良
渠有源
+2 位作者
李瑶
陈雯柏
高国伟
《计量学报》
CSCD
北大核心
2023年第6期923-930,共8页
针对稀疏奖励下,复杂任务学习效率低的问题,在离线策略(off-policy)强化学习思想基础上,提出了元生成内在奖励算法(meta generative intrinsic reward, MGIR),并将其应用在机器人操作技能学习问题求解方面。具体步骤为先使用一个可将复...
针对稀疏奖励下,复杂任务学习效率低的问题,在离线策略(off-policy)强化学习思想基础上,提出了元生成内在奖励算法(meta generative intrinsic reward, MGIR),并将其应用在机器人操作技能学习问题求解方面。具体步骤为先使用一个可将复杂任务分解为多个子任务的元生成内在奖励框架,对子任务进行能力评价;再引入生成内在奖励模块,将智能体探索得到状态的新颖性作为内在奖励,并联合环境奖励共同指导智能体完成对环境的探索和特定任务的学习;最后,在MuJoCo仿真环境Fetch中对离线策略强化学习进行对比实验。实验结果表明,无论是在训练效率还是在成功率方面,提出的元生成内在奖励算法均表现较好。
展开更多
关键词
计量学
机器人
操作技能学习
稀疏奖励
强化
学习
元
学习
生成内在奖励
在线阅读
下载PDF
职称材料
智能微装配技术研究综述
被引量:
6
4
作者
程俊森
吴文荣
+1 位作者
杨毅
张娟
《现代制造工程》
CSCD
北大核心
2022年第6期142-152,共11页
随着微装配技术的发展,微装配系统的智能化趋势日益明显。介绍了微装配系统智能化的研究背景及国内外相关技术研究成果,结合人工智能技术及机器人技术建立了智能微装配机器人的技术框架。然后对于智能微装配系统中的智能显微机器视觉技...
随着微装配技术的发展,微装配系统的智能化趋势日益明显。介绍了微装配系统智能化的研究背景及国内外相关技术研究成果,结合人工智能技术及机器人技术建立了智能微装配机器人的技术框架。然后对于智能微装配系统中的智能显微机器视觉技术、智能控制与决策技术和数字化微装配技术取得的研究成果分别进行了综述与总结,对存在的问题与技术难点进行了分析,提出了未来发展的思路。最后对智能微装配技术的发展前景进行了展望。
展开更多
关键词
微装配机器人
目标检测
操作技能学习
智能控制
数字化装配
在线阅读
下载PDF
职称材料
题名
面向稀疏奖励的机器人操作技能学习
1
作者
吴培良
张彦
毛秉毅
陈雯柏
高国伟
机构
燕山大学信息科学与工程学院
河北省计算机虚拟技术与系统集成重点实验室
北京信息科技大学自动化学院
出处
《控制理论与应用》
EI
CAS
CSCD
北大核心
2024年第1期99-108,共10页
基金
国家重点研发计划项目(2018YFB1308300)
国家自然科学基金区域联合基金项目(U20A20167)
+1 种基金
北京市自然科学基金项目(4202026)
河北省自然科学基金项目(F202103079)资助.
文摘
基于深度强化学习的机器人操作技能学习成为研究热点,但由于任务的稀疏奖励性质,学习效率较低.本文提出了基于元学习的双经验池自适应软更新事后经验回放方法,并将其应用于稀疏奖励的机器人操作技能学习问题求解.首先,在软更新事后经验回放算法的基础上推导出可以提高算法效率的精简值函数,并加入温度自适应调整策略,动态调整温度参数以适应不同的任务环境;其次,结合元学习思想对经验回放进行分割,训练时动态调整选取真实采样数据和构建虚拟数的比例,提出了DAS-HER方法;然后,将DAS-HER算法应用到机器人操作技能学习中,构建了一个稀疏奖励环境下具有通用性的机器人操作技能学习框架;最后,在Mujoco下的Fetch和Hand环境中,进行了8项任务的对比实验,实验结果表明,无论是在训练效率还是在成功率方面,本文算法表现均优于其他算法.
关键词
机器人
操作技能学习
强化
学习
稀疏奖励
最大熵方法
自适应温度参数
元
学习
Keywords
robot manipulation skills learning
reinforcement learning
sparse reward
maximum entropy methods
adaptive temperature parameters
meta-learning
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
TP242 [自动化与计算机技术—检测技术与自动化装置]
在线阅读
下载PDF
职称材料
题名
操作技能学习中成绩反馈对不同成就动机倾向学生后继成绩的影响
被引量:
4
2
作者
周亚琴
曾芊
机构
江苏南通师范学院体育系
广州体育学院心理教研室
出处
《广州体育学院学报》
北大核心
2003年第2期36-38,共3页
文摘
本研究通过实验室中的双手协调技能学习 ,探讨目标协调或目标差异的成绩反馈对不同成就动机倾向的学生后继操作成绩的影响。结果表明 :( 1)成绩反馈和成就动机倾向都不能独立地影响学生后继成绩的提高或降低。 ( 2 )两种成绩反馈对不同成就动机倾向学生的后继成绩具有不同的影响 ,在目标协调时 ,两类学生的后继成绩非常接近 ;但在目标差异时 ,追求成功者的后继成绩优于避免失败者。
关键词
体育教育
操作技能学习
成绩反馈
成就动机倾向
后继成绩
运动心理学
Keywords
feedback of performance
achievement oriented
operative skills
分类号
G804.85 [文化科学—运动人体科学]
在线阅读
下载PDF
职称材料
题名
基于元生成内在奖励的机器人操作技能学习方法
被引量:
1
3
作者
吴培良
渠有源
李瑶
陈雯柏
高国伟
机构
燕山大学信息科学与工程学院
河北省计算机虚拟技术与系统集成重点实验室
北京信息科技大学自动化学院
出处
《计量学报》
CSCD
北大核心
2023年第6期923-930,共8页
基金
国家重点研发计划(2018YFB1308300)
国家自然科学基金(62276028,U20A20167)
+2 种基金
北京市自然科学基金(4202026)
河北省自然科学基金(F202103079)
河北省创新能力提升计划(22567626H)。
文摘
针对稀疏奖励下,复杂任务学习效率低的问题,在离线策略(off-policy)强化学习思想基础上,提出了元生成内在奖励算法(meta generative intrinsic reward, MGIR),并将其应用在机器人操作技能学习问题求解方面。具体步骤为先使用一个可将复杂任务分解为多个子任务的元生成内在奖励框架,对子任务进行能力评价;再引入生成内在奖励模块,将智能体探索得到状态的新颖性作为内在奖励,并联合环境奖励共同指导智能体完成对环境的探索和特定任务的学习;最后,在MuJoCo仿真环境Fetch中对离线策略强化学习进行对比实验。实验结果表明,无论是在训练效率还是在成功率方面,提出的元生成内在奖励算法均表现较好。
关键词
计量学
机器人
操作技能学习
稀疏奖励
强化
学习
元
学习
生成内在奖励
Keywords
metrology
robot operation skills learning
sparse reward
reinforcement learning
meta learning
generative intrinsic reward
分类号
TB93 [机械工程—测试计量技术及仪器]
TB973 [机械工程—测试计量技术及仪器]
在线阅读
下载PDF
职称材料
题名
智能微装配技术研究综述
被引量:
6
4
作者
程俊森
吴文荣
杨毅
张娟
机构
中国工程物理研究院激光聚变研究中心
出处
《现代制造工程》
CSCD
北大核心
2022年第6期142-152,共11页
基金
国家重点研发计划项目(2019YFB1310905)
国家自然科学基金项目(61803354)。
文摘
随着微装配技术的发展,微装配系统的智能化趋势日益明显。介绍了微装配系统智能化的研究背景及国内外相关技术研究成果,结合人工智能技术及机器人技术建立了智能微装配机器人的技术框架。然后对于智能微装配系统中的智能显微机器视觉技术、智能控制与决策技术和数字化微装配技术取得的研究成果分别进行了综述与总结,对存在的问题与技术难点进行了分析,提出了未来发展的思路。最后对智能微装配技术的发展前景进行了展望。
关键词
微装配机器人
目标检测
操作技能学习
智能控制
数字化装配
Keywords
micro-assembly robot
object detection
manipulation skills learning
intelligent control
digital assembly
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
面向稀疏奖励的机器人操作技能学习
吴培良
张彦
毛秉毅
陈雯柏
高国伟
《控制理论与应用》
EI
CAS
CSCD
北大核心
2024
0
在线阅读
下载PDF
职称材料
2
操作技能学习中成绩反馈对不同成就动机倾向学生后继成绩的影响
周亚琴
曾芊
《广州体育学院学报》
北大核心
2003
4
在线阅读
下载PDF
职称材料
3
基于元生成内在奖励的机器人操作技能学习方法
吴培良
渠有源
李瑶
陈雯柏
高国伟
《计量学报》
CSCD
北大核心
2023
1
在线阅读
下载PDF
职称材料
4
智能微装配技术研究综述
程俊森
吴文荣
杨毅
张娟
《现代制造工程》
CSCD
北大核心
2022
6
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部