期刊文献+
共找到42篇文章
< 1 2 3 >
每页显示 20 50 100
基于概率自动机的操作条件反射计算模型 被引量:3
1
作者 阮晓钢 蔡建羡 戴丽珍 《北京工业大学学报》 EI CAS CSCD 北大核心 2010年第8期1025-1030,共6页
基于概率自动机构造了反应操作条件反射行为的随机学习自动机,以模拟斯金纳(Skinner)鸽子试验.该随机学习自动机是一种能在未知的随机环境中完成自适应决策的智能单元,它与随机环境构成闭环,能在与环境的交互过程中学习选取给予奖赏的... 基于概率自动机构造了反应操作条件反射行为的随机学习自动机,以模拟斯金纳(Skinner)鸽子试验.该随机学习自动机是一种能在未知的随机环境中完成自适应决策的智能单元,它与随机环境构成闭环,能在与环境的交互过程中学习选取给予奖赏的最佳动作.试验结果表明:该自动机模型体现了动物的操作条件反射行为,具有和实际类似的学习效果,对于处理先验知识缺乏或不完备的问题具有优越性. 展开更多
关键词 概率自动机 操作条件反射 随机学习自动机 Skinner鸽子试验 评价机制 学习机制
在线阅读 下载PDF
一种自治操作条件反射自动机 被引量:2
2
作者 阮晓钢 戴丽珍 +1 位作者 于乃功 于建均 《控制理论与应用》 EI CAS CSCD 北大核心 2012年第11期1452-1457,共6页
针对仿生自主学习控制问题,根据自动机的原理,以操作条件反射学习机制为基础,运用仿生的自组织学习方法,提出一种自治操作条件反射自动机(autonomous operant conditioning automata,AOCA)模型,主要包括:操作集合、状态集合、"条件... 针对仿生自主学习控制问题,根据自动机的原理,以操作条件反射学习机制为基础,运用仿生的自组织学习方法,提出一种自治操作条件反射自动机(autonomous operant conditioning automata,AOCA)模型,主要包括:操作集合、状态集合、"条件-操作"规则集合、可观测的状态转移以及操作条件反射学习律;定义了基于AOCA状态取向值的操作熵;给出了AOCA操作熵收敛性证明;分析了AOCA自组织特性;规定了AOCA的递归运行程序.同时,将其应用于斯金纳动物实验的模拟,动物分阶段学习,并且成功习得技能,实验结果表明AOCA实现了模拟操作条件反射学习机制. 展开更多
关键词 自动机理论 自治 操作条件反射 仿生学 自主学习
在线阅读 下载PDF
基于Skinner操作条件反射的两轮机器人自平衡控制 被引量:3
3
作者 任红格 阮晓钢 《控制理论与应用》 EI CAS CSCD 北大核心 2010年第10期1423-1428,共6页
针对两轮自平衡机器人的运动平衡控制问题,采用了基于Skinner操作条件反射理论的自回归神经网络学习算法作为机器人的学习机制,利用自回归神经网络对评价函数进行逼近,以实现对行为决策的优化,从而使机器人能够在无需外部环境模型的情况... 针对两轮自平衡机器人的运动平衡控制问题,采用了基于Skinner操作条件反射理论的自回归神经网络学习算法作为机器人的学习机制,利用自回归神经网络对评价函数进行逼近,以实现对行为决策的优化,从而使机器人能够在无需外部环境模型的情况下,通过学习和训练,获得像人或动物一样的自主学习技能,解决了两轮机器人的运动平衡控制问题.最后分别在无扰动和有扰动的两种状态下设计了仿真实验并进行了比较.结果表明,该操作条件反射学习机制具有较快的自主平衡控制技能和较好的鲁棒性能,体现了较高的理论研究意义和工程应用价值. 展开更多
关键词 Skinner操作条件反射 自回归神经网络 两轮机器人 自平衡控制 鲁棒性
在线阅读 下载PDF
基于遗传算法的Skinner操作条件反射学习模型 被引量:3
4
作者 蔡建羡 阮晓钢 《系统工程与电子技术》 EI CSCD 北大核心 2011年第6期1370-1376,共7页
以概率自动机(probabilistic automata,PA)为平台,结合遗传算法(genetic algorithm,GA)的进化思想,设计了反映Skinner操作条件反射(operant conditioning,OC)思想的仿生学习模型,称为基于遗传算法的操作条件反射概率自动机(genetic algo... 以概率自动机(probabilistic automata,PA)为平台,结合遗传算法(genetic algorithm,GA)的进化思想,设计了反映Skinner操作条件反射(operant conditioning,OC)思想的仿生学习模型,称为基于遗传算法的操作条件反射概率自动机(genetic algorithm-operant conditioning probabilistic automata,GA-OCPA)学习系统。每一次学习尝试之后,首先,学习系统把通过OC学习算法学习得到的信息熵值作为个体适应度;然后,执行遗传算法,搜索最优的个体;最后,再执行OC学习算法学习最优个体内的最优操作行为,以得到新的信息熵值。理论上分析了GA-OCPA学习系统学习算法的收敛性,通过对两轮机器人运动平衡控制的仿真分析,表明设计的GA-OCPA学习系统的学习是一个自动获取知识和提炼的过程,具有高度的自适应能力。 展开更多
关键词 操作条件反射 遗传算法 概率自动机 运动平衡控制
在线阅读 下载PDF
映射领域可自主收缩的操作条件反射自动机 被引量:1
5
作者 蔡建羡 孙旭光 杨秋格 《电机与控制学报》 EI CSCD 北大核心 2012年第9期83-90,共8页
为避免操作条件反射学习模型中存在发生小概率操作行为所引发的不良操作后果,设计了一种映射领域可在线自主收缩移动的操作条件反射自动机,映射领域指机器人各状态映射的操作行为集合,其收缩是通过定义学习误差的界限值和操作行为选取... 为避免操作条件反射学习模型中存在发生小概率操作行为所引发的不良操作后果,设计了一种映射领域可在线自主收缩移动的操作条件反射自动机,映射领域指机器人各状态映射的操作行为集合,其收缩是通过定义学习误差的界限值和操作行为选取的概率阈值两个指标来实现的。对映射领域可自主收缩的操作条件反射学习的收敛性进行了分析,从理论上证明:操作行为熵随映射领域的收缩收敛至极小。针对两轮机器人运动平衡控制的仿真结果表明,映射领域的收缩性使操作条件反射自动机可以在线地在最有意义的映射领域内搜索学习,通过有效的动态的消除无用的映射区域,提高了系统的学习速度和精度。 展开更多
关键词 操作条件反射自动机 映射领域 自主收缩移动 操作行为熵 运动平衡控制
在线阅读 下载PDF
基于操作条件反射自动机的仿生自主学习方法
6
作者 阮晓钢 郜园园 宋洪军 《北京工业大学学报》 EI CAS CSCD 北大核心 2011年第11期1631-1637,共7页
提出了基于操作条件反射的仿生自主学习方法,设计了操作条件反射自动机(OCM)的认知模型.与原来的学习自动机相比,该模型增加了状态取向单元,利用'反应-强化'的学习机理,来模拟自然界生物的'随机应变性'.设计了OCM的递... 提出了基于操作条件反射的仿生自主学习方法,设计了操作条件反射自动机(OCM)的认知模型.与原来的学习自动机相比,该模型增加了状态取向单元,利用'反应-强化'的学习机理,来模拟自然界生物的'随机应变性'.设计了OCM的递归学习算法,用于模拟生物的操作条件反射机制,使其具有仿生的自组织功能,包括自学习和自适应功能.通过模拟Skinner鸽子实验和倒立摆平衡控制实验,验证了该模型具有一定的仿生自主学习能力,可用于描述、模拟和设计各种自组织系统. 展开更多
关键词 操作条件反射自动机 仿生 自主学习 自组织
在线阅读 下载PDF
奖励性操作条件反射实验在学习记忆研究中的应用 被引量:2
7
作者 张亦文 姚彩虹 +3 位作者 孙欣然 陈善广 刘新民 姜宁 《中国实验动物学报》 CAS CSCD 北大核心 2023年第6期802-810,共9页
动物行为学是用于评价动物学习记忆的基本实验手段,广泛应用于生理病理机制研究及药效评价。评价大小鼠学习记忆行为检测方法根据实验原理可分为惩罚性、自发性和奖励性三类,其中奖励性操作条件反射实验是基于奖励性原理和斯金纳条件反... 动物行为学是用于评价动物学习记忆的基本实验手段,广泛应用于生理病理机制研究及药效评价。评价大小鼠学习记忆行为检测方法根据实验原理可分为惩罚性、自发性和奖励性三类,其中奖励性操作条件反射实验是基于奖励性原理和斯金纳条件反射原理的行为学检测方法,为检测动物学习记忆中的高级认知功能提供了一种更全面更精细的检测手段,尤其适合于现代高科技条件下执行复杂操作任务时的认知作业能力评价。本文对奖励性操作性条件反射实验的发展历程、实验装置、实验方法及应用领域等方面进行了概述,为此类方法今后在国内学习记忆行为学领域的研究与应用提供参考。 展开更多
关键词 奖励性操作条件反射 学习记忆 行为学实验 大小鼠
在线阅读 下载PDF
奖励性操作式条件反射任务在大鼠学习记忆研究中的应用 被引量:11
8
作者 石哲 陈善广 +8 位作者 陈玲玲 孙秀萍 宋广青 王琼 常琪 李海清 李莹辉 曲丽娜 刘新民 《中国实验动物学报》 CAS CSCD 2012年第4期9-15,共7页
目的将奖励性操作式条件反射方法应用于学习记忆研究。方法首次采用奖励性操作式条件反射方法,设置单次操作训练、连续多次操作训练、信号辨识与消退四种检测模式,研究Wistar大鼠和SHR大鼠学习记忆能力。结果奖赏训练中,SHR组鼻触次数... 目的将奖励性操作式条件反射方法应用于学习记忆研究。方法首次采用奖励性操作式条件反射方法,设置单次操作训练、连续多次操作训练、信号辨识与消退四种检测模式,研究Wistar大鼠和SHR大鼠学习记忆能力。结果奖赏训练中,SHR组鼻触次数显著增多(vs.Wistar&Donepezil,P<0.05);单次操作训练中,三组动物对操作反应的获得无显著差异;连续多次操作学习任务中,SHR组错误操作次数增多(vs.Wistar,P<0.05),奖赏获得次数减少(vs.Donepezil,P<0.001),反应准确率显著降低(vs.Wistar&Donepezil,P<0.05);信号辨识任务中SHR组错误反应次数显著增多(vs.Wistar&Donepezil,P<0.05),而反应准确率降低,组间差异有显著性(vs.Wistar&Donepezil,P<0.05);消退实验中,三组动物差异无显著性。神经递质检测发现,SHR组大鼠谷氨酸[(1.0639±0.07086)mg/g]、乙酰胆碱[(2.7760±0.2609)μg/g]与五羟色胺[(1.2200±0.1137)μg/g]含量均显著低于Wistar组大鼠(P<0.05),多奈哌齐组大鼠乙酰胆碱含量显著增加[(3.9344±0.2747)μg/g](vs.Wistar,P<0.05;vs.SHR,P<0.001)。结论奖励性操作式条件反射方法可作为一种正性增强条件反射检测新方法应用于大鼠学习记忆研究。 展开更多
关键词 操作条件反射 奖赏 WISTAR大鼠 SHR大鼠 学习记忆
在线阅读 下载PDF
两品系大鼠在经典条件反射和操作式条件反射中的行为学表现 被引量:8
9
作者 王克柱 徐攀 +5 位作者 卢聪 陈怡西 谢磊 李莹辉 曲丽娜 刘新民 《中国实验动物学报》 CAS CSCD 北大核心 2016年第1期65-71,共7页
目的探讨SD、Wistar两种品系大鼠在经典条件反射和操作式条件反射中行为学表现差异,为研究脑的高级功能建立稳定的条件反射动物模型提供实验动物选择依据。方法选择8周龄的正常SD和Wistar大鼠,分别进行奖赏训练、单次操作训练、连续多... 目的探讨SD、Wistar两种品系大鼠在经典条件反射和操作式条件反射中行为学表现差异,为研究脑的高级功能建立稳定的条件反射动物模型提供实验动物选择依据。方法选择8周龄的正常SD和Wistar大鼠,分别进行奖赏训练、单次操作训练、连续多次操作训练三种检测模式,研究SD、Wistar大鼠学习记忆能力。结果奖赏训练中,SD大鼠的鼻触次数显著性增多(vs.Wistar,P<0.05);单次操作训练中,与SD大鼠比较,Wistar大鼠的总踏板次数(LPs)、比率(c LP/LP)显著升高(P<0.05),总鼻触次数(NPs)于第5天差异有显著性,踏板潜伏期明显降低(P<0.05),踏板速率则显著性的升高(P<0.05)。连续多次操作训练中,Wistar大鼠鼻触次数显著性升高(P<0.05),踏板次数、奖赏次数均增多,反应准确率也高于SD大鼠,但组间差异无显著性(P>0.05)。结论经典条件反射阶段SD大鼠对饮水盒的探索能力强,表现出对奖赏物质较强的兴趣;而在奖赏操作条件反射阶段Wistar大鼠的表现优于SD大鼠。 展开更多
关键词 经典条件反射 操作条件反射 SD大鼠 WISTAR大鼠 学习记忆
在线阅读 下载PDF
建立操作式条件反射动物模型的实验性研究 被引量:4
10
作者 乔德才 刘晓莉 《中国运动医学杂志》 CAS CSCD 北大核心 1999年第3期252-253,225,共3页
试图利用家兔在实验箱内建立巩固的操作式条件反射。条件刺激为声音,动物前肢拨动杠杆为操作动作。方法是给予条件刺激(1s)后,要求动物使用前肢拨动杠杆,然后结合食物强化,每天训练4组,每组10次,共40次。结果表明:家兔一般在1... 试图利用家兔在实验箱内建立巩固的操作式条件反射。条件刺激为声音,动物前肢拨动杠杆为操作动作。方法是给予条件刺激(1s)后,要求动物使用前肢拨动杠杆,然后结合食物强化,每天训练4组,每组10次,共40次。结果表明:家兔一般在1~2个训练日即可学会操作动作;首次出现阳性反应需3~7个训练日;大约7~10个训练日便可使家兔建立起巩固的操作式条件反射。实验证明:利用家兔建立较复杂的操作式条件反射是确实可行的。 展开更多
关键词 条件刺激 操作条件反射 阳性反应
在线阅读 下载PDF
操作式条件反射自动监测系统 被引量:1
11
作者 管林初 姚力 +1 位作者 唐鹏威 陈聚瑜 《心理学报》 1986年第3期318-323,共6页
操作式条件反射是在条件信号呈现后,通过有机体自身的某个特定的操作行为而获取食物或回避有害刺激的反射活动。由于操作式条件反射需要动物自身去寻找出一个适当的反应,因此,这种反应便具有一定的主动性。 半个世纪以来,传统的斯金纳... 操作式条件反射是在条件信号呈现后,通过有机体自身的某个特定的操作行为而获取食物或回避有害刺激的反射活动。由于操作式条件反射需要动物自身去寻找出一个适当的反应,因此,这种反应便具有一定的主动性。 半个世纪以来,传统的斯金纳箱在动物的简单的联想学习或条件作用的研究中曾起过积极作用。并且,直到今天,它在神经科学的各个领域,特别是在生理心理学、动物行为学和神经药理学等学科的研究中继续发挥其应有的作用。但是。 展开更多
关键词 操作条件反射 条件信号 单板机 灯光信号 实验箱 动物行为学 行为反应 食物 电刺激 打印机
在线阅读 下载PDF
利用家兔建立操作式条件反射的可行性研究
12
作者 乔德才 刘晓莉 《体育学刊》 CAS 1998年第2期29-31,共3页
本实验是在条件反射箱内训练家兔建立操作式条件反射。训练时给予1s的声音刺激后,要求动物使用前股拨动杠杆,然后结合食物强化,每天训练40次。结果表明:家兔一般在1~2个训练日即可学会操作动作;首次出现阳性反应需3~7个训练日;... 本实验是在条件反射箱内训练家兔建立操作式条件反射。训练时给予1s的声音刺激后,要求动物使用前股拨动杠杆,然后结合食物强化,每天训练40次。结果表明:家兔一般在1~2个训练日即可学会操作动作;首次出现阳性反应需3~7个训练日;大约7~10个训练日便可使家兔建立起巩固的操作式条件反射。(并存在有较大的个体差异)。实验证明:利用家克建立较复杂的操作式条件反射是确实可行的。 展开更多
关键词 操作条件反射 条件刺激 阳性反应
在线阅读 下载PDF
短尾蝮操作性条件反射训练探究 被引量:2
13
作者 朴弋戈 刘杨 +1 位作者 唐业忠 陈勤 《四川动物》 北大核心 2020年第4期361-374,共14页
操作性条件反射训练是研究动物认知行为的重要方法,目前这一方法在经典模式动物中的应用较成熟,但在蛇类等爬行动物上鲜有报道。蝮亚科Crotalinae蛇类特有的红外感知觉系统受到了动物学、神经生物学和仿生学研究的关注,有效的操作性条... 操作性条件反射训练是研究动物认知行为的重要方法,目前这一方法在经典模式动物中的应用较成熟,但在蛇类等爬行动物上鲜有报道。蝮亚科Crotalinae蛇类特有的红外感知觉系统受到了动物学、神经生物学和仿生学研究的关注,有效的操作性条件反射训练是揭示生物红外成像机制的关键方法。本实验以短尾蝮Gloydius brevicaudus为被试动物,采用Y迷宫考察了操作性条件反射训练的3种惩罚刺激方案。训练结果表明,水、高温、敲击刺激均不能使短尾蝮学会将Y迷宫路径选择与目标信号进行稳定关联。研究证明,基于现有惩罚刺激的训练方案对短尾蝮的条件反射习得效果弱于既有研究的其他实验动物。 展开更多
关键词 短尾蝮 惩罚刺激 红外图形识别 操作条件反射 Y迷宫
在线阅读 下载PDF
用微机控制的操作式条件反射实验系统
14
作者 陈聚瑜 姚力 +1 位作者 关敏 管林初 《心理学报》 1988年第1期65-69,共5页
本文介绍了用APPLE—Ⅱ微型计算机控制的操作式条件反射实验系统。系统包括硬件,软件两部分。该系统可同时控制五个实验箱,预先设置实验条件后,可在计算机控制下自动给出刺激信号,并记录实验结果,最后将各项数据在打印机上打印出来。
关键词 实验系统 微机控制 微型计算机控制 接口电路 打印机 操作条件反射 硬件 信号电路 微型机 显示终端
在线阅读 下载PDF
从警犬训练角度辨析斯金纳操作式条件反射理论中名词的修正用法 被引量:2
15
作者 周士兵 翟纯艺 《中国工作犬业》 2023年第1期26-29,共4页
条件反射理论是巴甫洛夫的高级神经活动学说的核心内容,指在一定条件下,外界刺激与有机体反应之间建立起来的暂时神经联系。条件反射为后天形成,有经典条件反射和操作式条件反射两种形式,操作式条件反射亦称“工具性条件反射”,是由美... 条件反射理论是巴甫洛夫的高级神经活动学说的核心内容,指在一定条件下,外界刺激与有机体反应之间建立起来的暂时神经联系。条件反射为后天形成,有经典条件反射和操作式条件反射两种形式,操作式条件反射亦称“工具性条件反射”,是由美国行为主义心理学家斯金纳于20世纪30年代在经典条件反射的基础上创立的理论。他为研究动物的学习行为,采用精确的测量习得反应技术,设计了一种由动物进行操作活动的实验箱(通常称斯金纳箱),用来测定动物完成压杆或按键活动的特定反应。除了可训练大鼠,还可训练猫、家兔和猕猴等实验动物进行该项操作。 展开更多
关键词 暂时神经联系 行为主义心理学 警犬训练 斯金纳箱 经典条件反射 实验箱 实验动物 操作条件反射
在线阅读 下载PDF
古典式条件反射与操作式条件反射之间的关系及应用
16
作者 饶求斌 干稳权 《中国工作犬业》 2001年第6期7-10,共4页
我们知道,犬的条件反射活动有两种表现形式:一种是低级神经活动,即非条件反射;另一种是高级神经活动,即条件反射。非条件反射是犬先天的一种本能行为,是犬一切生存活动的基本反射,是不需要经过后天学习的。条件反射是犬后天获得的一种... 我们知道,犬的条件反射活动有两种表现形式:一种是低级神经活动,即非条件反射;另一种是高级神经活动,即条件反射。非条件反射是犬先天的一种本能行为,是犬一切生存活动的基本反射,是不需要经过后天学习的。条件反射是犬后天获得的一种经验性行为,是发生在犬大脑皮层中暂时性的神经联系,犬能够通过人的口令或手势等获取信号,从而做出相应回答性行为。 展开更多
关键词 操作条件反射 条件反射 性行为 古典式 大脑皮层 条件刺激 无关刺激 学习方式 神经联系 相结合
在线阅读 下载PDF
学习巴氏学说——试谈条件反射与运动训练
17
作者 汪仁和 《体育科学》 CSSCI 北大核心 1997年第4期93-93,共1页
在解释人和动物的随意运动方面巴氏学说具有一定权威性,某种程度上能“自圆其说”,而且有动物实验结果的支持。但是条件反射的大脑机制如何?何为兴奋灶和兴奋扩散、反射中枢?暂时性神经联系又为何物?无疑是有待进一步验证内容,这些验证... 在解释人和动物的随意运动方面巴氏学说具有一定权威性,某种程度上能“自圆其说”,而且有动物实验结果的支持。但是条件反射的大脑机制如何?何为兴奋灶和兴奋扩散、反射中枢?暂时性神经联系又为何物?无疑是有待进一步验证内容,这些验证对于确切认识体育运动本质和运动训练规律将有重要意义。巴氏曾设想,人体感觉器接受内在或外在刺激而产生的神经冲动(兴奋),总是沿着某一通道到达大脑皮层的某个固定点,形成一个“兴奋中心”(兴奋灶)。而不再沿着已有的神经通道去传递,而是按照机械活动的原则。 展开更多
关键词 巴氏学说 运动训练 操作条件反射 兴奋灶 暂时性神经联系 运动员 动力定型 研究与控制 运动技能 训练理论
在线阅读 下载PDF
模糊操作条件概率自动机仿生自主学习系统和机器人自平衡控制 被引量:2
18
作者 阮晓钢 蔡建羡 《控制理论与应用》 EI CAS CSCD 北大核心 2010年第7期960-964,共5页
为了实现两轮机器人的自平衡控制,利用Skinner操作条件反射机理,以概率自动机为平台,融入模糊推理,构造了模糊操作条件概率自动机(OCPA)仿生自主学习系统.该学习系统是一个从状态集合到操作行为集合的随机映射,采用操作条件反射学习机制... 为了实现两轮机器人的自平衡控制,利用Skinner操作条件反射机理,以概率自动机为平台,融入模糊推理,构造了模糊操作条件概率自动机(OCPA)仿生自主学习系统.该学习系统是一个从状态集合到操作行为集合的随机映射,采用操作条件反射学习机制,从操作行为集合中随机学习作为控制系统控制信号的最优行为,并利用学习到的操作行为取向值信息,调整操作条件反射学习算法.此外,学习系统还引入行为熵,以验证其自学习和自组织能力.应用于两轮机器人自平衡控制的仿真结果,验证了模糊OCPA学习系统的可行性. 展开更多
关键词 操作条件反射 概率自动机 模糊推理 仿生自主学习系统 自平衡控制
在线阅读 下载PDF
基于条件反射原理浅析响片在警犬训练中的应用
19
作者 许普之 彭梦华 魏荣兴 《中国工作犬业》 2023年第11期29-31,共3页
现阶段,警犬训练的开展通常基于经典条件反射原理和操作性条件反射原理,响片是基于这两种训练原理而引入到训练中的一种便携高效的工具。由于响片的使用具有奖励的一致性、及时性等诸多优势,越来越多地被广大警犬训导员使用。本文就警... 现阶段,警犬训练的开展通常基于经典条件反射原理和操作性条件反射原理,响片是基于这两种训练原理而引入到训练中的一种便携高效的工具。由于响片的使用具有奖励的一致性、及时性等诸多优势,越来越多地被广大警犬训导员使用。本文就警犬训练中响片的应用及其背后的基本原理逻辑进行初步分析,以期与相关领域专业人士共同探讨训练中响片的深入应用。 展开更多
关键词 警犬训练 操作条件反射 经典条件反射 警犬训导员 专业人士 深入应用 及时性
在线阅读 下载PDF
进化操作行为学习模型及在移动机器人避障上的应用 被引量:4
20
作者 郜园园 朱凡 宋洪军 《计算机应用》 CSCD 北大核心 2013年第8期2283-2288,共6页
针对移动机器人避障上存在的自适应能力较差的问题,结合遗传算法(GA)的进化思想,以自适应启发评价(AHC)学习和操作条件反射(OC)理论为基础,提出了一种基于进化操作行为学习模型(EOBLM)的移动机器人学习避障行为的方法。该方法是一种改进... 针对移动机器人避障上存在的自适应能力较差的问题,结合遗传算法(GA)的进化思想,以自适应启发评价(AHC)学习和操作条件反射(OC)理论为基础,提出了一种基于进化操作行为学习模型(EOBLM)的移动机器人学习避障行为的方法。该方法是一种改进的AHC学习模式,评价单元采用多层前向神经网络来实现,利用TD算法和梯度下降法进行权值更新,这一阶段学习用来生成取向性信息,作为内在动机决定进化的方向;动作选择单元主要用来优化操作行为以实现状态到动作的最佳映射。优化过程分两个阶段来完成,第一阶段通过操作条件反射学习算法得到的信息熵作为个体适应度,执行GA学习算法搜索最优个体;第二阶段由OC学习算法选择最优个体内的最优操作行为,并得到新的信息熵值。通过移动机器人避障仿真实验,结果表明所设计的EOBLM能使机器人通过不断与外界未知环境进行交互主动学会避障的能力,与传统的AHC方法相比其自学习自适应的能力得到加强。 展开更多
关键词 移动机器人 自适应启发评价 操作条件反射 遗传算法 避障
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部