期刊文献+
共找到97篇文章
< 1 2 5 >
每页显示 20 50 100
考虑径流过程矢量化的机器学习洪水预报模型 被引量:10
1
作者 刘成帅 解添宁 +4 位作者 李文忠 胡彩虹 徐源浩 牛超杰 余其鹰 《水科学进展》 EI CAS CSCD 北大核心 2024年第3期420-429,共10页
准确的超前洪水预报有利于开展防洪减灾工作和优化水资源调度。本文提出一种针对场次洪水的径流过程矢量化方法(Runoff Process Vectorization, RPV),并耦合3种机器学习(Machine Learning, ML)模型构建了RPV-ML洪水预报系列模型。以黄... 准确的超前洪水预报有利于开展防洪减灾工作和优化水资源调度。本文提出一种针对场次洪水的径流过程矢量化方法(Runoff Process Vectorization, RPV),并耦合3种机器学习(Machine Learning, ML)模型构建了RPV-ML洪水预报系列模型。以黄河中上游孤山川、佳芦河和祖厉河3个典型流域为研究区,分别基于43、28、37场洪水的降雨径流数据,按照洪水场次7∶3的比例进行模型训练和验证。研究表明:(1)相同预见期条件下RPV-ML模型在孤山川、佳芦河和祖厉河流域洪水预报纳什效率系数更高、均方根误差和洪峰相对误差更低,RPV-ML模型比ML模型具有更好的预报性能,在预见期为4~6 h时优势更显著;(2) RPV-ML和ML模型预报精度会随着预见期增加逐渐下降,但RPV-ML预报精度呈现缓慢下降趋势,具有更好的鲁棒性;(3)基于RPV改进的时间卷积网络(Temporal Convolutional Network, TCN)可以更好地克服预报误差问题,RPV-TCN模型在3个流域预报性能最好。 展开更多
关键词 洪水预报 径流过程矢量 机器学习 RPV-ML模型 黄河中上游
在线阅读 下载PDF
基于对比学习的矢量化特征空间嵌入聚类
2
作者 郑洋 吴永明 徐岸 《计算机工程与应用》 CSCD 北大核心 2024年第4期211-219,共9页
深度嵌入聚类(deep embedding clustering,DEC)算法只通过自编码器,以单一实例重构的方式将数据嵌入到低维矢量化特征空间中进行聚类,而忽略了不同实例之间的关系,导致可能无法很好地区分嵌入空间中的实例。针对上述问题,提出基于对比... 深度嵌入聚类(deep embedding clustering,DEC)算法只通过自编码器,以单一实例重构的方式将数据嵌入到低维矢量化特征空间中进行聚类,而忽略了不同实例之间的关系,导致可能无法很好地区分嵌入空间中的实例。针对上述问题,提出基于对比学习的矢量化特征空间嵌入聚类(vectorized feature space embedded clustering based on contrastive learning,VECCL)方法。通过对比学习以辨识数据实例之间异同性的方式,从数据中提取出具有同近异远聚类语义的特征,并作为先验知识带入DEC中,引导自编码器初始化带有深层数据信息的低维聚类特征空间。同时利用软分类标签构造熵损失,与自编码器的重构损失一起作为正则化项引入聚类损失函数中,共同细化聚类。实验结果表明,所提方法提取特征的能力更强,与DEC方法在数据集CIFAR10、CIFAR100和STL10上的实验结果相比,ACC分别提升48.1个百分点、23.1个百分点和41.8个百分点,NMI分别提升41.0个百分点、25.2个百分点和39.0个百分点,ARI分别提升45.4个百分点、16.4个百分点和41.8个百分点。 展开更多
关键词 深度聚类 对比学习 自编码器 矢量化特征空间 嵌入聚类
在线阅读 下载PDF
基于学习矢量量化(LVQ)神经网络的雷达体制识别 被引量:4
3
作者 李锦东 张洪才 +1 位作者 梁彦 潘泉 《火力与指挥控制》 CSCD 北大核心 2006年第9期30-33,共4页
由于现代战争中雷达体制的多样化、复杂化及其综合应用使得雷达体制识别中要处理大量复杂的高维数据,学习矢量量化(LVQ)神经网络不仅能处理有监督分类,而且相对于其他神经网络能以较小的计算量处理大量输入数据,所以采用LVQ对雷达体制... 由于现代战争中雷达体制的多样化、复杂化及其综合应用使得雷达体制识别中要处理大量复杂的高维数据,学习矢量量化(LVQ)神经网络不仅能处理有监督分类,而且相对于其他神经网络能以较小的计算量处理大量输入数据,所以采用LVQ对雷达体制进行识别,同时针对LVQ学习速率的变化可能引起学习算法不稳定,采用修正的学习速率算法。在简要介绍雷达体制和LVQ的基础上构造了LVQ神经网络对雷达体制进行分类。通过与径向基神经网络(RBFN)识别算法的仿真对比,证实了方法的有效性。 展开更多
关键词 学习矢量量化 雷达体制 电子战
在线阅读 下载PDF
一种基于增量学习型矢量量化的有效文本分类算法 被引量:14
4
作者 王修君 沈鸿 《计算机学报》 EI CSCD 北大核心 2007年第8期1277-1285,共9页
KNN作为一种简单的分类方法在文本分类中有广泛的应用,但存在着计算量大和训练文档分布不均所造成的分类准确率下降等问题.针对这些问题,基于最小化学习误差的增量思想,该文将学习型矢量量化(LVQ)和生长型神经气(GNG)结合起来提出一种... KNN作为一种简单的分类方法在文本分类中有广泛的应用,但存在着计算量大和训练文档分布不均所造成的分类准确率下降等问题.针对这些问题,基于最小化学习误差的增量思想,该文将学习型矢量量化(LVQ)和生长型神经气(GNG)结合起来提出一种新的增量学习型矢量量化方法,并将其应用到文本分类中.文中提出的算法对所有的训练样本有选择性地进行一次训练就可以生成有效的代表样本集,具有较强的学习能力.实验结果表明:这种方法不仅可以降低KNN方法的测试时间,而且可以保持甚至提高分类的准确性. 展开更多
关键词 学习矢量量化(lvq) 生长型神经气(GNG) 学习误差 类间距离 学习概率
在线阅读 下载PDF
学习矢量量化算法的性能分析 被引量:6
5
作者 朱策 厉力华 +1 位作者 王太君 何振亚 《电子学报》 EI CAS CSCD 北大核心 1995年第7期59-63,共5页
本文针对学习矢量量化算法Ⅰ型和Ⅱ型(LVQ1、LVQ2)进行了深入的分析研究,取得了以下结果:(1)对应于LVQ1算法,提出了一种选取学习步长的优化方案;(2)得到了LVQ1算法关于线性可分模式分类问题的一个重要结论... 本文针对学习矢量量化算法Ⅰ型和Ⅱ型(LVQ1、LVQ2)进行了深入的分析研究,取得了以下结果:(1)对应于LVQ1算法,提出了一种选取学习步长的优化方案;(2)得到了LVQ1算法关于线性可分模式分类问题的一个重要结论;(3)严格推导出LVQ2算法实质上是一种使分类错误减小的梯度下降法;(4)得出了LVQ2算法对于类间混叠的模式分类问题不存在稳定平衡状态这一重要结论;(5)针对LVQ2算法处理类间混叠模式分类问题的缺陷,提出了一种有效的LVQ2修正算法. 展开更多
关键词 学习矢量量化 算法 学习步长 模式分类
在线阅读 下载PDF
对学习矢量量化神经网络中“死”点问题的研究 被引量:6
6
作者 冯乃勤 南书坡 郭战杰 《计算机工程与应用》 CSCD 北大核心 2009年第4期64-66,共3页
竞争型神经网络已经在模式识别、分类等方面得到了广泛的应用,与传统的聚类方法相比具有巨大优势,但是在许多方面还存在不足,需要进一步完善。在Kohonen提出的学习矢量量化网络(Learning Vector Quantization Network,LVQ)的基础上,引... 竞争型神经网络已经在模式识别、分类等方面得到了广泛的应用,与传统的聚类方法相比具有巨大优势,但是在许多方面还存在不足,需要进一步完善。在Kohonen提出的学习矢量量化网络(Learning Vector Quantization Network,LVQ)的基础上,引入阈值学习规则,较好地解决了该类网络中遇到"死"点时训练误差偏大的问题,最后通过Matlab编程实现。 展开更多
关键词 学习矢量量化网络 阈值 死点
在线阅读 下载PDF
基于样本密度和分类误差率的增量学习矢量量化算法研究 被引量:10
7
作者 李娟 王宇平 《自动化学报》 EI CSCD 北大核心 2015年第6期1187-1200,共14页
作为一种简单而成熟的分类方法,K最近邻(K nearest neighbor,KNN)算法在数据挖掘、模式识别等领域获得了广泛的应用,但仍存在计算量大、高空间消耗、运行时间长等问题.针对这些问题,本文在增量学习型矢量量化(Incremental learning vect... 作为一种简单而成熟的分类方法,K最近邻(K nearest neighbor,KNN)算法在数据挖掘、模式识别等领域获得了广泛的应用,但仍存在计算量大、高空间消耗、运行时间长等问题.针对这些问题,本文在增量学习型矢量量化(Incremental learning vector quantization,ILVQ)的单层竞争学习基础上,融合样本密度和分类误差率的邻域思想,提出了一种新的增量学习型矢量量化方法,通过竞争学习策略对代表点邻域实现自适应增删、合并、分裂等操作,快速获取原始数据集的原型集,进而在保障分类精度基础上,达到对大规模数据的高压缩效应.此外,对传统近邻分类算法进行了改进,将原型近邻集的样本密度和分类误差率纳入到近邻判决准则中.所提出算法通过单遍扫描学习训练集可快速生成有效的代表原型集,具有较好的通用性.实验结果表明,该方法同其他算法相比较,不仅可以保持甚至提高分类的准确性和压缩比,且具有快速分类的优势. 展开更多
关键词 学习矢量量化 增量学习 分类误差率 样本密度 合并 分裂
在线阅读 下载PDF
基于学习矢量量化神经网络的水稻白穗和正常穗的高光谱识别 被引量:18
8
作者 刘占宇 孙华生 黄敬峰 《中国水稻科学》 CAS CSCD 北大核心 2007年第6期664-668,共5页
水稻病虫害的发生会导致大量白穗的出现,对白穗和正常穗的区分是采取植保措施和灾害评估的基础。通过研究获取了由水稻二化螟和穗瘟造成的白穗和正常穗的室内光谱,选取红边斜率、红边面积、绿峰幅值和绿峰面积等4个高光谱变量作为输入向... 水稻病虫害的发生会导致大量白穗的出现,对白穗和正常穗的区分是采取植保措施和灾害评估的基础。通过研究获取了由水稻二化螟和穗瘟造成的白穗和正常穗的室内光谱,选取红边斜率、红边面积、绿峰幅值和绿峰面积等4个高光谱变量作为输入向量,利用学习矢量量化(LVQ)神经网络对水稻白穗和正常穗进行分类。利用测试样本对网络进行测试,结果显示对白穗和正常稻穗的分类精度高达100%。研究表明,基于LVQ神经网络对水稻白穗和正常穗进行辨别的方法是切实可行的,可以补充和替代肉眼观测。 展开更多
关键词 水稻 遥感 病虫害估测 高光谱反射率 学习矢量量化神经网络
在线阅读 下载PDF
采用认知标架的人机学习情境矢量化方法 被引量:4
9
作者 杨升 刘长勇 +4 位作者 程仁贵 余文森 孟世敏 肖钟捷 郭磊 《重庆理工大学学报(自然科学)》 CAS 2013年第10期102-106,共5页
从学习研究角度考虑,人机交互学习环境是由"脑认知体-耦合情境-信息流形"组成的新型学习观测平台。脑认知体是高维认知流形载体,耦合情境是认知流形的局部度量,信息流形是认知活动的低维投影空间。学习观测把高维认知活动投... 从学习研究角度考虑,人机交互学习环境是由"脑认知体-耦合情境-信息流形"组成的新型学习观测平台。脑认知体是高维认知流形载体,耦合情境是认知流形的局部度量,信息流形是认知活动的低维投影空间。学习观测把高维认知活动投影映射到低维信息流形,即认知降维,涉及学习情境矢量化、度量标架、流形结构研究对象。基于认知科学、教育心理学构建情境内容、认知操作、数理逻辑三维认知标架,基于符号动力学思想设计认知符号序列采集学习情境数据。在认知拓扑空间重构认知符号序列,获得认知拓扑结构。基于认知标架的人机学习情境矢量化方法是认知结构成像新方法,为教学设计、诊断及智慧服务提供新技术和工具。 展开更多
关键词 人机交互 认知结构 矢量 标架 数字学习
在线阅读 下载PDF
矢量量化的误差竞争学习算法 被引量:4
10
作者 王进 余松煜 张文军 《数据采集与处理》 CSCD 2000年第3期281-283,共3页
提出了误差竞争学习 ( Distortion competitive learning,DCL)算法。该算法基于 Gersho的矢量量化误差渐近理论的等误差原则 ,即当码本数趋于无穷大时 ,各区域子误差相等 ,使用这个原则作为最优码书设计的一个必要条件 ,并结合传统最优... 提出了误差竞争学习 ( Distortion competitive learning,DCL)算法。该算法基于 Gersho的矢量量化误差渐近理论的等误差原则 ,即当码本数趋于无穷大时 ,各区域子误差相等 ,使用这个原则作为最优码书设计的一个必要条件 ,并结合传统最优码书设计的两个必要条件 ,然后根据这 3个必要条件 :( 1)最近邻规则 ;( 2 )中心准则 ;( 3)各区域子误差近似相等设计最优码书 ,而在算法的实现中引入广义误差测度 ,以确保该测度与各个区域的子误差相关。最后从快速性与均方差两个方面与目前的码本设计算法比较。实验结果表明 ,该算法在降低迭代时间与减少均方差优于其他传统码本设计算法 ,能迅速地找到优化的码本。 展开更多
关键词 矢量量化 误差竞争学习算法 图像处理 图像编码
在线阅读 下载PDF
基于广义学习矢量量化和支持向量机的混合短期负荷预测方法 被引量:14
11
作者 罗玮 严正 《电网技术》 EI CSCD 北大核心 2008年第13期62-68,共7页
提出了一种基于广义学习矢量量化的负荷特征聚类方法,既考虑了专家经验的指导,同时兼备人工神经网络强大的非线性处理能力。归纳提取的负荷、气象综合指数更能反映日负荷的基本特征,同时减少了网络输入层的维数。实际预测结果表明,综合... 提出了一种基于广义学习矢量量化的负荷特征聚类方法,既考虑了专家经验的指导,同时兼备人工神经网络强大的非线性处理能力。归纳提取的负荷、气象综合指数更能反映日负荷的基本特征,同时减少了网络输入层的维数。实际预测结果表明,综合了广义学习矢量量化和支持向量机的混合短期负荷预测方法无论是在聚类准确度方面,还是在预测准确度方面,与单纯的支持向量机算法和自组织特征映射与支持向量机的混合算法相比,均具有明显的优势。 展开更多
关键词 短期负荷预测 负荷特征聚类 广义学习矢量量化 (Glvq) 支持向量机(SVM) 气象因素
在线阅读 下载PDF
学习矢量量化的推广及其典型形式的比较 被引量:5
12
作者 程剑锋 徐俊艳 《计算机工程与应用》 CSCD 北大核心 2006年第17期82-85,共4页
无监督学习矢量量化(LVQ)是一类基于最小化风险函数的聚类方法,文中通过对无监督LVQ风险函数的研究,提出了无监督LVQ算法的广义形式,在此基础上将当前典型的LVQ算法表示为基于不同尺度函数的LVQ算法,极大地方便了学习矢量量化神经网络... 无监督学习矢量量化(LVQ)是一类基于最小化风险函数的聚类方法,文中通过对无监督LVQ风险函数的研究,提出了无监督LVQ算法的广义形式,在此基础上将当前典型的LVQ算法表示为基于不同尺度函数的LVQ算法,极大地方便了学习矢量量化神经网络的推广与应用。通过对无监督LVQ神经网络的改造,得到了基于无监督聚类算法的有监督LVQ神经网络,并将其应用于说话人辨认,取得了满意的结果并比较了几种典型聚类算法的优劣。 展开更多
关键词 无监督学习矢量量化 尺度函数 风险函数 梯度下降法
在线阅读 下载PDF
学习矢量量化网络在油藏描述中的应用 被引量:3
13
作者 李中亚 韩家新 杜美华 《特种油气藏》 CAS CSCD 2007年第5期32-34,共3页
由于在油藏描述领域中储层特性关系比较复杂,用传统方法进行油藏描述存在极大的局限性,为此提出运用学习矢量量化网络方法进行储层岩性识别。在学习矢量量化网络模型和学习算法分析基础上,运用该方法对某油井测井数据进行仿真试验。现... 由于在油藏描述领域中储层特性关系比较复杂,用传统方法进行油藏描述存在极大的局限性,为此提出运用学习矢量量化网络方法进行储层岩性识别。在学习矢量量化网络模型和学习算法分析基础上,运用该方法对某油井测井数据进行仿真试验。现场仿真试验结果与实际资料吻合较好,证明该方法在模式识别中具有较强的分类能力。与BP网络相比,学习矢量量化网络具有更明显的优越性。 展开更多
关键词 神经网络 学习矢量量化网络 油藏描述 测井资料 岩性识别
在线阅读 下载PDF
模糊强化学习型的图像矢量量化算法 被引量:1
14
作者 姜来 许文焕 +1 位作者 纪震 张基宏 《电子学报》 EI CAS CSCD 北大核心 2006年第9期1738-1741,共4页
本文给出了一种新的图像矢量量化码书的优化设计方法.传统矢量量化方法只考虑了码字与训练矢量之间的吸引影响,所以约束了最优解的寻解空间.本文提出了一种新的学习机理———模糊强化学习机制,该机制在传统的吸引因子基础上,引入新的... 本文给出了一种新的图像矢量量化码书的优化设计方法.传统矢量量化方法只考虑了码字与训练矢量之间的吸引影响,所以约束了最优解的寻解空间.本文提出了一种新的学习机理———模糊强化学习机制,该机制在传统的吸引因子基础上,引入新的排斥因子,极大地释放了吸引因子对最优解的寻解空间的约束.新的模糊强化学习机制没有采用引入随机扰动的方法来避免陷入局部最优码书,而是通过吸引因子和排斥因子的合力作用,较准确地确定了每个码字的最佳移动方向,从而使整体码书向全局最优解靠近.实验结果表明,基于模糊强化学习机制的矢量量化算法始终稳定地取得显著优于模糊K-means算法的性能,较好地解决了矢量量化中的码书设计容易陷入局部极小和初始码书影响优化结果的问题. 展开更多
关键词 矢量量化 图像编码 模糊强化学习 吸引因子 排斥因子
在线阅读 下载PDF
学习矢量量化的软竞争算法 被引量:2
15
作者 张志华 郑南宁 王天树 《软件学报》 EI CSCD 北大核心 2002年第5期980-986,共7页
尽管FALVQ算法的亏损因子为模糊隶属度函数,但由于它的尺度函数并不是模糊隶属度函数,使得算法的性能不稳定.为了克服这个问题,通过推广FALVQ中获胜亏损因子的定义,导出了广义LVQ的一类软竞争算法(SCALVQ),并且给出了它的3种具体形式.在... 尽管FALVQ算法的亏损因子为模糊隶属度函数,但由于它的尺度函数并不是模糊隶属度函数,使得算法的性能不稳定.为了克服这个问题,通过推广FALVQ中获胜亏损因子的定义,导出了广义LVQ的一类软竞争算法(SCALVQ),并且给出了它的3种具体形式.在SCALVQ中,亏损因子和对应的尺度函数是同一个模糊隶属度函数,它汲取了FALVQ和软竞争格式的优点,有效地克服了FALVQ存在的问题. 展开更多
关键词 学习矢量量化 软竞争算法 模糊隶属度函数 亏损因子 尺度函数 干扰函数 神经网络
在线阅读 下载PDF
基于主成分分析和学习矢量量化的会话初始协议识别研究 被引量:1
16
作者 李进东 王韬 +1 位作者 吴杨 雷东 《计算机工程》 CAS CSCD 北大核心 2016年第6期125-130,共6页
针对加密会话初始协议(SIP)识别困难以及相关研究工作较少,对入侵检测、网络流量监控等工作带来不便的问题,提出基于主成分分析(PCA)和学习矢量量化(LVQ)网络的SIP协议识别模型。通过对SIP协议的网络流特征进行PCA,提取出累计贡献率高于... 针对加密会话初始协议(SIP)识别困难以及相关研究工作较少,对入侵检测、网络流量监控等工作带来不便的问题,提出基于主成分分析(PCA)和学习矢量量化(LVQ)网络的SIP协议识别模型。通过对SIP协议的网络流特征进行PCA,提取出累计贡献率高于85%的相关流特征作为SIP协议识别过程中的主要特征,并进行LVQ网络训练,构建出完整的SIP协议识别模型。实验结果表明,PCA_LVQ模型对SIP协议的识别率均高于90%,通过PCA提取的SIP协议网络流属性区别于非SIP协议的属性,该模型对SIP协议的识别效果较好。 展开更多
关键词 会话初始协议 主成分分析 学习矢量量化 特征值 加密协议 流特征
在线阅读 下载PDF
基于提升小波变换与学习矢量量化网络的鉴别分析方法 被引量:1
17
作者 陈蕾 黄贤武 +1 位作者 刘家胜 仲兴荣 《计算机应用》 CSCD 北大核心 2006年第9期2038-2040,共3页
提出了一种基于提升小波变换(LWT)和学习矢量量化网络(LVQ)相结合的鉴别分析方法。提升小波又叫作第二代小波,比传统的第一代小波变换更为快速有效,利用它的多分辨率特性,可以获取输入图像的低频信息并使图像降维。LVQ算法是在有教师状... 提出了一种基于提升小波变换(LWT)和学习矢量量化网络(LVQ)相结合的鉴别分析方法。提升小波又叫作第二代小波,比传统的第一代小波变换更为快速有效,利用它的多分辨率特性,可以获取输入图像的低频信息并使图像降维。LVQ算法是在有教师状态下对竞争层进行训练的一种学习算法。LVQ网络结构简单,但却表现出比BP网络更强的有效性和鲁棒性。在ORL标准人脸库及现实人脸图像上的实验结果表明该方法具有很好的鉴别分析能力。 展开更多
关键词 提升小波变换 学习矢量量化 鉴别分析 神经网络 人脸识别
在线阅读 下载PDF
基于学习矢量量化的运动目标检测算法 被引量:1
18
作者 王世东 周德闯 汪箭 《光电工程》 CAS CSCD 北大核心 2012年第9期42-48,共7页
提出一种基于学习矢量量化的运动目标检测算法。通过训练样本,网络能自适应地确定区分运动目标和背景的阈值向量。输入向量包含图像的YCbCr颜色空间分量和灰度共生矩阵的方向特征。两者融合到算法中,有效抑制了背景亮度变化对运动目标... 提出一种基于学习矢量量化的运动目标检测算法。通过训练样本,网络能自适应地确定区分运动目标和背景的阈值向量。输入向量包含图像的YCbCr颜色空间分量和灰度共生矩阵的方向特征。两者融合到算法中,有效抑制了背景亮度变化对运动目标检测的干扰。仿真实验结果表明,即使在背景模型亮度剧烈变化的情况下,算法也能够准确检测出运动目标。 展开更多
关键词 运动目标检测 学习矢量量化 YCBCR 灰度共生矩阵
在线阅读 下载PDF
基于学习矢量量化神经网络的气固两相流流型识别 被引量:1
19
作者 葛李 李扬 郑莹娜 《仪表技术与传感器》 CSCD 北大核心 2004年第12期52-54,共3页
管流截面流型作为描述气固两相流的重要参数之一 ,极大地影响着两相流动压力损失和传热传质等特性 ,同时还影响着其他参数 (如流量、分相含率等 )的准确测量以及流动系统的运行特性。传统的检测方法由于难以获得能真正反映流型的管道截... 管流截面流型作为描述气固两相流的重要参数之一 ,极大地影响着两相流动压力损失和传热传质等特性 ,同时还影响着其他参数 (如流量、分相含率等 )的准确测量以及流动系统的运行特性。传统的检测方法由于难以获得能真正反映流型的管道截面局部分布的实时信息 ,在工业应用中受到了限制。有鉴于此 ,在光学层析成像技术的基础上 ,提出了一种基于学习矢量量化神经网络的气固两相流流型识别方法 ,详细介绍了这种网络的结构、学习算法、训练样本集的确定等。通过计算机仿真 ,实验结果表明此方法对于气固两相流的 8种流型能有较好的识别能力 。 展开更多
关键词 流型识别 学习矢量量化网络 气固两相流 光学成析成像
在线阅读 下载PDF
基于矢量量化的强化学习及其在机器人行为学习中的应用 被引量:1
20
作者 段勇 伊婧 +1 位作者 张永赫 徐心和 《高技术通讯》 CAS CSCD 北大核心 2011年第2期179-184,共6页
针对强化学习(RL)中状态空间过大所引起的学习时间过长或算法难于收敛等问题,提出了一种基于矢量量化(VQ)技术的表格型强化学习方法——VQRL方法,该方法用矢量量化器的码书矢量来逼近强化学习的状态空间,从而有效地解决了强化学... 针对强化学习(RL)中状态空间过大所引起的学习时间过长或算法难于收敛等问题,提出了一种基于矢量量化(VQ)技术的表格型强化学习方法——VQRL方法,该方法用矢量量化器的码书矢量来逼近强化学习的状态空间,从而有效地解决了强化学习的状态空间分割问题,并提高了学习的收敛速度。同时根据等失真理论将一种失真敏感自组织特征映射(SOFM)神经网络用于矢量量化,以达到更好的强化学习状态空间泛化性能。将此方法应用于反应式移动机器人的行为学习的实验验证了此方法的有效性,实验表明,此方法能够较好地解决复杂未知环境的机器人导航问题。 展开更多
关键词 强化学习(RL) 矢量量化(VQ) 码书 Q(λ)学习 自组织特征映射
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部