期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
一种基于最优策略概率分布的POMDP值迭代算法 被引量:4
1
作者 刘峰 王崇骏 骆斌 《电子学报》 EI CAS CSCD 北大核心 2016年第5期1078-1084,共7页
随着应用中POMDP问题的规模不断扩大,基于最优策略可达区域的启发式方法成为了目前的研究热点.然而目前已有的算法虽然保证了全局最优,但选择最优动作还不够精确,影响了算法的效率.本文提出一种基于最优策略概率的值迭代方法 PBVIOP.该... 随着应用中POMDP问题的规模不断扩大,基于最优策略可达区域的启发式方法成为了目前的研究热点.然而目前已有的算法虽然保证了全局最优,但选择最优动作还不够精确,影响了算法的效率.本文提出一种基于最优策略概率的值迭代方法 PBVIOP.该方法在深度优先的启发式探索中,根据各个动作值函数在其上界和下界之间的分布,用蒙特卡罗法计算动作最优的概率,选择概率最大的动作作为最优探索策略.在4个基准问题上的实验结果表明PBVIOP算法能够收敛到全局最优解,并明显提高了收敛效率. 展开更多
关键词 部分可观测马尔科夫决策过程 基于最优策略概率的值迭代算法 蒙特卡罗法
在线阅读 下载PDF
基于学习速率与更新向量的混合云数据冗余值迭代算法 被引量:4
2
作者 张晓丽 《河南理工大学学报(自然科学版)》 CAS 北大核心 2020年第5期114-119,共6页
针对传统混合云数据冗余值迭代算法的平均回报值较低、收敛稳定性较差、收敛动作规模较小等问题,提出一种基于学习速率与更新向量的混合云数据冗余值迭代算法。首先,构建混合云数据冗余值值函数,在该函数中引入一个新的参数更新权重向量... 针对传统混合云数据冗余值迭代算法的平均回报值较低、收敛稳定性较差、收敛动作规模较小等问题,提出一种基于学习速率与更新向量的混合云数据冗余值迭代算法。首先,构建混合云数据冗余值值函数,在该函数中引入一个新的参数更新权重向量,基于深度学习中学习速率要求,获取值函数的稳定值;其次,依据获取的稳定值计算值函数稳定值向量,利用新权值处理稳定值向量,获取值函数更新向量;最后,对权值增量进行计算,结合哈希表完成混合云数据冗余值的迭代研究。实验结果表明,该算法的平均回报值最高,且收敛速度最快。 展开更多
关键词 学习速率 更新向量 深度学习 混合云数据 冗余值迭代算法
在线阅读 下载PDF
一种稀疏度自适应的压缩感知信道估计算法
3
作者 林思铭 彭卫东 +2 位作者 李明阳 林志国 李瑞 《合肥工业大学学报(自然科学版)》 CAS CSCD 北大核心 2016年第8期1055-1059,共5页
针对目前稀疏度自适应的压缩感知(compressed sensing,CS)信道估计算法计算量过大的问题,文章提出了基于关联度分析的稀疏度自适应归档正则化迭代硬阈值(sparsity adaptive archiving normalized iterative hard thresholding,SAANIHT)... 针对目前稀疏度自适应的压缩感知(compressed sensing,CS)信道估计算法计算量过大的问题,文章提出了基于关联度分析的稀疏度自适应归档正则化迭代硬阈值(sparsity adaptive archiving normalized iterative hard thresholding,SAANIHT)算法。ANIHT算法可以解决传统压缩感知理论计算量大、计算时间过长的问题,但需要预知信道的稀疏度。引入高斯核函数对一种稀疏度估计算法进行了改进,并与ANIHT算法结合,使其可以在盲稀疏情况下对信道进行估计。仿真结果表明,在同等稀疏度条件下,该算法比其他算法节约了计算时间,在低信噪比下性能更优,具有较好的重构性能与稳定性。 展开更多
关键词 压缩感知 稀疏多径信道估计 归档正则化硬阀算法 高斯核函数 稀疏度自适应
在线阅读 下载PDF
部分可观察马尔可夫决策过程研究进展 被引量:3
4
作者 仵博 吴敏 《计算机工程与设计》 CSCD 北大核心 2007年第9期2116-2119,2126,共5页
部分可观察马尔可夫决策过程是通过引入信念状态空间将非马尔可夫链问题转化为马尔可夫链问题来求解,其描述真实世界的特性使它成为研究随机决策过程的重要分支。介绍了部分可观察马尔可夫决策过程的基本原理和决策过程,然后介绍了3种... 部分可观察马尔可夫决策过程是通过引入信念状态空间将非马尔可夫链问题转化为马尔可夫链问题来求解,其描述真实世界的特性使它成为研究随机决策过程的重要分支。介绍了部分可观察马尔可夫决策过程的基本原理和决策过程,然后介绍了3种典型的算法,它们分别是Littman等人的Witness算法、Incremental Pruning算法和Pineau等人的基于点的值迭代算法,对这3种算法进行了分析比较。讲述部分可观察马尔可夫决策过程的应用。 展开更多
关键词 部分可观察马尔可夫 决策算法 智能体 马尔可夫链 值迭代算法
在线阅读 下载PDF
边缘计算中基于马尔可夫决策过程的数据分流时间优化 被引量:6
5
作者 杨桂松 候玲 何杏宇 《小型微型计算机系统》 CSCD 北大核心 2020年第12期2626-2630,共5页
随着物联网的发展,大规模的数据传输增大了网络负载和数据分流时间.为了优化数据分流时间,本文在边缘计算的环境中,提出基于马尔可夫决策过程(MDP)的分流节点选择策略.本文首先构建一个支持蜂窝和WiFi通信的网络模型,该模型由终端设备... 随着物联网的发展,大规模的数据传输增大了网络负载和数据分流时间.为了优化数据分流时间,本文在边缘计算的环境中,提出基于马尔可夫决策过程(MDP)的分流节点选择策略.本文首先构建一个支持蜂窝和WiFi通信的网络模型,该模型由终端设备、分流节点和中心云构成,然后通过终端设备的位置和上传数据量的大小构建马尔可夫决策过程模型,最后,运用值迭代算法求解马尔可夫决策过程模型,得到最优分流节点选择策略,达到优化数据分流时间的效果.本文采用两组对比实验,大量实验结果表明本文所提策略在传输数据的同时,其数据分流时间比基准算法更短. 展开更多
关键词 边缘计算 马尔科夫决策过程 值迭代算法 数据分流
在线阅读 下载PDF
考虑患者止步行为的动态入院接收决策模型
6
作者 姜艳萍 杨飞飞 孙灿 《运筹与管理》 CSSCI CSCD 北大核心 2022年第9期49-55,共7页
大型公立医院病床供需矛盾日益突出,医院作为服务系统有必要考虑由于病床需求响应速度不及时而引起的患者策略性行为。针对患者到达时间的随机性与住院时长的不确定性,本文提出考虑患者止步行为的动态入院接收决策问题,制定了适用于可... 大型公立医院病床供需矛盾日益突出,医院作为服务系统有必要考虑由于病床需求响应速度不及时而引起的患者策略性行为。针对患者到达时间的随机性与住院时长的不确定性,本文提出考虑患者止步行为的动态入院接收决策问题,制定了适用于可等待慢性病患者的入院接收决策方法,旨在提高患者的就医满意度,有效权衡多类患者的接收数量,降低由于科室响应速度过慢引发的患者止步频率。首先,本文对考虑患者止步行为的动态入院接收决策问题进行数学描述及符号定义;然后,对患者止步行为的影响因素进行分析并构建止步概率函数;进一步地,构建考虑患者止步行为的动态入院接收马尔可夫决策过程(MDP)模型,并针对模型特点设计值迭代算法,最后通过数值算例验证本文所提方法的可行性与有效性。 展开更多
关键词 入院接收决策 止步行为 马尔可夫决策过程 值迭代算法
在线阅读 下载PDF
基于微重启和部分客观马尔可夫决策模型的智能水下机器人软件自修复方法
7
作者 张汝波 孟雷 史长亭 《计算机应用》 CSCD 北大核心 2015年第8期2375-2379,共5页
针对智能水下机器人(AUV)软件故障修复过程中存在的修复代价过高和系统环境只有部分可观察的问题,提出了一种基于微重启技术和部分客观马尔可夫决策(POMDP)模型的AUV软件故障修复方法。该方法结合AUV软件系统分层结构特点,构建了基于微... 针对智能水下机器人(AUV)软件故障修复过程中存在的修复代价过高和系统环境只有部分可观察的问题,提出了一种基于微重启技术和部分客观马尔可夫决策(POMDP)模型的AUV软件故障修复方法。该方法结合AUV软件系统分层结构特点,构建了基于微重启的三层重启结构,便于细粒度的自修复微重启策略的实施;并依据部分可观马尔可夫决策过程理论,给出AUV软件自修复POMDP模型,同时采用基于点的值迭代(PBVI)算法求解生成修复策略,以最小化累积修复代价为目标,使系统在部分可观环境下能够以较低的修复代价执行修复动作。仿真实验结果表明,基于微重启技术和POMDP模型的AUV软件故障修复方法能够解决由软件老化及系统调用引起的AUV软件故障,同与两层微重启策略和三层微重启固定策略相比,该方法在累积故障修复时间和运行稳定性上明显更优。 展开更多
关键词 智能水下机器人 微重启 自修复 部分客观马尔可夫决策 基于点的值迭代算法
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部