检索结果-维普期刊中文期刊服务平台

一种基于最优策略概率分布的POMDP值迭代算法被引量：4: 1; 作者刘峰王崇骏骆斌《电子学报》 EI CAS CSCD 北大核心 2016年第5期1078-1084,共7页; 随着应用中POMDP问题的规模不断扩大,基于最优策略可达区域的启发式方法成为了目前的研究热点.然而目前已有的算法虽然保证了全局最优,但选择最优动作还不够精确,影响了算法的效率.本文提出一种基于最优策略概率的值迭代方法 PBVIOP.该... 展开更多; 关键词部分可观测马尔科夫决策过程基于最优策略概率的值迭代算法蒙特卡罗法; 在线阅读下载PDF 职称材料

基于学习速率与更新向量的混合云数据冗余值迭代算法被引量：4: 2; 作者张晓丽《河南理工大学学报（自然科学版）》 CAS 北大核心 2020年第5期114-119,共6页; 针对传统混合云数据冗余值迭代算法的平均回报值较低、收敛稳定性较差、收敛动作规模较小等问题,提出一种基于学习速率与更新向量的混合云数据冗余值迭代算法。首先,构建混合云数据冗余值值函数,在该函数中引入一个新的参数更新权重向量... 展开更多; 关键词学习速率更新向量深度学习混合云数据冗余值迭代算法; 在线阅读下载PDF 职称材料

一种稀疏度自适应的压缩感知信道估计算法: 3; 作者林思铭彭卫东 +2 位作者李明阳林志国李瑞《合肥工业大学学报（自然科学版）》 CAS CSCD 北大核心 2016年第8期1055-1059,共5页; 针对目前稀疏度自适应的压缩感知(compressed sensing,CS)信道估计算法计算量过大的问题,文章提出了基于关联度分析的稀疏度自适应归档正则化迭代硬阈值(sparsity adaptive archiving normalized iterative hard thresholding,SAANIHT)... 展开更多; 关键词压缩感知稀疏多径信道估计归档正则化迭代硬阀值算法高斯核函数稀疏度自适应; 在线阅读下载PDF 职称材料

部分可观察马尔可夫决策过程研究进展被引量：3: 4; 作者仵博吴敏《计算机工程与设计》 CSCD 北大核心 2007年第9期2116-2119,2126,共5页; 部分可观察马尔可夫决策过程是通过引入信念状态空间将非马尔可夫链问题转化为马尔可夫链问题来求解,其描述真实世界的特性使它成为研究随机决策过程的重要分支。介绍了部分可观察马尔可夫决策过程的基本原理和决策过程,然后介绍了3种... 展开更多; 关键词部分可观察马尔可夫决策算法智能体马尔可夫链值迭代算法; 在线阅读下载PDF 职称材料

边缘计算中基于马尔可夫决策过程的数据分流时间优化被引量：6: 5; 作者杨桂松候玲何杏宇《小型微型计算机系统》 CSCD 北大核心 2020年第12期2626-2630,共5页; 随着物联网的发展,大规模的数据传输增大了网络负载和数据分流时间.为了优化数据分流时间,本文在边缘计算的环境中,提出基于马尔可夫决策过程(MDP)的分流节点选择策略.本文首先构建一个支持蜂窝和WiFi通信的网络模型,该模型由终端设备... 展开更多; 关键词边缘计算马尔科夫决策过程值迭代算法数据分流; 在线阅读下载PDF 职称材料

考虑患者止步行为的动态入院接收决策模型: 6; 作者姜艳萍杨飞飞孙灿《运筹与管理》 CSSCI CSCD 北大核心 2022年第9期49-55,共7页; 大型公立医院病床供需矛盾日益突出,医院作为服务系统有必要考虑由于病床需求响应速度不及时而引起的患者策略性行为。针对患者到达时间的随机性与住院时长的不确定性,本文提出考虑患者止步行为的动态入院接收决策问题,制定了适用于可... 展开更多; 关键词入院接收决策止步行为马尔可夫决策过程值迭代算法; 在线阅读下载PDF 职称材料

基于微重启和部分客观马尔可夫决策模型的智能水下机器人软件自修复方法: 7; 作者张汝波孟雷史长亭《计算机应用》 CSCD 北大核心 2015年第8期2375-2379,共5页; 针对智能水下机器人(AUV)软件故障修复过程中存在的修复代价过高和系统环境只有部分可观察的问题,提出了一种基于微重启技术和部分客观马尔可夫决策(POMDP)模型的AUV软件故障修复方法。该方法结合AUV软件系统分层结构特点,构建了基于微... 展开更多; 关键词智能水下机器人微重启自修复部分客观马尔可夫决策基于点的值迭代算法; 在线阅读下载PDF 职称材料

题名一种基于最优策略概率分布的POMDP值迭代算法被引量：4: 1; 作者刘峰王崇骏骆斌; 机构南京大学软件学院南京大学软件新技术国家重点实验室南京大学计算机科学与技术系; 出处《电子学报》 EI CAS CSCD 北大核心 2016年第5期1078-1084,共7页; 基金国家自然科学基金(No.61375069) 江苏省自然科学基金(No.BK20131277); 文摘随着应用中POMDP问题的规模不断扩大,基于最优策略可达区域的启发式方法成为了目前的研究热点.然而目前已有的算法虽然保证了全局最优,但选择最优动作还不够精确,影响了算法的效率.本文提出一种基于最优策略概率的值迭代方法 PBVIOP.该方法在深度优先的启发式探索中,根据各个动作值函数在其上界和下界之间的分布,用蒙特卡罗法计算动作最优的概率,选择概率最大的动作作为最优探索策略.在4个基准问题上的实验结果表明PBVIOP算法能够收敛到全局最优解,并明显提高了收敛效率.; 关键词部分可观测马尔科夫决策过程基于最优策略概率的值迭代算法蒙特卡罗法; Keywords partially observable Markov decision process （POMDP） probability-based value iteration on optimal policy（PBVIOP） Monte Carlo method; 分类号 TP319 [自动化与计算机技术—计算机软件与理论]; 在线阅读下载PDF 职称材料

题名基于学习速率与更新向量的混合云数据冗余值迭代算法被引量：4: 2; 作者张晓丽; 机构东北大学机械工程与自动化学院长春师范大学数学学院; 出处《河南理工大学学报（自然科学版）》 CAS 北大核心 2020年第5期114-119,共6页; 基金国家自然科学基金资助项目(41071262,61300230)。; 文摘针对传统混合云数据冗余值迭代算法的平均回报值较低、收敛稳定性较差、收敛动作规模较小等问题,提出一种基于学习速率与更新向量的混合云数据冗余值迭代算法。首先,构建混合云数据冗余值值函数,在该函数中引入一个新的参数更新权重向量,基于深度学习中学习速率要求,获取值函数的稳定值;其次,依据获取的稳定值计算值函数稳定值向量,利用新权值处理稳定值向量,获取值函数更新向量;最后,对权值增量进行计算,结合哈希表完成混合云数据冗余值的迭代研究。实验结果表明,该算法的平均回报值最高,且收敛速度最快。; 关键词学习速率更新向量深度学习混合云数据冗余值迭代算法; Keywords learning rate update vector deep learning hybrid cloud data redundancy value iteration algorithm; 分类号 TP181 [自动化与计算机技术—控制理论与控制工程]; 在线阅读下载PDF 职称材料

题名一种稀疏度自适应的压缩感知信道估计算法: 3; 作者林思铭彭卫东李明阳林志国李瑞; 机构空军工程大学装备管理与安全工程学院空军工程大学装备发展与运用研究中心中国人民解放军; 出处《合肥工业大学学报（自然科学版）》 CAS CSCD 北大核心 2016年第8期1055-1059,共5页; 基金国家自然科学基金资助项目(6150051163); 文摘针对目前稀疏度自适应的压缩感知(compressed sensing,CS)信道估计算法计算量过大的问题,文章提出了基于关联度分析的稀疏度自适应归档正则化迭代硬阈值(sparsity adaptive archiving normalized iterative hard thresholding,SAANIHT)算法。ANIHT算法可以解决传统压缩感知理论计算量大、计算时间过长的问题,但需要预知信道的稀疏度。引入高斯核函数对一种稀疏度估计算法进行了改进,并与ANIHT算法结合,使其可以在盲稀疏情况下对信道进行估计。仿真结果表明,在同等稀疏度条件下,该算法比其他算法节约了计算时间,在低信噪比下性能更优,具有较好的重构性能与稳定性。; 关键词压缩感知稀疏多径信道估计归档正则化迭代硬阀值算法高斯核函数稀疏度自适应; Keywords compressed sensing（CS） sparse multipath channel estimation archiving normalized itera- tire hard thresholding（ANIHT） algorithm Gaussian kernel function sparsity adaptive; 分类号 TN911.5 [电子电信—通信与信息系统]; 在线阅读下载PDF 职称材料

题名部分可观察马尔可夫决策过程研究进展被引量：3: 4; 作者仵博吴敏; 机构深圳职业技术学院计算机应用工程系中南大学信息科学与工程学院; 出处《计算机工程与设计》 CSCD 北大核心 2007年第9期2116-2119,2126,共5页; 基金国家863高技术研究发展计划基金项目(2001AA4422200); 文摘部分可观察马尔可夫决策过程是通过引入信念状态空间将非马尔可夫链问题转化为马尔可夫链问题来求解,其描述真实世界的特性使它成为研究随机决策过程的重要分支。介绍了部分可观察马尔可夫决策过程的基本原理和决策过程,然后介绍了3种典型的算法,它们分别是Littman等人的Witness算法、Incremental Pruning算法和Pineau等人的基于点的值迭代算法,对这3种算法进行了分析比较。讲述部分可观察马尔可夫决策过程的应用。; 关键词部分可观察马尔可夫决策算法智能体马尔可夫链值迭代算法; Keywords POMDP decision algorithm agent Markovian Iteration algorithm; 分类号 TP18 [自动化与计算机技术—控制理论与控制工程]; 在线阅读下载PDF 职称材料

题名边缘计算中基于马尔可夫决策过程的数据分流时间优化被引量：6: 5; 作者杨桂松候玲何杏宇; 机构上海理工大学光电信息与计算机工程学院上海理工大学出版印刷与艺术设计学院; 出处《小型微型计算机系统》 CSCD 北大核心 2020年第12期2626-2630,共5页; 基金国家自然科学基金项目(61602305,61802257)资助上海市自然科学基金项目(18ZR1426000,19ZR1477600)资助。; 文摘随着物联网的发展,大规模的数据传输增大了网络负载和数据分流时间.为了优化数据分流时间,本文在边缘计算的环境中,提出基于马尔可夫决策过程(MDP)的分流节点选择策略.本文首先构建一个支持蜂窝和WiFi通信的网络模型,该模型由终端设备、分流节点和中心云构成,然后通过终端设备的位置和上传数据量的大小构建马尔可夫决策过程模型,最后,运用值迭代算法求解马尔可夫决策过程模型,得到最优分流节点选择策略,达到优化数据分流时间的效果.本文采用两组对比实验,大量实验结果表明本文所提策略在传输数据的同时,其数据分流时间比基准算法更短.; 关键词边缘计算马尔科夫决策过程值迭代算法数据分流; Keywords edge computing markov decision process(MDP) value iteration algorithm(VIA) data offloading; 分类号 TP393 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名考虑患者止步行为的动态入院接收决策模型: 6; 作者姜艳萍杨飞飞孙灿; 机构东北大学工商管理学院北京工业大学经济与管理学院; 出处《运筹与管理》 CSSCI CSCD 北大核心 2022年第9期49-55,共7页; 基金国家自然科学基金资助项目(71871048,72202010) 中国博士后科学基金资助项目(2022M710275)。; 文摘大型公立医院病床供需矛盾日益突出,医院作为服务系统有必要考虑由于病床需求响应速度不及时而引起的患者策略性行为。针对患者到达时间的随机性与住院时长的不确定性,本文提出考虑患者止步行为的动态入院接收决策问题,制定了适用于可等待慢性病患者的入院接收决策方法,旨在提高患者的就医满意度,有效权衡多类患者的接收数量,降低由于科室响应速度过慢引发的患者止步频率。首先,本文对考虑患者止步行为的动态入院接收决策问题进行数学描述及符号定义;然后,对患者止步行为的影响因素进行分析并构建止步概率函数;进一步地,构建考虑患者止步行为的动态入院接收马尔可夫决策过程(MDP)模型,并针对模型特点设计值迭代算法,最后通过数值算例验证本文所提方法的可行性与有效性。; 关键词入院接收决策止步行为马尔可夫决策过程值迭代算法; Keywords admission decision balking behavior Markov decision process value iteration algorithm; 分类号 C934 [经济管理—管理学]; 在线阅读下载PDF 职称材料

题名基于微重启和部分客观马尔可夫决策模型的智能水下机器人软件自修复方法: 7; 作者张汝波孟雷史长亭; 机构哈尔滨工程大学计算机科学与技术学院大连民族大学机电工程学院; 出处《计算机应用》 CSCD 北大核心 2015年第8期2375-2379,共5页; 基金装备预研基金项目(9140C270101130C27099); 文摘针对智能水下机器人(AUV)软件故障修复过程中存在的修复代价过高和系统环境只有部分可观察的问题,提出了一种基于微重启技术和部分客观马尔可夫决策(POMDP)模型的AUV软件故障修复方法。该方法结合AUV软件系统分层结构特点,构建了基于微重启的三层重启结构,便于细粒度的自修复微重启策略的实施;并依据部分可观马尔可夫决策过程理论,给出AUV软件自修复POMDP模型,同时采用基于点的值迭代(PBVI)算法求解生成修复策略,以最小化累积修复代价为目标,使系统在部分可观环境下能够以较低的修复代价执行修复动作。仿真实验结果表明,基于微重启技术和POMDP模型的AUV软件故障修复方法能够解决由软件老化及系统调用引起的AUV软件故障,同与两层微重启策略和三层微重启固定策略相比,该方法在累积故障修复时间和运行稳定性上明显更优。; 关键词智能水下机器人微重启自修复部分客观马尔可夫决策基于点的值迭代算法; Keywords Autonomous Underwater Vehicle （AUV） micro-reboot self-repair Partially Observable Markov Decision Process （POMDP） Point Based Value Iteration （PBVI） algorithm; 分类号 TP311.52 [自动化与计算机技术—计算机软件与理论]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	一种基于最优策略概率分布的POMDP值迭代算法	刘峰王崇骏骆斌	《电子学报》 EI CAS CSCD 北大核心	2016	4	在线阅读下载PDF 职称材料
2	基于学习速率与更新向量的混合云数据冗余值迭代算法	张晓丽	《河南理工大学学报（自然科学版）》 CAS 北大核心	2020	4	在线阅读下载PDF 职称材料
3	一种稀疏度自适应的压缩感知信道估计算法	林思铭彭卫东李明阳林志国李瑞	《合肥工业大学学报（自然科学版）》 CAS CSCD 北大核心	2016	0	在线阅读下载PDF 职称材料
4	部分可观察马尔可夫决策过程研究进展	仵博吴敏	《计算机工程与设计》 CSCD 北大核心	2007	3	在线阅读下载PDF 职称材料
5	边缘计算中基于马尔可夫决策过程的数据分流时间优化	杨桂松候玲何杏宇	《小型微型计算机系统》 CSCD 北大核心	2020	6	在线阅读下载PDF 职称材料
6	考虑患者止步行为的动态入院接收决策模型	姜艳萍杨飞飞孙灿	《运筹与管理》 CSSCI CSCD 北大核心	2022	0	在线阅读下载PDF 职称材料
7	基于微重启和部分客观马尔可夫决策模型的智能水下机器人软件自修复方法	张汝波孟雷史长亭	《计算机应用》 CSCD 北大核心	2015	0	在线阅读下载PDF 职称材料