期刊文献+
共找到13篇文章
< 1 >
每页显示 20 50 100
基于动态规划的作物种植优化决策模型
1
作者 李钰瑾 杜玫 +1 位作者 李昊天 胡鑫 《农村实用技术》 2025年第7期65-66,共2页
基于市场需求,充分利用有限的耕地资源实现作物利润最大的作物种植决策尤为重要。本文针对作物的习性和生长规律,开展了作物种植优化研究。首先以最大收益作为目标,建立单目标规划决策模型;在此基础上,基于动态规划建立马尔可夫决策模型... 基于市场需求,充分利用有限的耕地资源实现作物利润最大的作物种植决策尤为重要。本文针对作物的习性和生长规律,开展了作物种植优化研究。首先以最大收益作为目标,建立单目标规划决策模型;在此基础上,基于动态规划建立马尔可夫决策模型,选用最大化价值函数开展优化策略的迭代计算;这为提高作物的生产效益提供了有效手段,对于促进乡村经济的长期健康发展具有重要的现实意义。 展开更多
关键词 动态规划 作物种植优化 模拟退火算法 马尔可夫决策模型
在线阅读 下载PDF
决策树-马尔可夫模型在心房颤动筛查经济学评价中的应用 被引量:7
2
作者 卢莎 孙金悦 樊重俊 《上海理工大学学报》 CAS CSCD 北大核心 2022年第3期308-314,共7页
心房颤动(简称房颤)近年来的发病率呈现年轻化趋势,严重威胁着人类的生存及健康。基于决策树-马尔可夫模型,模拟房颤-脑卒中-疾病转归的自然发展过程,依据成本效用等指标开展不同房颤筛查策略的卫生经济学评价。针对上海地区和国内平均... 心房颤动(简称房颤)近年来的发病率呈现年轻化趋势,严重威胁着人类的生存及健康。基于决策树-马尔可夫模型,模拟房颤-脑卒中-疾病转归的自然发展过程,依据成本效用等指标开展不同房颤筛查策略的卫生经济学评价。针对上海地区和国内平均水平分别提出了不同的最优筛查组合策略。通过模型敏感性分析发现,房颤筛查费用对于上海的成本效用敏感性最强,而抗凝治疗费用对于国内平均的成本效用敏感性最强。最后,为了更好地开展针对房颤的健康管理,给出了房颤筛查策略的建议,为我国房颤筛查防治的健康管理模式优化提供参考。 展开更多
关键词 房颤 健康管理 筛查 决策树–马尔可夫模型 成本管理
在线阅读 下载PDF
基于POMDP模型的智能雷达干扰决策方法 被引量:1
3
作者 冯路为 刘松涛 徐华志 《系统工程与电子技术》 EI CSCD 北大核心 2023年第9期2755-2760,共6页
为了有效提高复杂电磁环境下对非合作方工作模式未知的智能雷达的干扰效率和准确率,提出了一种基于部分可观测马尔可夫决策过程(partially observable Markov decision process,POMDP)的干扰决策方法。首先,根据智能雷达的工作特点构建... 为了有效提高复杂电磁环境下对非合作方工作模式未知的智能雷达的干扰效率和准确率,提出了一种基于部分可观测马尔可夫决策过程(partially observable Markov decision process,POMDP)的干扰决策方法。首先,根据智能雷达的工作特点构建了智能雷达对抗系统的POMDP模型,采用非参数的、基于样本的信念分布反映智能体对环境的认知,并利用贝叶斯滤波更新智能体对环境的信念。然后,以信息熵作为评估准则,令干扰机选择信息熵最大的干扰样式不断尝试。最后,通过仿真实验与传统Q-学习法和经验决策法的干扰决策性能进行比较,验证所提方法的优越性。结果表明,所提方法能够根据未知雷达状态变化动态地选择最优干扰方式,且能更快实现对智能雷达的干扰决策。 展开更多
关键词 智能雷达 强化学习 部分可观测马尔可夫决策过程模型 贝叶斯滤波
在线阅读 下载PDF
惯性导航设备维修决策控制方法的研究
4
作者 杨德刚 李安 +1 位作者 胡柏青 朱涛 《中国惯性技术学报》 EI CSCD 2003年第4期62-65,72,共5页
提出了采用比例失效率模型和马尔可夫决策模型进行惯性导航设备维修决策控制。对基于威布尔比例失效率模型的可靠性参数估计方法和半马尔可夫决策模型的数学构建进行了论述,并介绍了根据这两个模型进行维修决策控制的具体步骤。
关键词 惯性导航设备 比例失效率模型 马尔可夫决策模型 维修决策控制 可靠性 参数估计
在线阅读 下载PDF
基于深度确定性梯度学习的集群多目标分配方法
5
作者 李乔易 王正杰 +1 位作者 张小宁 程杞元 《北京理工大学学报》 EI CAS CSCD 北大核心 2024年第10期1051-1057,共7页
针对多弹协同作战进行目标分配时,存在敌方平台和反舰导弹数量不确定性和类型多样化,导致目标分配算法难以建模的问题,为提升高动态协同攻击条件下的攻击效能,建立动态战场环境模型和多目标分配的单回合马尔可夫决策模型,提出一种改进... 针对多弹协同作战进行目标分配时,存在敌方平台和反舰导弹数量不确定性和类型多样化,导致目标分配算法难以建模的问题,为提升高动态协同攻击条件下的攻击效能,建立动态战场环境模型和多目标分配的单回合马尔可夫决策模型,提出一种改进深度确定性策略梯度的分配算法.通过与模拟器的交互自动求解最佳分配策略,利用mask方法对动作空间进行掩码操作,实现算法对平台数量和类型的适应能力.实验结果表明,在各种不同舰船的防御配置和红蓝双方数量配置下,算法求解得到的攻击策略相对于随机策略的性能提升约为87.5%,模型推理时间约为0.04ms.研究结果将加速基于深度确定性梯度学习的方法在高动态环境下智能决策中的应用,对集群自主决策方法的研究具有推动作用. 展开更多
关键词 多弹协同 动态环境 目标分配 深度确定性策略梯度 马尔可夫决策模型
在线阅读 下载PDF
服务多类需求串行供应链的最优控制策略 被引量:8
6
作者 周伟华 吴晓波 杜健 《管理科学学报》 CSSCI 北大核心 2010年第3期19-28,共10页
研究由一系列生产环节采用串行方式组成多级供应链的最优控制策略.在此供应链中,原材料经过各级生产环节顺序加工形成最终产品.各级生产环节的加工时间服从随机分布.对最终产品存在多类随机需求.在每个时刻,管理者需要决定:1)是否该启... 研究由一系列生产环节采用串行方式组成多级供应链的最优控制策略.在此供应链中,原材料经过各级生产环节顺序加工形成最终产品.各级生产环节的加工时间服从随机分布.对最终产品存在多类随机需求.在每个时刻,管理者需要决定:1)是否该启动某个生产环节的生产;2)当有需求到达时,是否该满足此需求.管理者期望系统运行的总期望折扣成本最小.构造了该系统的马尔可夫决策模型并深入研究了其最优控制策略及其动态协同特性.在生产策略方面,证明系统的最优生产策略就是对各级生产环节采用动态的基本库存策略.该策略的动态协同特性主要体现在各级生产环节的最优基本库存水平受其他生产环节的库存水平影响.在产品分配方面,证明系统的最优分配策略是动态配给策略.该策略的动态协同特性主要体现在每类随机需求最优配给水平受各级生产环节的库存水平影响. 展开更多
关键词 多级串行系统 马尔可夫决策模型 多类随机需求 随机提前期
在线阅读 下载PDF
云计算中虚拟机资源自动配置技术的研究 被引量:12
7
作者 薛涛 刘龙 《计算机应用研究》 CSCD 北大核心 2016年第3期759-764,共6页
针对云资源管理者所面临的负载动态变化以及弹性资源需求等问题,提出一种虚拟机资源的自动配置管理技术,把强化学习技术引入云虚拟资源的管理,将虚拟机的配置管理过程建模为马尔可夫决策模型,根据系统的运行状态以及输入负载的动态变化... 针对云资源管理者所面临的负载动态变化以及弹性资源需求等问题,提出一种虚拟机资源的自动配置管理技术,把强化学习技术引入云虚拟资源的管理,将虚拟机的配置管理过程建模为马尔可夫决策模型,根据系统的运行状态以及输入负载的动态变化自动决策添加或删除虚拟机的行为。实验结果验证了该技术能够根据负载的动态变化完成云虚拟资源的自动配置管理任务,及时响应终端用户的实时性任务请求,保证了云资源使用者的SLA需求。 展开更多
关键词 云计算 自动配置 强化学习 马尔可夫决策模型
在线阅读 下载PDF
基于POMDP的动态客户关系管理建模研究 被引量:2
8
作者 马少辉 刘金兰 《系统工程学报》 CSCD 北大核心 2010年第3期387-393,共7页
从多阶段、延迟回报的角度提出基于部分可观察马尔可夫决策过程(POMDP)对客户关系的动态发展与管理进行建模的方法.模型以客户关系作为隐状态,以客户购买水平作为隐状态的观察值,以客户管理行动为决策变量.通过模型,可以动态估计客户的... 从多阶段、延迟回报的角度提出基于部分可观察马尔可夫决策过程(POMDP)对客户关系的动态发展与管理进行建模的方法.模型以客户关系作为隐状态,以客户购买水平作为隐状态的观察值,以客户管理行动为决策变量.通过模型,可以动态估计客户的关系状态,可以估计各行动对客户关系动态演化的影响,并以客户终生价值为目标优化管理行动.以客户保持-流失两状态客户关系模型为例,说明了模型的具体应用. 展开更多
关键词 客户关系管理 客户终生价值 部分可观察马尔可夫决策模型
在线阅读 下载PDF
状态不完全可观条件下设备检修策略研究 被引量:3
9
作者 刘繁茂 朱海平 +1 位作者 邵新宇 高贵兵 《计算机集成制造系统》 EI CSCD 北大核心 2009年第8期1628-1632,1663,共6页
为了诊断状态不完全可观条件下的设备状况,介绍了部分可观察的马尔可夫决策过程的基本原理和Perseus近似算法的基本流程。给出了基于设备加工次品率和某些核心组件振动信号诊断信息的设备状态评估方法。在基于设备状态的视情维修模式下... 为了诊断状态不完全可观条件下的设备状况,介绍了部分可观察的马尔可夫决策过程的基本原理和Perseus近似算法的基本流程。给出了基于设备加工次品率和某些核心组件振动信号诊断信息的设备状态评估方法。在基于设备状态的视情维修模式下,考虑了检测手段的局限性和检测结果的不确定性,并以某轿车发动机缸体生产线上的一台加工中心为例,建立了以最小化折扣费用为目标的设备检测维修的部分可观察马尔可夫决策过程模型。最后应用Perseus近似算法对模型进行了求解,得到了有限区间条件下的近似最优检测、维修策略和近似最优的折扣费用值。 展开更多
关键词 部分可观察马尔可夫决策过程模型 检测维修策略 视情维修 Perseus算法
在线阅读 下载PDF
基于分层POMDP的智能轮椅行为控制方法 被引量:3
10
作者 陶永 王田苗 +1 位作者 魏洪兴 陈殿生 《高技术通讯》 CAS CSCD 北大核心 2010年第6期613-617,共5页
针对部分可观察马尔可夫决策过程(POMDP)模型在智能轮椅控制上的应用因模型参数难以确定而受到限制的问题,将POMDP模型决策过程中的动作空间分成一系列较小动作子集,进而提出了一种基于分层POMDP模型的智能轮椅行为控制方法。该方法综... 针对部分可观察马尔可夫决策过程(POMDP)模型在智能轮椅控制上的应用因模型参数难以确定而受到限制的问题,将POMDP模型决策过程中的动作空间分成一系列较小动作子集,进而提出了一种基于分层POMDP模型的智能轮椅行为控制方法。该方法综合了动作的不确定性和状态的部分可观测性,通过对环境的观测和信息的采集,得到不确定环境下的最优策略选择,进而选择相应的最优动作,从而提高了动作的执行效率。在室内家居环境下进行的交互任务与导航控制试验以及对实验结果进行的分析验证了这一方法的实时性、有效性和可靠性。 展开更多
关键词 智能轮椅 行为控制方法 分层的部分可观测马尔可夫决策过程(POMDP)模型
在线阅读 下载PDF
基于POMDP算法的微铣削优化切削策略研究 被引量:2
11
作者 任星宇 刘同舜 +1 位作者 李怡 丁浩淇 《工具技术》 北大核心 2021年第10期8-12,共5页
优化切削过程对降低微铣削刀具使用成本具有重要意义。由于微铣刀磨损迅速且具有较强的不确定性,传统的优化方案难以保证优化效果。为此,本文提出一种基于刀具磨损过程监测与控制的微铣削加工优化方案。通过分析切削参数对微铣削刀具磨... 优化切削过程对降低微铣削刀具使用成本具有重要意义。由于微铣刀磨损迅速且具有较强的不确定性,传统的优化方案难以保证优化效果。为此,本文提出一种基于刀具磨损过程监测与控制的微铣削加工优化方案。通过分析切削参数对微铣削刀具磨损演化过程以及微铣刀磨损对切削性能的影响,构建微铣削加工过程的部分可观马尔可夫决策模型(POMDP),基于磨损监测信息,运用POMDP算法求解反馈调控切削参数的最优策略,控制刀具磨损过程,使微铣刀在其有限的寿命里被充分使用,并设计实验验证最优控制策略的有效性。实验结果表明,本文提出的基于刀具磨损监测和最优控制的微铣削优化方案可有效降低微铣刀使用成本。 展开更多
关键词 微铣削 刀具磨损 状态监测 最优控制 部分可观马尔可夫决策模型
在线阅读 下载PDF
A dynamic model for railway freight overbooking 被引量:2
12
作者 冯芬玲 张佳琪 郭晓峰 《Journal of Central South University》 SCIE EI CAS CSCD 2015年第8期3257-3264,共8页
In order to apply overbooking idea in Chinese railway freight industry to improve revenue, a Markov decision process(dynamic programming) model for railway freight reservation was formulated and the overbooking limit ... In order to apply overbooking idea in Chinese railway freight industry to improve revenue, a Markov decision process(dynamic programming) model for railway freight reservation was formulated and the overbooking limit level was proposed as a control policy. However, computing the dynamic programming treatment needs six nested loops and this will be burdensome for real-world problems. To break through the calculation limit, the properties of value function were analyzed and the overbooking protection level was proposed to reduce the calculating quantity. The simulation experiments show that the overbooking protection level for the lower-fare class is higher than that for the higher-fare class, so the overbooking strategy is nested by fare class. Besides, by analyzing the influence on the overbooking strategy of freight arrival probability and cancellation probability, the proposed approach is efficient and also has a good application prospect in reality. Also, compared with the existing reservation(FCFS), the overbooking strategy performs better in the fields of vacancy reduction and revenue improvement. 展开更多
关键词 revenue management railway freight OVERBOOKING dynamic model
在线阅读 下载PDF
A novel dynamic call admission control policy for wireless network 被引量:1
13
作者 黄国盛 陈志刚 +2 位作者 李庆华 赵明 郭真 《Journal of Central South University》 SCIE EI CAS 2010年第1期110-116,共7页
To address the issue of resource scarcity in wireless communication, a novel dynamic call admission control scheme for wireless mobile network was proposed. The scheme established a reward computing model of call admi... To address the issue of resource scarcity in wireless communication, a novel dynamic call admission control scheme for wireless mobile network was proposed. The scheme established a reward computing model of call admission of wireless cell based on Markov decision process, dynamically optimized call admission process according to the principle of maximizing the average system rewards. Extensive simulations were conducted to examine the performance of the model by comparing with other policies in terms of new call blocking probability, handoff call dropping probability and resource utilization rate. Experimental results show that the proposed scheme can achieve better adaptability to changes in traffic conditions than existing protocols. Under high call traffic load, handoff call dropping probability and new call blocking probability can be reduced by about 8%, and resource utilization rate can be improved by 2%-6%. The proposed scheme can achieve high source utilization rate of about 85%. 展开更多
关键词 wireless network call admission control quality of service Markov decision process
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部