期刊文献+
共找到148篇文章
< 1 2 8 >
每页显示 20 50 100
基于马尔可夫决策过程的中国石油战略储备模型分析
1
作者 刘婧 侯孟睿 +1 位作者 刘冲昊 贾祥英 《中国矿业》 北大核心 2025年第2期126-138,共13页
石油被称为“国民经济的血液”,是国家的重要战略资源,在国家经济安全中发挥着战略支撑作用。当前国际环境变乱交织,大国间博弈逐步加剧,国际油价震荡不定,中国作为能源需求大国,石油对外依存度始终处于高位,为更好应对石油市场的不确... 石油被称为“国民经济的血液”,是国家的重要战略资源,在国家经济安全中发挥着战略支撑作用。当前国际环境变乱交织,大国间博弈逐步加剧,国际油价震荡不定,中国作为能源需求大国,石油对外依存度始终处于高位,为更好应对石油市场的不确定性及供应中断风险,制定科学合理的战略储备策略尤为重要。本文研究旨在运用马尔可夫决策过程,构建符合中国国情的石油战略储备模型,为保障国家能源安全提供决策依据。模型考虑石油价格波动、供应中断概率及持续时间等因素,通过定义时间阶段、石油价格、供应量、断供幅度等参数和变量,采用动态规划方法构建奖励函数,提出约束条件,通过情景分析研究各类不确定因素对储备策略的影响。研究结果表明,石油需求弹性、供应中断概率和储备成本系数等因素对储备规模和策略有显著影响,高中断持续时间风险会使最优储备规模显著增加,且不同中断持续时间下储备释放策略不同。模型计算结果在一定程度上反映了不同情景下中国石油战略储备的合理规模和调整策略,但实际情况更为复杂,需综合考虑多方面因素。模型结果为决策提供了重要参考依据,敏感性分析有助于深入理解各因素对储备决策的影响机制,从而在实际中制定更科学合理的石油战略储备策略。分析石油战略储备政策对矿业资本市场的潜在影响,可以通过优化储备策略来提高资源的高质化利用,增强中国在全球石油市场中的能源安全和经济稳定性。本文研究不仅为石油战略储备政策提供了决策支持,也为其他战略性矿产资源的管理提供了借鉴,为政策制定者提供了重要参考。 展开更多
关键词 石油战略储备 石油供应中断 马尔可夫决策过程 储备释放与获取策略 动态规划
在线阅读 下载PDF
基于马尔可夫决策过程的边缘云业务迁移算法
2
作者 马安华 潘甦 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2024年第6期1931-1939,共9页
在移动互联网中,当用户位置发生改变时,业务迁移可用来提升服务质量(QoS)。基于此,提出一种基于马尔可夫决策过程的边缘云业务迁移算法。与对比算法相比,所提算法考虑了不同业务类型对QoS的差异化需求,并全面考虑了业务迁移过程中的收... 在移动互联网中,当用户位置发生改变时,业务迁移可用来提升服务质量(QoS)。基于此,提出一种基于马尔可夫决策过程的边缘云业务迁移算法。与对比算法相比,所提算法考虑了不同业务类型对QoS的差异化需求,并全面考虑了业务迁移过程中的收益及开销。所提算法将业务分为实时和非实时2类,将终端的业务运行状态和与服务器的距离作为状态空间,并基于与业务体验紧密相关的可用速率和时延2个QoS指标构建收益函数,同时将业务迁移过程中的系统资源消耗作为迁移开销,通过最大化全局收益来获取最优迁移策略。通过与对比算法的模拟比较,所提算法在多种场景下都有更高的全局收益。 展开更多
关键词 业务迁移 马尔可夫决策过程 服务质量 迁移开销 业务类型
在线阅读 下载PDF
异构无线网络中基于马尔可夫决策过程的区分业务接纳控制的研究 被引量:10
3
作者 邓强 陈山枝 +1 位作者 胡博 时岩 《通信学报》 EI CSCD 北大核心 2010年第12期27-36,共10页
对异构无线网络中区分业务类型的接纳控制机制进行研究。分析了语音和数据2种典型业务在CDMA蜂窝网络和WLAN中的容量区域。基于马尔可夫决策过程理论,提出异构无线网络中区分业务类型的接纳控制理论模型,规定了不同类型业务的接纳控制... 对异构无线网络中区分业务类型的接纳控制机制进行研究。分析了语音和数据2种典型业务在CDMA蜂窝网络和WLAN中的容量区域。基于马尔可夫决策过程理论,提出异构无线网络中区分业务类型的接纳控制理论模型,规定了不同类型业务的接纳控制行为并推导了系统状态转移概率。而且,进一步从用户角度对不同类型业务QoS要求和网络状态之间关系进行分析,提出一种基于模糊逻辑的接纳效用评估机制,在保证各类业务接入和切换成功率的基础上,推导出接纳效用最大的最优接纳控制策略。仿真表明,基于模糊逻辑的接纳效用评估能够有效反映网络状态动态变化对接纳控制的影响,最优接纳控制策略在平均接纳效用方面明显优于不考虑业务区分和用户移动性2种接纳控制机制,并且能严格保证各类业务的接入和切换成功率。 展开更多
关键词 异构无线网络 接纳控制 业务区分 马尔可夫决策过程
在线阅读 下载PDF
基于马尔可夫过程的牵引供电设备维修决策模型及其应用 被引量:6
4
作者 张奥 林圣 +1 位作者 冯玎 何正友 《铁道学报》 EI CAS CSCD 北大核心 2017年第11期38-45,共8页
传统的牵引供电设备固定计划维修模式存在着维修过剩与维修不足的问题,随着维管单位和牵引变电所信息化水平的逐步提高,状态维修模式取代固定计划维修模式已成为可能。本文将设备健康状态引入牵引供电设备维修决策中,基于马尔可夫决策... 传统的牵引供电设备固定计划维修模式存在着维修过剩与维修不足的问题,随着维管单位和牵引变电所信息化水平的逐步提高,状态维修模式取代固定计划维修模式已成为可能。本文将设备健康状态引入牵引供电设备维修决策中,基于马尔可夫决策过程建立牵引供电设备的维修决策模型。该模型考虑了基于Gauss-Poisson过程的牵引供电设备全寿命周期健康状态劣化过程和预防性维修过程,以设备全寿命周期的单位时间综合成本为优化目标,采用策略迭代法实现牵引供电设备在不同健康状态下最优维修方式和维修周期的选择。结果表明该模型可行有效,为优化牵引供电设备的维修维护方案,实现状态维修提供依据。 展开更多
关键词 牵引供电设备 劣化过程 维修决策 马尔可夫决策过程
在线阅读 下载PDF
基于马尔可夫决策过程的医疗检查预约优化模型 被引量:11
5
作者 罗利 秦春蓉 罗永 《运筹与管理》 CSSCI CSCD 北大核心 2014年第6期12-16,共5页
医技部门的医疗检查如电子计算机断层扫描(CT)、核磁共振成像设备(MRI)、X射线(X-rays)常常有如下三种病人类型:门诊病人、住院病人和急诊病人。针对不同病人类型的需求特点,运用马尔可夫决策过程原理和动态规划方法,建立了医疗检查设... 医技部门的医疗检查如电子计算机断层扫描(CT)、核磁共振成像设备(MRI)、X射线(X-rays)常常有如下三种病人类型:门诊病人、住院病人和急诊病人。针对不同病人类型的需求特点,运用马尔可夫决策过程原理和动态规划方法,建立了医疗检查设备的预约优化模型,并证明了模型的最优性质,得出了不同病人类型的最优预约策略。数值算例的结果表明:本文的预约策略不仅易于实施,而且,通过该模型获得的最大收益比按传统先来先预约的模式所获得的收益要大。 展开更多
关键词 管理科学与工程 预约优化 马尔可夫决策过程 医疗检查
在线阅读 下载PDF
基于部分可观察马尔可夫决策过程的多被动传感器组网协同反隐身探测任务规划 被引量:12
6
作者 万开方 高晓光 +1 位作者 李波 梅军峰 《兵工学报》 EI CAS CSCD 北大核心 2015年第4期731-743,共13页
针对反隐身作战需求,提出多被动传感器组网协同战术。为提升反隐身探测效能,引入部分可观察马尔可夫决策过程(POMDP)理论,分析了POMDP任务规划要素,建立起多被动传感器组网协同反隐身探测任务规划POMDP模型。建立了多被动传感器协同控... 针对反隐身作战需求,提出多被动传感器组网协同战术。为提升反隐身探测效能,引入部分可观察马尔可夫决策过程(POMDP)理论,分析了POMDP任务规划要素,建立起多被动传感器组网协同反隐身探测任务规划POMDP模型。建立了多被动传感器协同控制系统结构,提出了基于无迹卡尔曼滤波(UKF)的信念状态更新方法和基于蒙特卡洛Rollout采样(MCRS)的Q值估计方法,并设计了CCSP基本策略。仿真结果表明,所建立的模型能够实现多被动传感器的高效管理调度,能够控制多被动传感器对隐身目标进行有效探测跟踪,即模型有效性得到了验证。 展开更多
关键词 控制科学与技术 传感器技术 反隐身 多传感器组网 部分可观察马尔可夫决策过程 信念状态 任务规划
在线阅读 下载PDF
一种基于马尔可夫决策过程的认知无线电网络传输调度方案 被引量:5
7
作者 朱江 徐斌阳 李少谦 《电子与信息学报》 EI CSCD 北大核心 2009年第8期2019-2023,共5页
该文提出了一种适用于认知无线电网络的跨层传输调度方案,即满足掉包率约束的前提下最小化平均功率消耗。此方案被建模为约束马尔可夫决策过程(MDP)。采用拉格朗日乘子法求解此MDP,并且提出了一种黄金分割乘子搜索法。提出两种简化方法... 该文提出了一种适用于认知无线电网络的跨层传输调度方案,即满足掉包率约束的前提下最小化平均功率消耗。此方案被建模为约束马尔可夫决策过程(MDP)。采用拉格朗日乘子法求解此MDP,并且提出了一种黄金分割乘子搜索法。提出两种简化方法,即状态聚合以及行动集缩减来解决维灾问题。仿真结果显示简化方法对该方案的性能影响很小,且该方案的平均功耗最低。 展开更多
关键词 认知无线电 马尔可夫决策过程 跨层设计 传输调度
在线阅读 下载PDF
马尔可夫决策过程在视情维修中的应用 被引量:3
8
作者 张秀斌 郭波 谭跃进 《工业工程》 2002年第6期53-55,共3页
在实际应用视情维修中,维修时机的确定通常是通过经验或简单的趋势检验,其结果比较粗糙,不便于应用。在本文中,我们研究了应用马尔可夫过程描述系统劣化的过程。针对维修与不维修两种决策行为,以单位时间费用最低为目标的决策过程,并给... 在实际应用视情维修中,维修时机的确定通常是通过经验或简单的趋势检验,其结果比较粗糙,不便于应用。在本文中,我们研究了应用马尔可夫过程描述系统劣化的过程。针对维修与不维修两种决策行为,以单位时间费用最低为目标的决策过程,并给出了具体算法计算维修状态阈值。最后,通过一个例子说明了决策的过程。 展开更多
关键词 马尔可夫决策过程 视情维修 设备维修 预防性维修
在线阅读 下载PDF
基于马尔可夫决策过程的MES系统动态调度方法 被引量:2
9
作者 赵海峰 姜兴宇 +1 位作者 王贵和 王宛山 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2007年第8期1178-1181,共4页
针对以事件为驱动的网络化制造环境下生产系统的特征,扩展马尔可夫决策过程,根据生产制造的特点进行动态生产调度方法的研究.以面向用户标准为基础,用制造系统响应时间来评价调度算法在不同规则下具有的性能特点;根据分析结果分别确定... 针对以事件为驱动的网络化制造环境下生产系统的特征,扩展马尔可夫决策过程,根据生产制造的特点进行动态生产调度方法的研究.以面向用户标准为基础,用制造系统响应时间来评价调度算法在不同规则下具有的性能特点;根据分析结果分别确定各种调度规则在预期时间内能够达到生产优化调度或满意调度的可能程度.将调度规则与实际生产相结合,设计网络化制造环境下动态调度指令单管理系统,实现制造管理的信息化.本系统可以按照用户需求实时反映生产制造信息;根据企业情况确定调度规则,生成调度决策方案,最大程度保证企业利益. 展开更多
关键词 网络化制造 马尔可夫决策过程 制造执行系统(MES) 动态调度 系统响应时间 指令单管理
在线阅读 下载PDF
基于非负矩阵分解更新规则的部分可观察马尔可夫决策过程信念状态空间降维算法 被引量:1
10
作者 仵博 陈鑫 +1 位作者 郑红燕 冯延蓬 《电子与信息学报》 EI CSCD 北大核心 2013年第12期2901-2907,共7页
针对求解部分可观察马尔可夫决策过程(POMDP)规划问题时遭遇的"维数诅咒",该文提出了一种基于非负矩阵分解(NMF)更新规则的POMDP信念状态空间降维算法,分两步实现低误差高维降维。第1步,利用POMDP的结构特性,将状态、观察和... 针对求解部分可观察马尔可夫决策过程(POMDP)规划问题时遭遇的"维数诅咒",该文提出了一种基于非负矩阵分解(NMF)更新规则的POMDP信念状态空间降维算法,分两步实现低误差高维降维。第1步,利用POMDP的结构特性,将状态、观察和动作进行可分解表示,然后利用动态贝叶斯网络的条件独立对其转移函数进行分解压缩,并去除概率为零的取值,降低信念状态空间的稀疏性。第2步,采用信念状态空间值直接降维方法,使降维后求出的近似最优策略与原最优策略保持一致,使用NMF更新规则来更新信念状态空间,避免Krylov迭代,加快降维速度。该算法不仅保证降维前后值函数不发生改变,又保留了其分段线性凸特性。实验结果表明,该算法具有较低误差率和较高收敛性。 展开更多
关键词 信息处理 部分可观察马尔可夫决策过程 信念状态空间 非负矩阵分解 值直接压缩 维数灾
在线阅读 下载PDF
基于部分可观察马尔可夫决策过程的受控无线网络系统动态资源分配 被引量:2
11
作者 李萌 司鹏搏 +1 位作者 孙恩昌 张延华 《高技术通讯》 北大核心 2017年第3期220-227,共8页
研究了受控无线网络的动态资源分配。针对传统无线通信传输模型的局限性随着无线通信系统架构的发展日益凸显的问题,提出了一种引入反馈控制策略的受控无线网络模型。该模型结合部分可观察马尔可夫决策过程(POMDP),将用户接收功率与数... 研究了受控无线网络的动态资源分配。针对传统无线通信传输模型的局限性随着无线通信系统架构的发展日益凸显的问题,提出了一种引入反馈控制策略的受控无线网络模型。该模型结合部分可观察马尔可夫决策过程(POMDP),将用户接收功率与数据传输误码率作为反馈观测对象,对通信小区内基站天线开启数与用户接入数进行动态资源最优匹配。仿真结果表明,这种方法能够有效提升系统传输能效性与可靠性,降低传输误码率,改善系统资源动态匹配控制性能。 展开更多
关键词 受控网络 反馈策略 资源分配 部分可观察马尔可夫决策过程(POMDP)
在线阅读 下载PDF
基于马尔可夫决策过程的维修决策模型研究 被引量:2
12
作者 王进才 曹学峰 《电子产品可靠性与环境试验》 2011年第2期1-6,共6页
提出了一种基于设备状况进行维修的模型。该模型包括随机失效和针对失效进行有计划检查、维修的过程。运用马尔可夫决策模型,提出了以费用-效果为指标的维修策略。
关键词 失效率 基于条件维修 马尔可夫决策过程
在线阅读 下载PDF
马尔可夫经营过程最优决策的线性规划算法
13
作者 宫佩珊 《青岛大学学报(工程技术版)》 CAS 1998年第3期79-81,共3页
讨论了经营为遍历不可约有限状态马尔可夫过程的最优决策问题,并用线性规划方法求出作为实现最优决策依据的密度矩阵。
关键词 马尔可夫 经营过程 决策 线性规划 最优决策
在线阅读 下载PDF
基于马尔可夫决策过程的数字移动通信系统的研究
14
作者 陈玉仙 罗三定 胡扬 《凿岩机械气动工具》 2006年第2期32-33,共2页
通过介绍数字移动通信模型及相关参数,提供了马尔可夫过程在无线呼叫过程中的控制方案。该方案能较好地描述参数确定下的模型,能提供优化控制策略。对于参数不确定的情形,也能通过统计方式得出其参数分布的规律,从而为进一步解决移动通... 通过介绍数字移动通信模型及相关参数,提供了马尔可夫过程在无线呼叫过程中的控制方案。该方案能较好地描述参数确定下的模型,能提供优化控制策略。对于参数不确定的情形,也能通过统计方式得出其参数分布的规律,从而为进一步解决移动通信控制问题提供了参考依据。 展开更多
关键词 马尔可夫决策过程 数字移动通信系统 无线呼叫
在线阅读 下载PDF
基于马尔可夫决策过程的云平台资源调度 被引量:3
15
作者 邱远 虞慧群 范贵生 《华东理工大学学报(自然科学版)》 CAS CSCD 北大核心 2016年第5期702-707,共6页
云计算平台可以动态地配置资源,适合基于工作流的科学计算。当前云平台的资源调度研究更多考虑运行时长和成本的最优化,而较少提到鲁棒性。本文提出了一种基于马尔可夫决策过程理论的资源调度算法,对工作流任务进行分组,按照任务的计算... 云计算平台可以动态地配置资源,适合基于工作流的科学计算。当前云平台的资源调度研究更多考虑运行时长和成本的最优化,而较少提到鲁棒性。本文提出了一种基于马尔可夫决策过程理论的资源调度算法,对工作流任务进行分组,按照任务的计算量和依赖关系将任务期限分配给各个任务组,在满足工作流总期限的基础上,将异构环境中的云资源分配给工作流的各个任务,通过最大化每个任务组的容忍时间使得整个工作流的鲁棒性达到最优。实验结果表明:该调度算法在异构环境中可以在任务期限和开销内提高调度的鲁棒性。 展开更多
关键词 云计算 资源调度 马尔可夫决策过程 鲁棒性
在线阅读 下载PDF
基于马尔可夫决策的动态电源管理技术 被引量:3
16
作者 储毅 赵敏 《电子科技大学学报》 EI CAS CSCD 北大核心 2007年第3期521-523,共3页
研究了随机最优算法,并建立了该算法的电源管理系统模型。在系统任务响应延迟的约束条件下,应用马尔可夫决策方法对电源管理方案进行优化,得出系统模型最佳的电源管理策略。分析比较表明,一些传统的动态电源管理方法虽然也可以有效地减... 研究了随机最优算法,并建立了该算法的电源管理系统模型。在系统任务响应延迟的约束条件下,应用马尔可夫决策方法对电源管理方案进行优化,得出系统模型最佳的电源管理策略。分析比较表明,一些传统的动态电源管理方法虽然也可以有效地减少系统的能耗,但是对系统的性能却有较大的影响。随机最优算法可以在节约系统能耗和保证系统性能之间取得较好的平衡。 展开更多
关键词 动态电源管理 嵌入式系统 能耗 马尔可夫决策过程 系统性能
在线阅读 下载PDF
基于马尔可夫判定过程的无线传感网络入侵检测研究
17
作者 潘迟龙 《江西通信科技》 2024年第2期49-51,共3页
无线传感网络(Wireless Sensor Networks,WSN)在许多领域中得到广泛应用,但也面临着安全威胁和入侵风险。为了保护无线传感网络免受入侵行为的影响,研究人员开始探索基于马尔可夫判定过程(Markov Decision Process,MDP)的入侵检测方法... 无线传感网络(Wireless Sensor Networks,WSN)在许多领域中得到广泛应用,但也面临着安全威胁和入侵风险。为了保护无线传感网络免受入侵行为的影响,研究人员开始探索基于马尔可夫判定过程(Markov Decision Process,MDP)的入侵检测方法。本文通过综述和分析已有的研究成果,总结了基于马尔可夫判定过程的无线传感网络入侵检测的研究现状和优势。 展开更多
关键词 无线传感网络 入侵检测 马尔可夫判定过程 安全 决策支持
在线阅读 下载PDF
基于马尔可夫决策过程的网格资源发现
18
作者 尚庆红 佘堃 +1 位作者 周明天 代星科 《微电子学与计算机》 CSCD 北大核心 2007年第9期202-205,共4页
传统的网格资源发现方法没有考虑节点和资源本身性能的优劣性。针对这一问题,提出了基于马尔可夫决策过程(MDP)的网格资源发现方法,利用其对固定目标的最优搜索理论建立MDP模型实现报酬最优的资源发现,并对该模型仿真分析,验证其性能。
关键词 马尔可夫决策过程 网格资源发现 网格
在线阅读 下载PDF
马尔可夫决策过程在类风湿关节炎治疗中的应用研究 被引量:2
19
作者 徐伟锋 曹平 《运筹与管理》 CSSCI CSCD 北大核心 2023年第9期150-156,共7页
类风湿关节炎(RA)不仅给人们带来了巨大的身心痛苦,同时也带来了巨大的成本。针对RA的治疗过程,本文提出将马尔可夫决策过程(MDP)应用于该过程中。对于建立MDP所需的各个参数,本文给出定义方式并利用临床数据进行推断。首先本文利用患... 类风湿关节炎(RA)不仅给人们带来了巨大的身心痛苦,同时也带来了巨大的成本。针对RA的治疗过程,本文提出将马尔可夫决策过程(MDP)应用于该过程中。对于建立MDP所需的各个参数,本文给出定义方式并利用临床数据进行推断。首先本文利用患者的实验室指标来衡量健康状态,然后将患者使用的中药视为行动的基础,接着分别将患者指标的改善程度之和与患者两次实验室指标检查之间已住院的时长视为治疗报酬与治疗成本,最后利用相对值迭代算法求解并得到了相应的治疗策略以及治疗报酬与治疗成本。实验结果表明,本文所得到的治疗报酬要高于医院的报酬且治疗成本要低于医院的成本,将MDP模型用于RA的中医治疗中具有一定的临床应用价值。 展开更多
关键词 类风湿关节炎 马尔可夫决策过程 实验室指标 中药
在线阅读 下载PDF
基于马尔可夫决策过程的轨道不平顺维修策略研究
20
作者 何祥国 张斌 +2 位作者 曾城林 邹海浪 罗雁云 《华东交通大学学报》 2023年第5期68-75,共8页
为有效判别轨道几何状态、适应高速铁路养护状态修,开展轨道不平顺维修策略优化研究。选取马尔可夫决策过程,设置轨道状态等级、维修动作空间和维修动作成本等模型参数,利用价值迭代算法进行求解,实现高速铁路线路维修计划的有效制定。... 为有效判别轨道几何状态、适应高速铁路养护状态修,开展轨道不平顺维修策略优化研究。选取马尔可夫决策过程,设置轨道状态等级、维修动作空间和维修动作成本等模型参数,利用价值迭代算法进行求解,实现高速铁路线路维修计划的有效制定。以华东地区某有砟高速铁路线路为例,结合典型劣化速度的轨道单元区段特征,分析马尔可夫决策模型的维修决策优化过程并验证效果,同时探究轨道单元区段在每个决策时刻的最优维修决策,利用蒙特卡洛法模拟规划周期内的维修总成本并与实际维修成本进行对比。结果表明:基于马尔可夫决策过程的轨道不平顺维修决策,能够充分考虑轨道单元区段不平顺劣化的异质性,可以根据轨道单元区段的实际状态和劣化规律科学安排维修活动,提高维修作业的空间分辨率,规划周期内维修决策的优化效果显著,在保证线路高平顺性的同时减少维修成本,对铁路线路轨道养护维修具有指导作用。 展开更多
关键词 高速铁路 轨道不平顺 马尔可夫决策过程 价值迭代算法 养护维修策略
在线阅读 下载PDF
上一页 1 2 8 下一页 到第
使用帮助 返回顶部