期刊文献+
共找到568篇文章
< 1 2 29 >
每页显示 20 50 100
基于MDP和Q-learning的绿色移动边缘计算任务卸载策略
1
作者 赵宏伟 吕盛凱 +2 位作者 庞芷茜 马子涵 李雨 《河南理工大学学报(自然科学版)》 北大核心 2025年第5期9-16,共8页
目的为了在汽车、空调等制造类工业互联网企业中实现碳中和,利用边缘计算任务卸载技术处理生产设备的任务卸载问题,以减少服务器的中心负载,减少数据中心的能源消耗和碳排放。方法提出一种基于马尔可夫决策过程(Markov decision process... 目的为了在汽车、空调等制造类工业互联网企业中实现碳中和,利用边缘计算任务卸载技术处理生产设备的任务卸载问题,以减少服务器的中心负载,减少数据中心的能源消耗和碳排放。方法提出一种基于马尔可夫决策过程(Markov decision process,MDP)和Q-learning的绿色边缘计算任务卸载策略,该策略考虑了计算频率、传输功率、碳排放等约束,基于云边端协同计算模型,将碳排放优化问题转化为混合整数线性规划模型,通过MDP和Q-learning求解模型,并对比随机分配算法、Q-learning算法、SARSA(state action reward state action)算法的收敛性能、碳排放与总时延。结果与已有的计算卸载策略相比,新策略对应的任务调度算法收敛比SARSA算法、Q-learning算法分别提高了5%,2%,收敛性更好;系统碳排放成本比Q-learning算法、SARSA算法分别减少了8%,22%;考虑终端数量多少,新策略比Q-learning算法、SARSA算法终端数量分别减少了6%,7%;系统总计算时延上,新策略明显低于其他算法,比随机分配算法、Q-learning算法、SARSA算法分别减少了27%,14%,22%。结论该策略能够合理优化卸载计算任务和资源分配,权衡时延、能耗,减少系统碳排放量。 展开更多
关键词 碳排放 边缘计算 强化学习 马尔可夫决策过程 任务卸载
在线阅读 下载PDF
Probabilistic Analysis and Multicriteria Decision for Machine Assignment Problem with General Service Times
2
作者 Wang, Jing 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 1994年第1期53-61,共9页
In this paper we carried out a probabilistic analysis for a machine repair system with a general service-time distribution by means of generalized Markov renewal processes. Some formulas for the steady-state performan... In this paper we carried out a probabilistic analysis for a machine repair system with a general service-time distribution by means of generalized Markov renewal processes. Some formulas for the steady-state performance measures. such as the distribution of queue sizes, average queue length, degree of repairman utilization and so on. are then derived. Finally, the machine repair model and a multiple critcria decision-making method are applied to study machine assignment problem with a general service-time distribution to determine the optimum number of machines being serviced by one repairman. 展开更多
关键词 Machine assignment problem Queueing model Multicriteria decision markov processes
在线阅读 下载PDF
基于马尔可夫判定过程的光纤网络入侵检测方法 被引量:1
3
作者 郭海智 贾志诚 李金库 《激光杂志》 北大核心 2025年第3期193-198,共6页
为了可以精准实现光纤网络入侵检测,提出基于马尔可夫判定过程的光纤网络入侵检测方法。通过频域分块技术对光纤网络信号展开信号提纯,利用经验模态分解方法对入侵信号进行初始检测,采用模糊层次分析法确定网络接入行为信用度,对于信用... 为了可以精准实现光纤网络入侵检测,提出基于马尔可夫判定过程的光纤网络入侵检测方法。通过频域分块技术对光纤网络信号展开信号提纯,利用经验模态分解方法对入侵信号进行初始检测,采用模糊层次分析法确定网络接入行为信用度,对于信用度较高的接入行为直接通过,剩余接入行为则利用马尔可夫判定过程展开判定,由此实现入侵检测。实验结果表明,该方法能够快速、准确检测入侵信号,特别是针对Pording数据集所遭受侵入式窃听行为,检出率高达0.985。在整个实验中,该方法检出率的最小值也可以达到0.920,平均检测误判率、平均检测漏判率的最大值分别为0.01、0.02。这说明该方法显著提升光纤网络的安全性和稳定性,为保障网络安全提供有力的支持。 展开更多
关键词 马尔可夫判定过程 光纤网络 经验模态分解 模糊层次分析法 入侵检测
在线阅读 下载PDF
动态电磁环境下多功能雷达一体化发射资源管理方案
4
作者 张鹏 严俊坤 +2 位作者 高畅 李康 刘宏伟 《雷达学报(中英文)》 北大核心 2025年第2期456-469,共14页
传统多功能雷达仅面向目标特性优化发射资源,在动态电磁环境下面临干扰智能时变、优化模型失配的问题。因此,该文提出一种基于数据驱动的一体化发射资源管理方案,旨在通过对动态干扰信息在线感知与利用提升多功能雷达在动态电磁环境下... 传统多功能雷达仅面向目标特性优化发射资源,在动态电磁环境下面临干扰智能时变、优化模型失配的问题。因此,该文提出一种基于数据驱动的一体化发射资源管理方案,旨在通过对动态干扰信息在线感知与利用提升多功能雷达在动态电磁环境下的多目标跟踪(MTT)性能。该方案首先建立马尔可夫决策过程,数学化描述雷达被敌方截获和干扰的风险。而后将该马尔可夫决策过程感知的干扰信息耦合进MTT精度计算,一体化发射资源管理方法被设计为具有约束动作空间的优化问题。最后提出一种贪婪排序回溯算法对其进行求解。仿真结果表明,所提方法在面向动态干扰环境时不仅可以降低敌方截获概率,还能在被干扰时降低干扰对雷达的影响,改善MTT性能。 展开更多
关键词 一体化发射资源管理 多目标跟踪 动态电磁环境 马尔可夫决策过程 优化问题
在线阅读 下载PDF
因果时空语义驱动的深度强化学习抽象建模方法
5
作者 田丽丽 杜德慧 +2 位作者 聂基辉 陈逸康 李荥达 《软件学报》 北大核心 2025年第8期3637-3654,共18页
随着智能信息物理融合系统(intelligent cyber-physical system,ICPS)的快速发展,智能技术在感知、决策、规控等方面的应用日益广泛.其中,深度强化学习因其在处理复杂的动态环境方面的高效性,已被广泛用于ICPS的控制组件中.然而,由于运... 随着智能信息物理融合系统(intelligent cyber-physical system,ICPS)的快速发展,智能技术在感知、决策、规控等方面的应用日益广泛.其中,深度强化学习因其在处理复杂的动态环境方面的高效性,已被广泛用于ICPS的控制组件中.然而,由于运行环境的开放性和ICPS系统的复杂性,深度强化学习在学习过程中需要对复杂多变的状态空间进行探索,这极易导致决策生成时效率低下和泛化性不足等问题.目前对于该问题的常见解决方法是将大规模的细粒度马尔可夫决策过程(Markov decision process,MDP)抽象为小规模的粗粒度马尔可夫决策过程,从而简化模型的计算复杂度并提高求解效率.但这些方法尚未考虑如何保证原状态的时空语义信息、聚类抽象的系统空间和真实系统空间之间的语义一致性问题.针对以上问题,提出基于因果时空语义的深度强化学习抽象建模方法.首先,提出反映时间和空间价值变化分布的因果时空语义,并在此基础上对状态进行双阶段语义抽象以构建深度强化学习过程的抽象马尔可夫模型;其次,结合抽象优化技术对抽象模型进行调优,以减少抽象状态与相应具体状态之间的语义误差;最后,结合车道保持、自适应巡航、交叉路口会车等案例进行了大量的实验,并使用验证器PRISM对模型进行评估分析,结果表明所提出的抽象建模技术在模型的抽象表达能力、准确性及语义等价性方面具有较好的效果. 展开更多
关键词 深度强化学习 抽象建模 因果时空语义 智能信息物理融合系统(ICPS) 马尔可夫决策过程(mdp)
在线阅读 下载PDF
考虑峰值功率受限约束的柔性作业车间调度研究
6
作者 李益兵 曹岩 +3 位作者 郭钧 王磊 李西兴 孙利波 《中国机械工程》 北大核心 2025年第2期280-293,共14页
针对车间峰值功率受限约束下的柔性作业车间调度面临的作业周期增加、机器负荷增大的问题,建立以最小化最大完工时间和最小化机器最大负载为优化目标、考虑车间峰值功率约束的柔性作业车间调度问题(PPCFJSP)模型。为更好地调度决策,首... 针对车间峰值功率受限约束下的柔性作业车间调度面临的作业周期增加、机器负荷增大的问题,建立以最小化最大完工时间和最小化机器最大负载为优化目标、考虑车间峰值功率约束的柔性作业车间调度问题(PPCFJSP)模型。为更好地调度决策,首先将该问题转化为马尔可夫决策过程,基于此设计了一个结合离线训练与在线调度的用于求解PPCFJSP的调度框架。然后设计了一种基于优先级经验重放的双重决斗深度Q网络(D3QNPER)算法,并设计了一种引入噪声的ε-贪婪递减策略,提高了算法收敛速度,进一步提高了求解能力和求解结果的稳定性。最后开展实验与算法对比研究,验证了模型和算法的有效性。 展开更多
关键词 柔性作业车间调度 马尔可夫决策过程 深度强化学习 峰值功率受限
在线阅读 下载PDF
面向成本与可用度的舰船冗余系统与备件库存优化模型
7
作者 龚立雄 范岩淼 +2 位作者 梁嘉乐 肖杪铃 雷彬文 《海军工程大学学报》 北大核心 2025年第2期1-8,共8页
为有效提高舰船冗余系统可用度,并合理控制舰船保障成本,首先基于马尔科夫(Markov)状态转移过程,考虑了系统部件故障、维修周期以及备件预订过程等参数,建立了k/n舰船冗余系统可用度模型,用于反映系统在不同状态下的可用性;然后,基于全... 为有效提高舰船冗余系统可用度,并合理控制舰船保障成本,首先基于马尔科夫(Markov)状态转移过程,考虑了系统部件故障、维修周期以及备件预订过程等参数,建立了k/n舰船冗余系统可用度模型,用于反映系统在不同状态下的可用性;然后,基于全寿命周期费用,构建了一种考虑冗余度和备件库存配置的可用度与成本优化模型,并提出了一种基于边际优化算法的联合优化方法;最后,通过与单一备件库存优化、单一冗余优化方法以及遗传算法和自适应遗传算法的比较,验证了该方法的可行性和有效性。研究结果表明:所提出的联合优化方法能够显著降低舰船冗余系统全寿命周期费用,为舰船冗余系统的可用度分析和成本控制提供了一种新的思路和工具。 展开更多
关键词 markov过程 可用度 冗余 备件库存 决策系统 全寿命周期费用
在线阅读 下载PDF
基于序贯检测的快速马尔可夫决策:理论、方法及应用 被引量:1
8
作者 陈祖旭 陈巍 +1 位作者 李长坤 韩宇星 《信号处理》 北大核心 2025年第3期448-471,共24页
本文立足存在突变状态与检测噪声复杂环境,针对控制后效性与动作迟滞性问题,探索提升决策与控制时效性的方法,提出了一种基于序贯检测的快速马尔可夫决策框架,并应用于智能电网、疾控、水利等若干典型场景。具体的,本文发掘了统计信号... 本文立足存在突变状态与检测噪声复杂环境,针对控制后效性与动作迟滞性问题,探索提升决策与控制时效性的方法,提出了一种基于序贯检测的快速马尔可夫决策框架,并应用于智能电网、疾控、水利等若干典型场景。具体的,本文发掘了统计信号处理中的变化点最速检测与随机最优控制中的马尔可夫决策之间的关联,建立了一种包含四维状态的受约束马尔可夫决策框架。该框架可选择一种可行的联合检测-控制策略,最大化控制对象的期望回报,或达到平均收益与风险的最佳折中。相对于传统的“先检测变化点、后调整可控量”的分层策略,所提出的新方法实现了“边检测变化点,边调整可控量”的跨层协同,可有效应对检测延时、反应迟滞对决策控制时效性带来的挑战。在智能电网、疾控、水利等场景中,均展示了“检中调”的思路显著优于“检后调”的传统方法。最后,本文还简要展望了基于序贯检测的快速马尔可夫决策在海上碳封存、网络攻击检测防御中的潜在应用价值。 展开更多
关键词 统计信号处理 随机最优控制 序贯检测 最速变化点检测 马尔可夫决策过程 受约束马尔可夫决策过程
在线阅读 下载PDF
基于MDP框架的飞行器隐蔽接敌策略 被引量:11
9
作者 徐安 于雷 +2 位作者 寇英信 徐保伟 李战武 《系统工程与电子技术》 EI CSCD 北大核心 2011年第5期1063-1068,共6页
基于近似动态规划(approximate dynamic programming,ADP)对空战飞行器隐蔽接敌决策问题进行研究。基于作战飞行器的战术使用原则,提出了隐蔽接敌过程中的优势区域与暴露区域;构建了基于马尔科夫决策过程(Markov decision process,MDP)... 基于近似动态规划(approximate dynamic programming,ADP)对空战飞行器隐蔽接敌决策问题进行研究。基于作战飞行器的战术使用原则,提出了隐蔽接敌过程中的优势区域与暴露区域;构建了基于马尔科夫决策过程(Markov decision process,MDP)的隐蔽接敌策略的强化学习方法;通过态势得分函数对非连续的即时收益函数进行修正,给出了基于ADP方法的策略学习与策略提取方法。分别针对对手在有无信息源支持情况下的不同机动对策进行了仿真验证。仿真结果表明,将ADP方法应用于隐蔽接敌策略的学习是可行的,在不同态势下可获得较为有效的接敌策略。 展开更多
关键词 隐蔽接敌 马尔科夫决策过程 近似动态规划 空战决策 近似值函数
在线阅读 下载PDF
基于HMDP的无人机三维路径规划 被引量:8
10
作者 洪晔 房建成 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2009年第1期100-103,共4页
路径规划是UAV(Unmanned Aerial Vehicle)自主飞行的重要保障.初步建立了基于MDP(Markov Decision Processes)的全局路径规划模型,把UAV的路径规划看作是给定环境模型和奖惩原则的情况下,寻求最优策略的问题;为解决算法时空开销大、UAV... 路径规划是UAV(Unmanned Aerial Vehicle)自主飞行的重要保障.初步建立了基于MDP(Markov Decision Processes)的全局路径规划模型,把UAV的路径规划看作是给定环境模型和奖惩原则的情况下,寻求最优策略的问题;为解决算法时空开销大、UAV航向改变频繁的缺点,提出一种基于状态聚类方法的HMDP(Hierarchical Markov Decision Processes)模型,并将其拓展到三维规划中.仿真实验证明:这种简单的规划模型可以有效解决UAV的三维全局路径规划问题,为其在实际飞行中的局部规划奠定了基础. 展开更多
关键词 无人机(UAV) 路径规划 马尔可夫决策过程(mdp) 分层马尔可夫决策过程(Hmdp) 仿真
在线阅读 下载PDF
含季节性氢储能的电力系统跨尺度全年时序生产模拟方法
11
作者 金昱烨 方家琨 +5 位作者 艾小猛 钟治垚 魏利屾 朱梦姝 崔世常 文劲宇 《电力系统自动化》 北大核心 2025年第14期120-129,共10页
氢储能是新型电力系统消纳大规模新能源、应对净负荷季节性不均衡问题的关键手段。为充分评估新型电力系统中氢储能对新能源的消纳作用,建立了含季节性氢储能的电力系统全年时序生产模拟模型。针对全年时序生产模拟模型时间跨度长、电... 氢储能是新型电力系统消纳大规模新能源、应对净负荷季节性不均衡问题的关键手段。为充分评估新型电力系统中氢储能对新能源的消纳作用,建立了含季节性氢储能的电力系统全年时序生产模拟模型。针对全年时序生产模拟模型时间跨度长、电力设备数量多、氢储能长时耦合特性所导致的优化计算困难的问题,提出一种基于马尔可夫决策过程(MDP)的全年时序生产模拟模型季节性策略迭代方法。该方法通过评估储氢量对未来时段总运行成本的影响来调整全年时序运行模拟决策,基于储氢量的值函数近似前瞻策略及其并行更新方法实现近似最优解的快速求解。以两个改进系统算例为例,验证了所建模型及其求解方法的有效性。 展开更多
关键词 新型电力系统 电氢耦合 氢储能 时序生产模拟 马尔可夫决策过程
在线阅读 下载PDF
基于MDP随机路径模拟的电动汽车充电负荷时空分布预测 被引量:60
12
作者 张谦 王众 +2 位作者 谭维玉 刘桦臻 李晨 《电力系统自动化》 EI CSCD 北大核心 2018年第20期59-66,共8页
针对电动汽车时空转移随机性的问题,计及实时交通与温度,提出了一种基于马尔可夫决策过程随机路径模拟的城市电动汽车充电负荷时空分布预测方法。首先,根据各类车型充电方式与出行特点对各类电动汽车进行分类;其次,根据蒙特卡洛方法建... 针对电动汽车时空转移随机性的问题,计及实时交通与温度,提出了一种基于马尔可夫决策过程随机路径模拟的城市电动汽车充电负荷时空分布预测方法。首先,根据各类车型充电方式与出行特点对各类电动汽车进行分类;其次,根据蒙特卡洛方法建立各类电动汽车的时空转移模型,采用马尔可夫决策理论对出行路径进行实时动态随机模拟;根据电动汽车实测数据建立温度、交通能耗模型,计算得到实时单位里程耗电量。最后,以某典型城区为例,对不同温度、不同交通状况下电动汽车区域充电负荷进行计算。仿真结果表明,区域内快充负荷较大的节点充电波动性较大,环境温度升高或交通拥堵状况恶化会导致充电负荷高峰的持续时间增高。 展开更多
关键词 电动汽车 时空分布 马尔可夫决策过程 随机路径模拟 充电负荷
在线阅读 下载PDF
氢能综合能源系统的自适应最优能量调度研究 被引量:1
13
作者 吴东阳 崔佳 +3 位作者 赵宇航 王仕瀚 吴筱熳 秦博宇 《电工电能新技术》 北大核心 2025年第3期9-16,共8页
氢能综合能源系统已成为一种应对化石燃料枯竭和日益严峻的气候变化问题的有效方案。为增强系统稳定性,提高运行效率,本文提出一种使用深度确定性策略梯度(DDPG)算法的最优能量调度方法。最优调度问题被建模为一个具有动作空间、环境状... 氢能综合能源系统已成为一种应对化石燃料枯竭和日益严峻的气候变化问题的有效方案。为增强系统稳定性,提高运行效率,本文提出一种使用深度确定性策略梯度(DDPG)算法的最优能量调度方法。最优调度问题被建模为一个具有动作空间、环境状态和动作值函数的马尔科夫决策过程(MDP)问题。基于策略梯度和神经网络,通过对动作-评价网络的训练和策略迭代,提出了基于深度确定性策略梯度的最优能源调度方法,可根据氢能综合能源系统的动态响应进行自适应优化。最后结合算例验证了所提方法的有效性。 展开更多
关键词 氢能综合能源系统 深度确定性策略梯度 马尔科夫决策过程 自适应最优能量调度
在线阅读 下载PDF
一种无人机冲突探测与避让系统决策方法
14
作者 汤新民 李帅 +1 位作者 顾俊伟 管祥民 《电子与信息学报》 北大核心 2025年第5期1301-1309,共9页
针对无人机探测与避让(DAA)系统中无人机飞行碰撞避免的决策问题,该文提出一种将无人机系统检测和避免警报逻辑(DAIDALUS)和马尔可夫决策过程(MDP)相结合的方法。DAIDALUS算法的引导逻辑可以根据当前状态空间计算无人机避撞策略,将这些... 针对无人机探测与避让(DAA)系统中无人机飞行碰撞避免的决策问题,该文提出一种将无人机系统检测和避免警报逻辑(DAIDALUS)和马尔可夫决策过程(MDP)相结合的方法。DAIDALUS算法的引导逻辑可以根据当前状态空间计算无人机避撞策略,将这些策略作为MDP的动作空间,并设置合适的奖励函数和状态转移概率,建立MDP模型,探究不同折扣因子对无人机飞行避撞过程的影响。仿真结果表明:相比于DAIDALUS,本方法的效率提升27.2%;当折扣因子设置为0.99时,可以平衡长期与短期收益;净空入侵率为5.8%,威胁机与本机最近距离为343 m,该方法可以满足无人机飞行过程中避撞的要求。 展开更多
关键词 无人机系统 探测与避让 马尔可夫决策过程 奖励函数
在线阅读 下载PDF
云网融合环境下服务组合的未来属性验证
15
作者 王湛 张鹏程 +1 位作者 金惠颖 吉顺慧 《计算机工程》 北大核心 2025年第3期310-319,共10页
随着云网融合技术以及空天地一体化网络的快速发展,越来越多的服务开始在云网融合环境下运行。在云网融合环境下,用户呈现移动性特征,导致服务组合过程变得愈发复杂,服务组合验证变得尤为关键。同时,在云网融合环境下用户要求服务组合... 随着云网融合技术以及空天地一体化网络的快速发展,越来越多的服务开始在云网融合环境下运行。在云网融合环境下,用户呈现移动性特征,导致服务组合过程变得愈发复杂,服务组合验证变得尤为关键。同时,在云网融合环境下用户要求服务组合不仅在当前时间段内稳定运行,还需要在未来时间段内持续满足用户需求。为了解决以上问题,提出一种云网融合环境下的服务组合未来属性验证方法。首先,对云网融合中的服务组合过程进行形式化建模,同时考虑用户移动导致的云网环境下服务场景的转换关系;然后,为了准确描述用户需求,对云网融合场景下的用户需求进行形式化描述;最后,为了解决云网融合环境下用户对服务组合未来时间段内的验证需求,对服务组合未来时间段的服务属性进行预测,利用PRISM模型检验工具来进行云网融合环境下的服务组合验证,以确保在未来时间段内仍然满足性能和可用性要求。实验结果表明,在云网融合环境下,当服务数量达到1000时验证模型构建时间以及模型检测时间分别为3.372 s和0.075 s,通过云网融合环境下的服务组合案例说明了所提方法的有效性与可行性。 展开更多
关键词 云网融合 服务组合 马尔可夫决策过程 服务质量 形式化验证
在线阅读 下载PDF
基于POMDP的信道感知接入算法 被引量:2
16
作者 郭文慧 王亚林 韩迎鸽 《计算机工程与应用》 CSCD 2014年第5期203-207,共5页
在认知无线电中,为了最大化次用户的吞吐量,同时对主用户的干扰低于预定值,提出一种基于POMDP的信道感知接入算法。次用户将主用户信道在时间轴上细分成等间隔的时隙,在每个时隙开始时,次用户从频谱感知、以较高的功率接入信道和以较低... 在认知无线电中,为了最大化次用户的吞吐量,同时对主用户的干扰低于预定值,提出一种基于POMDP的信道感知接入算法。次用户将主用户信道在时间轴上细分成等间隔的时隙,在每个时隙开始时,次用户从频谱感知、以较高的功率接入信道和以较低的功率接入信道三种可选策略中选择最优的策略。将次用户的选择过程建模成一个POMDP问题,并采用一些相应的最优策略求解。计算机仿真结果验证了算法的有效性。 展开更多
关键词 认知无线电 频谱感知 吞吐量 半马尔科夫链 PARTIALLY OBSERVABLE markov decision process(POmdp)
在线阅读 下载PDF
基于Markov决策过程用交叉熵方法优化软件测试 被引量:11
17
作者 张德平 聂长海 徐宝文 《软件学报》 EI CSCD 北大核心 2008年第10期2770-2779,共10页
研究了待测软件某些参数已知的条件下,以最小化平均测试费用为目标的软件测试优化问题.将软件测试过程处理成马尔可夫(Markov)决策过程,给出了软件测试的马尔可夫决策模型,运用交叉熵方法,通过一种学习策略获得软件测试的最优测试剖面,... 研究了待测软件某些参数已知的条件下,以最小化平均测试费用为目标的软件测试优化问题.将软件测试过程处理成马尔可夫(Markov)决策过程,给出了软件测试的马尔可夫决策模型,运用交叉熵方法,通过一种学习策略获得软件测试的最优测试剖面,用于优化软件测试.模拟结果表明,学习策略给出的测试剖面要优于随机测试策略,检测和排除相同数目的软件缺陷,学习策略比随机测试能够显著地减少测试用例数,降低测试成本,提高缺陷检测效率. 展开更多
关键词 软件测试 马尔可夫决策过程 交叉熵方法 最优测试剖面
在线阅读 下载PDF
基于Markov game模型的装备保障信息网络安全态势感知方法研究 被引量:18
18
作者 李玺 卢昱 +1 位作者 刘森 刘锋 《计算机应用研究》 CSCD 北大核心 2017年第11期3441-3445,共5页
为了提升装备保障信息网络的安全态势感知能力,根据装备保障信息网络的特点,提出了基于Markov决策过程和博弈论思想的网络安全态势评估方法。该方法以Markov game模型为核心,通过求解纳什均衡点确定攻守双方的博弈对网络安全造成的影响... 为了提升装备保障信息网络的安全态势感知能力,根据装备保障信息网络的特点,提出了基于Markov决策过程和博弈论思想的网络安全态势评估方法。该方法以Markov game模型为核心,通过求解纳什均衡点确定攻守双方的博弈对网络安全造成的影响,并利用4级数据融合实现对装备保障信息网络安全态势的评估。实验证明,该方法能够综合各类基础信息,准确给出装备保障信息网络的安全态势值。 展开更多
关键词 装备保障信息网络 安全态势评估 markov决策过程 博弈论
在线阅读 下载PDF
Markov过程理论在发电商报价策略选择中的应用 被引量:4
19
作者 刘严 谭忠富 +2 位作者 刘明明 杨力俊 王成文 《电工技术学报》 EI CSCD 北大核心 2005年第12期36-42,共7页
在电力市场的环境下,发电商在报价策略选择的过程中将面临许多不确定性因素,如各时段的系统负荷、市场边际价格、对手的报价策略、自身发电成本等,本文从发电商的角度出发对竞价策略的选择问题进行研究,将竞价策略选择的过程设计成为Mar... 在电力市场的环境下,发电商在报价策略选择的过程中将面临许多不确定性因素,如各时段的系统负荷、市场边际价格、对手的报价策略、自身发电成本等,本文从发电商的角度出发对竞价策略的选择问题进行研究,将竞价策略选择的过程设计成为Markov决策过程——一种抽象的随机优化方法,先将每个时段的报价简化为报价参数的选择,利用Markov过程理论对不确定性因素的出现进行概率估计,将发电商报价策略的选择问题表示为离散的随机优化过程—— Markov决策过程;通过使期望收益最大来计算最优策略,从而确定了每个时段发电商报价参数的最优选择,并将报价参数还原成为报价结果。 展开更多
关键词 markov过程 电力市场 竞价策略 决策制定
在线阅读 下载PDF
不确定SMDP基于全局优化的鲁棒决策问题 被引量:4
20
作者 刘春 唐昊 程文娟 《系统仿真学报》 EI CAS CSCD 北大核心 2005年第11期2704-2707,共4页
考虑半马尔可夫决策过程(SMDP)在一些系统参数不确定,且性能函数依赖于这些参数时的鲁棒决策问题。这些参数的不确定性不仅导致等价无穷小生成子的不确定性,也导致性能函数的不确定性。论文针对相关参数的情况,分别采用不同的全局优化算... 考虑半马尔可夫决策过程(SMDP)在一些系统参数不确定,且性能函数依赖于这些参数时的鲁棒决策问题。这些参数的不确定性不仅导致等价无穷小生成子的不确定性,也导致性能函数的不确定性。论文针对相关参数的情况,分别采用不同的全局优化算法,即填充函数法和模拟退火算法,进行鲁棒控制策略求解。仿真实例说明,全局优化方法的使用保证了平均准则和折扣准则下的计算结果之间当折扣因子趋近于零时的极限关系成立。 展开更多
关键词 半马尔可夫决策过程 性能势 鲁棒决策 全局优化
在线阅读 下载PDF
上一页 1 2 29 下一页 到第
使用帮助 返回顶部