期刊文献+
共找到268篇文章
< 1 2 14 >
每页显示 20 50 100
Heterogeneous Network Selection Optimization Algorithm Based on a Markov Decision Model 被引量:9
1
作者 Jianli Xie Wenjuan Gao Cuiran Li 《China Communications》 SCIE CSCD 2020年第2期40-53,共14页
A network selection optimization algorithm based on the Markov decision process(MDP)is proposed so that mobile terminals can always connect to the best wireless network in a heterogeneous network environment.Consideri... A network selection optimization algorithm based on the Markov decision process(MDP)is proposed so that mobile terminals can always connect to the best wireless network in a heterogeneous network environment.Considering the different types of service requirements,the MDP model and its reward function are constructed based on the quality of service(QoS)attribute parameters of the mobile users,and the network attribute weights are calculated by using the analytic hierarchy process(AHP).The network handoff decision condition is designed according to the different types of user services and the time-varying characteristics of the network,and the MDP model is solved by using the genetic algorithm and simulated annealing(GA-SA),thus,users can seamlessly switch to the network with the best long-term expected reward value.Simulation results show that the proposed algorithm has good convergence performance,and can guarantee that users with different service types will obtain satisfactory expected total reward values and have low numbers of network handoffs. 展开更多
关键词 heterogeneous wireless networks markov decision process reward function genetic algorithm simulated annealing
在线阅读 下载PDF
An Optimized Vertical Handoff Algorithm Based on Markov Process in Vehicle Heterogeneous Network 被引量:4
2
作者 MA Bin DENG Hong +1 位作者 XIE Xianzhong LIAO Xiaofeng 《China Communications》 SCIE CSCD 2015年第4期106-116,共11页
In order to solve the problem the existing vertical handoff algorithms of vehicle heterogeneous wireless network do not consider the diversification of network's status, an optimized vertical handoff algorithm bas... In order to solve the problem the existing vertical handoff algorithms of vehicle heterogeneous wireless network do not consider the diversification of network's status, an optimized vertical handoff algorithm based on markov process is proposed and discussed in this paper. This algorithm takes into account that the status transformation of available network will affect the quality of service(Qo S) of vehicle terminal's communication service. Firstly, Markov process is used to predict the transformation of wireless network's status after the decision via transition probability. Then the weights of evaluating parameters will be determined by fuzzy logic method. Finally, by comparing the total incomes of each wireless network, including handoff decision incomes, handoff execution incomes and communication service incomes after handoff, the optimal network to handoff will be selected. Simulation results show that: the algorithm proposed, compared to the existing algorithm, is able to receive a higher level of load balancing and effectively improves the average blocking rate, packet loss rate and ping-pang effect. 展开更多
关键词 vehicle heterogeneous network vertical handoff markov process fuzzy logic multi-attribute decision
在线阅读 下载PDF
动态电磁环境下多功能雷达一体化发射资源管理方案
3
作者 张鹏 严俊坤 +2 位作者 高畅 李康 刘宏伟 《雷达学报(中英文)》 北大核心 2025年第2期456-469,共14页
传统多功能雷达仅面向目标特性优化发射资源,在动态电磁环境下面临干扰智能时变、优化模型失配的问题。因此,该文提出一种基于数据驱动的一体化发射资源管理方案,旨在通过对动态干扰信息在线感知与利用提升多功能雷达在动态电磁环境下... 传统多功能雷达仅面向目标特性优化发射资源,在动态电磁环境下面临干扰智能时变、优化模型失配的问题。因此,该文提出一种基于数据驱动的一体化发射资源管理方案,旨在通过对动态干扰信息在线感知与利用提升多功能雷达在动态电磁环境下的多目标跟踪(MTT)性能。该方案首先建立马尔可夫决策过程,数学化描述雷达被敌方截获和干扰的风险。而后将该马尔可夫决策过程感知的干扰信息耦合进MTT精度计算,一体化发射资源管理方法被设计为具有约束动作空间的优化问题。最后提出一种贪婪排序回溯算法对其进行求解。仿真结果表明,所提方法在面向动态干扰环境时不仅可以降低敌方截获概率,还能在被干扰时降低干扰对雷达的影响,改善MTT性能。 展开更多
关键词 一体化发射资源管理 多目标跟踪 动态电磁环境 马尔可夫决策过程 优化问题
在线阅读 下载PDF
基于马尔可夫判定过程的光纤网络入侵检测方法
4
作者 郭海智 贾志诚 李金库 《激光杂志》 北大核心 2025年第3期193-198,共6页
为了可以精准实现光纤网络入侵检测,提出基于马尔可夫判定过程的光纤网络入侵检测方法。通过频域分块技术对光纤网络信号展开信号提纯,利用经验模态分解方法对入侵信号进行初始检测,采用模糊层次分析法确定网络接入行为信用度,对于信用... 为了可以精准实现光纤网络入侵检测,提出基于马尔可夫判定过程的光纤网络入侵检测方法。通过频域分块技术对光纤网络信号展开信号提纯,利用经验模态分解方法对入侵信号进行初始检测,采用模糊层次分析法确定网络接入行为信用度,对于信用度较高的接入行为直接通过,剩余接入行为则利用马尔可夫判定过程展开判定,由此实现入侵检测。实验结果表明,该方法能够快速、准确检测入侵信号,特别是针对Pording数据集所遭受侵入式窃听行为,检出率高达0.985。在整个实验中,该方法检出率的最小值也可以达到0.920,平均检测误判率、平均检测漏判率的最大值分别为0.01、0.02。这说明该方法显著提升光纤网络的安全性和稳定性,为保障网络安全提供有力的支持。 展开更多
关键词 马尔可夫判定过程 光纤网络 经验模态分解 模糊层次分析法 入侵检测
在线阅读 下载PDF
基于HMDP的无人机三维路径规划 被引量:8
5
作者 洪晔 房建成 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2009年第1期100-103,共4页
路径规划是UAV(Unmanned Aerial Vehicle)自主飞行的重要保障.初步建立了基于MDP(Markov Decision Processes)的全局路径规划模型,把UAV的路径规划看作是给定环境模型和奖惩原则的情况下,寻求最优策略的问题;为解决算法时空开销大、UAV... 路径规划是UAV(Unmanned Aerial Vehicle)自主飞行的重要保障.初步建立了基于MDP(Markov Decision Processes)的全局路径规划模型,把UAV的路径规划看作是给定环境模型和奖惩原则的情况下,寻求最优策略的问题;为解决算法时空开销大、UAV航向改变频繁的缺点,提出一种基于状态聚类方法的HMDP(Hierarchical Markov Decision Processes)模型,并将其拓展到三维规划中.仿真实验证明:这种简单的规划模型可以有效解决UAV的三维全局路径规划问题,为其在实际飞行中的局部规划奠定了基础. 展开更多
关键词 无人机(UAV) 路径规划 马尔可夫决策过程(mdp) 分层马尔可夫决策过程(Hmdp) 仿真
在线阅读 下载PDF
基于Markov过程的集束型设备预防维护策略 被引量:4
6
作者 綦法群 周炳海 《上海交通大学学报》 EI CAS CSCD 北大核心 2014年第10期1461-1467,共7页
为了更好地保障集束型晶圆制造设备运行的可靠性,同时考虑维护的经济性,建立了基于Markov过程的预防性维护策略.根据集束型设备的特点,采用大修和小修相结合的预防性维护方式,同时考虑随机失效和退化失效两种失效形式,建立了状态转移模... 为了更好地保障集束型晶圆制造设备运行的可靠性,同时考虑维护的经济性,建立了基于Markov过程的预防性维护策略.根据集束型设备的特点,采用大修和小修相结合的预防性维护方式,同时考虑随机失效和退化失效两种失效形式,建立了状态转移模型.依据Markov理论求得设备各状态的稳态概率及状态转移概率.再根据Markov决策理论及策略迭代算法求得最佳维护策略.实验结果表明,所提出的预防性维护策略有效可行. 展开更多
关键词 预防性维护 markov过程 markov决策过程 随机失效 退化失效
在线阅读 下载PDF
基于MDP的战机对抗导弹措施优化方法 被引量:1
7
作者 宋海方 肖明清 +1 位作者 陈游 胡阳光 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2017年第5期942-950,共9页
对战机对抗导弹的措施优化问题进行了研究,将该问题归结为不确定条件下的序贯决策问题,提出了一种基于Markov决策过程(MDP)的导弹对抗措施优化方法。首先,该方法根据作战过程将作战阶段分为不同的状态,将电子对抗措施(ECM)和战术机动作... 对战机对抗导弹的措施优化问题进行了研究,将该问题归结为不确定条件下的序贯决策问题,提出了一种基于Markov决策过程(MDP)的导弹对抗措施优化方法。首先,该方法根据作战过程将作战阶段分为不同的状态,将电子对抗措施(ECM)和战术机动作为可供战机选择的行动;然后,通过不同战术行动下状态之间的转移概率来反映行动的不确定性,以雷达搜索状态和导弹命中状态的期望值来表征不同策略下的飞机生存力;最后,通过建立Markov决策模型得到飞机生存力最大时各个状态对应的最佳行动。仿真结果表明:飞机生存力随着时间推移而逐渐降低;不同策略下飞机的生存力不同,基于MDP的策略可以有效提高飞机的生存力;单步优化措施不能提高战机的生存力,必须考虑长期状态转移的影响。 展开更多
关键词 飞机生存力 电子对抗措施(ECM) 战术机动 markov决策过程(mdp) 导弹对抗 序贯决策
在线阅读 下载PDF
异构密集网络下基于POMDP负载感知的负载均衡算法研究 被引量:4
8
作者 唐伦 梁荣 +1 位作者 张亚 陈前斌 《电子与信息学报》 EI CSCD 北大核心 2017年第9期2134-2140,共7页
针对异构密集网络场景中业务不确定性而引起的网络负载不均衡,该文提出一种基于部分可测马尔科夫决策过程(POMDP)负载感知的负载均衡方法。该方法首先通过对系统用户在感知周期内数据包传输数量进行观察,预测出下一周期系统可能出现的... 针对异构密集网络场景中业务不确定性而引起的网络负载不均衡,该文提出一种基于部分可测马尔科夫决策过程(POMDP)负载感知的负载均衡方法。该方法首先通过对系统用户在感知周期内数据包传输数量进行观察,预测出下一周期系统可能出现的负载状态。其次根据负载感知结果动态调整小区范围扩展偏置值(DCRE),以达到优化系统整体负载均衡性的目的。最后采用启发式算法近似求解,能够快速得到次优解。仿真结果表明,该方案能在异构密集网络下提高系统负载均衡性,同时提升了系统吞吐量与系统资源利用率。 展开更多
关键词 异构密集网络 负载均衡 小区范围扩展 部分可测马尔科夫决策过程
在线阅读 下载PDF
基于SMDP的虚拟化无线传感网络资源分配策略 被引量:6
9
作者 王汝言 李宏娟 李红霞 《太赫兹科学与电子信息学报》 北大核心 2020年第1期66-71,共6页
针对传统无线传感网络(WSN)中资源部署与特定任务的耦合关系密切从而造成较低的资源利用率问题,将虚拟化技术引入WSN,提出基于半马尔科夫决策过程(SMDP)的资源分配策略。定义虚拟化WSN的状态集、行为集、状态转移概率,考虑传感网能量受... 针对传统无线传感网络(WSN)中资源部署与特定任务的耦合关系密切从而造成较低的资源利用率问题,将虚拟化技术引入WSN,提出基于半马尔科夫决策过程(SMDP)的资源分配策略。定义虚拟化WSN的状态集、行为集、状态转移概率,考虑传感网能量受限以及完成虚拟传感网络请求(VSNR)的时间,给出奖励的表达式,并使用值迭代的方法求解特定状态下的行为,在提高资源利用率的同时最大化网络资源提供者的长期收益。数值结果表明,所提的资源分配策略能有效提高资源提供者的收益。 展开更多
关键词 无线传感网络 虚拟化 资源分配 半马尔科夫决策过程
在线阅读 下载PDF
多UCAV任务分配有限阶段MDP方法和算法 被引量:2
10
作者 何鹏 周德云 王谦 《火力与指挥控制》 CSCD 北大核心 2012年第10期99-101,104,共4页
多UCAV(U nm anned Com bat A ir V eh icle)任务分配是无人机作战决策的重要内容,是一类求解困难的组合优化问题,目前尚无成熟高效的解决方案。通过马尔可夫决策过程(M DP)将任务分配问题化解为分阶段序列决策过程,并对当前阶段决策状... 多UCAV(U nm anned Com bat A ir V eh icle)任务分配是无人机作战决策的重要内容,是一类求解困难的组合优化问题,目前尚无成熟高效的解决方案。通过马尔可夫决策过程(M DP)将任务分配问题化解为分阶段序列决策过程,并对当前阶段决策状态采用单一整数编码,提出了基于有限阶段M DP的求解算法。通过仿真实验表明:该算法可以快速精确地解决多UCAV任务分配的问题。 展开更多
关键词 无人作战飞机 马尔可夫决策 任务分配 组合优化
在线阅读 下载PDF
隐Markov决策模型 被引量:1
11
作者 赵联文 吴晓雄 郭耀煌 《西南交通大学学报》 EI CSCD 北大核心 2002年第4期467-469,共3页
讨论Markov决策问题中样本与不可观测状态之间的关系问题。引进了避错特征函数的概念 ,利用隐Markov过程的结构和Markov决策模型建立了隐Markov决策模型。并进一步讨论了状态估计和阶段收益函数。
关键词 markov决策模型 随机过程 决策树 markov过程 避错特征函数 状态估计
在线阅读 下载PDF
一种有限时段Markov决策过程的强化学习算法 被引量:4
12
作者 李春贵 刘永信 《广西工学院学报》 CAS 2003年第1期1-4,共4页
研究有限时段非平稳的 Markov决策过程的强化学习算法。通过引入一个人工吸收状态 ,把有限时段问题变为无限时段问题 ,从而可利用通常的强化学习方法来求解。在文献 [3]提出的算法思想基础上 ,提出了一种新的有限时段非平稳的 Markov决... 研究有限时段非平稳的 Markov决策过程的强化学习算法。通过引入一个人工吸收状态 ,把有限时段问题变为无限时段问题 ,从而可利用通常的强化学习方法来求解。在文献 [3]提出的算法思想基础上 ,提出了一种新的有限时段非平稳的 Markov决策过程的强化学习算法 。 展开更多
关键词 强化学习 有限时段 markov决策过程 无完全模型 库存控制 机器学习 非平稳
在线阅读 下载PDF
基于分层POMDP的智能轮椅行为控制方法 被引量:3
13
作者 陶永 王田苗 +1 位作者 魏洪兴 陈殿生 《高技术通讯》 CAS CSCD 北大核心 2010年第6期613-617,共5页
针对部分可观察马尔可夫决策过程(POMDP)模型在智能轮椅控制上的应用因模型参数难以确定而受到限制的问题,将POMDP模型决策过程中的动作空间分成一系列较小动作子集,进而提出了一种基于分层POMDP模型的智能轮椅行为控制方法。该方法综... 针对部分可观察马尔可夫决策过程(POMDP)模型在智能轮椅控制上的应用因模型参数难以确定而受到限制的问题,将POMDP模型决策过程中的动作空间分成一系列较小动作子集,进而提出了一种基于分层POMDP模型的智能轮椅行为控制方法。该方法综合了动作的不确定性和状态的部分可观测性,通过对环境的观测和信息的采集,得到不确定环境下的最优策略选择,进而选择相应的最优动作,从而提高了动作的执行效率。在室内家居环境下进行的交互任务与导航控制试验以及对实验结果进行的分析验证了这一方法的实时性、有效性和可靠性。 展开更多
关键词 智能轮椅 行为控制方法 分层的部分可观测马尔可夫决策过程(POmdp)模型
在线阅读 下载PDF
基于Markov决策过程的驾驶员行为模型 被引量:3
14
作者 许骏 李一兵 《汽车工程》 EI CSCD 北大核心 2008年第1期14-16,60,共4页
将驾驶员-汽车看作统一的人机系统,利用驾驶员驾驶过程的本质是决策过程的性质,通过确定系统的决策时刻、决策报酬、状态转移速率和概率、抽象驾驶员的行为集合等建立了基于Markov决策过程的驾驶员行为模型,最后对所建模型进行了计算机... 将驾驶员-汽车看作统一的人机系统,利用驾驶员驾驶过程的本质是决策过程的性质,通过确定系统的决策时刻、决策报酬、状态转移速率和概率、抽象驾驶员的行为集合等建立了基于Markov决策过程的驾驶员行为模型,最后对所建模型进行了计算机仿真。 展开更多
关键词 驾驶员行为 markov决策过程 模型 人机系统
在线阅读 下载PDF
基于分时MDP的出租车载客预测推荐技术研究 被引量:3
15
作者 王桐 高山 +1 位作者 龚慧雯 孙博 《通信学报》 EI CSCD 北大核心 2021年第2期37-51,共15页
针对出租车盲目寻客导致空载率高的问题,提出了一种出租车载客热点推荐策略,以最大程度优化匹配乘客过程,提高寻客效率。基于出租车历史轨迹数据,结合热点乘客信息的时间序列特性,提出基于循环神经网络的分段预测(SPBR)算法,以及基于分... 针对出租车盲目寻客导致空载率高的问题,提出了一种出租车载客热点推荐策略,以最大程度优化匹配乘客过程,提高寻客效率。基于出租车历史轨迹数据,结合热点乘客信息的时间序列特性,提出基于循环神经网络的分段预测(SPBR)算法,以及基于分时马尔可夫决策过程(TMDP)的载客推荐模型。实验表明,SPBR算法预测结果的RMSE比SVR、CART和BPNN等算法分别降低了67.6%、71.1%和64.5%;TMDP模型出租车期望回报比历史期望提升了35.9%。 展开更多
关键词 出租车空载率 分时马尔可夫决策过程 热点预测 分段预测方法 载客推荐模型
在线阅读 下载PDF
基于POMDP模型的分布式机会频谱接入算法 被引量:2
16
作者 张士兵 王惠建 邹丽 《南京邮电大学学报(自然科学版)》 北大核心 2014年第1期10-16,共7页
针对认知无线电(cognitive radio,CR)信道的动态特性,以部分可观测马尔科夫决策过程(POMDP)为模型对认知无线电网络用户的频谱感知和频谱接入过程进行研究,提出了基于POMDP模型的分布式机会频谱接入算法。该算法利用网络信道的历史频谱... 针对认知无线电(cognitive radio,CR)信道的动态特性,以部分可观测马尔科夫决策过程(POMDP)为模型对认知无线电网络用户的频谱感知和频谱接入过程进行研究,提出了基于POMDP模型的分布式机会频谱接入算法。该算法利用网络信道的历史频谱感知信息对主用户接入信道的状况作出估计,以认知用户吞吐量最大化为目标进行频谱接入。同时,通过贪心算法得到此优化策略的次优解,降低了最优策略的计算复杂度。论文分析了认知用户接入吞吐量与网络中信道数目以及信道状态转移概率之间的关系,将贪心算法与随机检测接入算法进行了仿真比较。仿真结果显示,该算法获得的吞吐量比随机检测接入算法提高了约25%,能够更有效地做出接入策略。 展开更多
关键词 认知无线电 机会频谱接入 吞吐量 POmdp
在线阅读 下载PDF
一种基于最优策略概率分布的POMDP值迭代算法 被引量:4
17
作者 刘峰 王崇骏 骆斌 《电子学报》 EI CAS CSCD 北大核心 2016年第5期1078-1084,共7页
随着应用中POMDP问题的规模不断扩大,基于最优策略可达区域的启发式方法成为了目前的研究热点.然而目前已有的算法虽然保证了全局最优,但选择最优动作还不够精确,影响了算法的效率.本文提出一种基于最优策略概率的值迭代方法 PBVIOP.该... 随着应用中POMDP问题的规模不断扩大,基于最优策略可达区域的启发式方法成为了目前的研究热点.然而目前已有的算法虽然保证了全局最优,但选择最优动作还不够精确,影响了算法的效率.本文提出一种基于最优策略概率的值迭代方法 PBVIOP.该方法在深度优先的启发式探索中,根据各个动作值函数在其上界和下界之间的分布,用蒙特卡罗法计算动作最优的概率,选择概率最大的动作作为最优探索策略.在4个基准问题上的实验结果表明PBVIOP算法能够收敛到全局最优解,并明显提高了收敛效率. 展开更多
关键词 部分可观测马尔科夫决策过程 基于最优策略概率的值迭代算法 蒙特卡罗法
在线阅读 下载PDF
用户偏好提取MDP建模研究 被引量:2
18
作者 黄海清 张平 张曦文 《国防科技大学学报》 EI CAS CSCD 北大核心 2006年第6期81-85,共5页
将马尔可夫判决过程和智能强化学习算法相结合,给出了异构无线网络环境下用户业务偏好评估模型的技术框架。为动态环境下用户需求的感知、量化和适配特征的研究提供了基本的数学描述,对解决用户体验的评价问题和业务与业务环境的适配问... 将马尔可夫判决过程和智能强化学习算法相结合,给出了异构无线网络环境下用户业务偏好评估模型的技术框架。为动态环境下用户需求的感知、量化和适配特征的研究提供了基本的数学描述,对解决用户体验的评价问题和业务与业务环境的适配问题提供了新的研究思路。仿真结果表明所构建的MDP模型能够在多状态条件下学习用户偏好,根据用户需求智能选择业务。 展开更多
关键词 效用理论 用户偏好 马尔可夫判决过程 强化学习
在线阅读 下载PDF
基于LMDP的铁路钢轨网格化维修规划编制模型 被引量:1
19
作者 白磊 李擎 +2 位作者 刘仍奎 赵新勇 王福田 《铁道学报》 EI CAS CSCD 北大核心 2019年第10期17-23,共7页
铁路钢轨设备维修规划的优化编制,能够辅助合理分配维修资源与控制维修成本。构建了一种新的铁路钢轨维修规划编制模型。按照某一长度分割铁路线路,得到多个连续等长的小钢轨区段,这些小钢轨区段称为钢轨网格。以钢轨网格为研究对象,采... 铁路钢轨设备维修规划的优化编制,能够辅助合理分配维修资源与控制维修成本。构建了一种新的铁路钢轨维修规划编制模型。按照某一长度分割铁路线路,得到多个连续等长的小钢轨区段,这些小钢轨区段称为钢轨网格。以钢轨网格为研究对象,采用Markov随机过程理论,个性化地描述了钢轨网格状态劣化规律,利用隐形马尔科夫决策过程方法,建立了基于状态的维修策略模型,以一个规划周期内的期望总成本最小为优化目标,确定规划周期内的最优检查策略、维修策略,并采用陇海线的实际数据,对提出模型的有效性进行了验证,计算结果表明提出的模型优于既有的基于阈值的管理方法。 展开更多
关键词 铁路钢轨 维修规划 网格化 隐形马尔科夫决策过程
在线阅读 下载PDF
基于时间策略的连续时间Markov过程验证 被引量:1
20
作者 黄镇谨 陈波 欧阳浩 《广西科技大学学报》 CAS 2014年第3期59-62,86,共5页
对系统模型进行验证是保证系统安全的一个关键.连续时间Markov过程可以刻画复杂并发系统的随机、概率、不确定性特征.提出时间依赖策略下连续时间Markov过程验证方法,将连续时间Markov过程转换成为交互式马尔科夫链,给出模型的转换方法... 对系统模型进行验证是保证系统安全的一个关键.连续时间Markov过程可以刻画复杂并发系统的随机、概率、不确定性特征.提出时间依赖策略下连续时间Markov过程验证方法,将连续时间Markov过程转换成为交互式马尔科夫链,给出模型的转换方法及不确定性选择策略的转换方法,最终通过求解交互式马尔科夫链的时间可达概率最值实现对连续时间Markov过程模型的验证.理论分析表明,提出的方法具有可行性. 展开更多
关键词 马尔科夫决策过程 交互式马尔科夫链 时间有界可达概率 时间策略
在线阅读 下载PDF
上一页 1 2 14 下一页 到第
使用帮助 返回顶部