检索结果-维普期刊中文期刊服务平台

马尔可夫决策过程两种抽象模式被引量：2: 1; 作者王蓁蓁邢汉承 +1 位作者张志政倪庆剑《计算机科学》 CSCD 北大核心 2008年第10期6-14,48,共10页; 抽象层次上马尔可夫决策过程的引入,使得人们可简洁地、陈述地表达复杂的马尔可夫决策过程,解决常规马尔可夫决策过程(MDPs)在实际中所遇到的大型状态空间的表达问题。介绍了结构型和概括型两种不同类型抽象马尔可夫决策过程基本概念以... 展开更多; 关键词情景演算因子化马尔可夫决策过程逻辑马尔可夫决策过程关系马尔可夫决策过程 Bellman方程; 在线阅读下载PDF 职称材料

基于马尔可夫过程的牵引供电设备维修决策模型及其应用被引量：7: 2; 作者张奥林圣 +1 位作者冯玎何正友《铁道学报》 EI CAS CSCD 北大核心 2017年第11期38-45,共8页; 传统的牵引供电设备固定计划维修模式存在着维修过剩与维修不足的问题,随着维管单位和牵引变电所信息化水平的逐步提高,状态维修模式取代固定计划维修模式已成为可能。本文将设备健康状态引入牵引供电设备维修决策中,基于马尔可夫决策... 展开更多; 关键词牵引供电设备劣化过程维修决策马尔可夫决策过程; 在线阅读下载PDF 职称材料

Polish空间上的折扣马氏过程量子化策略的渐近优化: 3; 作者吴晓孔荫莹郭圳滨《数学物理学报（A辑）》 CSCD 北大核心 2022年第2期594-604,共11页; 该文研究了Polish空间上、带折扣因子的连续时间马尔可夫决策过程(CTMDPs)的量子化平稳策略的渐近最优性问题.首先,建立了折扣最优方程(DOE)及其解的存在性和唯一性.其次,在适当的条件下证明了最优确定性平稳策略的存在性.此外,为了对... 展开更多; 关键词连续时间马尔可夫决策过程依赖状态折扣因子折扣准则量子化平稳策略渐近最优性; 在线阅读下载PDF 职称材料

基于深度Q网络的在线服务功能链部署方法被引量：8: 4; 作者邱航汤红波游伟《电子与信息学报》 EI CSCD 北大核心 2021年第11期3122-3130,共9页; 针对5G网络资源状态动态变化和网络模型高维度下服务功能链部署的复杂性问题,该文提出一种基于深度Q网络的在线服务功能链部署方法(DeePSCD)。首先,为描述网络资源动态变化的特征,将服务功能链部署建模成马尔可夫决策过程,然后,针对系... 展开更多; 关键词网络功能虚拟化服务功能链马尔可夫决策过程深度Q网络; 在线阅读下载PDF 职称材料

面向大规模网络的服务功能链部署方法被引量：1: 5; 作者张冠莹伊鹏 +2 位作者李丹朱棣毛明《计算机工程》 CAS CSCD 北大核心 2023年第8期122-129,共8页; 网络功能虚拟化(NFV)将网络功能从硬件中间盒中解耦出来,部署功能实例并编排为服务功能链(SFC),从而实现网络服务。针对资源受限情况下大规模网络环境中的SFC动态部署问题,提出一种基于多智能体的群策部署方法,该方法结合了集中式深度... 展开更多; 关键词网络功能虚拟化服务功能链深度强化学习部分可见马尔可夫决策过程多智能体; 在线阅读下载PDF 职称材料

题名马尔可夫决策过程两种抽象模式被引量：2: 1; 作者王蓁蓁邢汉承张志政倪庆剑; 机构东南大学计算机科学与工程学院南京大学计算机软件新技术国家重点实验室; 出处《计算机科学》 CSCD 北大核心 2008年第10期6-14,48,共10页; 基金国家自然科学基金会重大研究计划项目(90412014) 计算机软件新技术开放课题(A200707)资助; 文摘抽象层次上马尔可夫决策过程的引入,使得人们可简洁地、陈述地表达复杂的马尔可夫决策过程,解决常规马尔可夫决策过程(MDPs)在实际中所遇到的大型状态空间的表达问题。介绍了结构型和概括型两种不同类型抽象马尔可夫决策过程基本概念以及在各种典型抽象MDPs中的最优策略的精确或近似算法,其中包括与常规MDPs根本不同的一个算法:把Bellman方程推广到抽象状态空间的方法,并且对它们的研究历史进行总结和对它们的发展做一些展望,使得人们对它们有一个透彻的、全面而又重点的理解。; 关键词情景演算因子化马尔可夫决策过程逻辑马尔可夫决策过程关系马尔可夫决策过程 Bellman方程; Keywords Situation calculus, Factored Markov decision processes, Logical Markov decision processes, Relational Markov decision processes, Bellman equations; 分类号 TP391.4 [自动化与计算机技术—计算机应用技术] TJ761.13 [兵器科学与技术—武器系统与运用工程]; 在线阅读下载PDF 职称材料

题名基于马尔可夫过程的牵引供电设备维修决策模型及其应用被引量：7: 2; 作者张奥林圣冯玎何正友; 机构西南交通大学电气工程学院国网安徽电力公司亳州供电公司; 出处《铁道学报》 EI CAS CSCD 北大核心 2017年第11期38-45,共8页; 基金国家自然科学基金(51525702) 中国铁路总公司科技研究开发计划(2015J008-A +1 种基金 2016J010-A) 广东省省级科技计划(2015B010128002); 文摘传统的牵引供电设备固定计划维修模式存在着维修过剩与维修不足的问题,随着维管单位和牵引变电所信息化水平的逐步提高,状态维修模式取代固定计划维修模式已成为可能。本文将设备健康状态引入牵引供电设备维修决策中,基于马尔可夫决策过程建立牵引供电设备的维修决策模型。该模型考虑了基于Gauss-Poisson过程的牵引供电设备全寿命周期健康状态劣化过程和预防性维修过程,以设备全寿命周期的单位时间综合成本为优化目标,采用策略迭代法实现牵引供电设备在不同健康状态下最优维修方式和维修周期的选择。结果表明该模型可行有效,为优化牵引供电设备的维修维护方案,实现状态维修提供依据。; 关键词牵引供电设备劣化过程维修决策马尔可夫决策过程; Keywords traction power supply equipment deterioration process maintenance decisions Markov decision process; 分类号 TM922.3 [电气工程—电力电子与电力传动]; 在线阅读下载PDF 职称材料

题名Polish空间上的折扣马氏过程量子化策略的渐近优化: 3; 作者吴晓孔荫莹郭圳滨; 机构肇庆学院数学与统计学院广东财经大学智能财会管理学院广发证券股份有限公司发展研究中心; 出处《数学物理学报（A辑）》 CSCD 北大核心 2022年第2期594-604,共11页; 基金国家自然科学基金(11961005) 中山大学广东省计算科学重点实验室开放基金(2021021) +1 种基金广州市科技计划项目(202102080420)。; 文摘该文研究了Polish空间上、带折扣因子的连续时间马尔可夫决策过程(CTMDPs)的量子化平稳策略的渐近最优性问题.首先,建立了折扣最优方程(DOE)及其解的存在性和唯一性.其次,在适当的条件下证明了最优确定性平稳策略的存在性.此外,为了对行动空间进行离散化,构造了一列量子化策略,利用有限行动空间的策略来逼近一般(Polish)空间上的折扣CTMDPs最优平稳策略.最后,通过一个例子来说明该文的渐近逼近结果.; 关键词连续时间马尔可夫决策过程依赖状态折扣因子折扣准则量子化平稳策略渐近最优性; Keywords Continuous-time Markov decision processes State-dependent discount factors Discounted criterion Quantized stationary policies Asymptotic optimality; 分类号 O211.6 [理学—概率论与数理统计]; 在线阅读下载PDF 职称材料

题名基于深度Q网络的在线服务功能链部署方法被引量：8: 4; 作者邱航汤红波游伟; 机构中国人民解放军战略支援部队信息工程大学; 出处《电子与信息学报》 EI CSCD 北大核心 2021年第11期3122-3130,共9页; 基金国家自然科学基金(61801515,61941114,61521003)。; 文摘针对5G网络资源状态动态变化和网络模型高维度下服务功能链部署的复杂性问题,该文提出一种基于深度Q网络的在线服务功能链部署方法(DeePSCD)。首先,为描述网络资源动态变化的特征,将服务功能链部署建模成马尔可夫决策过程,然后,针对系统资源模型的高维度问题采用深度Q网络的方法进行在线服务功能链部署策略求解。该方法可以有效描述网络资源状态的动态变化,特别是深度Q网络能有效克服求解复杂度,优化服务功能链的部署开销。仿真结果表明,所提方法在满足服务时延约束条件下降低了服务功能链的部署开销,提高了运营商网络的服务请求接受率。; 关键词网络功能虚拟化服务功能链马尔可夫决策过程深度Q网络; Keywords Network function virtualization Service function chain Markov decision process Deep Q network; 分类号 TN915.07 [电子电信—通信与信息系统]; 在线阅读下载PDF 职称材料

题名面向大规模网络的服务功能链部署方法被引量：1: 5; 作者张冠莹伊鹏李丹朱棣毛明; 机构郑州大学网络空间安全学院中国人民解放军战略支援部队信息工程大学信息技术研究所; 出处《计算机工程》 CAS CSCD 北大核心 2023年第8期122-129,共8页; 基金国家重点研发计划(2022YFB2901304) 国家自然科学基金(62002382) 嵩山实验室项目(221100210900-03)。; 文摘网络功能虚拟化(NFV)将网络功能从硬件中间盒中解耦出来,部署功能实例并编排为服务功能链(SFC),从而实现网络服务。针对资源受限情况下大规模网络环境中的SFC动态部署问题,提出一种基于多智能体的群策部署方法,该方法结合了集中式深度强化学习(DRL)和传统分布式方法的优点。将SFC部署问题建模为部分可见马尔可夫决策过程,每个节点部署一个Actor-Critic智能体,仅通过观察本地节点信息即可得到全局训练策略,具有DRL的灵活性和自适应性。本地智能体控制交互过程,以解决集中式DRL方法在大规模网络中控制复杂、响应速度慢等问题。基于多线程的思想,收集、整合每个节点的经验进行集中式训练,避免完全分布式训练过程中部分节点因请求流量少而导致训练不充分、策略不适用等问题。实验结果表明,该方法无须考虑网络规模而且不依赖特定场景,可以很好地适应现实中复杂多变的网络环境,在相对复杂的流量环境中,与CDRL、GCASP方法相比,在多种流量模式下所提方法的部署成功率均提高了20%以上,同时能够降低部署成本。; 关键词网络功能虚拟化服务功能链深度强化学习部分可见马尔可夫决策过程多智能体; Keywords Network Function Virtualization(NFV) Service Function Chain(SFC) Deep Reinforcement Learning(DRL) Partially Observable Markov Decision Process(POMDP) multiple agent; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	马尔可夫决策过程两种抽象模式	王蓁蓁邢汉承张志政倪庆剑	《计算机科学》 CSCD 北大核心	2008	2	在线阅读下载PDF 职称材料
2	基于马尔可夫过程的牵引供电设备维修决策模型及其应用	张奥林圣冯玎何正友	《铁道学报》 EI CAS CSCD 北大核心	2017	7	在线阅读下载PDF 职称材料
3	Polish空间上的折扣马氏过程量子化策略的渐近优化	吴晓孔荫莹郭圳滨	《数学物理学报（A辑）》 CSCD 北大核心	2022	0	在线阅读下载PDF 职称材料
4	基于深度Q网络的在线服务功能链部署方法	邱航汤红波游伟	《电子与信息学报》 EI CSCD 北大核心	2021	8	在线阅读下载PDF 职称材料
5	面向大规模网络的服务功能链部署方法	张冠莹伊鹏李丹朱棣毛明	《计算机工程》 CAS CSCD 北大核心	2023	1	在线阅读下载PDF 职称材料