检索结果-维普期刊中文期刊服务平台

Markov控制过程基于神经元动态规划的优化算法被引量：1: 1; 作者唐昊奚宏生殷保群《中国科学技术大学学报》 CAS CSCD 北大核心 2001年第5期549-557,共9页; 论文在Markov性能势理论基础上 ,研究了Markov控制过程在神经元网络等逼近结构表示的随机平稳策略作用下的仿真优化算法 ;分析了它们在一个无限长的样本轨道上以概率 1的收敛性 ;并给出了一个三; 关键词 Markov性能势理论 MARKOV控制过程随机平稳策略样本轨道神经元动态规划随机决策问题; 在线阅读下载PDF 职称材料

SDN中DASH路由规划和码率调节联合决策算法被引量：3: 2; 作者姜俊超朱坤杰 +1 位作者张云飞杨坚《小型微型计算机系统》 CSCD 北大核心 2017年第6期1169-1174,共6页; 随着互联网技术的快速发展以及智能设备的普及,基于HTTP的动态自适应流媒体(Dynamic Adaptive Streaming over HTTP,DASH)业务发展迅速.但在带宽受限网络中,大规模用户的视频请求,将会加重网络负载,严重影响网络带宽资源的有效利用,同... 展开更多; 关键词自适应流媒体码率调节路由算法神经元动态规划软件定义网络; 在线阅读下载PDF 职称材料

平均和折扣准则MDP基于TD(0)学习的统一NDP方法被引量：5: 3; 作者唐昊周雷袁继彬《控制理论与应用》 EI CAS CSCD 北大核心 2006年第2期292-296,共5页; 为适应实际大规模M arkov系统的需要,讨论M arkov决策过程(MDP)基于仿真的学习优化问题.根据定义式,建立性能势在平均和折扣性能准则下统一的即时差分公式,并利用一个神经元网络来表示性能势的估计值,导出参数TD(0)学习公式和算法,进行... 展开更多; 关键词 MARKOV决策过程性能势 TD(0)学习神经元动态规划; 在线阅读下载PDF 职称材料

随机平稳策略下半Markov决策过程的仿真优化算法: 4; 作者代桂平唐昊奚宏生《控制理论与应用》 EI CAS CSCD 北大核心 2006年第4期547-551,共5页; 基于性能势理论和等价Markov过程方法,研究了一类半Markov决策过程(SMDP)在参数化随机平稳策略下的仿真优化算法,并简要分析了算法的收敛性．通过SMDP的等价Markov过程,定义了一个一致化Markov链,然后根据该一致化Markov链的单个样本轨... 展开更多; 关键词随机平稳策略等价Markov过程一致化Markov链神经元动态规划仿真优化; 在线阅读下载PDF 职称材料

Rollout及其并行求解算法在多类商品库存控制中的应用被引量：1: 5; 作者李豹程文娟 +1 位作者周雷唐昊《系统仿真学报》 EI CAS CSCD 北大核心 2007年第17期3883-3887,共5页; Rollout算法是Bertsekas提出的求解马尔科夫决策过程(MDP)问题的一种仿真优化算法。文章研究Rollout算法求解多类商品库存控制问题,给出了基于性能势和神经元动态规划的Rollout优化算法。另外,为了降低运算时间,文章提出了两种Rollout... 展开更多; 关键词 ROLLOUT算法库存控制 MARKOV决策过程性能势并行算法神经元动态规划; 在线阅读下载PDF 职称材料

题名Markov控制过程基于神经元动态规划的优化算法被引量：1: 1; 作者唐昊奚宏生殷保群; 机构中国科学技术大学自动化系; 出处《中国科学技术大学学报》 CAS CSCD 北大核心 2001年第5期549-557,共9页; 基金国家自然科学基金 (6 99740 37) 国家高性能计算基金 (0 0 2 0 8)资助项目; 文摘论文在Markov性能势理论基础上 ,研究了Markov控制过程在神经元网络等逼近结构表示的随机平稳策略作用下的仿真优化算法 ;分析了它们在一个无限长的样本轨道上以概率 1的收敛性 ;并给出了一个三; 关键词 Markov性能势理论 MARKOV控制过程随机平稳策略样本轨道神经元动态规划随机决策问题; Keywords Markov performance potentials Markov control processes randomized stationary policies sample path; 分类号 O231.3 [理学—运筹学与控制论] O221.3 [理学—运筹学与控制论]; 在线阅读下载PDF 职称材料

题名SDN中DASH路由规划和码率调节联合决策算法被引量：3: 2; 作者姜俊超朱坤杰张云飞杨坚; 机构中国科学技术大学电子工程与信息科学系; 出处《小型微型计算机系统》 CSCD 北大核心 2017年第6期1169-1174,共6页; 基金国家自然科学基金面上项目(61573329)资助国家自然科学基金重点项目(61233003)资助中央高校基本科研业务费专项资金项目(WK2100100026)资助; 文摘随着互联网技术的快速发展以及智能设备的普及,基于HTTP的动态自适应流媒体(Dynamic Adaptive Streaming over HTTP,DASH)业务发展迅速.但在带宽受限网络中,大规模用户的视频请求,将会加重网络负载,严重影响网络带宽资源的有效利用,同时用户码率调节缺乏全局协调控制机制,容易造成网络拥塞.针对软件定义网络中的DASH视频传输业务,将视频业务提供商长期平均收益最大化作为优化目标,设计并实现了基于神经元动态规划的DASH视频路由和用户码率调节联合决策算法.最后,通过在Mininet平台上建立SDN(Software-Defined Networking)网络环境并进行对比实验,我们验证了本文提出的联合决策算法能够提高网络带宽资源利用率,最大化DASH视频业务提供商长期平均收益.; 关键词自适应流媒体码率调节路由算法神经元动态规划软件定义网络; Keywords adaptive video streaming bitrate adjustment routing algorithm neuro-dynamic programming software-defined networking; 分类号 TP393 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名平均和折扣准则MDP基于TD(0)学习的统一NDP方法被引量：5: 3; 作者唐昊周雷袁继彬; 机构合肥工业大学计算机与信息学院; 出处《控制理论与应用》 EI CAS CSCD 北大核心 2006年第2期292-296,共5页; 基金国家自然科学基金资助项目(60404009) 安徽省自然科学基金资助项目(050420303) 合肥工业大学中青年科技创新群体计划资助项目; 文摘为适应实际大规模M arkov系统的需要,讨论M arkov决策过程(MDP)基于仿真的学习优化问题.根据定义式,建立性能势在平均和折扣性能准则下统一的即时差分公式,并利用一个神经元网络来表示性能势的估计值,导出参数TD(0)学习公式和算法,进行逼近策略评估;然后,根据性能势的逼近值,通过逼近策略迭代来实现两种准则下统一的神经元动态规划(neuro-dynam ic programm ing,NDP)优化方法.研究结果适用于半M arkov决策过程,并通过一个数值例子,说明了文中的神经元策略迭代算法对两种准则都适用,验证了平均问题是折扣问题当折扣因子趋近于零时的极限情况.; 关键词 MARKOV决策过程性能势 TD(0)学习神经元动态规划; Keywords Markov decision processes performance potentials TD（0） learning neuro-dynamic programming; 分类号 TP18 [自动化与计算机技术—控制理论与控制工程]; 在线阅读下载PDF 职称材料

题名随机平稳策略下半Markov决策过程的仿真优化算法: 4; 作者代桂平唐昊奚宏生; 机构北京工业大学电子信息与控制学院合肥工业大学计算机系中国科学技术大学自动化系; 出处《控制理论与应用》 EI CAS CSCD 北大核心 2006年第4期547-551,共5页; 基金国家自然科学基金资助项目(60274012) 北京工业大学博士科研启动基金资助项目(00194); 文摘基于性能势理论和等价Markov过程方法,研究了一类半Markov决策过程(SMDP)在参数化随机平稳策略下的仿真优化算法,并简要分析了算法的收敛性．通过SMDP的等价Markov过程,定义了一个一致化Markov链,然后根据该一致化Markov链的单个样本轨道来估计SMDP的平均代价性能指标关于策略参数的梯度,以寻找最优(或次优)策略．文中给出的算法是利用神经元网络来逼近参数化随机平稳策略,以节省计算机内存,避免了“维数灾”问题,适合于解决大状态空间系统的性能优化问题．最后给出了一个仿真实例来说明算法的应用．; 关键词随机平稳策略等价Markov过程一致化Markov链神经元动态规划仿真优化; Keywords randomized stationary polices equivalent Markov process uniformized Markov chain neuro-dynamic programming simulation optimization; 分类号 TP391.9 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名Rollout及其并行求解算法在多类商品库存控制中的应用被引量：1: 5; 作者李豹程文娟周雷唐昊; 机构合肥工业大学计算机与信息学院; 出处《系统仿真学报》 EI CAS CSCD 北大核心 2007年第17期3883-3887,共5页; 基金国家自然科学基金项目(60404009) 安徽省自然科学基金项目(050420303 +1 种基金 070416242) 安徽高校自然科学研究重点项目(KJ2007A063); 文摘 Rollout算法是Bertsekas提出的求解马尔科夫决策过程(MDP)问题的一种仿真优化算法。文章研究Rollout算法求解多类商品库存控制问题,给出了基于性能势和神经元动态规划的Rollout优化算法。另外,为了降低运算时间,文章提出了两种Rollout并行求解算法,并讨论了这两种并行算法各自的适用场合。实验结果表明,Rollout算法能满足模型未知系统的优化要求,具有较好的并行性能。; 关键词 ROLLOUT算法库存控制 MARKOV决策过程性能势并行算法神经元动态规划; Keywords Launch Canister Launch Finite Element Composites Simulation; 分类号 TP202 [自动化与计算机技术—检测技术与自动化装置]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	Markov控制过程基于神经元动态规划的优化算法	唐昊奚宏生殷保群	《中国科学技术大学学报》 CAS CSCD 北大核心	2001	1	在线阅读下载PDF 职称材料
2	SDN中DASH路由规划和码率调节联合决策算法	姜俊超朱坤杰张云飞杨坚	《小型微型计算机系统》 CSCD 北大核心	2017	3	在线阅读下载PDF 职称材料
3	平均和折扣准则MDP基于TD(0)学习的统一NDP方法	唐昊周雷袁继彬	《控制理论与应用》 EI CAS CSCD 北大核心	2006	5	在线阅读下载PDF 职称材料
4	随机平稳策略下半Markov决策过程的仿真优化算法	代桂平唐昊奚宏生	《控制理论与应用》 EI CAS CSCD 北大核心	2006	0	在线阅读下载PDF 职称材料
5	Rollout及其并行求解算法在多类商品库存控制中的应用	李豹程文娟周雷唐昊	《系统仿真学报》 EI CAS CSCD 北大核心	2007	1	在线阅读下载PDF 职称材料