期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
攻防对抗中指数射击策略最优性分析 被引量:3
1
作者 李龙跃 刘付显 +1 位作者 赵麟锋 王东旭 《兵工学报》 EI CAS CSCD 北大核心 2015年第5期953-960,共8页
研究了红蓝攻防对抗中的射击策略优化问题,即研究红方面对多个蓝方目标,如何射击能获得最大收益的问题。基于以往研究的局限性,为平衡红方射击收益和自身存活概率,引入和拓展Gittins指数应用于射击决策问题,考虑了蓝方目标退出战斗的可... 研究了红蓝攻防对抗中的射击策略优化问题,即研究红方面对多个蓝方目标,如何射击能获得最大收益的问题。基于以往研究的局限性,为平衡红方射击收益和自身存活概率,引入和拓展Gittins指数应用于射击决策问题,考虑了蓝方目标退出战斗的可能性,以红方在自身被摧毁之前最大化杀伤蓝方目标的收益(或数量)为目标,对指数射击策略的最优性进行了讨论,拓展了定理1、定理2,给出推论1.为进行比较,引入近视策略、完全策略和循环策略3种截然不同的射击策略,并给出近视策略最优性定理3.实例设置了两个射击场景,在4种射击策略下计算红方的收益情况、杀伤目标情况和自身被摧毁情况,验证了指数射击策略的最优性。 展开更多
关键词 兵器科学与技术 射击决策 gittins指数 指数策略 近视策略
在线阅读 下载PDF
单臂Erlang(k) Bandit报酬过程 被引量:1
2
作者 邹捷中 邓倩 梁友 《长沙电力学院学报(自然科学版)》 2006年第4期69-71,77,共4页
应用贝叶斯方法,对未知Band it报酬过程的抽样报酬基于Erlang(k)分布的单臂Erlang(k)Band it报酬过程提出计算描述最优选择的平衡值序列的算法.有效解决了单臂Erlang(k)Band it报酬过程的最优决策问题,将Band it报酬过程基于的分布从负... 应用贝叶斯方法,对未知Band it报酬过程的抽样报酬基于Erlang(k)分布的单臂Erlang(k)Band it报酬过程提出计算描述最优选择的平衡值序列的算法.有效解决了单臂Erlang(k)Band it报酬过程的最优决策问题,将Band it报酬过程基于的分布从负指数分布推广至目前在实际中应用更为广泛的分布,是对Band it报酬过程的补充和推广.使用本算法通过数值计算可以得到G ittins指数的近似解. 展开更多
关键词 贝叶斯方法 多臂Bandit过程 单臂Bandit过程 gittins指数 平衡值 Bandit报酬过程 分布
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部