-
题名攻防对抗中指数射击策略最优性分析
被引量:3
- 1
-
-
作者
李龙跃
刘付显
赵麟锋
王东旭
-
机构
空军工程大学防空反导学院
-
出处
《兵工学报》
EI
CAS
CSCD
北大核心
2015年第5期953-960,共8页
-
基金
全军军事学研究生课题项目(2014年)
-
文摘
研究了红蓝攻防对抗中的射击策略优化问题,即研究红方面对多个蓝方目标,如何射击能获得最大收益的问题。基于以往研究的局限性,为平衡红方射击收益和自身存活概率,引入和拓展Gittins指数应用于射击决策问题,考虑了蓝方目标退出战斗的可能性,以红方在自身被摧毁之前最大化杀伤蓝方目标的收益(或数量)为目标,对指数射击策略的最优性进行了讨论,拓展了定理1、定理2,给出推论1.为进行比较,引入近视策略、完全策略和循环策略3种截然不同的射击策略,并给出近视策略最优性定理3.实例设置了两个射击场景,在4种射击策略下计算红方的收益情况、杀伤目标情况和自身被摧毁情况,验证了指数射击策略的最优性。
-
关键词
兵器科学与技术
射击决策
gittins指数
指数策略
近视策略
-
Keywords
ordnance science and technology
shooting policy
gittins index
index policy
myopic policy
-
分类号
E917
[军事]
-
-
题名单臂Erlang(k) Bandit报酬过程
被引量:1
- 2
-
-
作者
邹捷中
邓倩
梁友
-
机构
中南大学数学科学与计算技术学院
-
出处
《长沙电力学院学报(自然科学版)》
2006年第4期69-71,77,共4页
-
文摘
应用贝叶斯方法,对未知Band it报酬过程的抽样报酬基于Erlang(k)分布的单臂Erlang(k)Band it报酬过程提出计算描述最优选择的平衡值序列的算法.有效解决了单臂Erlang(k)Band it报酬过程的最优决策问题,将Band it报酬过程基于的分布从负指数分布推广至目前在实际中应用更为广泛的分布,是对Band it报酬过程的补充和推广.使用本算法通过数值计算可以得到G ittins指数的近似解.
-
关键词
贝叶斯方法
多臂Bandit过程
单臂Bandit过程
gittins指数
平衡值
Bandit报酬过程
分布
-
Keywords
bayesian approach
multi-armed bandit processes
one-armed bandit process
gittins index
break-even values
bandit reward process
distribution
-
分类号
O211.64
[理学—概率论与数理统计]
-