期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
有限规划水平部分可观Markov自适应决策过程的参数决策
1
作者 李江红 韩正之 《上海交通大学学报》 EI CAS CSCD 北大核心 2000年第12期1653-1657,共5页
提出了一种有限规划水平部分可观、不确定 Markov决策过程自适应决策算法 .算法的基本思想是运用 Bayes理论对未知系统进行“学习”,通过最小决策失误概率的参数决策实现参数估计 ,在参数估计的基础上进行控制决策从而以最大概率实现最... 提出了一种有限规划水平部分可观、不确定 Markov决策过程自适应决策算法 .算法的基本思想是运用 Bayes理论对未知系统进行“学习”,通过最小决策失误概率的参数决策实现参数估计 ,在参数估计的基础上进行控制决策从而以最大概率实现最优决策 .文中证明了决策算法的收敛性 .仿真结果表明了决策算法的有效性 . 展开更多
关键词 部分可观markov决策过程 自适应控制 贝叶斯原理
在线阅读 下载PDF
基于部分可观马氏决策过程的多平台主被动传感器调度 被引量:4
2
作者 张子宁 单甘霖 段修生 《电子学报》 EI CAS CSCD 北大核心 2014年第10期2104-2109,共6页
为了使有限时域内的跟踪精度和辐射风险达到最佳平衡,本文研究了多传感器平台在协同跟踪目标时的主被动传感器调度问题.将该问题建立成基于部分可观马氏决策过程的数学模型以同步实现目标跟踪和辐射控制.在先见优化思想的基础上,借助由... 为了使有限时域内的跟踪精度和辐射风险达到最佳平衡,本文研究了多传感器平台在协同跟踪目标时的主被动传感器调度问题.将该问题建立成基于部分可观马氏决策过程的数学模型以同步实现目标跟踪和辐射控制.在先见优化思想的基础上,借助由无迹采样近似得到的精度收益及由隐马氏模型滤波器推导出的辐射代价将调度问题转化成决策树问题,并采用分枝定界方法求解.仿真结果表明了该方法的有效性. 展开更多
关键词 传感器调度 部分可观马氏决策过程 先见优化 无迹采样 分枝定界
在线阅读 下载PDF
采用马氏决策过程和后验克拉美罗下界的多被动式移动传感器长期调度方法 被引量:1
3
作者 徐公国 单甘霖 段修生 《西安交通大学学报》 EI CAS CSCD 北大核心 2019年第6期125-133,150,共10页
针对多被动式移动传感器协同工作时跟踪精度不稳定等问题,提出了一种基于多步预测的移动传感器长期调度方法。该方法结合部分可观马尔科夫决策过程(POMDP)构建多传感器调度模型,并基于后验克拉美罗下界(PCRLB)建立了传感器调度过程中的... 针对多被动式移动传感器协同工作时跟踪精度不稳定等问题,提出了一种基于多步预测的移动传感器长期调度方法。该方法结合部分可观马尔科夫决策过程(POMDP)构建多传感器调度模型,并基于后验克拉美罗下界(PCRLB)建立了传感器调度过程中的单步与长期代价函数;为有效减少计算复杂度,利用大量无迹采样粒子来近似估算长期代价值;通过将多约束非线性调度问题转化为决策树优化问题,可快速获取传感器长期调度方法,并给出了一种基于分支定界技术的改进决策树搜索算法。实验结果表明,所提方法能够实现移动式传感器的合理调度,在决策步长为2时,其目标跟踪精度相较于短期调度可平均提升6.08%;改进搜索算法的求解速度也更加迅速,能够有效满足在线调度的实时性要求。 展开更多
关键词 移动传感器 传感器调度 部分可观马尔科夫决策过程 后验克拉美罗下界 决策
在线阅读 下载PDF
优化策略模型下的匹配律算法
4
作者 程振波 邓志东 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2009年第S1期146-151,共6页
利用基于部分可观马尔可夫决策过程的策略搜索模型,提出了一种具有优化行为的策略搜索算法,并推导出满足匹配律的策略算法.被试可通过调整策略参数,最大化目标值函数的期望值,并根据已往的经验调整策略参数.假定被试所处的环境具有马尔... 利用基于部分可观马尔可夫决策过程的策略搜索模型,提出了一种具有优化行为的策略搜索算法,并推导出满足匹配律的策略算法.被试可通过调整策略参数,最大化目标值函数的期望值,并根据已往的经验调整策略参数.假定被试所处的环境具有马尔可夫性,通过计算值函数期望值的梯度可求得优化行为的策略搜索算法.理论分析与仿真结果表明,如果策略参数与值函数的期望值仅受当前经验的影响,则可由获得优化行为的策略算法推导出符合匹配律的策略算法.研究结果揭示了匹配行为与优化策略搜索算法之间的关系,表明满足匹配律的决策行为是一类达到次优的决策行为. 展开更多
关键词 部分可观马尔可夫决策过程 再励学习 优化策略搜索 匹配律
在线阅读 下载PDF
传感器工作时长约束及辐射控制的调度方法 被引量:5
5
作者 乔成林 段修生 +1 位作者 单甘霖 王俭臣 《探测与控制学报》 CSCD 北大核心 2018年第3期91-96,102,共7页
针对多传感器调度中辐射控制及频繁切换的问题,提出传感器工作时长约束及辐射控制的调度方法。该方法将目标跟踪及辐射控制过程建立为部分可观马尔可夫决策过程;采用不敏卡尔曼滤波更新目标信念状态,预测目标跟踪精度;同时,结合隐马尔... 针对多传感器调度中辐射控制及频繁切换的问题,提出传感器工作时长约束及辐射控制的调度方法。该方法将目标跟踪及辐射控制过程建立为部分可观马尔可夫决策过程;采用不敏卡尔曼滤波更新目标信念状态,预测目标跟踪精度;同时,结合隐马尔可夫滤波器推导多步辐射代价,动态确定传感器工作时长;考虑跟踪任务需求,得到工作时长约束及辐射控制的调度策略。仿真结果表明,在满足跟踪任务需求下,该方法有效降低了系统辐射代价,避免了频繁切换问题,增强了系统稳定性和实用性。 展开更多
关键词 传感器调度 频繁切换 部分可观马尔可夫决策过程 时长约束 辐射代价
在线阅读 下载PDF
多传感器协同跟踪与辐射控制的调度算法 被引量:6
6
作者 乔成林 段修生 单甘霖 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2018年第7期1472-1480,共9页
为了降低有源传感器在获得目标持续量测时被敌方截获的风险,提出一种多传感器协同跟踪与辐射控制的调度算法。该算法首先采用辐射度影响(ELI)衡量传感器辐射,将目标跟踪与辐射控制过程建立为部分可观马尔可夫决策(POMDP)过程。然后以隐... 为了降低有源传感器在获得目标持续量测时被敌方截获的风险,提出一种多传感器协同跟踪与辐射控制的调度算法。该算法首先采用辐射度影响(ELI)衡量传感器辐射,将目标跟踪与辐射控制过程建立为部分可观马尔可夫决策(POMDP)过程。然后以隐马尔可夫模型(HMM)滤波器更新传感器辐射状态、推导长时辐射风险,以无迹卡尔曼滤波(UKF)更新目标状态、估计跟踪精度。最后考虑跟踪任务需求,构建精度约束下辐射控制的长时调度模型,并将该长时调度问题转化为决策树寻优问题,给出决策树节点次优下界值,采用改进分支定界技术(IB&B)快速求解最优调度序列。仿真结果验证了本文算法的有效性。 展开更多
关键词 传感器调度 协同跟踪 辐射控制 决策 任务需求 部分可观马尔可夫决策过程(POMDP)
在线阅读 下载PDF
多平台主动与被动传感器协同跟踪的长时调度方法 被引量:13
7
作者 乔成林 单甘霖 +1 位作者 段修生 郭峰 《兵工学报》 EI CAS CSCD 北大核心 2019年第1期115-123,共9页
为了有效跟踪杂波环境下机动目标、降低系统辐射风险,提出一种多平台主动与被动传感器协同跟踪的长时调度方法。将长时调度问题构建为部分可观马尔可夫决策过程,采用交互式多模型概率数据关联算法更新目标信念状态,利用后验克拉美-罗下... 为了有效跟踪杂波环境下机动目标、降低系统辐射风险,提出一种多平台主动与被动传感器协同跟踪的长时调度方法。将长时调度问题构建为部分可观马尔可夫决策过程,采用交互式多模型概率数据关联算法更新目标信念状态,利用后验克拉美-罗下界预测机动目标长时跟踪精度,提出改进的维特比算法以求解最优调度序列。仿真实验结果表明,所提搜索算法能够显著降低搜索空间和存储空间,所提长时调度方法能够有效控制系统辐射代价、克服传感器频繁切换。 展开更多
关键词 传感器长时调度 部分可观马尔可夫决策过程 交互式多模型 概率数据关联 后验克拉美-罗下界 维特比算法
在线阅读 下载PDF
主/被动传感器辐射控制的调度方法 被引量:2
8
作者 张昀普 单甘霖 +1 位作者 段修生 王猛 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2019年第6期67-74,共8页
为了降低目标跟踪时传感器系统的辐射风险,研究了主/被动传感器的调度问题。通过建立基于部分可观马尔可夫决策过程的传感器调度模型,给出了目标跟踪精度和系统辐射代价的预测公式,并以满足跟踪精度约束的同时系统辐射代价达到最小为优... 为了降低目标跟踪时传感器系统的辐射风险,研究了主/被动传感器的调度问题。通过建立基于部分可观马尔可夫决策过程的传感器调度模型,给出了目标跟踪精度和系统辐射代价的预测公式,并以满足跟踪精度约束的同时系统辐射代价达到最小为优化目标建立了目标函数,设计了一种改进分布式拍卖算法以求解该问题。仿真实验表明,该方法能够通过合理切换各平台上的主/被动传感器,使系统在不牺牲跟踪精度的同时,降低辐射代价。 展开更多
关键词 传感器调度 目标跟踪 部分可观马尔可夫决策过程 辐射代价 拍卖算法
在线阅读 下载PDF
面向双基协同跟踪的接收站路径优化方法
9
作者 石义芳 郭志伟 +2 位作者 张瑜 彭冬亮 张直 《现代雷达》 CSCD 北大核心 2022年第4期6-15,共10页
为进一步提升双基站无源协同跟踪系统的目标跟踪精度,提出了一种最小化克拉美罗下界(CRLB)迹的接收站路径优化方法。该方法结合部分可观马尔可夫决策过程(POMDP)构建接收站路径优化模型,并设计了基于CRLB的接收站路径优化代价函数;在满... 为进一步提升双基站无源协同跟踪系统的目标跟踪精度,提出了一种最小化克拉美罗下界(CRLB)迹的接收站路径优化方法。该方法结合部分可观马尔可夫决策过程(POMDP)构建接收站路径优化模型,并设计了基于CRLB的接收站路径优化代价函数;在满足接收站自身运动约束的前提下,求解最小化目标代价函数的接收站控制指令,最终实现接收站路径的实时优化;考虑到代价函数的高度非线性,为减少计算量,保证优化实时性,在接收站运动速度矢量转向角约束内进行离散化取值,获取接收站路径优化的近似最优解。实验结果表明,相比于现有的主流方法,该文方法能够有效减少接收站路径优化算法的计算量,同时显著提升目标跟踪精度。 展开更多
关键词 双基站无源协同跟踪系统 接收站路径优化 部分可观马尔可夫决策过程 克拉美罗下界
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部