为应对现代战争中作战环境的不确定性问题,指挥员需具备实时优化作战行动过程(course of action,COA)的能力和手段,保证态势变化条件下的作战效能。本文考虑作战持续过程中战场态势变化、指挥员意图介入等因素,采用基于贝叶斯网络的行...为应对现代战争中作战环境的不确定性问题,指挥员需具备实时优化作战行动过程(course of action,COA)的能力和手段,保证态势变化条件下的作战效能。本文考虑作战持续过程中战场态势变化、指挥员意图介入等因素,采用基于贝叶斯网络的行动过程建模,研究反馈机制下的COA实时滚动优化策略,有效提升行动方案的适用性。通过仿真案例分析可知,滚动优化结构所生成的COA方案评价得分能够在单次优化的基础上提高15%以上,表明滚动优化结构的COA实时决策方法,能够克服复杂作战环境下战场态势和指挥员意图的实时变化影响,保证行动方案的全过程持续最优。展开更多
传统的优化控制方法很难在浮选过程状态发生变化时准确、快速做出决策,导致精矿品位和尾矿品位大幅度波动、出现产品质量不稳定.此外,浮选过程难以对精矿品位进行在线检测,导致其实用性下降.针对上述问题采用混合模型对浮选过程建模,并...传统的优化控制方法很难在浮选过程状态发生变化时准确、快速做出决策,导致精矿品位和尾矿品位大幅度波动、出现产品质量不稳定.此外,浮选过程难以对精矿品位进行在线检测,导致其实用性下降.针对上述问题采用混合模型对浮选过程建模,并基于示例的安全增强值评估(safety augmented value estimation from demonstrations,SAVED)的强化学习算法,控制浮选溢出气泡的尺寸分布,从而间接实现对精矿品位和尾矿品位的控制.通过仿真实验验证了所提算法的有效性.与人工经验和数据驱动模型相比,基于混合模型的SAVED算法在保证安全约束的条件下能够实现更好的控制效果.展开更多
文摘为应对现代战争中作战环境的不确定性问题,指挥员需具备实时优化作战行动过程(course of action,COA)的能力和手段,保证态势变化条件下的作战效能。本文考虑作战持续过程中战场态势变化、指挥员意图介入等因素,采用基于贝叶斯网络的行动过程建模,研究反馈机制下的COA实时滚动优化策略,有效提升行动方案的适用性。通过仿真案例分析可知,滚动优化结构所生成的COA方案评价得分能够在单次优化的基础上提高15%以上,表明滚动优化结构的COA实时决策方法,能够克服复杂作战环境下战场态势和指挥员意图的实时变化影响,保证行动方案的全过程持续最优。
文摘传统的优化控制方法很难在浮选过程状态发生变化时准确、快速做出决策,导致精矿品位和尾矿品位大幅度波动、出现产品质量不稳定.此外,浮选过程难以对精矿品位进行在线检测,导致其实用性下降.针对上述问题采用混合模型对浮选过程建模,并基于示例的安全增强值评估(safety augmented value estimation from demonstrations,SAVED)的强化学习算法,控制浮选溢出气泡的尺寸分布,从而间接实现对精矿品位和尾矿品位的控制.通过仿真实验验证了所提算法的有效性.与人工经验和数据驱动模型相比,基于混合模型的SAVED算法在保证安全约束的条件下能够实现更好的控制效果.