期刊文献+
共找到188篇文章
< 1 2 10 >
每页显示 20 50 100
Study on group air to ground attack-defends hierarchical dynamic decision-making 被引量:1
1
作者 Zhang Li Zhang An Zhang Yongfang Shi Zhifu 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2007年第3期540-544,共5页
As to oppositional, multi-objective and hierarchical characteristic of air formation to ground attackdefends campaign, and using dynamic space state model of military campaign, this article establishes a principal and... As to oppositional, multi-objective and hierarchical characteristic of air formation to ground attackdefends campaign, and using dynamic space state model of military campaign, this article establishes a principal and subordinate hierarchical interactive decision-making way, the Nash-Stackelberg-Nash model, to solve the problems in military operation, and find out the associated best strategy in hierarchical dynamic decision-making. The simulating result indicate that when applying the model to air formation to ground attack-defends decision-making system, it can solve the problems of two hierarchies, dynamic oppositional decision-making favorably, and reach preferable effect in battle. It proves that the model can provide an effective way for analyzing a battle, 展开更多
关键词 dynamic game theory Nash-Stackelberg-Nash strategy hierarchical decision-making attack-defends antagonize.
在线阅读 下载PDF
Discrete decision model and multi-agent simulation of the Liang Zong two-chain hierarchical organization in a complex project
2
作者 MAI Qiang ZHAO Yueqiang AN Shi 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2018年第2期311-320,共10页
Different from the organization structure of complex projects in Western countries, the Liang Zong hierarchical organization structure of complex projects in China has two different chains, the chief-engineer chain an... Different from the organization structure of complex projects in Western countries, the Liang Zong hierarchical organization structure of complex projects in China has two different chains, the chief-engineer chain and the general-director chain,to handle the trade-off between technical and management decisions. However, previous works on organization search have mainly focused on the single-chain hierarchical organization in which all decisions are regarded as homogeneous. The heterogeneity and the interdependency between technical decisions and management decisions have been neglected. A two-chain hierarchical organization structure mapped from a real complex project is constructed. Then, a discrete decision model for a Liang Zong two-chain hierarchical organization in an NK model framework is proposed. This model proves that this kind of organization structure can reduce the search space by a large amount and that the search process should reach a final stable state more quickly. For a more complicated decision mechanism, a multi-agent simulation based on the above NK model is used to explore the effect of the two-chain organization structure on the speed, stability, and performance of the search process. The results provide three insights into how, compared with the single-chain hierarchical organization, the two-chain organization can improve the search process: it can reduce the number of iterations efficiently; the search is more stable because the search space is a smoother hill-like fitness landscape; in general, the search performance can be improved.However, when the organization structure is very complicated, the performance of a two-chain organization is inferior to that of a single-chain organization. These findings about the efficiency of the unique Chinese-style organization structure can be used to guide organization design for complex projects. 展开更多
关键词 complex project two-chain hierarchical organization discrete decision model multi-agent simulation
在线阅读 下载PDF
Mining Hierarchical Decision Rules from Hybrid Data with Categorical and Continuous Valued Attributes
3
作者 MIAO Duo-qian QIAN Jin +1 位作者 LI Wen ZHANG Ze-hua 《浙江海洋学院学报(自然科学版)》 CAS 2010年第5期420-427,共8页
Decision rules mining is an important issue in machine learning and data mining.However,most proposed algorithms mine categorical data at single level,and these rules are not easily understandable and really useful fo... Decision rules mining is an important issue in machine learning and data mining.However,most proposed algorithms mine categorical data at single level,and these rules are not easily understandable and really useful for users.Thus,a new approach to hierarchical decision rules mining is provided in this paper,in which similarity direction measure is introduced to deal with hybrid data.This approach can mine hierarchical decision rules by adjusting similarity measure parameters and the level of concept hierarchy trees. 展开更多
关键词 Similarity relation Attribute reduction hierarchical decision rules Hybrid data
在线阅读 下载PDF
Sequential maneuvering decisions based on multi-stage influence diagram in air combat 被引量:8
4
作者 Zhong Lin Tong Ming'an +1 位作者 Zhong Wei Zhang Shengyun 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2007年第3期551-555,共5页
A multi-stage influence diagram is used to model the pilot's sequential decision making in one on one air combat. The model based on the multi-stage influence diagram graphically describes the elements of decision pr... A multi-stage influence diagram is used to model the pilot's sequential decision making in one on one air combat. The model based on the multi-stage influence diagram graphically describes the elements of decision process, and contains a point-mass model for the dynamics of an aircraft and takes into account the decision maker's preferences under uncertain conditions. Considering an active opponent, the opponent's maneuvers can be modeled stochastically. The solution of multistage influence diagram can be obtained by converting the multistage influence diagram into a two-level optimization problem. The simulation results show the model is effective. 展开更多
关键词 multi-stage influence diagram air combat maneuvering decision hierarchical optimization.
在线阅读 下载PDF
缓存辅助的移动边缘计算任务卸载与资源分配
5
作者 李致远 陈品润 《计算机工程与设计》 北大核心 2025年第5期1248-1255,共8页
针对边缘计算网络环境下的计算任务卸载与资源分配问题,提出一种基于分层强化学习的联合优化缓存、卸载与资源分配(HRLJCORA)算法。以时延和能耗为优化目标,将原优化问题分解为两个子问题,下层利用深度Q-learning网络算法进行缓存决策,... 针对边缘计算网络环境下的计算任务卸载与资源分配问题,提出一种基于分层强化学习的联合优化缓存、卸载与资源分配(HRLJCORA)算法。以时延和能耗为优化目标,将原优化问题分解为两个子问题,下层利用深度Q-learning网络算法进行缓存决策,上层使用软动作评价算法进行计算任务卸载与资源分配决策。仿真实验结果表明,HRLJCORA算法与现有基线算法相比,有效降低了总开销,相较于联合优化计算任务卸载与资源分配(JORA)算法,卸载决策奖励值提高了13.11%,为用户提供了更优质的服务。 展开更多
关键词 移动边缘计算 缓存辅助 卸载决策 资源分配 分层强化学习 深度Q-learning网络算法 软动作评价算法
在线阅读 下载PDF
面向飞行器智能协同控制的分层双时延策略梯度强化学习方法
6
作者 马宇 安豆 +3 位作者 林熙祥 赵建福 张光华 牛鸿敏 《西安交通大学学报》 北大核心 2025年第9期88-98,共11页
针对多飞行器智能协同控制中因规模大、环境复杂及资源受限导致的建模与协同难题,以提高决策算法效率为目标,构建了多智能体分层决策架构,提出了智能协同控制方法。首先,将飞行器作为智能体构建协同控制模型;其次,采用部分可观测马尔可... 针对多飞行器智能协同控制中因规模大、环境复杂及资源受限导致的建模与协同难题,以提高决策算法效率为目标,构建了多智能体分层决策架构,提出了智能协同控制方法。首先,将飞行器作为智能体构建协同控制模型;其次,采用部分可观测马尔可夫决策过程模型解决观测信息不全问题;然后,针对博弈环境多变和学习成本问题,提出基于集中训练分布执行的分层双时延策略梯度强化学习方法,融合有模型(model-based)与无模型(model-free)机制高效利用现有博弈环境的演化模型;最后,在分层智能决策框架下,进行典型多飞行器博弈及千次多场景的仿真验证。结果表明,新方法有效解决多飞行器协同控制问题,相较于多智能体强化学习算法MAPPO和QMIX,训练时间分别减少了51.03%和79.03%,算法效率(累积回报)分别提升了37.51%和58.73%,规避机动成功率分别提高了17.63%和39.79%。 展开更多
关键词 智能决策 多飞行器智能协同控制 分层决策 强化学习
在线阅读 下载PDF
基于多激发与层级标签的野生菌图像分类
7
作者 龙朝勋 李俊仪 +3 位作者 李向阳 李海燕 李红松 余鹏飞 《计算机工程与设计》 北大核心 2025年第4期941-949,共9页
为利用生物学多层级类别正确鉴别野生菌种类,提出一种多层级标签的分类网络。引入高效通道注意力(ECA)构建多激发模块,提取并融合多种判别性特征。推广条件概率权重矩阵并以决策融合构建多层级分类器(MHC),实现更广泛的逐层级监督与引... 为利用生物学多层级类别正确鉴别野生菌种类,提出一种多层级标签的分类网络。引入高效通道注意力(ECA)构建多激发模块,提取并融合多种判别性特征。推广条件概率权重矩阵并以决策融合构建多层级分类器(MHC),实现更广泛的逐层级监督与引导。基于准确率动态加权各层级损失项,调整训练侧重点,舍弃KL散度正则项,规避对交叉熵损失的干扰。实验结果表明,提出方法在“种”层级上Top1准确率可达98.17%,识别为可食用的有毒样本的比例(风险指数)达到最低水平,为3.64‰。t-SNE可视化显示,提取的特征的类内聚集性和类间可分离性有所提升。 展开更多
关键词 野生菌 层级标签 细粒度分类 决策融合 动态加权 KL散度 风险指数
在线阅读 下载PDF
基于分层强化学习的新型电力系统在线稳态调度
8
作者 赵莹莹 仇越 +5 位作者 朱天晨 李凡 苏运 邰振赢 孙庆赟 凡航 《上海交通大学学报》 北大核心 2025年第3期400-412,共13页
随着新型电力系统的建设,高比例可再生能源的随机性导致电网运行方式的不确定性大幅增加,给电网的安全稳定经济运行带来严峻挑战.采用深度强化学习方法等数据驱动的人工智能方法对电网进行调控并进行辅助决策在新型电力系统中具有重要意... 随着新型电力系统的建设,高比例可再生能源的随机性导致电网运行方式的不确定性大幅增加,给电网的安全稳定经济运行带来严峻挑战.采用深度强化学习方法等数据驱动的人工智能方法对电网进行调控并进行辅助决策在新型电力系统中具有重要意义,但当前基于深度强化学习的在线调度算法仍然面临高维决策空间难建模、调度策略难优化的问题,使得模型搜索效率较低、收敛较慢.因此,提出一种基于分层强化学习的新型电力系统在线稳态调度方法,通过自适应选取关键节点调节以降低决策空间.在此基础上进一步引入基于门控循环单元的状态上下文感知模块建模高维环境状态,综合运行成本、能源消纳以及越限情况为优化目标构建模型,并考虑各种运行约束.在IEEE-118、L2RPN-WCCI-2022和SG-126算例集上验证了所提算法的有效性. 展开更多
关键词 电网运行调度 强化学习 分层决策 状态表征
在线阅读 下载PDF
基于符号知识的选项发现方法
9
作者 王麒迪 沈立炜 吴天一 《计算机科学》 北大核心 2025年第1期277-288,共12页
基于选项(Option)的层次化策略学习是分层强化学习领域的一种主要实现方式。其中,选项表示特定动作的时序抽象,一组选项以多层次组合的方式可解决复杂的强化学习任务。针对选项发现这一目标,已有的研究工作使用监督或无监督方式从非结... 基于选项(Option)的层次化策略学习是分层强化学习领域的一种主要实现方式。其中,选项表示特定动作的时序抽象,一组选项以多层次组合的方式可解决复杂的强化学习任务。针对选项发现这一目标,已有的研究工作使用监督或无监督方式从非结构化演示轨迹中自动发现有意义的选项。然而,基于监督的选项发现过程需要人为分解任务问题并定义选项策略,带来了大量的额外负担;无监督方式发现的选项则难以包含丰富语义,限制了后续选项的重用。为此,提出一种基于符号知识的选项发现方法,只需对环境符号建模,所得知识可指导环境中多种任务的选项发现,并为发现的选项赋予符号语义,从而在新任务执行时被重复使用。将选项发现过程分解为轨迹切割和行为克隆两阶段步骤:轨迹切割旨在从演示轨迹提取具备语义的轨迹片段,为此训练一个面向演示轨迹的切割模型,引入符号知识定义强化学习奖励评价切割的准确性;行为克隆根据切割得到的数据监督训练选项,旨在使选项模仿轨迹行为。使用所提方法在多个包括离散和连续空间的领域环境中分别进行了选项发现和选项重用实验。选项发现中轨迹切割部分的实验结果显示,所提方法在离散和连续空间环境中的切割准确率均高出基线方法数个百分点,并在复杂环境任务的切割中提高到20%。另外,选项重用实验的结果证明,相较于基线方法,赋予符号语义增强的选项在新任务重用上拥有更快的训练速度,并在基线方法无法完成的复杂任务中仍然得到良好收敛。 展开更多
关键词 分层强化学习 演示学习 选项发现 马尔可夫决策过程
在线阅读 下载PDF
基于深度强化学习的无人机空战机动分层决策算法
10
作者 魏潇龙 吴亚荣 +1 位作者 姚登凯 赵顾颢 《系统工程与电子技术》 北大核心 2025年第9期2993-3003,共11页
针对无人机(unmanned aerial vehicle,UAV)超视距空战机动决策复杂度高、时效性强的问题,提出基于深度强化学习的分层决策算法。首先,根据超视距空战的战术特点,对UAV的态势判断、状态转移、胜负判定等过程进行建模,搭建空战仿真环境。... 针对无人机(unmanned aerial vehicle,UAV)超视距空战机动决策复杂度高、时效性强的问题,提出基于深度强化学习的分层决策算法。首先,根据超视距空战的战术特点,对UAV的态势判断、状态转移、胜负判定等过程进行建模,搭建空战仿真环境。其次,对深度强化学习网络模型进行构建,引入分层决策机制,使用蚁群算法作为目标网络Q值估计的启发式因子。仿真验证表明,所提算法可以使UAV根据态势变化及时采取机动策略,且策略输出和机动指令输出较为稳定,决策效率较高。所提算法可在拓宽UAV战术样式的基础上降低网络的学习难度,提升决策质量。 展开更多
关键词 无人机 超视距 空战对抗 深度强化学习 分层决策
在线阅读 下载PDF
基于分层多智能体强化学习的多无人机视距内空战
11
作者 雍宇晨 李子豫 董琦 《智能系统学报》 北大核心 2025年第3期548-556,共9页
为提高无人机在视距内空战中的自主机动决策能力,本文提出一种基于自博弈理论(self-play,SP)和多智能体分层强化学习(mutil agent hierarchical reinforcement learning,MAHRL)的层次决策网络框架。该框架通过结合自身博弈和多智能体强... 为提高无人机在视距内空战中的自主机动决策能力,本文提出一种基于自博弈理论(self-play,SP)和多智能体分层强化学习(mutil agent hierarchical reinforcement learning,MAHRL)的层次决策网络框架。该框架通过结合自身博弈和多智能体强化学习算法,研究了多无人机空战缠斗场景。复杂的空战任务被分解为上层导弹打击任务和下层飞行跟踪任务,有效地减少了战术行动的模糊性,并提高了多无人机空战场景中的自主机动决策能力。此外,通过设计新颖的奖励函数和采用自博弈方法,减少了大型战场环境导致的无意义探索。仿真结果表明,该算法不仅有助于智能体学习基本的飞行战术和高级的作战战术,而且在防御和进攻能力上优于其他多智能体空战算法。 展开更多
关键词 视距内空战 缠斗 自主机动决策 自博弈 分层强化学习 多智能体博弈 分层决策网络 奖励函数设计
在线阅读 下载PDF
高灵敏度X射线荧光光谱结合化学计量学对鞋底材料的快速检验
12
作者 王会荣 姜红 +4 位作者 宋彩芳 刘姝君 郑先云 李桂兰 韩玮 《化学研究与应用》 北大核心 2025年第3期655-661,共7页
为实现对不同鞋底材料的快速、准确鉴别,采用高灵敏度X射线荧光光谱对88个不同品牌、不同种类的鞋底材料进行测定。根据测试结果,初步把样品分为4类。结合化学计量学,对数据进行分析,首先用Ward法进行凝聚式层次聚类,然后建立决策树随... 为实现对不同鞋底材料的快速、准确鉴别,采用高灵敏度X射线荧光光谱对88个不同品牌、不同种类的鞋底材料进行测定。根据测试结果,初步把样品分为4类。结合化学计量学,对数据进行分析,首先用Ward法进行凝聚式层次聚类,然后建立决策树随机森林分类预测模型,数据表明随机森林的训练集正确率为100%,测试集的正确率为89%。进一步根据所含元素可以对鞋底材料进行准确识别。高灵敏度X射线荧光光谱法结合化学计量学可以对鞋底材料进行快速有效的检验,为未知鞋底材料溯源提供了一种新的思路。 展开更多
关键词 鞋底材料 高灵敏度X射线荧光光谱法 层次聚类 决策树 随机森林
在线阅读 下载PDF
面向物流数据共享的可撤销属性加密方案
13
作者 时自成 刘卓 +2 位作者 孙旭 郭锋 武传坤 《计算机应用研究》 北大核心 2025年第7期2161-2167,共7页
在信息驱动的时代,数据被赋予了更高的价值,成为推动各行各业发展的关键要素之一。针对物流数据共享过程中的数据安全问题,提出了一种基于多值决策图(MDD)访问结构的、支持用户分级访问且可撤销的密文策略属性基加密(CP-ABE)方案。该方... 在信息驱动的时代,数据被赋予了更高的价值,成为推动各行各业发展的关键要素之一。针对物流数据共享过程中的数据安全问题,提出了一种基于多值决策图(MDD)访问结构的、支持用户分级访问且可撤销的密文策略属性基加密(CP-ABE)方案。该方案利用MDD访问结构支持多值属性的特性,并结合物流企业的特点,构造并应用了一种支持用户分级访问的MDD分级访问结构。此外,考虑到物流企业人员的流动性,该数据共享方案还提供细粒度属性撤销功能。安全性分析证明,所提方案能够抵御选择明文攻击。通过理论分析,与相关方案相比,该方案在用户私钥生成和密文解密方面的性能不受用户属性集大小的影响;通过实验分析,该方案的密钥生成时间和解密时间恒定且低于其他方案。因此,所提方案具有更高的计算效率,更适用于物流数据分级共享的应用场景。 展开更多
关键词 物流数据共享 属性基加密 多值决策图 用户分级访问 属性撤销
在线阅读 下载PDF
基于DDQN-D^(3)PG的无人机空战分层决策
14
作者 王昱 李远鹏 +2 位作者 郭中宇 李硕 任田君 《兵工学报》 北大核心 2025年第8期66-76,共11页
强化学习在无人机空战应用中面临僵化的奖励函数与单一模型难以处理高维连续状态空间中复杂任务的挑战,严重限制了算法在动态多变态势下的决策泛化能力。针对上述问题,融合分层式与分布式架构的精髓,提出一种集成深度双Q网络(Double Dee... 强化学习在无人机空战应用中面临僵化的奖励函数与单一模型难以处理高维连续状态空间中复杂任务的挑战,严重限制了算法在动态多变态势下的决策泛化能力。针对上述问题,融合分层式与分布式架构的精髓,提出一种集成深度双Q网络(Double Deep Q-Network,DDQN)与深度确定性策略梯度(Deep Deterministic Policy Gradient,DDPG)算法的自主决策框架。根据敌我双方在不同态势下的优势差异,设计一系列基于不同奖励函数权重组合的DDPG算法模型,并以此构建底层分布式深度确定性策略梯度(Distributed DDPG,D^(3)PG)决策网络。引入擅长处理离散动作空间的DDQN算法构建上层决策网络,根据实时态势变化自主地选择并切换至最合适的底层策略模型,实现决策的即时调整与优化。为进一步提升红蓝双方无人机近距离空战环境的真实性与挑战性,在DDPG算法的训练中引入自我博弈机制,构建具备高度智能化的敌方决策模型。实验结果表明,新算法在无人机与智能化对手的博弈对抗中胜率最高达96%,相较D^(3)PG等算法提升20%以上,且在多种初始态势下均能稳定战胜对手,充分验证了该方法的有效性和先进性。 展开更多
关键词 无人机空战 强化学习 分层决策 深度双Q网络 分布式深度确定性策略梯度
在线阅读 下载PDF
基于近似动态规划的多级火箭全程任务决策 被引量:1
15
作者 李超兵 包为民 +2 位作者 李忠奎 禹春梅 程晓明 《宇航学报》 EI CAS CSCD 北大核心 2024年第8期1251-1260,共10页
针对火箭发生推力下降故障下的任务决策问题,提出了一种基于近似动态规划的多级火箭全程任务决策方法。首先,通过设置初始状态集合、决策选项、奖励函数、Q函数迭代方法等,建立了火箭任务决策分层强化学习模型,得到对火箭后续飞行进行... 针对火箭发生推力下降故障下的任务决策问题,提出了一种基于近似动态规划的多级火箭全程任务决策方法。首先,通过设置初始状态集合、决策选项、奖励函数、Q函数迭代方法等,建立了火箭任务决策分层强化学习模型,得到对火箭后续飞行进行评价的“评价网络”;然后利用基于凸优化的在线能力评估和轨迹规划方法,得到近似动态规划原理中的“决策生成”模块;最后,通过两者结合完成对火箭故障下后续飞行中连续轨迹和各级飞行段离散轨道根数等的决策。仿真结果表明该方法能够在非致命推力下降故障下实现火箭全程飞行任务决策并给出飞行轨迹。 展开更多
关键词 运载火箭 推力故障 任务决策 近似动态规划 分层强化学习
在线阅读 下载PDF
众包制造环境下协同产品族设计与延迟决策的主从关联优化 被引量:3
16
作者 吴军 夏一 《计算机集成制造系统》 EI CSCD 北大核心 2024年第2期695-707,共13页
针对众包制造环境下产品族设计与延迟决策之间的协同优化问题,建立了以产品族设计为主、延迟决策为从的混合整数非线性双层规划模型。模型上层由制造商设计产品族架构以最大化自身的期望利润,下层由多个分销商优化延迟产品模块的类型以... 针对众包制造环境下产品族设计与延迟决策之间的协同优化问题,建立了以产品族设计为主、延迟决策为从的混合整数非线性双层规划模型。模型上层由制造商设计产品族架构以最大化自身的期望利润,下层由多个分销商优化延迟产品模块的类型以最大化各自的期望利润,且各分销商之间的决策具有相互独立性。考虑到延迟产品模块事先不确定,提出虚拟延迟结构将该优化问题具体化,并证明需要被延迟的产品模块。开发了一个双层嵌套遗传算法对模型进行求解。用智能冰箱产品族延迟案例验证了所提模型和算法的有效性,并对所提延迟偏好参数进行了灵敏度分析。 展开更多
关键词 众包制造 产品族设计 延迟决策 主从关联优化 嵌套遗传算法
在线阅读 下载PDF
基于层次分析和关联规则的陆路交通工程间接勘察技术方案决策方法 被引量:2
17
作者 张国华 韩兆阳 马彩霞 《安全与环境工程》 CAS CSCD 北大核心 2024年第2期71-79,共9页
勘察技术方案的决策是开展陆路交通工程勘察的首要工作,然而在不同的勘察阶段,由于成本、效率、效果等需求不同,对勘察技术及手段的要求也不同。现阶段勘察技术的选取长期单纯地依赖从业者经验,导致其无法满足信息化、智能化勘察的需求... 勘察技术方案的决策是开展陆路交通工程勘察的首要工作,然而在不同的勘察阶段,由于成本、效率、效果等需求不同,对勘察技术及手段的要求也不同。现阶段勘察技术的选取长期单纯地依赖从业者经验,导致其无法满足信息化、智能化勘察的需求;同时,实用的新型勘察技术由于缺乏科学有效的决策机制,导致工程实践中无法及时融入。因此,需要建立科学的决策机制,结合新技术,制定更加精准、高效的勘察方案。将层次分析法和关联规则进行融合,提出了一种基于两者的间接勘察技术方案决策方法。首先,根据勘察技术本身具备的特性和目标地区地层参数进行定量分析,确定主要的勘察类别;然后,利用层次分析法选取该类别中满足勘察准确性、技术可靠性、经济合理性的最佳勘察技术;最后,运用关联规则围绕最佳勘察技术补齐在应用中存在的短板,综合新型勘察技术的应用实践结果,构建间接勘察技术组合方案。通过本决策方法的应用,极大程度地减小了勘察技术选择的随意性,据此建立的间接勘察技术组合方案符合现场需求和实践经验,证明了本方法的可行性。 展开更多
关键词 陆路交通工程勘察 组合方案 决策方法 层次分析 关联规则
在线阅读 下载PDF
基于兵棋推演的空战编组对抗智能决策方法 被引量:1
18
作者 陈晓轩 冯旸赫 +2 位作者 黄金才 刘忠 徐越 《指挥与控制学报》 CSCD 北大核心 2024年第2期213-219,共7页
基于兵棋研究的空战编组对抗方法主要使用规则或运筹等手段,存在假设不够合理、建模不准确、应变性差等缺陷。强化学习算法可以根据作战数据自主学习编组对抗策略,以应对复杂的战场情况,但现有强化学习对作战数据要求高,当动作空间过大... 基于兵棋研究的空战编组对抗方法主要使用规则或运筹等手段,存在假设不够合理、建模不准确、应变性差等缺陷。强化学习算法可以根据作战数据自主学习编组对抗策略,以应对复杂的战场情况,但现有强化学习对作战数据要求高,当动作空间过大时,算法收敛慢,且对仿真平台有较高的要求。针对上述问题,提出了一种融合知识数据和强化学习的空战编组对抗智能决策方法,该决策方法的输入是战场融合态势,使用分层决策框架控制算子选择并执行任务,上层包含使用专家知识驱动的动作选择器,下层包含使用专家知识和作战规则细化的避弹动作执行器、侦察动作执行器和使用强化学习算法控制的打击动作执行器。最后基于典型作战场景进行实验,验证了该方法的可行性和实用性,且具有建模准确、训练高效的优点。 展开更多
关键词 空战编组对抗 多算子的协作与控制 多智能体深度强化学习算法 分层决策模型
在线阅读 下载PDF
集成灾害系统和D/I模型的岩溶区燃气管道致灾演化层次结构分析 被引量:3
19
作者 李乔楚 张鹏 《中国安全生产科学技术》 CAS CSCD 北大核心 2024年第7期35-42,共8页
为进一步厘清岩溶区燃气管道多因素致灾演化的层次结构,基于灾害系统理论将其解构为孕灾环境、灾害因子、承灾体和灾情4大子系统,结合决策实验室分析法和解释结构模型分析多因素致灾演化的逻辑层次和因果递进关系,建立多级递阶结构模型... 为进一步厘清岩溶区燃气管道多因素致灾演化的层次结构,基于灾害系统理论将其解构为孕灾环境、灾害因子、承灾体和灾情4大子系统,结合决策实验室分析法和解释结构模型分析多因素致灾演化的逻辑层次和因果递进关系,建立多级递阶结构模型并明确风险管控要点。研究结果表明:灾害系统风险因素分布于多阶层级,形成差异化作用路径和异质性影响效应;岩溶塌陷长度和宽度等表层直接因素对致灾演化造成直接影响,是风险管控第1要务;岩溶覆盖层特征、地形地貌等中层间接因素在灾害系统中起承上启下作用;构造条件、火源等深层根本因素位于多阶结构底层,对其管控能从本质上有效遏制灾害演化发展。研究结果可为岩溶地质隐患区燃气管道工程提供防灾减灾参考。 展开更多
关键词 灾害系统 决策实验室分析法 解释结构模型 岩溶区 燃气管道 灾害演化 层次结构
在线阅读 下载PDF
基于区块链的园区碳排放可信监测模型 被引量:4
20
作者 王栋 冯景丽 +2 位作者 李达 牛静伟 李军 《中国电力》 CSCD 北大核心 2024年第7期182-187,共6页
构建了基于能源电力区块链的园区碳排放可信监测数字模型。首先,利用区块链防篡改技术保障监测数据的可信存证要求,相关接入实体指标全部由联盟链进行身份认证和权限控制,避免了数据遗失以及主体以外其他人恶意篡改的风险;其次,在具体... 构建了基于能源电力区块链的园区碳排放可信监测数字模型。首先,利用区块链防篡改技术保障监测数据的可信存证要求,相关接入实体指标全部由联盟链进行身份认证和权限控制,避免了数据遗失以及主体以外其他人恶意篡改的风险;其次,在具体的监测指标融合过程中,结合层次分析法,构建碳排放评价指标融合策略,对能源电力相关指标数据结合相似性聚类算法进行多源在线融合;最后,基于局部异常因子算法(local outlier factor,LOF)实现指标数据长周期异常离群检测,一定程度上解决数据畸变和错报自筛难题。 展开更多
关键词 区块链 碳排放监测 层次决策
在线阅读 下载PDF
上一页 1 2 10 下一页 到第
使用帮助 返回顶部