期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于混合模仿学习的多智能体追捕决策方法
1
作者 王焱宁 张锋镝 +1 位作者 肖登敏 孙中奇 《计算机科学》 北大核心 2025年第1期323-330,共8页
针对传统模仿学习方法在处理多样化专家轨迹时的局限性,尤其是难以有效整合质量参差不齐的固定模态专家数据的问题,创新性地融合了多专家轨迹生成对抗模仿学习(Multiple Trajectories Generative Adversarial Imitation Learning, MT-GA... 针对传统模仿学习方法在处理多样化专家轨迹时的局限性,尤其是难以有效整合质量参差不齐的固定模态专家数据的问题,创新性地融合了多专家轨迹生成对抗模仿学习(Multiple Trajectories Generative Adversarial Imitation Learning, MT-GAIL)方法与时序差分误差行为克隆(Temporal-Difference Error Behavioral Cloning, TD-BC)技术,构建了一种混合模仿学习框架。该框架不仅可以增强模型对复杂多变的专家策略的适应能力,还能够提升模型从低质量数据中提炼有用信息的鲁棒性。框架得到的模型具备直接应用于强化学习的能力,仅需经过细微的调整与优化,即可训练出一个直接可用的、基于专家经验的强化学习模型。在二维动静结合的目标追捕场景中进行了实验验证,该方法展现出良好的性能。结果表明,所提方法可以吸取专家经验,为后续的强化学习训练阶段提供一个起点高、效果佳的初始模型。 展开更多
关键词 智能决策 强化学习 行为克隆 生成对抗模仿学习
在线阅读 下载PDF
基于安全域的区域综合能源系统安全预警方法
2
作者 肖峻 孙纲 +2 位作者 宋晨辉 王丹 莫少雄 《中国电机工程学报》 北大核心 2025年第10期3709-3722,I0003-I0010,共22页
该文基于安全域理论提出一套较完整的区域综合能源系统(regional integrated energy system,RIES)安全预警流程。首先,建立RIES安全域模型并给出RIES安全边界计算方法,包括交流安全边界与直流安全边界。其次,介绍模糊推理与模糊综合评... 该文基于安全域理论提出一套较完整的区域综合能源系统(regional integrated energy system,RIES)安全预警流程。首先,建立RIES安全域模型并给出RIES安全边界计算方法,包括交流安全边界与直流安全边界。其次,介绍模糊推理与模糊综合评判方法,用于预警中评估越限的严重程度。再次,提出RIES预警方法,能综合考虑系统N-0与N-1安全性从而发出预警或告警信号。该方法包括预警指标选取与评判、安全预警分级、预警原因分析、安全趋势预测等步骤。最后,用算例验证该方法的有效性。可知,该文提出的安全预警方法对于提升RIES的安全管控能力,具有一定应用价值。 展开更多
关键词 区域综合能源系统 安全预警 安全域 模糊推理 模糊综合评判
在线阅读 下载PDF
大模型的能力边界与指挥控制应用 被引量:1
3
作者 赵亮 鞠鸿彬 +2 位作者 张鹏翼 苏建 李杏 《指挥与控制学报》 CSCD 北大核心 2024年第6期653-660,共8页
大模型在军事指挥决策中存在巨大的潜在应用价值,需要明确大模型能力边界,才能更好地推动应用落地。从国内外大模型行业发展现状、大模型的能力边界、潜在的指挥控制应用3个方面进行了分析。分析最先新大模型能力边界以及国内大模型的... 大模型在军事指挥决策中存在巨大的潜在应用价值,需要明确大模型能力边界,才能更好地推动应用落地。从国内外大模型行业发展现状、大模型的能力边界、潜在的指挥控制应用3个方面进行了分析。分析最先新大模型能力边界以及国内大模型的相对水平,对大模型能力缺陷、能力扩展手段进行了总结。提出大模型在指挥控制应用方法以及带来的智能化等级提升。提出在指挥与控制应用领域应重点开展的工作建议。 展开更多
关键词 大模型 能力边界 指挥与控制 智能等级
在线阅读 下载PDF
中国大中型陆栖哺乳动物地理区边界探测及其驱动因素
4
作者 迟瑶 刘璐 +1 位作者 吴朝宁 王结臣 《生态学报》 CAS CSCD 北大核心 2023年第23期9597-9620,共24页
地理隔离是驱动物种空间分布格局形成的主要原因之一。利用我国大中型陆栖哺乳动物的地理分布数据,基于信息地图生物区(Infomap Bioregions)方法探测生物地理区域,提取对大中型陆栖哺乳动物类群的分布扩散产生阻隔效应的主要界线。从温... 地理隔离是驱动物种空间分布格局形成的主要原因之一。利用我国大中型陆栖哺乳动物的地理分布数据,基于信息地图生物区(Infomap Bioregions)方法探测生物地理区域,提取对大中型陆栖哺乳动物类群的分布扩散产生阻隔效应的主要界线。从温度、降水和地形的梯度变化角度入手,应用空间自回归模型确定与生物地理区边界相关的主要驱动因子,构建地理加权逻辑回归(GWLR)模型分析各驱动因子重要性的空间非平稳性特征。结果表明,研究区域划分为3个主要的生物地理区,除年降水量变异系数与边界联系不明显外,其余变量均在10%及以下的显著性水平与生物地理区边界呈正相关,反映出生物地理区边界与气候突变、地形障碍和人类活动的协同作用有关。生物地理区1与生物地理区3的边界线的主导影响因子是人类足迹指数,生物地理区1和生物地理区2的边界线的主导影响因子是气温季节性变动系数变异系数,生物地理区2和生物地理区3边界线在祁连山脉一带的主导影响因子主要是气温季节性变动系数变异系数,其余地区为地形障碍。多类群物种对隔离屏障的响应模式难以统一,研究从大中型动物入手,通过识别以不同物种组合为特征的生物地理区域,揭示物种在空间上的分组方式,为探讨各动物类群的隔离机制提供空间模式和框架。 展开更多
关键词 地理隔离 大中型陆栖哺乳动物 生物地理区 Infomap 地理加权逻辑回归
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部