期刊文献+
共找到133篇文章
< 1 2 7 >
每页显示 20 50 100
深度强化学习下的多智能体思考型半多轮通信网络
1
作者 邹启杰 汤宇 +2 位作者 高兵 赵锡玲 张哲婕 《控制理论与应用》 北大核心 2025年第3期553-562,共10页
针对多智能体系统在合作环境中通信内容单一和信息稀疏问题,本文提出一种基于多智能体深度强化学习的思考型通信网络(TMACN).首先,智能体在交互过程中考虑不同信息源的差异性,智能体将接收到的通信信息与自身历史经验信息进行融合,形成... 针对多智能体系统在合作环境中通信内容单一和信息稀疏问题,本文提出一种基于多智能体深度强化学习的思考型通信网络(TMACN).首先,智能体在交互过程中考虑不同信息源的差异性,智能体将接收到的通信信息与自身历史经验信息进行融合,形成推理信息,并将此信息作为新的发送消息,从而达到提高通信内容多样化的目标;然后,该模型在软注意力机制的基础上设计了一种半多轮通信策略,提高了信息饱和度,从而提升系统的通信交互效率.本文在合作导航、捕猎任务和交通路口3个模拟环境中证明,TMACN对比其他方法,提高了系统的准确率与稳定性. 展开更多
关键词 多智能体系统 合作环境 深度强化学习 通信网络
在线阅读 下载PDF
交流合作认知理论下数智媒介赋能在线深度教学模式构建
2
作者 程欣 《成人教育》 北大核心 2025年第9期55-62,共8页
在教育数智化转型背景下,依据交流合作认知理论探索生成式人工智能工具支持在线深度教学的实践模式,回应数智时代对高质量教学的要求,推动在线教学模式变革。根据在线教学各个环节的认知特征,将数智媒介贯穿于在线教学的课前、课中与课... 在教育数智化转型背景下,依据交流合作认知理论探索生成式人工智能工具支持在线深度教学的实践模式,回应数智时代对高质量教学的要求,推动在线教学模式变革。根据在线教学各个环节的认知特征,将数智媒介贯穿于在线教学的课前、课中与课后,精准匹配教学资源,提供多模态教学环境,支持学生个性化自适应合作学习。通过人机多元交流改变师生互动的二元格局,促进个体认知冲突不断向群体共同认知转化,发展批判性思维,帮助学生建构灵活、开放的知识体系,从元认知高度促进学生知识的迁移应用,实现在线深度教学。 展开更多
关键词 交流合作认知 数智媒介 生成式人工智能 在线深度教学 教学模式
在线阅读 下载PDF
智能油藏注采生产调控系统关键技术研究 被引量:1
3
作者 魏琪 丁帅 +4 位作者 冀凯 荣金曦 牛会钊 张雄英 檀朝东 《钻采工艺》 北大核心 2025年第1期180-189,共10页
油藏开发注采单元的注入端与受效采出端,存在有采无注、油层互串的现象,导致油层动用不均衡,开发效果差等问题。针对以上问题,融合注采生产单元实时智能全景信息感知、数字孪生的注采生产单元数字建模、“数据+机理”驱动的注入端—油... 油藏开发注采单元的注入端与受效采出端,存在有采无注、油层互串的现象,导致油层动用不均衡,开发效果差等问题。针对以上问题,融合注采生产单元实时智能全景信息感知、数字孪生的注采生产单元数字建模、“数据+机理”驱动的注入端—油藏—采出端多目标协同优化建模、云边协同的注采调控系统架构等关键技术,建立了注采单元生产过程管控的数字孪生架构,研发了智能注采生产调控系统WellTwin。系统业务功能涵盖数字井史、生产动态监测、油藏动态分析、注采方案优化设计、井筒智能调控、井筒诊断预警,形成了注采监测、诊断、预警、优化、调控的一体化闭环系统。应用效果表明,智能注采生产调控系统WellTwin有效解决了传统系统的分析离散、调控滞后等问题,提升了采单元的精细化管控水平,有效推动了油藏开发生产的数字化转型。 展开更多
关键词 智能油藏 注采优化 深度强化学习 协同调控 数字孪生系统
在线阅读 下载PDF
近端策略优化的城市环境多智能体协作对抗方法
4
作者 米广铭 张辉 +1 位作者 张菁 卓力 《通信学报》 北大核心 2025年第3期94-108,共15页
城市环境由于其地理空间的复杂性及动态变化性,往往会令指挥系统变得低效且短视。针对该问题,提出了一种近端策略优化城市环境的多智能体协作对抗方法。首先,在建立完善的城市对抗环境的基础上,使用近端策略优化的演员-评论员网络算法... 城市环境由于其地理空间的复杂性及动态变化性,往往会令指挥系统变得低效且短视。针对该问题,提出了一种近端策略优化城市环境的多智能体协作对抗方法。首先,在建立完善的城市对抗环境的基础上,使用近端策略优化的演员-评论员网络算法进行求解;其次,针对多对一的评论网络采用嵌入方法来解决空间维度不同的异构智能体决策评价问题;再次,在近端策略优化的基础上,增加了自适应采样来辅助策略的更新;最后,对演员网络进行权重继承操作以帮助智能体迅速接管相应的任务。实验结果表明,相较于其他方法,所提方法的奖励回报提高了22.67%,收敛速度加快了8.14%,不仅可以满足城市环境下多个智能体协作对抗的决策,还能够兼容多异构智能体的协作对抗。 展开更多
关键词 深度强化学习 多智能体 协作对抗 近端策略优化 城市环境
在线阅读 下载PDF
面向无人机协同定位的机载深度计算编译优化
5
作者 熊康 刘思聪 +3 位作者 王宏涛 高元 郭斌 於志文 《计算机科学与探索》 北大核心 2025年第1期141-157,共17页
随着无人机技术快速发展,在定位信号缺失的情况下进行无人机定位成为一个研究难题。而近几年图神经网络的出现与发展,为解决这一难题提供了一种新的解决思路。然而在资源受限的无人机端侧部署图神经网络面临着无人机算储资源受限及实时... 随着无人机技术快速发展,在定位信号缺失的情况下进行无人机定位成为一个研究难题。而近几年图神经网络的出现与发展,为解决这一难题提供了一种新的解决思路。然而在资源受限的无人机端侧部署图神经网络面临着无人机算储资源受限及实时性难以满足等挑战。提出面向无人机协同定位的机载深度计算编译优化方法。采用了一种轻量化的时间图卷积神经网络模型,该时间图卷积网络由图卷积网络和门控递归单元组成,将无人机群的空间依赖性和无人机位置变化的时间依赖性同时加以考虑,对无人机群位置进行精确的预测;针对该模型在时间图卷积网络上的冗余特性,提出了基于逆向Cuthill-McKee图重排和基于双深度确定性策略梯度的全局自适应剪枝算法。在保证无人机群坐标精确预测的同时,不仅能提高数据在主存的空间局部性,加速模型的运算速度,而且能够对模型进行自适应的非结构化剪枝,降低模型的存储复杂度。实验结果表明,相对于已有的时间图卷积神经网络模型,编译优化后的轻量化时间图卷积神经网络模型在保留78.8%准确率的同时,模型计算时间降低37.9%,模型的平均剪枝率达到90.3%。 展开更多
关键词 时间图卷积网络 协同定位 通道剪枝 图重排算法 深度确定性策略梯度
在线阅读 下载PDF
基于DDPG-LQR的高超声速飞行器时间协同再入制导
6
作者 宋志飞 吉月辉 +2 位作者 宋雨 刘俊杰 高强 《导弹与航天运载技术(中英文)》 北大核心 2025年第1期57-64,共8页
针对多高超声速飞行器协同作战的特点,提出一种基于深度策略性梯度和线性二次型调节器(Deep Deterministic Policy Gradient-Linear Quadratic Regulator,DDPG-LQR)的时间协同再入制导方案。首先,采用序列凸优化方法生成满足多个约束的... 针对多高超声速飞行器协同作战的特点,提出一种基于深度策略性梯度和线性二次型调节器(Deep Deterministic Policy Gradient-Linear Quadratic Regulator,DDPG-LQR)的时间协同再入制导方案。首先,采用序列凸优化方法生成满足多个约束的时间协同再入轨迹及其相应的稳态控制量,并且采用Radau伪谱法离散运动学方程,以提高轨迹优化离散精度。其次,采用线性二次型调节器(Linear Quadratic Regulator,LQR)跟踪时间协同再入轨迹。为了提高协同制导精度和制导效果,采用深度策略性梯度(Deep Deterministic Policy Gradient,DDPG)在线优化LQR的权重矩阵系数。在DDPG算法中,通过引入合适的奖励函数来提高算法的优化性能。仿真结果表明,在初始状态误差和不确定性的情况下,通过与传统的LQR控制器相比,本文所提出的协同制导方案具有更好的协同制导精度和制导效果。 展开更多
关键词 多高超声速飞行器 协同制导 序列凸优化 深度策略性梯度 线性二次型调节器
在线阅读 下载PDF
一种基于深度强化学习的协同制导策略
7
作者 谭明虎 艾文洁 +2 位作者 何昊麟 李浩宇 王靖宇 《宇航学报》 北大核心 2025年第6期1203-1213,共11页
针对在速度不可控条件下的多弹协同打击问题,提出了一种基于深度强化学习的多弹协同制导策略生成方法。基于多智能体近端策略优化算法,通过构建连续动作空间的智能协同制导框架,设计了一种启发式重塑的奖励函数来引导多枚导弹有效协同... 针对在速度不可控条件下的多弹协同打击问题,提出了一种基于深度强化学习的多弹协同制导策略生成方法。基于多智能体近端策略优化算法,通过构建连续动作空间的智能协同制导框架,设计了一种启发式重塑的奖励函数来引导多枚导弹有效协同打击目标,以解决对制导环境因奖励信号稀疏导致的学习效率低下问题。最后,提出基于多阶段课程学习的智能体平滑动作方法,有效解决强化学习中由独立采样引起的动作抖动问题。仿真实验表明,在随机初始条件范围内,基于深度强化学习制导律生成的协同制导策略可以成功实现对目标的协同攻击。 展开更多
关键词 导弹 协同制导 深度强化学习 多智能体近端策略优化
在线阅读 下载PDF
基于指针网络架构的多星协同成像任务规划方法
8
作者 朱运豆 孙海权 胡笑旋 《系统工程与电子技术》 北大核心 2025年第7期2246-2255,共10页
随着卫星资源数量增加,用户成像需求也在急剧扩大,亟需加强多星协同成像任务规划研究,提升卫星服务能力。本文基于深度强化学习对多星协同成像任务规划问题开展研究。首先,在满足任务需求、卫星能力、时空约束基础上,建立多星协同成像... 随着卫星资源数量增加,用户成像需求也在急剧扩大,亟需加强多星协同成像任务规划研究,提升卫星服务能力。本文基于深度强化学习对多星协同成像任务规划问题开展研究。首先,在满足任务需求、卫星能力、时空约束基础上,建立多星协同成像任务规划数学模型。然后,设计一种基于指针网络的卫星任务规划算法,利用指针网络机制对输入序列进行优化选择,并通过Mask向量表征各类约束。最后,仿真结果表明算法获得的平均任务收益比传统启发式算法和指针网络模型至少提高1.71%,对于不同任务规模实例训练完成的算法,其平均任务收益差最大不超过0.28%,证明了算法的有效性和适用性。 展开更多
关键词 多星协同成像 任务规划 深度强化学习 指针网络
在线阅读 下载PDF
基于TD3算法的多智能体协作缓存策略
9
作者 曾建州 李泽平 张素勤 《计算机工程》 北大核心 2025年第2期365-374,共10页
为了降低移动边缘网络中的内容获取时延和传输开销,提出一种基于双延迟深度确定性策略梯度(TD3)的多智能体协作缓存策略(MACC)。首先构建多智能体边缘缓存模型,将多节点缓存替换问题建模为部分可观测马尔可夫决策过程(POMDP),把相邻节... 为了降低移动边缘网络中的内容获取时延和传输开销,提出一种基于双延迟深度确定性策略梯度(TD3)的多智能体协作缓存策略(MACC)。首先构建多智能体边缘缓存模型,将多节点缓存替换问题建模为部分可观测马尔可夫决策过程(POMDP),把相邻节点的缓存状态和内容请求信息融入到各节点的观察空间,提高智能体对环境的感知能力,并通过三次指数平滑法提取各节点内容请求的流行度特征,使得算法能够适应内容流行度变化,从而提高缓存命中率;然后联合本地与相邻节点的传输时延和开销来设计指导性奖励函数,引导智能体进行协作缓存,降低系统的缓存冗余和内容传输开销;最后结合Wolpertinger Architecture方法对TD3算法进行多智能体扩展,使每个边缘节点都能自适应地学习缓存策略,从而提高系统性能。实验结果表明,MACC算法中边缘节点牺牲了部分缓存空间来协助相邻节点缓存请求内容,从而提高缓存命中率,在同一数据集上与MAAC、DDPG、独立TD3算法相比,MACC算法的缓存命中率分别平均提高了8.50%、13.91%和29.21%,并能适应动态的边缘环境,实现较小的内容获取时延和传输开销。 展开更多
关键词 移动边缘网络 多智能体 协作缓存 深度强化学习 TD3算法
在线阅读 下载PDF
考虑动态时段划分的双策略协同强化学习无功电压控制
10
作者 郑瑜蓁 王慧芳 +2 位作者 张亦翔 马永吉 郭瑞鹏 《电力自动化设备》 北大核心 2025年第8期199-207,共9页
高比例分布式光伏接入农村配电网引起日间潮流倒送,导致日夜电压越限存在明显差异,为此,提出了一种考虑动态时段划分的双策略协同强化学习无功电压控制方法。分析了动态时段划分的必要性,并提出样本表征指标及划分方法,据此进行静止无... 高比例分布式光伏接入农村配电网引起日间潮流倒送,导致日夜电压越限存在明显差异,为此,提出了一种考虑动态时段划分的双策略协同强化学习无功电压控制方法。分析了动态时段划分的必要性,并提出样本表征指标及划分方法,据此进行静止无功补偿器优化配置;以最小化全天运行网损为目标,利用二阶锥松弛进行日前离散无功规划,并作为后续日内控制决策的依据;提出了双策略协同多智能体深度强化学习算法,将实时无功电压控制问题转化为分布式部分可观测马尔可夫决策过程,依据日内超短期与日前预测偏差对全天时段进行动态划分,构建双策略无功电压协同控制架构,对全天电压进行有效控制。利用改进IEEE33节点配电网验证了所提方法的有效性。 展开更多
关键词 动态时段划分 无功电压控制 多智能体深度强化学习 双策略协同 多时间尺度 配电网
在线阅读 下载PDF
考虑燃油消耗异质性的船舶进港效率与能耗协同优化
11
作者 郭文强 张新宇 杨嵩旭 《交通运输系统工程与信息》 北大核心 2025年第4期297-305,共9页
针对不同类型船舶在进港过程中燃油消耗差异显著,调度效率与能耗优化难以兼顾的问题,本文研究考虑燃油消耗异质性的船舶进港效率与能耗协同优化方法,构建以最小化船舶总进港时间与总燃油消耗为目标的双目标混合整数非线性规划模型,提出... 针对不同类型船舶在进港过程中燃油消耗差异显著,调度效率与能耗优化难以兼顾的问题,本文研究考虑燃油消耗异质性的船舶进港效率与能耗协同优化方法,构建以最小化船舶总进港时间与总燃油消耗为目标的双目标混合整数非线性规划模型,提出一种深度Q网络(DQN)驱动的协同元启发式算法求解模型。算法设计中引入改进的Nawaz-Enscore-Ham启发式方法生成初始调度序列,并构建基于DQN的双种群协作搜索框架以动态调整船舶进港顺序与航速配置。以天津港典型调度实例为背景开展仿真对比实验,结果显示,深度Q网络驱动的协同元启发式算法在目标空间中解的质量与分布性能均优于传统启发式方法。与商业求解器CPLEX相比,该算法在求解效率上实现了指数级提升,其两个目标函数的综合偏差控制在2.04%~12.82%,能够稳定地获得接近最优的高质量近似解。进一步对比分析表明,在考虑燃油效率异质性的条件下,船舶的调度优先级发生明显变化,印证了能耗结构差异对进港组织策略的显著影响。 展开更多
关键词 水路运输 效率和油耗优化 深度Q网络 进港船舶 双种群协作框架
在线阅读 下载PDF
“三位一体”海空协同机器人系统设计与实现
12
作者 王帅 高志福 +1 位作者 徐红丽 茹敬雨 《实验技术与管理》 北大核心 2025年第1期28-37,共10页
针对海洋监测、海洋垃圾清理、搜索救援及资源探测等任务,为在资源受限的环境下实现高效智能作业,研究并开发了一种“三位一体”海空协同机器人系统。该系统综合运用了无人艇(unmanned surface vessel,USV)、无人机(unmanned aerial veh... 针对海洋监测、海洋垃圾清理、搜索救援及资源探测等任务,为在资源受限的环境下实现高效智能作业,研究并开发了一种“三位一体”海空协同机器人系统。该系统综合运用了无人艇(unmanned surface vessel,USV)、无人机(unmanned aerial vehicle,UAV)、水下机器人(autonomous underwater vehicle,AUV)和地面站的先进技术,形成了一套完整的海空协同作业解决方案。首先,在USV上设计了一种用于水面USV自主布放与回收微小型AUV的机构;其次,在AUV设计方面,采用开源的BuleROV框架和PNP位姿解算的方式实现与USV的自主对接;在UAV设计方面,Pixhawk飞控板与树莓派4B的结合,不仅强化了系统的处理能力,而且通过Pymavlink协议实现了高效的机载计算与通信。湖试验证阶段,模拟了实际作业场景,验证了UAV与USV的协同作业流程,以及AUV与USV对接实验,包括目标检测、信息传递、路径规划、PNP位姿解算和目标收取等关键环节。试验结果表明,系统能够有效地完成预定任务,展现出良好的稳定性和可靠性。 展开更多
关键词 无人艇 海空协同机器人 深度学习 自主对接
在线阅读 下载PDF
跨通道桥接图卷积神经网络的多模态故障诊断
13
作者 苏树智 董闯 +1 位作者 陈见 朱彦敏 《振动.测试与诊断》 北大核心 2025年第3期513-519,622,共8页
针对传统故障诊断方法难以提取全面的故障特征以及泛化能力相对较弱等问题,提出了一种跨通道桥接图卷积神经网络(cross-channel bridge graph convolutional network,简称CCBGCN)的多模态故障诊断方法。首先,构造K近邻图获得不同模态的... 针对传统故障诊断方法难以提取全面的故障特征以及泛化能力相对较弱等问题,提出了一种跨通道桥接图卷积神经网络(cross-channel bridge graph convolutional network,简称CCBGCN)的多模态故障诊断方法。首先,构造K近邻图获得不同模态的图结构数据,考虑到每个模态特有的故障信息,使用图卷积操作先获取各模态的故障特征,再跨越不同通道建立高效的桥接机制,促进特征的融合与补充;其次,针对多个模态中隐藏的共同信息,使用动态协同机制捕捉共有故障特征,从而提升模型的综合分析能力;最后,使用多通道融合Transformer模块实现多通道信息整合和故障诊断,所提出方法在数据集Paderborn和AUST上的准确率分别达到了0.995和0.984。实验结果表明,该模型可有效增强多模态故障特征,捕捉相似故障特征,在变工况下的诊断精度和鲁棒性均优于常用方法。 展开更多
关键词 故障诊断 跨通道桥接 动态协同 图卷积神经网络 深度学习
在线阅读 下载PDF
基于合作博弈Shapley值法的类激活映射算法
14
作者 许莉 常雨晴 +2 位作者 柴霁轩 宛旭 范纯龙 《计算机工程与设计》 北大核心 2025年第3期795-803,共9页
为加深对深度神经网络内部决策依据的理解,更好进行网络的调试和应用,提出一种结合特征重要性算法和类激活映射(CAM)的计算机视觉可解释性技术(Shapley-CAM)。利用合作博弈理论中的沙普利值算法计算特征图对最终结果的贡献,以此作为权... 为加深对深度神经网络内部决策依据的理解,更好进行网络的调试和应用,提出一种结合特征重要性算法和类激活映射(CAM)的计算机视觉可解释性技术(Shapley-CAM)。利用合作博弈理论中的沙普利值算法计算特征图对最终结果的贡献,以此作为权重对特征图进行加权求和,得到类激活图,对神经网络模型的决策机制进行解释。重点考虑网络最后一层中每个特征图对结果的影响,可视化输入图像中对模型输出造成正向影响的区域。实验结果表明,该方法能够更准确地解释深度神经网络的决策依据,在定位能力和算法忠诚度等方面的性能得到了显著提升。 展开更多
关键词 深度神经网络 特征重要性 类激活映射 可解释性 合作博弈 沙普利值 特征图
在线阅读 下载PDF
基于多智能体深度策略梯度的离网型微电网双层优化调度
15
作者 樊会丛 段志国 +4 位作者 陈志永 朱士加 刘航 李文霄 杨阳 《中国电力》 北大核心 2025年第5期11-20,32,共11页
针对高渗透率分布式可再生能源并网引发的电压越限、双向潮流等问题,提出一种双层有功无功协同优化方法,实现离网型微电网有功无功协调优化调度,保证系统安全稳定运行并提升运行的经济性。下层模型基于混合整数二阶锥规划优化慢速调节... 针对高渗透率分布式可再生能源并网引发的电压越限、双向潮流等问题,提出一种双层有功无功协同优化方法,实现离网型微电网有功无功协调优化调度,保证系统安全稳定运行并提升运行的经济性。下层模型基于混合整数二阶锥规划优化慢速调节离散设备,上层模型基于多智能体深度策略梯度算法优化快速调节连续设备。双层模型同时调节微电网的有功和无功潮流,能够实时观测微电网状态,在线决策调节设备的优化方案,且不依赖精确的潮流模型和复杂的通信系统。最后,在改进IEEE 33节点微电网系统中验证双层优化模型的可行性和有效性。 展开更多
关键词 离网型微电网 多智能体 深度强化学习 混合整数线性规划 多时间尺度 有功无功协同优化
在线阅读 下载PDF
横琴粤澳深度合作区发展逻辑与方向
16
作者 关成华 《人民论坛·学术前沿》 北大核心 2025年第4期44-54,共11页
横琴粤澳深度合作区是丰富“一国两制”实践的新示范,厘清横琴粤澳深度合作区在多重国家发展战略叠加背景下面临的矛盾及其未来发展方向,有助于横琴进一步强化核心功能定位,促进澳门地区经济适度多元发展,支持澳门地区更好融入国家发展... 横琴粤澳深度合作区是丰富“一国两制”实践的新示范,厘清横琴粤澳深度合作区在多重国家发展战略叠加背景下面临的矛盾及其未来发展方向,有助于横琴进一步强化核心功能定位,促进澳门地区经济适度多元发展,支持澳门地区更好融入国家发展大局。横琴粤澳深度合作区在发展建设过程中面临“高与低”“开与合”“承与转”“有与优”等矛盾,制约了其制度、政策等比较优势的发挥。未来,建议横琴粤澳深度合作区紧紧围绕促进澳门地区经济适度多元发展的重要使命,加快打造“国际科教城”“世界博物馆之城”“国际中医药之城”,建设“国际新技术创新应用中心”和“创意产业集群”,为澳门地区“一国两制”实践行稳致远注入新动能。 展开更多
关键词 横琴粤澳深度合作区 多重国家发展战略 粤港澳大湾区“一国两制”
在线阅读 下载PDF
Cooperative multi-target hunting by unmanned surface vehicles based on multi-agent reinforcement learning 被引量:2
17
作者 Jiawei Xia Yasong Luo +3 位作者 Zhikun Liu Yalun Zhang Haoran Shi Zhong Liu 《Defence Technology(防务技术)》 SCIE EI CAS CSCD 2023年第11期80-94,共15页
To solve the problem of multi-target hunting by an unmanned surface vehicle(USV)fleet,a hunting algorithm based on multi-agent reinforcement learning is proposed.Firstly,the hunting environment and kinematic model wit... To solve the problem of multi-target hunting by an unmanned surface vehicle(USV)fleet,a hunting algorithm based on multi-agent reinforcement learning is proposed.Firstly,the hunting environment and kinematic model without boundary constraints are built,and the criteria for successful target capture are given.Then,the cooperative hunting problem of a USV fleet is modeled as a decentralized partially observable Markov decision process(Dec-POMDP),and a distributed partially observable multitarget hunting Proximal Policy Optimization(DPOMH-PPO)algorithm applicable to USVs is proposed.In addition,an observation model,a reward function and the action space applicable to multi-target hunting tasks are designed.To deal with the dynamic change of observational feature dimension input by partially observable systems,a feature embedding block is proposed.By combining the two feature compression methods of column-wise max pooling(CMP)and column-wise average-pooling(CAP),observational feature encoding is established.Finally,the centralized training and decentralized execution framework is adopted to complete the training of hunting strategy.Each USV in the fleet shares the same policy and perform actions independently.Simulation experiments have verified the effectiveness of the DPOMH-PPO algorithm in the test scenarios with different numbers of USVs.Moreover,the advantages of the proposed model are comprehensively analyzed from the aspects of algorithm performance,migration effect in task scenarios and self-organization capability after being damaged,the potential deployment and application of DPOMH-PPO in the real environment is verified. 展开更多
关键词 Unmanned surface vehicles Multi-agent deep reinforcement learning cooperative hunting Feature embedding Proximal policy optimization
在线阅读 下载PDF
切顶沿空留巷充填体—矸石协同承载机理及控制技术研究 被引量:5
18
作者 徐军 孟宁康 柏建彪 《矿业安全与环保》 CAS 北大核心 2024年第1期140-146,共7页
针对深部沿空留巷顶底板移近量大、充填体大变形破坏失稳等问题,采用数值模拟和现场实践相结合的方法,分析了传统沿空留巷和切顶卸压协同承载沿空留巷围岩应力演化规律和变形特征,揭示了切顶沿空留巷充填体—矸石协同承载机理。在此基础... 针对深部沿空留巷顶底板移近量大、充填体大变形破坏失稳等问题,采用数值模拟和现场实践相结合的方法,分析了传统沿空留巷和切顶卸压协同承载沿空留巷围岩应力演化规律和变形特征,揭示了切顶沿空留巷充填体—矸石协同承载机理。在此基础上,以朱庄煤矿Ⅲ635工作面沿空留巷为工程背景,提出了一种巷旁充填体—矸石组合结构体协同承载的切顶卸压沿空留巷技术,建立充填体—矸石协同支撑顶板力学模型、推导出顶板挠度方程,并进行工程应用。数值模拟结果表明:采用切顶卸压协同承载沿空留巷技术后,实体煤帮和充填体的垂直应力峰值分别降低了28.3%、44.4%,巷道顶底板移近量降低了58.2%。现场应用结果表明:采用该技术后,顶底板和两帮移近量分别为382.9、253.6 mm,工作面支架平均支撑力下降了45.3%,有效控制了巷道变形。可为类似条件下沿空留巷围岩控制提供参考。 展开更多
关键词 深部矿井 沿空留巷 顶板预裂 应力转移 协同承载 影响特征
在线阅读 下载PDF
基于多Agent深度强化学习的无人机协作规划方法 被引量:3
19
作者 王娜 马利民 +1 位作者 姜云春 宗成国 《计算机应用与软件》 北大核心 2024年第9期83-89,96,共8页
人机协作控制是多无人机任务规划的重要方式。考虑多无人机任务环境协同解释和策略控制一致性需求,提出基于多Agent深度强化学习的无人机协作规划方法。依据任务知识和行为状态,构建基于任务分配Agent的任务规划器,生成人机交互的相互... 人机协作控制是多无人机任务规划的重要方式。考虑多无人机任务环境协同解释和策略控制一致性需求,提出基于多Agent深度强化学习的无人机协作规划方法。依据任务知识和行为状态,构建基于任务分配Agent的任务规划器,生成人机交互的相互依赖关系;设计一种深度学习强化方法,解决群体行为最优策略和协同控制方法,并利用混合主动行为选择机制评估学习策略。实验结果表明:作为人机交互实例,所提方法通过深度强化学习使群体全局联合动作表现较好,学习速度和稳定性均能优于确定性策略梯度方法。同时,在跟随、自主和混合主动3种模式比较下,可以较好地控制无人机飞行路径和任务,为无人机集群任务执行提供了智能决策依据。 展开更多
关键词 多Agent规划 深度强化学习 无人机协同规划 混合主动行为
在线阅读 下载PDF
基于协同育人的专业学位研究生产教深度融合培养模式探索实践 被引量:2
20
作者 王愈 安琪 +2 位作者 张立新 刘亚平 李志刚 《农产品加工》 2024年第24期133-136,共4页
随着社会对应用型、复合型和创新型人才的需求日益加大,专业学位研究生培养模式需要进一步改革创新,与国家区域经济发展紧密对接,不断探索前行和发展完善,为创新型国家建设服务。以山西农业大学食品科学与工程学院食品加工与安全专业学... 随着社会对应用型、复合型和创新型人才的需求日益加大,专业学位研究生培养模式需要进一步改革创新,与国家区域经济发展紧密对接,不断探索前行和发展完善,为创新型国家建设服务。以山西农业大学食品科学与工程学院食品加工与安全专业学位硕士点为例,从教学改革、双导师制优化、校企合作、平台建立、科技小院建设5个方面进行产教深度融合探索实践,构建产教深度融合培养模式,实现校企协同育人,为食品学院专业学位研究生的培养提供支持,为农业院校专业学位研究生产教融合提供示范。 展开更多
关键词 协同育人 专业学位研究生 培养模式 产教深度融合
在线阅读 下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部