期刊文献+
共找到2,767篇文章
< 1 2 139 >
每页显示 20 50 100
融合流体扰动与近端策略优化算法的路径规划研究
1
作者 谷志新 贾珂怡 徐凯宏 《火力与指挥控制》 北大核心 2026年第3期66-73,共8页
路径规划算法是机器人技术以及自动化系统等领域的核心问题之一。针对三维动态空间中易出现移动目标、动态威胁等,构建智能体路径规划的仿真环境及相关模型,确定仿真流程。运用近端策略优化对改进的流体扰动算法的初始路径进行修正,实... 路径规划算法是机器人技术以及自动化系统等领域的核心问题之一。针对三维动态空间中易出现移动目标、动态威胁等,构建智能体路径规划的仿真环境及相关模型,确定仿真流程。运用近端策略优化对改进的流体扰动算法的初始路径进行修正,实现最优决策。并进行仿真验证,结果表明在三维动态空间中,该算法在路径规划的收敛效率、路径平滑度和避障成功率等方面均优于对比算法。对于三维动态空间中易发生出现可移动障碍物等情况,此算法优化改进的流体扰动算法,具有较好的鲁棒性和良好的适应性。 展开更多
关键词 流体扰动算法 近端策略优化算法 路径规划 三维动态空间
在线阅读 下载PDF
基于双策略优化VMD-HO-LSTM的锂电池剩余寿命预测 被引量:1
2
作者 杨朋朋 曾圣浩 +1 位作者 薛海 白永亮 《重庆交通大学学报(自然科学版)》 北大核心 2026年第1期120-128,共9页
针对锂电池健康状态(SOH)预测精度不足的问题,提出一种基于变分模态分解与河马算法,优化长短期记忆神经网络(VMD-HO-LSTM)的模型预测锂电池剩余寿命。首先,为消除锂电池的虚假容量信号,采用变分模态分解(VMD)方法对锂电池容量进行分解,... 针对锂电池健康状态(SOH)预测精度不足的问题,提出一种基于变分模态分解与河马算法,优化长短期记忆神经网络(VMD-HO-LSTM)的模型预测锂电池剩余寿命。首先,为消除锂电池的虚假容量信号,采用变分模态分解(VMD)方法对锂电池容量进行分解,得到本征模态分量(IMF)并进行重构;其次,将Logistic映射和自适应学习率融入河马算法(HO),避免迭代过程陷入局部最优,并采用改进河马算法优化长短时记忆(LSTM)网络参数,建立改进的HO-LSTM模型;最后,基于改进的HO-LSTM模型开展锂电池SOH预测,提升预测准确度。基于锂电池容量数据验证,结果表明:相较于单一LSTM预测模型,基于双策略优化的VMD-HO-LSTM模型预测精度提升了49.6%~81.9%;相较于VMD-LSTM模型,电池预测精度提升23.4%~59.0%,该模型预测精度在0.976~0.998,建立的模型和分析方法对锂电池SOH具有较好的预测效果。 展开更多
关键词 车辆与机电工程 锂电池 剩余寿命 策略优化 长短期记忆神经网络
在线阅读 下载PDF
基于噬菌体的烟草青枯病防治策略优化与评价
3
作者 易克 葛龙 +6 位作者 蔡海林 陈武 门思润 李晔 于凌云 黄彬彬 刘清术 《植物保护》 北大核心 2026年第1期155-165,共11页
为科学、高效利用噬菌体防治烟草青枯病,本研究通过单因素试验法对盆栽烟草青枯病菌的接种浓度,噬菌体的施用策略(时期、浓度、频次)进行探索和优化,构建基于噬菌体的盆栽和田间烟草青枯病防治的施用策略,并对3株噬菌体进行盆栽和田间... 为科学、高效利用噬菌体防治烟草青枯病,本研究通过单因素试验法对盆栽烟草青枯病菌的接种浓度,噬菌体的施用策略(时期、浓度、频次)进行探索和优化,构建基于噬菌体的盆栽和田间烟草青枯病防治的施用策略,并对3株噬菌体进行盆栽和田间防效评价。盆栽烟草青枯病菌Ralstonia solanacearum NX1的发病模型表明,以10%水土比无创式灌根的最佳青枯菌接种剂量为土壤中终浓度10^(6) cfu/g,此条件下烟草发病快、周期长,病情发展平稳。噬菌体防控盆栽烟草青枯病的施用策略为:在青枯病菌接种当天(接种后6 h)和接种后第3天,以10%水土比无创式灌根方式各施1次,确保每次施用土壤中终浓度达10^(6)pfu/g,基于此,3株噬菌体的盆栽防效显著优于生物农药3%中生菌素粉剂,且持效期≥40 d,其中复配组在接种青枯菌后40 d的防效显著高于单剂。田间防控试验表明:以10%水土比无创式灌根方式,分别在烟草旺长期和打顶期施用噬菌体制剂各1次,使土壤噬菌体终浓度达10^(6) pfu/g的策略防效良好,3株噬菌体的田间防效达50.53%~58.54%,显著优于3%中生菌素粉剂3.75 mg/L的防效(32.54%),其中3株噬菌体复配施用防效达74.63%,显著优于单剂。综上,本研究建立的噬菌体防控烟草青枯病的施用策略良好,3株噬菌体及其施用策略在盆栽及宁乡烟区青枯病防效评价中防效显著优于中生菌素,本结果将为宁乡地区烟草青枯病害防控及噬菌体资源评价、规模化应用等提供重要参考。 展开更多
关键词 噬菌体 青枯病 烟草 防治策略优化 防效评价
在线阅读 下载PDF
流奖赏引导的基于模型学习的策略优化方法
4
作者 王义 钟珊 龚声蓉 《计算机工程与设计》 北大核心 2026年第2期528-535,共8页
针对基于模型的强化学习中模型误差累积与探索效率低下的问题,提出耦合标准化流的动态奖励优化方法。通过构建双流网络区分真实环境与模型生成分布,利用分布差异动态重构奖励函数:训练阶段最小化差异提升预测精度,策略在线交互阶段根据... 针对基于模型的强化学习中模型误差累积与探索效率低下的问题,提出耦合标准化流的动态奖励优化方法。通过构建双流网络区分真实环境与模型生成分布,利用分布差异动态重构奖励函数:训练阶段最小化差异提升预测精度,策略在线交互阶段根据差异强度自适应调节探索范围。该方法突破传统静态奖励机制限制,在连续控制任务中有效抑制多步预测误差传播,显著提升样本效率与累积回报,同时增强策略收敛稳定性,为开放环境中的智能体学习提供新范式。 展开更多
关键词 强化学习 模型学习 策略优化 标准化流 样本效率 奖赏函数 探索与利用
在线阅读 下载PDF
基于改进近端策略优化算法的无人车打击策略规划方法
5
作者 王秉坤 王越 +3 位作者 杨妹 张鹏年 樊浡昊 唐杰 《系统仿真学报》 北大核心 2026年第2期372-386,共15页
针对无人战车预设打击规则无法最大化打击命中率,以及连续运动规划与离散打击决策难以耦合优化问题,提出一种基于混合动作空间和GRU的改进PPO算法。建立无人车打击任务过程中的环境模型、目标模型,以及融合运动学约束、态势感知和动态... 针对无人战车预设打击规则无法最大化打击命中率,以及连续运动规划与离散打击决策难以耦合优化问题,提出一种基于混合动作空间和GRU的改进PPO算法。建立无人车打击任务过程中的环境模型、目标模型,以及融合运动学约束、态势感知和动态决策的三级架构无人车模型;使用2个不同的策略网络用于路径规划的连续运动规划网络,求解打击位置及目标序列选择过程中打击决策问题的离散打击决策网络;引入GRU处理无人车决策过程因状态部分可观测需要依赖历史观察推断当前状态的问题。仿真结果表明:该方法能耦合优化无人车路径规划与打击决策问题,提升了无人车自主执行打击任务的能力。 展开更多
关键词 深度强化学习 无人车 路径规划 打击决策 近端策略优化
在线阅读 下载PDF
基于自适应策略优化的鲁棒泛化权衡学习
6
作者 翟浩杰 王冉 +1 位作者 邬文慧 贾育衡 《软件学报》 北大核心 2026年第4期1472-1491,共20页
对抗训练被视为提升深度模型鲁棒性的核心防御手段,但其固有缺陷严重制约了实际应用效果.传统对抗训练方法依赖固定攻击模式生成对抗样本,导致训练过程中样本多样性不足、模型泛化能力受限,且在鲁棒性与干净准确率间难以达成有效平衡.... 对抗训练被视为提升深度模型鲁棒性的核心防御手段,但其固有缺陷严重制约了实际应用效果.传统对抗训练方法依赖固定攻击模式生成对抗样本,导致训练过程中样本多样性不足、模型泛化能力受限,且在鲁棒性与干净准确率间难以达成有效平衡.更为关键的是,现有对抗训练框架缺乏对训练过程的自适应控制,容易引发鲁棒过拟合现象.针对上述挑战,利用演化优化提出一个自适应对抗训练框架,称为基于自适应策略优化的鲁棒泛化权衡学习,简称TRG-ASO.该方法将遗传算法引入对抗训练过程,通过动态调整不同训练阶段的对抗攻击策略,实现对抗样本生成模式的渐进式复杂化.这种层级递进的对抗机制不仅增强了样本多样性,还可通过策略优化记录实现训练早停,有效抑制过拟合风险.在CIFAR系列数据集上的实验表明,相较于传统对抗训练方法,所提框架在维持基础分类性能的同时,提升了模型面对多种攻击范式的防御能力,且加快了训练收敛速度.为对抗训练中鲁棒性-泛化性的权衡提供了新思路,对构建可信深度学习系统具有重要实践价值. 展开更多
关键词 鲁棒性 自适应策略优化 权衡学习 对抗训练 演化优化
在线阅读 下载PDF
人机混合驾驶协同合流的多智能体近端策略优化算法
7
作者 蒋贤才 曲悦 魏贺迪 《交通运输系统工程与信息》 北大核心 2026年第1期65-75,共11页
为平衡高速公路合流区网联自动驾驶车辆(CAV)与人工驾驶车辆(HDV)协同控制的安全与效率问题,本文以多智能体近端策略优化(Multi-Agent Proximal Policy Optimization,MAPPO)算法为基础,引入静态与动态双层动作掩码过滤规则,建立基于任... 为平衡高速公路合流区网联自动驾驶车辆(CAV)与人工驾驶车辆(HDV)协同控制的安全与效率问题,本文以多智能体近端策略优化(Multi-Agent Proximal Policy Optimization,MAPPO)算法为基础,引入静态与动态双层动作掩码过滤规则,建立基于任务紧迫性、空间临界性和时间风险性的优先级指数,并采用近端策略优化(Proximal Policy Optimization,PPO)裁剪与广义优势估计(Generalized Advantage Estimation,GAE)长程收益估计优化“策略-价值网络”协同机制,提出融合优先级安全监管与动作掩码的混合交通协同合流多智能体近端策略优化算法——Priority-SAAM MAPPO。仿真结果表明,Priority-SAAM MAPPO在基础及复杂异构场景中的学习收敛性好,策略与价值网络协同优化稳定;安全性能方面,基础异构场景碰撞风险率低于4%,较MAPPO下降了50%,复杂异构场景碰撞风险率约8%,优于MAPPO(12%)和QMIX(一种基于单调价值函数分解的深度多智能体强化学习算法,18%);效率表现上,平均奖励均高于基准算法,且合流区时空密度从无序波动转为规则分布,交通流有序性显著增强,验证了其在合流区混合交通流协同控制中的有效性和鲁棒性。进一步分析表明,Priority-SAAM MAPPO适用于高交通密度和HDV行为异构性强的混合交通流合流控制。 展开更多
关键词 智能交通 混合交通 多智能体近端策略优化 协同控制 合流区
在线阅读 下载PDF
基于近端策略优化的两栖无人平台路径规划算法研究 被引量:3
8
作者 左哲 覃卫 +2 位作者 徐梓洋 李寓安 陈泰然 《北京理工大学学报》 EI CAS 北大核心 2025年第1期19-25,共7页
为解决水陆两栖无人平台在复杂环境中的路径规划问题,针对传统方法难以应对动态障碍物和多变环境的局限性,提出了一种基于近端策略优化(PPO)的路径规划算法,包含四种感知信息输入方案以及速度强化奖励函数,适应动态和静态环境.该算法通... 为解决水陆两栖无人平台在复杂环境中的路径规划问题,针对传统方法难以应对动态障碍物和多变环境的局限性,提出了一种基于近端策略优化(PPO)的路径规划算法,包含四种感知信息输入方案以及速度强化奖励函数,适应动态和静态环境.该算法通过批次函数正则化、策略熵引入和自适应裁剪因子,显著提升了算法的收敛速度和稳定性.研究中采用了ROS仿真平台,结合Flatland物理引擎和PedSim插件,模拟了包含动态障碍物的多种复杂场景.实验结果表明,采用BEV+V状态空间输入结构和离散动作空间的两栖无人平台,在路径规划中展现出高成功率和低超时率,优于传统方法和其他方案.仿真和对比实验显示采用鸟瞰图与速度组合的状态空间数据结构配合速度强化奖励函数算法提高了性能,收敛速度提高25.58%,路径规划成功率提升25.54%,超时率下降13.73%. 展开更多
关键词 路径规划 两栖 无人平台 近端策略优化(PPO)
在线阅读 下载PDF
多智能体近端策略优化的动态武器目标分配 被引量:2
9
作者 宫华 王智昕 +1 位作者 许可 张勇 《兵器装备工程学报》 北大核心 2025年第7期93-104,共12页
针对地对空防御作战中武器与目标之间的动态关系,以及多类型武器协同作战的复杂性,研究了动态武器目标分配问题。考虑防护效能与成本之间的冲突关系,以最大化资产生存概率和最小化武器消耗成本为目标,结合武器制导能力、软杀伤武器充能... 针对地对空防御作战中武器与目标之间的动态关系,以及多类型武器协同作战的复杂性,研究了动态武器目标分配问题。考虑防护效能与成本之间的冲突关系,以最大化资产生存概率和最小化武器消耗成本为目标,结合武器制导能力、软杀伤武器充能特性、时间窗等关键约束,建立了多作战单元协同的动态武器目标分配优化模型。基于策略熵和随机噪声策略设计了改进的多智能体近端策略优化算法进行求解。实验仿真验证了所提出算法的有效性。 展开更多
关键词 地对空防御 动态武器目标分配 多智能体强化学习 近端策略优化 策略 随机噪声
在线阅读 下载PDF
地方国有资本划转社保基金:运行困境、治理探索及策略优化 被引量:2
10
作者 李培 丁少群 《经济与管理》 北大核心 2025年第6期1-10,共10页
地方国有资本划转社保基金后的运行与治理已成为社会各界关注的重要事项。当前,地方国有资本划转社保基金后运行存在着投资运作渠道狭窄不畅、承接主体参与治理不够、多向协同效应作用不足、划转国有资本退出通道和退出方式缺乏以及运... 地方国有资本划转社保基金后的运行与治理已成为社会各界关注的重要事项。当前,地方国有资本划转社保基金后运行存在着投资运作渠道狭窄不畅、承接主体参与治理不够、多向协同效应作用不足、划转国有资本退出通道和退出方式缺乏以及运行管理机制不够健全等问题,直接影响划转后的可持续运行并关系到充实社保基金的质效,亟须根据我国试点省份治理实践探索继续完善和优化治理策略。为此,应从优化承接主体持股运作管理方式、探索承接主体参与国企治理路径、构建承接主体多向多维协同机制、建立划转国资风险隔离与退出机制和加强划转国资运行监管机制建设等方面着手,破解运行治理难点,提升治理效能。 展开更多
关键词 地方国有资本 划转社保基金 运行困境 治理探索 策略优化
在线阅读 下载PDF
基于近端策略优化算法的电力系统多类型储能爬坡功率分配策略 被引量:3
11
作者 王杰 苗世洪 +3 位作者 王廷涛 姚福星 励刚 汤伟 《高电压技术》 北大核心 2025年第9期4796-4806,I0020-I0025,共17页
随着新能源发电比例不断提高,由此引发的短时大规模功率爬坡事件愈加频繁,因此研究多类型储能爬坡功率分配策略对防范极端爬坡风险、保障系统稳定运行具有重要意义。该文提出一种面向紧急爬坡需求的多类型储能功率优化分配策略,引入深... 随着新能源发电比例不断提高,由此引发的短时大规模功率爬坡事件愈加频繁,因此研究多类型储能爬坡功率分配策略对防范极端爬坡风险、保障系统稳定运行具有重要意义。该文提出一种面向紧急爬坡需求的多类型储能功率优化分配策略,引入深度强化学习(deep reinforcement learning,DRL)方法以兼顾功率分配的准确性与时效性。首先,以绝热压缩空气储能(adiabatic compressed air energy storage,A-CAES)、风电联合储能、火电联合飞轮储能为代表,分析多类型储能的爬坡互补特性,重点研究A-CAES的非线性热动-气动耦合特征及风储系统的风机转子动能瞬态响应行为,并据此构建多类型储能爬坡功率响应模型;其次,将功率优化分配问题转化为适合DRL的马尔可夫决策过程,并引入学习率动态衰减、策略熵以及状态归一化等训练机制,提出基于近端策略优化算法的电力系统多类型储能爬坡功率分配策略;最后,在多种爬坡场景下开展算例分析。结果表明,所提分配策略能够充分发挥各类储能的调控优势,提高爬坡功率分配的灵活性、精准性、时效性。 展开更多
关键词 近端策略优化算法 多类型储能 功率优化分配 爬坡场景 深度强化学习 绝热压缩空气储能
在线阅读 下载PDF
结构分解视角下生猪价格波动机制及调控策略优化研究 被引量:4
12
作者 郑瑞强 朱晨曦 《农林经济管理学报》 北大核心 2025年第3期400-409,共10页
运用Census X12季节调整法和H-P滤波法,对2010年1月—2024年12月我国生猪价格的成分结构进行解构,剖析周期变动、趋势变动、季节变动和不规则变动等四种成分,以探究生猪价格波动机制,并利用VAR模型分析各成分结构对生猪价格波动的影响... 运用Census X12季节调整法和H-P滤波法,对2010年1月—2024年12月我国生猪价格的成分结构进行解构,剖析周期变动、趋势变动、季节变动和不规则变动等四种成分,以探究生猪价格波动机制,并利用VAR模型分析各成分结构对生猪价格波动的影响。结果表明:我国生猪价格的季节性波动特征显著,年度内呈现“两头高、中间低”的变化态势,不规则性波动频繁且剧烈;生猪价格总体呈上升趋势,且波动周期缩短、波动幅度增大;生猪价格波动除受自身影响外,不规则变动成分的贡献率最大,趋势变动成分次之,周期变动成分和季节变动成分的贡献程度相对较小。据此,建议提出健全预警机制与风险防控体系、强化科技与金融协同支撑、优化消费结构与市场调节能力等策略,以提升生猪市场调控效率,促进生猪产业健康平稳发展。 展开更多
关键词 生猪价格 结构分解 波动机制 策略优化
在线阅读 下载PDF
云南省三七产业发展深度洞察与策略优化
13
作者 王奕 张锡顺 +2 位作者 杨妍 钱志龙 杜刚 《农业工程》 2025年第10期159-166,共8页
三七作为名贵中药材,其产业发展一直备受关注。全面系统地梳理云南省三七产业发展历程与变迁,深度剖析云南省三七产业发展现状,涵盖主栽品种、生产基地、产品加工、品牌建设和科技创新等诸多方面。研究结果表明,云南省三七产业发展历程... 三七作为名贵中药材,其产业发展一直备受关注。全面系统地梳理云南省三七产业发展历程与变迁,深度剖析云南省三七产业发展现状,涵盖主栽品种、生产基地、产品加工、品牌建设和科技创新等诸多方面。研究结果表明,云南省三七产业发展历程跌宕起伏,在不断调整优化中艰难前行。目前,三七产业发展主要面临土地资源竞争激烈、技术创新应用不足、质量控制体系不健全、产品开发与加工相对滞后及融合发展程度不深等问题和困境。鉴于此,针对性地提出优化产业区域布局、组织开展联合攻关、严格把控产品质量、大力强化产品加工和积极推进融合发展等策略,旨在推动云南省三七产业实现高质量发展,增强其在中药材市场中的地位和影响力,也为相关产业研究提供参考。 展开更多
关键词 文山三七 发展历程 产业现状 策略优化 中药材
在线阅读 下载PDF
基于近端策略优化的数据中心任务调度算法
14
作者 徐涛 常怡明 刘才华 《计算机工程与设计》 北大核心 2025年第3期712-718,共7页
针对调度算法无法动态适应数据中心状态动态变化和用户需求多样化的问题,提出一种基于近端策略优化的数据中心两阶段任务调度算法。通过设计优先级函数为任务提供优先级,采用近端策略优化方法适应数据中心状态动态变化和用户需求的多样... 针对调度算法无法动态适应数据中心状态动态变化和用户需求多样化的问题,提出一种基于近端策略优化的数据中心两阶段任务调度算法。通过设计优先级函数为任务提供优先级,采用近端策略优化方法适应数据中心状态动态变化和用户需求的多样化。在任务选择阶段通过计算任务的优先级,优先调度高优先级任务;在物理服务器选择阶段,智能体根据实时的数据中心状态和用户需求,灵活地调整任务调度决策,实现资源的高效分配。实验结果表明,该算法性能优于现有的启发式算法以及常用强化学习算法。 展开更多
关键词 调度算法 数据中心 任务调度 强化学习 近端策略优化 优先级 两阶段
在线阅读 下载PDF
基于近端策略优化的Leader-Follower无人机编队控制
15
作者 霍琳 高永霖 +1 位作者 赵锐 李泽铎 《兵器装备工程学报》 北大核心 2025年第S1期180-187,共8页
针对多无人机编队系统中如何实现高效率自主飞行、提高编队飞行控制精度的问题,提出了一种基于近端策略优化(PPO)与领导-跟随(leader-follower)策略结合的无人机编队飞行控制方法。通过定义状态空间、动作空间建立无人机的观测模型和控... 针对多无人机编队系统中如何实现高效率自主飞行、提高编队飞行控制精度的问题,提出了一种基于近端策略优化(PPO)与领导-跟随(leader-follower)策略结合的无人机编队飞行控制方法。通过定义状态空间、动作空间建立无人机的观测模型和控制模型;设计MLP-GRU-ACTLayer的策略网络架构,对观测数据进行特征提取及动作输出,并在训练过程中通过分布熵和动作评估方法对策略进行优化;设计奖惩机制引导无人机学习航向、高度和速度的控制策略,实现编队飞行的稳定性和适应性;同时将基于三变量(航向、高度、速度)的领导-跟随策略应用到编队飞行中,实现整体编队飞行控制。仿真结果表明,该方法能够高效实现无人机编队飞行控制,较传统方法将高度最大差值减少了7 m,速度最大差值减少了5 m/s。 展开更多
关键词 无人机编队 近端策略优化 领导-跟随策略 三变量 编队保持
在线阅读 下载PDF
近端策略优化的城市环境多智能体协作对抗方法 被引量:1
16
作者 米广铭 张辉 +1 位作者 张菁 卓力 《通信学报》 北大核心 2025年第3期94-108,共15页
城市环境由于其地理空间的复杂性及动态变化性,往往会令指挥系统变得低效且短视。针对该问题,提出了一种近端策略优化城市环境的多智能体协作对抗方法。首先,在建立完善的城市对抗环境的基础上,使用近端策略优化的演员-评论员网络算法... 城市环境由于其地理空间的复杂性及动态变化性,往往会令指挥系统变得低效且短视。针对该问题,提出了一种近端策略优化城市环境的多智能体协作对抗方法。首先,在建立完善的城市对抗环境的基础上,使用近端策略优化的演员-评论员网络算法进行求解;其次,针对多对一的评论网络采用嵌入方法来解决空间维度不同的异构智能体决策评价问题;再次,在近端策略优化的基础上,增加了自适应采样来辅助策略的更新;最后,对演员网络进行权重继承操作以帮助智能体迅速接管相应的任务。实验结果表明,相较于其他方法,所提方法的奖励回报提高了22.67%,收敛速度加快了8.14%,不仅可以满足城市环境下多个智能体协作对抗的决策,还能够兼容多异构智能体的协作对抗。 展开更多
关键词 深度强化学习 多智能体 协作对抗 近端策略优化 城市环境
在线阅读 下载PDF
基于改进近端策略优化算法的AGV路径规划与任务调度 被引量:5
17
作者 祁璇 周通 +2 位作者 王村松 彭孝天 彭浩 《计算机集成制造系统》 北大核心 2025年第3期955-964,共10页
自动引导车(AGV)是一种具有高度柔性和灵活性的自动化物料运输设备,可实现路径规划、任务调度和智能分配等功能。目前关于AGV最优路径与调度算法研究仍存在泛化性差、收敛效率低、寻路时间长等问题。因此,提出一种改进近端策略优化算法(... 自动引导车(AGV)是一种具有高度柔性和灵活性的自动化物料运输设备,可实现路径规划、任务调度和智能分配等功能。目前关于AGV最优路径与调度算法研究仍存在泛化性差、收敛效率低、寻路时间长等问题。因此,提出一种改进近端策略优化算法(PPO)。首先,采用多步长动作选择策略增加AGV移动步长,将AGV动作集由原来的4个方向基础上增加了8个方向,优化最优路径;其次,改进动态奖励值函数,根据AGV当前状态实时调整奖励值大小,提高其学习能力;然后,基于不同改进方法比较其奖励值曲线图,验证算法收敛效率与最优路径距离;最后,采用多任务调度优化算法,设计了一种单AGV多任务调度优化算法,提高运输效率。结果表明:改进后的算法最优路径缩短了28.6%,改进后的算法相比于PPO算法收敛效率提升了78.5%,在处理更为复杂、需要高水平策略的任务时表现更佳,具有更强的泛化能力;将改进后的算法与Q学习、深度Q学习(DQN)算法、软演员-评论家(SAC)算法进行比较,算法效率分别提升了84.4%、83.7%、77.9%;单AGV多任务调度优化后,平均路径缩短了47.6%。 展开更多
关键词 自动导引小车 路径规划 任务调度 近端策略优化算法 强化学习
在线阅读 下载PDF
基于近端策略优化算法的含电动汽车孤岛微电网智能频率控制策略 被引量:2
18
作者 卢昱宏 范培潇 +1 位作者 杨军 李蕊 《电力自动化设备》 北大核心 2025年第10期135-143,共9页
随着电动汽车数量的快速增长,其作为有限挂网储能设备参与电网调控的潜力备受关注,但用户行为的随机性与时空移动性给车网互动带来了挑战。为此,提出一种基于近端策略优化算法的含电动汽车孤岛微电网智能频率控制策略。构建包含广义聚... 随着电动汽车数量的快速增长,其作为有限挂网储能设备参与电网调控的潜力备受关注,但用户行为的随机性与时空移动性给车网互动带来了挑战。为此,提出一种基于近端策略优化算法的含电动汽车孤岛微电网智能频率控制策略。构建包含广义聚合电动汽车充电站的微电网负荷频率控制框架;基于闵可夫斯基求和方式,提出两阶段电动汽车充电站的可调控裕度计算方法;通过重要性采样比率剪切、多步经验回放、小批量优化等方式提升算法训练效率,并通过设计状态与动作空间、奖励函数以及选取合适超参数完成频率控制器的构建。仿真结果表明,所设计的控制器在训练时间和控制效果方面显著优于传统频率控制方法,为微电网的稳定运行提供了有力的技术支持。 展开更多
关键词 电动汽车 孤岛微电网 频率控制 近端策略优化算法 闵可夫斯基求和
在线阅读 下载PDF
课堂高阶问题的特征识别与设计策略优化--基于文本语料库循证的方法 被引量:3
19
作者 曲茜茜 刘晓楠 +1 位作者 解月光 武晓旋 《电化教育研究》 北大核心 2025年第5期94-102,共9页
思维的深度发展是创新型人才培养之路的应有之义。学源于思,思源于疑,开展高阶思维教学的课堂当以高阶问题为动力,以思维对话为载体。研究聚焦于课堂中的高阶问题,依循数据—证据—行动的循证实践与跃迁过程,基于一定的筛选标准与方法,... 思维的深度发展是创新型人才培养之路的应有之义。学源于思,思源于疑,开展高阶思维教学的课堂当以高阶问题为动力,以思维对话为载体。研究聚焦于课堂中的高阶问题,依循数据—证据—行动的循证实践与跃迁过程,基于一定的筛选标准与方法,历经样本筛选、问题提取、标注与存储等流程,从纵向追踪的5000余份教案文本中筛选出1055份教案文本及3042条高阶问题数据并建立文本语料库,采用质性分析方法通过开放性编码、主轴性编码、选择性编码等证据创制的实证分析过程,识别出包括目标、认知、内容与类型在内的高阶问题四维特征及其关系框架,并依据循证结果,提出高阶问题设计策略的优化方案,为提升教师高阶问题设计能力提供理论支持和实践指导。 展开更多
关键词 高阶问题 教案 文本语料库 循证 特征识别 策略优化
在线阅读 下载PDF
基于社交电商的农产品直播营销策略优化研究 被引量:1
20
作者 拉珍 《智慧农业导刊》 2025年第16期7-10,共4页
随着社交电商平台的快速发展,农产品直播营销迎来新的发展机遇与挑战。研究基于社交电商平台特性,采用实地调研、案例分析和数据统计等方法,系统分析农产品直播营销现状及存在的问题,研究发现,现阶段农产品直播营销存在直播内容与平台... 随着社交电商平台的快速发展,农产品直播营销迎来新的发展机遇与挑战。研究基于社交电商平台特性,采用实地调研、案例分析和数据统计等方法,系统分析农产品直播营销现状及存在的问题,研究发现,现阶段农产品直播营销存在直播内容与平台属性匹配度不足、社交互动机制设计欠缺、供应链协同性差等问题,针对这些问题提出基于社交属性的直播内容优化策略与社交平台互动转化机制创新方案和供应链协同体系构建措施。研究结果表明,优化后的营销策略在提升农产品直播营销效果促进农产品销售和带动农民增收方面具有显著成效。 展开更多
关键词 社交电商 农产品营销 直播带货 营销策略优化 供应链协同
在线阅读 下载PDF
上一页 1 2 139 下一页 到第
使用帮助 返回顶部