期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
深度强化学习中策略表征研究简述
1
作者 陈真 吴卓屹 张霖 《系统仿真学报》 北大核心 2025年第7期1753-1769,共17页
深度强化学习(deep reinforcement learning,DRL)在多个领域取得了显著成功,但DRL的策略网络在泛化性、多任务适应性和样本效率等方面仍面临巨大挑战。策略表征作为提升DRL能力的重要研究方向,通过构建更高效、更泛化的策略表达形式,提... 深度强化学习(deep reinforcement learning,DRL)在多个领域取得了显著成功,但DRL的策略网络在泛化性、多任务适应性和样本效率等方面仍面临巨大挑战。策略表征作为提升DRL能力的重要研究方向,通过构建更高效、更泛化的策略表达形式,提升智能体对环境变化及新任务的适应能力。概述了策略表征领域的关键研究进展,介绍了从传统的基于多层感知机(multi-layer perceptron,MLP)策略到基于指针网络、序列生成模型、扩散模型、超网络、模块化设计以及专家混合模型以及基于序列化Token的跨模态策略等多样化策略架构,还从策略输入和中间表达的语义如何编码和优化等策略表征方法层面归纳分析前沿研究。总结并对未来可能的发展趋势进行了展望。 展开更多
关键词 策略表征 深度强化学习 泛化能力 多任务学习
在线阅读 下载PDF
绿色与数智化运营下机场地勤车辆调度优化
2
作者 田琼 陈晓静 郭蕊 《工程管理科技前沿》 北大核心 2025年第2期25-32,共8页
机场电动无人驾驶车辆应用有助于减少碳排放,促进机场数智化建设。本文研究了与航班准点率及旅客行程体验密切相关的采用无人驾驶的摆渡车及行李车的机场电动地勤车辆调度问题。在满足航班服务时间窗,并允许车辆在航班服务过程中进行全... 机场电动无人驾驶车辆应用有助于减少碳排放,促进机场数智化建设。本文研究了与航班准点率及旅客行程体验密切相关的采用无人驾驶的摆渡车及行李车的机场电动地勤车辆调度问题。在满足航班服务时间窗,并允许车辆在航班服务过程中进行全额或部分充电的条件下,建立了以最小化机场车辆运营成本及航班服务时间为目标的混合整数线性规划模型,结合航班服务等待时间最小化机制,设计了以Gurobi航班服务时序轮转法为基础的TR_SWT贪心算法。在数值实验中,采用北京首都国际机场的实际运营数据,通过灵敏度分析,指出了合理地控制行李车速度,有利于兼顾安全及运营收益,并基于小规模算例及实际算例测试了模型的合理性及方法的有效性,证明了所提出的方法在减少航班延迟服务方面具有优越性,可为机场地勤车辆调度的绿色与数智化运营提供理论借鉴。 展开更多
关键词 机场电动无人驾驶车辆 航班服务 车辆调度 混合整数线性规划模型 TR_SWT贪心算法
在线阅读 下载PDF
激光增材制造GH4169镍基高温合金力学性能各向异性及热处理调控研究进展
3
作者 赵哲南 杨仕超 +4 位作者 张乐 杨未柱 曾延 张斌 鲍蕊 《热加工工艺》 2025年第14期1-13,共13页
GH4169镍基高温合金拥有低裂纹敏感性和优异的高温力学性能,是激光增材制造航空航天高温部件的理想材料之一。然而,当前激光增材制造GH4169面临各向异性显著、高温服役环境的影响机制不明确、疲劳性能数据不充分等瓶颈问题,严重制约了... GH4169镍基高温合金拥有低裂纹敏感性和优异的高温力学性能,是激光增材制造航空航天高温部件的理想材料之一。然而,当前激光增材制造GH4169面临各向异性显著、高温服役环境的影响机制不明确、疲劳性能数据不充分等瓶颈问题,严重制约了其工程推广应用。热处理作为一种低成本、高效率的金属后处理工艺,能有效调控金属材料的细微观组织结构和力学性能,然而其对激光增材制造GH4169镍基高温合金的调控规律和机理较为复杂,仍需更深入的研究。系统梳理了激光增材制造GH4169镍基高温合金的各向异性力学性能,分析了材料独特的细微观结构和各向异性拉伸及疲劳性能,总结了热处理对材料细微观结构和力学性能的影响;并分析了当前研究面临的主要问题和挑战,展望了研究方向,以期为激光增材制造镍基高温合金在航空航天高温结构上的应用提供参考。 展开更多
关键词 激光增材制造 镍基高温合金 各向异性 疲劳性能 热处理
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部