检索结果-维普期刊中文期刊服务平台

基于在线强化学习算法的救护车智能调控模型: 1; 作者张雷张雪超 +1 位作者王超薄祥雷《系统仿真学报》北大核心 2025年第3期584-594,共11页; 在利用救护车开展伤员后送的应急场景中,需要充分协调救护车的救援能力和场景中伤员的实时状态才能取得最佳的救援效果。此类问题一般是非确定性多项式问题,采用传统的确定性调度算法效果较差,针对此场景建立了一套在线强化学习DQN算法... 展开更多; 关键词应急场景救护车后送在线强化学习数据增强行动调控优化; 在线阅读下载PDF 职称材料

基于在线强化学习的风电系统自适应负荷频率控制被引量：24: 2; 作者杨丽孙元章 +2 位作者徐箭廖思阳彭刘阳《电力系统自动化》 EI CSCD 北大核心 2020年第12期74-83,共10页; 大规模风电接入给系统带来新的不确定性,影响系统频率响应特性,从数据驱动的角度出发,提出了一种基于自适应动态模型的在线强化学习方法,用于系统的负荷频率控制。建立低秩自编码器特征提取网络,从所量测的低维数据中发现隐藏特征;基于... 展开更多; 关键词负荷频率控制低秩自编码器非线性动态系统稀疏辨识模型预测控制在线强化学习; 在线阅读下载PDF 职称材料

齿轮表面的在线强化研究被引量：2: 3; 作者蒋松程西云 +2 位作者余红华陈国需陈波水《润滑与密封》 EI CAS CSCD 北大核心 2000年第6期30-32,共3页; 根据现有的齿轮表面处理技术 ,提出了齿轮表面的在线强化新构思 ,进而得出齿轮在线强化设计的方法。按此方法 ,在CL - 10 0齿轮实验机上实现了齿轮表面的在线强化。; 关键词在线强化齿轮表面摩擦化学摩擦扩散; 在线阅读下载PDF 职称材料

齿轮传动副在线强化的实验研究被引量：1: 4; 作者曹兴进韦云隆谢江华《现代制造工程》 CSCD 北大核心 2003年第2期7-9,共3页; 齿轮试件的模数为 1.75 ,齿数分别为 3 2和 17,材料为 2 0CrMo ,分别选用平均粒径在 2 μm以下的超细无机硼酸盐添加剂配制的润滑油及普通矿物油ISOVG68润滑齿轮副 ,由自制的齿轮实验台上的实验结果表明 ,选用加有超细无机硼酸盐添加剂... 展开更多; 关键词齿轮传动副在线强化实验研究硼酸盐渗透改性层齿轮油; 在线阅读下载PDF 职称材料

摩擦表面在线强化的实验研究: 5; 作者李晓涛陈国需蒋松《润滑与密封》 CAS CSCD 北大核心 2003年第5期22-24,共3页; 本文用纯的硼酸三丙酯在四球机摩擦磨损试验机上进行了摩擦表面在线强化的实验。; 关键词摩擦表面在线强化硼酸三丙酯四球机摩擦磨损试验机实验研究渗透层摩擦化学; 在线阅读下载PDF 职称材料

DPC-DQRL:动态行为克隆约束的离线-在线双Q值强化学习: 6; 作者闫雷鸣刘健朱永昕《计算机应用研究》北大核心 2025年第4期1003-1010,共8页; 离线-在线强化学习旨在使用少量在线微调来提高预训练模型的性能。现有方法主要包括无约束微调与约束微调。前者往往由于分布偏移过大而导致严重的策略崩溃;后者由于保留离线约束导致性能提升缓慢,影响训练效率。为了改善上述问题,可视... 展开更多; 关键词深度强化学习离线-在线强化学习动态策略约束 Q值估计; 在线阅读下载PDF 职称材料

界面摩擦渗透的数学模型: 7; 作者李晓涛陈国需郭小川《石油学报（石油加工）》 EI CAS CSCD 北大核心 2009年第B09期32-38,共7页; 以100%的硼酸三丙酯作为强化剂,通过分析强化剂功能元素的扩散和渗透的条件、过程和机理,建立了扩散渗透的数学模型,并对数学模型进行了分析,从而得到有利于摩擦渗透的各种条件、摩擦副强化剂的选择、强化剂浓度的确定以及进行强化的工... 展开更多; 关键词表面膜摩擦渗透摩擦化学反应数学模型在线强化; 在线阅读下载PDF 职称材料

多伺服电机智能化协调容错轨迹跟踪控制系统设计被引量：5: 8; 作者朱俊威顾曹源 +2 位作者王鼎张文安王鑫《控制理论与应用》 EI CAS CSCD 北大核心 2021年第7期1023-1032,共10页; 针对一类具有执行器、传感器故障的多伺服电机控制系统,设计了相应的多伺服电机智能化协调容错轨迹跟踪控制系统.首先,提出了一种新结构的分布式中间估计器,修改了其设计结构,提高了估计方案的可行性.其次,通过在线强化学习估计策略,可... 展开更多; 关键词多伺服电机协调容错轨迹跟踪控制智能化在线强化学习估计策略人机交互; 在线阅读下载PDF 职称材料

水面无人艇自适应危险规避决策过程收敛性分析被引量：7: 9; 作者张汝波唐平鹏 +2 位作者杨歌李雪耀史长亭《计算机研究与发展》 EI CSCD 北大核心 2014年第12期2644-2652,共9页; 水面无人艇(unmanned surface vehicle,USV)是一种重要的海洋自主机器人,当前正被广泛研究并逐渐应用于实际.然而USV的安全航行问题仍严重制约其自主性能的提高,尤其是在复杂海况下的危险规避问题亟待解决.以Sarsa在线策略强化学习算法... 展开更多; 关键词水面无人艇复杂海况 Sarsa在线策略强化学习自适应危险规避决策过程渐进贪心策略; 在线阅读下载PDF 职称材料

题名基于在线强化学习算法的救护车智能调控模型: 1; 作者张雷张雪超王超薄祥雷; 机构国防大学联合作战学院国防大学联合勤务学院军事交通学院汽车士官学校; 出处《系统仿真学报》北大核心 2025年第3期584-594,共11页; 基金全军军事类研究生资助课题(JY2022B011)。; 文摘在利用救护车开展伤员后送的应急场景中,需要充分协调救护车的救援能力和场景中伤员的实时状态才能取得最佳的救援效果。此类问题一般是非确定性多项式问题,采用传统的确定性调度算法效果较差,针对此场景建立了一套在线强化学习DQN算法框架,并训练了对应的智能体用于实时在线调度。为解决应急场景可重复性差,学习样本积累速度低导致智能体训练缓慢的问题,在传统DQN算法的基础上提出了结合数据增强方法的DA-DQN方法。结果表明:几种经典的DQN方法都可以在线训练获得一个智能体,取得比确定性算法更优的调度效果。经典“先到先得”算法调度取得的救治失败率大约为45.4%,而DQN智能体收敛后的救治失败率大约为25%,且DA-DQN方法的智能体训练速度远快于传统DQN类方法,展现了此方法用于实际应急救援场景的潜力。; 关键词应急场景救护车后送在线强化学习数据增强行动调控优化; Keywords emergency scenario ambulance evacuation online reinforcement learning data augmentation action control optimization; 分类号 TP391.9 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名基于在线强化学习的风电系统自适应负荷频率控制被引量：24: 2; 作者杨丽孙元章徐箭廖思阳彭刘阳; 机构武汉大学电气与自动化学院; 出处《电力系统自动化》 EI CSCD 北大核心 2020年第12期74-83,共10页; 基金国家重点研发计划资助项目(2018AAA0101501)。; 文摘大规模风电接入给系统带来新的不确定性,影响系统频率响应特性,从数据驱动的角度出发,提出了一种基于自适应动态模型的在线强化学习方法,用于系统的负荷频率控制。建立低秩自编码器特征提取网络,从所量测的低维数据中发现隐藏特征;基于特征网络,建立非线性动态系统稀疏辨识学习模型,感知系统动态模型的潜在物理状态,提升模型在线学习效率;通过结合模型预测控制,进行实时决策控制。所提出方法能够有效解决传统模型预测控制对系统全局模型准确性的依赖问题,加强控制器对系统动态模型的自适应性,且能有效跟踪风电输出功率的随机波动。最后,以接入四型风机的负荷频率控制模型为例,验证所提方法的有效性。; 关键词负荷频率控制低秩自编码器非线性动态系统稀疏辨识模型预测控制在线强化学习; Keywords load frequency control low rank autoencoder sparse identification of nonlinear dynamic system model predictive control online reinforcement learning; 分类号 TM614 [电气工程—电力系统及自动化] TM761 [电气工程—电力系统及自动化]; 在线阅读下载PDF 职称材料

题名齿轮表面的在线强化研究被引量：2: 3; 作者蒋松程西云余红华陈国需陈波水; 机构重庆大学机械传动国家重点实验室后勤工程学院油品应用化学系; 出处《润滑与密封》 EI CAS CSCD 北大核心 2000年第6期30-32,共3页; 基金国家自然科学基金! (5 9875 0 83) 重庆大学机械传动国家重点实验室开放基金; 文摘根据现有的齿轮表面处理技术 ,提出了齿轮表面的在线强化新构思 ,进而得出齿轮在线强化设计的方法。按此方法 ,在CL - 10 0齿轮实验机上实现了齿轮表面的在线强化。; 关键词在线强化齿轮表面摩擦化学摩擦扩散; Keywords On line Strengthening Gear Surface Tribochemistry Tribodiffusion; 分类号 TH132.41 [机械工程—机械制造及自动化] TG162.73 [金属学及工艺—热处理]; 在线阅读下载PDF 职称材料

题名齿轮传动副在线强化的实验研究被引量：1: 4; 作者曹兴进韦云隆谢江华; 机构重庆大学重庆工学院重庆宗申摩托车集团; 出处《现代制造工程》 CSCD 北大核心 2003年第2期7-9,共3页; 基金国家自然科学基金 (5990 50 2 4 ) 宗申公司项目资助; 文摘齿轮试件的模数为 1.75 ,齿数分别为 3 2和 17,材料为 2 0CrMo ,分别选用平均粒径在 2 μm以下的超细无机硼酸盐添加剂配制的润滑油及普通矿物油ISOVG68润滑齿轮副 ,由自制的齿轮实验台上的实验结果表明 ,选用加有超细无机硼酸盐添加剂的润滑油时 ,齿轮副抗剥落能力大大提高。; 关键词齿轮传动副在线强化实验研究硼酸盐渗透改性层齿轮油; Keywords Borate Diffuse Changing lay; 分类号 TH132.41 [机械工程—机械制造及自动化] TH117 [机械工程—机械设计及理论]; 在线阅读下载PDF 职称材料

题名摩擦表面在线强化的实验研究: 5; 作者李晓涛陈国需蒋松; 机构空军油料研究所一室解放军后勤工程学院军事油料应用工程系; 出处《润滑与密封》 CAS CSCD 北大核心 2003年第5期22-24,共3页; 基金国家自然科学基金 (5 9875 0 83)资助; 文摘本文用纯的硼酸三丙酯在四球机摩擦磨损试验机上进行了摩擦表面在线强化的实验。; 关键词摩擦表面在线强化硼酸三丙酯四球机摩擦磨损试验机实验研究渗透层摩擦化学; Keywords On line Strengthening Infiltration Film; 分类号 TH117.1 [机械工程—机械设计及理论]; 在线阅读下载PDF 职称材料

题名DPC-DQRL:动态行为克隆约束的离线-在线双Q值强化学习: 6; 作者闫雷鸣刘健朱永昕; 机构南京信息工程大学计算机学院、网络空间安全学院南京信息工程大学数字取证教育部工程研究中心; 出处《计算机应用研究》北大核心 2025年第4期1003-1010,共8页; 基金国家自然科学基金资助项目(62172292,42375147)。; 文摘离线-在线强化学习旨在使用少量在线微调来提高预训练模型的性能。现有方法主要包括无约束微调与约束微调。前者往往由于分布偏移过大而导致严重的策略崩溃;后者由于保留离线约束导致性能提升缓慢,影响训练效率。为了改善上述问题,可视化对比分析两类方法的微调过程,发现不准确的Q值估计是影响性能的主要原因,并提出了一种动态策略约束的双Q值强化学习算法(DPC-DQRL)。首先,该算法设计了遵循记忆遗忘规律的动态行为克隆约束,在微调过程中动态调整约束强度;其次,构建离线-在线双Q值网络,引入离线动作价值网络参与Q值估计,提高微调过程中Q值的准确性。在Gym仿真平台使用MuJoCo物理引擎进行了Halfcheetah、Hopper、Walker2D三个经典仿真任务,使用DPC-DQRL算法微调后性能比原预训练模型分别提升47%、63%、20%,所有任务的平均归一化得分比最优基线算法提升10%。实验结果表明,DPC-DQRL在提升模型性能的同时保证了模型的稳定,与其他算法相比具有一定的优越性。; 关键词深度强化学习离线-在线强化学习动态策略约束 Q值估计; Keywords deep reinforcement learning offline to online reinforcement learning dynamic policy constraints Q-value estimation; 分类号 TP301.6 [自动化与计算机技术—计算机系统结构]; 在线阅读下载PDF 职称材料

题名界面摩擦渗透的数学模型: 7; 作者李晓涛陈国需郭小川; 机构中国人民解放军空军油料研究所中国人民解放军后勤工程学院军事油料应用与管理工程系; 出处《石油学报（石油加工）》 EI CAS CSCD 北大核心 2009年第B09期32-38,共7页; 基金国家自然科学基金项目(59875083)资助; 文摘以100%的硼酸三丙酯作为强化剂,通过分析强化剂功能元素的扩散和渗透的条件、过程和机理,建立了扩散渗透的数学模型,并对数学模型进行了分析,从而得到有利于摩擦渗透的各种条件、摩擦副强化剂的选择、强化剂浓度的确定以及进行强化的工况,为以后的理论和实验研究建立起桥梁,使摩擦副有可能实现在线强化,并在此基础上完善在线强化理论。; 关键词表面膜摩擦渗透摩擦化学反应数学模型在线强化; Keywords surface film tribo-infiltration tribochemical reaction mathematics model online strengthen; 分类号 TG115.5 [金属学及工艺—物理冶金]; 在线阅读下载PDF 职称材料

题名多伺服电机智能化协调容错轨迹跟踪控制系统设计被引量：5: 8; 作者朱俊威顾曹源王鼎张文安王鑫; 机构浙江工业大学信息工程学院浙江省嵌入式系统联合重点实验室北京工业大学信息学部黑龙江大学数学科学学院; 出处《控制理论与应用》 EI CAS CSCD 北大核心 2021年第7期1023-1032,共10页; 基金国家自然科学基金项目(61803334,61822311,61703148) 浙江省自然科学基金项目(LQ18F030012) +3 种基金 NFSC-浙江两化融合联合基金项目(U1709213)资助。; 文摘针对一类具有执行器、传感器故障的多伺服电机控制系统,设计了相应的多伺服电机智能化协调容错轨迹跟踪控制系统.首先,提出了一种新结构的分布式中间估计器,修改了其设计结构,提高了估计方案的可行性.其次,通过在线强化学习估计策略,可以显著提高估计性能,其核心是自适应切换机制与源故障模式定位功能块的集成,并根据估计值设计了协调容错轨迹跟踪控制器.同时,设计了可视化人机交互操作界面,可将伺服电机的实时位置、速度、相应的位置、速度估计值及控制性能等信息反馈至监控中心.操作人员可随时调节伺服输入,完成任务调整,可有效提升系统实用性.多伺服电机控制系统的实验结果验证了所提方法的有效性及优越性.; 关键词多伺服电机协调容错轨迹跟踪控制智能化在线强化学习估计策略人机交互; Keywords multi-servo motors cooperative fault-tolerant trajectory tracking control intelligence online reinforcement learning estimation strategy man-machine interaction; 分类号 TM383.4 [电气工程—电机] TP273 [自动化与计算机技术—检测技术与自动化装置]; 在线阅读下载PDF 职称材料

题名水面无人艇自适应危险规避决策过程收敛性分析被引量：7: 9; 作者张汝波唐平鹏杨歌李雪耀史长亭; 机构哈尔滨工程大学计算机科学与技术学院大连民族学院机电信息学院武汉第二船舶设计研究所; 出处《计算机研究与发展》 EI CSCD 北大核心 2014年第12期2644-2652,共9页; 基金国家自然科学基金项目(60975071 61100005 60975019); 文摘水面无人艇(unmanned surface vehicle,USV)是一种重要的海洋自主机器人,当前正被广泛研究并逐渐应用于实际.然而USV的安全航行问题仍严重制约其自主性能的提高,尤其是在复杂海况下的危险规避问题亟待解决.以Sarsa在线策略强化学习算法为基础,提出了USV在复杂海况下的自适应危险规避决策模型,并以渐进贪心策略作为行为探索策略,证明了USV自适应危险规避决策过程能够以概率1收敛到最优行为策略.论证结果表明,采用在线策略强化学习算法提升USV在复杂海况下的危险规避性能是可行的.; 关键词水面无人艇复杂海况 Sarsa在线策略强化学习自适应危险规避决策过程渐进贪心策略; Keywords unmanned surface vehicle （USV） complicated sea-state~ Sarsa on-policy reinforcement learning adaptive obstacle avoidance decision process greedy in the limit and infinite exploration （GLIE）; 分类号 TP181 [自动化与计算机技术—控制理论与控制工程]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	基于在线强化学习算法的救护车智能调控模型	张雷张雪超王超薄祥雷	《系统仿真学报》北大核心	2025	0	在线阅读下载PDF 职称材料
2	基于在线强化学习的风电系统自适应负荷频率控制	杨丽孙元章徐箭廖思阳彭刘阳	《电力系统自动化》 EI CSCD 北大核心	2020	24	在线阅读下载PDF 职称材料
3	齿轮表面的在线强化研究	蒋松程西云余红华陈国需陈波水	《润滑与密封》 EI CAS CSCD 北大核心	2000	2	在线阅读下载PDF 职称材料
4	齿轮传动副在线强化的实验研究	曹兴进韦云隆谢江华	《现代制造工程》 CSCD 北大核心	2003	1	在线阅读下载PDF 职称材料
5	摩擦表面在线强化的实验研究	李晓涛陈国需蒋松	《润滑与密封》 CAS CSCD 北大核心	2003	0	在线阅读下载PDF 职称材料
6	DPC-DQRL:动态行为克隆约束的离线-在线双Q值强化学习	闫雷鸣刘健朱永昕	《计算机应用研究》北大核心	2025	0	在线阅读下载PDF 职称材料
7	界面摩擦渗透的数学模型	李晓涛陈国需郭小川	《石油学报（石油加工）》 EI CAS CSCD 北大核心	2009	0	在线阅读下载PDF 职称材料
8	多伺服电机智能化协调容错轨迹跟踪控制系统设计	朱俊威顾曹源王鼎张文安王鑫	《控制理论与应用》 EI CAS CSCD 北大核心	2021	5	在线阅读下载PDF 职称材料
9	水面无人艇自适应危险规避决策过程收敛性分析	张汝波唐平鹏杨歌李雪耀史长亭	《计算机研究与发展》 EI CSCD 北大核心	2014	7	在线阅读下载PDF 职称材料