期刊文献+
共找到385篇文章
< 1 2 20 >
每页显示 20 50 100
Approximate Dynamic Programming for Self-Learning Control 被引量:14
1
作者 DerongLiu 《自动化学报》 EI CSCD 北大核心 2005年第1期13-18,共6页
This paper introduces a self-learning control approach based on approximate dynamic programming. Dynamic programming was introduced by Bellman in the 1950's for solving optimal control problems of nonlinear dynami... This paper introduces a self-learning control approach based on approximate dynamic programming. Dynamic programming was introduced by Bellman in the 1950's for solving optimal control problems of nonlinear dynamical systems. Due to its high computational complexity, the applications of dynamic programming have been limited to simple and small problems. The key step in finding approximate solutions to dynamic programming is to estimate the performance index in dynamic programming. The optimal control signal can then be determined by minimizing (or maximizing) the performance index. Artificial neural networks are very efficient tools in representing the performance index in dynamic programming. This paper assumes the use of neural networks for estimating the performance index in dynamic programming and for generating optimal control signals, thus to achieve optimal control through self-learning. 展开更多
关键词 近似动态程序 自学习控制 神经网络 人工智能
在线阅读 下载PDF
明朝国家翻译实践及当代启示:从“怀柔远人”到“会通超胜” 被引量:1
2
作者 郭国良 朱焜 《浙江工商大学学报》 北大核心 2025年第1期43-52,共10页
明朝是中国历史上对外交往繁盛的一个朝代。万邦来朝,傅安、陈诚出使西域,郑和七下西洋,西方传教士入华,皆为证明。相伴而来的是繁荣的翻译活动,从因“怀柔远人”政策而兴起的四夷馆翻译活动,到“会通超胜”思想引发的西学翻译活动,延... 明朝是中国历史上对外交往繁盛的一个朝代。万邦来朝,傅安、陈诚出使西域,郑和七下西洋,西方传教士入华,皆为证明。相伴而来的是繁荣的翻译活动,从因“怀柔远人”政策而兴起的四夷馆翻译活动,到“会通超胜”思想引发的西学翻译活动,延续了两百余年。从国家翻译实践视域来看,明朝翻译活动具有明显的国家翻译实践性质。明朝统治者采取翻译活动机构化、翻译过程合作化、译者培养制度化、翻译规范明晰化、儒家思想基础化五种举措,发挥翻译在民族融合、国际交往、富国强兵三个方面的治理功能。在当今中国与世界深度融通的背景下,国家翻译实践的规模逐渐扩大。明朝翻译活动可为当前我国国家翻译实践在项目规划、人才培养、规范制定等方面提供借鉴。 展开更多
关键词 国家翻译实践 四夷馆 西学翻译 明朝
在线阅读 下载PDF
基于强化学习的非线性输入受限系统最优控制
3
作者 高晓格 韩淑云 《计算机应用与软件》 北大核心 2025年第2期287-291,298,共6页
针对一类输入受限的非线性系统最优跟踪控制问题,提出一种基于强化学习的自适应动态规划的控制策略。通过设计一种合适的性能指标函数解决控制系统输入受限问题;通过设计评价神经网络来估计系统的最优性能指标函数,从而求解控制系统HJB(... 针对一类输入受限的非线性系统最优跟踪控制问题,提出一种基于强化学习的自适应动态规划的控制策略。通过设计一种合适的性能指标函数解决控制系统输入受限问题;通过设计评价神经网络来估计系统的最优性能指标函数,从而求解控制系统HJB(Hamilton-Jacobi-Bellman)方程,获得最优控制输入;利用Lyapunov方法获得评价网络的权重更新率,并证明系统的跟踪误差和评价网络的权重估计误差为最终一致有界(UUB);通过数值仿真实验验证该控制策略的有效性。 展开更多
关键词 非线性系统 输入受限 强化学习 自适应动态规划
在线阅读 下载PDF
面向深度学习编译器TVM的算子融合优化
4
作者 高伟 王磊 +2 位作者 李嘉楠 李帅龙 韩林 《计算机科学》 北大核心 2025年第5期58-66,共9页
算子融合是深度学习编译器中的一种编译优化技术,能够将多个算子合并为一个大的算子,有效降低计算和访存的成本。深度学习编译器TVM的算子融合方案中将算子按照功能特性进行分类,并设计融合规则,最后采用贪心算法进行融合。这种融合方... 算子融合是深度学习编译器中的一种编译优化技术,能够将多个算子合并为一个大的算子,有效降低计算和访存的成本。深度学习编译器TVM的算子融合方案中将算子按照功能特性进行分类,并设计融合规则,最后采用贪心算法进行融合。这种融合方案存在以下问题:首先,功能特性的算子分类方式下的融合规则不够通用,会错失算子融合机会,无法实现更大粒度的融合;其次,贪心的融合算法也无法实现算子融合的最优解。针对上述问题,对TVM进行改进,提出按照算子输入输出映射类型的算子分类方式,并设计通用的算子融合规则以扩大算子融合的粒度;提出基于动态规划的融合方案搜索算法和算子融合代价评估模型,并对搜索空间进行剪枝,使得算法能够在合理时间内搜索得到优化的融合方案。为评测融合方案的有效性,在CPU以及DCU等平台上对VGG-16,Efficient-B0,MobileNet-V1,YOLO-V4等深度学习模型的融合比和推理时延进行测试,实验结果表明,相较于TVM原有融合方案,所提方案融合比平均提升了27%,推理时延平均获得了1.75的加速比。 展开更多
关键词 深度学习编译器 TVM 算子融合 融合规则 动态规划
在线阅读 下载PDF
基于MILP-TD3的用户侧储能系统优化运行
5
作者 陈景文 单茜 《中国电机工程学报》 北大核心 2025年第13期5119-5129,I0015,共12页
深度强化学习(deep reinforcement learning,DRL)作为调控用户侧储能以消纳光伏发电和满足用户用电需求的重要算法得到广泛的应用,但应用过程中,DRL智能体难以严格执行运行约束,导致其提供不可靠的动作,威胁储能系统运行的安全性。基于... 深度强化学习(deep reinforcement learning,DRL)作为调控用户侧储能以消纳光伏发电和满足用户用电需求的重要算法得到广泛的应用,但应用过程中,DRL智能体难以严格执行运行约束,导致其提供不可靠的动作,威胁储能系统运行的安全性。基于此,该文提出一种基于MILP-TD3的用户侧储能系统优化运行策略。首先,以调度周期内运行成本最小为目标,建立考虑电池退化成本的实时运行优化模型,引入包含功率平衡约束的马尔科夫决策过程(Markov decision process,MDP),将储能运行问题转换为智能体的寻优问题;其次,提出将双延迟深度确定性策略梯度(double delay depth deterministic strategy gradient,TD3)算法的动作价值函数转化为混合整数线性规划(mixed integer linear programming,MILP)公式的MILP-TD3算法,使智能体严格执行储能运行的约束条件;最后,通过算例对比分析,结果表明所提模型和算法能够确定最优运行策略,可以严格执行功率平衡约束,该文算法较传统TD3算法所得平均日运行成本降低25.34%,各时段平均优化时间为0.024 s,满足实时调度要求,保证用户侧储能系统安全运行。 展开更多
关键词 用户侧储能 深度强化学习 混合整数线性规划 优化运行
在线阅读 下载PDF
基于模糊神经网络在线自学习的多智能体一致性控制
6
作者 张宪霞 唐胜杰 俞寅生 《自动化学报》 北大核心 2025年第3期590-603,共14页
针对多智能体系统分布式一致性控制问题,提出一种新的融合动态模糊神经网络(Dynamic fuzzy neural network,DFNN)和自适应动态规划(Adaptive dynamic programming,ADP)算法的无模型自适应控制方法.类似于强化学习中执行者-评论家结构,D... 针对多智能体系统分布式一致性控制问题,提出一种新的融合动态模糊神经网络(Dynamic fuzzy neural network,DFNN)和自适应动态规划(Adaptive dynamic programming,ADP)算法的无模型自适应控制方法.类似于强化学习中执行者-评论家结构,DFNN和神经网络(Neural network,NN)分别逼近控制策略和性能指标.每个智能体的DFNN执行者从零规则开始,通过在线学习,与其局部邻域的智能体交互而生成和合并规则.最终,每个智能体都有一个独特的DFNN控制器,具有不同的结构和参数,实现了最优的分布式同步控制律.仿真结果表明,本文提出的在线算法在非线性多智能体系统分布式一致性控制中优于传统基于NN的ADP算法. 展开更多
关键词 多智能体系统 自适应动态规划 动态模糊神经网络 分布式一致性控制 在线学习
在线阅读 下载PDF
基于强化学习与遗传算法的机器人并行拆解序列规划方法 被引量:2
7
作者 汪开普 马晓艺 +2 位作者 卢超 殷旅江 李新宇 《国防科技大学学报》 北大核心 2025年第2期24-34,共11页
在拆解序列规划问题中,为了提高拆解效率、降低拆解能耗,引入了机器人并行拆解模式,构建了机器人并行拆解序列规划模型,并设计了基于强化学习的遗传算法。为了验证模型的正确性,构造了混合整数线性规划模型。算法构造了基于目标导向的... 在拆解序列规划问题中,为了提高拆解效率、降低拆解能耗,引入了机器人并行拆解模式,构建了机器人并行拆解序列规划模型,并设计了基于强化学习的遗传算法。为了验证模型的正确性,构造了混合整数线性规划模型。算法构造了基于目标导向的编解码策略,以提高初始解的质量;采用Q学习来选择算法迭代过程中的最佳交叉策略和变异策略,以增强算法的自适应能力。在一个34项任务的发动机拆解案例中,通过与四种经典多目标算法对比,验证了所提算法的优越性;分析所得拆解方案,结果表明机器人并行拆解模式可以有效缩短完工时间,并降低拆解能耗。 展开更多
关键词 拆解序列规划 机器人并行拆解 混合整数线性规划模型 遗传算法 强化学习
在线阅读 下载PDF
情绪驱动下的拔尖潜能:深度学习与批判性思维的成长机制 被引量:1
8
作者 李文烨 吕林海 《高教发展与评估》 北大核心 2025年第1期64-73,I0005,共11页
在人工智能快速发展的背景下,深度学习和批判性思维已成为衡量拔尖人才潜力的重要指标。研究采用量化方法,结合3210名本科生的大规模横断调查与53名拔尖学生的四期追踪分析,聚焦拔尖计划本科生,探究其深度学习与批判性思维的发展规律及... 在人工智能快速发展的背景下,深度学习和批判性思维已成为衡量拔尖人才潜力的重要指标。研究采用量化方法,结合3210名本科生的大规模横断调查与53名拔尖学生的四期追踪分析,聚焦拔尖计划本科生,探究其深度学习与批判性思维的发展规律及情绪影响机制,挖掘拔尖学生的深度学习、批判性思维发展、影响因素、动力机制。研究发现:(1)拔尖学生在入学前后均展现出显著优于普通学生的深度学习行为和批判性思维能力;(2)情绪类因素对拔尖学生的学习发展起着关键作用,不仅能促进深度学习,还能直接提升批判性思维;(3)存在两条促进高水平批判性思维形成的情绪路径:一是志向与兴趣、使命与意义和社会与自我共同作用,二是志向与兴趣、社会与自我与深度学习相互作用。基于研究发现,管理与教学层面应转变教学理念、重视情绪体验、淡化功利评价、强化家国情怀培养。 展开更多
关键词 拔尖计划 深度学习 批判性思维 情绪路径 人才培养
在线阅读 下载PDF
基于序列二次规划及机器学习算法的油气田生产优化模型 被引量:1
9
作者 白宗翰 康琦 +1 位作者 吴海浩 宫敬 《钻采工艺》 北大核心 2025年第1期165-172,共8页
油气田生产优化可以提高储层的产能及整体产量,在油气行业中具有重要的意义。现有方法在处理复杂油气系统时存在计算效率低、模型耦合性差等问题。针对油气田生产优化问题,提出了一个基于序列二次规划(SQP)算法与机器学习算法的地上—... 油气田生产优化可以提高储层的产能及整体产量,在油气行业中具有重要的意义。现有方法在处理复杂油气系统时存在计算效率低、模型耦合性差等问题。针对油气田生产优化问题,提出了一个基于序列二次规划(SQP)算法与机器学习算法的地上—地下一体化生产优化模型,耦合油气田地上管道、生产设备、井筒与油藏多相流计算模型来进行水力和热力计算。利用SQP算法对生产设备的油嘴开度和电潜泵频率等运行参数进行优化,以实现油气田产量最大化。针对复杂流动特性的建模难题,通过神经网络模型对井筒与管道压降进行快速预测,有效减少了迭代计算量。利用实际油气田数据进行模型验证结果显示,该模型能够准确预测油气流动特性,误差控制在10%以内,优化后的油气田总产量较未优化前显著提升。提出的基于SQP算法与机器学习算法的油气田生产优化模型,实现了地上—地下一体化系统的全局优化,利用机器学习方法替代传统压差计算部分,克服了传统优化方法在计算效率和模型耦合性方面的不足,显著提升了优化的时间效率。通过与商业软件对比,验证了所采用的SQP算法的准确性和有效性。 展开更多
关键词 油田生产优化 气田生产优化 序列二次规划 机器学习
在线阅读 下载PDF
城市居民区回收箱布局和调度双层规划模型及优化算法
10
作者 郭谦 刘勇 马良 《计算机应用研究》 北大核心 2025年第1期177-184,共8页
针对城市居民区回收箱布局规划和路径优化问题,首先构建居民区回收箱数量与人口、回收频率、回收阈值的线性函数,并构建双层优化模型,回收总利润最大化作为上层目标,运输成本最小化作为下层目标。其次,为求解具有NP-hard特征的新模型,... 针对城市居民区回收箱布局规划和路径优化问题,首先构建居民区回收箱数量与人口、回收频率、回收阈值的线性函数,并构建双层优化模型,回收总利润最大化作为上层目标,运输成本最小化作为下层目标。其次,为求解具有NP-hard特征的新模型,设计加入团体学习算子和自适应选择策略的人类学习优化算法,并与禁忌搜索算法嵌套构建混合人类学习算法(hybrid human learning optimization algorithm,HHLO)。再次,采用不同规模算例,并将新算法与基本人类学习算法、遗传算法、自适应粒子群算法、红嘴蓝鹊算法进行对比分析,验证了模型的可行性和算法的有效性。最后,通过上海杨浦区某实例进行灵敏度分析,探讨回收箱容量、分时定价策略和分区定价策略对回收中心总利润与居民满意度的影响。 展开更多
关键词 回收箱布局 车辆调度 混合人类学习优化算法 双层规划
在线阅读 下载PDF
基于CodeBERT和Stacking集成学习的补丁正确性验证方法
11
作者 韩威 姜淑娟 周伟 《计算机科学》 北大核心 2025年第1期250-258,共9页
近年来,自动程序修复已成为软件工程领域的重要研究课题。然而,现有的自动修复技术大多是基于补丁生成和测试的,在补丁验证环节时间成本很高。此外,由于测试套件的不完备,许多候选补丁虽然能通过测试,但实际上并不正确,从而导致补丁过... 近年来,自动程序修复已成为软件工程领域的重要研究课题。然而,现有的自动修复技术大多是基于补丁生成和测试的,在补丁验证环节时间成本很高。此外,由于测试套件的不完备,许多候选补丁虽然能通过测试,但实际上并不正确,从而导致补丁过拟合。为提高补丁验证的效率并缓解补丁过拟合的问题,提出了一种静态的补丁验证方法。该方法首先使用大型预训练模型CodeBERT自动提取缺陷代码片段和补丁代码片段的语义特征,然后使用历史缺陷修复补丁数据训练Stacking集成学习模型,训练之后的模型可以对新的缺陷修复补丁进行有效验证。在Defects4J缺陷数据集相关的1 000个补丁数据上对所提方法的验证能力进行评估。实验结果表明,该方法可以有效地验证补丁的正确性,从而提高补丁验证的效率。 展开更多
关键词 自动程序修复 补丁验证 预训练模型 集成学习 Defects4J缺陷数据集
在线阅读 下载PDF
基于压阻传感器和微信小程序的中医脉象深度学习分类算法
12
作者 陈江宁 陈俊飞 +3 位作者 施京红 丁辉 雷成阳 陈文会 《传感技术学报》 北大核心 2025年第2期288-293,共6页
人体手腕处的桡动脉脉象是心脏、血管、血液的质和量等因素共同作用并互相影响的表现,可以反映人体整个循环系统的状态。首先,基于压阻式传感器设计了人体桡动脉脉搏信号采集单元,并提出基于卷积神经网络的脉象分类算法和基于自编码器... 人体手腕处的桡动脉脉象是心脏、血管、血液的质和量等因素共同作用并互相影响的表现,可以反映人体整个循环系统的状态。首先,基于压阻式传感器设计了人体桡动脉脉搏信号采集单元,并提出基于卷积神经网络的脉象分类算法和基于自编码器的脉搏信号判别算法进行脉象识别,并将其成功应用到脉象识别系统中。经过大量的临床测试表明,该方案具有一定的可行性。其次,在“微信开发者工具”环境下,设计了“WH采集脉象”微信小程序,微信小程序把采集到的脉搏数据送到微信云数据库上进行存储,使用人体桡动脉常见的平脉、细脉、滑脉、弦脉等10种注重脉形和脉势的标准脉图作为依据进行标注,构建了2127条样本的脉象数据集,搭建了脉象分类模型,并对模型进行了五折交叉验证训练和测试,临床测试结果说明,卷积神经网络模型在测试集上的脉象分类准确度高于95%以上。最后,为避免非脉搏信号或其他干扰信号对脉象分类准确性造成影响,使用自编码器模型判别脉搏信号并进行训练和测试。临床测试结果表明,使用自编码器构建的脉搏信号判别模型,可以有效判别常见脉搏信号和非脉搏信号。 展开更多
关键词 压阻传感器 深度学习 中医脉象分类 微信小程序
在线阅读 下载PDF
基于微信小程序的工程材料及热处理移动学习系统研究
13
作者 宋功琼 肖军杰 +1 位作者 王雪寒 王之恒 《印刷与数字媒体技术研究》 北大核心 2025年第4期229-236,264,共9页
在信息化、网络化、智能化时代,移动化学习模式越来越得到关注,移动学习系统的设计关系到学习的效果。本研究基于微信小程序,采用MINA框架和Java语言,围绕工程材料及热处理的基本理论知识,设计和开发了一款移动学习系统。首先,对教材内... 在信息化、网络化、智能化时代,移动化学习模式越来越得到关注,移动学习系统的设计关系到学习的效果。本研究基于微信小程序,采用MINA框架和Java语言,围绕工程材料及热处理的基本理论知识,设计和开发了一款移动学习系统。首先,对教材内容进行数字化处理;然后,从开发工具、功能模块、数据库设计、平台实现等方面研究了移动学习系统开发全过程,开发的移动学习系统可实现检索查询、视频教学、在线测试、随堂笔记等功能;最后,综合测试了该移动学习系统的功能。结果表明,用户体验反馈良好,创新了传统学习模式。 展开更多
关键词 微信小程序 移动学习系统 工程材料 热处理 学习模式
在线阅读 下载PDF
基于记忆策略的元解释学习
14
作者 王榕 田聪 +2 位作者 孙军 于斌 段振华 《软件学报》 北大核心 2025年第8期3477-3493,共17页
元解释学习(meta-interpretive learning,MIL)是一种归纳逻辑程序设计(inductive logic programming,ILP)方法,旨在从一组实例、元规则和其他背景知识中学习一个程序.MIL采用深度优先和失败驱动策略在程序空间中搜索适当的子句以生成程... 元解释学习(meta-interpretive learning,MIL)是一种归纳逻辑程序设计(inductive logic programming,ILP)方法,旨在从一组实例、元规则和其他背景知识中学习一个程序.MIL采用深度优先和失败驱动策略在程序空间中搜索适当的子句以生成程序.事实上,这种机制不可避免地引发了对相同目标重复证明的问题.提出一种剪枝策略,该策略利用Prolog内置的数据库机制来存储未能达成的目标及其对应的错误信息,从而有效避免冗余的证明过程.此后,这些累积的错误信息能够作为指导,帮助MIL系统在未来的学习过程中进行优化和调整.证明剪枝算法的正确性,并在理论上计算程序空间的缩减比例.将所提出的方法应用于两个现有的MIL系统Metagol和Metagol_(AI),从而产生了两个新的MIL系统MetagolF和Metagol_(AI_F).在4个不同任务上的实证结果表明,所提出的策略可以显著减少学习相同程序的时间消耗. 展开更多
关键词 元解释学习 冗余证明 记忆策略 剪枝算法 归纳逻辑程序设计
在线阅读 下载PDF
基于分布式自适应内模的多智能体系统协同最优输出调节
15
作者 董昱辰 高伟男 姜钟平 《自动化学报》 北大核心 2025年第3期678-691,共14页
针对离散时间多智能体系统的协同最优输出调节问题,在不依赖多智能体系统矩阵精确信息的条件下提出分布式数据驱动自适应控制策略.基于自适应动态规划和分布式自适应内模,通过引入值迭代和策略迭代两种强化学习算法,利用在线数据学习最... 针对离散时间多智能体系统的协同最优输出调节问题,在不依赖多智能体系统矩阵精确信息的条件下提出分布式数据驱动自适应控制策略.基于自适应动态规划和分布式自适应内模,通过引入值迭代和策略迭代两种强化学习算法,利用在线数据学习最优控制器,实现多智能体系统的协同输出调节.考虑到跟随者只能访问领导者的估计值进行在线学习,对闭环系统的稳定性和学习算法的收敛性进行严格的理论分析,证明所学习的控制增益可以收敛到最优控制增益.仿真结果验证了所提控制方法的有效性. 展开更多
关键词 自适应动态规划 分布式自适应内模 强化学习 协同输出调节 多智能体系统
在线阅读 下载PDF
基于统计推理的二进制程序语义比较模型
16
作者 郭曦 王盼 《电子学报》 北大核心 2025年第1期163-181,共19页
在程序缺陷分析、恶意代码发掘等过程中,通常需要对二进制程序的行为相似性进行分析.目前基于语法的相似性分析方法忽略了程序的执行语义,存在分析精度不高的问题.基于语义的相似性分析方法在符号逻辑公式生成过程中,频繁地调用约束求... 在程序缺陷分析、恶意代码发掘等过程中,通常需要对二进制程序的行为相似性进行分析.目前基于语法的相似性分析方法忽略了程序的执行语义,存在分析精度不高的问题.基于语义的相似性分析方法在符号逻辑公式生成过程中,频繁地调用约束求解器进行语义相似性比较,会产生巨大的计算开销.提出一种基于统计推理的代码相似性模糊匹配分析方法,从指令级别相似度的计算开始,逐级对基本块及函数间的语义相似性进行推理.首先将二进制代码按照一定的规则划分为具有规范形式的片段集合,在基本块粒度上使用动态规划的方法构建有相同执行语义的存储表,从而获得基本块间的指令初始语义映射.然后通过邻域搜索的方法将该映射拓展到目标分析函数,并在该过程中提取函数的执行语义.最后通过对相似函数的结果进行统计分析,进而计算二进制文件的相似度.同时采用无监督的预训练分析方法,通过调优预训练模型的参数从而提高代码相似分析的精度.从跨平台及优化选项的角度对13个主流的开源项目进行了实验,实验结果表明相较于对比工具,本文方法的分析精度平均提高7.26%,同时消融实验表明,本文的预训练模型可以有效提高二进制程序语义匹配的性能. 展开更多
关键词 程序分析 语义比较 逆向工程 统计推理 迁移学习
在线阅读 下载PDF
数据驱动自适应评判控制研究进展
17
作者 王鼎 赵明明 +2 位作者 刘德荣 乔俊飞 宋世杰 《自动化学报》 北大核心 2025年第6期1170-1190,共21页
最优控制与人工智能的融合发展产生了一类以执行−评判设计为主要思想的自适应动态规划(ADP)方法.通过集成动态规划理论、强化学习机制、神经网络技术、函数优化算法,ADP在求解大规模复杂非线性系统的决策和调控问题上取得重要进展.然而... 最优控制与人工智能的融合发展产生了一类以执行−评判设计为主要思想的自适应动态规划(ADP)方法.通过集成动态规划理论、强化学习机制、神经网络技术、函数优化算法,ADP在求解大规模复杂非线性系统的决策和调控问题上取得重要进展.然而,实际系统的未知参数和不确定扰动经常导致难以建立精确的数学模型,对最优控制器的设计提出挑战.近年来,具有强大自学习和自适应能力的数据驱动ADP方法受到广泛关注,它能够在不依赖动态模型的情况下,仅利用系统的输入输出数据为复杂非线性系统设计出稳定、安全、可靠的最优控制器,符合智能自动化的发展潮流.通过对数据驱动ADP方法的算法实现、理论特性、相关应用等方面进行梳理,着重介绍了最新的研究进展,包括在线Q学习、值迭代Q学习、策略迭代Q学习、加速Q学习、迁移Q学习、跟踪Q学习、安全Q学习和博弈Q学习,并涵盖数据学习范式、稳定性、收敛性以及最优性的分析.此外,为提高学习效率和控制性能,设计了一些改进的评判机制和效用函数.最后,以污水处理过程为背景,总结数据驱动ADP方法在实际工业系统中的应用效果和存在问题,并展望一些未来的研究方向. 展开更多
关键词 自适应评判控制 自适应动态规划 数据驱动设计 在线Q学习 迭代Q学习
在线阅读 下载PDF
融合动态规划与XGBoost算法的混合动力汽车能量管理策略 被引量:1
18
作者 田珂 马骁 《车用发动机》 北大核心 2025年第2期80-88,共9页
对于目前插电式混合动力汽车能量管理功率分配的实时性与准确性问题,现有的离线功率预测模型未能全面考虑混合动力汽车蓄电池的健康状态(SOH),以及功率波动等动态性能多目标变化对预测结果的影响,同时现有的机器学习算法在混合动力汽车... 对于目前插电式混合动力汽车能量管理功率分配的实时性与准确性问题,现有的离线功率预测模型未能全面考虑混合动力汽车蓄电池的健康状态(SOH),以及功率波动等动态性能多目标变化对预测结果的影响,同时现有的机器学习算法在混合动力汽车的动力分配计算及预测方面也存在性能不足问题,故通过离线动态规划+在线XGBoost算法,实现对混合动力汽车的功率分配建模及预测。首先搭建插电式混合动力汽车的动力系统模型,并且通过聚类分析获取车辆行驶的典型混合工况,其次使用动态规划算法离线计算该工况下发动机与锂电池的最优功率分配比例,最后XGBoost算法以动态规划计算结果作为训练数据进行模型训练验证。计算结果表明:离线阶段的动态规划考虑了多目标优化,使得在线阶段的模型训练有足够的数据支撑。对比随机森林算法,XGBoost算法将最大误差降低了28%,同时将计算速度提升了62%,可以实现对插电式混合动力汽车功率分配的精确估计。 展开更多
关键词 混合动力汽车 能量管理策略 动态规划 机器学习
在线阅读 下载PDF
数据驱动的球团生产工艺参数优化技术研究
19
作者 张岳伟 张祖国 +2 位作者 卢维枫 李毓森 张智海 《工程管理科技前沿》 北大核心 2025年第1期54-61,共8页
本文基于某球团生产企业的带式焙烧机球团生产线,利用机器学习和运筹优化相结合的方法,提出了一套球团制造工艺控制参数优化方法,能够显著提高产品抗压强度。本研究对现有数据进行了同步、清洗,并进行主成分分析提高数据集的信息密度。... 本文基于某球团生产企业的带式焙烧机球团生产线,利用机器学习和运筹优化相结合的方法,提出了一套球团制造工艺控制参数优化方法,能够显著提高产品抗压强度。本研究对现有数据进行了同步、清洗,并进行主成分分析提高数据集的信息密度。使用处理后的数据集训练机器学习模型,拟合成品球团抗压强度、全铁含量与工艺参数之间的相关性。根据预测模型的类型,采用不同的优化方法:将树集成模型转化为混合整数线性规划模型,并使用求解器求解;对于复杂黑箱模型,采用高斯核平滑处理,并使用梯度上升方法优化目标函数。在测试集上,两种算法均能在20分钟内得到可行的优化解,相较历史决策显著提高了球团的抗压强度,同时保证针对不同数据场景下得到的不同预测模型,均可使用二者之一得到优化后的决策方案。本研究提出了一种可在实际球团工业中应用和推广的参数预测后优化方法,并在真实生产场景下验证了方法的有效性。 展开更多
关键词 机器学习 混合整数线性规划 启发式算法 预测后优化 烧结球团
在线阅读 下载PDF
2001—2021年“三北”工程区植被韧性分布特征及其驱动因素
20
作者 袁泽雨 许行 +5 位作者 任怡 许杨 庞建壮 吴小云 张翰遥 张志强 《林业科学》 北大核心 2025年第7期182-191,共10页
【目的】探讨2001—2021年间“三北”工程区内不同类型植被韧性的分布特征及其主要驱动因素,为在气候变化背景下提升“三北”工程区植被生态服务功能的可持续性提供科学依据。【方法】采用21年(2001—2021年)核归一化植被指数(kNDVI)的... 【目的】探讨2001—2021年间“三北”工程区内不同类型植被韧性的分布特征及其主要驱动因素,为在气候变化背景下提升“三北”工程区植被生态服务功能的可持续性提供科学依据。【方法】采用21年(2001—2021年)核归一化植被指数(kNDVI)的滞后1时间自相关系数(AC1)来衡量植被韧性,分析“三北”工程区植被韧性的分布特征。同时,运用可解释的机器学习算法解析生物和环境因素对植被韧性的调控机制。【结果】在“三北”工程区内,森林的韧性最高,其次是灌木,草地韧性最低;从空间分布来看,内蒙古高原地区植被韧性最低,而西北地区则表现出较高的植被韧性。不同植被类型的韧性受到各驱动因素的影响程度存在差异,但总体而言,年平均气温(MAT)和年平均降水量(MAP)等环境因素对植被韧性的影响显著高于生物因素。此外,植被韧性受到植被覆盖度(FVC)与MAP之间交互作用的显著影响。在干旱地区,应特别关注水资源承载力的限制,合理控制森林FVC,以避免因水分竞争导致的韧性下降;而草地FVC与韧性呈正相关关系,FVC的增加有助于提升草地韧性。在半干旱和半湿润地区,森林FVC与韧性呈正相关,高FVC有助于增强森林韧性,植被种植与管理应根据当地水资源可用情况进行调整。【结论】“三北”工程区植被韧性的变化主要受环境因素驱动。针对不同类型的植被,应结合区域生态可利用水条件实施差异化的经营管理策略,以增强生态韧性。在全球气候变化的背景下,本研究不仅有助于揭示“三北”工程区植被的韧性,还为未来的造林规划和植被种植管理提供了重要的科学依据和理论指导。 展开更多
关键词 "三北"工程 水资源 植被韧性 机器学习 沙普利加性解释
在线阅读 下载PDF
上一页 1 2 20 下一页 到第
使用帮助 返回顶部