期刊文献+
共找到906篇文章
< 1 2 46 >
每页显示 20 50 100
基于softmax的加权Double Q-Learning算法 被引量:3
1
作者 钟雨昂 袁伟伟 关东海 《计算机科学》 CSCD 北大核心 2024年第S01期46-50,共5页
强化学习作为机器学习的一个分支,用于描述和解决智能体在与环境的交互过程中,通过学习策略以达成回报最大化的问题。Q-Learning作为无模型强化学习的经典方法,存在过估计引起的最大化偏差问题,并且在环境中奖励存在噪声时表现不佳。Dou... 强化学习作为机器学习的一个分支,用于描述和解决智能体在与环境的交互过程中,通过学习策略以达成回报最大化的问题。Q-Learning作为无模型强化学习的经典方法,存在过估计引起的最大化偏差问题,并且在环境中奖励存在噪声时表现不佳。Double Q-Learning(DQL)的出现解决了过估计问题,但同时造成了低估问题。为解决以上算法的高低估问题,提出了基于softmax的加权Q-Learning算法,并将其与DQL相结合,提出了一种新的基于softmax的加权Double Q-Learning算法(WDQL-Softmax)。该算法基于加权双估计器的构造,对样本期望值进行softmax操作得到权重,使用权重估计动作价值,有效平衡对动作价值的高估和低估问题,使估计值更加接近理论值。实验结果表明,在离散动作空间中,相比于Q-Learning算法、DQL算法和WDQL算法,WDQL-Softmax算法的收敛速度更快且估计值与理论值的误差更小。 展开更多
关键词 强化学习 q-learning double q-learning Softmax
在线阅读 下载PDF
Supervisory control of the hybrid off-highway vehicle for fuel economy improvement using predictive double Q-learning with backup models 被引量:1
2
作者 SHUAI Bin LI Yan-fei +2 位作者 ZHOU Quan XU Hong-ming SHUAI Shi-jin 《Journal of Central South University》 SCIE EI CAS CSCD 2022年第7期2266-2278,共13页
This paper studied a supervisory control system for a hybrid off-highway electric vehicle under the chargesustaining(CS)condition.A new predictive double Q-learning with backup models(PDQL)scheme is proposed to optimi... This paper studied a supervisory control system for a hybrid off-highway electric vehicle under the chargesustaining(CS)condition.A new predictive double Q-learning with backup models(PDQL)scheme is proposed to optimize the engine fuel in real-world driving and improve energy efficiency with a faster and more robust learning process.Unlike the existing“model-free”methods,which solely follow on-policy and off-policy to update knowledge bases(Q-tables),the PDQL is developed with the capability to merge both on-policy and off-policy learning by introducing a backup model(Q-table).Experimental evaluations are conducted based on software-in-the-loop(SiL)and hardware-in-the-loop(HiL)test platforms based on real-time modelling of the studied vehicle.Compared to the standard double Q-learning(SDQL),the PDQL only needs half of the learning iterations to achieve better energy efficiency than the SDQL at the end learning process.In the SiL under 35 rounds of learning,the results show that the PDQL can improve the vehicle energy efficiency by 1.75%higher than SDQL.By implementing the PDQL in HiL under four predefined real-world conditions,the PDQL can robustly save more than 5.03%energy than the SDQL scheme. 展开更多
关键词 supervisory charge-sustaining control hybrid electric vehicle reinforcement learning predictive double q-learning
在线阅读 下载PDF
A blockchain bee colony double inhibition labor division algorithm for spatio-temporal coupling task with application to UAV swarm task allocation 被引量:7
3
作者 WU Husheng LI Hao XIAO Renbin 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2021年第5期1180-1199,共20页
It is difficult for the double suppression division algorithm of bee colony to solve the spatio-temporal coupling or have higher dimensional attributes and undertake sudden tasks.Using the idea of clustering,after clu... It is difficult for the double suppression division algorithm of bee colony to solve the spatio-temporal coupling or have higher dimensional attributes and undertake sudden tasks.Using the idea of clustering,after clustering tasks according to spatio-temporal attributes,the clustered groups are linked into task sub-chains according to similarity.Then,based on the correlation between clusters,the child chains are connected to form a task chain.Therefore,the limitation is solved that the task chain in the bee colony algorithm can only be connected according to one dimension.When a sudden task occurs,a method of inserting a small number of tasks into the original task chain and a task chain reconstruction method are designed according to the relative relationship between the number of sudden tasks and the number of remaining tasks.Through the above improvements,the algorithm can be used to process tasks with spatio-temporal coupling and burst tasks.In order to reflect the efficiency and applicability of the algorithm,a task allocation model for the unmanned aerial vehicle(UAV)group is constructed,and a one-to-one correspondence between the improved bee colony double suppression division algorithm and each attribute in the UAV group is proposed.Task assignment has been constructed.The study uses the self-adjusting characteristics of the bee colony to achieve task allocation.Simulation verification and algorithm comparison show that the algorithm has stronger planning advantages and algorithm performance. 展开更多
关键词 bee colony double inhibition labor division algorithm high dimensional attribute sudden task reforming the task chain task allocation model
在线阅读 下载PDF
A Routing Algorithm for Distributed Optimal Double Loop Computer Networks
4
作者 Li Layuan(Department of Electrical Engineering and Computer Science.Wuhan University of Water Transportation, Wuhan 430063, P. R. China) 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 1994年第1期37-43,共7页
A routing algorithm for distributed optimal double loop computer networks is proposed and analyzed. In this paper, the routing algorithm rule is described, and the procedures realizing the algorithm are given. The pr... A routing algorithm for distributed optimal double loop computer networks is proposed and analyzed. In this paper, the routing algorithm rule is described, and the procedures realizing the algorithm are given. The proposed algorithm is shown to be optimal and robust for optimal double loop. In the absence of failures,the algorithm can send a packet along the shortest path to destination; when there are failures,the packet can bypasss failed nodes and links. 展开更多
关键词 Computer networks double loop Routing algorithm
在线阅读 下载PDF
基于双估计器的改进Speedy Q-learning算法 被引量:7
5
作者 郑帅 罗飞 +2 位作者 顾春华 丁炜超 卢海峰 《计算机科学》 CSCD 北大核心 2020年第7期179-185,共7页
Q-learning算法是一种经典的强化学习算法,更新策略由于保守和过估计的原因,存在收敛速度慢的问题。Speedy Q-learning算法和Double Q-learning算法是Q-learning算法的两个变种,分别用于解决Q-learning算法收敛速度慢和过估计的问题。... Q-learning算法是一种经典的强化学习算法,更新策略由于保守和过估计的原因,存在收敛速度慢的问题。Speedy Q-learning算法和Double Q-learning算法是Q-learning算法的两个变种,分别用于解决Q-learning算法收敛速度慢和过估计的问题。文中基于Speedy Q-learning算法Q值的更新规则和蒙特卡洛强化学习的更新策略,通过理论分析及数学证明提出了其等价形式,从该等价形式可以看到,Speedy Q-learning算法由于将当前Q值的估计函数作为历史Q值的估计,虽然整体上提升了智能体的收敛速度,但是同样存在过估计问题,使得算法在迭代初期的收敛速度较慢。针对该问题,文中基于Double Q-learning算法中双估计器可以改善智能体收敛速度的特性,提出了一种改进算法Double Speedy Q-learning。其通过双估计器,分离最优动作和最大Q值的选择,改善了Speedy Q-learning算法在迭代初期的学习策略,提升了Speedy Q-learning算法的整体收敛速度。在不同规模的格子世界中进行实验,分别采用线性学习率和多项式学习率,来对比Q-learning算法及其改进算法在迭代初期的收敛速度和整体收敛速度。实验结果表明,Double Speedy Q-learning算法在迭代初期的收敛速度快于Speedy Q-learning算法,且其整体收敛速度明显快于对比算法,其实际平均奖励值和期望奖励值之间的差值最小。 展开更多
关键词 q-learning double q-learning Speedy q-learning 强化学习
在线阅读 下载PDF
基于Expectimax搜索与Double DQN的非完备信息博弈算法 被引量:7
6
作者 雷捷维 王嘉旸 +2 位作者 任航 闫天伟 黄伟 《计算机工程》 CAS CSCD 北大核心 2021年第3期304-310,320,共8页
麻将作为典型的非完备信息博弈游戏主要通过传统Expectimax搜索算法实现,其剪枝策略与估值函数基于人工先验知识设计,存在假设不合理等问题。提出一种结合Expectimax搜索与Double DQN强化学习算法的非完备信息博弈算法。在Expectimax搜... 麻将作为典型的非完备信息博弈游戏主要通过传统Expectimax搜索算法实现,其剪枝策略与估值函数基于人工先验知识设计,存在假设不合理等问题。提出一种结合Expectimax搜索与Double DQN强化学习算法的非完备信息博弈算法。在Expectimax搜索树扩展过程中,采用Double DQN输出的估值设计估值函数并在限定搜索层数内获得分支估值,同时设计剪枝策略对打牌动作进行排序与部分扩展实现搜索树剪枝。在Double DQN模型训练过程中,将麻将信息编码为特征数据输入神经网络获得估值,使用Expectimax搜索算法得到最优动作以改进探索策略。实验结果表明,与Expectimax搜索算法、Double DQN算法等监督学习算法相比,该算法在麻将游戏上胜率与得分更高,具有更优异的博弈性能。 展开更多
关键词 double DQN算法 Expectimax搜索 非完备信息博弈 麻将 强化学习
在线阅读 下载PDF
基于Double Deep Q Network的无人机隐蔽接敌策略 被引量:10
7
作者 何金 丁勇 高振龙 《电光与控制》 CSCD 北大核心 2020年第7期52-57,共6页
基于深度强化学习的连续状态空间无人机隐蔽接敌问题,提出了基于马尔可夫决策过程的隐蔽接敌双深度Q网络(DDQN)方法。利用DDQN生成目标值函数的方法解决了传统DQN的过拟合问题;采用按优先级随机抽样的方法获取训练样本,加速了神经网络... 基于深度强化学习的连续状态空间无人机隐蔽接敌问题,提出了基于马尔可夫决策过程的隐蔽接敌双深度Q网络(DDQN)方法。利用DDQN生成目标值函数的方法解决了传统DQN的过拟合问题;采用按优先级随机抽样的方法获取训练样本,加速了神经网络的训练速度;设定贪婪系数按照指数下降的方法,解决了传统强化学习的“探索利用窘境”;在势函数奖赏函数设计中引入角度因子,使其更加符合实际作战情况。仿真实验结果表明,DDQN具有较好的收敛性,能有效生成隐蔽接敌策略。 展开更多
关键词 隐蔽接敌策略 空战决策 马尔可夫决策过程 双神经网络结构 DDQN算法
在线阅读 下载PDF
基于Q-Learning算法的无人机空战机动决策研究
8
作者 姚培源 魏潇龙 +1 位作者 俞利新 李胜厚 《电光与控制》 CSCD 北大核心 2023年第5期16-22,共7页
针对无人机空战对抗自主机动决策问题,设计了侧向机动决策算法。通过加入启发式因子的方式和双Q表交替学习的机制,弥补了传统Q-Learning算法学习速度慢、无效学习多的不足。通过路径规划仿真和数据的对比,验证了改进Q-Learning算法具有... 针对无人机空战对抗自主机动决策问题,设计了侧向机动决策算法。通过加入启发式因子的方式和双Q表交替学习的机制,弥补了传统Q-Learning算法学习速度慢、无效学习多的不足。通过路径规划仿真和数据的对比,验证了改进Q-Learning算法具有更好的稳定性和求解能力。设计了动态的栅格规划环境,能够使无人机根据变化的空战态势自适应调整栅格尺寸大小,且对求解的速率不产生影响。基于Q-Learning算法,构建了无人机空战对抗侧向机动决策模型,并通过武器平台调换的方式验证了改进Q-Learning算法能显著提升无人机空战胜负比。 展开更多
关键词 无人机 空战 机动决策 动态栅格环境 路径规划 q-learning学习表算法
在线阅读 下载PDF
双转子永磁传动不平衡和失准耦合振动的抑制控制方法
9
作者 郭永存 马鑫 +2 位作者 王爽 李德永 杨豚 《煤炭学报》 北大核心 2025年第6期3195-3209,共15页
大型带式输送机在启制动工况或非均匀负载条件下,双转子永磁传动系统易受周期性激励和扰动产生较大振动,特别是该系统磁场呈现非正弦分布以及存在涡电流谐波等因素,使得该系统运行中的振动控制变得尤为重要。双转子永磁传动系统具有调... 大型带式输送机在启制动工况或非均匀负载条件下,双转子永磁传动系统易受周期性激励和扰动产生较大振动,特别是该系统磁场呈现非正弦分布以及存在涡电流谐波等因素,使得该系统运行中的振动控制变得尤为重要。双转子永磁传动系统具有调速高效、运行成本低、适应能力强且等优势,但其非线性特征明显。神经网络迭代学习控制算法通过引入非线性激活函数和深度结构,使得网络能够拟合系统的非线性特征,在迭代学习过程中,网络根据系统的实时振动数据不断调整参数,以实现振动抑制的目标。故采用该算法对转子系统的振动抑制开展研究,对提升系统整体的稳定性,确保其安全高效运行有着重要意义。针对双转子永磁传动系统中磁场非正弦分布及涡电流谐波等因素诱发的传动不平衡与失准耦合振动问题,提出一种改进的神经网络迭代学习控制算法(MNN-ILC),创新性引入了基于误差值的自适应因子σ和正则化的权重衰减系数λ,以快速响应系统变化并减少误差,旨在有效抑制振动。采用多物理场有限元仿真,模拟系统在不对中不平衡状态下的振动特性。为验证所提算法的有效性,以1台55kW的双转子永磁传动系统为研究对象,测试其在不同转速下的实时缓振能力。结果显示:未施加控制时测量点的最大振幅为18.7μm;施加MNN-ILC算法后,振幅最大值降低至3.1μm,减幅达到约83.4%。通过对比MNN-ILC算法与传统ILC算法、现有改进的ILC算法,发现施加控制后约10s时,传统ILC算法开始发散,而MNN-ILC算法仍能保持良好的稳定控制性能,将振幅控制在±3.5μm以内。MNN-ILC相较于ILC,振动抑制效果提升了约51.9%、58.1%、61.4%;在响应时间上分别减少了约33.4%、32.0%、32.5%。该研究为双转子永磁传动系统的振动抑制提供了重要的理论参考。 展开更多
关键词 双转子永磁传动 自适应因子 失准耦合 MNN-ILC算法 振动抑制
在线阅读 下载PDF
基于动态区域划分的配电网台区三相不平衡治理策略
10
作者 陈晓龙 徐颖 李斌 《电力自动化设备》 北大核心 2025年第8期208-216,共9页
传统三相不平衡治理仅关注变压器关口处的三相不平衡情况,忽略了台区内部不平衡特征,且多采用静态调相策略,难以适应灵活源荷接入下低压配电网运行状态的动态变化。为此,提出了一种基于动态区域划分的三相不平衡治理策略。提出基于分区... 传统三相不平衡治理仅关注变压器关口处的三相不平衡情况,忽略了台区内部不平衡特征,且多采用静态调相策略,难以适应灵活源荷接入下低压配电网运行状态的动态变化。为此,提出了一种基于动态区域划分的三相不平衡治理策略。提出基于分区评价指数与阈值触发机制的动态分区方法,以划定后续相序优化的区域范围。建立考虑多类型灵活调节资源的双层优化模型,上层以各分区三相不平衡度最小为目标优化相序配置,下层构建以运行成本最小为目标的电压优化模型。采用基于云模型改进的遗传算法和Gurobi求解器分别求解上下层模型。基于改进的IEEE 123节点系统和0.38 kV实际配电网台区进行仿真,验证了所提策略的有效性与优越性。 展开更多
关键词 配电网 三相不平衡 动态分区 双层优化模型 相序优化 云模型 遗传算法
在线阅读 下载PDF
基于TLF-YOLOv8的堆叠垃圾实例分割算法
11
作者 李利 梁晶 +2 位作者 陈旭东 潘红光 寇发荣 《科学技术与工程》 北大核心 2025年第5期2009-2018,共10页
相较于一般场景下的图像实例分割,复杂堆叠场景下的实例分割受到严重遮挡、同类别待测物体堆叠等复杂情况的影响,使得其实例分割具有更大的难度。针对具有复杂堆叠场景下的垃圾实例分割问题,提出了一种融合YOLOv8与双层特征网络策略的... 相较于一般场景下的图像实例分割,复杂堆叠场景下的实例分割受到严重遮挡、同类别待测物体堆叠等复杂情况的影响,使得其实例分割具有更大的难度。针对具有复杂堆叠场景下的垃圾实例分割问题,提出了一种融合YOLOv8与双层特征网络策略的实例分割算法。首先,在数据预处理部分进行特征数据分层,并通过双层图卷积网络(graph convolutions network,GCN)实现双分支特征融合,减弱堆叠情况对被遮挡物体特征的影响,从而解决复杂堆叠遮挡下的实例分割问题。同时,为了解决同类待测物体易混淆的问题,融入了软阈值化非极大值抑制算法和新的交并比算法。最后,根据应用场景和数据集的复杂性,优化了主干网络部分的特征提取模块,并在主干网络部分引入了多尺度注意力机制,有效提高了模型的检测性能。实验使用遮挡垃圾分类实例分割数据集,实验结果表明该方法的平均准确率、交并比阈值为0.5时的平均准确率(AP_(50))、交并比为0.5~0.95时的平均准确率(AP_(50~95))等指标较之前的其他方法更优。相较于原YOLOv8算法,检测AP_(50)提高了7.9%,分割AP_(50)提高了5.4%,具有更好的检测和分割效果。 展开更多
关键词 垃圾堆叠 双层特征解耦融合 YOLOv8算法 软阈值化非极大值抑制 动态非单调聚焦机制 期望最大化注意力
在线阅读 下载PDF
基于DAUKF的锂离子电池SOC和SOE估算
12
作者 朱锦 李珊珊 张阿香 《电池》 北大核心 2025年第3期456-462,共7页
电荷状态(SOC)和能量状态(SOE)估算有助于延长锂离子电池的电池寿命和确保系统可靠性。提出一种双自适应无迹卡尔曼滤波(DAUKF)算法,同时估算SOC和SOE,在动态应力测试(DST)动态驾驶曲线、US06动态驾驶曲线和联邦城市驾驶时间表(FUDS)动... 电荷状态(SOC)和能量状态(SOE)估算有助于延长锂离子电池的电池寿命和确保系统可靠性。提出一种双自适应无迹卡尔曼滤波(DAUKF)算法,同时估算SOC和SOE,在动态应力测试(DST)动态驾驶曲线、US06动态驾驶曲线和联邦城市驾驶时间表(FUDS)动态驾驶曲线下,进行验证。DAUKF算法能准确估算SOC和SOE,SOC的均方根误差(RMSE)分别为0.07%、0.29%和0.31%,SOE的RMSE分别为0.07%、0.30%和0.31%。与自适应无迹卡尔曼滤波(AUKF)算法相比,DAUKF算法在估计精度上表现更优。 展开更多
关键词 锂离子电池 双自适应无迹卡尔曼滤波(DAUKF)算法 状态估计 电荷状态(SOC) 能量状态(SOE)
在线阅读 下载PDF
基于ITSA的太阳电池模型参数辨识
13
作者 郭欣欣 江朝阳 +2 位作者 王众 王陈 夏天瑞 《太阳能学报》 北大核心 2025年第7期577-581,共5页
鉴于传统的太阳电池等效电路参数辨识方法存在结构复杂、辨识精度不高、鲁棒性不强等问题,提出一种基于改进树种算法(ITSA)的太阳电池等效电路参数辨识方法。引入随迭代次数自适应变化的搜索趋势,提升算法的局部最优收敛能力和全局搜索... 鉴于传统的太阳电池等效电路参数辨识方法存在结构复杂、辨识精度不高、鲁棒性不强等问题,提出一种基于改进树种算法(ITSA)的太阳电池等效电路参数辨识方法。引入随迭代次数自适应变化的搜索趋势,提升算法的局部最优收敛能力和全局搜索能力;用自适应步长因子替代算法随机步长因子,加快算法后期寻优迭代速度,缩短寻优时间。将改进的树种算法用于双二极管太阳电池等效电路模型参数辨识,与其他算法对比,该方法所得电流均方根误差最小,预测数据与测量数据拟合程度高,表明改进的树种算法能有效地对太阳电池等效电路参数进行辨识,具有较高的辨识精度和收敛性,便于工程应用。 展开更多
关键词 参数辨识 太阳电池 双二极管模型 改进树种算法 自适应步长因子
在线阅读 下载PDF
超长指令字DSP上的多方向Sobel算法实现与优化
14
作者 唐俊龙 段美竹 时洋 《湖南大学学报(自然科学版)》 北大核心 2025年第8期130-139,共10页
VLIW(very long instruction word)架构的DSP在图像处理和计算机视觉等实时性应用场景得到广泛应用,高并行性的多方向Sobel算法是这些应用领域的重要算法之一,面向VLIW DSP实现和优化多方向Sobel算法具有重要意义.本文提出了基于VLIW的... VLIW(very long instruction word)架构的DSP在图像处理和计算机视觉等实时性应用场景得到广泛应用,高并行性的多方向Sobel算法是这些应用领域的重要算法之一,面向VLIW DSP实现和优化多方向Sobel算法具有重要意义.本文提出了基于VLIW的数据重排Im2col(image to column)加矩阵乘GEMM(general matrix multiplication)优化卷积计算的方法,并采用DMA(direct memory access)双缓冲机制实现数据传输与内核计算的并行,减少了等待数据传输的时间开销,使用该方法在FT-Matrix DSP上实现并优化了多方向Sobel算法.实验结果显示,优化后的算法相比于OpenCV图像库中算法,实现了4.96~8.76倍的加速;比TMS320C6678处理器提升了3.26~6.60倍.这些结果表明,采用VLIW架构的DSP在密集型数据处理方面具有显著优势,在VLIW DSP上实现与优化的图像检测算法具有广阔应用前景. 展开更多
关键词 超长指令字(VLIW) 多方向Sobel算法 数据重排 矩阵乘 DMA双缓冲
在线阅读 下载PDF
基于双层交互Q学习算法的轴承生产智能排程 被引量:1
15
作者 裴志杰 杨晓英 +1 位作者 杨欣 杨逢海 《机电工程》 北大核心 2025年第3期451-462,共12页
针对带装配的两阶段分布式混合流水车间(TSDHFSSP)环境下的轴承排程问题,提出了一种基于双层交互Q学习算法(DIQLA)的车间调度方法,以解决轴承生产智能排程问题。首先,描述了轴承的排程问题,建立了以最小化最大完工时间为目标的数学模型... 针对带装配的两阶段分布式混合流水车间(TSDHFSSP)环境下的轴承排程问题,提出了一种基于双层交互Q学习算法(DIQLA)的车间调度方法,以解决轴承生产智能排程问题。首先,描述了轴承的排程问题,建立了以最小化最大完工时间为目标的数学模型;然后,引入马尔科夫决策过程(MDP),模拟了轴承生产排程过程,根据两阶段生产过程,搭建了双智能体交互的Q学习模型,接着对两阶段的的智能体进行了建模,设计了双智能体的状态变量、调度规则动作集和即时奖励函数,改进了传统的贪婪搜索策略,提出了两阶段联合排程算法;最后,利用实例数据对该算法进行了仿真验证,将其与单一智能体Q学习算法(QL)及非支配遗传算法(NSGA-II)、带精英策略的改进的鲸鱼优化算法(IWOA)等算法进行了对比,先在同一算例下验证了该算法的有效性,再通过对比不同订单算例,验证了该算法的性能,并利用实例数据再次验证了该算法在两阶段排程的应用效果。研究结果表明:两阶段联合排程算法在解决轴承排程问题时具有可行性,在优化轴承生产排程方面上具有较好的效果;在实际的应用中,与原有人工排产相比,其产品的加工周期平均缩减了17%,订单交付率平均提升了9%。该方法为轴承制造类企业生产排程提供了一种智能化的方案。 展开更多
关键词 轴承生产 车间调度方法 智能排程 两阶段分布式混合流水车间 Q学习 双层交互 两阶段联合排程算法
在线阅读 下载PDF
基于双深度Q网络算法的无人机辅助密集网络资源优化策略
16
作者 陈佳美 孙慧雯 +2 位作者 李玉峰 王宇鹏 别玉霞 《电子与信息学报》 北大核心 2025年第8期2621-2629,共9页
为顺应未来网络向密集化与空间化方向的发展趋势,该文提出构建一种多基站共存的空地结合超密集复杂网络,并开发半分布式方案以优化网络资源。首先,建立包括宏基站、微基站和无人机(UAV)空中基站在内的多种基站共存的超密集复杂网络构架... 为顺应未来网络向密集化与空间化方向的发展趋势,该文提出构建一种多基站共存的空地结合超密集复杂网络,并开发半分布式方案以优化网络资源。首先,建立包括宏基站、微基站和无人机(UAV)空中基站在内的多种基站共存的超密集复杂网络构架。在此基础上,针对传统完全集中式方案存在的计算负担重、响应速度慢以及分布式方案缺乏全局优化视角等问题,提出一种半分布式的双深度Q网络(DDQN)功率控制方案。该方案旨在优化网络能效,通过分布式决策与集中训练相结合的方式,有效平衡了计算复杂度和性能优化。具体而言,半分布式方案利用DDQN算法在基站侧进行分布式决策,同时引入集中式网络训练器以确保整体网络的能效最优。仿真结果表明,所提出的半分布式DDQN方案能够很好地适应密集复杂网络结构,与传统深度Q网络(DQN)相比,在能效和总吞吐量方面均取得了显著提升。 展开更多
关键词 空地密集网络 半分布式 双深度Q网络算法 资源优化
在线阅读 下载PDF
基于K-means++算法与YDSE算法的多农机协同优化
17
作者 彭汪忆楠 赖惠成 +1 位作者 于逸然 张过 《计算机应用研究》 北大核心 2025年第5期1453-1461,共9页
针对农业生产中农机磨损问题常被忽视,导致任务分配和路径规划不合理的问题,提出一种高效的任务分配与路径规划算法,基于磨损感知的多农机协同优化方法(wear-aware multi-machine collaborative optimization method,WAMMCO),以提高农... 针对农业生产中农机磨损问题常被忽视,导致任务分配和路径规划不合理的问题,提出一种高效的任务分配与路径规划算法,基于磨损感知的多农机协同优化方法(wear-aware multi-machine collaborative optimization method,WAMMCO),以提高农业生产效率。首先,开发了一种融合荷兰式拍卖机制和惩罚因子机制的改进K-means++算法,并引入偏置处理,以实现农机工作负荷的均衡分配;其次,基于杨氏双缝实验(YDSE)原理,设计了一种元启发式算法,该算法结合离散化处理和多扰动策略,以优化农机作业路径并寻找最短作业路径;最后,结合贪心算法(GA)和农机的实际磨损情况,实现了农机的高效分配。仿真实验结果表明,在任务分配阶段,该算法比相同偏置约束下的constrained-balanced K-means++算法具有更快的运算速度;在路径规划阶段,与ACO、GWO、BWO、HO等算法相比,该算法在寻找全局最优解和收敛时间上表现更优;在农机分配阶段,不同农机数量下,该算法展现出其可行性、有效性和合理性,为农业生产智能化管理提供了新的技术支持,显著提升了农机作业的综合性能。 展开更多
关键词 农业机械 K-means++算法 杨氏双缝实验算法 贪心算法 农机磨损
在线阅读 下载PDF
中国区域基于PPP与双差网解法的GNSS水汽反演精度分析
18
作者 罗晋 曹云昌 +4 位作者 徐八林 梁宏 周凌昊 王乙竹 梁静舒 《高原气象》 北大核心 2025年第4期1034-1045,共12页
利用中国区域2023年夏季945个地基全球导航卫星系统(GNSS)测站的观测数据,分别采用双差网解法与精密单点定位法(Precise Point Positioning,PPP)对大气可降水量(Precipitable Water Vapor,PWV)进行了反演,以同址探空站和ERA5再分析资料... 利用中国区域2023年夏季945个地基全球导航卫星系统(GNSS)测站的观测数据,分别采用双差网解法与精密单点定位法(Precise Point Positioning,PPP)对大气可降水量(Precipitable Water Vapor,PWV)进行了反演,以同址探空站和ERA5再分析资料的PWV为参考值,研究分析了两种方法在中国不同气候区域反演PWV的精度及稳定性特征。结果表明:与PPP解相比,双差解与探空和ERA5资料的PWV的相关性更强,偏差(Bias)频率分布更集中,峰值区概率更高,偏差范围更小。以探空资料获取的RS-PWV为参考值时,双差解与PPP解的平均Bias分别为-0.1 mm和1.1 mm,平均均方根误差(RMSE)分别为2.4 mm和3.1 mm,以ERA5-PWV为参考值时,双差解与PPP解的平均Bias分别为-0.2 mm和0.1 mm,平均RMSE分别为2.7 mm和3.2 mm,双差解的平均RMSE均小于3 mm,这表明双差网解法反演的PWV具有更高的精度和稳定性。GNSS探测水汽的精度总体表现为西部非季风区优于东部季风区,双差解在各气候区域的RMSE都更集中于中位数附近,而PPP解在不同测站多表现出不同的精度水平,在水汽充足且探测精度偏低的温带和亚热带季风气候区域精度离散程度较大,具有较强的不稳定性。 展开更多
关键词 GNSS 双差网解 精密单点定位 大气可降水量 精度分析
在线阅读 下载PDF
集装箱码头同贝同步装卸作业的资源配置与调度优化
19
作者 范忠浪 曾艳 刘旺盛 《上海海事大学学报》 北大核心 2025年第1期33-43,59,共12页
为提升集装箱码头作业效率并降低能耗,考虑同贝同步装卸模式下岸桥装卸、集卡运输、堆场存取三个环节,构建两阶段资源配置与调度模型。第一阶段,根据船舶配载计划,考虑岸桥的闲置成本,运用启发式算法得到岸桥作业各贝位的路线与顺序;第... 为提升集装箱码头作业效率并降低能耗,考虑同贝同步装卸模式下岸桥装卸、集卡运输、堆场存取三个环节,构建两阶段资源配置与调度模型。第一阶段,根据船舶配载计划,考虑岸桥的闲置成本,运用启发式算法得到岸桥作业各贝位的路线与顺序;第二阶段,着眼于堆场平行堆存布局,在集卡水平运输中采用贪婪原则(先近后远)进行集装箱位置分配,并设计改进的鲸鱼优化算法求得集卡最优配置和作业序列。通过Flexterm仿真及多算法对比,验证了所提模型和算法的有效性,结果表明改进算法能显著减少能耗与成本,为码头多资源调度提供实践参考。 展开更多
关键词 集装箱码头 同贝同步装卸 资源配置与调度 箱区分配 改进鲸鱼优化算法
在线阅读 下载PDF
基于双Q学习的温差发电系统电压动态补偿
20
作者 张子健 杨博 +2 位作者 李鸿彪 郜登科 陆海 《电网技术》 北大核心 2025年第8期3354-3361,I0097-I0104,共16页
针对温差发电系统在非均匀温度条件下的输出功率下降问题,提出了一种基于双Q学习的温差发电系统电压动态补偿方法。通过引入双Q学习机制和自适应探索率与学习率设计,有效降低了传统Q学习算法因Q值高估导致效率下降的问题,同时结合启发... 针对温差发电系统在非均匀温度条件下的输出功率下降问题,提出了一种基于双Q学习的温差发电系统电压动态补偿方法。通过引入双Q学习机制和自适应探索率与学习率设计,有效降低了传统Q学习算法因Q值高估导致效率下降的问题,同时结合启发式动作策略提升了搜索效率,使算法能够更准确地找到最优电压补偿方案。在10×15模型的仿真中,双Q学习算法在对角线、外部、内部及随机4种温差分布条件下,分别实现了43.00、62.29、47.59和58.89W的功率提升,相比初始功率提升了8.11%~15.79%。在15×15模型中,双Q学习算法在上述4种条件下分别提升了59.97、48.69、59.18和73.22W,功率提升幅度达6.26%~11.38%。所有仿真均通过MATLAB/Simulink及SimuNPS软件实现。仿真结果表明,该方法在多种温差条件下显著提高了发电效率,且优于其他对比算法及动态重构方法。 展开更多
关键词 温差发电 电压补偿 双Q学习 不均匀温度分布 SimuNPS
在线阅读 下载PDF
上一页 1 2 46 下一页 到第
使用帮助 返回顶部