检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到2篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

一种新的基于Sigmoid函数的分布式深度Q网络概率分布更新策略被引量：1: 1; 作者高卓凡郭文利《计算机科学》 CSCD 北大核心 2024年第12期277-285,共9页; 分布式深度Q网络(Distributed-Deep Q Network,Dist-DQN)是在传统期望值深度Q网络的基础上将离散的动作奖励在一个区间上连续化,通过不断更新支集区间的概率分布来解决复杂环境的随机奖励问题。奖励概率的分布更新策略作为Dist-DQN实现... 展开更多; 关键词分布式深度q网络奖励区间连续化概率分布更新学习效率训练稳定性; 在线阅读下载PDF 职称材料

基于位置预测模型的空天地一体化网络切换算法被引量：1: 2; 作者谢健骊陈龙 +1 位作者张泽鹏李翠然《通信学报》 CSCD 北大核心 2024年第12期162-178,共17页; 针对6G空天地一体化网络(SAGIN)中网络环境动态变化和用户终端移动性增强导致的终端切换频繁、网络负载不均衡问题,提出了一种基于终端位置预测模型的SAGIN切换算法。该算法构建了基于麻雀搜索策略优化的长短期记忆(LSTM)网络终端位置... 展开更多; 关键词空天地一体化网络网络切换效用函数长短期记忆网络分布式深度q网络; 在线阅读下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部