检索结果-维普期刊中文期刊服务平台

基于改进双重深度Q网络的入侵检测模型被引量：3: 1; 作者吴亚丽王君虎郑帅龙《计算机工程与应用》 CSCD 北大核心 2022年第16期102-110,共9页; 入侵检测技术作为网络安全有效的防御手段,是网络安全体系中的重要组成部分。随着互联网的快速发展,网络数据量快速增加,网络攻击更加趋于复杂化和多元化,目前主流的入侵检测技术无法有效识别各种攻击。针对实际网络环境中正常流量和攻... 展开更多; 关键词入侵检测深度强化学习双重深度q网络卷积神经网络(CNN) 长短期记忆网络(LSTM); 在线阅读下载PDF 职称材料

基于课程式双重DQN的水下无人航行器路径规划被引量：3: 2; 作者王莹莹周佳加 +1 位作者高峰管凤旭《实验室研究与探索》 CAS 北大核心 2022年第3期244-248,共5页; 针对水下无人航行器路径规划中强化学习方法存在训练不稳定、时间长的弊端,提出了一种课程式双重深度Q学习网络(DQN)算法。该算法融合经验回放池技术,有效缩短了训练时间,并消除了Q学习网络引起的最大化偏差问题。同时,结合课程式学习... 展开更多; 关键词水下无人航行器路径规划双重深度q网络课程式学习; 在线阅读下载PDF 职称材料

基于文件工作流和强化学习的工程项目文件管理优化方法: 3; 作者司鹏搏庞睿 +2 位作者杨睿哲孙艳华李萌《北京工业大学学报》北大核心 2025年第10期1162-1170,共9页; 为了解决大型工程项目中文件的传输时间与成本问题,提出一个基于文件工作流的工程项目文件管理优化方法。首先,构建了工程项目文件管理环境和具有逻辑顺序的文件工作流模型,分析了文件的传输和缓存。在此基础上,将文件管理优化问题建模... 展开更多; 关键词文件工作流传输时间马尔可夫过程对抗式双重深度q网络(dueling double deep q network D3qN) 文件管理联合优化; 在线阅读下载PDF 职称材料

基于D3QN的无人机编队控制技术被引量：6: 4; 作者赵启甄子洋 +3 位作者龚华军曹红波李荣刘继承《北京航空航天大学学报》 EI CAS CSCD 北大核心 2023年第8期2137-2146,共10页; 针对无人机编队中控制器设计需要基于模型信息,以及无人机智能化程度低等问题,采用深度强化学习解决编队控制问题。针对编队控制问题设计对应强化学习要素,并设计基于深度强化学习对偶双重深度Q网络(D3QN)算法的编队控制器,同时提出一... 展开更多; 关键词无人机编队编队控制深度强化学习深度q网络对偶双重深度q网络; 在线阅读下载PDF 职称材料

基于引导Minimax-DDQN的无人机空战机动决策被引量：7: 5; 作者王昱任田君范子琳《计算机应用》 CSCD 北大核心 2023年第8期2636-2643,共8页; 针对无人机(UAV)空战环境信息复杂、对抗性强所导致的敌机机动策略难以预测,以及作战胜率不高的问题,设计了一种引导Minimax-DDQN(Minimax-Double Deep Q-Network)算法。首先,在Minimax决策方法的基础上提出了一种引导式策略探索机制;然... 展开更多; 关键词无人机空战自主决策深度强化学习双重深度q网络多阶段训练; 在线阅读下载PDF 职称材料

面向智能工厂多机器人定位的无线分布式协同决策被引量：2: 6; 作者张文璐霍子龙 +2 位作者赵西雨崔琪楣陶小峰《无线电通信技术》 2022年第4期718-727,共10页; 由于未来智能工厂中智能机器人的工作环境复杂多变,机器人进行协作定位时无法获知全局信道状态,其选择的标定节点可能被其他机器人占用,导致定位性能的波动较大,稳定性差。针对该问题,提出了基于双重深度超Q神经网络(DDHQN)的多机器人... 展开更多; 关键词双重深度超q神经网络(DDHqN) 多机器人协同标定节点选择决策轨迹行为预估无线感知; 在线阅读下载PDF 职称材料

基于强化学习的六足机器人动态避障研究被引量：8: 7; 作者董星宇唐开强 +2 位作者傅汇乔留沧海蒋刚《传感器与微系统》 CSCD 北大核心 2022年第1期19-23,共5页; 针对局部可观测的非线性动态地震环境下,六足机器人采用传统算法进行动态避障时易出现算法不稳定的情况。运用了基于双重深度Q网络(DDQN)的决策方式,通过传感器数据输入卷积神经网络(CNN)并结合强化学习的策略,下达命令到六足机器人,控... 展开更多; 关键词双重深度q网络六足机器人动态避障传感器输入; 在线阅读下载PDF 职称材料

题名基于改进双重深度Q网络的入侵检测模型被引量：3: 1; 作者吴亚丽王君虎郑帅龙; 机构西安理工大学自动化与信息工程学院陕西省复杂系统控制与智能信息处理重点实验室; 出处《计算机工程与应用》 CSCD 北大核心 2022年第16期102-110,共9页; 基金国家重点研发计划(2018YFB1703000) 陕西重点研发计划(2020ZDLGR07-06)。; 文摘入侵检测技术作为网络安全有效的防御手段,是网络安全体系中的重要组成部分。随着互联网的快速发展,网络数据量快速增加,网络攻击更加趋于复杂化和多元化,目前主流的入侵检测技术无法有效识别各种攻击。针对实际网络环境中正常流量和攻击流量数据不平衡,且对攻击类流量检测率低的问题,基于深度强化学习提出一种基于改进双重深度Q网络的CBL_DDQN网络入侵检测模型。该模型将一维卷积神经网络和双向长短期记忆网络的混合网络模型引入深度强化学习的DDQN框架,并使用深度强化学习中的反馈学习和策略生成机制训练智能体来对不同类别的攻击样本进行分类,在一定程度上减弱了训练模型过程中对数据标签的依赖性。采用Borderline-SMOTE算法降低数据的不平衡度,从而提高稀有攻击的检测率。通过NSL_KDD和UNSW_NB15数据集对模型的性能进行评估,结果表明:该模型在准确率、精确率、召回率这三项指标上均取得了良好的结果,检测效果远优于Adam-BNDNN、KNN、SVM等检测方法,是一种高效的网络入侵检测模型。; 关键词入侵检测深度强化学习双重深度q网络卷积神经网络(CNN) 长短期记忆网络(LSTM); Keywords intrusion detection deep reinforcement learning double deep q-network convolutional neural network(CNN) long short-term memory network(LSTM); 分类号 TP393 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名基于课程式双重DQN的水下无人航行器路径规划被引量：3: 2; 作者王莹莹周佳加高峰管凤旭; 机构哈尔滨工程大学智能科学与工程学院; 出处《实验室研究与探索》 CAS 北大核心 2022年第3期244-248,共5页; 基金国家自然科学基金项目(51609048,62071138) 哈尔滨工程大学本科教学改革研究项目(JG2019B11)。; 文摘针对水下无人航行器路径规划中强化学习方法存在训练不稳定、时间长的弊端,提出了一种课程式双重深度Q学习网络(DQN)算法。该算法融合经验回放池技术,有效缩短了训练时间,并消除了Q学习网络引起的最大化偏差问题。同时,结合课程式学习改进双重DQN算法,加快了学习收敛速度。通过静态、动态障碍物环境的水下无人航行器路径规划仿真结果表明,所提出的课程式双重DQN算法可行、有效。该实验仿真研究可培养学生开展独立科学研究的能力。; 关键词水下无人航行器路径规划双重深度q网络课程式学习; Keywords unmanned underwater vehicle(UUV) path planning double deep q network curriculum learning; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名基于文件工作流和强化学习的工程项目文件管理优化方法: 3; 作者司鹏搏庞睿杨睿哲孙艳华李萌; 机构北京工业大学信息学部北京工业大学信息与通信工程学院; 出处《北京工业大学学报》北大核心 2025年第10期1162-1170,共9页; 基金国家自然科学基金资助项目(62171062) 北京市教育委员会科技计划资助项目(KM202110005021)。; 文摘为了解决大型工程项目中文件的传输时间与成本问题,提出一个基于文件工作流的工程项目文件管理优化方法。首先,构建了工程项目文件管理环境和具有逻辑顺序的文件工作流模型,分析了文件的传输和缓存。在此基础上,将文件管理优化问题建模为马尔可夫过程,通过设计状态空间、动作空间及奖励函数等实现文件工作流的任务完成时间与缓存成本的联合优化。其次,采用对抗式双重深度Q网络(dueling double deep Q network,D3QN)来降低训练时间,提高训练效率。仿真结果验证了提出方案在不同参数配置下文件传输的有效性,并且在任务体量增大时仍能保持较好的优化能力。; 关键词文件工作流传输时间马尔可夫过程对抗式双重深度q网络(dueling double deep q network D3qN) 文件管理联合优化; Keywords file workflow transmission time Markov process dueling double deep q network(D3qN) file management joint optimization; 分类号 TN915 [电子电信—通信与信息系统] TP393 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名基于D3QN的无人机编队控制技术被引量：6: 4; 作者赵启甄子洋龚华军曹红波李荣刘继承; 机构南京航空航天大学自动化学院; 出处《北京航空航天大学学报》 EI CAS CSCD 北大核心 2023年第8期2137-2146,共10页; 基金国家自然科学基金(61973158) 南京航空航天大学研究生创新基地(实验室)开放基金项目(kfjj20200310,kfjj20200311)。; 文摘针对无人机编队中控制器设计需要基于模型信息,以及无人机智能化程度低等问题,采用深度强化学习解决编队控制问题。针对编队控制问题设计对应强化学习要素,并设计基于深度强化学习对偶双重深度Q网络(D3QN)算法的编队控制器,同时提出一种优先选择策略与多层动作库结合的方法,加快算法收敛速度并使僚机最终能够保持到期望距离。通过仿真将设计的控制器与PID控制器、Backstepping控制器对比,验证D3QN控制器的有效性。仿真结果表明:该控制器可应用于无人机编队,提高僚机智能化程度,自主学习保持到期望距离,且控制器设计无需模型精确信息,为无人机编队智能化控制提供了依据与参考。; 关键词无人机编队编队控制深度强化学习深度q网络对偶双重深度q网络; Keywords UAV formation formation control deep reinforcement learning deep q-network dueling double deep q-network; 分类号 V249.1 [航空宇航科学与技术—飞行器设计]; 在线阅读下载PDF 职称材料

题名基于引导Minimax-DDQN的无人机空战机动决策被引量：7: 5; 作者王昱任田君范子琳; 机构沈阳航空航天大学自动化学院; 出处《计算机应用》 CSCD 北大核心 2023年第8期2636-2643,共8页; 基金国家自然科学基金资助项目(61906125) 辽宁省教育厅科学研究经费资助项目(LJKZ0222)。; 文摘针对无人机(UAV)空战环境信息复杂、对抗性强所导致的敌机机动策略难以预测,以及作战胜率不高的问题,设计了一种引导Minimax-DDQN(Minimax-Double Deep Q-Network)算法。首先,在Minimax决策方法的基础上提出了一种引导式策略探索机制;然后,结合引导Minimax策略,以提升Q网络更新效率为出发点设计了一种DDQN(Double Deep Q-Network)算法;最后,提出进阶式三阶段的网络训练方法,通过不同决策模型间的对抗训练,获取更为优化的决策模型。实验结果表明,相较于Minimax-DQN(Minimax-DQN)、Minimax-DDQN等算法,所提算法追击直线目标的成功率提升了14%~60%,并且与DDQN算法的对抗胜率不低于60%。可见,与DDQN、Minimax-DDQN等算法相比,所提算法在高对抗的作战环境中具有更强的决策能力,适应性更好。; 关键词无人机空战自主决策深度强化学习双重深度q网络多阶段训练; Keywords Unmanned Aerial Vehicle(UAV)air combat autonomous decision-making deep reinforcement learning Double Deep q-Network(DDqN) multi-stage training; 分类号 V279 [航空宇航科学与技术—飞行器设计]; 在线阅读下载PDF 职称材料

题名面向智能工厂多机器人定位的无线分布式协同决策被引量：2: 6; 作者张文璐霍子龙赵西雨崔琪楣陶小峰; 机构北京邮电大学信息与通信工程学院; 出处《无线电通信技术》 2022年第4期718-727,共10页; 基金国家自然科学基金区域创新发展联合基金(U21A20449) 国家自然科学基金(61941105)。; 文摘由于未来智能工厂中智能机器人的工作环境复杂多变,机器人进行协作定位时无法获知全局信道状态,其选择的标定节点可能被其他机器人占用,导致定位性能的波动较大,稳定性差。针对该问题,提出了基于双重深度超Q神经网络(DDHQN)的多机器人协同决策算法;首先将多机器人进行协作定位时的决策系统构建为竞争加合作模型,并通过奖励函数的设计鼓励机器人参与协作;为了避免机器人之间的决策冲突,引入表示机器人决策轨迹的记录空间以实现对其他机器人的行为预估,记录空间的内容依据机器人的无线感知结果进行迭代更新;最后,仿真证明了所提出的基于DDHQN的多机器人协同决策算法使得每个机器人能够以群体性能最大为目标进行独立学习,在一定的迭代次数后可以实现精准的行为预估,并收敛到稳定有效的决策方案。; 关键词双重深度超q神经网络(DDHqN) 多机器人协同标定节点选择决策轨迹行为预估无线感知; Keywords Dual Deep Hyper-q Neural Network(DDHqN) multi-robot cooperation calibration node selection decision trajectory behavior prediction wireless perception; 分类号 TN929.5 [电子电信—通信与信息系统] TP242 [自动化与计算机技术—检测技术与自动化装置]; 在线阅读下载PDF 职称材料

题名基于强化学习的六足机器人动态避障研究被引量：8: 7; 作者董星宇唐开强傅汇乔留沧海蒋刚; 机构西南科技大学制造科学与工程学院南京大学工程管理学院控制与系统工程系制造过程测试技术省部共建教育部重点实验室成都理工大学核技术与自动化工程学院; 出处《传感器与微系统》 CSCD 北大核心 2022年第1期19-23,共5页; 基金四川省重大科技专项资助项目(2020ZDZX0019) 四川省科技厅重点研发计划资助项目(19ZDYF1083)。; 文摘针对局部可观测的非线性动态地震环境下,六足机器人采用传统算法进行动态避障时易出现算法不稳定的情况。运用了基于双重深度Q网络(DDQN)的决策方式,通过传感器数据输入卷积神经网络(CNN)并结合强化学习的策略,下达命令到六足机器人,控制输出决策动作,实现机器人动态避障。将系统的环境反馈与决策控制直接形成闭环,通过最大化机器人与避障环境交互产生的累计奖励回报,更新神经网络权重,形成最优决策策略。通过六足机器人平台实验结果证明:此方法能较好地减少传统深度强化学习算法容易导致过度估计状态动作值和损失函数难以收敛的风险;并且提高了六足机器人进行动态避障的效率和稳定性。; 关键词双重深度q网络六足机器人动态避障传感器输入; Keywords double deep q-network(DDqN) hexapod robot dynamic obstacle avoidance sensor input; 分类号 TP242.6 [自动化与计算机技术—检测技术与自动化装置] TP212 [自动化与计算机技术—检测技术与自动化装置]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	基于改进双重深度Q网络的入侵检测模型	吴亚丽王君虎郑帅龙	《计算机工程与应用》 CSCD 北大核心	2022	3	在线阅读下载PDF 职称材料
2	基于课程式双重DQN的水下无人航行器路径规划	王莹莹周佳加高峰管凤旭	《实验室研究与探索》 CAS 北大核心	2022	3	在线阅读下载PDF 职称材料
3	基于文件工作流和强化学习的工程项目文件管理优化方法	司鹏搏庞睿杨睿哲孙艳华李萌	《北京工业大学学报》北大核心	2025	0	在线阅读下载PDF 职称材料
4	基于D3QN的无人机编队控制技术	赵启甄子洋龚华军曹红波李荣刘继承	《北京航空航天大学学报》 EI CAS CSCD 北大核心	2023	6	在线阅读下载PDF 职称材料
5	基于引导Minimax-DDQN的无人机空战机动决策	王昱任田君范子琳	《计算机应用》 CSCD 北大核心	2023	7	在线阅读下载PDF 职称材料
6	面向智能工厂多机器人定位的无线分布式协同决策	张文璐霍子龙赵西雨崔琪楣陶小峰	《无线电通信技术》	2022	2	在线阅读下载PDF 职称材料
7	基于强化学习的六足机器人动态避障研究	董星宇唐开强傅汇乔留沧海蒋刚	《传感器与微系统》 CSCD 北大核心	2022	8	在线阅读下载PDF 职称材料