-
题名基于改进双重深度Q网络的入侵检测模型
被引量:3
- 1
-
-
作者
吴亚丽
王君虎
郑帅龙
-
机构
西安理工大学自动化与信息工程学院
陕西省复杂系统控制与智能信息处理重点实验室
-
出处
《计算机工程与应用》
CSCD
北大核心
2022年第16期102-110,共9页
-
基金
国家重点研发计划(2018YFB1703000)
陕西重点研发计划(2020ZDLGR07-06)。
-
文摘
入侵检测技术作为网络安全有效的防御手段,是网络安全体系中的重要组成部分。随着互联网的快速发展,网络数据量快速增加,网络攻击更加趋于复杂化和多元化,目前主流的入侵检测技术无法有效识别各种攻击。针对实际网络环境中正常流量和攻击流量数据不平衡,且对攻击类流量检测率低的问题,基于深度强化学习提出一种基于改进双重深度Q网络的CBL_DDQN网络入侵检测模型。该模型将一维卷积神经网络和双向长短期记忆网络的混合网络模型引入深度强化学习的DDQN框架,并使用深度强化学习中的反馈学习和策略生成机制训练智能体来对不同类别的攻击样本进行分类,在一定程度上减弱了训练模型过程中对数据标签的依赖性。采用Borderline-SMOTE算法降低数据的不平衡度,从而提高稀有攻击的检测率。通过NSL_KDD和UNSW_NB15数据集对模型的性能进行评估,结果表明:该模型在准确率、精确率、召回率这三项指标上均取得了良好的结果,检测效果远优于Adam-BNDNN、KNN、SVM等检测方法,是一种高效的网络入侵检测模型。
-
关键词
入侵检测
深度强化学习
双重深度q网络
卷积神经网络(CNN)
长短期记忆网络(LSTM)
-
Keywords
intrusion detection
deep reinforcement learning
double deep q-network
convolutional neural network(CNN)
long short-term memory network(LSTM)
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名基于强化学习的超启发算法求解有容量车辆路径问题
被引量:15
- 2
-
-
作者
张景玲
冯勤炳
赵燕伟
刘金龙
冷龙龙
-
机构
浙江工业大学特种装备制造与先进加工技术教育部重点实验室
-
出处
《计算机集成制造系统》
EI
CSCD
北大核心
2020年第4期1118-1129,共12页
-
基金
国家自然科学基金资助项目(61402409)
浙江省自然科学基金资助项目(LY19F030017)。
-
文摘
为了更高效地求解物流优化领域中的有容量车辆路径问题,减少陷入局部最优的情况,提出一种基于强化学习的超启发算法。设计了算法的高层启发式策略,包括选择策略和解的接受准则:基于学习机制,使用强化学习中的深度Q神经网络算法构造该算法的选择策略,对底层算子的性能进行奖惩评价;利用奖惩值以及模拟退火作为算法的接受准则,对优质解建立序列池,从而引导算法更有效地搜索解空间,并采用聚类思想提升初始解的质量。对有容量车辆问题的标准算例进行计算,并与其他算法对比,统计分析了最优值、误差率和平均值,实验结果表明了所提算法在该问题求解上的有效性和稳定性,总体求解效果优于对比算法。
-
关键词
车辆路径问题
强化学习
深度q神经网络
超启发算法
-
Keywords
vehicle routing problem
reinforcement learning
deep q neural network
hyper-heuristic algorithm
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
U116.2
[交通运输工程]
-
-
题名面向智能工厂多机器人定位的无线分布式协同决策
被引量:2
- 3
-
-
作者
张文璐
霍子龙
赵西雨
崔琪楣
陶小峰
-
机构
北京邮电大学信息与通信工程学院
-
出处
《无线电通信技术》
2022年第4期718-727,共10页
-
基金
国家自然科学基金区域创新发展联合基金(U21A20449)
国家自然科学基金(61941105)。
-
文摘
由于未来智能工厂中智能机器人的工作环境复杂多变,机器人进行协作定位时无法获知全局信道状态,其选择的标定节点可能被其他机器人占用,导致定位性能的波动较大,稳定性差。针对该问题,提出了基于双重深度超Q神经网络(DDHQN)的多机器人协同决策算法;首先将多机器人进行协作定位时的决策系统构建为竞争加合作模型,并通过奖励函数的设计鼓励机器人参与协作;为了避免机器人之间的决策冲突,引入表示机器人决策轨迹的记录空间以实现对其他机器人的行为预估,记录空间的内容依据机器人的无线感知结果进行迭代更新;最后,仿真证明了所提出的基于DDHQN的多机器人协同决策算法使得每个机器人能够以群体性能最大为目标进行独立学习,在一定的迭代次数后可以实现精准的行为预估,并收敛到稳定有效的决策方案。
-
关键词
双重深度超q神经网络(ddhqn)
多机器人协同
标定节点选择
决策轨迹
行为预估
无线感知
-
Keywords
Dual Deep Hyper-q Neural Network(ddhqn)
multi-robot cooperation
calibration node selection
decision trajectory
behavior prediction
wireless perception
-
分类号
TN929.5
[电子电信—通信与信息系统]
TP242
[自动化与计算机技术—检测技术与自动化装置]
-