基于深度自编码和决策树的恶意域名检测被引量：7

Malicious domain name detection based on deep auto-encoder and decision tree

在线阅读下载PDF

导出

摘要针对目前恶意域名检测方法特征提取过程复杂和检测准确率不高的问题,提出一种基于深度自编码和决策树(Deep Auto Encoder and Decision Tree, DAE-DT)的恶意域名检测算法.该算法首先将每一域名按照域名词法组成与结构等属性进行特征映射,并进行正则化处理;然后将正则化处理后的无标签域名数据随机置0作为模型的输入,域名字符统计特征作为输出,构造深度自编码网络模型.并通过计算模型输出值与未处理数据之间的重构误差,实现各层参数与权值的优化,以增强模型的鲁棒性;最后依据提取的域名字符统计特征构造恶意域名判定的决策树.通过在Alexa和Malware domain list等标准数据集上进行测试.实验结果表明,该模型的检测准确率、精确率、假阴性率和假阳性率值分别为95.21%、94.17%、2.41%和3.63%. Aiming at the problem that the existing malicious domain name detection methods are not effective enough in performance of accuracy rate and the process of feature extraction, a malicious domain name detection algorithm based on deep auto-encoder and decision tree(DAE-DT) is proposed. According to lexical composition and structure of domain name, each domain name is firstly mapped into the feature space and it is normalized. Then the normalized unlabeled domain names are randomly set to 0 as the input of the model, and the statistical features of domain name are used to as the output to construct the deep auto-encoder network model, and the reconstruction error of the unprocessed data and output data is computed to achieve the purpose of optimizing the parameters and weights so that the model is more robust. Finally, a decision tree for malicious domain name detection is constructed based on the statistical features of domain name. In the experiments on Alexa and malware domain list, the proposed detection algorithm yield an accuracy rate of 95.21%, a precision rate of 94.17%, a false negative rate of 2.41%, and a false positive rate of 3.63%.

作者赵宏常兆斌王伟杰 ZHAO Hong;CHANG Zhao-bin;WANG Wei-jie(School of Computer and Communication,Lanzhou University of Technology,Lanzhou 730050,China)

机构地区兰州理工大学计算机与通信学院

出处《微电子学与计算机》北大核心 2020年第5期13-17,共5页 Microelectronics & Computer

基金国家自然科学基金项目(51668043,61262016) 赛尔网络下一代互联网技术创新项目(NGII20160311,NGII20160112) 兰州理工大学学生科技创新基金(KC2019ZR016)。

关键词恶意域名检测深度自编码决策树域名统计特征重构误差 malicious domain name detection deep auto-encoder network decision tree statistical feature of domain name reconstruction error

分类号 TP393 [自动化与计算机技术—计算机应用技术]

作者简介赵宏,男,(1971-),博士,教授.研究方向为并行与分布式处理、自然语言处理、深度学习;通讯作者:常兆斌,男,(1995-),硕士研究生.研究方向为深度学习、空间网络安全、自然语言处理.E-mail:1510998508@qq.com;王伟杰,女,(1994-),博士研究生.研究方向为深度学习和语音识别.

引文网络
相关文献

参考文献3

1赵宏,常兆斌,王乐.基于词法特征的恶意域名快速检测算法[J].计算机应用,2019,39(1):227-231. 被引量：28
2丁红卫,万良,龙廷艳.深度自编码网络在入侵检测中的应用研究[J].哈尔滨工业大学学报,2019,51(5):185-194. 被引量：24
3朱俚治.基于决策树的病毒检测算法[J].计算机与数字工程,2015,43(6):1069-1072. 被引量：1

二级参考文献24

1卿斯汉,蒋建春,马恒太,文伟平,刘雪飞.入侵检测技术研究综述[J].通信学报,2004,25(7):19-29. 被引量：236
2洪龙,肖奚安,朱梧槚.中介真值程度的度量及其应用(I)[J].计算机学报,2006,29(12):2186-2193. 被引量：79
3陈友,程学旗,李洋,戴磊.基于特征选择的轻量级入侵检测系统[J].软件学报,2007,18(7):1639-1651. 被引量：78
4罗森林,马俊,潘丽敏编著.数据挖掘理论与技术[M].北京:电子工业出版社,2013.
5朱梧梗,肖奚安.数学基础与模糊数学基础[J].自然杂志,1984,10:723-726,800.
6Tom M.Mitchell著.机器学习[M].北京:机械工业出版社,2013.
7范自柱,徐勇,徐保根,朱旗.一种快速KMSE算法及其在异常入侵检测中的应用[J].哈尔滨工业大学学报,2011,43(3):90-94. 被引量：1
8周勇林,由林麟,张永铮.基于命名及解析行为特征的异常域名检测方法[J].计算机工程与应用,2011,47(20):50-52. 被引量：4
9赖瑞麟.计算机变形病毒发展剖析及解决策略[J].信息安全与技术,2012,3(2):41-42. 被引量：2
10刘爱江,黄长慧,胡光俊.基于改进神经网络算法的木马控制域名检测方法[J].电信科学,2014,30(7):39-42. 被引量：6

共引文献49

1周珮,周志平,王利,赵卫东.基于AutoEncoder和ResNet的网络入侵检测方法[J].计算机应用研究,2020,37(S02):224-226. 被引量：21
2赵宏,王乐,王伟杰.基于BiLSTM-CNN串行混合模型的文本情感分析[J].计算机应用,2020,40(1):16-22. 被引量：34
3杨彦荣,宋荣杰,周兆永.基于GAN-PSO-ELM的网络入侵检测方法[J].计算机工程与应用,2020,56(12):66-72. 被引量：27
4俞中华,杨晓东.基于深度自编码网络的网络安全态势感知与预警机制[J].广播电视网络,2020,27(6):63-65. 被引量：3
5朱怡,宁振虎,周艺华.基于视觉特征的仿冒域名轻量级检测技术[J].计算机应用,2020,40(8):2279-2285. 被引量：1
6孙世岩,张钢,田福庆,梁伟阁.多输入混合深度学习网络的健康因子构建方法[J].系统工程与电子技术,2020,42(10):2390-2398. 被引量：7
7云大维.基于深度自编码网络的高校招生咨询算法分析[J].信息与电脑,2020,32(18):49-51.
8刘全明,李尹楠,郭婷,李岩纬.基于Borderline-SMOTE和双Attention的入侵检测方法[J].计算机科学,2021,48(3):327-332. 被引量：6
9刘伯成,王浩宇,李向军,肖聚鑫,肖楚霁,孔珂.基于Deep-IndRNN的DGA域名检测方法[J].南昌大学学报（理科版）,2020,44(6):598-609. 被引量：2
10高德平.考虑样本数据重复性的通信信息冗余数据检测算法[J].微型电脑应用,2021,37(6):205-208. 被引量：2

同被引文献72

1殷君茹,侯瑞霞,唐小明,罗鹏.基于瓦片金字塔模型的海量空间数据快速分发方法[J].吉林大学学报（理学版）,2015,53(6):1269-1274. 被引量：8
2王文霞.数据挖掘中改进的C4.5决策树分类算法[J].吉林大学学报（理学版）,2017,55(5):1274-1277. 被引量：25
3周梦源,常鹏,张永铮.互联网下多元属性特征恶意停靠域名检测仿真[J].计算机仿真,2018,35(2):406-409. 被引量：2
4黄凯,傅建明,黄坚伟,李鹏伟.一种基于字符及解析特征的恶意域名检测方法[J].计算机仿真,2018,35(3):287-292. 被引量：9
5杨先圣,姜磊,彭雄,周倩,刘菊君.基于大数据的异常检测方法研究[J].计算机工程与科学,2018,40(7):1180-1186. 被引量：22
6臧小东,龚俭,胡晓艳.基于AGD的恶意域名检测[J].通信学报,2018,39(7):15-25. 被引量：22
7徐东,王岩俊,孟宇龙,张子迎.基于Isolation Forest改进的数据异常检测方法[J].计算机科学,2018,45(10):155-159. 被引量：28
8刘延飞,何燕辉,张薇,崔智高.基于异常值检测的KCF目标丢失预警方法研究[J].计算机工程与应用,2018,54(22):216-222. 被引量：15
9罗玲.采用随机Petri网的嵌入式机载软件可靠性检测[J].计算机工程与应用,2019,55(1):233-240. 被引量：6
10朱昌敏,岳东.一种基于Spark模型的电力异常数据检测方法[J].计算机技术与发展,2019,29(1):140-144. 被引量：15

引证文献7

1孙小雪,钟辉,陈海鹏.基于决策树分类技术的学生考试成绩统计分析系统[J].吉林大学学报（工学版）,2021,51(5):1866-1872. 被引量：11
2陈晓飞,姚翔,贾勇.云存储网络映射密文搜索的恶意域名检测仿真[J].计算机仿真,2021,38(11):399-403. 被引量：1
3张晓琴,汪云飞.基于属性基加密的恶意域名训练异常数据检测[J].信息技术,2022,46(3):90-95.
4高宁康,王小英,梁嘉烨.基于随机森林和深度神经网络的恶意域名检测方法[J].科学技术创新,2023(11):115-118. 被引量：1
5卢加奇,吕广旭,魏先燕,冯燕茹,王小英.基于优化CS-SVM算法的DGA域名检测研究[J].现代信息科技,2023,7(11):77-79. 被引量：3
6白雯.基于决策树的英文翻译软件缺陷检测方法[J].自动化技术与应用,2023,42(12):108-111. 被引量：3
7徐红泉,金琦,娄冰,孙志华.基于协同注意力的多家族恶意域名入侵检测[J].信息安全研究,2024,10(12):1115-1121.

二级引证文献19

1焦自权,杨丽君,冯志强,韩鑫,吕娜,覃海俭,黎欣,袁浩.基于粗糙-模糊软计算建模技术的船海类专业实践课程教育改革研究[J].课程教育研究,2021(17):192-193.
2陈丹萍.网络时代统计技术的变革及其影响探微[J].科技创新导报,2022,19(3):69-71.
3谢加良,陈艳玲,朱荣坤,宾红华,李凤.基于改进Apriori算法的线性代数试卷分析[J].长春师范大学学报,2022,41(12):48-54. 被引量：2
4吴静.基于改进随机森林的苹果分类系统设计[J].陇东学院学报,2023,34(2):50-56. 被引量：1
5肖艳.《误差理论与测量平差基础》课程成绩分析[J].地理空间信息,2023,21(7):134-137.
6张文娟,张彬,杨皓哲.基于双注意力机制的成绩预测[J].南京师大学报（自然科学版）,2023,46(4):103-113. 被引量：2
7齐润泉.基于卷积神经网络的智能化考试系统设计[J].信息技术,2024,48(1):158-162.
8翟洁,李艳豪,孟天鑫,郭卫斌,王占全,李冬冬.基于决策树和大模型的个性化计算机实验教学探索与实践[J].实验技术与管理,2023,40(12):8-15. 被引量：11
9封彦.基于决策树的就业创业资源信息分类系统设计[J].信息技术,2024,48(5):114-119. 被引量：1
10马惠强,曾宋贤,陈云生.基于Java的在线考试系统设计与开发[J].现代信息科技,2024,8(12):56-60. 被引量：5

1罗孟疌.探讨免疫组化染色中阳性对照制作的方法及其价值[J].名医,2020,0(1):79-79. 被引量：1
2刘磊.暖通空调工程施工中BIM技术应用[J].写真地理,2020,0(1):0239-0239.
3张慧玉.玉竹黄酮在柑橘黄酮酒中的应用研究方法[J].饮食科学（下半月）,2020,0(1):0276-0276.
4杨帆.糖化血红蛋白及糖化白蛋白在妊娠期糖尿病诊断中的价值[J].微量元素与健康研究,2020,37(3):40-41. 被引量：6
5田芷,陈茂,李继新,叶倩,梁光平,张珏,吴洁,杨俊.超声波辅助提取披针新月蕨中多糖的工艺研究[J].轻工科技,2020,0(4):23-25.
6王远志,陆文成,田文泉,高标.基于GBDT的标记分布学习算法研究[J].安庆师范大学学报（自然科学版）,2020,26(2):63-68. 被引量：4
7林谷洋,孟迎芳,林惠茹.注意促进效应的ERP研究[J].心理科学,2020,43(1):9-16. 被引量：4
8党燕,娄金丽.新型冠状病毒肺炎的实验室检测现状[J].标记免疫分析与临床,2020,27(4):702-706. 被引量：2
9许伟.高速公路沥青路面使用性能及抗滑性能检测研究[J].中国周刊,2020,0(4):0117-0117.
10石福周,吴佳云,贾小军,王震,刘晓佩.水性环氧树脂乳化沥青对开级配抗滑磨耗层性能的影响[J].筑路机械与施工机械化,2020,37(1):66-70. 被引量：5

微电子学与计算机

2020年第5期

浏览历史

内容加载中请稍等...

基于深度自编码和决策树的恶意域名检测被引量：7

参考文献3

二级参考文献24

共引文献49

同被引文献72

引证文献7

二级引证文献19

相关作者

相关机构

相关主题

浏览历史

基于深度自编码和决策树的恶意域名检测 被引量：7

参考文献3

二级参考文献24

共引文献49

同被引文献72

引证文献7

二级引证文献19

相关作者

相关机构

相关主题

浏览历史

基于深度自编码和决策树的恶意域名检测被引量：7