-
题名基于URL特征检测的违法网站识别方法
被引量:10
- 1
-
-
作者
凡友荣
杨涛
王永剑
姜国庆
-
机构
公安部第三研究所
信息网络安全公安部重点实验室
-
出处
《计算机工程》
CAS
CSCD
北大核心
2018年第3期171-177,共7页
-
基金
国家重点研发计划项目(2016YFC0800909)
中央高校基本科研业务费专项资金(C16356)
-
文摘
为高效识别违法网站,提出一种基于URL特征检测的识别方法。基于报文请求行信息中用户访问路径的分级特点,构建基于路径相似度的网站相似度计算模型,并使用Python编程语言实现模型的分布式计算。采用Fast Unfolding算法进行网站聚类并抽取违法网站的URL特征,从中筛选出准确率高、具有特定含义的特征作为有效的违法网站特征,并通过检测未知网站是否具有违法网站的URL特征识别出违法网站。实验结果证明,该方法能有效度量同类网站间的关联程度,结合Fast Unfolding算法能有效区分不同类型的网站。与基于URL词法特征、HTM L、语义特征的违法网站识别方法相比,其F-M easure值最高。
-
关键词
url特征
违法网站识别
网站相似度
聚类
访问路径
-
Keywords
url feature
illegal website identification
website similarity
clustering
access path
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名改进Relief-C5.0的恶意域名检测算法
被引量:6
- 2
-
-
作者
马栋林
张澍寰
赵宏
-
机构
兰州理工大学计算机与通信学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2022年第11期100-106,共7页
-
基金
国家自然科学基金(61262016)
赛尔网络下一代互联网技术创新项目(NGII20160311,NGII20160112)。
-
文摘
针对目前恶意域名检测算法中分类模型计算复杂度较大、实时性不强以及准确率不高等问题,提出了Rf-C5(Relief-C5.0)恶意域名检测算法模型。提取待测域名的全局URL特征,根据提取的特征按照改进的Relief算法进行权重计算,并依据权重值进行优先级排序;选取权重值排名前20的关键特征作为C5.0分类器的输入端,进行合法域名与恶意域名的分类。实验结果表明,在大样本数据集下,Rf-C5模型与当前主流恶意域名检测算法相比,在提高平均检测速率的基础上,检测准确率提高了1.58~4.91个百分点。
-
关键词
恶意域名
url特征
改进的Relief算法
C5.0分类器
-
Keywords
malicious domain name
url features
improved Relief algorithm
C5.0 classifier
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-