-
题名面向二进制数据帧的聚类系统
被引量:3
- 1
-
-
作者
岳旸
孟凡治
张春瑞
李桐
-
机构
中国工程物理研究院计算机应用研究所
-
出处
《计算机应用研究》
CSCD
北大核心
2015年第3期909-911,916,共4页
-
基金
中国工程物理研究院科学技术发展基金资助项目(2012A0403021)
-
文摘
为了分离复杂无线网络环境下获取到的二进制数据帧,为后续协议逆向解析提供前提条件,实现了对复杂协议簇协议的聚类系统。首先使用AC算法挖掘出二进制数据帧中的频繁序列特征;然后创新地使用了Apriori算法搜索分析这些特征的关联关系,并且结合二进制流数据帧的特点对结果进行了四步剪枝处理;最后利用筛选出的特征通过改进的K-means算法进行聚类。实验表明,该系统可以对二进制协议数据帧的聚类起到很好的效果,同时对存在TYPE字段的多层协议簇,还能进一步区分出多种协议间的层次关系。
-
关键词
协议逆向工程
无线网络
协议帧聚类
频繁序列
AC算法
APRIORI算法
K-MEANS算法
-
Keywords
Key words: protocol reverse engineering
wireless network
protocol frame cluster
frequent set
AC algorithm
Apriorialgorithm
K-means algorithm
-
分类号
TP309
[自动化与计算机技术—计算机系统结构]
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名融合特征降维和密度峰值的二进制协议数据帧聚类算法
- 2
-
-
作者
闫小勇
李青
-
机构
信息工程大学信息系统工程学院
-
出处
《小型微型计算机系统》
CSCD
北大核心
2018年第12期2662-2668,共7页
-
文摘
针对二进制协议会话流特征缺失和频繁模式难以提取的问题,通过采用特征降维和改进的密度峰值聚类算法,实现了无监督条件下以数据帧为颗粒度的二进制协议数据聚类.提出基于频繁项的特征降维算法,利用协议数据中存在的频繁项构造特征矢量表示原有数据帧,达到降维的目的;提出基于距离指数加权的密度峰值聚类算法自动选取聚类中心,有效提高了聚类中心和其它数据帧的区分度.通过在AIS、ARP、DNS、ICMP和SMB五种协议构成的三个数据集上进行测试,结果表明本文提出的算法对二进制协议数据帧具有较好的聚类效果.
-
关键词
协议识别
二进制协议
特征降维
密度峰值
帧聚类
-
Keywords
protocol identification
binary protocol
feature dimensionality reduction
density peaks
frames clustering
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-