-
题名基于Hadoop的网络分流和流特征计算
被引量:6
- 1
-
-
作者
刘勇
雒江涛
邓生雄
王小平
-
机构
重庆市高校通信网测试技术工程研究中心
重庆邮电大学通信与信息工程学院
重庆邮电大学电子信息与网络工程研究院
-
出处
《电信科学》
北大核心
2014年第12期76-81,共6页
-
基金
重庆市应用开发计划基金资助项目(No.cstc2013yykf A40006)
-
文摘
网络流量特征计算是网络流量分析的一个重要步骤,对于海量网络流量数据,并行化计算网络流量特征是高效网络流量分析的重要方法。针对传统单机处理成本高、可扩展性差的问题,提出一种基于Map Reduce编程模型的网络流量分析方法,并行实现网络分流和流量特征计算。通过使用Hadoop平台对实际数据进行分析,统计常用网络流量属性特征,实验表明,该方法分析网络流量特征的结果准确可信,且适合分析大流量数据。
-
关键词
网络分流
特征
并行计算
-
Keywords
MapReduce, diffluent internet traffic, characteristic, parallel computing
-
分类号
TP393.07
[自动化与计算机技术—计算机应用技术]
-
-
题名集成随机森林的分类模型
被引量:20
- 2
-
-
作者
邓生雄
雒江涛
刘勇
王小平
杨军超
-
机构
重庆邮电大学通信与信息工程学院
重庆市高校通信网测试技术工程研究中心
-
出处
《计算机应用研究》
CSCD
北大核心
2015年第6期1621-1624,1629,共5页
-
基金
国家科技重大专项子课题资助项目(2012ZX03005002-005)
重庆市应用开发计划资助项目(cstc2013yykf A40006)
2013年重庆高校创新团队建设计划资助项目(KJTD201312)
-
文摘
与集成学习相比,针对单个分类器不能获得相对较高而稳定的准确率的问题,提出一种分类模型。该模型可集成多个随机森林,并以带阈值的多数投票法作为结合方法;模型实现主要分为建立集成分类模型、实例初步预测和结合分析三个层次。MapReduce编程方式实现的分类模型以P2P流量识别为例,分别与单个随机森林和集成其他算法进行对比,实验表明提出模型能获得更好的P2P流量识别综合分类性能,该模型也为二类型分类提供了一种可行的参考方法。
-
关键词
集成学习
随机森林
带阈值的多数投票法
MAPREDUCE
P2P流量识别
-
Keywords
ensemble learning
random forests
majority voting with thresholds
MapReduce
P2P traffic identification
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-