-
题名基于SPARK与随机森林的短信诈骗用户识别研究
被引量:13
- 1
-
-
作者
杨杰超
许江淳
岳秋燕
曾德斌
陆万荣
-
机构
昆明理工大学信息工程与自动化学院
-
出处
《计算机工程与科学》
CSCD
北大核心
2019年第6期1136-1144,共9页
-
文摘
当今数据时代电信诈骗现象日益增多,为了在短信诈骗份子实施诈骗前及时识别出其身份,根据目前电信行业需求及研究现状,在SPARK并行处理框架上,针对性地提出了分层子空间的加权随机森林算法。面对短信用户种类繁杂导致的数据类别不平衡带来的随机森林性能低下的问题,采用改进的分层子空间的方法,并根据评估出的每棵树的分类能力给决策树加权,相较于其他分类算法,改进的随机森林表现得更优异;针对电信行业海量数据的特点,选择分布式SPARK作为数据处理平台,并行化的平台缩短了模型训练和测试时间,提高了效率,实时、准确地识别电信短信诈骗用户,其准确率达到90%以上。
-
关键词
SPARK
随机森林
分层子空间
加权
短信诈骗用户识别
-
Keywords
SPARK
random forest
hierarchical subspace
weighted
SMS scam user identification
-
分类号
TP39
[自动化与计算机技术—计算机应用技术]
-