近年来,黑客攻击、网络钓鱼、勒索病毒等事件频发,使得区块链交易异常检测成为当前研究的热点之一。XGBoost作为一种基于梯度提升框架的机器学习算法,可灵活地处理数据特征,不仅关注模型的预测误差,还考虑了每个样本的相对重要性。在前...近年来,黑客攻击、网络钓鱼、勒索病毒等事件频发,使得区块链交易异常检测成为当前研究的热点之一。XGBoost作为一种基于梯度提升框架的机器学习算法,可灵活地处理数据特征,不仅关注模型的预测误差,还考虑了每个样本的相对重要性。在前人区块链交易异常检测研究的基础上,将XGBoost与随机森林算法相结合,提出了基于XGBoost和随机森林的区块链异常交易检测模型(Blockchain Anomalous Transaction Detection Based on XGBoost and Random Forests,BATD_XRF)。模型分为数据特征处理、特征选择、分类检测3个模块,选取Elliptic Data Set、Bitcoin Alpha Dataset和Bitcoin OTC Trust Network Dataset数据集,使用主成分分析方法对数据进行二分类。特征选择过程中通过Gini Mean Decrease计算平均递减量,进一步确定特征的相对重要性。分类检测过程中提出网络搜索参数调优算法,并进行10倍交叉验证。最终通过与其他模型的对比实验,证明了所提模型在区块链交易异常检测中的准确性更高,训练时间更短。展开更多
文摘近年来,黑客攻击、网络钓鱼、勒索病毒等事件频发,使得区块链交易异常检测成为当前研究的热点之一。XGBoost作为一种基于梯度提升框架的机器学习算法,可灵活地处理数据特征,不仅关注模型的预测误差,还考虑了每个样本的相对重要性。在前人区块链交易异常检测研究的基础上,将XGBoost与随机森林算法相结合,提出了基于XGBoost和随机森林的区块链异常交易检测模型(Blockchain Anomalous Transaction Detection Based on XGBoost and Random Forests,BATD_XRF)。模型分为数据特征处理、特征选择、分类检测3个模块,选取Elliptic Data Set、Bitcoin Alpha Dataset和Bitcoin OTC Trust Network Dataset数据集,使用主成分分析方法对数据进行二分类。特征选择过程中通过Gini Mean Decrease计算平均递减量,进一步确定特征的相对重要性。分类检测过程中提出网络搜索参数调优算法,并进行10倍交叉验证。最终通过与其他模型的对比实验,证明了所提模型在区块链交易异常检测中的准确性更高,训练时间更短。