对湖北田歌的分布与田歌孕育的地理环境之间的关系进行了探究,以期为区域音乐的实证研究提供新的思路和方法.以湖北田歌为研究对象,选取1 248个田歌样本数据集,运用地理信息系统(geographic information system,GIS)对初步选定的田歌分...对湖北田歌的分布与田歌孕育的地理环境之间的关系进行了探究,以期为区域音乐的实证研究提供新的思路和方法.以湖北田歌为研究对象,选取1 248个田歌样本数据集,运用地理信息系统(geographic information system,GIS)对初步选定的田歌分布及音乐要素影响因子进行建库,基于随机森林及可解释性算法(shapley additive explanations,SHAP)构建田歌影响因子体系分析模型,通过受试者工作特性曲线(receiver operating characteristic curve,ROC)对模型的有效性进行评价,分析田歌的分布、音乐要素与地理环境之间的关系.研究结果表明:1)基于随机森林构建的田歌影响因子体系模型预测效果较好,其曲线下面积(area under the curve,AUC)的值为0.82;2)对田歌产生及音乐要素影响因子重要性排序得出,多年平均降雨量和多年平均气温是孕育湖北田歌的主要因子.其随机森林及SHAP算法,能在一定程度上预测湖北田歌分布格局,对区域音乐文化与地理关联性研究具有重要意义.展开更多
近年来,黑客攻击、网络钓鱼、勒索病毒等事件频发,使得区块链交易异常检测成为当前研究的热点之一。XGBoost作为一种基于梯度提升框架的机器学习算法,可灵活地处理数据特征,不仅关注模型的预测误差,还考虑了每个样本的相对重要性。在前...近年来,黑客攻击、网络钓鱼、勒索病毒等事件频发,使得区块链交易异常检测成为当前研究的热点之一。XGBoost作为一种基于梯度提升框架的机器学习算法,可灵活地处理数据特征,不仅关注模型的预测误差,还考虑了每个样本的相对重要性。在前人区块链交易异常检测研究的基础上,将XGBoost与随机森林算法相结合,提出了基于XGBoost和随机森林的区块链异常交易检测模型(Blockchain Anomalous Transaction Detection Based on XGBoost and Random Forests,BATD_XRF)。模型分为数据特征处理、特征选择、分类检测3个模块,选取Elliptic Data Set、Bitcoin Alpha Dataset和Bitcoin OTC Trust Network Dataset数据集,使用主成分分析方法对数据进行二分类。特征选择过程中通过Gini Mean Decrease计算平均递减量,进一步确定特征的相对重要性。分类检测过程中提出网络搜索参数调优算法,并进行10倍交叉验证。最终通过与其他模型的对比实验,证明了所提模型在区块链交易异常检测中的准确性更高,训练时间更短。展开更多
文摘对湖北田歌的分布与田歌孕育的地理环境之间的关系进行了探究,以期为区域音乐的实证研究提供新的思路和方法.以湖北田歌为研究对象,选取1 248个田歌样本数据集,运用地理信息系统(geographic information system,GIS)对初步选定的田歌分布及音乐要素影响因子进行建库,基于随机森林及可解释性算法(shapley additive explanations,SHAP)构建田歌影响因子体系分析模型,通过受试者工作特性曲线(receiver operating characteristic curve,ROC)对模型的有效性进行评价,分析田歌的分布、音乐要素与地理环境之间的关系.研究结果表明:1)基于随机森林构建的田歌影响因子体系模型预测效果较好,其曲线下面积(area under the curve,AUC)的值为0.82;2)对田歌产生及音乐要素影响因子重要性排序得出,多年平均降雨量和多年平均气温是孕育湖北田歌的主要因子.其随机森林及SHAP算法,能在一定程度上预测湖北田歌分布格局,对区域音乐文化与地理关联性研究具有重要意义.
文摘近年来,黑客攻击、网络钓鱼、勒索病毒等事件频发,使得区块链交易异常检测成为当前研究的热点之一。XGBoost作为一种基于梯度提升框架的机器学习算法,可灵活地处理数据特征,不仅关注模型的预测误差,还考虑了每个样本的相对重要性。在前人区块链交易异常检测研究的基础上,将XGBoost与随机森林算法相结合,提出了基于XGBoost和随机森林的区块链异常交易检测模型(Blockchain Anomalous Transaction Detection Based on XGBoost and Random Forests,BATD_XRF)。模型分为数据特征处理、特征选择、分类检测3个模块,选取Elliptic Data Set、Bitcoin Alpha Dataset和Bitcoin OTC Trust Network Dataset数据集,使用主成分分析方法对数据进行二分类。特征选择过程中通过Gini Mean Decrease计算平均递减量,进一步确定特征的相对重要性。分类检测过程中提出网络搜索参数调优算法,并进行10倍交叉验证。最终通过与其他模型的对比实验,证明了所提模型在区块链交易异常检测中的准确性更高,训练时间更短。