期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于特征选择的统计最优样本大小算法 被引量:3
1
作者 邓杰 钱雪忠 +1 位作者 钱恒 吴秦 《计算机应用研究》 CSCD 北大核心 2014年第12期3535-3538,3549,共5页
针对统计最优样本大小算法在确定大数据集,尤其是高维数据集抽样样本大小时的执行效率较低,以及高维数据集中每一维属性的重要性不同且可能存在冗余属性,提出一种基于特征选择的统计最优样本大小算法。该算法基于熵理论,通过构造一个基... 针对统计最优样本大小算法在确定大数据集,尤其是高维数据集抽样样本大小时的执行效率较低,以及高维数据集中每一维属性的重要性不同且可能存在冗余属性,提出一种基于特征选择的统计最优样本大小算法。该算法基于熵理论,通过构造一个基于对象间相似度的熵度量方法来评估特征重要性,然后根据设计的一种挑选特征的标准获得重要的特征子集,最后在该特征子集上执行统计最优样本大小算法。实验结果表明,改进后算法得到的样本大小抽取的样本集能够在聚类算法中得到较高的准确率,同时也较明显地降低了算法的执行时间,从而验证了改进后的算法是有效可行的。 展开更多
关键词 统计最优样本大小算法 高维数据集 特征选择 聚类
在线阅读 下载PDF
决策树算法:揭示残障人身体活动参与关键影响因素的新方法 被引量:1
2
作者 张磊 吴雪萍 王丹丹 《上海体育学院学报》 CSSCI 北大核心 2023年第5期94-94,共1页
残障人身体活动的促成和阻碍因素复杂且多维,如个体的障碍类型、障碍程度、年龄、性别以及社会人口学因素均会直接或间接地影响其身体活动参与,且多数关于残障人的研究基于小样本数据。因此,如何对以上变量进行最优分类并揭示影响其身... 残障人身体活动的促成和阻碍因素复杂且多维,如个体的障碍类型、障碍程度、年龄、性别以及社会人口学因素均会直接或间接地影响其身体活动参与,且多数关于残障人的研究基于小样本数据。因此,如何对以上变量进行最优分类并揭示影响其身体活动参与的敏感因素是亟待解决的重要问题。决策树算法作为机器学习中的一种树状预测模型,可以清晰地反映不同分类变量之间的映射关系。其中,CHAID决策树算法以卡方值等统计量为分支准则。 展开更多
关键词 决策树算法 机器学习 残障人 最优分类 样本数据 分类变量 预测模型 统计
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部