期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于特征选择的统计最优样本大小算法
被引量:
3
1
作者
邓杰
钱雪忠
+1 位作者
钱恒
吴秦
《计算机应用研究》
CSCD
北大核心
2014年第12期3535-3538,3549,共5页
针对统计最优样本大小算法在确定大数据集,尤其是高维数据集抽样样本大小时的执行效率较低,以及高维数据集中每一维属性的重要性不同且可能存在冗余属性,提出一种基于特征选择的统计最优样本大小算法。该算法基于熵理论,通过构造一个基...
针对统计最优样本大小算法在确定大数据集,尤其是高维数据集抽样样本大小时的执行效率较低,以及高维数据集中每一维属性的重要性不同且可能存在冗余属性,提出一种基于特征选择的统计最优样本大小算法。该算法基于熵理论,通过构造一个基于对象间相似度的熵度量方法来评估特征重要性,然后根据设计的一种挑选特征的标准获得重要的特征子集,最后在该特征子集上执行统计最优样本大小算法。实验结果表明,改进后算法得到的样本大小抽取的样本集能够在聚类算法中得到较高的准确率,同时也较明显地降低了算法的执行时间,从而验证了改进后的算法是有效可行的。
展开更多
关键词
统计最优样本大小算法
高维数据集
特征选择
熵
聚类
在线阅读
下载PDF
职称材料
决策树算法:揭示残障人身体活动参与关键影响因素的新方法
被引量:
1
2
作者
张磊
吴雪萍
王丹丹
《上海体育学院学报》
CSSCI
北大核心
2023年第5期94-94,共1页
残障人身体活动的促成和阻碍因素复杂且多维,如个体的障碍类型、障碍程度、年龄、性别以及社会人口学因素均会直接或间接地影响其身体活动参与,且多数关于残障人的研究基于小样本数据。因此,如何对以上变量进行最优分类并揭示影响其身...
残障人身体活动的促成和阻碍因素复杂且多维,如个体的障碍类型、障碍程度、年龄、性别以及社会人口学因素均会直接或间接地影响其身体活动参与,且多数关于残障人的研究基于小样本数据。因此,如何对以上变量进行最优分类并揭示影响其身体活动参与的敏感因素是亟待解决的重要问题。决策树算法作为机器学习中的一种树状预测模型,可以清晰地反映不同分类变量之间的映射关系。其中,CHAID决策树算法以卡方值等统计量为分支准则。
展开更多
关键词
决策树
算法
机器学习
残障人
最优
分类
小
样本
数据
分类变量
预测模型
统计
量
在线阅读
下载PDF
职称材料
题名
基于特征选择的统计最优样本大小算法
被引量:
3
1
作者
邓杰
钱雪忠
钱恒
吴秦
机构
江南大学物联网工程学院
扬州大学信息工程学院
出处
《计算机应用研究》
CSCD
北大核心
2014年第12期3535-3538,3549,共5页
基金
国家自然科学基金资助项目(61103129
61202312)
江苏省科技支撑计划资助项目(BE2009009)
文摘
针对统计最优样本大小算法在确定大数据集,尤其是高维数据集抽样样本大小时的执行效率较低,以及高维数据集中每一维属性的重要性不同且可能存在冗余属性,提出一种基于特征选择的统计最优样本大小算法。该算法基于熵理论,通过构造一个基于对象间相似度的熵度量方法来评估特征重要性,然后根据设计的一种挑选特征的标准获得重要的特征子集,最后在该特征子集上执行统计最优样本大小算法。实验结果表明,改进后算法得到的样本大小抽取的样本集能够在聚类算法中得到较高的准确率,同时也较明显地降低了算法的执行时间,从而验证了改进后的算法是有效可行的。
关键词
统计最优样本大小算法
高维数据集
特征选择
熵
聚类
Keywords
statistical optimal sample size algorithm
high-dimensional datasets
feature selection
entropy
clustering
分类号
TP301.6 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
决策树算法:揭示残障人身体活动参与关键影响因素的新方法
被引量:
1
2
作者
张磊
吴雪萍
王丹丹
机构
上海体育学院
上海理工大学
出处
《上海体育学院学报》
CSSCI
北大核心
2023年第5期94-94,共1页
文摘
残障人身体活动的促成和阻碍因素复杂且多维,如个体的障碍类型、障碍程度、年龄、性别以及社会人口学因素均会直接或间接地影响其身体活动参与,且多数关于残障人的研究基于小样本数据。因此,如何对以上变量进行最优分类并揭示影响其身体活动参与的敏感因素是亟待解决的重要问题。决策树算法作为机器学习中的一种树状预测模型,可以清晰地反映不同分类变量之间的映射关系。其中,CHAID决策树算法以卡方值等统计量为分支准则。
关键词
决策树
算法
机器学习
残障人
最优
分类
小
样本
数据
分类变量
预测模型
统计
量
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
G812.49 [文化科学—体育学]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于特征选择的统计最优样本大小算法
邓杰
钱雪忠
钱恒
吴秦
《计算机应用研究》
CSCD
北大核心
2014
3
在线阅读
下载PDF
职称材料
2
决策树算法:揭示残障人身体活动参与关键影响因素的新方法
张磊
吴雪萍
王丹丹
《上海体育学院学报》
CSSCI
北大核心
2023
1
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部