期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于代表性数据的决策树集成 被引量:3
1
作者 李海芳 丁周芳 王立群 《计算机应用研究》 CSCD 北大核心 2009年第4期1241-1243,1265,共4页
为了获得更好的决策树集成效果,在理论分析的基础上从数据的角度提出了一种基于代表性数据的决策树集成方法。该方法使用围绕中心点的划分(PAM)算法从原始训练集中提取出代表性训练集,由该代表性训练集来训练出多个决策树分类器,并由此... 为了获得更好的决策树集成效果,在理论分析的基础上从数据的角度提出了一种基于代表性数据的决策树集成方法。该方法使用围绕中心点的划分(PAM)算法从原始训练集中提取出代表性训练集,由该代表性训练集来训练出多个决策树分类器,并由此建立决策树集成模型。该方法能选取尽可能少的代表性数据来训练出尽可能好的决策树集成模型。实验结果表明,该方法使用更少的代表性数据能获得比Bagging和Boosting还要高的决策树集成精度。 展开更多
关键词 代表性数据 决策树 聚类 围绕中心点的划分 集成学习 BAGGING BOOSTING
在线阅读 下载PDF
数据密集型知识发现的边界与陷阱——以美国大选预测为例 被引量:15
2
作者 罗俊 罗教讲 《学术论坛》 CSSCI 北大核心 2017年第3期1-7,共7页
信息时代数据快速增长,数据密集型知识发现成为科学研究的新途径。它在取得一系列成就的同时,也出现了走向"唯数据论"的极端倾向。数据生成、采集的方式和特点,数据分析处理技术的水平,决定了数据密集型知识发现存在能力边界... 信息时代数据快速增长,数据密集型知识发现成为科学研究的新途径。它在取得一系列成就的同时,也出现了走向"唯数据论"的极端倾向。数据生成、采集的方式和特点,数据分析处理技术的水平,决定了数据密集型知识发现存在能力边界。对于科学研究尤其是社会科学研究而言,数据的代表性、数据的质量、算法的模糊性等是必须认真考量的问题。数据密集型知识发现的产生,并不意味着"理论的终结"和传统科学方法都已过时,而是在新的基础上使实验、理论、模拟与数据统一起来成为可能,这一发展方向具有更为广阔的前景。 展开更多
关键词 数据密集型知识 数据驱动 数据代表性 数据质量 数据 计算社会科学
在线阅读 下载PDF
论城市空气环境质量评估模式的完善 被引量:9
3
作者 宋国君 宋书灵 《环境污染与防治》 CAS CSCD 北大核心 2008年第2期87-89,96,共4页
城市空气环境质量评估应包含科学监测数据的代表性核查、基本要素尺度的确定和环境质量报告书基本内容的规范。社会学评估及人群健康核查可作为科学监测的有效验证手段;而基本要素的尺度确定包括合适的时间尺度、空间尺度和受体的暴露... 城市空气环境质量评估应包含科学监测数据的代表性核查、基本要素尺度的确定和环境质量报告书基本内容的规范。社会学评估及人群健康核查可作为科学监测的有效验证手段;而基本要素的尺度确定包括合适的时间尺度、空间尺度和受体的暴露程度。当污染比较严重时,适合采用较大的时间尺度,污染较轻时采用较小的时间尺度。建议按照采用空气环境质量区的概念考虑空间尺度,并采用与时间尺度对应的概率来表示监测点的代表性。受体的暴露程度可采用特定时间尺度的二级空气环境质量覆盖率表示。城市空气环境质量报告书的类型应当多样化,基本内容应当包括监测点位和监测频率描述、数据处理方法描述、数据代表性评价、环境质量评估结果和环境质量改善建议。 展开更多
关键词 监测布点 监测频率 数据代表性 环境质量报告书
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部