期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于代表性数据的决策树集成
被引量:
3
1
作者
李海芳
丁周芳
王立群
《计算机应用研究》
CSCD
北大核心
2009年第4期1241-1243,1265,共4页
为了获得更好的决策树集成效果,在理论分析的基础上从数据的角度提出了一种基于代表性数据的决策树集成方法。该方法使用围绕中心点的划分(PAM)算法从原始训练集中提取出代表性训练集,由该代表性训练集来训练出多个决策树分类器,并由此...
为了获得更好的决策树集成效果,在理论分析的基础上从数据的角度提出了一种基于代表性数据的决策树集成方法。该方法使用围绕中心点的划分(PAM)算法从原始训练集中提取出代表性训练集,由该代表性训练集来训练出多个决策树分类器,并由此建立决策树集成模型。该方法能选取尽可能少的代表性数据来训练出尽可能好的决策树集成模型。实验结果表明,该方法使用更少的代表性数据能获得比Bagging和Boosting还要高的决策树集成精度。
展开更多
关键词
代表性
数据
决策树
聚类
围绕中心点的划分
集成学习
BAGGING
BOOSTING
在线阅读
下载PDF
职称材料
数据密集型知识发现的边界与陷阱——以美国大选预测为例
被引量:
15
2
作者
罗俊
罗教讲
《学术论坛》
CSSCI
北大核心
2017年第3期1-7,共7页
信息时代数据快速增长,数据密集型知识发现成为科学研究的新途径。它在取得一系列成就的同时,也出现了走向"唯数据论"的极端倾向。数据生成、采集的方式和特点,数据分析处理技术的水平,决定了数据密集型知识发现存在能力边界...
信息时代数据快速增长,数据密集型知识发现成为科学研究的新途径。它在取得一系列成就的同时,也出现了走向"唯数据论"的极端倾向。数据生成、采集的方式和特点,数据分析处理技术的水平,决定了数据密集型知识发现存在能力边界。对于科学研究尤其是社会科学研究而言,数据的代表性、数据的质量、算法的模糊性等是必须认真考量的问题。数据密集型知识发现的产生,并不意味着"理论的终结"和传统科学方法都已过时,而是在新的基础上使实验、理论、模拟与数据统一起来成为可能,这一发展方向具有更为广阔的前景。
展开更多
关键词
数据
密集型知识
数据
驱动
数据代表性
数据
质量
大
数据
计算社会科学
在线阅读
下载PDF
职称材料
论城市空气环境质量评估模式的完善
被引量:
9
3
作者
宋国君
宋书灵
《环境污染与防治》
CAS
CSCD
北大核心
2008年第2期87-89,96,共4页
城市空气环境质量评估应包含科学监测数据的代表性核查、基本要素尺度的确定和环境质量报告书基本内容的规范。社会学评估及人群健康核查可作为科学监测的有效验证手段;而基本要素的尺度确定包括合适的时间尺度、空间尺度和受体的暴露...
城市空气环境质量评估应包含科学监测数据的代表性核查、基本要素尺度的确定和环境质量报告书基本内容的规范。社会学评估及人群健康核查可作为科学监测的有效验证手段;而基本要素的尺度确定包括合适的时间尺度、空间尺度和受体的暴露程度。当污染比较严重时,适合采用较大的时间尺度,污染较轻时采用较小的时间尺度。建议按照采用空气环境质量区的概念考虑空间尺度,并采用与时间尺度对应的概率来表示监测点的代表性。受体的暴露程度可采用特定时间尺度的二级空气环境质量覆盖率表示。城市空气环境质量报告书的类型应当多样化,基本内容应当包括监测点位和监测频率描述、数据处理方法描述、数据代表性评价、环境质量评估结果和环境质量改善建议。
展开更多
关键词
监测布点
监测频率
数据代表性
环境质量报告书
在线阅读
下载PDF
职称材料
题名
基于代表性数据的决策树集成
被引量:
3
1
作者
李海芳
丁周芳
王立群
机构
太原理工大学计算机与软件学院
出处
《计算机应用研究》
CSCD
北大核心
2009年第4期1241-1243,1265,共4页
基金
国家自然科学基金资助项目(60773004)
山西省自然科学基金资助项目(2006011030
2007011050)
文摘
为了获得更好的决策树集成效果,在理论分析的基础上从数据的角度提出了一种基于代表性数据的决策树集成方法。该方法使用围绕中心点的划分(PAM)算法从原始训练集中提取出代表性训练集,由该代表性训练集来训练出多个决策树分类器,并由此建立决策树集成模型。该方法能选取尽可能少的代表性数据来训练出尽可能好的决策树集成模型。实验结果表明,该方法使用更少的代表性数据能获得比Bagging和Boosting还要高的决策树集成精度。
关键词
代表性
数据
决策树
聚类
围绕中心点的划分
集成学习
BAGGING
BOOSTING
Keywords
representative data
decision tree
cluster
PAM
ensemble learning
Bagging
Boosting
分类号
TP301.6 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
数据密集型知识发现的边界与陷阱——以美国大选预测为例
被引量:
15
2
作者
罗俊
罗教讲
机构
武汉大学社会发展研究所
武汉大学社会学系
出处
《学术论坛》
CSSCI
北大核心
2017年第3期1-7,共7页
基金
国家社科基金重大项目"大数据时代计算社会科学的产生
现状与发展前景研究"(16ZDA086)的阶段性成果
文摘
信息时代数据快速增长,数据密集型知识发现成为科学研究的新途径。它在取得一系列成就的同时,也出现了走向"唯数据论"的极端倾向。数据生成、采集的方式和特点,数据分析处理技术的水平,决定了数据密集型知识发现存在能力边界。对于科学研究尤其是社会科学研究而言,数据的代表性、数据的质量、算法的模糊性等是必须认真考量的问题。数据密集型知识发现的产生,并不意味着"理论的终结"和传统科学方法都已过时,而是在新的基础上使实验、理论、模拟与数据统一起来成为可能,这一发展方向具有更为广阔的前景。
关键词
数据
密集型知识
数据
驱动
数据代表性
数据
质量
大
数据
计算社会科学
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
论城市空气环境质量评估模式的完善
被引量:
9
3
作者
宋国君
宋书灵
机构
中国人民大学环境学院
出处
《环境污染与防治》
CAS
CSCD
北大核心
2008年第2期87-89,96,共4页
基金
"十一五"国家科技支撑计划重点项目之"重污染城市环境空气质量达标管理关键技术研究"课题(No.2007BAC16B01)
文摘
城市空气环境质量评估应包含科学监测数据的代表性核查、基本要素尺度的确定和环境质量报告书基本内容的规范。社会学评估及人群健康核查可作为科学监测的有效验证手段;而基本要素的尺度确定包括合适的时间尺度、空间尺度和受体的暴露程度。当污染比较严重时,适合采用较大的时间尺度,污染较轻时采用较小的时间尺度。建议按照采用空气环境质量区的概念考虑空间尺度,并采用与时间尺度对应的概率来表示监测点的代表性。受体的暴露程度可采用特定时间尺度的二级空气环境质量覆盖率表示。城市空气环境质量报告书的类型应当多样化,基本内容应当包括监测点位和监测频率描述、数据处理方法描述、数据代表性评价、环境质量评估结果和环境质量改善建议。
关键词
监测布点
监测频率
数据代表性
环境质量报告书
分类号
X831 [环境科学与工程—环境工程]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于代表性数据的决策树集成
李海芳
丁周芳
王立群
《计算机应用研究》
CSCD
北大核心
2009
3
在线阅读
下载PDF
职称材料
2
数据密集型知识发现的边界与陷阱——以美国大选预测为例
罗俊
罗教讲
《学术论坛》
CSSCI
北大核心
2017
15
在线阅读
下载PDF
职称材料
3
论城市空气环境质量评估模式的完善
宋国君
宋书灵
《环境污染与防治》
CAS
CSCD
北大核心
2008
9
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部