期刊文献+
共找到227篇文章
< 1 2 12 >
每页显示 20 50 100
大数据探索式搜索研究 被引量:9
1
作者 杜小勇 陈峻 陈跃国 《通信学报》 EI CSCD 北大核心 2015年第12期77-88,共12页
数据探索(data exploration)是有别于数据服务与数据分析的第3种体现大数据价值的技术手段。数据服务强调从微观层面获取满足用户需求的精准信息;数据分析强调从宏观层面为用户提供数据洞察,进而提供决策支持;而数据探索是一种支持用户... 数据探索(data exploration)是有别于数据服务与数据分析的第3种体现大数据价值的技术手段。数据服务强调从微观层面获取满足用户需求的精准信息;数据分析强调从宏观层面为用户提供数据洞察,进而提供决策支持;而数据探索是一种支持用户在微观层面和宏观层面进行自由切换的、深入浅出的、交互式发掘数据价值的方式。首先,简要介绍大数据价值发掘的传统技术手段和特点,并引入探索式搜索;其次,详细阐述探索式搜索的定义与模型,总结探索式搜索的特点;随后,基于组件化的思想,设计探索式搜索系统框架,并综述每个组件所涉及到的挑战与关键技术;最后简要介绍了笔者在知识库探索式搜索方面的尝试。 展开更多
关键词 数据 知识库 探索式搜索 数据探索
在线阅读 下载PDF
交互式数据探索综述 被引量:3
2
作者 王蒙湘 李芳芳 +1 位作者 谷峪 于戈 《计算机科学与探索》 CSCD 北大核心 2017年第2期171-184,共14页
大规模数据集已经超过TB和PB级,现有的技术可以收集和存储大量的信息。虽然数据库管理系统一直在不断提高提供复杂的多种数据管理的能力,但是管理查询工具并不能满足大数据的需求,如何精准理解和探索这些大规模数据集仍然是一个巨大的... 大规模数据集已经超过TB和PB级,现有的技术可以收集和存储大量的信息。虽然数据库管理系统一直在不断提高提供复杂的多种数据管理的能力,但是管理查询工具并不能满足大数据的需求,如何精准理解和探索这些大规模数据集仍然是一个巨大的挑战。交互式数据探索(interactive data exploration,IDE)的关注点是强调交互、探索和发现,能让用户从海量的数据中用最小的代价更精确地找到他们需要的信息。首先对交互式数据探索及其应用背景进行了介绍,总结了通用的探索模型和IDE的特点,分析了交互式数据探索中的查询推荐技术和查询结果优化技术的现状;随后分别对IDE原型系统进行了分析和比较;最后给出了关于交互式数据探索技术的总结和展望。 展开更多
关键词 交互式数据探索 查询推荐 查询结果优化 用户反馈 机器学习
在线阅读 下载PDF
交互式数据探索框架的特征自适应技术 被引量:2
3
作者 王蒙湘 李芳芳 于戈 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2018年第12期1685-1690,共6页
交互式数据探索是一组多样的发现式应用程序的关键技术,着重于交互、探索和发现;在许多场景和领域中广泛应用.以海量的学术文献数据探索为背景,对交互式数据探索的特征自适应技术进行研究.首先,提出一种适用于面向学术文献数据探索的特... 交互式数据探索是一组多样的发现式应用程序的关键技术,着重于交互、探索和发现;在许多场景和领域中广泛应用.以海量的学术文献数据探索为背景,对交互式数据探索的特征自适应技术进行研究.首先,提出一种适用于面向学术文献数据探索的特征自适应交互式数据探索框架FA-IDE(feature-adaptive interactive data exploration),在每次迭代过程中动态地调整特征子集,以满足用户兴趣多样性的需求.其次,针对该框架,提出特征子集的均匀度BFS(balance of feature subsets)评价准则,并给出了基于BFS的序列前向特征选择算法.再次,针对相关样本发现问题,提出划分等级建立方法,根据决策树模型对用户兴趣区域划分后,提出基于相似度的结果集排序策略.实验结果表明,所提出方法可有效提高用户探索效率和最终结果的准确性. 展开更多
关键词 交互式数据探索 主题提取 特征选择 样本发现 机器学习
在线阅读 下载PDF
DRec:大语言模型驱动的数据分析推荐系统
4
作者 陈治彰 封颖超杰 +2 位作者 翁罗轩 沈健 陈为 《图学学报》 北大核心 2025年第5期1028-1041,共14页
自然语言交互系统极大地简化了用户与数据分析的交互流程,允许用户通过自然语言来完成数据分析和图表绘制。随着大型语言模型(LLM)的兴起,近年来LLM驱动的自然语言数据分析系统逐渐成为一种趋势。LLM凭借其出色的逻辑推理和工具调用能力... 自然语言交互系统极大地简化了用户与数据分析的交互流程,允许用户通过自然语言来完成数据分析和图表绘制。随着大型语言模型(LLM)的兴起,近年来LLM驱动的自然语言数据分析系统逐渐成为一种趋势。LLM凭借其出色的逻辑推理和工具调用能力,能够生成更为复杂的逻辑推断和图表。尽管如此,依靠LLM进行的交互式数据分析仍充满挑战。数据分析师在分析过程中必须明确分析方向以推动交互式分析的进行,通常要求其对数据有深入的了解。此外,使用LLM进行数据探索时,分析师因为较少直接操作数据,致使对数据的理解不足,从而影响对分析流程的整体掌控。为了帮助用户明确分析流程、加深对数据的理解,提出一种基于推荐和关联的LLM数据分析系统DRec。该系统通过关联信息帮助用户建立起对数据的认知,并引导数据分析的流程。同时,系统从语义和数据2个维度为用户提供洞察,并据此推荐查询,以协助用户确定数据分析的方向。通过案例研究和用户实验,证明DRec系统能够提高数据分析效率并引导用户获得合理的数据分析结果。 展开更多
关键词 大语言模型 交互式数据分析 数据探索 自然语言界面 自然语言推荐
在线阅读 下载PDF
FastNavi:巡天数据的交互式探索系统 被引量:2
5
作者 周彧 李晖 +2 位作者 梁青青 陈梅 朱明 《计算机工程与应用》 CSCD 北大核心 2018年第1期86-93,101,共9页
目前,我国天文科学领域的重大科学工程FAST(500 m口径球面射电望远镜)已于2016年9月建成并进入调试和试运行阶段。为满足FAST建成后开展科学研究的需要,采用基于阵列模型的科学型数据库系统作为巡天数据的存储支撑系统,设计实现了一个... 目前,我国天文科学领域的重大科学工程FAST(500 m口径球面射电望远镜)已于2016年9月建成并进入调试和试运行阶段。为满足FAST建成后开展科学研究的需要,采用基于阵列模型的科学型数据库系统作为巡天数据的存储支撑系统,设计实现了一个能够满足对大规模巡天数据进行高效读写、复杂分析的交互式探索系统FastNavi。该系统涵盖了最为常用的巡天数据可视化探索的核心功能,通过优化对巡天数据的可视化分析及观测信息导航的实现,向天文学家或其他非专业人士进行天文研究提供了一种新的交互式探索方式。FastNavi目前已在国家天文台FAST工程科学部巡天数据研究规划中应用,并被其列为巡天数据科学研究的支撑软件。 展开更多
关键词 交互式数据探索 科学数据 阵列数据 数据分析 天文学
在线阅读 下载PDF
基于探索性数据分析的柑橘部位颜色模型分析与识别 被引量:5
6
作者 彭红星 邹湘军 +2 位作者 郭艾侠 熊俊涛 陈燕 《农业机械学报》 EI CAS CSCD 北大核心 2013年第S1期253-259,235,共8页
针对成熟柑橘各部位特点、光照与环境的不确定性及多变性,对柑橘各部位的图像数据进行了探索性数据分析并进行了识别。分析了探索性数据分析方法的特点和基于色彩分通道的柑橘识别原理,给出了柑橘图像数据的探索性数据分析流程图。对采... 针对成熟柑橘各部位特点、光照与环境的不确定性及多变性,对柑橘各部位的图像数据进行了探索性数据分析并进行了识别。分析了探索性数据分析方法的特点和基于色彩分通道的柑橘识别原理,给出了柑橘图像数据的探索性数据分析流程图。对采集的柑橘图像分成顺光、正常光、逆光3种不同光照情况,并分别采集其中的柑橘果实与果梗、叶子图像数据,根据这些图像数据生成柑橘果实与果梗、叶子在6种颜色模型下的颜色分量分布箱线图,通过图形启示的数据分析与探索,给出了基于I1I2I3颜色模型的I2分量的柑橘各部位分类识别的视觉模型,分析表明I2分量值为0.3能去除树枝、叶子和草地等复杂背景,实现柑橘果实与背景的分割。以300幅野外环境下采集的、不同光照下的柑橘图像为试验对象,成熟柑橘果实总体识别率达到了98.4%,同时证实果梗与叶子由于颜色的相似性,仅靠颜色特征无法对其进行区分。 展开更多
关键词 柑橘果实 识别 探索数据分析 颜色模型 图像分类
在线阅读 下载PDF
基于探索性分析的时序数据研究 被引量:4
7
作者 张荣明 邹湘军 +2 位作者 顾邦军 罗陆锋 周艳琼 《系统仿真学报》 CAS CSCD 北大核心 2006年第z2期791-793,共3页
探索性分析是从不同的角度进行建模,找出较优模型的一种方法。提出了基于探索性分析的时序数据挖掘方法,采用线性回归技术建立了数学模型。并给出了1978年到2002年间的中国交通产值变化的实例,建立两种预测模型,采用探索性分析方法对预... 探索性分析是从不同的角度进行建模,找出较优模型的一种方法。提出了基于探索性分析的时序数据挖掘方法,采用线性回归技术建立了数学模型。并给出了1978年到2002年间的中国交通产值变化的实例,建立两种预测模型,采用探索性分析方法对预测模型进行探索性的仿真分析,达到较好的效果。 展开更多
关键词 数据挖掘 探索性分析 仿真探索数据分析 线性回归
在线阅读 下载PDF
探索性数据分析在选矿中的应用 被引量:6
8
作者 王淑红 李英龙 +1 位作者 戈保梁 李文瑶 《金属矿山》 CAS 北大核心 2002年第7期22-25,共4页
介绍了统计分析方法中新兴起的探索性数据分析方法的箱线图法 ,并对选矿数据进行分析 ,进而找到最优精矿品位和回收率的最佳药剂用量。
关键词 选矿 探索数据分析 箱线图 统计分析方法 精矿品位 回收率 药剂
在线阅读 下载PDF
用“探索性数据”分析优选预测模型的研究 被引量:4
9
作者 胡金莲 李天河 《长江科学院院报》 CSCD 北大核心 2002年第2期54-57,共4页
为了从三峡工程大量安全监测数据中 ,找出内在变化规律 ,建立一个能客观预测关键建筑部位变形及应力、应变情况的数学模型 ,采用“探索性数据”分析法即类比优选法对预测模型的构建进行了研究。以三峡二期上游围堰第一道防渗墙为例 ,用... 为了从三峡工程大量安全监测数据中 ,找出内在变化规律 ,建立一个能客观预测关键建筑部位变形及应力、应变情况的数学模型 ,采用“探索性数据”分析法即类比优选法对预测模型的构建进行了研究。以三峡二期上游围堰第一道防渗墙为例 ,用多元回归、灰色模型、时间序列统计方法构造了 3种预测模型 ,通过对预测模型的计算值及实测值进行对比分析 ,可以看出 :多元非线性回归模型的残差较小 ,计算结果的拟合程度及模型反映的规律性均较好 ;时间序列模型次之 ;灰色模型的拟合程度及残差均偏离较大。实测数据检验表明 ,回归模型预测效果较好 ,其测值在预报范围内的可能性为 95 % ,为此 ,选定多元非线性回归模型为预测模型。 展开更多
关键词 安全监测 预测模型 探索数据”分析 大坝 三峡工程
在线阅读 下载PDF
我国省域商贸流通空间布局演化——基于探索性空间数据(ESDA)分析 被引量:5
10
作者 孟小欣 高伟 盛小丰 《商业经济研究》 北大核心 2018年第8期190-192,共3页
本文基于2006-2015年的省级数据,构建探索性空间数据模型对我国省域商贸流通业空间布局的演化进行实证分析。研究发现,全国人均Moran’sⅠ值反映出商贸流通业呈现集聚型结构,分地区的商贸流通业空间演化存在较大的差异。东部地区除广东... 本文基于2006-2015年的省级数据,构建探索性空间数据模型对我国省域商贸流通业空间布局的演化进行实证分析。研究发现,全国人均Moran’sⅠ值反映出商贸流通业呈现集聚型结构,分地区的商贸流通业空间演化存在较大的差异。东部地区除广东外其他省份的变化不大,均位于商贸流通业的集聚区;中部地区省份分化较大,2015年山西、广西和陕西仍位于萧条区和孤岛区;西部地区内蒙古一直位于集聚区,而其他大部分省份位于萧条区和孤岛区。文章最后提出了完善我国省域商贸流通业空间布局的对策。 展开更多
关键词 商贸流通业 空间布局演化 探索性空间数据
在线阅读 下载PDF
中国省域金融活动空间结构探索性数据分析 被引量:6
11
作者 汤子隆 任晓怡 +1 位作者 祝佳 唐松 《广东商学院学报》 CSSCI 北大核心 2013年第5期28-33,56,共7页
采用Moran指数和Lisa指数,运用空间计量模型考察中国金融活动的空间分布规律及其经济影响,结果表明:省域金融活动存在显著的全域空间正相关,各省域之间金融活动的空间差异程度扩大,东、中、西区域金融活动的空间结构差异加大。因此,应... 采用Moran指数和Lisa指数,运用空间计量模型考察中国金融活动的空间分布规律及其经济影响,结果表明:省域金融活动存在显著的全域空间正相关,各省域之间金融活动的空间差异程度扩大,东、中、西区域金融活动的空间结构差异加大。因此,应根据区域禀赋原则,加快建立健全金融市场体系,培养更多的金融专业人才,进而促进我国区域经济的协调发展。 展开更多
关键词 区域金融 金融活动 空间统计学 探索性空间数据
在线阅读 下载PDF
中国2013年城市大气污染现状及探索性空间数据分析 被引量:16
12
作者 姜澒月 闫亚琛 李海蓉 《安全与环境学报》 CAS CSCD 北大核心 2016年第2期352-357,共6页
为了了解中国城市大气污染现状和污染特征,根据中华人民共和国环境保护部数据中心监测资料,采用环境空气质量综合指数、探索性空间数据分析方法(ESDA)研究了2013年74个重点城市空气质量时空分布及影响因素。结果表明:1)首要污染物以... 为了了解中国城市大气污染现状和污染特征,根据中华人民共和国环境保护部数据中心监测资料,采用环境空气质量综合指数、探索性空间数据分析方法(ESDA)研究了2013年74个重点城市空气质量时空分布及影响因素。结果表明:1)首要污染物以PM2.5、PM10、O3为主,我国空气质量综合指数为2~8,呈第三季度、第二季度、第四季度、第一季度依次增大的现象;2)空间上空气质量综合指数由南向北逐渐升高,三大经济圈按珠三角地区、长三角地区、京津冀地区的顺序依次增大,综合指数正相似值间空间集聚显著,南方沿海地区空气质量优于北方地区;3)温度、风速和降水与空气质量综合指数呈负相关关系。改善地表条件、防风固沙以减少沙尘暴,污染源综合治理,使用能源清洁等措施可对改善环境空气质量起关键作用。 展开更多
关键词 环境学 环境空气质量 时空分布特征 探索性空间数据分析
在线阅读 下载PDF
探索性空间数据分析模型研究 被引量:42
13
作者 张学良 《当代经济管理》 2007年第2期26-29,共4页
探索性空间数据分析是空间经济计量学的一个重要领域,解释与空间位置相关的空间依赖、空间关联或空间自相关现象,目前在国内外的应用也越来越广泛。本文就探索性空间数据分析模型进行了综合介绍,并分析了其在未来的应用前景。
关键词 探索性空间数据分析 空间自相关 空间关联
在线阅读 下载PDF
中国区域人均GDP增长速度的探索性空间数据分析 被引量:20
14
作者 何江 张馨之 《统计与决策》 CSSCI 北大核心 2006年第22期72-74,共3页
本文运用空间统计方法——探索性空间数据分析方法,考察了1990-2004年中国341个区域单位人均GDP增长速度的空间相关性和空间异质性,揭示了中国区域经济增长的空间模式及其变动特征。分析结果表明,为了更加深入地理解中国区域经济增长,... 本文运用空间统计方法——探索性空间数据分析方法,考察了1990-2004年中国341个区域单位人均GDP增长速度的空间相关性和空间异质性,揭示了中国区域经济增长的空间模式及其变动特征。分析结果表明,为了更加深入地理解中国区域经济增长,应强调空间因素的重要性。最后,基于分析结果提出协调区域经济发展的政策建议。 展开更多
关键词 中国区域经济增长 人均GDP增长速度 探索性空间数据分析 空间分布
在线阅读 下载PDF
基于探索性空间数据的县域经济空间差异研究 被引量:5
15
作者 何秀芝 刘玥 李朝旗 《统计与决策》 CSSCI 北大核心 2015年第16期96-99,共4页
将基于熵权的逼近理想解排序法和探索性空间数据分析方法应用于县域经济水平空间差异分析,以广东省88个县(区)作为研究对象,选取18项经济指标数据,对2012年广东各县区经济空间相关性进行了计量分析并对空间差异的特征进行了初步探索。... 将基于熵权的逼近理想解排序法和探索性空间数据分析方法应用于县域经济水平空间差异分析,以广东省88个县(区)作为研究对象,选取18项经济指标数据,对2012年广东各县区经济空间相关性进行了计量分析并对空间差异的特征进行了初步探索。结果表明:广东省内区域经济发展的差异很明显,经济综合实力较强的都处于珠三角地区,而经济实力较弱的都集中在山区;广东省区域经济发展过程中呈现出显著的空间自相关特征,经济发达的县域在空间上趋于集中。 展开更多
关键词 县域经济 逼近理想解排序法 探索性空间数据分析 空间差异
在线阅读 下载PDF
中国油砂富集区域资源勘探开发序列研究——基于探索性空间数据分析 被引量:1
16
作者 胡健 周艳春 《统计与信息论坛》 CSSCI 2014年第1期76-80,共5页
以中国油砂资源富集的省域为研究对象,综合运用SPSS和GeoDA软件,对中国区域油砂资源丰度和投资环境的空间差异分析后发现:中国油砂富集区域的资源丰度与投资环境差异较大,资源丰度较高的区域主要集中于西部,而投资环境较优的区域则主要... 以中国油砂资源富集的省域为研究对象,综合运用SPSS和GeoDA软件,对中国区域油砂资源丰度和投资环境的空间差异分析后发现:中国油砂富集区域的资源丰度与投资环境差异较大,资源丰度较高的区域主要集中于西部,而投资环境较优的区域则主要集中于东部和中部;资源丰度的全局自相关特征明显,存在着相似值的空间集聚特征;依据油砂资源丰度与区域投资环境组合类型的空间特征,可以规划出中国区域油砂资源的勘探开发序列。 展开更多
关键词 探索性空间数据分析 油砂 资源丰度 投资环境 空间分析
在线阅读 下载PDF
开封市商品住宅价格的探索性空间数据分析 被引量:8
17
作者 赵自胜 《地域研究与开发》 CSSCI 北大核心 2009年第4期105-109,共5页
商品住宅价格空间分布是房地产价格研究的热点。为了探测商品住宅价格的空间分布特征,以开封市商品住宅交易均价为例,利用探索性空间数据分析(ESDA)的理论与方法分析开封市商品住宅价格空间自相关性和变异性。研究表明:开封市商品住宅... 商品住宅价格空间分布是房地产价格研究的热点。为了探测商品住宅价格的空间分布特征,以开封市商品住宅交易均价为例,利用探索性空间数据分析(ESDA)的理论与方法分析开封市商品住宅价格空间自相关性和变异性。研究表明:开封市商品住宅价格全局空间自相关性显著,总体上呈空间集聚格局;开封市大部分商品住宅价格呈现局部空间集聚格局,少量存在空间异质性而呈现局部离散格局;开封商品住宅价格的地域分异规律明显。 展开更多
关键词 商品住宅价格 空间自相关 探索性空间数据分析 开封市
在线阅读 下载PDF
中国省域农村居民消费水平探索性空间数据分析:1993-201 被引量:2
18
作者 罗建利 郑阳阳 《商业研究》 CSSCI 北大核心 2016年第2期28-34,共7页
运用探索性空间数据分析方法,对1993-2013年中国各省域农村居民消费水平空间分布特征及其动态演化机制进行分析。研究发现:各省域的农村居民消费水平非随机分布,而是呈正的空间相关特性,农村居民消费水平相似的省份在地理空间呈聚集趋势... 运用探索性空间数据分析方法,对1993-2013年中国各省域农村居民消费水平空间分布特征及其动态演化机制进行分析。研究发现:各省域的农村居民消费水平非随机分布,而是呈正的空间相关特性,农村居民消费水平相似的省份在地理空间呈聚集趋势;通过Moran散点图和LISA聚类变化图分析,得出一个是以东部沿海省份组成的HH聚集区,一个是以西部省份组成的LL聚集区,而且这种空间格局随着时间推移呈现一定的稳定性和强化性。 展开更多
关键词 农村居民消费水平 探索性空间数据分析 Moran’s I 局部Moran’s I
在线阅读 下载PDF
太湖MODIS-EVI完全时空数据获取与探索性分析
19
作者 张恒敢 顾克军 张斯梅 《安徽农业科学》 CAS 2017年第19期226-230,共5页
构建太湖水域较长时间范围的植被指数全时空数据有助于全面了解太湖蓝藻水华的时空变化特征。以MODIS数据产品MOD13Q1为数据源,构建了太湖水域MODIS-EVI全时空数据,并做了探索性空间数据分析。结果表明,该研究的时空数据获取和分析方法... 构建太湖水域较长时间范围的植被指数全时空数据有助于全面了解太湖蓝藻水华的时空变化特征。以MODIS数据产品MOD13Q1为数据源,构建了太湖水域MODIS-EVI全时空数据,并做了探索性空间数据分析。结果表明,该研究的时空数据获取和分析方法是可行的,对该数据进行经验正交函数分解,能够获得太湖水面EVI典型的空间分布模式。 展开更多
关键词 水华 增强植被指数 探索性空间数据分析
在线阅读 下载PDF
基于EDA统计图量化的桥梁动态监测数据质量评估
20
作者 殷鹏程 谭曼丽莎 +1 位作者 曹阳梅 单德山 《重庆交通大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第5期9-16,共8页
探索性数据分析统计图在桥梁健康监测动态数据质量评估中已有广泛应用。为了减少人工观察统计图的主观性,通过近似度量方法实现统计图的量化分析,得到多个指标对监测数据进行快速质量评估。在运营环境激励作用下,桥梁结构动力响应具有... 探索性数据分析统计图在桥梁健康监测动态数据质量评估中已有广泛应用。为了减少人工观察统计图的主观性,通过近似度量方法实现统计图的量化分析,得到多个指标对监测数据进行快速质量评估。在运营环境激励作用下,桥梁结构动力响应具有短时线性平稳性,近似服从正态分布。以某大跨斜拉桥振动数据为研究对象,首先,绘制样本数据直方图和Q-Q图,通过观察数据分布特征预先判断数据质量,确定优、良和差3个等级。然后,分别通过KL散度和余弦相似度2种近似度量方法对样本数据直方图和Q-Q图进行量化,得到数据服从正态分布程度的指标;通过箱线图检测样本数据全局异常点,得到正常数据占比;统计分析得到量化值和先验质量等级的对应关系,确定以直方图KL散度和余弦相似度为主、以箱线图正常数据占比为辅的数据质量评估标准。最后,取部分数据为验证集,进一步验证所提方法各个指标的合理性,并给出该方法在实际工程上的应用结果。 展开更多
关键词 桥梁工程 桥梁结构健康监测 数据质量评估 探索数据分析 KL散度 余弦相似度 箱线图
在线阅读 下载PDF
上一页 1 2 12 下一页 到第
使用帮助 返回顶部