期刊文献+
共找到64篇文章
< 1 2 4 >
每页显示 20 50 100
基于属性值序列图模型的deep Web新数据发现策略 被引量:4
1
作者 鲜学丰 崔志明 +3 位作者 赵朋朋 方立刚 杨元峰 顾才东 《通信学报》 EI CSCD 北大核心 2016年第3期20-32,共13页
针对数据源新产生数据记录的增量爬取问题,提出了一种deep Web新数据发现策略,该策略采用一种新的属性值序列图模型表示deep Web数据源,将新数据发现问题转化为属性值序列图的遍历问题,该模型仅与数据相关,与现有查询关联图模型相比,具... 针对数据源新产生数据记录的增量爬取问题,提出了一种deep Web新数据发现策略,该策略采用一种新的属性值序列图模型表示deep Web数据源,将新数据发现问题转化为属性值序列图的遍历问题,该模型仅与数据相关,与现有查询关联图模型相比,具有更强的适应性和确定性,可适用于仅仅包含简单查询接口的deep Web数据源。在此模型的基础上,发现增长节点并预测其新数据发现能力;利用互信息计算节点之间的依赖关系,查询选择时尽可能地降低查询依赖带来的负面影响。该策略提高了新数据爬取的效率,实验结果表明,在相同资源约束前提下,该策略能使本地数据和远程数据保持最大化同步。 展开更多
关键词 DEEP WEB 数据发现 数据获取
在线阅读 下载PDF
基于元数据的数据发现和数据评价 被引量:3
2
作者 赵华 周国民 王健 《现代情报》 CSSCI 北大核心 2015年第4期65-68,共4页
元数据在信息资源发现过程中发挥了重要作用。科学数据元数据也不例外,它为用户发现、评价和再利用科学数据提供了依据。本文在阐述科学数据和科学数据元数据内涵的基础上,对科学数据的用户需求进行了分析,重点分析了用户查找与发现科... 元数据在信息资源发现过程中发挥了重要作用。科学数据元数据也不例外,它为用户发现、评价和再利用科学数据提供了依据。本文在阐述科学数据和科学数据元数据内涵的基础上,对科学数据的用户需求进行了分析,重点分析了用户查找与发现科学数据的过程,此外,本文针对如何完善科学数据元数据提出建议,以促进用户对科学数据的发现和使用。 展开更多
关键词 数据 数据发现 数据评价 用户需求 认知
在线阅读 下载PDF
数据发现在地球化学数据处理中的应用 被引量:2
3
作者 陈春香 《桂林工学院学报》 1999年第3期230-234,共5页
数据发现是机器学习中的归纳学习法,适用于定量数据的处理。在广东云浮—阳春地区的实践证明,此方法应用于地球化学数据的处理可加大数据的处理量,挖掘隐含在数据中的各参数间的相互关系及参数组合关系。增加已知模型的信息量,增强... 数据发现是机器学习中的归纳学习法,适用于定量数据的处理。在广东云浮—阳春地区的实践证明,此方法应用于地球化学数据的处理可加大数据的处理量,挖掘隐含在数据中的各参数间的相互关系及参数组合关系。增加已知模型的信息量,增强模式识别能力。 展开更多
关键词 数据处理 机器学习 数据发现 地球化学 找矿
在线阅读 下载PDF
CMS实验元数据发现的数据聚集系统
4
作者 梁栋 臧冬松 +2 位作者 霍菁 孙功星 Valentin Kuznetsov 《计算机工程》 CAS CSCD 2014年第4期57-63,70,共8页
在大型强子对撞机上的紧凑繆子螺线管探测器实验,具有数据量大(PB级规模)、数据类型复杂与数据地理上全球分布的特点。记录上述数据的元数据达到TB级的规模,并且以不同的格式保存在不同的关系和非关系数据源中,通过在这些异构数据源上... 在大型强子对撞机上的紧凑繆子螺线管探测器实验,具有数据量大(PB级规模)、数据类型复杂与数据地理上全球分布的特点。记录上述数据的元数据达到TB级的规模,并且以不同的格式保存在不同的关系和非关系数据源中,通过在这些异构数据源上添加一个缓存层的方法,实现一个提供精确的关键词查询的数据聚集系统。根据多重映射和聚集的方式支持用户的查询,并利用有效的缓存管理策略来提升查询的命中率。实验结果表明,该系统能够通过缓存的方式响应超过70%的用户查询,具有良好的查询性能。 展开更多
关键词 关键词查询 数据聚集 数据发现 缓存管理 映射 异构数据
在线阅读 下载PDF
北京师范大学天文系学者基于LAMOST巡天数据发现4颗新的DA型脉动白矮星
5
《北京师范大学学报(自然科学版)》 CAS CSCD 北大核心 2017年第5期527-527,共1页
近期,北京师范大学天文系博士后苏杰和付建宁教授等基于我国大科学装置郭守敬望远镜(又称LAMOST)巡天数据的自矮星星表,观测发现了4颗新的DA型脉动白矮星.白矮星是中、小质量恒星演化的晚期阶段,是一种由电子简并态物质构成的致... 近期,北京师范大学天文系博士后苏杰和付建宁教授等基于我国大科学装置郭守敬望远镜(又称LAMOST)巡天数据的自矮星星表,观测发现了4颗新的DA型脉动白矮星.白矮星是中、小质量恒星演化的晚期阶段,是一种由电子简并态物质构成的致密天体.由于银河系中大约98%的恒星最终都会演化成为白矮星。 展开更多
关键词 北京师范大学 白矮星 LAMOST 数据发现 脉动 A型 天文 巡天
在线阅读 下载PDF
数据仓库与知识发现 被引量:16
6
作者 楼伟进 孔繁胜 楼伟忠 《计算机工程与应用》 CSCD 北大核心 2000年第10期111-113,共3页
文章通过对数据仓库的概念以及基于数据仓库的知识发现系统的技术特点的介绍,揭示了基于数据仓库的知识发现应用的优势.
关键词 数据仓库 数据发现 数据库系统
在线阅读 下载PDF
基于双数据目录存储的网格元数据的资源发现
7
作者 孟宪虎 《计算机工程》 EI CAS CSCD 北大核心 2006年第15期55-57,共3页
提出了基于全局命名的数据网格环境下元数据目录和资源信息目录双目录存储和访问的概念,研究了全局命名的规则,给出了在该命名情况下元数据的注册和存储以及利用这种注册存储如何快速发现远程数据资源。说明了在多网格结点下寻找“对照... 提出了基于全局命名的数据网格环境下元数据目录和资源信息目录双目录存储和访问的概念,研究了全局命名的规则,给出了在该命名情况下元数据的注册和存储以及利用这种注册存储如何快速发现远程数据资源。说明了在多网格结点下寻找“对照表”采取时间戳抑制多次重发和导致多次访问数据资源的方法,并指出了“对照表”应采取的热点数据优先、冷僻数据清除的策略。 展开更多
关键词 数据网格 数据 双目录存储管理 全局命名 数据发现
在线阅读 下载PDF
山东蒙阴金刚石矿床地质大数据三维建模与成矿预测 被引量:1
8
作者 陈建平 周冠云 +1 位作者 褚志远 赵婕 《矿床地质》 CAS CSCD 北大核心 2024年第4期802-820,共19页
大数据时代的到来,需要我们在大数据思维指导下进行三维地质建模工作。笔者以山东蒙阴西峪金刚石矿作为为研究对象,基于大数据发现技术与大数据挖掘技术实现了传统三维地质建模工作和信息技术的深度融合,结合可视化表达等技术方法充分... 大数据时代的到来,需要我们在大数据思维指导下进行三维地质建模工作。笔者以山东蒙阴西峪金刚石矿作为为研究对象,基于大数据发现技术与大数据挖掘技术实现了传统三维地质建模工作和信息技术的深度融合,结合可视化表达等技术方法充分提取了文本数据中西峪金刚石矿的成因模式信息与地球物理勘探标准信息;并在此指导下完成了地球物理信息的解译工作,以期降低地球物理信息多解性对三维地质建模干扰,提高三维地质建模的准确性。最后,结合对成因模式与地球物理勘探标准的深入认识,文章实现了蒙阴金刚石深部含矿性分析,并初步圈定了成矿远景区。 展开更多
关键词 数据发现 数据挖掘 三维地质建模 蒙阴西峪金刚石矿
在线阅读 下载PDF
科学论文内的科学数据组织和发现研究 被引量:3
9
作者 丁培 《现代情报》 CSSCI 2020年第2期34-43,共10页
[目的/意义]科学论文中的图、表等科学数据(文内数据)蕴含有丰富的知识内容。基于细粒度语义组织的文内数据发现有效聚合文献、科学数据两类科研产出,为未来实现全领域、全维度、全粒度、全类型的深度知识发现奠定基础。[方法/过程]梳... [目的/意义]科学论文中的图、表等科学数据(文内数据)蕴含有丰富的知识内容。基于细粒度语义组织的文内数据发现有效聚合文献、科学数据两类科研产出,为未来实现全领域、全维度、全粒度、全类型的深度知识发现奠定基础。[方法/过程]梳理、对比、分析现有3类文内数据的发现模式,尝试构建面向细粒度内容描述的文内数据本体,揭示文内数据的显性特征、内容特征以及与其他类型科学产出的关联特征。[结果/结论]从面向应用的角度,提出基于本体的文内数据知识发现技术框架,细化“信息抽取—语义标注—关联应用”技术路线,针对关键点技术进行讨论。文内数据本体为科学论文内科学数据提供语义描述和关联组织依据,人工标注结合机器学习自动标注可以解决文内数据部分特征发现问题。 展开更多
关键词 文内数据 科学数据 科学论文 本体组织 数据发现
在线阅读 下载PDF
C-cast:传感器网络中无位置数据分发和发现技术 被引量:1
10
作者 李志刚 吴君青 《传感技术学报》 CAS CSCD 北大核心 2012年第7期985-992,共8页
在无线传感器网络中,基于对等节点的数据分发和发现技术是一项关键的工作和研究问题。现有的研究技术和协议设计多数依赖于节点的位置信息,但是在传感器网络中节点获取位置信息需要精确的定位算法和大量的计算、通信开销。为满足在没有... 在无线传感器网络中,基于对等节点的数据分发和发现技术是一项关键的工作和研究问题。现有的研究技术和协议设计多数依赖于节点的位置信息,但是在传感器网络中节点获取位置信息需要精确的定位算法和大量的计算、通信开销。为满足在没有位置信息的情况下,节点依然能够有效地进行数据分发和发现工作,本文提出了C-cast协议。C-cast协议不仅不依赖于精确的物理位置信息和大功耗的定位服务,而且节点不需要存储维护太多的全局拓扑信息。本文证明了在稠密网络的理想模型下,C-cast协议能够达到100%的数据查询成功率;在随机模型下,通过选择跳步距离适当的两个信标节点,C-cast协议能够达到80%以上的实际数据查询成功率。本文测试了C-cast协议的三种性能,包括数据查询成功率、存储代价和负载均衡。测试结果显示C-cast协议达到甚至超过基于位置信息的协议性能。 展开更多
关键词 无线传感器网络 数据存储发现 数据查询 C-cast
在线阅读 下载PDF
基于分类模型的数据库个性化知识发现方法 被引量:1
11
作者 蒙祖强 蔡自兴 《计算机工程》 CAS CSCD 北大核心 2006年第20期185-187,共3页
利用RS理论和方法提出了个性化知识发现方法——PKDA算法。该算法可以有效地把那些冗余的和用户不感兴趣的信息层层去除,发现用户真正感兴趣的知识。该文给出了实验分析与对比结果,证实了算法的有效性和可行性。
关键词 数据库知识发现 ROUGH SET 分辨矩阵 约简
在线阅读 下载PDF
欧美国家知识发现与数据挖掘过程模型研究及其教育领域应用启示 被引量:2
12
作者 吴兰岸 刘延申 刘怡 《远程教育杂志》 CSSCI 2016年第3期24-31,共8页
教育信息化、大数据战略已成为一种国家意志,通过数据挖掘发现新知识或更新现有知识是计算机信息处理最理想的产品之一。基于明确知识发现与数据挖掘(Knowledge Discovery and Data Mining,KDDM)的领域范畴,在回顾与综合分析欧美国家KDD... 教育信息化、大数据战略已成为一种国家意志,通过数据挖掘发现新知识或更新现有知识是计算机信息处理最理想的产品之一。基于明确知识发现与数据挖掘(Knowledge Discovery and Data Mining,KDDM)的领域范畴,在回顾与综合分析欧美国家KDDM过程模型研究的基础之上,把KDDM过程模型概括为学科交叉性、应用多样性、本质探索性、过程迭代性、目标与结果不确定性等五个主要特征,从中获得在教育领域应用与实施KDDM工程实践的四点启示,并对KDDM在教育领域中的应用提出四点建议。 展开更多
关键词 知识发现数据挖掘 KDDM 过程模型 知识创造 教育应用 学习分析
在线阅读 下载PDF
空间数据挖掘和知识发现与地理可视化的集成 被引量:8
13
作者 王净 《测绘通报》 CSCD 北大核心 2005年第12期20-23,共4页
论述空间数据挖掘和知识发现以及地理可视化的理论及特点,指出二者集成的可能性和必然性,并在此基础上介绍一种集成方法。
关键词 数据挖掘 知识发现 空间数据挖掘和知识发现 地理可视化 GIS
在线阅读 下载PDF
基于MapReduce虚拟机的Deep Web数据源发现方法 被引量:3
14
作者 辛洁 崔志明 +2 位作者 赵朋朋 张广铭 鲜学丰 《通信学报》 EI CSCD 北大核心 2011年第7期189-195,共7页
为了提高Deep Web爬虫发现和搜集数据源的效率,提出了一种融合MapReduce和虚拟化技术实现DeepWeb海量数据挖掘的并行计算方法。基于MapReduce架构提出了一个Deep Web爬虫模型,通过链接过滤分类、页面过滤分类、表单过滤分类等3个MapRed... 为了提高Deep Web爬虫发现和搜集数据源的效率,提出了一种融合MapReduce和虚拟化技术实现DeepWeb海量数据挖掘的并行计算方法。基于MapReduce架构提出了一个Deep Web爬虫模型,通过链接过滤分类、页面过滤分类、表单过滤分类等3个MapReduce过程找到Deep Web数据源接口,并利用虚拟机构建单机集群进行性能测试。实验结果显示该方法可以实现大规模数据的并行处理,有效提高爬虫数据源发现的效率,避免网络及物理资源的浪费,验证了云计算技术在Deep Web数据挖掘方面的可行性。 展开更多
关键词 数据发现 MAPREDUCE DEEP Web 虚拟化技术 云计算
在线阅读 下载PDF
开放科学数据集的统一发现平台研究进展 被引量:10
15
作者 罗鹏程 王继民 聂磊 《情报学报》 CSSCI CSCD 北大核心 2022年第6期637-650,共14页
在开放科学环境下,科学数据的复用受到重视。为了方便研究人员查找科学数据,面向科学数据集的统一发现平台陆续推出,相关数据集检索方法受到研究者的广泛关注。本文对国内外开放科学数据集的统一发现平台相关的研究与应用实践进行广泛调... 在开放科学环境下,科学数据的复用受到重视。为了方便研究人员查找科学数据,面向科学数据集的统一发现平台陆续推出,相关数据集检索方法受到研究者的广泛关注。本文对国内外开放科学数据集的统一发现平台相关的研究与应用实践进行广泛调研,从数据集采集、组织、检索、综合排序四个方面,全面梳理、总结国内外研究进展,并分析未来发展方向。具体地,对数据集采集方法、多源元数据融合方法、元数据质量分析、元数据信息丰富方法、检索匹配中查询扩展和排序方法,以及相关性判据与综合排序方法进行详细介绍和深入分析,以期为进一步的研究和应用实践提供参考。 展开更多
关键词 科学数据 研究数据 数据发现 数据集搜索 数据集检索
在线阅读 下载PDF
基于搜索引擎的Deep Web数据源发现 被引量:1
16
作者 王海龙 胡景芝 +1 位作者 赵朋朋 崔志明 《计算机工程》 CAS CSCD 北大核心 2011年第5期77-79,82,共4页
提出一种利用搜索引擎发现数据源的方法。为向搜索引擎提交高质量的关键词,将本体作为等级化组织词汇的架构引入到初始词构建过程。对所有词汇按在当前领域中出现频率高低进行分类,并根据搜索引擎返回接口集元素数量进行二次分类,确保... 提出一种利用搜索引擎发现数据源的方法。为向搜索引擎提交高质量的关键词,将本体作为等级化组织词汇的架构引入到初始词构建过程。对所有词汇按在当前领域中出现频率高低进行分类,并根据搜索引擎返回接口集元素数量进行二次分类,确保关键词是对发现数据源查询接口贡献较大的词汇。在不同领域上的测试结果表明,该方法能发现相当数量的查询接口,从而验证其有效性。 展开更多
关键词 数据发现 深层网 本体
在线阅读 下载PDF
数据库中弱数据模式的发现
17
作者 韩柯 李德毅 《计算机研究与发展》 EI CSCD 北大核心 1997年第S1期317-321,共5页
实际数据库中的数据分布模式一般较弱,很难凸现有价值的规律.文中提出基于混合层次概念的描述方法,更充分地利用领域专家的背景知识,使用户能够更有力地控制发现过程,提高数据分布模式描述的精确性和准确性,可以发现全局较弱但局... 实际数据库中的数据分布模式一般较弱,很难凸现有价值的规律.文中提出基于混合层次概念的描述方法,更充分地利用领域专家的背景知识,使用户能够更有力地控制发现过程,提高数据分布模式描述的精确性和准确性,可以发现全局较弱但局部较强的数据分布模式. 展开更多
关键词 数据库中的知识发现(KDD) 机器学习 概念树
在线阅读 下载PDF
知识图谱和表示学习在道路交通事故数据挖掘中的应用 被引量:3
18
作者 于德新 彭万里 +2 位作者 吴新程 陈云结 刘晓佳 《安全与环境学报》 CAS CSCD 北大核心 2024年第10期3950-3958,共9页
交通安全领域数据量庞大且蕴含丰富的语义信息,从海量道路交通事故数据中挖掘潜在的价值信息可为交通事故预防和智能研判提供支撑。然而,传统的事故分析方法在处理复杂且多语义交叉的事故数据时,存在一定的局限性。研究提出了一种基于... 交通安全领域数据量庞大且蕴含丰富的语义信息,从海量道路交通事故数据中挖掘潜在的价值信息可为交通事故预防和智能研判提供支撑。然而,传统的事故分析方法在处理复杂且多语义交叉的事故数据时,存在一定的局限性。研究提出了一种基于知识图谱和知识表示学习的事故数据挖掘方法。通过翻译距离嵌入(Translating Embedding,TransE)模型对道路交通事故知识图谱进行表示学习,将事故实体和致因关系映射到向量空间,并在向量匹配运算中捕捉向量之间的语义信息,进而挖掘潜在的交通事故信息。研究采用真实的事故数据进行试验验证,结果表明所提方法具有较高的准确率和较强的语义解析性能,可为道路交通事故碎片化信息的最大化利用提供新的方法和思路。 展开更多
关键词 安全工程 交通安全 道路交通事故 知识图谱 表示学习 数据挖掘与知识发现
在线阅读 下载PDF
国家科研数据服务实践进展及启示 被引量:20
19
作者 刘晓娟 于佳 林夏 《大学图书馆学报》 CSSCI 北大核心 2016年第5期29-37,共9页
基于美国、英国、加拿大、澳大利亚、荷兰、瑞典6个国家科研数据服务的实践,从服务概况、基础设施建设、科研数据的关联、发现、再利用及合作机构等方面总结了各国从国家层面提供科研数据服务的经验。研究表明,国外在国家层面的科研数... 基于美国、英国、加拿大、澳大利亚、荷兰、瑞典6个国家科研数据服务的实践,从服务概况、基础设施建设、科研数据的关联、发现、再利用及合作机构等方面总结了各国从国家层面提供科研数据服务的经验。研究表明,国外在国家层面的科研数据服务方面已经取得了一定的进展。相比之下,我国的科研数据服务目前主要集中在基础科学领域,并且主要提供以学科为导向的数据资源集成服务。我国需要在借鉴学习国际成功经验基础上,加大政府的引导和支持力度,宏观规划国家科研数据服务支撑项目,有效整合各机构和各学科领域的科研数据资源和基础设施,深化科研数据服务层次,最终构建具有中国特色的国家科研数据服务体系。 展开更多
关键词 科研数据服务数据发现 数据关联 数据再利用
在线阅读 下载PDF
分布式空间数据注册容器的设计与实现 被引量:1
20
作者 李丰丹 李超岭 +1 位作者 罗显刚 吕霞 《计算机工程》 CAS CSCD 北大核心 2008年第16期274-276,共3页
分布式空间数据注册容器是国家地质空间信息网格(NGSIG)平台内一种重要的数据发现机制。该文介绍注册容器的重要特征及体系结构,描述其2个重要组成部分,即结点容器和应用门户容器。在NGSIG平台上实现空间数据注册容器,在空间数据整合中... 分布式空间数据注册容器是国家地质空间信息网格(NGSIG)平台内一种重要的数据发现机制。该文介绍注册容器的重要特征及体系结构,描述其2个重要组成部分,即结点容器和应用门户容器。在NGSIG平台上实现空间数据注册容器,在空间数据整合中的应用表明,该容器运行效果良好。 展开更多
关键词 分布式 空间数据 注册容器 数据发现
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部