期刊文献+
共找到24篇文章
< 1 2 >
每页显示 20 50 100
基于频繁模式半结构化数据的模式抽取 被引量:4
1
作者 李颖 张晓贤 孙佳慧 《吉林大学学报(信息科学版)》 CAS 2012年第5期540-543,共4页
为克服半结构化数据存储复杂的缺点,提出一种基于动态树的半结构化的存储模型。对该模型进行模式抽取,并将其引入到Apriori算法。通过设置最小支持度阀值过滤掉不必要的信息,输出最长频繁路径的集合,以实现半结构化数据的提取。实验结... 为克服半结构化数据存储复杂的缺点,提出一种基于动态树的半结构化的存储模型。对该模型进行模式抽取,并将其引入到Apriori算法。通过设置最小支持度阀值过滤掉不必要的信息,输出最长频繁路径的集合,以实现半结构化数据的提取。实验结果表明,该算法能同时有效地处理分支及环路问题,避免了死循环的出现。 展开更多
关键词 半结构化数据 数据挖掘 频繁模式 模式抽取
在线阅读 下载PDF
半结构化数据查询语言的特性 被引量:1
2
作者 万谦 陆建江 +1 位作者 刘忠英 宋自林 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2002年第1期133-137,共5页
结合查询语言Lorel及其与对象查询语言OQL的差异 ,对半结构化数据查询语言的特性进行了深入的分析 .结果表明 。
关键词 半结构化数据 路径表达式 数据查询语言 程序设计语言
在线阅读 下载PDF
档案管理中半结构化数据智能检索研究 被引量:1
3
作者 金保华 张兴 郭小娟 《郑州轻工业学院学报(自然科学版)》 CAS 2015年第5期81-84,共4页
档案数据形式多样、数据量巨大,特别是半结构化数据结构复杂,给档案管理工作造成巨大困难.针对这种情况提出了一种基于本体的智能档案信息检索系统.该系统的处理过程分为两个部分:第一部分是半结构化数据的处理,采用特征数据提取的方法... 档案数据形式多样、数据量巨大,特别是半结构化数据结构复杂,给档案管理工作造成巨大困难.针对这种情况提出了一种基于本体的智能档案信息检索系统.该系统的处理过程分为两个部分:第一部分是半结构化数据的处理,采用特征数据提取的方法对半结构化数据进行特征提取,进而重组成为结构化数据;第二部分是智能检索的实现,利用基于本体的逻辑推理实现语义层次的智能检索.实验结果表明,该智能检索系统较基于关键字的传统检索在查全率和查准率上都有了较大提高. 展开更多
关键词 半结构化数据 本体推理 智能检索 档案管理
在线阅读 下载PDF
面向半结构化数据的数据模型和数据挖掘方法研究 被引量:1
4
作者 孔令信 《煤炭技术》 CAS 北大核心 2012年第12期177-179,共3页
作为互联网中重要数据形式之一,半结构化数据是开展数据挖掘的重要前提性条件。而进行数据挖掘旨在发现并提取大型数据库中所隐含的有价值的信息。首先介绍了半结构化数据的概念及其特点,在此基础上分别从半结构化数据表示、数据模型两... 作为互联网中重要数据形式之一,半结构化数据是开展数据挖掘的重要前提性条件。而进行数据挖掘旨在发现并提取大型数据库中所隐含的有价值的信息。首先介绍了半结构化数据的概念及其特点,在此基础上分别从半结构化数据表示、数据模型两方面对半结构化数据模型进行介绍,最后总结半结构化数据模式与之前关系数据模式间的差别。 展开更多
关键词 半结构化数据 数据模型 数据挖掘
在线阅读 下载PDF
半结构化数据模型与数据挖掘技术分析 被引量:1
5
作者 陈一明 《中山大学学报论丛》 2002年第1期266-270,共5页
要对Internet上巨量的数据进行数据挖掘 ,半结构化数据模型及其抽取技术是前提。对数据挖掘技术和Internet上数据结构的特征进行分析 ,并就把XML作为一种半结构化的数据模型实施查询与模型抽取 ,从而完成面向Internet数据挖掘的方法 ,... 要对Internet上巨量的数据进行数据挖掘 ,半结构化数据模型及其抽取技术是前提。对数据挖掘技术和Internet上数据结构的特征进行分析 ,并就把XML作为一种半结构化的数据模型实施查询与模型抽取 ,从而完成面向Internet数据挖掘的方法 ,且结合SQLServer 2 0 0 展开更多
关键词 半结构化数据模型 XML 数据挖掘 Internet 数据结构 异构数据 人工智能 知识发现
在线阅读 下载PDF
半结构化数据OEM图应用 被引量:2
6
作者 曹文仙 赵雪岩 +1 位作者 李建成 邓轲 《西安工程科技学院学报》 2007年第1期92-95,共4页
研究了如何利用查询和视图来解决半结构化数据查询重写问题.给出了一种OEM数据模型和一种半结构化数据查询重写算法.算法借用了半结构化数据查询重写桶算法的思想,解决了半结构化数据模型之下查询重写的一些新问题.理论分析表明,它降低... 研究了如何利用查询和视图来解决半结构化数据查询重写问题.给出了一种OEM数据模型和一种半结构化数据查询重写算法.算法借用了半结构化数据查询重写桶算法的思想,解决了半结构化数据模型之下查询重写的一些新问题.理论分析表明,它降低了算法的代价. 展开更多
关键词 对象交换模型(OEM) TSL 查询重写 算法 半结构化数据
在线阅读 下载PDF
并行处理网络下半结构化大数据快速聚类方法 被引量:1
7
作者 王珂 《信息技术与信息化》 2024年第1期126-130,共5页
半结构化数据量已经超过PB级,在这种大规模数据集上快速响应交互式请求,对关系数据库查询和大数据处理技术都提出了挑战。然而当前的聚类算法均是离线批量处理结构化、非结构化数据。面对半结构化数据对象和应用需求的转变,需要对传统... 半结构化数据量已经超过PB级,在这种大规模数据集上快速响应交互式请求,对关系数据库查询和大数据处理技术都提出了挑战。然而当前的聚类算法均是离线批量处理结构化、非结构化数据。面对半结构化数据对象和应用需求的转变,需要对传统聚类算法针对性地优化和改进。设计一种并行处理网络下半结构化大数据快速聚类方法。首先,在常用的Linux与Windows网络环境中捕获大数据包,并对捕获的多源异构大数据做清洗和集成等预处理操作,完成数据准备工作;然后在并行处理网络下,基于MapReduce框架改进常规CanpoyK-means聚类算法形成BCK-means并行聚类算法,对多源异构大数据进行并行化聚类分析,实现半结构化大数据的快速聚类挖掘。实验结果表明,设计方法在10 s内即可完成不同类别的半结构化数据集的聚类且聚类结果稳定,在半结构化数据聚类挖掘效率方面具有优势。 展开更多
关键词 并行处理网络 结构化数据 数据快速聚类 聚类方法
在线阅读 下载PDF
一种Excel数据到结构化数据的转换方法 被引量:3
8
作者 文必龙 王瑞 +1 位作者 姚建蓬 黄俊莲 《佳木斯大学学报(自然科学版)》 CAS 2006年第3期365-367,共3页
Excel作为Microsoft Office的一部分,已经被广泛应用于各行各业的数据统计,办公电子表格文档处理等,如何将这些数据与关系数据进行统一管理,Excel半结构化数据与结构化数据的集成是前提.本文采用把XML做为中间转换模型的方法,实现Excel... Excel作为Microsoft Office的一部分,已经被广泛应用于各行各业的数据统计,办公电子表格文档处理等,如何将这些数据与关系数据进行统一管理,Excel半结构化数据与结构化数据的集成是前提.本文采用把XML做为中间转换模型的方法,实现Excel数据与结构化数据之间的转换. 展开更多
关键词 半结构化数据 数据集成 XML
在线阅读 下载PDF
XML Schema对关系型数据源的映射 被引量:7
9
作者 高峰 鲁士文 《微电子学与计算机》 CSCD 北大核心 2004年第2期15-17,共3页
文章讨论了xml文档与关系型数据库之间的关系,指出由于数据结构不同二者之间的数据不能够直接访问。在介绍XMLSchema的优点后,描述并通过实例展示了在XMLSchema与关系型数据源之间的一种映射转换算法。
关键词 关系型数据 数据结构 关系型数据 XML SCHEMA 半结构化数据模型 数据类型
在线阅读 下载PDF
异构数据源统一查询技术的研究 被引量:2
10
作者 戴坚锋 高静 庄毅 《微电子学与计算机》 CSCD 北大核心 2004年第8期63-64,共2页
本文提出一种新的异构数据查询技术,该技术可以有效地对异构数据进行统一查询,从而避免了传统数据集成中语义转换的问题,提高了查询效率,在理论和实践中具有广泛的应用价值。
关键词 异构数据 数据集成 半结构化数据
在线阅读 下载PDF
生物信息二级数据库的RM-CwX构建模式
11
作者 陆枫 卢正鼎 +1 位作者 陈传波 肖奕 《高技术通讯》 EI CAS CSCD 2004年第12期25-28,共4页
提出了一种适用于生物信息领域的RM-CwX(RDB model compafible with XML)数据库构建模式,它采用关系数据库管理系统来存储和管理收集到的生物信息,采用XML形式的半结构化数据进行信息的发布。通过硒蛋白相关生物信息二级数据库的构建... 提出了一种适用于生物信息领域的RM-CwX(RDB model compafible with XML)数据库构建模式,它采用关系数据库管理系统来存储和管理收集到的生物信息,采用XML形式的半结构化数据进行信息的发布。通过硒蛋白相关生物信息二级数据库的构建实例说明,该模式可有效地构建生物信息二级数据库系统,在对相关生物信息进行及时收集和有效管理的基础上,不仅可以提供相关生物信息的网页浏览及交叉索引,提供复杂的信息检索,同时还能够较大限度地处理生物信息数据源中常见的不一致和变化等。 展开更多
关键词 RM 关系数据库管理系统 生物信息 XML 网页浏览 半结构化数据 RDB 构建模式 收集 信息检索
在线阅读 下载PDF
病案数据的XML存储模式研究
12
作者 王玉凤 徐静 《信息技术》 2008年第10期107-109,共3页
分析病案数据的特点,提出了一种基于XML存储半结构化数据的方法,设计并实现了相应存储与解析算法。鉴于OEM模型是一种图状模型,而通常的XML数据模型是树状模型,为此需解决图状模型数据映射为树状模型数据这一关键问题,利用XML元素和属... 分析病案数据的特点,提出了一种基于XML存储半结构化数据的方法,设计并实现了相应存储与解析算法。鉴于OEM模型是一种图状模型,而通常的XML数据模型是树状模型,为此需解决图状模型数据映射为树状模型数据这一关键问题,利用XML元素和属性的语义信息可从语义级别解决该问题。 展开更多
关键词 半结构化数据 OEM模型 XML DOM
在线阅读 下载PDF
一种基于XML的Web数据挖掘技术 被引量:8
13
作者 王建丽 丁振国 《西安科技学院学报》 北大核心 2002年第3期337-340,共4页
阐述了一种基于XML的数据抽取技术 ,并示例如何将该技术应用于Web信息的挖掘 ,通过对实例的剖析 ,提出了有关技术人员如何通过该数据挖掘技术拥有一个维护成本低廉而且可靠的数据抽取系统 。
关键词 数据挖掘 半结构化数据 XML 数据抽取系统 Web 异构数据 信息发布 数据模型
在线阅读 下载PDF
大数据背景下政府决策数据化的实现路径 被引量:1
14
作者 程秋月 张顺 《领导科学》 北大核心 2016年第16期7-9,共3页
政府决策数据化既是对传统政府决策思想的继承,又是基于新一代信息技术的发展,借力于大数据技术对传统政府决策的创新与突破。大数据与政府决策数据化的内在关联将从作用与反作用两个角度得到清晰的展现:大数据为政府决策数据化的实现... 政府决策数据化既是对传统政府决策思想的继承,又是基于新一代信息技术的发展,借力于大数据技术对传统政府决策的创新与突破。大数据与政府决策数据化的内在关联将从作用与反作用两个角度得到清晰的展现:大数据为政府决策数据化的实现提供发展动力,政府决策数据化为大数据的应用发展提供政策支持。 展开更多
关键词 决策数据 顶层设计 半结构化数据 平台资源 数据 预处理工作 决策思想 处理阶段 辅助决策 共享数据
在线阅读 下载PDF
基于图数据的极大频繁子树挖掘算法研究 被引量:1
15
作者 唐德权 黄金贵 《微电子学与计算机》 北大核心 2020年第10期54-58,共5页
由于极大频繁子树中已经隐含了所有频繁子树信息,尤其处理大型图数据集时候,挖掘极大频繁子树对提高频繁子树挖掘算法效率具有重要意义.首先在有效编码的基础上提出连接和扩展操作算法,通过两个算法产生所有极大候选子树;其次引入嵌入... 由于极大频繁子树中已经隐含了所有频繁子树信息,尤其处理大型图数据集时候,挖掘极大频繁子树对提高频繁子树挖掘算法效率具有重要意义.首先在有效编码的基础上提出连接和扩展操作算法,通过两个算法产生所有极大候选子树;其次引入嵌入集计算解决子树同构问题,对子树同构问题进行了优化,进一步提出了一种新的极大频繁子树挖掘算法(MFST);最后证明了算法的正确性和分析了算法在最坏情况下的时间性能,并与其它基于半结构化数据集的频繁子树挖掘算法进行了比较.实验结果表明,MFST算法具有更好的时间性能和空间性能,可以在图数据集中有效挖掘频繁子树. 展开更多
关键词 极大频繁子树 数据 候选子树 子树同构 半结构化数据
在线阅读 下载PDF
数据挖掘技术分析 被引量:1
16
作者 周密 《河南科技》 2011年第4X期33-34,共2页
随着数据库技术的迅速发展以及数据库管理系统的广泛应用,数据库中的信息量在不断增加。人们面对"被数据淹没,却饥饿于知识"的挑战,为此,数据挖掘和知识发现(DMKD)技术便应运而生,并得到了蓬勃发展,日益显示出其强大的生命力... 随着数据库技术的迅速发展以及数据库管理系统的广泛应用,数据库中的信息量在不断增加。人们面对"被数据淹没,却饥饿于知识"的挑战,为此,数据挖掘和知识发现(DMKD)技术便应运而生,并得到了蓬勃发展,日益显示出其强大的生命力。一、数据挖掘的定义数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的和随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。而且。 展开更多
关键词 数据挖掘技术 定义数据 序列模式 决策树方法 半结构化数据 文档数据 频繁项集 业务对象 文本数据 数据挖掘应用
在线阅读 下载PDF
路基设计软件中横断面数据处理的探讨 被引量:2
17
作者 陈豪 《科学技术创新》 2021年第22期140-142,共3页
为了开发自主可控路基设计软件,预研了一种路基横断面数据处理方法,研究首先分析了路基横断面数据处理问题,再对半结构化数据的处理方法进行了归纳,并以某路基横断面为例,按嵌套层次JSON数据方式建模并在MongoDB增删查改,最后得出结论:... 为了开发自主可控路基设计软件,预研了一种路基横断面数据处理方法,研究首先分析了路基横断面数据处理问题,再对半结构化数据的处理方法进行了归纳,并以某路基横断面为例,按嵌套层次JSON数据方式建模并在MongoDB增删查改,最后得出结论:非关系数据库可以无阻抗匹配面向对象设计方法,并对各种繁杂多变的工程数据进行统一处理。 展开更多
关键词 路基横断面 地层线 半结构化数据 JSON格式 NOSQL数据
在线阅读 下载PDF
互联网络科技信息自动抽取系统的开发
18
作者 程显林 王敬山 +1 位作者 韩冬 姜建国 《大庆石油学院学报》 CAS 北大核心 2008年第6期103-105,共3页
为自动从网页中抽取所需科技信息,根据两类知识:一类描绘网页本身的特点及识别各网页信息对象的确定模式知识;另一类描述网页信息记录块及各网页信息对象的非确定模式知识,提出一种基于知识库的信息抽取方法,给出初步实现的可以运行的... 为自动从网页中抽取所需科技信息,根据两类知识:一类描绘网页本身的特点及识别各网页信息对象的确定模式知识;另一类描述网页信息记录块及各网页信息对象的非确定模式知识,提出一种基于知识库的信息抽取方法,给出初步实现的可以运行的原型系统.该系统依据前一类知识,经过动态分析,获得后一类知识,然后利用这2类知识自动完成从信息内容类似,但其表现形式各异的网页中抽取所需的科技信息.应用结果表明:实验网页论文信息被成功提取. 展开更多
关键词 INTERNET 信息抽取 半结构化数据 抽取器
在线阅读 下载PDF
EMC推出全球领先的管理平台
19
作者 乐宁 《通信世界》 2007年第26B期23-23,共1页
互联网带来消费行为的改变,各种类型的数据正以每年200%的速度增加,这种情况使企业面临管理数据和提升数据价值的难题,尤其是占总量80%以上的半结构化数据。
关键词 管理平台 EMC 半结构化数据 消费行为 管理数据
在线阅读 下载PDF
煤科云智能一体化管控平台在天地王坡煤矿的设计与应用 被引量:7
20
作者 王磊 苌延辉 +3 位作者 苏上海 张晓霞 杨培培 徐华龙 《智能矿山》 2023年第12期8-16,共9页
山西天地王坡煤业有限公司(简称天地王坡煤矿)是一座高产高效的现代化煤矿。近年来,天地王坡煤矿各个生产环节的自动化、信息化和智能化系统产生了海量的工业数据,已经形成了覆盖煤矿全流程、全要素的工业大数据。然而,在数据利用、数... 山西天地王坡煤业有限公司(简称天地王坡煤矿)是一座高产高效的现代化煤矿。近年来,天地王坡煤矿各个生产环节的自动化、信息化和智能化系统产生了海量的工业数据,已经形成了覆盖煤矿全流程、全要素的工业大数据。然而,在数据利用、数据分析与建模、智能联动等方面,仍存在以下问题:(1)多源异构数据深度融合不足。煤矿生产、安全和经营管理数据格式多样,涵盖结构化数据、非结构化数据和半结构化数据,类型包括时序型、关系型、对象型、时空型等,难以融合和使用。 展开更多
关键词 半结构化数据 结构化数据 工业大数据 数据利用 工业数据 数据格式 智能联动 智能化系统
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部