期刊文献+
共找到88篇文章
< 1 2 5 >
每页显示 20 50 100
半结构化数据查询重写 被引量:16
1
作者 高军 唐世渭 +1 位作者 杨冬青 王腾蛟 《计算机研究与发展》 EI CSCD 北大核心 2002年第2期165-171,共7页
查询重写是数据库研究的一个基本问题 ,它和查询优化 ,数据仓库 ,信息集成 ,语义缓存等问题紧密相关 .目前 Internet上存在海量的半结构化数据 ,在信息集成过程中产生了大量半结构化视图 ,如何利用物化半结构化视图来重写用户查询 ,减... 查询重写是数据库研究的一个基本问题 ,它和查询优化 ,数据仓库 ,信息集成 ,语义缓存等问题紧密相关 .目前 Internet上存在海量的半结构化数据 ,在信息集成过程中产生了大量半结构化视图 ,如何利用物化半结构化视图来重写用户查询 ,减少响应时间成为研究热点问题 .上述问题本质上是 NP问题 ,提出了一种半结构化查询重写的新方法 ,该方法在保证算法正确性和完备性的基础上 ,利用半结构化数据特点和查询子目标之间的关系 ,减少了指数空间的查询重写候选方案生成 .理论分析表明 。 展开更多
关键词 查询重写 OEM 查询包含 半结构化数据 数据
在线阅读 下载PDF
半结构化数据模型及查询语言 被引量:15
2
作者 许学标 顾宁 施伯乐 《计算机研究与发展》 EI CSCD 北大核心 1998年第10期896-901,共6页
在传统数据库中要求查询处理时数据的结构模式已知且固定,这在WWW和异构信息源集成等半结构化数据情形下很难满足.为此,文中给出了一个无模式的自描述简单对象模型SDOM和相应的查询语言SDOQL,很好地解决了上述问题.文... 在传统数据库中要求查询处理时数据的结构模式已知且固定,这在WWW和异构信息源集成等半结构化数据情形下很难满足.为此,文中给出了一个无模式的自描述简单对象模型SDOM和相应的查询语言SDOQL,很好地解决了上述问题.文中同时给出了与查询处理相关的若干问题. 展开更多
关键词 半结构化数据 数据模型 查询语言 数据
在线阅读 下载PDF
基于本体的半结构化数据的柔性查询 被引量:7
3
作者 王真星 顾宁 施伯乐 《计算机研究与发展》 EI CSCD 北大核心 2003年第11期1571-1578,共8页
半结构化数据库没有固定的库模式,用户对其结构难以产生清晰的认识,从而无法有效地查询所需的内容.提出了一种基于本体的柔性查询,用户通过了解数据库本体语义信息而发出的查询不必遵循严格的数据库模式也能得出结果.由于在半结构化数... 半结构化数据库没有固定的库模式,用户对其结构难以产生清晰的认识,从而无法有效地查询所需的内容.提出了一种基于本体的柔性查询,用户通过了解数据库本体语义信息而发出的查询不必遵循严格的数据库模式也能得出结果.由于在半结构化数据库上直接查找效率很低,故在其上生成描述结构模式的概念本体库.查询模块先在本体库上评估能否得出查询结果,再在数据库上执行查询.然而由于本体库可能是图的形式,其查询代价仍然很高,本质上是NP问题,进一步研究了将图转化为树的方法,并给出了相应的算法. 展开更多
关键词 本体 半结构化数据 XML 柔性查询
在线阅读 下载PDF
半结构化数据的模式研究综述 被引量:22
4
作者 王静 孟小峰 《计算机科学》 CSCD 北大核心 2001年第2期6-10,共5页
1 引言 近年来,Internet的飞速发展已经给人类的生活带来了翻天覆地的变化,网络迅速成为一种重要的信息传播和交换的手段.在Internet上,存在着大量的各种形式的数据,如文本文件,HTML文档,各种数据库等,如何快速准确地在网上查找所需的信... 1 引言 近年来,Internet的飞速发展已经给人类的生活带来了翻天覆地的变化,网络迅速成为一种重要的信息传播和交换的手段.在Internet上,存在着大量的各种形式的数据,如文本文件,HTML文档,各种数据库等,如何快速准确地在网上查找所需的信息,成为一个重要的问题.为了解决这个问题,各种搜索引擎维护了大量网站和网页的索引信息,主要采用关键字匹配的方法为用户提供查询服务,但关键字匹配技术存在一些很明显的缺陷,如返回的结果集过大,不能对语义内容和结构进行查询等,这些缺陷决定了搜索引擎所能提供的查询能力是极其有限的.为了更好地对Internet上的数据资源进行管理和查询,数据库界的研究人员开始考虑将数据库的概念和技术引入到该领域.数据库中已有的许多比较成熟的思想和技术,在WWW的新环境下,需要进行扩展和调整,以适应其特点. 展开更多
关键词 半结构化数据 数据 数据模型 INTERNET
在线阅读 下载PDF
基于半结构化数据的新型产品结构模式研究 被引量:8
5
作者 董峥 徐晓飞 战德臣 《计算机集成制造系统-CIMS》 EI CSCD 北大核心 2003年第1期15-19,共5页
针对二维表父子关系存储结构的不足,提出基于XML半结构化数据的新型产品结构解决方案。设计了基于XML的可重用构件库,以提高产品设计效益;同时提出以踪迹树为核心的产品结构树动态联接思想,以平衡系统的存储与计算能力;给出了踪迹树向... 针对二维表父子关系存储结构的不足,提出基于XML半结构化数据的新型产品结构解决方案。设计了基于XML的可重用构件库,以提高产品设计效益;同时提出以踪迹树为核心的产品结构树动态联接思想,以平衡系统的存储与计算能力;给出了踪迹树向产品结构树的映射算法,并提出了可屏蔽系统复杂性的产品结构服务模型。 展开更多
关键词 半结构化数据 产品结构模式 可扩展标记语言 踪迹树 产品数据管理 制造业
在线阅读 下载PDF
网际网上半结构化数据抽取与知识发现方法及其实现 被引量:7
6
作者 陈恩红 范焱 +1 位作者 王行甫 蔡庆生 《计算机科学》 CSCD 北大核心 1999年第10期49-52,共4页
1.引言在信息化程度日益提高的今天,半结构化信息已遍及社会的各个领域。例如,网际网(World WideWeb,又称WWW)已成为一个巨大的信息源,然而WWW上的信息并不能以一种通用的方式进行查询及操纵,大量的信息是以静态的HTML文本形式存储并只... 1.引言在信息化程度日益提高的今天,半结构化信息已遍及社会的各个领域。例如,网际网(World WideWeb,又称WWW)已成为一个巨大的信息源,然而WWW上的信息并不能以一种通用的方式进行查询及操纵,大量的信息是以静态的HTML文本形式存储并只能通过浏览器来浏览,因此如何有效利用这类信息显得尤为重要。 展开更多
关键词 网际网 数据抽取 知识发现 半结构化数据
在线阅读 下载PDF
半结构化数据查询的处理和优化 被引量:12
7
作者 陈滢 王能斌 《软件学报》 EI CSCD 北大核心 1999年第8期883-890,共8页
半结构化数据的特点是数据的结构不规则或不完整,其模型都基于带根有向图,因此,查询处理过程本质上是对图的搜索过程.另外,通配路径使查询处理更加复杂化.文章详细介绍了异构数据源集成系统Versatile中采取的半结构数据OIM(model... 半结构化数据的特点是数据的结构不规则或不完整,其模型都基于带根有向图,因此,查询处理过程本质上是对图的搜索过程.另外,通配路径使查询处理更加复杂化.文章详细介绍了异构数据源集成系统Versatile中采取的半结构数据OIM(modelforobjectintegration)对象的查询和优化策略,包括查询计划的生成、路径扩展和路径索引、层次索引和基于数据源知识这3种查询优化方法.文章介绍的方法同样适用于其他的半结构化数据模型. 展开更多
关键词 半结构化数据 查询处理 优化 数据结构
在线阅读 下载PDF
半结构化数据相似搜索的索引技术研究 被引量:11
8
作者 杨建武 陈晓鸥 《计算机学报》 EI CSCD 北大核心 2002年第11期1219-1226,共8页
为了在海量、高维、动态的半结构化数据集上进行有效的相似搜索,该文提出一种采用聚类技术进行索引构建与更新的多路平衡树——CSS-树以及基于CSS-树的相似搜索与动态更新的算法.CSS-树借鉴SS+-树基于聚类进行节点组织与分裂的基本思想... 为了在海量、高维、动态的半结构化数据集上进行有效的相似搜索,该文提出一种采用聚类技术进行索引构建与更新的多路平衡树——CSS-树以及基于CSS-树的相似搜索与动态更新的算法.CSS-树借鉴SS+-树基于聚类进行节点组织与分裂的基本思想,避免了根据坐标维进行分裂时所要求的维不相关性,同时在节点组织、分裂算法和搜索算法等方面进行了改进,提出了新的搜索剪枝策略.实验表明,该结构及算法对海量半结构化数据相似搜索的效率明显优于传统算法. 展开更多
关键词 半结构化数据 相似搜索 索引 相似索引 聚类 数据挖掘 数据 多路平衡树
在线阅读 下载PDF
一种基于XML的半结构化数据存储方法 被引量:11
9
作者 吴共庆 陈恩红 《计算机工程》 CAS CSCD 北大核心 2004年第10期57-59,共3页
提出了一种基于XML存储半结构化数据的方法,设计并实现了相应存储与解析算法。鉴于OEM模型是一种图状模型,而通常的XML数据模型是树状模型,为此需解决图状模型数据映射为树状模型数据这一关键问题,利用XML元素和属性的语义信息可从... 提出了一种基于XML存储半结构化数据的方法,设计并实现了相应存储与解析算法。鉴于OEM模型是一种图状模型,而通常的XML数据模型是树状模型,为此需解决图状模型数据映射为树状模型数据这一关键问题,利用XML元素和属性的语义信息可从语义级别解决该问题。 展开更多
关键词 半结构化数据 OEM模型 XML DOM
在线阅读 下载PDF
一种结构化数据和半结构化数据的统一集成模型 被引量:5
10
作者 李生琦 徐福缘 徐莹 《计算机工程与应用》 CSCD 北大核心 2004年第15期34-36,100,共4页
结构化和半结构化数据的统一集成和访问是目前Web数据访问中急需解决的问题。文章提出了一种半结构化数据表示模型———层次数据图(HDG),给出了结构化数据向HDG的转换方法,并就不同结构HDG的统一集成问题进行了探究。
关键词 半结构化数据 层次数据 关系模型 集成
在线阅读 下载PDF
半结构化数据的模式抽取 被引量:5
11
作者 蒙德龙 叶飞跃 李旭华 《计算机工程与应用》 CSCD 北大核心 2006年第27期162-165,共4页
模式抽取在半结构化数据研究领域中具有重要意义。论文结合同类对象集和标签路径的概念,提出了一种从OEM模型中抽取模式的新方法。算法的基本思想是:在用OEM模型表示的半结构化数据中查找同类对象集,并通过构造模式表的方法来实现模式... 模式抽取在半结构化数据研究领域中具有重要意义。论文结合同类对象集和标签路径的概念,提出了一种从OEM模型中抽取模式的新方法。算法的基本思想是:在用OEM模型表示的半结构化数据中查找同类对象集,并通过构造模式表的方法来实现模式抽取。这种方法不但能从层次结构数据中抽取模式,而且还能从包含环路的OEM数据中进行模式抽取,克服了其它一些算法不能从带有环路的数据中进行模式抽取的缺点。 展开更多
关键词 半结构化数据 OEM 同类对象 模式表 模式抽取
在线阅读 下载PDF
利用关系数据库系统对半结构化数据进行近似查询 被引量:3
12
作者 韩恺 岳丽华 龚育昌 《中国科学技术大学学报》 CAS CSCD 北大核心 2005年第5期674-682,共9页
提出一种利用关系数据库系统在一般图结构的半结构化数据上进行近似查询的途径.根据嵌套结构和文本值的相似性来度量路径的相似性;根据路径的相似性得到查询目标节点与数据源节点的相似性.为返回数据源中与查询目标节点相似的节点,首先... 提出一种利用关系数据库系统在一般图结构的半结构化数据上进行近似查询的途径.根据嵌套结构和文本值的相似性来度量路径的相似性;根据路径的相似性得到查询目标节点与数据源节点的相似性.为返回数据源中与查询目标节点相似的节点,首先提取出数据源中长度在固定范围内的所有路径,然后利用关系数据库系统将其与查询路径进行相似性连接,并按相似度从大到小返回所有结果.为提高相似性连接的效率,引入q窗口概念,并利用若干路径相似的必要条件来减少计算相似性函数的次数.试验证明了其有效性. 展开更多
关键词 半结构化数据 结构 近似查询 相似性度量 相似性连接 关系数据库系统
在线阅读 下载PDF
XML的半结构化数据表示方法及其在医学文档处理中的应用 被引量:18
13
作者 许斗 陈恩红 《计算机工程》 CAS CSCD 北大核心 2002年第1期57-58,191,共3页
可扩展标识语言以其合理的数据组织结构和可扩展的特性,成为各种复杂数据,特别是半结构化数据表示和处理的良好工具。基于一则医学文档管理的实例,详细介绍了使用XML表示和处理半结构化信息内容的方法、思想及特点。
关键词 医学 文档处理 XML 半结构化数据表示方法 数据
在线阅读 下载PDF
一种用于存储与查询半结构化数据的新方法 被引量:3
14
作者 叶飞跃 蒙德龙 员红娟 《计算机工程》 EI CAS CSCD 北大核心 2006年第19期91-93,共3页
由于半结构化数据缺乏模式信息,因而半结构化数据的存储与查询将是一个十分重要且具有挑战性的研究课题。利用关系数据库存储半结构化数据可以重用数据库的查询优化器和事务处理机制,能够保证半结构化数据的一致性和完整性。该文提出一... 由于半结构化数据缺乏模式信息,因而半结构化数据的存储与查询将是一个十分重要且具有挑战性的研究课题。利用关系数据库存储半结构化数据可以重用数据库的查询优化器和事务处理机制,能够保证半结构化数据的一致性和完整性。该文提出一种实现半结构化数据存储与查询的新方法,该方法使用关系数据库系统来实现半结构化数据的存储与查询。给出了把基于半结构化数据的查询重写为基于关系的查询的算法,同时介绍一个可视化查询程序。 展开更多
关键词 半结构化数据 查询OEM
在线阅读 下载PDF
基于对象—关系—属性数据模型的空间半结构化数据存储管理研究 被引量:2
15
作者 杨骏 李永树 蔡国林 《计算机应用研究》 CSCD 北大核心 2007年第6期55-57,共3页
对象—关系—属性数据模型相对传统的结构化数据模型,用更丰富的数据语义区别了对象类属性和关系类型属性两个概念,使其适用于半结构化数据的存储与管理。从分析空间数据的半结构化特征入手,以空间数据的嵌套关系为管理对象,实现了在关... 对象—关系—属性数据模型相对传统的结构化数据模型,用更丰富的数据语义区别了对象类属性和关系类型属性两个概念,使其适用于半结构化数据的存储与管理。从分析空间数据的半结构化特征入手,以空间数据的嵌套关系为管理对象,实现了在关系型数据库中对空间半结构化数据的存储与管理。 展开更多
关键词 对象一关系一属性数据模型 空间半结构化数据 嵌套关系 关系型数据
在线阅读 下载PDF
半结构化数据到结构化数据的模式抽取 被引量:3
16
作者 潘顺 金远平 《计算机工程》 CAS CSCD 北大核心 2002年第5期57-58,280,共3页
在分析现有的半结构化数据的存储方式及存在的问题基础上,引入了小集合属性、集合属性、聚类集合、模板集合、父属性序列等概念,借助映射表达语言,提出了一种基于数据挖掘的半结构化数据到结构化数据的模式抽取的方法。
关键词 半结构化数据 结构化数据 模式抽取 数据挖掘 数据
在线阅读 下载PDF
半结构化数据查询语言的特性 被引量:1
17
作者 万谦 陆建江 +1 位作者 刘忠英 宋自林 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2002年第1期133-137,共5页
结合查询语言Lorel及其与对象查询语言OQL的差异 ,对半结构化数据查询语言的特性进行了深入的分析 .结果表明 。
关键词 半结构化数据 路径表达式 数据查询语言 程序设计语言
在线阅读 下载PDF
半结构化数据的表示及查询方法研究 被引量:1
18
作者 陈恩红 石竹 王煦法 《计算机工程》 CAS CSCD 北大核心 2001年第5期5-7,共3页
介绍了如何将网页中的有用住处提取出来,并以为数据模型将其组织存储的方法,以及在这种存储模型上对半结构化数据WWWOEM的查询方法。
关键词 半结构化数据 对象交换模型 数据模型 数据查询 数据 WWW 网页
在线阅读 下载PDF
基于半结构化数据模型的频繁模式挖掘研究 被引量:2
19
作者 刘先锋 李钒 《计算机工程与应用》 CSCD 北大核心 2007年第36期173-176,共4页
为了有效快速地得到频繁模式,通过公共路径舍弃中间重新构造模式树的步骤,充分利用层次结构和深度优先遍历,提出了直接从待挖掘原始半结构化数据中挖掘频繁模式的算法。
关键词 半结构化数据 频繁模式挖掘 OEM模型 压缩树 公共路径
在线阅读 下载PDF
半结构化数据的最小化模式发现 被引量:1
20
作者 李久仲 石硕 沈轶 《计算机应用与软件》 CSCD 2009年第4期51-54,共4页
半结构化数据的模式抽取对于半结构化数据查询、优化及异构数据的集成具有重要的意义。结合标签路径及标签路径的目标集概念,提出了基于OEM(Object Exchange Model)模型的半结构化数据最小化模式抽取新方法,并给出了与标签路径目标集、... 半结构化数据的模式抽取对于半结构化数据查询、优化及异构数据的集成具有重要的意义。结合标签路径及标签路径的目标集概念,提出了基于OEM(Object Exchange Model)模型的半结构化数据最小化模式抽取新方法,并给出了与标签路径目标集、支持度计算相关的两个定理。算法的基本思路:依据文中的两个定理,采用宽度优先自顶向下的遍历策略依次求出各标签路径的最后一个标签的目标集及支持度,标签支持度大的目标集优先映射为对应的模式节点。对同一半结构数据实例,算法抽取的模式与其他算法得到的模式相比规模小、算法执行时间短。算法适用于层次型及包含环路的OEM半结构化数据模式抽取。 展开更多
关键词 半结构化数据 模式抽取 OEM模型 标签路径 标签路径的支持度 标签路径的目标集
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部