期刊文献+
共找到183篇文章
< 1 2 10 >
每页显示 20 50 100
Deep Web数据集成研究综述 被引量:137
1
作者 刘伟 孟小峰 孟卫一 《计算机学报》 EI CSCD 北大核心 2007年第9期1475-1489,共15页
随着World Wide Web(WWW)的飞速发展,Deep Web中蕴含了海量的可供访问的信息,并且还在迅速地增长.这些信息要通过查询接口在线访问其后端的Web数据库.尽管丰富的信息蕴藏在Deep Web中,由于Deep Web数据的异构性和动态性,有效地把这些信... 随着World Wide Web(WWW)的飞速发展,Deep Web中蕴含了海量的可供访问的信息,并且还在迅速地增长.这些信息要通过查询接口在线访问其后端的Web数据库.尽管丰富的信息蕴藏在Deep Web中,由于Deep Web数据的异构性和动态性,有效地把这些信息加以利用是一件十分挑战性的工作.Deep Web数据集成至今仍然是一个新兴的研究领域,其中包含有若干需要解决的问题.总体来看,在该领域已经开展了大量的研究工作,但各个方面发展并不均衡.文中提出了一个Deep Web数据集成的系统架构,依据这个系统架构对Deep Web数据集成领域中若干关键研究问题的现状进行了回顾总结,并对未来的研究发展方向作了较为深入的探讨分析. 展开更多
关键词 World Wide web DEEP web web数据库 查询接口 DEEP web数据集成
在线阅读 下载PDF
基于样本实例的Web信息抽取 被引量:19
2
作者 张绍华 徐林昊 +2 位作者 杨文柱 薛文玲 李天柱 《河北大学学报(自然科学版)》 CAS 2001年第4期431-437,共7页
主要研究了基于HTML文档的信息抽取 ,提出了一种基于样本实例的Web信息抽取的方法 .用户首先选定样本页面和预先定义模式 (基于O -R模型 ) ,然后对样本页面和其中的样本记录进行标记、学习 ,形成信息抽取规则 ,并存入知识库 ;利用知识... 主要研究了基于HTML文档的信息抽取 ,提出了一种基于样本实例的Web信息抽取的方法 .用户首先选定样本页面和预先定义模式 (基于O -R模型 ) ,然后对样本页面和其中的样本记录进行标记、学习 ,形成信息抽取规则 ,并存入知识库 ;利用知识库对其他同类页面自动抽取所需的信息 ,存入数据库中 .本方法可用于Web查询 ,也可用于信息集成的包装器 . 展开更多
关键词 HTML 模式 抽取器 信息抽取 web查询 INTERNET INTRANET
在线阅读 下载PDF
关于中国Deep Web的规模、分布和结构 被引量:13
3
作者 赵朋朋 崔志明 +1 位作者 高岭 仲华 《小型微型计算机系统》 CSCD 北大核心 2007年第10期1799-1802,共4页
随着Web数据库的广泛应用,Web正在加速的"深化",大量的高质量的信息隐藏在Deep Web中.基于IP采样的方法,对1,000,000个IP样本进行了分析统计,揭示了2006年初中国Deep Web的规模、分布和结构.主要结论包括有:1中国Deep Web查... 随着Web数据库的广泛应用,Web正在加速的"深化",大量的高质量的信息隐藏在Deep Web中.基于IP采样的方法,对1,000,000个IP样本进行了分析统计,揭示了2006年初中国Deep Web的规模、分布和结构.主要结论包括有:1中国Deep Web查询接口往往位于站点浅层,94.6%的Deep Web查询接口出现在站点的前3层;2中国Deep Web大约有24,000个站点,28,000个Web数据库和74,000个查询接口;3中国Deep Web大部分是非结构化的,其中64%是非结构化的Web数据库;4中国Deep Web分布于多种不同的主题领域;5目前主要的中文搜索引擎已覆盖国内Deep Web大约二分之一的页面. 展开更多
关键词 DEEPweb web数据库 查询接口
在线阅读 下载PDF
Web数据抽取技术研究进展 被引量:13
4
作者 张成洪 古晓洪 白延红 《计算机科学》 CSCD 北大核心 2004年第2期129-131,151,共4页
由于Web上存在着大量有用而复杂的信息,近年来学术界和企业界开发了许多从Web中抽取数据的方法和工具。本文总结了Web数据抽取技术的研究进展和从Web中抽取数据的主要原理、过程、方法和抽取规则,并讨论了未来的研究方向。
关键词 web 网页 数据抽取 分布式数据库系统 数据模型 数据管理
在线阅读 下载PDF
Web查询技术研究 被引量:12
5
作者 孟小峰 曹巍 王珊 《计算机科学》 CSCD 北大核心 2001年第2期1-5,共5页
一、引言 WWW的迅速发展,使其成为全球信息传递与共享的日益重要和最具潜力的资源,如何管理WWW上的大量信息,以满足用户不断增长的高质量的信息需求?WWW作为一种新的环境资源,为新技术的产生开辟了新的领域,同时也为传统技术(如数据库。
关键词 信息检索系统 数据库 web 数据查询 WWW
在线阅读 下载PDF
基于Web的股票查询系统的Java实现 被引量:5
6
作者 崔朝辉 刘恩 +1 位作者 李志刚 程小茁 《计算机工程》 CAS CSCD 北大核心 2000年第5期52-53,共2页
详细介绍利用Java语言的跨平台及强大的网络通信功能等特点开发出具有良好扩展性的基于Web的股票查询系统的设计与实现。
关键词 web 股票查询系统 JAVA语言 信息网
在线阅读 下载PDF
Deep Web爬虫爬行策略研究 被引量:13
7
作者 郑冬冬 崔志明 《计算机工程与设计》 CSCD 北大核心 2006年第17期3154-3158,共5页
如今Web上越来越多的信息可以通过查询接口来获得,为了获取某DeepWeb站点的页面用户不得不键入一系列的关键词集。由于没有直接指向DeepWeb页面的静态链接,当前大多搜索引擎不能发现和索引这些页面。然而,近来研究表明DeepWeb站点提供... 如今Web上越来越多的信息可以通过查询接口来获得,为了获取某DeepWeb站点的页面用户不得不键入一系列的关键词集。由于没有直接指向DeepWeb页面的静态链接,当前大多搜索引擎不能发现和索引这些页面。然而,近来研究表明DeepWeb站点提供的高质量的信息对许多用户来说是非常有价值。这里研究了怎样建立起一个有效的DeepWeb爬虫,它可以自动发现和下载DeepWeb页面。由于DeepWeb惟一“入口点”是查询接口,DeepWeb爬虫设计面对的主要挑战是怎样对查询接口自动产生有意义的查询。这里提出一种针对查询接口查询自动产生问题的理论框架。通过在实际DeepWeb站点上的实验证明了此方法是非常有效的。 展开更多
关键词 DEEP web DEEP web爬虫 查询选择 查询效能 适应性爬行算法
在线阅读 下载PDF
Web查询日志研究综述 被引量:9
8
作者 付博 赵世奇 刘挺 《电子学报》 EI CAS CSCD 北大核心 2013年第9期1800-1808,共9页
本文对查询日志在相关领域内的研究现状与进展进行了总结.首先介绍了web查询日志的常用信息和公开的数据集;进而阐述了查询日志在web搜索、信息抽取等方面的相关研究,并对它们进行了细致的介绍和分析;最后指出基于查询日志研究所面临的... 本文对查询日志在相关领域内的研究现状与进展进行了总结.首先介绍了web查询日志的常用信息和公开的数据集;进而阐述了查询日志在web搜索、信息抽取等方面的相关研究,并对它们进行了细致的介绍和分析;最后指出基于查询日志研究所面临的问题和挑战.重在对基于查询日志研究的主流方法和前沿进展进行概括、比较和分析,以期对后续研究有所助益. 展开更多
关键词 查询日志分析 查询日志挖掘 web搜索 信息抽取
在线阅读 下载PDF
Deep Web数据采集查询构造方法研究 被引量:2
9
作者 林海伦 杨晓刚 +3 位作者 熊锦华 王元卓 贾岩涛 程学旗 《计算机科学与探索》 CSCD 北大核心 2015年第9期1025-1033,共9页
网络大数据的大规模、多源异构、动态更新、高噪声给知识的获取带来了很大的挑战。特别地,很多网站隐藏在HTML表单后端的Web数据库中的Deep Web数据,只能通过提交表单查询的方式进行动态访问,网络爬虫难以通过页面之间的链接关系采集到... 网络大数据的大规模、多源异构、动态更新、高噪声给知识的获取带来了很大的挑战。特别地,很多网站隐藏在HTML表单后端的Web数据库中的Deep Web数据,只能通过提交表单查询的方式进行动态访问,网络爬虫难以通过页面之间的链接关系采集到这些数据,影响了获取到的知识资源的覆盖率,如何高效地采集这些数据并加以利用非常具有挑战性。为此对现有的Deep Web数据采集的查询构造方法进行了详细分析,分别介绍了针对不同类型的表单对应的Deep Web数据采集查询构造方法;总结了现有表层化方式的Deep Web数据采集查询构造方法的优缺点,并对Deep Web数据采集查询构造方法的未来工作进行了展望,以推动Deep Web数据采集技术的进一步发展。 展开更多
关键词 DEEP web 查询接口 查询构造 网络爬虫
在线阅读 下载PDF
基于标记树对象抽取技术的Hidden Web获取研究 被引量:9
10
作者 宋晖 张岭 +1 位作者 叶允明 马范援 《计算机工程与应用》 CSCD 北大核心 2002年第23期9-12,24,共5页
目前标准的搜索引擎能够检索的仅仅是WorldWideWeb提供的小部分称为可索引的Web信息。大量的HiddenWeb信息(估计容量是可索引Web的500倍)对这些搜索引擎是不可见的。这些信息隐藏在Web页面的搜索表单后面,保存在大型的动态数据库中。该... 目前标准的搜索引擎能够检索的仅仅是WorldWideWeb提供的小部分称为可索引的Web信息。大量的HiddenWeb信息(估计容量是可索引Web的500倍)对这些搜索引擎是不可见的。这些信息隐藏在Web页面的搜索表单后面,保存在大型的动态数据库中。该文提出了一套检索HiddenWeb信息的方法,给出了系统的框架结构,并详细讨论了实现的关键技术。系统采用新的基于标记树的对象抽取(Tag-Tree-basedObjectExtraction)方法自动地从Web页面中抽取HiddenWeb信息,然后在此基础上给出了结构化的HiddenWeb信息查询算法。文章最后对实验结果进行了讨论。 展开更多
关键词 标记树 对象抽取 Hiddenweb 互联网 搜索引擎 信息检索 结构化查询 数据库
在线阅读 下载PDF
WEB用户的视图 被引量:18
11
作者 阳小华 周龙骧 《软件学报》 EI CSCD 北大核心 1999年第7期690-693,共4页
视图不仅是数据库中的一个重要概念,也能够在Web 系统中发挥重要的作用.但是,Web 视图不能完全照搬数据库视图的概念,而应该体现出Web 特色.文章提出了浏览区域的概念,能较好地刻画Web 用户活动的特征.在此概念的基... 视图不仅是数据库中的一个重要概念,也能够在Web 系统中发挥重要的作用.但是,Web 视图不能完全照搬数据库视图的概念,而应该体现出Web 特色.文章提出了浏览区域的概念,能较好地刻画Web 用户活动的特征.在此概念的基础上,给出一个能体现Web 特色的用户视图的定义,初步探讨了Web 展开更多
关键词 web 视图 数据库 超文本信息系统
在线阅读 下载PDF
基于Web Services的模型库系统设计方案 被引量:8
12
作者 葛艳 黄冬梅 +1 位作者 陈明 陶桂芳 《计算机工程》 CAS CSCD 北大核心 2007年第7期258-260,275,共4页
在对Web services技术进行简单总结的基础上,给出了基于Web services的可重用模型库体系结构的设计方案,以AHP模型为例,分析了模型的Web services表示、模型服务发布、发现、调用以及模型服务查询等问题。给出了一个应用实例,利用Web se... 在对Web services技术进行简单总结的基础上,给出了基于Web services的可重用模型库体系结构的设计方案,以AHP模型为例,分析了模型的Web services表示、模型服务发布、发现、调用以及模型服务查询等问题。给出了一个应用实例,利用Web services技术建立了一个共享的模型库系统。 展开更多
关键词 web SERVICES 模型表示 模型发布 模型查询 AHP
在线阅读 下载PDF
语义Web数据管理研究进展 被引量:16
13
作者 杜小勇 王琰 吕彬 《软件学报》 EI CSCD 北大核心 2009年第11期2950-2964,共15页
从数据存储组织、查询优化和处理、原型系统和基准测试等方面介绍当前RDF数据管理的研究进展和比较分析,讨论存在的问题并给出未来的研究方向.
关键词 语义web RDF数据 数据管理 索引 存储组织 查询优化
在线阅读 下载PDF
基于Web的信息检索系统的设计与实现 被引量:10
14
作者 王枝军 强俊 程效军 《计算机工程与设计》 CSCD 北大核心 2006年第6期1025-1027,1055,共4页
从某高校科研信息管理的实际要求出发,经过详细的系统调查开发出了一个基于Web的信息检索系统。它具有录入、查询、修改和统计等功能,是一套对高校科研信息进行统计和管理的管理信息系统(MIS)。在技术上,讨论了JSP技术的工作原理,并且与... 从某高校科研信息管理的实际要求出发,经过详细的系统调查开发出了一个基于Web的信息检索系统。它具有录入、查询、修改和统计等功能,是一套对高校科研信息进行统计和管理的管理信息系统(MIS)。在技术上,讨论了JSP技术的工作原理,并且与ASP技术做了详细的比较,突出了用JSP技术进行Web应用系统开发的优点。最后对该系统提出了一些改进的意见。 展开更多
关键词 信息检索系统 基于web 管理信息系统 JSP ASP
在线阅读 下载PDF
Web信息查询研究进展 被引量:5
15
作者 徐林昊 杨文柱 +2 位作者 张绍华 薛文玲 李天柱 《河北大学学报(自然科学版)》 CAS 2001年第3期347-354,共8页
Web上大量、分布、动态的信息 ,造成了用户在查询Web上的信息时产生的“信息过载”和“信息迷向”现象 .Web信息检索与查询是目前的研究热点 ,本文分析和比较现有Web信息检索和查询语言技术的发展现状 ,介绍了基于人工智能领域中机器学... Web上大量、分布、动态的信息 ,造成了用户在查询Web上的信息时产生的“信息过载”和“信息迷向”现象 .Web信息检索与查询是目前的研究热点 ,本文分析和比较现有Web信息检索和查询语言技术的发展现状 ,介绍了基于人工智能领域中机器学习方法的Web信息检索和查询以及信息抽取技术的研究 。 展开更多
关键词 搜索引擎 web查询 信息抽取 智能AGENT XML INTERNET
在线阅读 下载PDF
基于ASP的WEB数据库智能查询 被引量:10
16
作者 李志勇 徐长通 《河南师范大学学报(自然科学版)》 CAS CSCD 北大核心 2010年第1期164-166,共3页
在网站信息处理工作中,Web数据库服务器能为访问者提供海量数据的存储和维护服务.就如何通过ASP把附加信息嵌入到链接中,在网络上实现客户端的智能查询作了一些探讨.
关键词 ASP编程 web数据库 SQL查询 智能查询
在线阅读 下载PDF
一种应用于Deep Web数据集成系统中的查询松弛策略 被引量:5
17
作者 申德荣 马也 +2 位作者 聂铁铮 寇月 于戈 《计算机研究与发展》 EI CSCD 北大核心 2010年第1期88-95,共8页
针对Deep Web环境中存在的失败查询,提出了一种有效的查询松弛策略.所有Deep Web资源按查询接口属性分组,组成全局数据源关系图(DRG);针对特定查询将DRG转换为对应该查询请求的数据源关系图;利用该DRG,按照特定的规则进行查询松弛和执... 针对Deep Web环境中存在的失败查询,提出了一种有效的查询松弛策略.所有Deep Web资源按查询接口属性分组,组成全局数据源关系图(DRG);针对特定查询将DRG转换为对应该查询请求的数据源关系图;利用该DRG,按照特定的规则进行查询松弛和执行处理.针对查询松弛导致的部分结果可能与用户查询请求的相似度较低的问题,提出先通过Skyline方法对结果进行筛选,然后再根据各个结果实例与用户查询的相似度进行Top-k排序,最后将最接近用户要求的结果集返回给用户.通过实验验证了提出的查询松弛策略的有效性. 展开更多
关键词 DEEP web 查询松弛 数据源关系图 TOP-K SKYLINE
在线阅读 下载PDF
基于Web GIS的区域矿产资源查询系统 被引量:7
18
作者 夏既胜 卢冬爱 +1 位作者 杨树华 谈树成 《金属矿山》 CAS 北大核心 2007年第4期59-61,70,共4页
以个旧锡矿某矿区为例,对区域矿产资源查询系统进行了初步设计与开发,以期探讨1种基于Web GIS的矿产资源查询系统的开发思路与方法。以Windows为操作系统,选择Super Map为GIS开发平台,在Visual studio.Net环境下,利用Visual Basic.NET... 以个旧锡矿某矿区为例,对区域矿产资源查询系统进行了初步设计与开发,以期探讨1种基于Web GIS的矿产资源查询系统的开发思路与方法。以Windows为操作系统,选择Super Map为GIS开发平台,在Visual studio.Net环境下,利用Visual Basic.NET开发语言进行系统的开发。系统采用SuperMap IS.NET作为地图服务器,并引用它的地图类库,减少了开发的难度。客户端完全采用HTML/Javascript实现,做到了跨平台运行,满足了不同用户需求。系统除实现了地图的放大、缩小、漫游等基本操作以外,还实现了空间数据与属性数据的关联查询,包括矿体的空间分布、产状、储量、出露地层、构造等信息,为矿产资源管理部门与工程设计单位进行矿产资源信息的实时快速查询提供了方便。 展开更多
关键词 webGIS 矿产资源查询系统 设计与开发
在线阅读 下载PDF
基于ASP、SQL Server 2000实现的Web文献检索系统及其查询优化 被引量:12
19
作者 宋阳 严平 曹彤 《计算机应用与软件》 CSCD 北大核心 2006年第10期25-28,共4页
介绍了基于ASP、SQL Server2000实现的Web文献检索系统及其查询优化。通过调试、运行,Web文献检索系统运行正常,查询效率高。基于ASP、SQL Server2000实现的Web文献检索系统简单、安全、稳定,维护方便。
关键词 ASP SQL SERVER 2000 web文献检索系统 查询优化
在线阅读 下载PDF
基于SPARQL-DL的语义Web服务查询 被引量:4
20
作者 王海 高岭 +1 位作者 范琳 李增智 《电子学报》 EI CAS CSCD 北大核心 2011年第A03期52-56,共5页
语义Web服务发现是当前Web服务研究领域的热点,其核心研究内容是服务描述及相应的发现方法.服务描述分为请求描述与发布描述,发布描述具有描述完整,信息丰富的特征,而服务请求描述仅关注服务的部分特征,通常不构成一个完整的服务描述.... 语义Web服务发现是当前Web服务研究领域的热点,其核心研究内容是服务描述及相应的发现方法.服务描述分为请求描述与发布描述,发布描述具有描述完整,信息丰富的特征,而服务请求描述仅关注服务的部分特征,通常不构成一个完整的服务描述.现有方法使用相同机制进行请求描述与发布描述,以比对请求与发布中对应部分的同一性或相似性作为匹配依据.构建假想的完整服务描述作为服务请求既不合理也难以实施,从而限制了方法的实用性.本文提出以语义Web查询语言SPARQL-DL作为服务请求描述语言,以OWL-S作为服务发布描述语言,将服务发现问题转化为知识库的查询,从而进行有效的服务发现.通过实验,证实了该方法具有实用性强,简单可靠的特点. 展开更多
关键词 语义web服务 服务查询 SPARQL-DL
在线阅读 下载PDF
上一页 1 2 10 下一页 到第
使用帮助 返回顶部