期刊文献+
共找到15篇文章
< 1 >
每页显示 20 50 100
World Wide Web的索引与查询技术 被引量:21
1
作者 阳小华 周龙骧 《计算机科学》 CSCD 北大核心 1997年第6期29-34,共6页
1引言 WWW(World Wide Web)是一个由许多称为Web页的超媒体文档组成的集合,这文档用HTML(Hyper Text Markup Language)书写。
关键词 WWW 索引查询 INTERNET网
在线阅读 下载PDF
一种高性能分布式Web Crawler的设计与实现 被引量:6
2
作者 张岭 叶允明 +2 位作者 宋晖 于水 马范援 《上海交通大学学报》 EI CAS CSCD 北大核心 2004年第1期59-61,共3页
介绍了一种大规模、高性能、分布式的Web信息搜集器的设计及其Java实现.提出了Crawler设计中数据结构、系统功能模块和相关算法新的设计思想;对设计与实现过程中需要解决的关键问题分布式协调机制、基于内存的URL存储管理等进行了讨论,... 介绍了一种大规模、高性能、分布式的Web信息搜集器的设计及其Java实现.提出了Crawler设计中数据结构、系统功能模块和相关算法新的设计思想;对设计与实现过程中需要解决的关键问题分布式协调机制、基于内存的URL存储管理等进行了讨论,并提供了现阶段的设计、实现方法和分布式无损链接分析算法. 展开更多
关键词 web信息搜集器 分布式系统 搜索引擎
在线阅读 下载PDF
面向主题的Web信息收集系统的设计与实现 被引量:12
3
作者 潘春华 武港山 《小型微型计算机系统》 CSCD 北大核心 2003年第12期2150-2154,共5页
随着互联网信息的持续爆炸性增长 ,通用搜索引擎的信息覆盖率和检索精度都在不断下降 ,发展面向主题信息的专用网络信息检索工具已经成为趋势 .文中提出的面向主题的Web信息收集系统是这类工具的核心部件 .该系统采用文档矢量模型进行... 随着互联网信息的持续爆炸性增长 ,通用搜索引擎的信息覆盖率和检索精度都在不断下降 ,发展面向主题信息的专用网络信息检索工具已经成为趋势 .文中提出的面向主题的Web信息收集系统是这类工具的核心部件 .该系统采用文档矢量模型进行文档相关度计算 ,并结合页面链接的上下文信息过滤页面 ;借鉴并修改了Shark启发式查找算法来查找相关页面 ;可采用多机并行下载提高收集效率 ;并依据站点的重要程度进行动态更新 .在一个面向Internet的计算机教学资源检索的搜索引擎中具体实现了这个Web信息收集系统 ,整个系统在低性能的台式机上就能运行 ,并可获得较高的属于指定主题的页面的收集精度和收集效率 . 展开更多
关键词 web信息收集系统 搜索引擎 信息检索 万维网 WWW 互联网 主题 系统设计
在线阅读 下载PDF
Web ME——一个大型网络挖掘环境系统 被引量:1
4
作者 鲁明羽 张红 +1 位作者 付克明 陆玉昌 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2004年第9期1164-1167,1172,共5页
随着互联网的飞速发展,如何高效利用万维网这一巨大信息源,从中挖掘潜在的有价值的信息和知识,已成为国际学术界一个研究热点.传统的Web信息检索技术已无法满足人们日益增长的Web信息检索和挖掘需求,而网络挖掘技术可以弥补搜索引擎的不... 随着互联网的飞速发展,如何高效利用万维网这一巨大信息源,从中挖掘潜在的有价值的信息和知识,已成为国际学术界一个研究热点.传统的Web信息检索技术已无法满足人们日益增长的Web信息检索和挖掘需求,而网络挖掘技术可以弥补搜索引擎的不足.重点介绍一个网络挖掘原型系统WebME,包括其系统结构、主要功能和特点,并提出了进一步完善的一些设想.WebME采用了一些独特的网络挖掘技术,集多种网络挖掘功能于一体,是目前国内功能最为全面的网络挖掘系统之一. 展开更多
关键词 网络信息检索 网络挖掘系统 网页分类 信息推荐
在线阅读 下载PDF
Web信息融合系统基础设施的研究 被引量:2
5
作者 李兵 何克清 +1 位作者 刘进 李瑞轩 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2004年第11期1048-1051,共4页
元建模是实现分布异构数据源间互操作的有效途径 ,元模型框架MMF(MetaModelFramework)是一套元对象和元模型结构的集合 ,用于信息注册和信息资源库开发中元模型建立 .将联邦数据管理系统与软件工程中本体元模型框架结合 ,建立Web信息融... 元建模是实现分布异构数据源间互操作的有效途径 ,元模型框架MMF(MetaModelFramework)是一套元对象和元模型结构的集合 ,用于信息注册和信息资源库开发中元模型建立 .将联邦数据管理系统与软件工程中本体元模型框架结合 ,建立Web信息融合系统基础设施的体系结构 .结合语义Web服务平台和软件代理技术 ,研究Web信息融合系统基础设施的运行机制 .提出本体对象 (ontology object)建模理论和方法 ,指导Web信息融合系统基础设施的开发设计 ,简化设计开发过程 . 展开更多
关键词 web信息融合 联邦数据库系统 本体元建模 web服务
在线阅读 下载PDF
相关主题的最具权威的Web页搜索 被引量:1
6
作者 汤艳红 李石君 黄竞伟 《计算机应用研究》 CSCD 北大核心 2003年第8期27-28,53,共3页
为搜索相关主题最具权威的Web信息资源,提出了一种计算Web页权威值的算法。该算法改进了HITS[1]算法,无须用户提供关键词,采用由Web例子页的连接扩展获得相关主题的例子页集,用一个Web页被超链接引用的次数来度量该页的权威性。
关键词 信息检索 搜索引擎 权威值 world wide web
在线阅读 下载PDF
数据广播中的UCL标引与传输机制 被引量:24
7
作者 马建国 邢玲 +1 位作者 李幼平 李在铭 《电子学报》 EI CAS CSCD 北大核心 2004年第10期1621-1624,1643,共5页
UCL(UniformContentLocator)是作者、编者和读者进行语义沟通的工具 ,是数据广播中解决接收端数据信息的快速选择、信息过滤、智能代理和信息的主动服务的基础 .本文系统地介绍了数据广播中UCL的概念 ,提出了在数据广播中进行UCL标引的... UCL(UniformContentLocator)是作者、编者和读者进行语义沟通的工具 ,是数据广播中解决接收端数据信息的快速选择、信息过滤、智能代理和信息的主动服务的基础 .本文系统地介绍了数据广播中UCL的概念 ,提出了在数据广播中进行UCL标引的方法和两级复用方法 ,研究了数据广播的UCL W标引方案 ,研究了多映射与复用技术 ,最后给出了在数据广播的传输过程中 ,发送端对数据信息进行采集、标引、映射、复用、格式转换和调制的工作流程 .实验验证了理论方案的正确性和有效性 . 展开更多
关键词 数据广播 UCL 信息标引 DVB
在线阅读 下载PDF
可在线增量自学习的聚焦爬行方法 被引量:18
8
作者 傅向华 冯博琴 +1 位作者 马兆丰 何明 《西安交通大学学报》 EI CAS CSCD 北大核心 2004年第6期599-602,共4页
将Web爬行看作执行序列动作的过程,结合改进的快速Q学习和半监督贝叶斯分类器,提出一种新的具有在线增量自学习能力的聚焦爬行方法.该方法从获取的页面中抽取特征文本,根据特征文本评估页面的主题相关性,预测链接的Q值,然后基于Q值过滤... 将Web爬行看作执行序列动作的过程,结合改进的快速Q学习和半监督贝叶斯分类器,提出一种新的具有在线增量自学习能力的聚焦爬行方法.该方法从获取的页面中抽取特征文本,根据特征文本评估页面的主题相关性,预测链接的Q值,然后基于Q值过滤无关链接.当得到主题相关页面时产生回报,将回报沿链接链路反馈,更新链路上所有链接的Q值,并选择相应的特征文本作为训练样本,增量地改善主题评估器和Q值预测器.实验结果表明,该方法具有很快的自学习能力,获取的页面数目和精度均优于离线聚焦爬行方法,更符合Web资源发现的要求. 展开更多
关键词 资源发现 聚焦爬行 在线学习 半监督学习
在线阅读 下载PDF
第三代搜索引擎与天网二期 被引量:18
9
作者 雷鸣 王建勇 +2 位作者 赵江华 单松巍 陈葆珏 《北京大学学报(自然科学版)》 CAS CSCD 北大核心 2001年第5期734-740,共7页
论述了三代搜索引擎的发展 ,着重介绍了第三代搜索引擎的体系结构 ,详细讨论了该搜索引擎的几个核心技术———大规模搜集技术、超链分析技术和用户行为分析技术。介绍了作者参与研发的第三代搜索引擎———“天网”的研究进展 。
关键词 WWW 搜索引擎 信息检索 超链分析 用户行为分析 大规模搜集技术 体系结构
在线阅读 下载PDF
基于www的高校课外体育管理系统的设计 被引量:7
10
作者 尹天安 杨亚琴 姚建军 《首都体育学院学报》 2003年第1期126-128,共3页
基于WWW技术,设计和实现的高校课外体育管理信息系统。该系统以浏览器/服务器(B/S)模式实现课外体育信息的管理,实现了网页访问、系统查询、竞赛管理、学生体育俱乐部管理、教务管理、系统管理、电子公告等功能。
关键词 高校 体育教学 课外体育管理信息系统 WWW 系统设计 B/S模式 INTERNET 数据库
在线阅读 下载PDF
网络化调度平台中数字签名技术的应用 被引量:6
11
作者 季坤 王克英 刘嘉宁 《电网技术》 EI CSCD 北大核心 2004年第18期25-28,共4页
文中建立了电力调度系统中综合令(即只涉及到一次设备初、末状态的调度命令)的网络化审批流程,在此基础上开发了调度联网发令系统,以该系统为核心,结合智能图形界面、数据库以及系统的管理和维护,建立了网络化调度操作平台。并通过引入... 文中建立了电力调度系统中综合令(即只涉及到一次设备初、末状态的调度命令)的网络化审批流程,在此基础上开发了调度联网发令系统,以该系统为核心,结合智能图形界面、数据库以及系统的管理和维护,建立了网络化调度操作平台。并通过引入数字防伪签名技术、基于角色存取控制的权限设置以及软件逻辑闭锁,解决了电力调度网络审批的安全问题。 展开更多
关键词 调度 基于角色 存取控制 图形界面 数字签名技术 命令 权限设置 网络化 系统 审批
在线阅读 下载PDF
中间应用服务器中分布对象事务服务管理技术研究 被引量:2
12
作者 齐勇 赵季中 +2 位作者 侯迪 沈钧毅 马莉 《西安交通大学学报》 EI CAS CSCD 北大核心 2001年第2期133-136,186,共5页
以“八六三”课题“基于Web的应用服务器集成框架研究”中的对象事务管理系统为基础 ,提出了基于CORBA分布式应用体系结构的对象事务服务管理系统模型 .该模型由传统的事务处理技术结合分布对象技术发展而来 ,并且在中间应用服务器中实... 以“八六三”课题“基于Web的应用服务器集成框架研究”中的对象事务管理系统为基础 ,提出了基于CORBA分布式应用体系结构的对象事务服务管理系统模型 .该模型由传统的事务处理技术结合分布对象技术发展而来 ,并且在中间应用服务器中实现了对象事务管理子系统 .由于它本身是作为基于Web的中间应用服务器的一部分 ,因此能够很好地满足Web环境下的分布式应用需求 . 展开更多
关键词 分布式应用环境 分布式对象 对象事务管理 应用服务器
在线阅读 下载PDF
自动定位彩色图像中的文本 被引量:5
13
作者 章东平 祝金标 刘济林 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2005年第2期229-233,共5页
提出一种适用于万维网搜索、彩色图像索引和视频索引等多种应用的彩色图像文本定位方法.算法采用多尺度图像分割方法把彩色图像分割为一系列可能包含文本的图像块,用连通区域方法确定每一个文本图像块中文本的精确位置和大小.采用多颜... 提出一种适用于万维网搜索、彩色图像索引和视频索引等多种应用的彩色图像文本定位方法.算法采用多尺度图像分割方法把彩色图像分割为一系列可能包含文本的图像块,用连通区域方法确定每一个文本图像块中文本的精确位置和大小.采用多颜色图像分解方法提取具有相似颜色的连通区域,通过聚类相邻的连通区域得到文本的位置和范围.利用一个图像数据库来测试本文算法,试验表明算法具有较高的正确率. 展开更多
关键词 高斯图像金字塔 颜色减少 图像分解 连通区域分析 排列分析
在线阅读 下载PDF
沁水煤层气田樊庄区块不同开采方式经济分析 被引量:7
14
作者 曹雯 《天然气工业》 EI CAS CSCD 北大核心 2005年第3期174-176,共3页
我国煤层气资源丰富,但是绝大部分渗透率低。目前,国外低渗煤层主体开发技术主要有两种,一是直井射孔压裂技术,二是定向羽状水平井技术。文章对樊庄区块开发 3# 煤煤层气采用直井射孔压裂和定向羽状水平井技术设计的4套方案进行了经济评... 我国煤层气资源丰富,但是绝大部分渗透率低。目前,国外低渗煤层主体开发技术主要有两种,一是直井射孔压裂技术,二是定向羽状水平井技术。文章对樊庄区块开发 3# 煤煤层气采用直井射孔压裂和定向羽状水平井技术设计的4套方案进行了经济评价,认为定向羽状水平井方案经济效益高,但国内没有应用羽状水平井开发煤层气的先例,风险较大。建议尽快开展定向羽状水平井先导性试验。直井压裂方案效益低于羽状水平井方案,但压裂工艺技术成熟,风险小。 展开更多
关键词 水平井技术 直井 区块 射孔 气田 开采方式 水平井开发 煤层气资源 定向 渗透率
在线阅读 下载PDF
WWW信息检索综述 被引量:9
15
作者 赵一唯 王和珍 李振东 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2001年第2期192-198,共7页
WWW是目前全球最大的信息系统 ,在WWW上查询信息和文档主要依靠Internet搜索引擎 .现在也出现了许多实用商业搜索引擎站点 ,例如Yahoo !、AltaVista、InfoSeek、Excite、Lycos等 .主要介绍了信息检索系统的结构 (Robot,搜索引擎 ,索引... WWW是目前全球最大的信息系统 ,在WWW上查询信息和文档主要依靠Internet搜索引擎 .现在也出现了许多实用商业搜索引擎站点 ,例如Yahoo !、AltaVista、InfoSeek、Excite、Lycos等 .主要介绍了信息检索系统的结构 (Robot,搜索引擎 ,索引数据库 ,查询服务等 4个部分 ) ,信息检索系统的分类 (检索工具站点和检索服务站点 ) ,信息搜寻的基本原理 ,信息检索模型 (包括经典的布尔模型 ,概率模型和新兴的概念模型等 ) ,其他的检索技术 (例如Push技术 ,MobileAgent技术等 ) ,对WWW信息检索做了比较全面的介绍 . 展开更多
关键词 信息检索 搜索引擎 信息检索模式 WWW 索引数据库 信息查询 布尔模型
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部