期刊文献+
共找到442篇文章
< 1 2 23 >
每页显示 20 50 100
基于Web中文检索系统SEARCH2000的设计与实现 被引量:7
1
作者 杜林 张毅波 孙玉芳 《中文信息学报》 CSCD 北大核心 2000年第6期14-20,共7页
本文详细介绍Search 2 0 0 0中文检索系统的设计思想及实现方法。与传统的全文检索系统相比 ,基于WEB的信息检索系统 ,具有许多全新的特征。页面为半结构化文档、页面通过超链接相互关联、页面的内容覆盖不同应用领域并且拥有大量专有... 本文详细介绍Search 2 0 0 0中文检索系统的设计思想及实现方法。与传统的全文检索系统相比 ,基于WEB的信息检索系统 ,具有许多全新的特征。页面为半结构化文档、页面通过超链接相互关联、页面的内容覆盖不同应用领域并且拥有大量专有名词和缩略词汇 ,这些特性成为影响查询精度的主要因素。针对Web的上述特性设计的Search2 0 0 0全文检索系统 ,使用智能化的页面相关分析、评分技术 ,以及高效数据存取、压缩算法和知识库的支持 ,使其具有使用方便、查询时间短、查询精度高等特点。 展开更多
关键词 信息检索 中文信息处理 search2000 页面 web
在线阅读 下载PDF
一种针对websearch应用的缓存替换算法 被引量:3
2
作者 司成祥 孟晓烜 许鲁 《电子学报》 EI CAS CSCD 北大核心 2011年第5期1205-1209,共5页
本文通过对websearch负载的分析,总结出负载访问模式的特点,在此基础上提出了一种新的缓存替换算法——ERDP-LRU.与传统的LRU算法的区别是它采用基于重用距离的放置策略.通过模拟实验和实际系统验证,在各种不同的典型负载和缓存大小下,E... 本文通过对websearch负载的分析,总结出负载访问模式的特点,在此基础上提出了一种新的缓存替换算法——ERDP-LRU.与传统的LRU算法的区别是它采用基于重用距离的放置策略.通过模拟实验和实际系统验证,在各种不同的典型负载和缓存大小下,ERDP-LRU的效果均好于其它替换算法. 展开更多
关键词 web搜索 缓存 替换算法
在线阅读 下载PDF
基于地理-时间意图和偏好的个性化Web搜索框架GT-WSearch 被引量:2
3
作者 杨丹 申德荣 陈默 《计算机科学》 CSCD 北大核心 2015年第7期240-244,共5页
基于Web查询的地理位置、时间查询意图和用户偏好的个性化Web搜索可以改善Web搜索结果,更好地满足不同用户的信息需求。提出了GT-WSearch个性化Web搜索框架,它通过挖掘搜索结果、用户点击数据和对查询进行分析得到的用户概貌和查询概貌... 基于Web查询的地理位置、时间查询意图和用户偏好的个性化Web搜索可以改善Web搜索结果,更好地满足不同用户的信息需求。提出了GT-WSearch个性化Web搜索框架,它通过挖掘搜索结果、用户点击数据和对查询进行分析得到的用户概貌和查询概貌,来捕捉用户的地理-时间的意图和偏好,提高搜索质量。用户概貌表明了查询自身的地理-时间的特性。GT-WSearch框架在排序函数中利用文档的地理位置、时间的相关度来进行个性化搜索。最后将使用线性的相关度排序函数进行重新排序的搜索结果返回给用户。大量实验结果表明,所提出的个性化方法在提高Web搜索结果的质量中取得了明显的效果。 展开更多
关键词 个性化web搜索 地理-时间意图 用户偏好
在线阅读 下载PDF
基于Web挖掘的智能门户搜索引擎的研究 被引量:36
4
作者 李岩 陈新中 杨炳儒 《计算机工程与应用》 CSCD 北大核心 2002年第4期34-36,共3页
搜索引擎是人们在Internet上快速获得信息的重要工具之一,但是由于中文自身的特点,使得检索结果的准确性和相关性不是很高,将Web挖掘技术应用到搜索引擎领域,从而产生智能搜索引擎,将会给用户提供一个高效、准确的Web检索工具。文章首... 搜索引擎是人们在Internet上快速获得信息的重要工具之一,但是由于中文自身的特点,使得检索结果的准确性和相关性不是很高,将Web挖掘技术应用到搜索引擎领域,从而产生智能搜索引擎,将会给用户提供一个高效、准确的Web检索工具。文章首先介绍了搜索引擎的工作原理和相关概念,然后介绍了Web挖掘的定义、分类和应用。最后,详细讨论了Web挖掘技术在智能搜索引擎的重要应用。 展开更多
关键词 搜索引擎 web 智能搜索 数据挖掘 INTERNET 信息检索
在线阅读 下载PDF
Web信息检索研究进展 被引量:118
5
作者 王继成 萧嵘 +1 位作者 孙正兴 张福炎 《计算机研究与发展》 EI CSCD 北大核心 2001年第2期187-193,共7页
Web上大量、分布、动态的信息造成了“信息过载”,如何在传统信息检索技术的基础上开展针对 Web的检索工作已经成为一项重要的研究课题 .但是 ,繁多的 Web信息检索系统和各种模糊的概念给用户的选择和研究人员的讨论带来了不便 .同时 ,... Web上大量、分布、动态的信息造成了“信息过载”,如何在传统信息检索技术的基础上开展针对 Web的检索工作已经成为一项重要的研究课题 .但是 ,繁多的 Web信息检索系统和各种模糊的概念给用户的选择和研究人员的讨论带来了不便 .同时 ,有关 Web信息检索最新技术的比较完整的分析又十分缺乏 .在此 ,对 Web信息检索技术进行了综述 ,从 Web信息检索系统的层次化分类 (搜索引擎与目录、元搜索引擎、信息检索 agent)、一般机制和关键新技术 (基于超链的相关度排序、检索结果的联机聚类、基于概念的检索、相关度反馈 )等方面加以阐述 。 展开更多
关键词 web 信息检索 搜索引擎 元搜索引擎 INTERNET
在线阅读 下载PDF
Web信息采集研究进展 被引量:25
6
作者 李盛韬 余智华 +1 位作者 程学旗 白硕 《计算机科学》 CSCD 北大核心 2003年第2期151-157,171,共8页
As a basic component of search engine and a series of other services on Web,Web crawler is playing an important role. Roughly,a Web crawler is a program which automatically traverses the Web by downloading documents a... As a basic component of search engine and a series of other services on Web,Web crawler is playing an important role. Roughly,a Web crawler is a program which automatically traverses the Web by downloading documents and following links from page to page. This article detailedly explains the principles and difficulties on the Web crawler,comprehensively argues several hot directions of Web crawler,and at last views the new direction of Web crawler. 展开更多
关键词 web 信息采集 信息发布 INTERNET INTRANET 计算机网络
在线阅读 下载PDF
一个Web社区搜索引擎系统 被引量:2
7
作者 刘务华 罗铁坚 王文杰 《计算机应用研究》 CSCD 北大核心 2007年第2期275-278,共4页
在分析Web社区搜索资源分散特点的基础上,运用Web抓取器、向量空间模型和相关性排序等技术设计了Web社区搜索引擎的体系结构,实现了一个Web社区搜索引擎系统——Chinalab Search。根据对系统的性能评估,系统满足Web社区的搜索要求,提高... 在分析Web社区搜索资源分散特点的基础上,运用Web抓取器、向量空间模型和相关性排序等技术设计了Web社区搜索引擎的体系结构,实现了一个Web社区搜索引擎系统——Chinalab Search。根据对系统的性能评估,系统满足Web社区的搜索要求,提高了在社区内查找信息的效率,为组织间的合作提供了方便。 展开更多
关键词 web社区 搜索引擎 信息获取 Chinalab search
在线阅读 下载PDF
一种QoS最优的语义Web服务自动组合方法 被引量:16
8
作者 邓水光 黄龙涛 +2 位作者 吴斌 尹健伟 李革新 《计算机学报》 EI CSCD 北大核心 2013年第5期1015-1030,共16页
针对海量的信息提供类(Information Providing)语义Web服务的自动组合问题,提出了一种将正向搜索与逆向搜索相结合并追求QoS最优的快速组合方法.该方法首先根据用户的请求对服务库中的服务进行层次划分,去除无关服务并得到具有并行调用... 针对海量的信息提供类(Information Providing)语义Web服务的自动组合问题,提出了一种将正向搜索与逆向搜索相结合并追求QoS最优的快速组合方法.该方法首先根据用户的请求对服务库中的服务进行层次划分,去除无关服务并得到具有并行调用结构的组合服务原型即规划图;之后,利用得到的参数的服务源信息,计算每个服务的最优组合QoS;最后,以用户请求的输出参数为起点进行逆向搜索,以最优组合QoS为约束条件构造所有可能的最优解.以WS-Challenge 2009提供的竞赛集进行实验,结果表明该方法不仅能够找到组合服务的最优QoS,而且可以获得大量结构不同但QoS均为最优的解,从而为组合服务的执行提供更多的选择. 展开更多
关键词 web服务自动组合 QOS 正向搜索 逆向搜索 规划图
在线阅读 下载PDF
基于元数据与Z39.50的分布协作式Web信息检索 被引量:27
9
作者 王继成 杨晓江 +1 位作者 潘金贵 张福炎 《软件学报》 EI CSCD 北大核心 2001年第4期620-627,共8页
Web上大量的异质、分布、动态的信息造成了“信息过载”.如何有效地为用户提供 Web信息检索已经成为一项重要的研究课题 .Web搜索引擎部分地解决了信息检索问题 ,然而其效果却远远不能令人满意 .提出了 Web信息检索的分布协作策略以取... Web上大量的异质、分布、动态的信息造成了“信息过载”.如何有效地为用户提供 Web信息检索已经成为一项重要的研究课题 .Web搜索引擎部分地解决了信息检索问题 ,然而其效果却远远不能令人满意 .提出了 Web信息检索的分布协作策略以取代传统的集中式信息检索方式 ;给出了一种新的 Web信息检索系统模型 ,该模型支持对 Web文档的元数据进行检索 ,并采用 Z39.50协议作为接口标准 ,以克服不同信息检索系统之间的访问异构性 .在此基础上 ,设计了一个分布协作式 Web信息检索框架 ,用以帮助用户有效地进行 Web信息检索 . 展开更多
关键词 web 信息检索 搜索引擎 元数据 Z39.50
在线阅读 下载PDF
一种通用Web信息采集系统的设计与实现 被引量:11
10
作者 吴丽辉 王斌 余智华 《计算机工程》 EI CAS CSCD 北大核心 2005年第3期123-124,194,共3页
介绍了一种通用的Web信息采集系统,给出了系统总体结构,分析了信息采集器、采集控制服务器和信息发布服务器,讨论了系统实际的应用。实践证明,该系统能够对Internet信息进行自动采集,并对今后的应用提供充分的支持,具有良好的通用性。
关键词 web信息 通用性 采集系统 服务器 信息发布 信息采集 设计 证明 实际 系统总体结构
在线阅读 下载PDF
分布式Web信息采集系统的研究与设计 被引量:10
11
作者 李盛韬 成绫 余智华 《计算机工程与应用》 CSCD 北大核心 2003年第16期162-166,182,共6页
Web信息的急速膨胀,使得Web信息采集面临一个巨大的挑战。针对这一情况,实现了一个分布式Web信息采集系统,以提高一般Web信息采集的能力。文章论述了分布式信息采集的基本原理、分类、难点以及相应的对策,并就该分布式Web信息采集系统... Web信息的急速膨胀,使得Web信息采集面临一个巨大的挑战。针对这一情况,实现了一个分布式Web信息采集系统,以提高一般Web信息采集的能力。文章论述了分布式信息采集的基本原理、分类、难点以及相应的对策,并就该分布式Web信息采集系统进行了仔细的剖析。最后,对分布式Web信息采集的发展作了一个展望。 展开更多
关键词 信息采集 分布式 搜索引擎 信息处理 web
在线阅读 下载PDF
Web结构挖掘 被引量:20
12
作者 杨炳儒 李岩 +1 位作者 陈新中 王霞 《计算机工程》 CAS CSCD 北大核心 2003年第20期28-30,共3页
概述了Web结构挖掘的有关概念和相关应用,详细分析和比较了基于超链接结构分析的网页排序的最权威算法,提出了有关Web结构挖掘技术的几个新的研究方向,供感兴趣的同行参考。
关键词 web结构挖掘 PAGERANK HITS SALSA 超链接 网页排序
在线阅读 下载PDF
一个个性化的Web信息采集模型 被引量:17
13
作者 吴丽辉 王斌 张刚 《计算机工程》 EI CAS CSCD 北大核心 2005年第22期86-88,共3页
介绍了个性化技术和个性化Web信息的采集技术,重点分析了个性化的Web信息采集模型,包括系统总体结构、用户兴趣的获取、个性化Web信息采集流程、个性化推荐的实现。最后对个性化Web信息采集与搜索引擎作了一个比较,分析了个性化Web信息... 介绍了个性化技术和个性化Web信息的采集技术,重点分析了个性化的Web信息采集模型,包括系统总体结构、用户兴趣的获取、个性化Web信息采集流程、个性化推荐的实现。最后对个性化Web信息采集与搜索引擎作了一个比较,分析了个性化Web信息采集的应用。 展开更多
关键词 个性化 个性化的web信息采集 搜索引擎
在线阅读 下载PDF
基于Web的生物医学文献资源保障系统的研究与实现 被引量:9
14
作者 应峻 徐一新 +2 位作者 莫梅琦 廖毅峰 聂荣华 《复旦学报(医学版)》 EI CAS CSCD 北大核心 2001年第6期531-533,共3页
目的 建立基于Web的生物医学文献资源保障系统并对其进行分析、评价。方法 将目前所能获取到的各种来源的医学全文电子期刊纳入系统中 ,在对各种途径进行分析后 ,将全文期刊按学科进行分类并给予各种特征性标识 ,采用TRS信息发布平台... 目的 建立基于Web的生物医学文献资源保障系统并对其进行分析、评价。方法 将目前所能获取到的各种来源的医学全文电子期刊纳入系统中 ,在对各种途径进行分析后 ,将全文期刊按学科进行分类并给予各种特征性标识 ,采用TRS信息发布平台在Solaris操作系统下 ,利用JSP技术、Javascript技术、数据库技术建立生物医学文献资源保障系统。对本校医学专业各学科发放调查表 ,对反馈结果进行处理分析 ,评价利用不同途径获取的医学全文电子期刊对用户需求的满足情况。结果 在本系统中实现对TRS数据库的全文期刊刊名按各种方式进行检索。利用生物医学文献资源保障系统对用户需求的总体满足率为 78.5 3% ,其中纯电子期刊对用户需求满足率为 5 9.2 0 %。结论 生物医学文献资源保障系统结合多种获取论文全文的途径 ,将各种类型网络全文期刊集中在一起 。 展开更多
关键词 全文保障系统 电子期刊导航 医学信息服务
在线阅读 下载PDF
可扩展并行Web服务器群技术的研究 被引量:10
15
作者 庄伟强 王鼎兴 +1 位作者 沈美明 郑纬民 《小型微型计算机系统》 EI CSCD 北大核心 2000年第1期19-23,共5页
随着Internet应用的发展,传统的Web 服务器已不能满足客户端访问能力的需求,可扩展并行Web 服务器群技术的研究和开发应运而生.它具有高可用、可扩展等特点.另一方面,机群系统具有良好的可扩展性能和计算能力,是实... 随着Internet应用的发展,传统的Web 服务器已不能满足客户端访问能力的需求,可扩展并行Web 服务器群技术的研究和开发应运而生.它具有高可用、可扩展等特点.另一方面,机群系统具有良好的可扩展性能和计算能力,是实现可扩展并行Web 服务器群的最好系统平台.本文在分析Web 服务器特点的基础上,总结用机群系统实现可扩展并行Web 服务器的优点和关键技术,提出一个系统实现方案,然后介绍在该系统基础上开发的信息搜集和检索系统. 展开更多
关键词 web 服务器 机群系统 信息检索系统
在线阅读 下载PDF
基于用户搜索意图的Web网页动态泛化 被引量:14
16
作者 王大玲 于戈 +2 位作者 鲍玉斌 张沫 沈洲 《软件学报》 EI CSCD 北大核心 2010年第5期1083-1097,共15页
基于目前对用户搜索意图的分类,进一步分析了每种用户意图的信息需求,提出了基于用户搜索意图的Web网页动态泛化模型,为搜索的Web网页动态地建立文档片段、关键词、导航类型、文档格式之间的概念层次,通过网页内容、类型和格式的泛化为... 基于目前对用户搜索意图的分类,进一步分析了每种用户意图的信息需求,提出了基于用户搜索意图的Web网页动态泛化模型,为搜索的Web网页动态地建立文档片段、关键词、导航类型、文档格式之间的概念层次,通过网页内容、类型和格式的泛化为不同的访问意图提供进一步的搜索导航,从而返回与搜索意图更相关的结果.与相关工作对比,重点并非获取用户意图,也不是对用户意图分类,而是基于用户搜索意图的Web网页动态泛化模型的建立及Web网页泛化过程的实现.实验结果表明,该泛化模型不仅能够通过导航自动获取用户搜索意图,而且能够基于该意图提供相关搜索结果以及进一步的搜索导航. 展开更多
关键词 网页泛化 用户意图 动态建模 搜索导航 文本挖掘
在线阅读 下载PDF
Web页面视觉搜索与浏览策略的眼动研究 被引量:17
17
作者 栗觅 钟宁 吕胜富 《北京工业大学学报》 EI CAS CSCD 北大核心 2011年第5期773-779,共7页
利用眼动跟踪技术,探讨W eb页面视觉搜索和浏览的视觉特征,并分析2种视觉行为对应策略的差异.实验结果发现,视觉搜索时,周边区域的注视时间和注视次数显著大于中心区域;而视觉浏览时,周边区域和中心区域没有显著差异.而且,视觉搜索时的... 利用眼动跟踪技术,探讨W eb页面视觉搜索和浏览的视觉特征,并分析2种视觉行为对应策略的差异.实验结果发现,视觉搜索时,周边区域的注视时间和注视次数显著大于中心区域;而视觉浏览时,周边区域和中心区域没有显著差异.而且,视觉搜索时的瞳孔直径显著大于浏览时的瞳孔直径,说明视觉搜索时的心理负荷显著大于浏览时的心理负荷.结果表明,在W eb页面上视觉搜索呈现周边区域的视觉搜索策略,而对于视觉浏览更多采用无明显规律的自由随机浏览策略.这种视觉搜索与浏览策略的差异主要是来自目标驱动和心理负荷大小的影响. 展开更多
关键词 web页面 视觉搜索 视觉浏览 眼动
在线阅读 下载PDF
基于Web服务的异构数据源统一检索研究 被引量:8
18
作者 吴泽彬 魏洁 +1 位作者 李蔚清 吴慧中 《计算机集成制造系统》 EI CSCD 北大核心 2007年第7期1444-1450,共7页
为使统一检索能够适应当前Internet和异构数据源的不断发展,基于目前流行的Web服务技术,设计了一个异构数据源统一检索框架,并针对检索服务分发和结果融合提出了检索服务统一模型、记录统一模型,以及相应的结果融合算法。结合可扩展标... 为使统一检索能够适应当前Internet和异构数据源的不断发展,基于目前流行的Web服务技术,设计了一个异构数据源统一检索框架,并针对检索服务分发和结果融合提出了检索服务统一模型、记录统一模型,以及相应的结果融合算法。结合可扩展标记语言,统一各数据源检索返回的异构数据记录,利用Web服务机制的完好封装性、规范性、松散耦合、高度集成能力等特点,实现异构数据源检索接口的透明集成。基于Web服务的异构数据源统一检索系统实现简单,时空性能好,可扩展性强,能兼顾各数据源的特点实现全局优化。 展开更多
关键词 web服务 异构 数据源 检索 结果融合
在线阅读 下载PDF
Web数据库技术简述 被引量:7
19
作者 张志强 周立柱 冯建华 《计算机科学》 CSCD 北大核心 2001年第10期1-6,共6页
The popularity of the WWW has made people disseminate information very easy. The rele-vance of database concepts to the problems of managing and querying Web information has led to a sig-nificant body of recent resear... The popularity of the WWW has made people disseminate information very easy. The rele-vance of database concepts to the problems of managing and querying Web information has led to a sig-nificant body of recent research addressing these problems. In this paper ,we discuss some Web databasetechniques in brief ,and give some advises about future working. 展开更多
关键词 web数据库 数据模型 半结构化数据 面向对象
在线阅读 下载PDF
广域网分布式Web爬虫 被引量:25
20
作者 许笑 张伟哲 +1 位作者 张宏莉 方滨兴 《软件学报》 EI CSCD 北大核心 2010年第5期1067-1082,共16页
分析了广域网分布式Web爬虫相对于局域网爬虫的诸多优势,提出了广域网分布式Web爬虫的3个核心问题:Web划分、Agent协同和Agent部署.围绕这3个问题,对目前学术界和商业界出现的多种实现方案和策略进行了全面的综述,深入讨论了研究中遇到... 分析了广域网分布式Web爬虫相对于局域网爬虫的诸多优势,提出了广域网分布式Web爬虫的3个核心问题:Web划分、Agent协同和Agent部署.围绕这3个问题,对目前学术界和商业界出现的多种实现方案和策略进行了全面的综述,深入讨论了研究中遇到的问题与挑战,并论述了广域网分布式Web爬虫的评价模型.最后,对未来的研究方向进行了总结. 展开更多
关键词 搜索引擎 广域网分布式爬虫 web划分 AGENT协同 Agent部署
在线阅读 下载PDF
上一页 1 2 23 下一页 到第
使用帮助 返回顶部