期刊文献+
共找到87篇文章
< 1 2 5 >
每页显示 20 50 100
一种基于Lucene改进的全文检索工具包 被引量:15
1
作者 宋佳 诸云强 刘润达 《计算机工程与应用》 CSCD 北大核心 2008年第4期172-175,共4页
基于Lucene实现了一种改进的全文检索引擎工具包E Lucene。它引入了索引配置文件,可针对不同应用背景来灵活定制索引的细节;提供了定时自动更新索引的功能;通过动态多态机制实现了支持多种索引数据源的功能;E Lucene内部设计了引擎基础... 基于Lucene实现了一种改进的全文检索引擎工具包E Lucene。它引入了索引配置文件,可针对不同应用背景来灵活定制索引的细节;提供了定时自动更新索引的功能;通过动态多态机制实现了支持多种索引数据源的功能;E Lucene内部设计了引擎基础对象类,并以静态对象的方式运行来避免频繁读取索引文件带来的性能损失。面向检索,提供了检索请求类和检索响应类来分别封装用户的查询要求和查询结果集,并设计实现了一些实用的查询输入和输出处理的方法。基于E Lucene的元数据搜索系统已成功应用到"国家科学数据共享工程:地球系统科学数据共享网"中。 展开更多
关键词 lucene Elucene 搜索引擎 检索 索引 数据共享
在线阅读 下载PDF
基于Lucene的地名数据库快速检索系统 被引量:20
2
作者 张文元 周世宇 谈国新 《计算机应用研究》 CSCD 北大核心 2017年第6期1756-1761,共6页
针对传统关系型数据库海量地名数据检索效率低下的问题,提出了一种盘古分词和Lucene全文检索相结合的地名数据库快速检索方法。首先,设计了一种地名数据表结构,比较了几种常用开源分词器的中文分词性能,并选用性能优异的盘古中文分词器... 针对传统关系型数据库海量地名数据检索效率低下的问题,提出了一种盘古分词和Lucene全文检索相结合的地名数据库快速检索方法。首先,设计了一种地名数据表结构,比较了几种常用开源分词器的中文分词性能,并选用性能优异的盘古中文分词器,通过扩展其词典来实现中文地名的有效分词。其次,利用内存索引和多线程并行处理技术提高Lucene创建倒排索引效率,并依据地名类别和显示优先级属性优化了检索结果相关度排序策略。最后,开发了一套具有快速搜索和地图定位展示的Web地名检索系统,使用500万条真实地名数据测试了其检索性能,查询平均耗时不到1s,比MySQL数据库模糊检索效率提高了15倍,匹配结果也更加准确,能够提供高效灵活的海量地名公共检索服务。 展开更多
关键词 lucene 地名 全文检索 数据库 中文分词 相关度排序
在线阅读 下载PDF
基于Lucene的搜索引擎设计与实现 被引量:26
3
作者 赵珂 逯鹏 李永强 《计算机工程》 CAS CSCD 北大核心 2011年第16期39-41,共3页
针对目前教育网庞大的FTP资源检索困难的问题,提出一种基于EdtFTPJ和Lucene的FTP搜索引擎的设计和实现方案。该方案整体上采用基于Struts1.2框架的模型-视图-控制器设计模式,数据采集模块利用基于正则表达式的有限状态自动机抓取数据,... 针对目前教育网庞大的FTP资源检索困难的问题,提出一种基于EdtFTPJ和Lucene的FTP搜索引擎的设计和实现方案。该方案整体上采用基于Struts1.2框架的模型-视图-控制器设计模式,数据采集模块利用基于正则表达式的有限状态自动机抓取数据,索引模块应用倒排索引方法,系统的分词算法使用基于字典的正向最大匹配中文分词法。实验结果表明,该方案具有较高的资源检索率,同时能够保证检索结果的准确性。 展开更多
关键词 FTP搜索引擎 lucene框架 模型-视图-控制器 有限状态自动机 倒排索引
在线阅读 下载PDF
基于Lucene的全文搜索引擎的设计与实现 被引量:12
4
作者 何伟 薛素静 +1 位作者 孔梦荣 杨正党 《情报杂志》 CSSCI 北大核心 2006年第9期88-90,共3页
Lucene是一个用Java写的全文搜索引擎工具包,支持多用户访问,访问索引速度快,可以跨平台使用。分析了Lucene的索引原理,根据Lucene的系统结构详细分析了Lucene分析器、索引包、文档等结构,实现了一个基于Lucene的中文诗词全文搜索应用... Lucene是一个用Java写的全文搜索引擎工具包,支持多用户访问,访问索引速度快,可以跨平台使用。分析了Lucene的索引原理,根据Lucene的系统结构详细分析了Lucene分析器、索引包、文档等结构,实现了一个基于Lucene的中文诗词全文搜索应用实例。 展开更多
关键词 查询分析器 读索引 写索引 lucene
在线阅读 下载PDF
基于Lucene全文检索引擎的应用研究与实现 被引量:71
5
作者 管建和 甘剑峰 《计算机工程与设计》 CSCD 北大核心 2007年第2期489-491,共3页
Lucene全文检索技术是信息检索领域广泛使用的基本技术。它是一个优秀的开源全文本搜索技术框架。按照Lucene的框架规范,扩展Lucene的功能,可以将Lucene很好地嵌入到自己的搜索引擎中。首先介绍了一个高性能的全文检索引擎——Lucene开... Lucene全文检索技术是信息检索领域广泛使用的基本技术。它是一个优秀的开源全文本搜索技术框架。按照Lucene的框架规范,扩展Lucene的功能,可以将Lucene很好地嵌入到自己的搜索引擎中。首先介绍了一个高性能的全文检索引擎——Lucene开源系统,详细分析了Lucene的系统结构,程序运行逻辑,以及在Lucene上的扩展;然后将其引入具体应用,给出了一个基于Lucene全文检索技术的校园网Web搜索引擎的设计与实现。 展开更多
关键词 全文检索技术 lucene 搜索引擎 索引 切分词
在线阅读 下载PDF
基于Lucene的语义检索系统的设计和实现 被引量:7
6
作者 蒋一峰 王华 +1 位作者 张玉红 黄少林 《计算机工程与设计》 CSCD 北大核心 2008年第20期5336-5337,5341,共3页
研究了语义检索,以Lucene为主要索引引擎,组合其它索引引擎,结合同义词查询扩展的概念,设计了一个语义检索系统,详细地描述了系统的实现过程。分析了语义检索的特点,从同义词扩展的角度,丰富和扩展了查询语义,查询扩展模块被很好的整合... 研究了语义检索,以Lucene为主要索引引擎,组合其它索引引擎,结合同义词查询扩展的概念,设计了一个语义检索系统,详细地描述了系统的实现过程。分析了语义检索的特点,从同义词扩展的角度,丰富和扩展了查询语义,查询扩展模块被很好的整合到以Lucene为基础的检索系统中,该系统在实验中表现了良好的效果。 展开更多
关键词 语义检索 同义词扩展 lucene 查询扩展 索引
在线阅读 下载PDF
基于Lucene的站内搜索设计与实现 被引量:12
7
作者 朱学昊 王儒敬 +1 位作者 余锋林 唐昱 《计算机应用与软件》 CSCD 北大核心 2008年第10期6-8,共3页
简述了站内全文检索的必要性,介绍了一种基于Lucene的全文检索系统模型,相对于Google的站内检索和传统的数据库检索都有较为明显的优势。该模型引入更好的中文分词技术,可自定义最终结果的排序。能够保证检索的前100条记录最符合检索者... 简述了站内全文检索的必要性,介绍了一种基于Lucene的全文检索系统模型,相对于Google的站内检索和传统的数据库检索都有较为明显的优势。该模型引入更好的中文分词技术,可自定义最终结果的排序。能够保证检索的前100条记录最符合检索者的需要。 展开更多
关键词 全文检索 lucene 中文分词 信息抽取
在线阅读 下载PDF
基于Lucene的索引系统的设计与实现 被引量:11
8
作者 黄少林 王华 +1 位作者 张玉红 蒋一峰 《现代情报》 2009年第7期169-171,共3页
索引系统是搜索引擎的数据大本营,在搜索引擎发展早期,能够索引的网页数量代表了整个行业的技术发展水平。Lucene全文检索技术是信息检索领域广泛使用的基本技术,它是一个优秀的开源全文本搜索技术框架,本文详细分析了索引系统相关技术... 索引系统是搜索引擎的数据大本营,在搜索引擎发展早期,能够索引的网页数量代表了整个行业的技术发展水平。Lucene全文检索技术是信息检索领域广泛使用的基本技术,它是一个优秀的开源全文本搜索技术框架,本文详细分析了索引系统相关技术和Lucene的索引系统结构。 展开更多
关键词 搜索引擎 索引 lucene 倒排索引
在线阅读 下载PDF
基于Lucene.Net的分布式全文检索系统 被引量:11
9
作者 谭文堂 贺明科 李阜 《计算机应用与软件》 CSCD 2009年第9期142-145,共4页
随着互联网的发展,现代信息量急剧增加,人们对于信息的检索要求越来越高,一个好的检索系统必须具有较快的检索速度和较高的查准率。针对海量文本数据提出一种基于Lucene.Net全文检索引擎构建的分布式全文检索系统,使用.NET Remoting实... 随着互联网的发展,现代信息量急剧增加,人们对于信息的检索要求越来越高,一个好的检索系统必须具有较快的检索速度和较高的查准率。针对海量文本数据提出一种基于Lucene.Net全文检索引擎构建的分布式全文检索系统,使用.NET Remoting实现分布式的全文索引与全文检索,具有较好的扩展性和很快的索引与检索速度,并成功地将该技术应用于军队某部信息管理系统,取得了很好的效果。 展开更多
关键词 lucene.Net.NET REMOTING 分布式 全文检索 全文索引
在线阅读 下载PDF
基于Lucene和PostGIS的地图搜索研究 被引量:10
10
作者 梁明 罗荣 胡最 《测绘通报》 CSCD 北大核心 2014年第11期42-45,共4页
基于网络的地图搜索是空间信息共享和互操作的基础,随着移动互联网技术的快速发展,网络地图搜索更成为人们获取空间信息的重要手段和网络入口。本文分析了当前主流的客户端/数据库模式的WebGIS地图搜索的不足与瓶颈,构建了客户端/Lucene... 基于网络的地图搜索是空间信息共享和互操作的基础,随着移动互联网技术的快速发展,网络地图搜索更成为人们获取空间信息的重要手段和网络入口。本文分析了当前主流的客户端/数据库模式的WebGIS地图搜索的不足与瓶颈,构建了客户端/Lucene/数据库的三元模式的地图搜索架构;探讨实现了PostGIS中地理对象到Lucene索引的映射机制,并针对Web客户端对检索结果矢量要素传输和渲染能力的不足,提出基于拓扑操作的矢量要素动态加载机制。本文提高了用户检索的灵活性和检索结果的针对性、有效性,为智慧城市建设和WebGIS的应用提供了更好的支持。 展开更多
关键词 地图搜索 WEBGIS 全文检索 POSTGIS lucene
在线阅读 下载PDF
基于Lucene的中文分析器分词性能比较研究 被引量:24
11
作者 义天鹏 陈启安 《计算机工程》 CAS CSCD 2012年第22期279-282,共4页
针对Lucene自带的中文分析器分词性能不理想并且难以选择第三方分析器的问题,研究多种基于Lucene的中文分析器,对语句分词、分词速度、建立索引的空间与时间、检索结果以及检索速度等方面进行比较。分析结果表明,在Lucene框架下,基于词... 针对Lucene自带的中文分析器分词性能不理想并且难以选择第三方分析器的问题,研究多种基于Lucene的中文分析器,对语句分词、分词速度、建立索引的空间与时间、检索结果以及检索速度等方面进行比较。分析结果表明,在Lucene框架下,基于词典分词的Paoding分析器总体性能最优,Lucene自带的一元分析器分词速度最快,imdict与ICTCLAS4J分析器在算法效率上存在一定改进空间。 展开更多
关键词 lucene框架 搜索引擎 中文分词 分析器 分词速度 索引 检索
在线阅读 下载PDF
基于领域本体和Lucene的语义检索系统研究 被引量:20
12
作者 王欢 孙瑞志 《计算机应用》 CSCD 北大核心 2010年第6期1655-1657,1660,共4页
语义相似度是影响语义检索系统查准率和查全率的重要因素。设计了一种改进的语义相似度模型,用于量化概念间的关联程度,通过对相似度阈值的控制来调整查询扩展时扩展概念集的范围。在Lucene的基础上设计了一个基于领域本体的语义检索系... 语义相似度是影响语义检索系统查准率和查全率的重要因素。设计了一种改进的语义相似度模型,用于量化概念间的关联程度,通过对相似度阈值的控制来调整查询扩展时扩展概念集的范围。在Lucene的基础上设计了一个基于领域本体的语义检索系统,该系统对提交的关键词组进行查询扩展后,将扩展关键词组导入文本检索引擎Lucene中,并把语义相似度作为检索结果排序算法的关键因素。实验结果表明,该语义相似度模型得出的相似度值更加接近专家经验值,系统的查询准确率与未加入查询扩展的Lucene系统相比有较大的提高。 展开更多
关键词 查询扩展 本体 lucene 语义相似度 语义检索
在线阅读 下载PDF
基于Lucene的全文检索构件的研究与实现 被引量:13
13
作者 唐铁兵 陈林 祝伟华 《计算机应用与软件》 CSCD 2010年第2期197-199,230,共4页
Lucene是一个高效全文检索工具包,但它不能直接处理文件和数据库。主要研究Lucene的体系架构及其索引的不足之处,并在其基础上设计实现了一个全文检索构件。该构件能够直接对文件及数据库进行全文检索,使用户在不用编写程序的情况下,快... Lucene是一个高效全文检索工具包,但它不能直接处理文件和数据库。主要研究Lucene的体系架构及其索引的不足之处,并在其基础上设计实现了一个全文检索构件。该构件能够直接对文件及数据库进行全文检索,使用户在不用编写程序的情况下,快速为自己的桌面系统或Web系统添加全文检索功能。使用插件架构,同时实现了多媒体文本提取插件。 展开更多
关键词 lucene 全文检索 构件 插件架构 多媒体文本提取
在线阅读 下载PDF
基于Lucene的数字作品搜索引擎的研究与设计 被引量:10
14
作者 吴洁明 韩云辉 冀单单 《计算机工程与科学》 CSCD 北大核心 2013年第5期166-172,共7页
在Lucene的全文检索工具包的基础上,分析现有的主流中文分词算法和Lucene相关度排序算法,提出了改进的分词算法和改进的相关度排序算法。还采用倒排索引、检索技术、分布式存储和并行计算等技术,分析并设计了一个对海量数字作品信息的... 在Lucene的全文检索工具包的基础上,分析现有的主流中文分词算法和Lucene相关度排序算法,提出了改进的分词算法和改进的相关度排序算法。还采用倒排索引、检索技术、分布式存储和并行计算等技术,分析并设计了一个对海量数字作品信息的搜索引擎,为用户提供对海量数字作品信息的快速、准确的搜索服务。实验分析比较了分词速度和分词效果,还比较了关键词搜索结果的响应时间、命中数量、准确率和召回率。实验结果表明,本系统在很大程度上提高了搜索速度,保证了搜索结果的准确性。 展开更多
关键词 lucene 分词算法 索引 相关度排序算法 分布式
在线阅读 下载PDF
基于PageRank的Lucene排序算法优化与实现 被引量:12
15
作者 陈建峡 黄日 马忠宝 《计算机工程与科学》 CSCD 北大核心 2012年第10期123-127,共5页
随着Web技术的迅速发展,提供个性化服务的搜索引擎技术受到用户的广泛关注,网页排序是其中的关键技术之一。本文利用PageRank算法对原有的Lucene网页排序进行了改进,设计并实现了关于手机信息搜索的个性化搜索引擎。实验结果证明,改进... 随着Web技术的迅速发展,提供个性化服务的搜索引擎技术受到用户的广泛关注,网页排序是其中的关键技术之一。本文利用PageRank算法对原有的Lucene网页排序进行了改进,设计并实现了关于手机信息搜索的个性化搜索引擎。实验结果证明,改进后的排序算法能够较好地提高信息检索的准确度,为用户带来了优于Lucene自身排序的搜索体验。 展开更多
关键词 lucene PAGERANK 个性化搜索引擎 排序优化
在线阅读 下载PDF
一种基于Lucene的中文全文检索系统 被引量:22
16
作者 苏潭英 郭宪勇 金鑫 《计算机工程》 CAS CSCD 北大核心 2007年第23期94-96,共3页
在开源全文索引引擎Lucene的基础上,设计了一个中文全文检索系统模型,该模型系统由7个模块组成,索引模块、检索模块是其中的核心部分。论述了模型的整体结构,分析设计了索引及检索模块,通过具体的索引技术和检索技术来提高整个系统的检... 在开源全文索引引擎Lucene的基础上,设计了一个中文全文检索系统模型,该模型系统由7个模块组成,索引模块、检索模块是其中的核心部分。论述了模型的整体结构,分析设计了索引及检索模块,通过具体的索引技术和检索技术来提高整个系统的检索效率。该系统增加了加密模块,实现对建立的全文索引进行加密处理,增强了信息的安全性。 展开更多
关键词 全文检索 lucene 倒排索引
在线阅读 下载PDF
基于Lucene的房产信息垂直搜索引擎的研究 被引量:6
17
作者 赵德平 刘阳 李鹏 《沈阳建筑大学学报(自然科学版)》 CAS 北大核心 2011年第1期178-183,共6页
目的针对目前国内房产信息资源比较分散特点,研究房产信息垂直搜索引擎的建立模式与实现技术.方法应用Lucene与Nutch平台以及垂直搜索引擎技术,开发具有市场应用价值的房产信息垂直搜索引擎.结果设计建立了包含网页抓取模块、网页解析... 目的针对目前国内房产信息资源比较分散特点,研究房产信息垂直搜索引擎的建立模式与实现技术.方法应用Lucene与Nutch平台以及垂直搜索引擎技术,开发具有市场应用价值的房产信息垂直搜索引擎.结果设计建立了包含网页抓取模块、网页解析模块、数据库存储模块、索引建立模块、查询模块组成的房产信息垂直搜索引擎.结论该房产信息垂直搜索引擎可为用户提供房源信息、房产新闻和数据的检索、查询与分析等服务.相比其他搜索引擎在搜索结果方面精度提高一倍,在运作成本方面仅为其他搜索引擎运作成本的1/2,搜索速度方面相比其他搜索引擎提高20%. 展开更多
关键词 垂直搜索 房产 lucene NUTCH
在线阅读 下载PDF
一种融合词语位置特征的Lucene相似度评分算法 被引量:8
18
作者 白培发 王成良 徐玲 《计算机工程与应用》 CSCD 2014年第2期129-132,161,共5页
相似度评分算法是Lucene引擎中的核心部分之一。对Lucene内部的相似度评分算法进行研究分析后,针对Lucene只关心查询词出现的频率,而不关心它们所在的位置这一缺陷提出了一种改进的算法。改进的算法将词语位置关系特征融合到Lucene原始... 相似度评分算法是Lucene引擎中的核心部分之一。对Lucene内部的相似度评分算法进行研究分析后,针对Lucene只关心查询词出现的频率,而不关心它们所在的位置这一缺陷提出了一种改进的算法。改进的算法将词语位置关系特征融合到Lucene原始相似度评分算法中。在TREC数据集上的实验结果表明:改进后的算法与Lucene原始算法相比,在MAP和P@n指标上都有一定程度的提高。 展开更多
关键词 lucene 相似度 全文检索
在线阅读 下载PDF
一种基于Lucene的影片搜索引擎的研究和应用 被引量:3
19
作者 匡振国 倪宏 +1 位作者 嵇智辉 刘磊 《计算机工程与应用》 CSCD 北大核心 2008年第29期8-10,30,共4页
Lucene是一个优秀的开源搜索引擎框架,已经广泛应用于信息搜索领域。分析点播门户中现有的搜索引擎存在的不足,设计一种基于双字哈希算法支持中文的分词器,并利用该分词器和Lucene工具包,设计并实现了一个视频点播影片快速搜索引擎,它... Lucene是一个优秀的开源搜索引擎框架,已经广泛应用于信息搜索领域。分析点播门户中现有的搜索引擎存在的不足,设计一种基于双字哈希算法支持中文的分词器,并利用该分词器和Lucene工具包,设计并实现了一个视频点播影片快速搜索引擎,它不仅支持中文检索,还具有搜索速度快、易于扩展等优点。仿真实验证明提出的基于Lucene的影片搜索引擎具有良好的性能。 展开更多
关键词 lucene 搜索引擎 双字哈希 中文分词 倒排索引
在线阅读 下载PDF
基于Lucene/Heritrix的垂直搜索引擎的研究与应用 被引量:21
20
作者 白坤 耿国华 《计算机应用与软件》 CSCD 2009年第1期212-215,247,共5页
Lucene是一个用Java写的全文索引引擎工具包,访问索引时间快,支持多用户访问,可以跨平台使用。Heritrix是一个由Java开发的、开源的Web网络爬虫,用户可以使用它从网络上抓取想要的资源。探讨了Lucene和Heritrix在构建垂直搜索引擎中的... Lucene是一个用Java写的全文索引引擎工具包,访问索引时间快,支持多用户访问,可以跨平台使用。Heritrix是一个由Java开发的、开源的Web网络爬虫,用户可以使用它从网络上抓取想要的资源。探讨了Lucene和Heritrix在构建垂直搜索引擎中的应用。 展开更多
关键词 lucene HERITRIX 垂直搜索引擎
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部