期刊文献+
共找到23篇文章
< 1 2 >
每页显示 20 50 100
一种全新的全文索引模型——后继数组模型 被引量:11
1
作者 刘学文 陶晓鹏 +1 位作者 于玉 胡运发 《软件学报》 EI CSCD 北大核心 2002年第1期150-158,共9页
提出了一种新的全文索引模型——后继数组模型,它结合了目前多个主流全文检索模型(倒排表模型、Pat数组模型等)的优点,提高了空间效率和时间效率,并得到了理论和实验的证明.
关键词 全文索引模型 后继数组模型 文本数据库 数据模型
在线阅读 下载PDF
基于邻接矩阵的全文索引模型(英文) 被引量:10
2
作者 周水庚 胡运发 关佶红 《软件学报》 EI CSCD 北大核心 2002年第10期1933-1942,共10页
文本信息的急剧增加和越来越多的用户通过在线方式获取文本信息,使得查询效率成为信息检索系统一个突出瓶颈.提出两种新型全文索引模型,用于改善信息检索系统的查询效率.通过使用有向图表示文本串,引出关于文本串的邻接矩阵;采用两种不... 文本信息的急剧增加和越来越多的用户通过在线方式获取文本信息,使得查询效率成为信息检索系统一个突出瓶颈.提出两种新型全文索引模型,用于改善信息检索系统的查询效率.通过使用有向图表示文本串,引出关于文本串的邻接矩阵;采用两种不同的方式实现文本串邻接矩阵,导出了两种基于邻接矩阵的新型全文索引模型,即基于邻接矩阵的倒排文件和基于邻接矩阵的PAT数组.给出了基于新模型的文本查询算法;分析了新模型的存储空间和查询时间的开销,并分别与两种传统索引模型进行了比较.对实际文本库进行了测试以证实新模型的效能.新模型能够以相对于原文较小的空间代价获得较大幅度的查询效率的提高,因此适合于在大规模文本检索系统中应用. 展开更多
关键词 邻接矩阵 全文索引模型 倒排文 PAT数组 信息检索系统
在线阅读 下载PDF
全文索引的研究 被引量:10
3
作者 徐小刚 王俊杰 于玉 《计算机工程》 CAS CSCD 北大核心 2002年第2期101-103,共3页
在倒排表模型的基础上,从加快索引创建速度和改进索引动态结构两个方面着手,提出并实现了一种高效的索引创建算法和相应的索引模型,经过测试,新系统的索引创建速度可以和数据复制速度相提并论。而在空间效率上,也得到了一定程度的提高。
关键词 全文索引 倒排表模型 Pat数组 文本数据库 研究
在线阅读 下载PDF
全文索引技术在办公自动化系统中的应用研究 被引量:7
4
作者 陈慧萍 于国政 王建东 《计算机应用研究》 CSCD 北大核心 2007年第2期222-224,共3页
基于内容的全文检索技术广泛用于全文数据库中,为解决办公自动化系统中大量文档的快速检索问题,将SQL Server全文索引技术运用于办公自动化系统开发中。首先介绍SQL Server全文检索流程,然后将其运用于办公自动化系统文档管理模块公文... 基于内容的全文检索技术广泛用于全文数据库中,为解决办公自动化系统中大量文档的快速检索问题,将SQL Server全文索引技术运用于办公自动化系统开发中。首先介绍SQL Server全文检索流程,然后将其运用于办公自动化系统文档管理模块公文搜索的实现中,全文检索用户界面层采用ASP.NET开发,应用业务层采用C#语言。 展开更多
关键词 全文索引 全文检索 办公自动化 B/S结构
在线阅读 下载PDF
基于邻接字符对的三元后缀树全文索引模型 被引量:1
5
作者 姚全珠 赵凯 郭梁涛 《计算机工程》 CAS CSCD 2012年第18期42-44,49,共4页
传统后缀树全文索引模型的索引建立复杂、难以维护,且空间消耗大。为此,提出一种改进的后缀树全文索引模型。将一棵完整后缀树划分为若干个三元后缀树,从而简化后缀树的组织结构,便于其建立和维护索引。将邻接字符对的公共前缀作为后缀... 传统后缀树全文索引模型的索引建立复杂、难以维护,且空间消耗大。为此,提出一种改进的后缀树全文索引模型。将一棵完整后缀树划分为若干个三元后缀树,从而简化后缀树的组织结构,便于其建立和维护索引。将邻接字符对的公共前缀作为后缀树的根结点,以降低模型的空间消耗,提高查询效率。实验结果表明,与传统模型相比,该模型具有较高的时空效率。 展开更多
关键词 后缀树 全文索引 邻接字符对 三元后缀树 公共前缀 时空效率
在线阅读 下载PDF
一种无标引实现汉字全文索引与全文检索的新方法 被引量:1
6
作者 刘春科 《情报学报》 CSSCI 北大核心 1991年第2期113-121,共9页
关键词 标引 全文索引 全文检索 应用程序
在线阅读 下载PDF
个性化中文全文索引技术在VBlog项目的应用
7
作者 张玉忠 《电信科学》 北大核心 2010年第1期91-94,共4页
本文介绍了利用SNS社交网站所提供的信息真实性和准确性等特点,如何深度挖掘用户价值,如何个性化扩展Mysql数据库的全文索引功能来实现基于内容的数据挖掘,从而类聚和分析用户行为,进一步延伸号码百事通业务的价值链,巩固电信在信息服... 本文介绍了利用SNS社交网站所提供的信息真实性和准确性等特点,如何深度挖掘用户价值,如何个性化扩展Mysql数据库的全文索引功能来实现基于内容的数据挖掘,从而类聚和分析用户行为,进一步延伸号码百事通业务的价值链,巩固电信在信息服务领域的竞争优势。 展开更多
关键词 SNS 中文全文索引 VBlog 精确营销
在线阅读 下载PDF
基于压缩全文索引的演变图查询
8
作者 肖洋 朱青 吴粤皖 《计算机工程与应用》 CSCD 北大核心 2015年第2期117-124,共8页
演变图中含有大量的时间和空间信息,其中某些空间信息随着时间的推移表现出相似的演变规律。给出了一种演变图查询模型,可以挖掘出在相同时间范围内具有相同变化规律的演变子图。但是演变图的规模往往是巨大的,当需要对其进行多次查询时... 演变图中含有大量的时间和空间信息,其中某些空间信息随着时间的推移表现出相似的演变规律。给出了一种演变图查询模型,可以挖掘出在相同时间范围内具有相同变化规律的演变子图。但是演变图的规模往往是巨大的,当需要对其进行多次查询时,每次遍历整个演变图将带来非常高的查询代价,而现有的基于枚举的哈希索引算法又使得预处理过程拥有相当大的时间和空间开销,为了减少对大规模演变图的预处理代价,将压缩的全文索引技术应用于演变图,它基于涡轮转换和后缀数组。在构建后缀数组时,给出了两种不同的线性算法,确保了预处理过程的稳定性。通过在Facebook、Enron邮件系统以及模拟数据集上的实验,评估了该算法的可行性、效率以及可扩展性。 展开更多
关键词 演变图 查询 演变子图 后缀数组 压缩全文索引
在线阅读 下载PDF
基于三维特征索引空间的分布式全文索引模型
9
作者 谭舜泉 陈有青 《计算机应用》 CSCD 北大核心 2004年第5期151-153,157,共4页
文中根据分布式全文数据库的特点,提出一种新的全文索引模型———基于三维特征索引空间的分布式全文索引模型。在理论上的推导和对实际全文数据库的测试都证实新模型在分布式环境下,能以相对较小的空间代价获得较大幅度的查询效率的提高。
关键词 全文索引 分布式全文数据库 Pat数组 三维特征索引空间
在线阅读 下载PDF
压缩的全文自索引算法研究 被引量:2
10
作者 路炜 刘燕兵 +2 位作者 王春露 刘庆云 郭莉 《计算机应用与软件》 CSCD 北大核心 2014年第3期11-15,35,共6页
针对传统全文索引技术空间浪费过大等问题,介绍压缩的全文自索引技术。该技术仅利用索引数据即可完成子串搜索,并且可以从索引数据无损地还原出原始的文本信息,是一种无需存储原始文本信息的"自索引"技术,从而大大节省存储空... 针对传统全文索引技术空间浪费过大等问题,介绍压缩的全文自索引技术。该技术仅利用索引数据即可完成子串搜索,并且可以从索引数据无损地还原出原始的文本信息,是一种无需存储原始文本信息的"自索引"技术,从而大大节省存储空间。综述现有的十几种典型的压缩的全文自索引算法的基本思想及其实现,并在多种数据集上对这些算法进行综合的测试评估。实验结果表明,压缩的全文自索引技术有效地节省了空间开销,实用价值较高。 展开更多
关键词 全文索引 数据压缩 索引 后缀数组 BWT变换
在线阅读 下载PDF
一种全文检索系统的设计与实现 被引量:13
11
作者 涂新辉 何婷婷 罗景 《计算机工程》 EI CAS CSCD 北大核心 2005年第17期55-57,共3页
在对全文检索有关技术进行分析和研究的基础之上,提出并实现了一个实用的全文检索系统UFRS,它能够处理中英文文档并可以扩展到其它语言,支持多种不同的索引存储方案以及分布式检索。依次讨论了该系统中的存储层、词法语法分析层、系统... 在对全文检索有关技术进行分析和研究的基础之上,提出并实现了一个实用的全文检索系统UFRS,它能够处理中英文文档并可以扩展到其它语言,支持多种不同的索引存储方案以及分布式检索。依次讨论了该系统中的存储层、词法语法分析层、系统核心接口层。最后给出了该系统的一种分布式部署方案。 展开更多
关键词 全文检索 全文索引 倒排文件 分布式
在线阅读 下载PDF
基于Lucene.Net的分布式全文检索系统 被引量:11
12
作者 谭文堂 贺明科 李阜 《计算机应用与软件》 CSCD 2009年第9期142-145,共4页
随着互联网的发展,现代信息量急剧增加,人们对于信息的检索要求越来越高,一个好的检索系统必须具有较快的检索速度和较高的查准率。针对海量文本数据提出一种基于Lucene.Net全文检索引擎构建的分布式全文检索系统,使用.NET Remoting实... 随着互联网的发展,现代信息量急剧增加,人们对于信息的检索要求越来越高,一个好的检索系统必须具有较快的检索速度和较高的查准率。针对海量文本数据提出一种基于Lucene.Net全文检索引擎构建的分布式全文检索系统,使用.NET Remoting实现分布式的全文索引与全文检索,具有较好的扩展性和很快的索引与检索速度,并成功地将该技术应用于军队某部信息管理系统,取得了很好的效果。 展开更多
关键词 Lucene.Net.NET REMOTING 分布式 全文检索 全文索引
在线阅读 下载PDF
云环境下基于可搜索加密技术的密文全文检索研究 被引量:4
13
作者 张克君 张国亮 +1 位作者 姜琛 杨云松 《计算机应用与软件》 2017年第4期35-41,共7页
为了解决云存储技术带来的数据安全和高效检索问题,在深入研究可搜索加密技术基础上,提出一种基于云存储的密文全文检索模型,给出基于可搜索加密技术的密文全文索引构建和检索策略,并对方案的安全性进行分析。实验表明,云存储环境下基... 为了解决云存储技术带来的数据安全和高效检索问题,在深入研究可搜索加密技术基础上,提出一种基于云存储的密文全文检索模型,给出基于可搜索加密技术的密文全文索引构建和检索策略,并对方案的安全性进行分析。实验表明,云存储环境下基于可搜索加密技术的密文全文检索方案既保证了数据的安全性,又具有很好的检索效率,可适用于海量数据的加密存储与高效安全检索。 展开更多
关键词 云存储 可搜索加密 全文检索 密文全文索引
在线阅读 下载PDF
元搜索引擎研究 被引量:15
14
作者 龚蛟腾 《情报杂志》 CSSCI 北大核心 2004年第10期77-78,81,共3页
基于分类目录搜索引擎和基于全文索引搜索存在较大的弊端 ,元搜索引擎是关于搜索引擎的搜索引擎 ,具有虚拟数据库与信息搜索代理的特点和检索效率高、扩展性能强与服务多样化的优势。智能化代理。
关键词 元搜索引 检索效率 分类目录 多样化 信息搜索 优势 个性化服务 代理 虚拟数据库 全文索引
在线阅读 下载PDF
探析自动索引原理 被引量:2
15
作者 衡中青 熊歆 《图书馆论坛》 CSSCI 北大核心 2004年第1期95-96,78,共3页
文章试图对自动索引的方法作一些探讨。首先介绍了自动索引的五种理论模型和六种自动标引方法,随后探讨了自动索引中不可或缺的两个对象———全文索引和数据库索引的原理。
关键词 自动索引 自动标引 全文索引 数据库索引
在线阅读 下载PDF
基于开源Lucene2.0的书目搜索引擎设计与实现 被引量:1
16
作者 熊定富 《图书情报知识》 CSSCI 北大核心 2009年第4期99-104,共6页
书目搜索引擎是一种类似于网络搜索引擎的目录检索系统,它使用开放源代码软件工具包Lucene2.0来实现。文章首先讨论了当前主流目录检索系统的检索界面使用上的不便之处,然后提出了书目搜索引擎的设计思路,接着详细地分析了书目搜索引擎... 书目搜索引擎是一种类似于网络搜索引擎的目录检索系统,它使用开放源代码软件工具包Lucene2.0来实现。文章首先讨论了当前主流目录检索系统的检索界面使用上的不便之处,然后提出了书目搜索引擎的设计思路,接着详细地分析了书目搜索引擎的关键技术与实现方法,最后给出应用的具体案例。 展开更多
关键词 书目搜索引 检索界面 全文索引 全文检索
在线阅读 下载PDF
基于自索引的DBF压缩查询工具研究
17
作者 刘胜飞 张云泉 张迪 《计算机应用研究》 CSCD 北大核心 2009年第2期628-630,共3页
介绍了DBF表的文件格式和基于自索引的全文查询算法FM-index。针对DBF文件同时包含二进制文件头和纯文本数据记录的特点,以及对查询结果的特定要求,扩充了现有的FM-index算法,使其支持对DBF文件的压缩查询。测试结果表明,虽然FM-index... 介绍了DBF表的文件格式和基于自索引的全文查询算法FM-index。针对DBF文件同时包含二进制文件头和纯文本数据记录的特点,以及对查询结果的特定要求,扩充了现有的FM-index算法,使其支持对DBF文件的压缩查询。测试结果表明,虽然FM-index在压缩/解压时间上与WinRAR仍有一段差距,但是FM-index对压缩查询功能的支持大大提高了文件的查询性能。 展开更多
关键词 全文索引 数据库表 压缩 查询
在线阅读 下载PDF
WEB搜索引擎.NET实现技术研究 被引量:3
18
作者 蒋志刚 叶勇 《计算机应用与软件》 CSCD 北大核心 2007年第10期156-157,168,共3页
随着网络信息量的爆炸式增长,人们查找信息越来越难。Web搜索引擎的出现在一定程度上解决了这种矛盾。讲述了搜索引擎的现状及发展趋势,并基于.net对搜索引擎的关键技术提出了实现方法。
关键词 索引 采集器 正则表达式 全文索引
在线阅读 下载PDF
一个基于三元互关联后继树的多功能全文检索系统 被引量:2
19
作者 颜文伟 胡运发 《计算机应用与软件》 CSCD 北大核心 2007年第2期124-126,129,共4页
针对全文检索领域的索引结构模型的研究,基于三元互关联后继树模型,提出并实现了一个存储结构良好的索引系统。利用该系统实现了多种有效的查询。
关键词 互关联后继树 全文索引 海量存储
在线阅读 下载PDF
上海城市地理编码系统应用与研究 被引量:10
20
作者 夏兰芳 毛炜青 郭功举 《测绘通报》 CSCD 北大核心 2012年第1期78-80,共3页
基于地理编码必须本地化的客观要求,建立适合上海市特点的地理编码系统。该系统一方面可为广大市民日常基于位置的服务提供技术支持;另一方面,还可以灵活嵌入到政府各部门的应用系统中,为政府部门信息资源的综合开发、利用奠定坚实的基础。
关键词 地理编码 地址模型 地理编码数据库 地址分词 全文索引 地址匹配
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部