-
题名对几种倒排文件压缩技术的研究与分析
被引量:2
- 1
-
-
作者
王虎
王潜平
-
机构
中国矿业大学计算机科学与技术学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2006年第7期169-173,共5页
-
文摘
要提高文件检索系统的性能,需要对倒排文件压缩技术进行研究与对比,以使文件检索系统在最大压缩比和最快的解压速度间寻找均衡,以到达最大的吞吐量。对Golomb,Eliasgamma,Eliasdelta,VariableByteEncoding和BinaryInterpolativeCoding五种压缩技术通过在Windows操作系统下对theTRECWallStreetJournalcollection文件系统进行存取与压缩,从CPU时钟周期角度来对比各个算法的压缩比、压缩与解压缩的时间和对文件的读取和查询所花费的时间,并对它们进行了一个综合的评测。
-
关键词
倒排文件
索引
压缩
文本搜索
-
Keywords
inverted files,document indexing,compression,text searching
-
分类号
TP311.52
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于自索引的DBF压缩查询工具研究
- 2
-
-
作者
刘胜飞
张云泉
张迪
-
机构
中国科学院软件研究所并行计算实验室
中国科学院软件研究所计算机科学国家重点实验室
-
出处
《计算机应用研究》
CSCD
北大核心
2009年第2期628-630,共3页
-
基金
国家自然科学基金资助项目(60303020)
国家自然科学基金重点资助项目(60533020)
+2 种基金
国家"863"计划资助项目(2006AA01A102
2006AA01A125)
北京邮电大学网络与交换技术国家重点实验室开放课题资助项目(2005-05)
-
文摘
介绍了DBF表的文件格式和基于自索引的全文查询算法FM-index。针对DBF文件同时包含二进制文件头和纯文本数据记录的特点,以及对查询结果的特定要求,扩充了现有的FM-index算法,使其支持对DBF文件的压缩查询。测试结果表明,虽然FM-index在压缩/解压时间上与WinRAR仍有一段差距,但是FM-index对压缩查询功能的支持大大提高了文件的查询性能。
-
关键词
全文索引
数据库表
压缩
查询
-
Keywords
full text index
DBF(database file) table
compress
search
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名P级文件系统搜索概述
- 3
-
-
作者
张妤芝
刘海涛
-
机构
上海交通大学信息安全工程学院
-
出处
《计算机应用》
CSCD
北大核心
2010年第3期813-817,共5页
-
文摘
当文件系统规模达到P级时,管理和查找这数以百万甚至千万计的文件将会变得越来越困难,高效的文件系统搜索成为必不可少的工具。综述了P级文件系统搜索的总体研究情况,包括面临的挑战,P级文件系统搜索中的关键问题,介绍了一些P级文件系统搜索研究项目及其所用到的索引技术,特别指出了它们的局限性。最后,结合当前搜索技术的发展,指出了P级文件系统搜索面临的一些新的发展方向。
-
关键词
P级文件系统搜索
桌面搜索
全文搜索
倒排索引
语义
索引层级划分
-
Keywords
petascale file system search
desktop search
full-text search
inverted index
semantic
hierarchical partitioning
-
分类号
TP316
[自动化与计算机技术—计算机软件与理论]
-