题名 基于压缩后缀数组技术的搜索引擎
被引量:2
1
作者
姚全珠
张楠
杨增辉
田元
机构
西安理工大学计算机学院
出处
《计算机工程》
CAS
CSCD
北大核心
2008年第10期83-85,88,共4页
基金
陕西省自然科学基金资助项目(2005F07)
文摘
目前,搜索引擎的核心模块(索引器)均采用倒排文件结构,对短语查询的准确率较低。该文引入后缀数组技术进行全文索引,为克服全文索引时占用空间大的缺点,研究了压缩后缀数组技术,把后缀数组索引的大小压缩到了O(n)位,并给出应用压缩后缀数组索引的步骤和核心操作伪代码。对比实验表明,基于压缩后缀数组的索引比传统倒排文件索引的短语查准率提高了近20%。
关键词
压缩后缀数组
倒排文件
后缀数组
搜索引擎
Keywords
Compressed suffix array( Csa)
inverted file
suffix array(sa)
search engine
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]
题名 一种灵活的精度可控的可搜索对称加密方案
被引量:3
2
作者
李西明
陶汝裕
粟晨
黄琼
黄欣沂
机构
华南农业大学数学与信息学院
福建师范大学数学与信息学院
出处
《计算机研究与发展》
EI
CSCD
北大核心
2020年第1期3-16,共14页
基金
国家自然科学基金优秀青年科学基金项目(61822202)
国家自然科学基金项目(61872152,61872409)
+2 种基金
广东省自然科学基金杰出青年基金项目(2014A030306021)
广东省特支计划科技创新青年拔尖人才项目(2015TQ01X796)
广东省基础与应用基础研究重大项目(2019B030302008)This work was~~
文摘
中查找到关键词记录的这3种搜索情况.同时,系统也结合3种搜索设计了一种模糊增强搜索进一步增强系统的实用性.FASSE方案的具体实现语言是Java编程开发语言,并且最终实验得出FASSE在https://eprint.iacr.org/complete/的论文数据集中平均搜索完每一篇论文的时间为114.26ms.
关键词
可搜索对称加密
后缀数组
LF映射
SubLF映射
FM索引
BWT转换
Keywords
searchable symmetric encryption(SSE)
suffix array (sa )
LF mapping
SubLF mapping
FM-index
Burrows Wheeler transform(BWT)
分类号
TP391
[自动化与计算机技术—计算机应用技术]