期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
一种支持多种子近似串匹配的q-gram索引 被引量:3
1
作者 孙德才 王晓霞 《计算机科学》 CSCD 北大核心 2014年第9期279-284,共6页
如何在大型文本库中快速找出给定串的近似串是大数据时代要解决的关键问题。基于多种子的近似串匹配算法因匹配速度快而得到众多学者的青睐,但巨大的索引空间消耗也使其难以处理大型文本库。提出了一种支持多种子的q-gram索引结构,通过... 如何在大型文本库中快速找出给定串的近似串是大数据时代要解决的关键问题。基于多种子的近似串匹配算法因匹配速度快而得到众多学者的青睐,但巨大的索引空间消耗也使其难以处理大型文本库。提出了一种支持多种子的q-gram索引结构,通过该索引能够快速地计算出给定任意长度连续种子的地址集合,解决了多种子近似串匹配算法中种子的数目和长度受存储空间限制的问题。实验数据显示,新索引方案成倍地减少了存储空间的消耗。实验结果表明,提出的索引方案在大数据环境下的多种子近似匹配中具有一定的优势。 展开更多
关键词 大数据 近似串匹配 种子 q-gram索引 多种子索引
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部