-
题名分档布鲁姆过滤器的查询算法
被引量:14
- 1
-
-
作者
谢鲲
闵应骅
张大方
谢高岗
文吉刚
-
机构
湖南大学计算机与通信学院
中国科学院计算技术研究所网络与普适计算研究部
湖南大学软件学院
-
出处
《计算机学报》
EI
CSCD
北大核心
2007年第4期597-607,共11页
-
基金
国家自然科学基金(60473031
60273070
+3 种基金
60403031
90604015)
国家"八六三"高技术研究发展计划项目基金(2005AA121560)
湖南省科技计划项目基金(2006GK3101)资助.
-
文摘
布鲁姆过滤器是一种能够简洁地表示集合并支持集合查询的数据结构,广泛应用于数据库、网络和分布式系统中.针对现有的布鲁姆过滤器没有考虑查询失效代价这一缺陷,文中提出一种新的代价敏感的分档布鲁姆过滤器查询算法.它将元素根据不同的查询代价分为不同的子集,通过考查每档子集最低查询失效率的关系,建立由每档子集合最低查询失效假阳性概率表示的集合最低查询失效总代价目标函数,使用类目标函数梯度遗传算法获得每档的最优Hash函数个数ki,完成集合到向量的映射与查找.仿真实验结果表明,使用新结构的查询算法和标准布鲁姆过滤器算法相比,所用的查询计算时间基本相同,因为区分对待集合元素,查询失效总代价仅为标准算法的27%.
-
关键词
分档布鲁姆过滤器
计算机网络
分布式计算
分布式消息系统
集合元素查询
-
Keywords
Basket Bloom Filter
computer networks
distributed computing
distributed information system
membership query
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名联合多维布鲁姆过滤器查询算法
被引量:8
- 2
-
-
作者
谢鲲
秦拯
文吉刚
张大方
谢高岗
-
机构
湖南大学计算机与通信学院
湖南大学软件学院
中国科学院计算技术研究所网络与普适计算研究部
香港理工大学电子计算学系
-
出处
《通信学报》
EI
CSCD
北大核心
2008年第1期56-64,共9页
-
基金
国家自然科学基金资助项目(60673155,90604015,60703097)
湖南省科技计划基金资助项目(2006FJ4110)
广东省科技计划基金资助项目(2007B01020043)~~
-
文摘
分析了现有多维布鲁姆过滤器查询算法(MDBF)工作原理,提出了一种改进的两步表示和查询的联合多维布鲁姆过滤器(CMDBF)查询算法。CMDBF新增一个用于表示元素整体的联合布鲁姆过滤器CBF,CMDBF中元素表示和查找分两步进行。将MDBF的各属性的表示和查询作为第一步,第二步联合元素所有属性域,利用CBF完成元素整体的表示和查询确认。理论分析和仿真实验结果表明,CMDBF能够支持多维集合元素的简洁表示和查询,相比MDBF查询误判率降低明显。
-
关键词
计算机网络
分布式计算
分布式消息系统
集合元素查询
多维布鲁姆过滤器
-
Keywords
computer networks
distributed computing
distributed information system
set membership query
multidimensional bloom filter
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名布鲁姆过滤器代数运算探讨
被引量:8
- 3
-
-
作者
谢鲲
张大方
文吉刚
谢高岗
尤志强
-
机构
湖南大学计算机与通信学院
香港理工大学电子计算学系
湖南大学软件学院
中国科学院计算技术研究所
-
出处
《电子学报》
EI
CAS
CSCD
北大核心
2008年第5期869-874,共6页
-
基金
国防基础科研“十一五”规划(No.A1420060162)
-
文摘
本文探讨布鲁姆过滤器的代数运算和集合查询的关系,定义布鲁姆过滤器的"并","交","异或","补","差"代数运算,从理论和实验两方面分析布鲁姆过滤器的代数运算和集合代数运算并集,交集,异或集,补集,差集的元素查询关系.理论分析和实验结果表明,布鲁姆过滤器的"并","交"运算能够支持集合并集交集的元素查询,这一结论可以简化利用布鲁姆过滤器进行的系统设计.
-
关键词
计算机网络
分布式计算
分布式消息系统
集合元素查询
代数运算
-
Keywords
computer networks
distributed computing
distributed information system
set membership query
algebraic operations
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名布隆过滤器研究综述
被引量:8
- 4
-
-
作者
华文镝
高原
吕萌
谢平
-
机构
青海师范大学计算机学院
青海省物联网重点实验室
省部共建藏语智能信息处理及应用国家重点实验室
高原科学与可持续发展研究院
-
出处
《计算机应用》
CSCD
北大核心
2022年第6期1729-1747,共19页
-
基金
国家自然科学基金资助项目(61762075)
青海省自然科学基金资助项目(2020⁃ZJ⁃926)。
-
文摘
布隆过滤器(BF)是一种基于哈希策略的二进制向量数据结构,凭借分摊哈希碰撞的思想、存在单向误判性的特点以及极小常数查询时间复杂度,常用于表示集合元素并作为进行集合元素查询操作的“加速器”。作为计算机工程中解决集合元素查询问题最好的数学工具,BF在网络工程、存储系统、数据库、文件系统、分布式系统等领域得到了广泛的应用和发展。近几年来,为了适用于各种硬件环境和应用场景,BF出现了大量基于改变结构、优化算法等思想的变种方案。随着大数据时代的发展,对BF自身特点和操作逻辑进行改进已经成为现有集合元素查询研究的一个重要方向。
-
关键词
布隆过滤器
集合元素查询
近似成员查询结构
哈希策略
误判率
-
Keywords
Bloom Filter(BF)
membership query
Approximate Membership Query(AMQ)structure
hashing strategy
False Positive Rate(FPR)
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名一种基于树形结构的布鲁姆过滤器
被引量:1
- 5
-
-
作者
程聂
黄昆
苏欣
张大方
-
机构
湖南大学软件学院
-
出处
《计算机工程与科学》
CSCD
北大核心
2012年第2期19-24,共6页
-
基金
国家发改委信息安全专项(发改办高技[2009]1886号文)
湖南省科技计划重点项目(2009JT1018)
-
文摘
本文提出一种基于多层次结构的树形布鲁姆过滤器TBF。多层次结构是近年来布鲁姆过滤器及相关数据结构研究的热点。这一结构使得多层次的存储方式得以实现,减轻了片上存储的负担,而且也加快了片上查找的速度。TBF是针对BloomingTree算法存在的缺陷所改进的一种更高效的算法,它能够在低于CBF的空间需求的条件下实现与CBF相同的功能。实验证明:与BloomingTree算法相比,TBF能够有效地解决BloomingTree算法在逻辑索引时的错误问题,而且比BloomingTree算法时间上更加高效:在层数不变假阳性相同条件下,查询时间平均提高13.4%;在假阳性不变层数相同条件下,插入时间平均提高17.9%,删除时间平均提高12%。
-
关键词
布鲁姆过滤器
多层次结构
数据结构
集合元素查询
-
Keywords
Bloom filter
multi-level structure
data structure
set element search
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名基于双布鲁姆过滤器的数据排重技术
被引量:2
- 6
-
-
作者
席晔文
杨金民
-
机构
湖南大学信息科学与工程学院
-
出处
《计算机工程与应用》
CSCD
2014年第23期198-202,共5页
-
基金
国家自然科学基金(No.61272401
No.61173167)
"973"子项目(No.2012CB315801)
-
文摘
针对文件级单布鲁姆过滤器排重算法只能以文件为单位进行数据排重,数据块级单布鲁姆过滤器排重算法耗时过多的缺点,采用2个布鲁姆过滤器,创建文件级和数据块级2级数据排重的算法结构。实验结果表明,双布鲁姆过滤器排重算法可以以数据块为单位对数据排重,在保持低假阳性误判率的同时,相比数据块级单布鲁姆过滤器排重算法耗时缩短了43%-68%。
-
关键词
重复数据删除
集合元素查询
布鲁姆过滤器
MD5
假阳性误判率
-
Keywords
duplicate data delete
query elements
bloom filter
MD5
false positive error rate
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-