期刊文献+
共找到19篇文章
< 1 >
每页显示 20 50 100
高性能计算及其相关新兴技术 被引量:14
1
作者 陈国良 毛睿 蔡晔 《深圳大学学报(理工版)》 EI CAS CSCD 北大核心 2015年第1期25-31,共7页
回顾高性能计算的发展历史,评述网格计算、云计算及其与高性能计算之间的关系,阐释新兴技术大数据和物联网,比较大数据、云计算与高性能计算的性能并分析其彼此间的关系.介绍代表国际高性能计算领域发展趋势的普适高性能计算以及作者在... 回顾高性能计算的发展历史,评述网格计算、云计算及其与高性能计算之间的关系,阐释新兴技术大数据和物联网,比较大数据、云计算与高性能计算的性能并分析其彼此间的关系.介绍代表国际高性能计算领域发展趋势的普适高性能计算以及作者在普及型高性能计算机研制方面的最新进展.指出高性能计算存在的一些难题,以及研制千万亿次以上的高性能计算机所面临的挑战. 展开更多
关键词 计算机工程 高性能计算 网格计算 云计算 大数据 物联网
在线阅读 下载PDF
大数据环境下并行计算模型的研究进展 被引量:20
2
作者 潘巍 李战怀 《华东师范大学学报(自然科学版)》 CAS CSCD 北大核心 2014年第5期43-54,共12页
在大数据时代,制约并行计算发展的掣肘正在发生改变,为分布式并行计算带来了前所未有的机遇和挑战.回顾了并行计算的发展和大数据环境下的新变化;结合硬件环境、计算模式、以及应用需求等对于并行计算模型研究的影响,综述了面向批处理... 在大数据时代,制约并行计算发展的掣肘正在发生改变,为分布式并行计算带来了前所未有的机遇和挑战.回顾了并行计算的发展和大数据环境下的新变化;结合硬件环境、计算模式、以及应用需求等对于并行计算模型研究的影响,综述了面向批处理、面向流处理、面向图数据以及面向内存等几类并行计算模型的相关研究;展望了其发展趋势. 展开更多
关键词 大数据 计算模型 并行计算 内存计算
在线阅读 下载PDF
多分支特征融合分类网络用于CXR图像识别 被引量:1
3
作者 苏华强 雷海军 雷柏英 《信号处理》 北大核心 2025年第2期253-266,共14页
COVID-19是由新型冠状病毒引起的一种传染性疾病,给全球公共卫生带来了巨大的挑战。在临床实践中,胸部X射线(Chest X-ray,CXR)检查是识别COVID-19感染和其他常见肺部疾病的重要手段,然而放射科医生对COVID-19患者进行检查需要耗费大量... COVID-19是由新型冠状病毒引起的一种传染性疾病,给全球公共卫生带来了巨大的挑战。在临床实践中,胸部X射线(Chest X-ray,CXR)检查是识别COVID-19感染和其他常见肺部疾病的重要手段,然而放射科医生对COVID-19患者进行检查需要耗费大量时间和精力,而且增加医生感染的风险。因此,能够从胸部X射线的图像中,自动识别COVID-19的算法显得尤为重要。本文提出了一种基于深度学习的CXR图像分类框架,该框架能够在有限的训练数据下生成更具判别力的特征。具体而言,首先通过残差神经网络(ResNet34和ResNet50)和Transformer组成多分支分类网络,其中ResNet分支通过深度残差结构,有效地提取丰富的语义信息和细腻的纹理信息;而Transformer分支则通过自注意力机制,捕捉图像的全局语义特征。随后,利用特征交互模块将ResNet分支提取丰富的语义信息和纹理信息,与Transformer提取的全局语义特征进行特征交互。最后,再通过特征融合模块来提取图像的多尺度语义特征。该方法能够在有限训练数据的条件下提取多尺度特征表示,以对COVID-19感染区域进行特征提取和定位。实验在公开DLAI3和COVIDx数据集上与15种方法进行了比较,相比于ResNet50的模型,准确率分别提高了1.37%和0.76%。本文提出的分类方法,结合ResNet和Transformer网络在特征提取上的优点,使得网络对CXR图像的识别结果更加准确。 展开更多
关键词 胸部X射线检查 特征交互模块 多分支分类网络 残差神经网络 TRANSFORMER
在线阅读 下载PDF
一种快速HEVC帧内预测模式决策算法 被引量:10
4
作者 雷海军 危雄 +1 位作者 杨张 袁梅冷 《计算机工程》 CAS CSCD 2014年第5期270-273,共4页
高性能视频编码(HEVC)标准是视频编码联合小组提出的新的视频编码标准。针对HEVC帧内预测模式决策的高计算复杂度问题,提出一种基于边缘方向强度检测的快速帧内预测模式决策算法。将35种帧内预测模式根据5个基本方向分为5个预测候选模... 高性能视频编码(HEVC)标准是视频编码联合小组提出的新的视频编码标准。针对HEVC帧内预测模式决策的高计算复杂度问题,提出一种基于边缘方向强度检测的快速帧内预测模式决策算法。将35种帧内预测模式根据5个基本方向分为5个预测候选模式集合,每个集合中有11种预测模式。分别计算预测单元(PU)的5个方向的方向强度,以及每个方向所占比例,选择比例最大的方向所对应的候选模式集合为该PU块的候选预测模式,有效减少帧内预测的计算复杂度。实验结果证明,与HM8.0相比,该算法能够以保证视频质量为前提,在高效率条件和低复杂度条件下平均节省15%和18%的编码时间。 展开更多
关键词 视频编码 高性能视频编码标准 帧内预测 预测单元 模式决策 边缘方向检测
在线阅读 下载PDF
多视点视频编码混合快速搜索算法 被引量:3
5
作者 雷海军 杨辉 +1 位作者 杨张 袁梅冷 《小型微型计算机系统》 CSCD 北大核心 2013年第5期1176-1180,共5页
EPZS是联合多视点视频编码(JMVC,Joint Multi-view Video Coding)运动估计中采用的一种预测搜索算法,其搜索速度慢.针对EPZS算法的性能不足,我们在预测矢量集合、搜索模型、阈值设置和搜索策略四个方面进行改进,提出了一种混合快速搜索... EPZS是联合多视点视频编码(JMVC,Joint Multi-view Video Coding)运动估计中采用的一种预测搜索算法,其搜索速度慢.针对EPZS算法的性能不足,我们在预测矢量集合、搜索模型、阈值设置和搜索策略四个方面进行改进,提出了一种混合快速搜索算法.在联合多视点视频编码测试平台JMVC8.3中,对三个由平行摄像机采集的多视点视频测试序列BallRoom、Exit和Vassar进行测试.实验结果表明:在保证视频重建质量和码率的前提下,与Jmvc中的EPZS算法相比,编码速度平均提高了55.66%~69.62%,改进算法的效果明显,编码效率得以提高. 展开更多
关键词 运动估计 多视点视频编码 混合搜索 EPZS 编码效率
在线阅读 下载PDF
多视点视频编码模式决策快速算法 被引量:1
6
作者 袁梅冷 杨张 雷海军 《小型微型计算机系统》 CSCD 北大核心 2015年第3期581-585,共5页
多层循环的多参考帧选择算法和运动估计搜索等算法提高了模式选择精度,但导致多视点视频编码复杂度急剧增加.我们在运动估计快速搜索算法的基础上,结合采用信息重用技术的多参考帧选择算法,提出一种模式决策快速算法.其中信息重用技术... 多层循环的多参考帧选择算法和运动估计搜索等算法提高了模式选择精度,但导致多视点视频编码复杂度急剧增加.我们在运动估计快速搜索算法的基础上,结合采用信息重用技术的多参考帧选择算法,提出一种模式决策快速算法.其中信息重用技术通过模式集合划分思想,根据模式尺寸块大小和编码特点将所有编码模式划分成三个集合,在同一集合中小尺寸块重用大尺寸块的最佳参考帧索引和最佳编码方向以减少多参考帧循环搜索次数.实验结果表明:与JMVC8.3.1原算法相比能减少70%-90%的编码复杂度,峰值信噪比(PSNR)下降在0.1d B以内,码率增加幅度少于6%. 展开更多
关键词 多视点视频编码 运动估计 模式决策 多参考帧选择
在线阅读 下载PDF
改进的变长夹角链码算法及在码头识别中的应用 被引量:1
7
作者 张永梅 杨飞 许静 《国土资源遥感》 CSCD 北大核心 2016年第4期164-169,共6页
针对变长夹角链码对曲线近似时的角度信息损失问题,提出了一种变长夹角链码的改进方法,并将该方法应用于码头目标的特征提取。该方法改变了变长夹角链码算法在折线终点选取时的规则,在继承变长夹角链码优点的基础上,保留了曲线曲率较大... 针对变长夹角链码对曲线近似时的角度信息损失问题,提出了一种变长夹角链码的改进方法,并将该方法应用于码头目标的特征提取。该方法改变了变长夹角链码算法在折线终点选取时的规则,在继承变长夹角链码优点的基础上,保留了曲线曲率较大的拐角,略去了曲线的较小波动,使有较小波动的曲线近似为直线。改进后的方法使折线能更好地逼近曲线,应用折线逼近并表示曲线,有利于提取曲线的角度特征和线特征。应用该方法提取图像特征,用于码头目标的检测,针对水陆分割后的海岸线使用改进的夹角链码提取海岸线的几何特征。实验表明,该方法能够有效地提取码头的直角、平行线特征,再依据码头先验知识,标记出码头区域。 展开更多
关键词 夹角链码 变长夹角链码 曲线描述 特征提取 港口检测 图像处理
在线阅读 下载PDF
基于TD-LTE的轨道交通集群调度系统 被引量:8
8
作者 季一木 柴博周 +2 位作者 杨罗坤 朱曈晖 李文峰 《计算机工程》 CAS CSCD 北大核心 2017年第6期296-300,共5页
传统轨道交通集群调度服务系统的峰值通信速率较低,无法实现日常调度工作中的高频次语音通信和基本视频通信。为此,采用4G TD-LTE技术、数据库连接池优化机制和I/O完成端口策略,设计一种新型调度服务系统。仿真测试结果表明,该系统能有... 传统轨道交通集群调度服务系统的峰值通信速率较低,无法实现日常调度工作中的高频次语音通信和基本视频通信。为此,采用4G TD-LTE技术、数据库连接池优化机制和I/O完成端口策略,设计一种新型调度服务系统。仿真测试结果表明,该系统能有效降低通信时延,提高并发量,可满足大容量、高速率、多媒体的现代轨道集群通信网络调度需求。 展开更多
关键词 分时长期演进技术 集群调度 并发量 I/O完成端口 数据库连接池
在线阅读 下载PDF
一种云环境下用户隐私数据分类加密方案研究与实现 被引量:1
9
作者 季一木 蒋晨晨 +1 位作者 匡子卓 王汝传 《南京邮电大学学报(自然科学版)》 北大核心 2015年第5期80-86,共7页
文中针对云环境下用户隐私数据的安全性和数据应用操作效率要求相矛盾的问题,提出一种基于同态加密和密钥策略基于属性的加密(Ciphertext-Policy Attributed-Based Encryption,CP-ABE)混合加密方案,实现了对云用户隐私信息分类加密保护... 文中针对云环境下用户隐私数据的安全性和数据应用操作效率要求相矛盾的问题,提出一种基于同态加密和密钥策略基于属性的加密(Ciphertext-Policy Attributed-Based Encryption,CP-ABE)混合加密方案,实现了对云用户隐私信息分类加密保护。方案中将云用户隐私数据分为绝对保密的A类和可被部分可信用户合理访问的B类两种,其中A类数据进行同态方法加密,确保重要的隐私不容易被窃取;对B类数据使用CP-ABE算法进行加密,并制定访问控制树,确保可信用户进行合理访问。实验结果表明,通过基于不同类别的加密方案,使得云用户的数据共享更加安全便捷,混合方案更贴近用户需求。 展开更多
关键词 云计算 隐私保护 同态加密 CP-ABE
在线阅读 下载PDF
轨道交通系统中多客户端连接池动态分配策略 被引量:3
10
作者 季一木 杨罗坤 +2 位作者 柴博周 朱曈晖 李文峰 《计算机工程》 CAS CSCD 北大核心 2017年第5期35-39,46,共6页
针对轨道交通集群调度系统中数据库连接池参数一次性设定后不可修改的问题,设计面向多客户端的数据库连接池动态分配策略。通过使用动态分配算法,根据每个客户端访问频率的不同为当前客户端分配最优连接数,从而达到提高系统资源利用率... 针对轨道交通集群调度系统中数据库连接池参数一次性设定后不可修改的问题,设计面向多客户端的数据库连接池动态分配策略。通过使用动态分配算法,根据每个客户端访问频率的不同为当前客户端分配最优连接数,从而达到提高系统资源利用率的目的。实验结果表明,该动态分配策略能够缩短连接池响应时间,提高系统运行效率。 展开更多
关键词 数据库连接池 集群调度系统 多客户端 连接复用 动态分配
在线阅读 下载PDF
SOC快速内存检查点的研究与实现
11
作者 袁小龙 蔡翔 宋莉莉 《北京交通大学学报》 CAS CSCD 北大核心 2015年第3期109-113,121,共6页
随着系统芯片SOC设计技术的普遍应用,对应的可靠性问题逐渐成为关注的焦点.提出一种应用在SOC设计上的内存检查点技术,通过硬件逻辑将内存中的数据备份到非易失存储介质中,系统恢复时将数据从存储介质取出,重新拷贝到内存,避免内存中的... 随着系统芯片SOC设计技术的普遍应用,对应的可靠性问题逐渐成为关注的焦点.提出一种应用在SOC设计上的内存检查点技术,通过硬件逻辑将内存中的数据备份到非易失存储介质中,系统恢复时将数据从存储介质取出,重新拷贝到内存,避免内存中的数据丢失;同时给出外部存储器到RAM的程序代码拷贝设计,显著提高了内存检查点保存的速度.在断电等突发情况下,可以有效地保护内存中的数据,具有很好的通用性,占用资源较少,可以广泛应用于实时系统的容错机制中. 展开更多
关键词 片上系统 内存 检查点 非易失性存储
在线阅读 下载PDF
基于Storm的面向大数据实时流查询系统设计研究 被引量:6
12
作者 蒋晨晨 季一木 +1 位作者 孙雁飞 王汝传 《南京邮电大学学报(自然科学版)》 北大核心 2016年第3期100-105,111,共7页
随着大数据的发展,传统的流查询系统框架不能满足用户实时查询的需求。通过调研传统的集中式查询系统与流计算框架,提出了一种新的能够适应用户处理连续查询的实时查询框架。该框架具备延时小、可拓展的特点。最后实验证明,该框架能够... 随着大数据的发展,传统的流查询系统框架不能满足用户实时查询的需求。通过调研传统的集中式查询系统与流计算框架,提出了一种新的能够适应用户处理连续查询的实时查询框架。该框架具备延时小、可拓展的特点。最后实验证明,该框架能够满足大数据流处理要求。 展开更多
关键词 大数据 流查询系统 Storm平台 实时流数据
在线阅读 下载PDF
改进密度峰值支撑点选取及其在度量空间离群检测的应用 被引量:3
13
作者 许红龙 唐颂 +2 位作者 毛睿 陈国良 刘刚 《小型微型计算机系统》 CSCD 北大核心 2017年第5期983-987,共5页
基于支撑点的度量空间离群检测算法旨在尽快提高离群度阀值,以达到快速检测离群点的效果.然而现有的相关算法缺乏有效的支撑点选取方法,造成支撑点选取结果不稳定,最终导致算法性能波动较大.应用于聚类的密度峰值算法不失为一种良好的... 基于支撑点的度量空间离群检测算法旨在尽快提高离群度阀值,以达到快速检测离群点的效果.然而现有的相关算法缺乏有效的支撑点选取方法,造成支撑点选取结果不稳定,最终导致算法性能波动较大.应用于聚类的密度峰值算法不失为一种良好的支撑点选取算法,然而其密度峰值搜索目标难以确定.通过改进密度峰值算法,通过自动确定距离值,计算该范围内对象的数量来确定密度峰值,从而选取出具有最大密度的支撑点,应用于度量空间离群检测之中.实验结果表明该算法较已有算法获得较大的提升,平均加速比为2.41,最高达6.28;距离计算次数平均减少60.67%,最高达91.17%,而建立索引所需时间在可接受范围内. 展开更多
关键词 离群检测 度量空间 索引 支撑点 密度峰值
在线阅读 下载PDF
基于近期最远遍历的支撑点选择 被引量:5
14
作者 李兴亮 毛睿 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2017年第3期483-496,共14页
度量空间数据管理分析方法把数据抽象成度量空间中的点,具有高度的通用性,是应对大数据多样性挑战的有效手段之一.由于度量空间没有坐标,很多数学工具无法直接使用,一般以数据到参考点(也称作支撑点)的距离作为坐标.支撑点的好坏对于度... 度量空间数据管理分析方法把数据抽象成度量空间中的点,具有高度的通用性,是应对大数据多样性挑战的有效手段之一.由于度量空间没有坐标,很多数学工具无法直接使用,一般以数据到参考点(也称作支撑点)的距离作为坐标.支撑点的好坏对于度量空间数据管理分析的性能发挥着关键性的影响.最远优先遍历(Farthest First Traversal,FFT)可以选出数据拐角的点,具有线性的时间复杂度和空间复杂度,是使用最广泛的支撑点选取算法之一.但是,实验表明最好的支撑点往往不是最拐角的点,故FFT很难选出最好的支撑点.提出近期最远遍历(Recent Farthest Traversal,RFT)算法,只以近期的几个支撑点来选择下一个支撑点,能够更快地选出性能更优的支撑点.同时,实验表明FFT还可以在数据内部均匀抽样.提出支撑点集合选择算法(Pivot Set Selection,PSS),可以一次性选出所有支撑点.以RFT选择候选集,以FFT选择评价集,选出支撑点并构建相似性索引,PSS使得索引构建代价大大降低,索引性能得到一定提升.实验表明,RFT选出好的支撑点的速度远快于FFT,准确率高于FFT,而FFT的抽样效果良好. 展开更多
关键词 度量空间 多样性 支撑点选择 大数据
在线阅读 下载PDF
面向大数据的内存数据管理研究现状与展望 被引量:11
15
作者 嵇智源 潘巍 《计算机工程与设计》 CSCD 北大核心 2014年第10期3499-3506,共8页
对面向大数据的内存数据管理技术的相关研究进行综述。梳理大数据环境下数据管理技术发展的脉络和格局的变化;分析新环境下的内存数据管理技术面临的发展机遇与研究挑战;介绍相关的前沿研究,其中包括分布式编程模型、混合存储体系结构... 对面向大数据的内存数据管理技术的相关研究进行综述。梳理大数据环境下数据管理技术发展的脉络和格局的变化;分析新环境下的内存数据管理技术面临的发展机遇与研究挑战;介绍相关的前沿研究,其中包括分布式编程模型、混合存储体系结构、内存数据管理等;给出技术和管理上的发展展望。 展开更多
关键词 大数据 内存计算 存储级内存 多核 混合存储体系
在线阅读 下载PDF
基于多种支撑点的度量空间离群检测算法 被引量:4
16
作者 许红龙 唐颂 +3 位作者 毛睿 沈婧 刘刚 陈国良 《计算机学报》 EI CSCD 北大核心 2017年第12期2839-2855,共17页
大数据的价值实现,归根到底还是依赖于数据挖掘技术.而在很多领域中,海量数据的非常规模式往往更具分析价值.离群检测,也叫异常检测,是用于挖掘海量数据中非常规模式的一项关键技术,广泛应用于网络入侵检测、公共卫生、医疗监控等领域.... 大数据的价值实现,归根到底还是依赖于数据挖掘技术.而在很多领域中,海量数据的非常规模式往往更具分析价值.离群检测,也叫异常检测,是用于挖掘海量数据中非常规模式的一项关键技术,广泛应用于网络入侵检测、公共卫生、医疗监控等领域.基于索引的离群检测算法通常具有较高的检测速度,然而现有的大多数基于索引的检测算法并非完全基于距离,导致通用性降低.较高的抽象能力使得度量空间具有比多维空间更广泛的适用范围,在其基础上设计的算法具有更高的通用性.而最新的度量空间基于索引的离群检测算法iORCA算法通过随机选取支撑点,基于数据到单支撑点的距离建立索引,并应用终止规则(Stopping rule)以期提前结束离群检测并得到正确的结果,多数情况下该机制起到加快检测速度的重要作用.然而iORCA算法未提供支撑点选取算法导致检测结果不稳定,且未能充分利用距离三角不等性减少距离计算次数.针对这些问题,文中指出基于距离的离群点定义应结合使用完全基于距离的离群检测算法,以确保算法的通用性,由此提出了度量空间离群检测的概念.在此基础上明确了支撑点选取的两大目标,即边缘支撑点和密集支撑点,并提出基于多种支撑点的度量空间离群检测算法VPOD.考虑到两个支撑点选取目标难以同时达到,VPOD算法分别予以选取,在近似的密集区域选取支撑点,即密集支撑点,对应使用终止规则,然后用FFT(Farthest-First Traversal)算法另选取若干支撑点,即边缘支撑点,与数据集计算距离而形成支撑点空间,利用距离三角不等性,使距离计算次数显著减少,从而提高检测速度.实验表明该算法能在可接受的时间范围内建立索引,并能高效检测离群点,加速比达2.05,最高达3.54,距离计算次数平均减少51.14%,最高达89.46%,同时保持对多种常见的基于距离的离群点定义的兼容. 展开更多
关键词 离群检测 度量空间 索引 支撑点选取 三角不等性
在线阅读 下载PDF
基于互信息的动态网络链路预测算法研究 被引量:2
17
作者 齐方鹏 王童 +1 位作者 周明洋 傅忠谦 《中国科学技术大学学报》 CAS CSCD 北大核心 2018年第6期440-446,共7页
链路预测中关键的问题是如何通过已知的节点属性信息和网络的结构特征来衡量两个节点之间产生连边的可能性.传统的链路预测算法假设网络结构是保持不变的,而实际系统中的时间信息对网络的结构和网络的动态特性有很大的影响,从而导致了... 链路预测中关键的问题是如何通过已知的节点属性信息和网络的结构特征来衡量两个节点之间产生连边的可能性.传统的链路预测算法假设网络结构是保持不变的,而实际系统中的时间信息对网络的结构和网络的动态特性有很大的影响,从而导致了传统方法预测精度较低.为此,通过将互信息方法与移动平均模型相结合,提出了移动平均互信息方法.该方法不仅考虑了节点之间的共同邻居信息,还利用历史信息描述了网络的演化模式.在4个动态网络中的实验结果表明,移动平均互信息方法优于传统的对比方法,在预测精度上有了较大的提高. 展开更多
关键词 动态网络 链路预测 互信息 时间序列模型
在线阅读 下载PDF
基于颜色四通道及空间金字塔的鱼类图像检索 被引量:5
18
作者 张美玲 吴俊峰 +2 位作者 于红 崔榛 董婉婷 《计算机应用》 CSCD 北大核心 2019年第5期1466-1472,共7页
随着计算机视觉技术在海洋水产领域中的应用不断加深,鱼类图像检索在渔业资源调查、鱼类行为学分析等方面发挥了巨大的作用。通过研究发现,鱼类图像的背景信息会对鱼类图像检索造成极大干扰,而且鱼类图像中颜色、纹理、形状等特征由于... 随着计算机视觉技术在海洋水产领域中的应用不断加深,鱼类图像检索在渔业资源调查、鱼类行为学分析等方面发挥了巨大的作用。通过研究发现,鱼类图像的背景信息会对鱼类图像检索造成极大干扰,而且鱼类图像中颜色、纹理、形状等特征由于空间位置信息的缺乏而使检索的准确率不高。为解决以上问题,提出了一种新的基于颜色四通道及空间金字塔的鱼类图像检索算法。首先,提取视觉显著性图将鱼类图像的前景和背景分开,从而减少图像背景对检索的干扰;其次,为了使图像特征包含一定的空间位置信息,利用空间金字塔的理论对图像进行分割,在此基础上,将图像转为HSVG四通道图并提取SURF特征;;最后,得到检索结果。为验证所提算法的有效性,在QUT_fish_data数据集和DLOU_fish_data数据集上对算法的查全率、查准率与经典的HSVG算法和显著性分块算法进行对比:在两个数据集上查准率分别比传统的HSVG算法最多分别提高12%和5%,查全率最多分别提高7%和22%;比传统的显著性分块算法查准率最多分别提高15%和5%,查全率最多分别提高36%和22%;从而证明所提算法是有效的,能有效提升鱼类图像的检索效果。 展开更多
关键词 鱼类图像检索 颜色通道 空间金字塔 图像特征
在线阅读 下载PDF
RPA:一种内存高效的度量空间recall@R近似最近邻搜索索引
19
作者 江润本 陈家颖 毛睿 《深圳大学学报(理工版)》 CAS CSCD 北大核心 2023年第6期640-648,共9页
现有的度量空间的近似最近邻搜索(approximate nearest neighbor search, ANNS)方法通常依赖于预选择的支撑点构成的序列,序列中的支撑点按照到数据元素的距离升序排列.然而,大多数现有的度量空间ANNS方法由于索引结构复杂、支撑点过多... 现有的度量空间的近似最近邻搜索(approximate nearest neighbor search, ANNS)方法通常依赖于预选择的支撑点构成的序列,序列中的支撑点按照到数据元素的距离升序排列.然而,大多数现有的度量空间ANNS方法由于索引结构复杂、支撑点过多或者未能充分利用距离信息导致搜索时内存开销巨大.为此,提出精简排列阵(reduced permutation array, RPA)的度量空间recall@R近似最近邻搜索方法.对于全体数据元素,RPA预先选择k个支撑点,对每个数据元素仅存储离该数据元素最近的l个(l<<k),并将所有元素的支撑点序列构建为一个数组结构.在搜索过程中,利用一种得分函数,该函数基于查询对象到各个支撑点的距离来近似计算数据元素到查询对象的距离.同时,维护一个有界最小堆,以保存R个候选结果数据元素.RPA具有结构简单、内存效率高和可扩展性强等特点.实验结果表明,在相同召回率的情况下,与排列索引(permutation-based index, P-index)相比,RPA平均具有高达3倍的内存压缩比.研究结果可在内存资源有限的单机环境下提供一种有效的针对海量数据的ANNS方法. 展开更多
关键词 计算机科学与技术 近似最近邻搜索 度量空间 索引结构 支撑点选择 支撑点序列 内存高效
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部