期刊文献+
共找到53篇文章
< 1 2 3 >
每页显示 20 50 100
基于LSH的时间子序列查询算法 被引量:6
1
作者 汤春蕾 董家麒 《计算机学报》 EI CSCD 北大核心 2012年第11期2228-2236,共9页
子序列的相似性查询是时间序列数据集中的一种重要操作,包括范围查询和k近邻查询.现有的大多算法是基于欧几里德距离或者DTW距离的,缺点在于查询效率低下.文中提出了一种新的基于LSH的距离度量方法,可以在保证查询结果质量的前提下,极... 子序列的相似性查询是时间序列数据集中的一种重要操作,包括范围查询和k近邻查询.现有的大多算法是基于欧几里德距离或者DTW距离的,缺点在于查询效率低下.文中提出了一种新的基于LSH的距离度量方法,可以在保证查询结果质量的前提下,极大提高相似性查询的效率;在此基础上,给出一种DS-Index索引结构,利用距离下界进行剪枝,进而还提出了两种优化的OLSH-Range和OLSH-kNN算法.实验是在真实的股票序列集上进行的,数据结果表明算法能快速精确地找出相似性查询结果. 展开更多
关键词 相似性查询 时间序列数据库 子序列 lsh 索引
在线阅读 下载PDF
基于关键证据与E^2LSH的增量式人名聚类消歧方法 被引量:6
2
作者 周杰 李弼程 唐永旺 《情报学报》 CSSCI 北大核心 2016年第7期714-722,共9页
搜索引擎中关于人名的相关文档往往数据量庞大,且数据为增量式更新过程,新文档出现的时间与规模都存在不确定性。现有的方法多为全局的人名聚类方法,在处理大规模数据时往往效率较低,且无法实现增量聚类。本文提出了一种基于关键证据与E... 搜索引擎中关于人名的相关文档往往数据量庞大,且数据为增量式更新过程,新文档出现的时间与规模都存在不确定性。现有的方法多为全局的人名聚类方法,在处理大规模数据时往往效率较低,且无法实现增量聚类。本文提出了一种基于关键证据与E^2LSH的增量式人名聚类消歧方法。对于初始文档集,采用全局的人名聚类方法,保证聚类性能且能有效控制全局聚类的文档规模,提高聚类效率。对于增量文档集,利用提出的关键证据与E2LSH方法生成候选文档集,极大降低了需要计算相似度的文档规模,提高方法效率。实验结果表明,本文提出的增量式人名聚类消歧方法能有效改善人名聚类的效率,且具有良好的性能。 展开更多
关键词 人名消歧 增量聚类 关键证据 E2lsh 大规模文档
在线阅读 下载PDF
基于LSH索引的快速图像检索 被引量:6
3
作者 唐俊华 阎保平 《计算机工程与应用》 CSCD 北大核心 2002年第24期20-21,63,共3页
高维空间中点数据的索引及检索是基于内容图像检索领域的关键问题,文中将LSH(localitysensitivehashing)索引算法应用于基于内容图像检索系统中,与传统的索引方法相比,该算法具有复杂度比较低、支持非常高的维数、极低的I/O代价等特点... 高维空间中点数据的索引及检索是基于内容图像检索领域的关键问题,文中将LSH(localitysensitivehashing)索引算法应用于基于内容图像检索系统中,与传统的索引方法相比,该算法具有复杂度比较低、支持非常高的维数、极低的I/O代价等特点。实验结果证明,将该索引算法应用于基于内容图像检索系统中,其性能优于传统的索引方法. 展开更多
关键词 快速图像检索 索引结构 相似性检索 lsh算法 R-树
在线阅读 下载PDF
基于卷积神经网络和E2LSH的遥感图像检索研究 被引量:7
4
作者 彭晏飞 陶进 訾玲玲 《计算机应用与软件》 北大核心 2018年第7期250-255,共6页
遥感图像是一种特征维度很高的图像,当前的遥感图像检索技术图像特征表达能力不强,并且利用海明距离排序后还需计算欧式距离,产生信息损失,严重制约了遥感图像检索技术的性能。基于上述问题,提出一种基于卷积神经网络和E2LSH的遥感图像... 遥感图像是一种特征维度很高的图像,当前的遥感图像检索技术图像特征表达能力不强,并且利用海明距离排序后还需计算欧式距离,产生信息损失,严重制约了遥感图像检索技术的性能。基于上述问题,提出一种基于卷积神经网络和E2LSH的遥感图像检索技术,将遥感图像进行降噪处理之后,利用已经预训练过的VGGNet-D卷积神经网络模型提取图像深层次的特征,挖掘隐含的图像信息;利用L个E2LSH(Exact Euclidean Locality-Sensitive Hashing)函数对提取的特征在保证度量距离的同时进行高效降维并构建L个索引结构;利用L个索引完成粗检索以构成候选集。直接计算并排序候选集的欧氏距离来完成近似最近邻搜索,避免了两种空间及距离的换算。实验结果表明,提出的检索方法减少了距离换算的信息损失并能有效提高遥感图像特征表达能力,使其在查准率和查全率上有更好的检索效果。 展开更多
关键词 遥感图像检索 卷积神经网络 E2lsh 欧氏距离 近似近邻搜索
在线阅读 下载PDF
一种基于分布式LSH的海量视频快速检索方法 被引量:2
5
作者 曹海傧 朱明 冯伟国 《中国科学院研究生院学报》 CAS CSCD 北大核心 2013年第1期106-111,共6页
针对大规模视频数据库,提出一种快速的视频相似性检索方法.该方法采用基于内存约束的分布式哈希结构,称为MD-LSH,有效地解决了快速与可扩展性问题.首先从视频序列中提取出特征向量集合,然后使用MD-LSH对高维特征向量建立索引,根据返回... 针对大规模视频数据库,提出一种快速的视频相似性检索方法.该方法采用基于内存约束的分布式哈希结构,称为MD-LSH,有效地解决了快速与可扩展性问题.首先从视频序列中提取出特征向量集合,然后使用MD-LSH对高维特征向量建立索引,根据返回的相似帧集合对相关的视频进行相似度计算,最后排序得到相似视频的查询结果.实验表明,该方法对大规模视频的快速检索是非常有效的. 展开更多
关键词 基于内容的召回 分布式lsh 海量视频 快速检索
在线阅读 下载PDF
一种基于LSH的时间子序列匹配查询算法 被引量:1
6
作者 刘根平 陈叶芳 +1 位作者 杜呈透 钱江波 《电信科学》 北大核心 2015年第8期63-71,共9页
提出了一种基于LSH(locality sensitive hashing,局部敏感散列)算法处理时间子序列匹配问题的方法LSHSM。不同于FRM和Dual Match方法 ,该方法不需要对时间序列做DFT、DWT等特征变换,而是直接把序列看成高维数据点,利用LSH能处理高维数... 提出了一种基于LSH(locality sensitive hashing,局部敏感散列)算法处理时间子序列匹配问题的方法LSHSM。不同于FRM和Dual Match方法 ,该方法不需要对时间序列做DFT、DWT等特征变换,而是直接把序列看成高维数据点,利用LSH能处理高维数据的特性来查找相似时间子序列。实验采用3种不同的时间序列数据集,通过与线性扫描算法比较,验证了算法的有效性,性能有很大的提高。 展开更多
关键词 时间子序列 lsh 匹配查询
在线阅读 下载PDF
利用K-Means LSH加速求解格中的最短向量问题 被引量:1
7
作者 金悦祺 胡红钢 《密码学报》 CSCD 2020年第4期473-482,共10页
2015年Laarhoven将位置敏感哈希(LSH)引入筛法,得到了基于LSH的高斯筛法框架,用以解决格上最短向量问题(SVP).本文利用该框架,通过引入由机器学习中经典的K-Means聚类算法衍生的K-Means LSH函数,对算法进行优化.实验验证了这种LSH具有... 2015年Laarhoven将位置敏感哈希(LSH)引入筛法,得到了基于LSH的高斯筛法框架,用以解决格上最短向量问题(SVP).本文利用该框架,通过引入由机器学习中经典的K-Means聚类算法衍生的K-Means LSH函数,对算法进行优化.实验验证了这种LSH具有很好的性能,优化后的筛法具有很好的效率.与Laarhoven的筛法对比,我们的算法由于多引入一个参数而具有更好的灵活性与实用价值. 展开更多
关键词 SVP问题 GaussSieve lsh
在线阅读 下载PDF
CB-LSH:基于压缩位图的高性能LSH索引算法 被引量:2
8
作者 吴羽 寿黎但 陈刚 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2012年第3期377-385,共9页
由于传统局部敏感散列(LSH)算法的删除性能不足,阻碍了LSH算法在实际产品中的应用.提出一种基于压缩位图的改进方法,通过引入压缩位图改良传统LSH算法的桶中数据结构,以及使用标记清除策略进行算法流程优化,解决传统LSH索引实时删除性... 由于传统局部敏感散列(LSH)算法的删除性能不足,阻碍了LSH算法在实际产品中的应用.提出一种基于压缩位图的改进方法,通过引入压缩位图改良传统LSH算法的桶中数据结构,以及使用标记清除策略进行算法流程优化,解决传统LSH索引实时删除性能差的问题.理论分析证明:基于压缩位图的LSH(CB-LSH)算法可以显著降低算法的空间复杂度和时间复杂度.实验结果支撑了理论分析的结论,相对于传统LSH算法,CB-LSH在降低内存消耗的同时,可显著提高索引删除、数据插入和数据查询的性能.在大型项目中的应用实践验证了在线实时更新的海量多媒体数据检索系统中,CB-LSH索引算法对于多媒体数据的高维索引是有效可行的,并显著提升了性能、降低了资源消耗. 展开更多
关键词 位图索引 局部敏感散列 高维索引 在线更新
在线阅读 下载PDF
基于LSH的时间序列DTW相似性查询 被引量:5
9
作者 李敏 于长永 +2 位作者 张峰 马海涛 赵宇海 《小型微型计算机系统》 CSCD 北大核心 2019年第10期2155-2159,共5页
提出了一种新颖的基于LSH的时间序列DTW相似性近似查询算法,较好地解决了DTW相似性查询速度慢的问题.首先,分析了DTW相似性度量的特点,即时间弯曲的重要特性;其次,将该特性与LSH函数相结合,设计了高效的DTW相似时间序列过滤方法.在很大... 提出了一种新颖的基于LSH的时间序列DTW相似性近似查询算法,较好地解决了DTW相似性查询速度慢的问题.首先,分析了DTW相似性度量的特点,即时间弯曲的重要特性;其次,将该特性与LSH函数相结合,设计了高效的DTW相似时间序列过滤方法.在很大概率程度上保证了相似的时间序列至少具有一个相同的LSH函数值;最后,给出了一个基于过滤加验证框架的时间序列DTW相似性近似查询算法,该算法利用低维的Hash索引加快候选集合的筛选,从而加快查询速度.实验结果表明,在保持较好的召回率的情况下,本文提出的方法较现有算法有效地提高了DTW相似性查询速度. 展开更多
关键词 时间序列 相似性查询 lsh DTW
在线阅读 下载PDF
低空间复杂度的LSH算法及其在图像检索中的应用 被引量:2
10
作者 曹玉东 刘艳洋 +1 位作者 孙福明 贾旭 《计算机工程与科学》 CSCD 北大核心 2015年第2期379-383,共5页
局部敏感哈希LSH算法是有效的高维数据索引方法,如何生成哈希函数是算法的关键部分。LSH算法的哈希函数是基于p-稳态分布随机生成的,为了提高算法性能就需要增加哈希表的数量,但这会增加算法的空间复杂度。改进后的LSH算法(I-LSH)在生... 局部敏感哈希LSH算法是有效的高维数据索引方法,如何生成哈希函数是算法的关键部分。LSH算法的哈希函数是基于p-稳态分布随机生成的,为了提高算法性能就需要增加哈希表的数量,但这会增加算法的空间复杂度。改进后的LSH算法(I-LSH)在生成哈希函数时不需要有标记的训练样本,而是仅仅利用数据点的分布信息构造投影方向。实验结果表明,在不显著降低检索性能的情况下,ILSH有效地降低了内存的使用量,适合处理大规模数据。 展开更多
关键词 高维数据索引 局部敏感哈希索引 图像检索 Gist特征
在线阅读 下载PDF
基于LSH的高维大数据k近邻搜索算法 被引量:4
11
作者 王忠伟 陈叶芳 +1 位作者 钱江波 陈华辉 《电子学报》 EI CAS CSCD 北大核心 2016年第4期906-912,共7页
局部敏感哈希(LSH)及其变体是解决高维数据k近邻(k NN)搜索的有效算法.但是,随着数据规模的日趋庞大,传统的集中式LSH算法结构已经不能够满足大数据时代的需求.本文分析传统LSH方案的不足之处,拓展AND-OR结构,提出通过索引而不比较原始... 局部敏感哈希(LSH)及其变体是解决高维数据k近邻(k NN)搜索的有效算法.但是,随着数据规模的日趋庞大,传统的集中式LSH算法结构已经不能够满足大数据时代的需求.本文分析传统LSH方案的不足之处,拓展AND-OR结构,提出通过索引而不比较原始数据直接实现高维大数据k近邻搜索算法C2SLSH.理论分析和实验证明,C2SLSH在分布式平台下具有稳定的可扩展性,在保证同等精确率的情况下,处理速度大约是现有方法的3倍. 展开更多
关键词 高维数据k近邻 局部敏感哈希 MAPREDUCE 冲突计数排序
在线阅读 下载PDF
M2LSH:基于LSH的高维数据近似最近邻查找算法 被引量:5
12
作者 李灿 钱江波 +1 位作者 董一鸿 陈华辉 《电子学报》 EI CAS CSCD 北大核心 2017年第6期1431-1442,共12页
在许多应用中,LSH(Locality Sensitive Hashing)以及各种变体,是解决近似最近邻问题的有效算法之一.虽然这些算法能够很好地处理分布比较均匀的高维数据,但从设计方案来看,都没有针对数据分布不均匀的情况做相应的优化.针对这一问题,本... 在许多应用中,LSH(Locality Sensitive Hashing)以及各种变体,是解决近似最近邻问题的有效算法之一.虽然这些算法能够很好地处理分布比较均匀的高维数据,但从设计方案来看,都没有针对数据分布不均匀的情况做相应的优化.针对这一问题,本文提出了一种新的基于LSH的解决方案(M2LSH,2 Layers Merging LSH),对于数据分布不均匀的情况依然能得到一个比较好的查询效果.首先,将数据存放到具有计数功能的组合哈希向量表示的哈希桶中,然后通过二次哈希将这些桶号投影到一维空间,在此空间根据各个桶中存放的数据个数合并相邻哈希桶,使得新哈希桶中的数据量能够大致均衡.查询时仅访问有限个哈希桶,就能找到较优结果.本文给出了详细的理论分析,并通过实验验证了M2LSH的性能,不仅能减少访问时间,也可提高结果的正确率. 展开更多
关键词 近似最近邻 KNN查询 局部敏感哈希 高维数据
在线阅读 下载PDF
基于LSH的隐私保护POI推荐算法 被引量:4
13
作者 沈鑫娣 翟东君 +1 位作者 张得天 刘安 《计算机工程》 CAS CSCD 北大核心 2019年第1期96-102,共7页
基于位置的社交网络利用用户的签到数据进行兴趣点(POI)推荐,但是出于对数据隐私的考虑,各种社交平台之间不愿意直接共享数据。为综合各个社交平台的数据从而提供更好的POI推荐服务,提出一种基于局部敏感哈希(LSH)的隐私保护POI推荐算... 基于位置的社交网络利用用户的签到数据进行兴趣点(POI)推荐,但是出于对数据隐私的考虑,各种社交平台之间不愿意直接共享数据。为综合各个社交平台的数据从而提供更好的POI推荐服务,提出一种基于局部敏感哈希(LSH)的隐私保护POI推荐算法。通过LSH选取相似用户集合,极大地减少计算量,满足用户的快速响应需求。利用LSH和Paillier同态加密技术,在计算过程中保护数据隐私不被泄露。真实数据集上的实验结果表明,在响应时间和预测准确度上,该算法优于传统基于用户的协同过滤推荐算法。 展开更多
关键词 局部敏感哈希 隐私保护 推荐算法 兴趣点 同态加密
在线阅读 下载PDF
基于LSH的shapelets转换方法 被引量:1
14
作者 丁智慧 乔钢柱 +1 位作者 程谭 宿荣 《计算机工程与应用》 CSCD 北大核心 2021年第3期112-119,共8页
针对基于shapelets转换的时间序列分类算法因shapelets候选集中存在大量相似序列而造成耗时过长的问题,提出了一种基于LSH的shapelets转换方法(Locality Sensitive Hashing Shapelets Transform,LSHST),提出一种局部敏感哈希函数(LSH)... 针对基于shapelets转换的时间序列分类算法因shapelets候选集中存在大量相似序列而造成耗时过长的问题,提出了一种基于LSH的shapelets转换方法(Locality Sensitive Hashing Shapelets Transform,LSHST),提出一种局部敏感哈希函数(LSH)的改进算法,对原始子序列候选集进行逐级过滤筛选,快速挑选出形态上具有代表性的shapelets集合,计算集合中shapelets的质量,采用覆盖的方法确定将要进行转换的shapelets,进一步减小shapelets的数量,进行shapelets转换。实验表明,与Shapelet Transform(ST)、ClusterShapelets(CST)和Fast Shapelet Selection(FSS)算法相比,LSHST在分类精度上最高提升了20.05、19.9和16.52个百分点,在时间节省程度上最高达8000倍、16000倍和8.5倍。 展开更多
关键词 时间序列分类 shapelets转换 局部敏感哈希
在线阅读 下载PDF
基于改进PRM算法的翼盒装配机器人路径规划研究
15
作者 游勇 李红卫 +2 位作者 黎应学 姜杰凤 毕运波 《航空制造技术》 北大核心 2025年第21期155-164,185,共11页
针对飞机翼盒装配机器人在使用传统概率路线图(PRM)算法时存在的各种问题(如采样点分布不均、冗余采样点、路径图构建复杂及路径折点过多等),提出了一种基于改进PRM算法的路径规划方法。首先,采用Halton序列优化采样策略,确保采样点在... 针对飞机翼盒装配机器人在使用传统概率路线图(PRM)算法时存在的各种问题(如采样点分布不均、冗余采样点、路径图构建复杂及路径折点过多等),提出了一种基于改进PRM算法的路径规划方法。首先,采用Halton序列优化采样策略,确保采样点在构型空间中的均匀分布,从而提高采样质量;其次,设计了基于控制点的椭圆区域冗余点优化策略,并引入局部敏感哈希(LSH)函数,以减少构型空间内的冗余采样点,优化概率路线图的构建和搜索效率;最后,采用B样条曲线对规划路径进行平滑处理,以满足翼盒装配机器人的实际运动约束。二维和三维空间的仿真试验结果表明,相比传统PRM算法,在二维空间中,改进PRM算法的规划时间平均减少了41.1%;在机械臂高维构型空间中,改进PRM算法的规划时间平均减少了68.43%,生成的路径更加优化,显著提升了翼盒装配机器人的工作效率。 展开更多
关键词 路径规划 Halton序列 冗余点优化策略 局部敏感哈希(lsh)函数 B样条曲线
在线阅读 下载PDF
Truster:面向高效查询的自动驾驶轨迹数据聚类存储方案
16
作者 王征权 彭智勇 《计算机科学》 北大核心 2025年第11期62-70,共9页
自动驾驶轨迹数据具有重要的研究与应用价值,其存储与查询技术得到了广泛的研究与关注。然而,现有轨迹数据管理方案主要针对一般轨迹数据设计,无法支持高频采样的自动驾驶轨迹数据的高效写入,且动态环境下高昂的索引维护开销使其难以满... 自动驾驶轨迹数据具有重要的研究与应用价值,其存储与查询技术得到了广泛的研究与关注。然而,现有轨迹数据管理方案主要针对一般轨迹数据设计,无法支持高频采样的自动驾驶轨迹数据的高效写入,且动态环境下高昂的索引维护开销使其难以满足动态更新与实时查询的需求。针对自动驾驶场景下高采样频率、高实时性的轨迹数据如何实现高频写入、动态更新、实时查询的问题,提出一种面向高效查询的自动驾驶轨迹数据聚类存储方案Truster。该方法设计了编码器和嵌入器,为原始轨迹生成空间感知键并提取特征向量;设计了基于日志结构合并树的存储结构CLSM树,以实现相似轨迹的集中存储;设计了LCC合并策略,在有序字符串表进行合并的同时,利用基于局部敏感哈希的分桶方法进行快速聚类;设计了轨迹查询算法,利用多粒度缓存和分桶映射快速筛选搜索空间。Truster不仅支持高频写入,还能适应动态工作负载的索引维护,且查询效率更高。在真实自动驾驶轨迹数据集Argoverse上进行的对比实验表明,与现有方法相比,Truster在写入操作上取得了20%~200%的加速,在查询操作上取得了20%~100%的加速。 展开更多
关键词 轨迹数据 轨迹存储 轨迹查询 日志结构合并树 局部敏感哈希
在线阅读 下载PDF
一种基于多核机群架构的混合索引结构 被引量:3
17
作者 龙柏 孙广中 +1 位作者 熊焰 陈国良 《电子学报》 EI CAS CSCD 北大核心 2011年第2期275-279,共5页
本文提出了一种HKD-tree(Hybrid K-Dimensional tree)混合索引结构.该结构将KD-tree(K-Dimensional tree)和LSH(Locality Sensitive Hashing)两种索引结构进行组合,利用KD-tree作为上层结构的主干而LSH充当叶子节点,从而可以利用多核机... 本文提出了一种HKD-tree(Hybrid K-Dimensional tree)混合索引结构.该结构将KD-tree(K-Dimensional tree)和LSH(Locality Sensitive Hashing)两种索引结构进行组合,利用KD-tree作为上层结构的主干而LSH充当叶子节点,从而可以利用多核机群系统的层次并行结构特性.与传统的索引结构相比,该混合索引结构具有高效并行处理、可扩展性好等特点,适于多核机群系统平台及高维数据索引.实验结果表明,该混合索引结构在多核机群系统上的性能优于传统的索引结构. 展开更多
关键词 索引 HKD-tree 高维数据 多核机群 lsh
在线阅读 下载PDF
一种基于内容相似性的重复视频片段检测方法 被引量:3
18
作者 刘守群 朱明 郑烇 《中国科学技术大学学报》 CAS CSCD 北大核心 2010年第11期1130-1135,共6页
针对互联网视频内容的复杂性,选择能够表征视频内容的特征,首先通过LSH哈希算法对特征进行索引,并由此确定视频之间的帧匹配序列,然后对于计算出的帧匹配序列,采用随机抽样一致性算法进行拟合,从而得到有效的帧匹配序列.视频之间的相似... 针对互联网视频内容的复杂性,选择能够表征视频内容的特征,首先通过LSH哈希算法对特征进行索引,并由此确定视频之间的帧匹配序列,然后对于计算出的帧匹配序列,采用随机抽样一致性算法进行拟合,从而得到有效的帧匹配序列.视频之间的相似度依据有效帧匹配序列的相似度计算,由相似度进行互联网视频片段的消重.实验表明,对于大量内容相似的互联网视频片段,该方法能较好地描述相似性,并能有效提高检测准确率. 展开更多
关键词 视频片段 消重 哈希算法 lsh SIFT RANSAC
在线阅读 下载PDF
改进的二进制特征图像检索算法 被引量:4
19
作者 黄超 刘利强 周卫东 《计算机工程与应用》 CSCD 北大核心 2015年第14期23-27,共5页
提出一种针对嵌入式系统的图像检索算法,通过提取目标局部特征来进行图像检索。为了提高检索的实时性并兼顾正确率,选用经典SIFT特征为基础进行改进。在关键点检测阶段使用均值滤波代替高斯滤波大大提高特征提取速度。在描述符生成阶段... 提出一种针对嵌入式系统的图像检索算法,通过提取目标局部特征来进行图像检索。为了提高检索的实时性并兼顾正确率,选用经典SIFT特征为基础进行改进。在关键点检测阶段使用均值滤波代替高斯滤波大大提高特征提取速度。在描述符生成阶段通过稀疏矩阵将SIFT特征映射为二进制描述符。引入基于K-means的Multi-probe LSH方法对二进制描述符进行快速检索和匹配。通过一系列的图像缩放、旋转、模糊和光照变化对比实验,可以看出该算法与现有的经典算法相比在检索正确率及实时性方面均有很好的表现。 展开更多
关键词 局部特征 二进制描述符 尺度不变特征转换(SIFT) 局部敏感哈希(lsh)
在线阅读 下载PDF
基于局部敏感Hash的半监督直推SVM增量学习算法 被引量:4
20
作者 姚明海 林宣民 王宪保 《浙江工业大学学报》 CAS 北大核心 2018年第2期127-131,共5页
为了提高机器学习在大数据集中的学习性能,提出了一种基于局部敏感Hash的半监督支持向量机增量学习算法.首先利用局部敏感Hash能快速查找相似数据特性的能力,筛选出第一次增量中与有标签样本相似的样本,通过TSVM(Transductive support v... 为了提高机器学习在大数据集中的学习性能,提出了一种基于局部敏感Hash的半监督支持向量机增量学习算法.首先利用局部敏感Hash能快速查找相似数据特性的能力,筛选出第一次增量中与有标签样本相似的样本,通过TSVM(Transductive support vector machine)得到支持向量并筛选出再次增量中有可能成为支持向量的无标记样本,然后与已有支持向量和有标签样本一起作为后续训练的基础,最后使用多个数据集对算法进行验证.实验表明:提出的半监督TSVM增量学习算法能有效地提高训练学习的速度和分类准确率. 展开更多
关键词 lsh TSVM 增量学习 半监督
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部