期刊文献+
共找到14篇文章
< 1 >
每页显示 20 50 100
利用位置信息熵改进VLAD的图像检索方法 被引量:4
1
作者 赵宏伟 王也然 +1 位作者 刘萍萍 苗壮 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2018年第8期1376-1381,共6页
针对局部聚合描述子向量(vector of locally aggregate descriptor,VLAD)的图像检索能力还有待提高的问题,提出利用尺度不变特征变换描述子(scale invariant feature transform,SIFT)描述子的位置信息对VLAD描述子进行补充的图像检索算... 针对局部聚合描述子向量(vector of locally aggregate descriptor,VLAD)的图像检索能力还有待提高的问题,提出利用尺度不变特征变换描述子(scale invariant feature transform,SIFT)描述子的位置信息对VLAD描述子进行补充的图像检索算法。本文提出位置信息熵,用以对SIFT描述子的位置信息进行描述,并将位置信息熵添加到VLAD中,并在多个公开数据集上进行实验。码本大小为256时,在Holidays数据上该方法能有效地将VLAD的m AP值由0.510提升至0.733,在Oxford5k数据上该方法能有效地将归一化VLAD的m AP值由0.287提升至0.559。实验结果表明,利用位置信息熵能有效提升VLAD的图像检索能力。 展开更多
关键词 图像处理 图像检索 图像特征 vlad SIFT 归一化 位置信息
在线阅读 下载PDF
结合VLAD特征和稀疏表示的图像检索 被引量:7
2
作者 颜文 金炜 符冉迪 《电信科学》 北大核心 2016年第12期80-85,共6页
为了实现快速准确的图像检索目标,提出一种结合VLAD(局部聚合描述符)特征和稀疏表示的图像检索方法。首先,根据图像具有结构细节丰富、局部视觉特征差异明显的特点,提取图像的局部旋转不变SURF特征,并采用局部聚合描述符方法,构造具有... 为了实现快速准确的图像检索目标,提出一种结合VLAD(局部聚合描述符)特征和稀疏表示的图像检索方法。首先,根据图像具有结构细节丰富、局部视觉特征差异明显的特点,提取图像的局部旋转不变SURF特征,并采用局部聚合描述符方法,构造具有旋转不变性的图像VLAD特征,然后将VLAD特征与稀疏表示相结合,设计基于稀疏表示的相似性检索度量准则,实现图像的查询检索。实验结果表明,提出方法在查准率(precision)及平均归一化修正检索排序等指标上,均优于其他几种典型方法 ,并具有较高的计算效率。 展开更多
关键词 图像检索 稀疏表示 局部聚合描述符
在线阅读 下载PDF
利用空间分布熵的改进VLAD图像检索 被引量:2
3
作者 孙明思 赵宏伟 +1 位作者 赵浩宇 王也然 《光学精密工程》 EI CAS CSCD 北大核心 2021年第1期152-159,共8页
对图像特征中的局部聚集描述子向量(Vector of Aggragate Locally Descriptor,VLAD)特征进行研究后发现,该特征缺乏尺度不变特征变换(Scale Invariant Feature Transform,SIFT)描述子的空间分布信息,为了提高图像检索的准确率,提出利用... 对图像特征中的局部聚集描述子向量(Vector of Aggragate Locally Descriptor,VLAD)特征进行研究后发现,该特征缺乏尺度不变特征变换(Scale Invariant Feature Transform,SIFT)描述子的空间分布信息,为了提高图像检索的准确率,提出利用空间分布熵改进VLAD的方法。首先,求取图像中的VLAD特征。其次,将SIFT描述子的空间分布信息根据描述子与聚类的对应情况,分为若干个集合。再次,在每一个集合中生成空间分布熵,将所有集合的熵值表示为空间分布熵向量。最后,利用该向量表示描述子的空间分布混乱程度,并将该向量与VLAD结合使用。实验结果表明,在码本大小为64时,在Holidays数据集上可以将平均准确率由0.519提升至0.601,在Oxford5k数据集上可以从0.395提升至0.408。该方法利用VLAD特征大幅度提高图像检索的平均准确率。 展开更多
关键词 图像处理 图像检索 局部聚集描述子向量 尺度不变特征变换
在线阅读 下载PDF
基于改进NeXtVLAD的视频分类 被引量:1
4
作者 陈意 黄山 《计算机工程与设计》 北大核心 2021年第3期749-754,共6页
为提高长视频分类精度并减少训练时占用显存,提出基于NeXtVLAD改进的长视频分类模型。将人脸识别领域的ghost聚类中心思想迁移到视频分类,通过加入ghost聚类中心降低无关采样帧的干扰,提高模型识别准确率,针对长视频分类提出多尺度的视... 为提高长视频分类精度并减少训练时占用显存,提出基于NeXtVLAD改进的长视频分类模型。将人脸识别领域的ghost聚类中心思想迁移到视频分类,通过加入ghost聚类中心降低无关采样帧的干扰,提高模型识别准确率,针对长视频分类提出多尺度的视频帧采样方法。采用预训练模型ResNet50提取采样帧的深度特征,在训练时冻结特征提取网络参数,减少训练时的计算量。在VideoNet数据集的前100个类别上进行实验,实验结果表明,该模型与现有相关模型相比取得了更好的分类效果。 展开更多
关键词 深度学习 视频分类 局部聚合描述子向量 特征融合 卷积神经网络
在线阅读 下载PDF
基于CNN和VLAD的指静脉描述子提取方法
5
作者 文东霞 胡永健 +2 位作者 王宇飞 刘琲贝 陈光 《信号处理》 CSCD 北大核心 2020年第9期1489-1496,共8页
为了提高指静脉描述子的鲁棒性同时降低网络参数量,通过修改VGGFace-Net并引入局部聚合描述子向量(Vector of Locally Aggregated Descriptors,VLAD)得到参数量仅0.3M的指静脉图像描述子提取网络,VLAD编码过程实现了局部描述子的聚类和... 为了提高指静脉描述子的鲁棒性同时降低网络参数量,通过修改VGGFace-Net并引入局部聚合描述子向量(Vector of Locally Aggregated Descriptors,VLAD)得到参数量仅0.3M的指静脉图像描述子提取网络,VLAD编码过程实现了局部描述子的聚类和重组,使描述子对手指姿势变化更加鲁棒;由于公开的指静脉训练数据库规模通常不够大,提出基于三元组和难分负样本挖掘策略进行网络的训练,并针对三元组损失没有约束样本对距离的类内方差的问题,提出一种样本对中心约束损失函数,通过将正负样本对视为两个类别,进一步促使其靠近各自的类中心,从而增大类内紧凑程度。在三个公开数据库FV-USM,SDUMLA,MMCBNU上的指静脉验证结果表明,所提取的描述子在基于欧氏距离进行匹配的情况下,指静脉验证的结果均优于现有方法,且在图像发生随机平移时具有更好的鲁棒性。 展开更多
关键词 指静脉识别 卷积神经网络 局部聚合描述子向量 三元组损失
在线阅读 下载PDF
采用音质特征和VLAD编码的新冠肺炎检测算法
6
作者 张昊然 韩易辰 +1 位作者 谭咏梅 李雅 《信号处理》 CSCD 北大核心 2021年第10期1843-1851,共9页
2020年,世界卫生组织宣布COVID-19疫情为大流行病。为了实现COVID-19快速地、可靠地检测,本研究通过语音信号分析技术来寻找感染COVID-19的语音信号特征,利用咳嗽声片段和语音片段对是否感染COVID-19做出自动判断。在INTERSPEECH 2021 C... 2020年,世界卫生组织宣布COVID-19疫情为大流行病。为了实现COVID-19快速地、可靠地检测,本研究通过语音信号分析技术来寻找感染COVID-19的语音信号特征,利用咳嗽声片段和语音片段对是否感染COVID-19做出自动判断。在INTERSPEECH 2021 ComParE竞赛提供的相关数据集和baseline的基础上,本文首先利用语音端点检测技术对数据集进行增广,其次在特征集中加入语音质量特征,使相关baseline结果得到了提升,证明了语音质量特征在对COVID-19自动语音检测任务上的有效性。同时,引入局部聚合描述子向量对低级别特征进行编码,当字典大小较小时,有效地提升了系统的分类性能。最后,对多种算法得到的分类结果进行融合,进一步提升分类效果,最终在两个子任务中的验证集上UAR分别取得了73.9%和77.2%。 展开更多
关键词 COVID-19自动检测 语音切分 语音质量特征 局部聚合描述子向量 情感识别
在线阅读 下载PDF
基于多特征组合的细粒度图像分类方法 被引量:6
7
作者 邹承明 罗莹 徐晓龙 《计算机应用》 CSCD 北大核心 2018年第7期1853-1856,1861,共5页
针对单一特征表示的局限性会导致细粒度图像分类准确度不高的问题,提出了一种基于卷积神经网络(CNN)和尺度不变特征转换(SIFT)的多特征组合表示方法,综合考虑对目标整体、关键部位和关键点的特征提取。首先,分别以细粒度图像库中的目标... 针对单一特征表示的局限性会导致细粒度图像分类准确度不高的问题,提出了一种基于卷积神经网络(CNN)和尺度不变特征转换(SIFT)的多特征组合表示方法,综合考虑对目标整体、关键部位和关键点的特征提取。首先,分别以细粒度图像库中的目标整体和头部区域训练CNN得到两个网络模型,用来提取目标的整体和头部CNN特征;然后,对图像库中所有目标区域提取SIFT关键点并通过K均值(K-means)聚类生成码本,再将每个目标区域的SIFT描述子通过局部特征聚合描述符(VLAD)参照码本编码为特征向量;最后,组合多种特征作为最终的特征表示,采用支持向量机(SVM)对细粒度图像进行分类。使用该方法在CUB-200-2011数据库上进行实验,并与单一的特征表示方法进行了比较。实验结果表明,该方法与基于单一CNN特征的细粒度图像分类相比提升了13.31%的准确度,证明了多特征组合对细粒度图像分类的积极作用。 展开更多
关键词 卷积神经网络 尺度不变特征转换 K均值聚类 局部特征聚合描述符 细粒度图像分类
在线阅读 下载PDF
融合局部聚合描述符和全局特征的现勘图像分类算法 被引量:5
8
作者 刘颖 倪天宇 +2 位作者 王富平 刘卫华 艾达 《科学技术与工程》 北大核心 2020年第3期1118-1124,共7页
针对低层特征对图像内容描述不够精确而导致现勘图像分类准确率不高的不足,提出一种融合局部聚合描述符(vector of locally aggregated descriptors,VLAD)和全局特征的现勘图像分类算法。首先,分别提取HSV颜色直方图和局部二值模式(loca... 针对低层特征对图像内容描述不够精确而导致现勘图像分类准确率不高的不足,提出一种融合局部聚合描述符(vector of locally aggregated descriptors,VLAD)和全局特征的现勘图像分类算法。首先,分别提取HSV颜色直方图和局部二值模式(local binary pattern,LBP)特征作为图像全局特征;然后,对现勘图像进行密集采样,提取每个子区域的尺度不变特征变换(scale-invariant feature transform,SIFT)特征,利用VLAD方法对提取的密集SIFT特征进行编码;最后,将全局特征和VLAD特征融合,并采用直方图相交核函数的支持向量机(support vector machine,SVM)进行分类。针对现勘5K、轮胎5K和Corel-1K数据集,比较提出算法与基于低层特征、基于词袋模型、基于空间金字塔模型特征分类方法的性能。结果表明:提出的算法分类精度优于对比算法。 展开更多
关键词 图像全局特征 尺度不变特征变换特征 局部聚合描述符 支持向量机 现勘图像分类
在线阅读 下载PDF
基于最近邻量化距离聚类的残差中心聚合图像表示 被引量:2
9
作者 张琳娜 梁列全 +2 位作者 郑心炜 阚世超 岑翼刚 《数据采集与处理》 CSCD 北大核心 2020年第1期79-88,共10页
通过累积残差和进行图像表示的局部聚合描述子向量(Vector of locally aggregated descriptors,VLAD)方法中,由于每个描述子与对应的最近邻码字得到的残差值大小不一,且每个码字对应的描述子数量不确定,会存在过累积和欠累积问题。针对... 通过累积残差和进行图像表示的局部聚合描述子向量(Vector of locally aggregated descriptors,VLAD)方法中,由于每个描述子与对应的最近邻码字得到的残差值大小不一,且每个码字对应的描述子数量不确定,会存在过累积和欠累积问题。针对此问题,提出一种通过距离聚类的残差中心聚合进行图像表示的新方法。首先,提取数据库图像的局部描述子,通过聚类得到码本;然后,将局部描述子通过最近邻方法量化到码本上,并求出局部描述子与最近邻码字之间的欧式距离;再次,聚类所有距离,得到中心集合,求出每个局部描述子与最近邻码字之间的欧式距离在中心集合上的最近邻,进而求得中心集合中每个中心对应的描述子与最近邻码字之间残差的中心,并将每个码字上所有的残差中心累积求和;最后,将所有码字对应的累积向量按顺序级联后得到最后的图像表示。在Holidays和UKB数据集上的图像检索实验结果表明,提出的图像表示方法比通过直接累积残差和进行图像表示的VLAD方法效果更好。 展开更多
关键词 图像表示 聚合局部描述子向量 聚类 残差中心聚合 图像检索
在线阅读 下载PDF
基于多层次特征表示的图像场景分类算法 被引量:2
10
作者 顾广华 秦芳 《高技术通讯》 EI CAS 北大核心 2019年第3期213-221,共9页
传统场景分类采用底层尺度不变特征变换(SIFT)特征,运用词袋(BoW)模型以及空间金字塔(SPM)模型进行分类判别。然而,单一的低层描述的识别精度有限,无法有效表征内容多变的场景图像。本文提出基于多层次特征表示的图像场景分类算法,利用... 传统场景分类采用底层尺度不变特征变换(SIFT)特征,运用词袋(BoW)模型以及空间金字塔(SPM)模型进行分类判别。然而,单一的低层描述的识别精度有限,无法有效表征内容多变的场景图像。本文提出基于多层次特征表示的图像场景分类算法,利用滑动窗均匀采样图像块,分别提取图像块的密集SIFT特征和卷积层卷积神经网络(CNN)特征,使用聚集局部描述符编码(VLAD)方法分别编码图像块的局部特征,将一幅图像的多个图像块特征顺序级联形成该幅图像的描述,由此构建包含局部语义信息的低层图像描述和中层图像描述。与此同时,将图像的低层描述与中层描述融合到图像的全连接层的高层语义中,从而获得整合了局部空间信息和全局语义信息的精确图像表示。本文在两个常用的场景数据集上进行了分类实验,结果表明,融合多层次特征描述的图像表示能够取得更好的分类结果。 展开更多
关键词 低层描述 中层描述 高层语义 聚集局部描述符编码(vlad)编码 场景分类
在线阅读 下载PDF
多层次特征和粒子群优化的场景分类 被引量:1
11
作者 张立亭 喻欣 +1 位作者 罗亦泳 杨静雯 《计算机工程与设计》 北大核心 2023年第9期2747-2753,共7页
针对遥感图像的场景分类精度问题,提出多层次特征和粒子群算法优化分类器的场景分类算法。利用聚集局部描述符编码算法对尺度不变特征变换算法提取的局部特征编码,获得中层特征,通过卷积神经网络提取高层特征,将提取的特征作为支持向量... 针对遥感图像的场景分类精度问题,提出多层次特征和粒子群算法优化分类器的场景分类算法。利用聚集局部描述符编码算法对尺度不变特征变换算法提取的局部特征编码,获得中层特征,通过卷积神经网络提取高层特征,将提取的特征作为支持向量机的输入数据,引入粒子群算法优化该分类器的参数,进行场景分类。在RSC11和WHU-RS19两个公开的遥感图像数据集上进行实验,分类精度分别达到95.28和97.20。将WHU-RS19数据集的结果与其它方法比较,精度有明显提高。实验结果表明,在分类时对分类器参数进行优化,分类效果更佳。 展开更多
关键词 遥感图像 场景分类 尺度不变特征变换 聚集局部描述符编码算法 卷积神经网络 支持向量机 粒子群算法
在线阅读 下载PDF
有效视频帧时间序池化的人体行为识别算法 被引量:4
12
作者 鹿天然 于凤芹 陈莹 《计算机工程》 CAS CSCD 北大核心 2018年第12期271-275,287,共6页
为利用人体行为的时域信息并减少帧间冗余及特征维数,提出一种提取有效视频帧并对其时间序池化的人体行为识别算法。通过对视频帧的稠密轨迹特征进行局部累计描述向量编码,获取视频帧特征表示,对每帧的特征编码进行余弦相似度分析,剔除... 为利用人体行为的时域信息并减少帧间冗余及特征维数,提出一种提取有效视频帧并对其时间序池化的人体行为识别算法。通过对视频帧的稠密轨迹特征进行局部累计描述向量编码,获取视频帧特征表示,对每帧的特征编码进行余弦相似度分析,剔除冗余特征帧得到有效视频帧特征序列。采用时间序池化对有效视频帧特征序列进行排序,得到可表示视频时序动态变化的特征向量,然后训练支持向量机实现人体行为识别。在HMDB51和UCF101数据集上的实验结果表明,与稠密轨迹行为识别算法相比,该算法可有效提高识别准确率。 展开更多
关键词 行为识别 稠密轨迹 局部累计描述向量 余弦相似度分析 时间序池化
在线阅读 下载PDF
深度优先局部聚合哈希 被引量:2
13
作者 龙显忠 程成 李云 《湖南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2021年第6期58-66,共9页
已有的深度监督哈希方法不能有效地利用提取到的卷积特征,同时,也忽视了数据对之间相似性信息分布对于哈希网络的作用,最终导致学到的哈希编码之间的区分性不足.为了解决该问题,提出了一种新颖的深度监督哈希方法,称之为深度优先局部聚... 已有的深度监督哈希方法不能有效地利用提取到的卷积特征,同时,也忽视了数据对之间相似性信息分布对于哈希网络的作用,最终导致学到的哈希编码之间的区分性不足.为了解决该问题,提出了一种新颖的深度监督哈希方法,称之为深度优先局部聚合哈希(Deep Priority Local Aggregated Hashing,DPLAH).DPLAH将局部聚合描述子向量嵌入到哈希网络中,提高网络对同类数据的表达能力,并且通过在数据对之间施加不同权重,从而减少相似性信息分布倾斜对哈希网络的影响.利用Pytorch深度框架进行DPLAH实验,使用NetVLAD层对Resnet18网络模型输出的卷积特征进行聚合,将聚合得到的特征进行哈希编码学习.在CIFAR-10和NUS-WIDE数据集上的图像检索实验表明,与使用手工特征和卷积神经网络特征的非深度哈希学习算法的最好结果相比,DPLAH的平均准确率均值要高出11%,同时,DPLAH的平均准确率均值比非对称深度监督哈希方法高出2%. 展开更多
关键词 深度哈希学习 卷积神经网络 图像检索 局部聚合描述子向量
在线阅读 下载PDF
基于局部聚合描述符的视点不变视觉位置识别 被引量:2
14
作者 刘靖 《计算机工程与设计》 北大核心 2020年第11期3181-3187,共7页
针对目前视觉位置识别系统无法同时拥有视点不变、条件不变和高效率的性能,提出一种基于视点不变的位置识别系统,采用局部聚合描述符(VLAD)。采用高稳健性的加速稳健特征(SURF)算子进行特征检测,利用梯度直方图描述特征;利用VLAD将每个... 针对目前视觉位置识别系统无法同时拥有视点不变、条件不变和高效率的性能,提出一种基于视点不变的位置识别系统,采用局部聚合描述符(VLAD)。采用高稳健性的加速稳健特征(SURF)算子进行特征检测,利用梯度直方图描述特征;利用VLAD将每个特征划分到特定的聚类中,使用局部敏感散列(LSH)进行数据降维,将特征随机投影到低维的二进制签名中,计算二进制签名;通过计算二进制图像签名上的汉明距离实现图像比较,识别视觉位置。实验结果表明,所提系统只需要占用很小的内存,就能够稳健适应变化的环境。 展开更多
关键词 视觉位置识别系统 局部聚合描述符 局部敏感散列 二进制图像 汉明距离
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部