期刊文献+
共找到1,835篇文章
< 1 2 92 >
每页显示 20 50 100
Indexing of Content-Based Image Retrieval System with Image Understanding Approach
1
作者 李学龙 刘政凯 俞能海 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2003年第2期63-68,共6页
This paper presents a novel efficient semantic image classification algorithm for high-level feature indexing of high-dimension image database. Experiments show that the algorithm performs well. The size of the train ... This paper presents a novel efficient semantic image classification algorithm for high-level feature indexing of high-dimension image database. Experiments show that the algorithm performs well. The size of the train set and the test set is 7 537 and 5 000 respectively. Based on this theory, another ground is built with 12,000 images, which are divided into three classes: city, landscape and person, the total result of the classifications is 88.92%, meanwhile, some preliminary results are presented for image understanding based on semantic image classification and low level features. The groundtruth for the experiments is built with the images from Corel database, photos and some famous face databases. 展开更多
关键词 content-based image retrieval image classification image indexing.
在线阅读 下载PDF
Content-Based Image Retrieval:Near Tolerance Rough Set Approach
2
作者 RAMANNA Sheela PETERS James F WU Wei-zhi 《浙江海洋学院学报(自然科学版)》 CAS 2010年第5期462-471,共10页
The problem considered in this paper is how to detect the degree of similarity in the content of digital images useful in image retrieval,i.e.,to what extent is the content of a query image similar to content of other... The problem considered in this paper is how to detect the degree of similarity in the content of digital images useful in image retrieval,i.e.,to what extent is the content of a query image similar to content of other images.The solution to this problem results from the detection of subsets that are rough sets contained in covers of digital images determined by perceptual tolerance relations(PTRs).Such relations are defined within the context of perceptual representative spaces that hearken back to work by J.H.Poincare on representative spaces as models of physical continua.Classes determined by a PTR provide content useful in content-based image retrieval(CBIR).In addition,tolerance classes provide a means of determining when subsets of image covers are tolerance rough sets(TRSs).It is the nearness of TRSs present in image tolerance spaces that provide a promising approach to CBIR,especially in cases such as satellite images or aircraft identification where there are subtle differences between pairs of digital images,making it difficult to quantify the similarities between such images.The contribution of this article is the introduction of the nearness of tolerance rough sets as an effective means of measuring digital image similarities and,as a significant consequence,successfully carrying out CBIR. 展开更多
关键词 content-based image retrieval Near sets PERCEPTION Rough sets Tolerance space
在线阅读 下载PDF
Image retrieval based on color features integrated with anisotropic directionality 被引量:1
3
作者 Jing Bai Xiaohua Wang Licheng Jiao 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2010年第1期127-133,共7页
A novel image retrieval approach based on color features and anisotropic directional information is proposed for content based image retrieval systems (CBIR). The color feature is described by the color histogram ... A novel image retrieval approach based on color features and anisotropic directional information is proposed for content based image retrieval systems (CBIR). The color feature is described by the color histogram (CH), which is translation and rotation invariant. However, the CH does not contain spatial information which is very important for the image retrieval. To overcome this shortcoming, the subband energy of the lifting directionlet transform (L-DT) is proposed to describe the directional information, in which L-DT is characterized by multi-direction and anisotropic basis functions compared with the wavelet transform. A global similarity measure is designed to implement the fusion of both color feature and anisotropic directionality for the retrieval process. The retrieval experiments using a set of COREL images demonstrate that the higher query precision and better visual effect can be achieved. 展开更多
关键词 image retrieval color histogram directionlet transform ANISOTROPIC similarity.
在线阅读 下载PDF
Exploiting global and local features for image retrieval 被引量:3
4
作者 LI Li FENG Lin +2 位作者 WU Jun SUN Mu-xin LIU Sheng-lan 《Journal of Central South University》 SCIE EI CAS CSCD 2018年第2期259-276,共18页
Two lines of image representation based on multiple features fusion demonstrate excellent performance in image retrieval.However,there are some problems in both of them:1)the methods defining directly texture in color... Two lines of image representation based on multiple features fusion demonstrate excellent performance in image retrieval.However,there are some problems in both of them:1)the methods defining directly texture in color space put more emphasis on color than texture feature;2)the methods extract several features respectively and combine them into a vector,in which bad features may lead to worse performance after combining directly good and bad features.To address the problems above,a novel hybrid framework for color image retrieval through combination of local and global features achieves higher retrieval precision.The bag-of-visual words(BoW)models and color intensity-based local difference patterns(CILDP)are exploited to capture local and global features of an image.The proposed fusion framework combines the ranking results of BoW and CILDP through graph-based density method.The performance of our proposed framework in terms of average precision on Corel-1K database is86.26%,and it improves the average precision by approximately6.68%and12.53%over CILDP and BoW,respectively.Extensive experiments on different databases demonstrate the effectiveness of the proposed framework for image retrieval. 展开更多
关键词 local binary patterns hue saturation value (HSV) color space graph fusion image retrieval
在线阅读 下载PDF
CMA:an efficient index algorithmof clustering supporting fast retrieval oflarge image databases
5
作者 谢毓湘 栾悉道 +2 位作者 吴玲达 老松杨 谢伦国 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2005年第3期709-714,共6页
To realize content-hased retrieval of large image databases, it is required to develop an efficient index and retrieval scheme. This paper proposes an index algorithm of clustering called CMA, which supports fast retr... To realize content-hased retrieval of large image databases, it is required to develop an efficient index and retrieval scheme. This paper proposes an index algorithm of clustering called CMA, which supports fast retrieval of large image databases. CMA takes advantages of k-means and self-adaptive algorithms. It is simple and works without any user interactions. There are two main stages in this algorithm. In the first stage, it classifies images in a database into several clusters, and automatically gets the necessary parameters for the next stage-k-means iteration. The CMA algorithm is tested on a large database of more than ten thousand images and compare it with k-means algorithm. Experimental results show that this algorithm is effective in both precision and retrieval time. 展开更多
关键词 large image database content-based retrieval K-means clustering self-adaptive clustering.
在线阅读 下载PDF
2D matrix based indexing with color spectralhistogram for efficient image retrieval
6
作者 maruthamuthu ramasamy john sanjeev kumar athisayam 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2016年第5期1122-1134,共13页
A novel content based image retrieval (CBIR) algorithmusing relevant feedback is presented. The proposed frameworkhas three major contributions: a novel feature descriptor calledcolor spectral histogram (CSH) to ... A novel content based image retrieval (CBIR) algorithmusing relevant feedback is presented. The proposed frameworkhas three major contributions: a novel feature descriptor calledcolor spectral histogram (CSH) to measure the similarity betweenimages; two-dimensional matrix based indexing approach proposedfor short-term learning (STL); and long-term learning (LTL).In general, image similarities are measured from feature representationwhich includes color quantization, texture, color, shapeand edges. However, CSH can describe the image feature onlywith the histogram. Typically the image retrieval process starts byfinding the similarity between the query image and the imagesin the database; the major computation involved here is that theselection of top ranking images requires a sorting algorithm to beemployed at least with the lower bound of O(n log n). A 2D matrixbased indexing of images can enormously reduce the searchtime in STL. The same structure is used for LTL with an aim toreduce the amount of log to be maintained. The performance ofthe proposed framework is analyzed and compared with the existingapproaches, the quantified results indicates that the proposedfeature descriptor is more effectual than the existing feature descriptorsthat were originally developed for CBIR. In terms of STL,the proposed 2D matrix based indexing minimizes the computationeffort for retrieving similar images and for LTL, the proposed algorithmtakes minimum log information than the existing approaches. 展开更多
关键词 content based image retrieval (CBIR) color spectralhistogram (CSH) short-term learning (STL) long-term learning(LTL) similarity measures.
在线阅读 下载PDF
ISAR imaging based on improved phase retrieval algorithm 被引量:5
7
作者 SHI Hongyin XIA Saixue TIAN Ye 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2018年第2期278-285,共8页
Traditional inverse synthetic aperture radar(ISAR)imaging methods for maneuvering targets have low resolution and poor capability of noise suppression. An ISAR imaging method of maneuvering targets based on phase retr... Traditional inverse synthetic aperture radar(ISAR)imaging methods for maneuvering targets have low resolution and poor capability of noise suppression. An ISAR imaging method of maneuvering targets based on phase retrieval is proposed,which can provide a high-resolution and focused map of the spatial distribution of scatterers on the target. According to theoretical derivation, the modulus of raw data from the maneuvering target is not affected by radial motion components for ISAR imaging system, so the phase retrieval algorithm can be used for ISAR imaging problems. However, the traditional phase retrieval algorithm will be not applicable to ISAR imaging under the condition of random noise. To solve this problem, an algorithm is put forward based on the range Doppler(RD) algorithm and oversampling smoothness(OSS) phase retrieval algorithm. The algorithm captures the target information in order to reduce the influence of the random phase on ISAR echoes, and then applies OSS for focusing imaging based on prior information of the RD algorithm. The simulated results demonstrate the validity of this algorithm, which cannot only obtain high resolution imaging for high speed maneuvering targets under the condition of random noise, but also substantially improve the success rate of the phase retrieval algorithm. 展开更多
关键词 inverse synthetic aperture radar(ISAR) maneuvering target autofocus imaging phase retrieval oversampling smoothness(OSS)
在线阅读 下载PDF
Online Learning a Binary Classifier for Improving Google Image Search Results 被引量:1
8
作者 WAN Yu-Chai LIU Xia-Bi HAN Fei-Fei TONG Kun-Qi LIU Yu 《自动化学报》 EI CSCD 北大核心 2014年第8期1699-1708,共10页
关键词 搜索结果 在线学习 二元分类 贝叶斯分类器 算法框架 训练数据 图片 支持向量机
在线阅读 下载PDF
基于多粒度声呐图像匹配的水下定位方法
9
作者 王可 王振鹤 +4 位作者 王彪 刘攀第 王华 李佳欣 徐明亮 《舰船科学技术》 北大核心 2025年第14期95-102,共8页
针对水下地形匹配定位问题,提出一种基于多粒度声呐图像匹配的定位方法。构建了U-Net架构的图像特征抽取模型,以无监督方式抽取水下声呐图像的高层特征。设计了一种具有时空约束的多粒度匹配算法,在特征空间内首先进行粗粒度匹配,并结... 针对水下地形匹配定位问题,提出一种基于多粒度声呐图像匹配的定位方法。构建了U-Net架构的图像特征抽取模型,以无监督方式抽取水下声呐图像的高层特征。设计了一种具有时空约束的多粒度匹配算法,在特征空间内首先进行粗粒度匹配,并结合时空约束约简搜索空间,然后进行细粒度精确匹配,根据匹配结果实现水下定位。通过建模水下典型地形并进行模拟声呐探测构建了数据集,包括水下地形高程数据和对应的声呐探测图像。在自构数据集上的实验结果表明,所提方法的定位精度可达0.679 m,平均单次定位时长小于0.5 s,性能优于基线算法。 展开更多
关键词 水下定位 声呐图像 特征匹配 图像检索 多粒度
在线阅读 下载PDF
基于特征分块与域间融合的跨域足迹图像检索方法
10
作者 张艳 申多 +2 位作者 李增辉 朱明 粟娇娇 《计算机辅助设计与图形学学报》 北大核心 2025年第2期303-312,共10页
为了解决现有图像检索方法难以提取跨域足迹图像的高区分性域共享特征等问题,提出了一种基于特征分块与域间融合的跨域足迹图像检索方法.首先,以ResNet50为主干网络提取足迹图像全局特征;然后通过水平分块特征提取方法获取更具鉴别性的... 为了解决现有图像检索方法难以提取跨域足迹图像的高区分性域共享特征等问题,提出了一种基于特征分块与域间融合的跨域足迹图像检索方法.首先,以ResNet50为主干网络提取足迹图像全局特征;然后通过水平分块特征提取方法获取更具鉴别性的特征;最后,采用跨域特征融合方法提取域共享信息,并设计均衡损失以优化融合特征.在自行采集的200人跨域足迹图像数据集上进行实验,在光学检索压力及压力检索光学2种模式下Rank-1分别达到91.38%和84.50%,验证了所提方法的有效性. 展开更多
关键词 图像检索 跨域足迹 特征分块 特征融合 均衡损失
在线阅读 下载PDF
虚实结合的行人重识别方法
11
作者 祁磊 任子豪 +1 位作者 刘俊汐 耿新 《计算机研究与发展》 北大核心 2025年第2期418-431,共14页
近年来,随着城市化进程的加速和社会经济的发展,公共安全问题也愈发引起人们的关注.为了保障社会稳定和公民生命财产安全,各地政府开始大力推进智能安防和智慧城市的建设.行人重识别就是构建智慧城市的核心技术之一,对安防监控和刑事调... 近年来,随着城市化进程的加速和社会经济的发展,公共安全问题也愈发引起人们的关注.为了保障社会稳定和公民生命财产安全,各地政府开始大力推进智能安防和智慧城市的建设.行人重识别就是构建智慧城市的核心技术之一,对安防监控和刑事调查申请具有重要意义.行人重识别旨在检索不同摄像头下捕捉到的特定人物.然而,由于光照、视角、遮挡和姿势等造成的类内差异,行人重识别在计算机视觉领域仍然是一项具有挑战性的任务.受限于数据和标记匮乏,已有的全监督行人重识别任务在模型层面上改进的方法效果基本达到瓶颈.引入更复杂多样且标记易获得的大型虚拟数据集来进行辅助训练,并提出了一种基于摄像头感知的非对称领域对抗学习方法,同时缓解领域间差异和多摄像头间类内差异的影响,使模型从更丰富多样的数据中学到摄像头差异无关的特征表示.此外,为了缓解虚拟数据集夹带的误导信息带来的不利影响和对抗训练中真实世界数据集的数据分布向虚拟数据集的数据分布发生偏移的问题,提出使用基于真实数据训练的辅助网络来约束主干网络的训练.实验在2个公开的数据集上进行验证,表明了所提方法的有效性. 展开更多
关键词 行人重识别 对抗学习 知识蒸馏 图像检索 计算机视觉
在线阅读 下载PDF
基于类中心优化辅助三元组损失的遥感图像检索
12
作者 郑宗生 霍志俊 +3 位作者 高萌 王政翰 周文睆 张月维 《计算机工程》 北大核心 2025年第5期305-313,共9页
遥感图像检索的关键是从海量图像中高效、准确地检索出目标样本。遥感图像类内样本分散、方差大,依靠有限样本的传统遥感图像检索不能很好地学习类内样本差异特征,现有的跨批处理内存(XBM)方法的三元组配对冗余、计算复杂。针对这些问题... 遥感图像检索的关键是从海量图像中高效、准确地检索出目标样本。遥感图像类内样本分散、方差大,依靠有限样本的传统遥感图像检索不能很好地学习类内样本差异特征,现有的跨批处理内存(XBM)方法的三元组配对冗余、计算复杂。针对这些问题,提出一种基于类中心优化辅助的三元组损失(CCO-TL)的遥感图像检索方法。CCO-TL使用类中心特征限制类内正样本之间的距离以辅助优化三元组损失,实现类间相互分离,同时类内的样本更加聚集紧凑,得到优化的样本特征;通过改进XBM模块得到批次特征队列(BFQ),用于存储先前训练批次的特征向量,通过改变三元组配对方式,充分挖掘样本信息并解决数据冗余问题,减少训练时间。同时使用BFQ模块进行类中心点特征的实时计算,用计算值取代传统方法的估计值。实验结果表明,基于真实类中心特征辅助优化的三元组损失函数训练的网络模型学习样本间的能力更强,类内更加聚集,类间区分也更明显。最后结合Recall@K等指标进行评估,在UCMD、AID、PN、OP 4个遥感数据集上进行实验,所提算法的精度分别达到93.1%、87.2%、97.1%、82.2%,优于其他研究方法。 展开更多
关键词 图像检索 深度度量学习 三元组损失 类中心 批次
在线阅读 下载PDF
基于交叉量化和样本校正的自监督遥感图像检索
13
作者 潘丽丽 瞿栋梁 +1 位作者 尹晶晶 马雪强 《郑州大学学报(工学版)》 北大核心 2025年第2期60-66,共7页
自监督遥感图像检索模型由于标签缺失导致使用错误的样本对进行学习,从而产生抽样偏差,影响图像表征的准确性,为此提出一种基于交叉量化和样本校正的自监督遥感图像检索模型(CQSC)。首先,为了降低数据存储和处理负载,将传统对比学习中... 自监督遥感图像检索模型由于标签缺失导致使用错误的样本对进行学习,从而产生抽样偏差,影响图像表征的准确性,为此提出一种基于交叉量化和样本校正的自监督遥感图像检索模型(CQSC)。首先,为了降低数据存储和处理负载,将传统对比学习中的映射层与乘积量化相结合,压缩高维图像数据,提高了检索效率;其次,使用交叉学习策略,最大化检索模型中特征映射前后的交叉相似性,增强模型的特征生成能力和检索精度;最后,针对自监督遥感图像检索中因标签缺失导致的抽样偏差,设计自适应纠错标签,标注训练样本,校正训练过程中存在的错误负样本。在UCMerced和EuroSAT数据集上进行了大量实验,结果表明:与PLSH方法相比,在UCMerced数据集上,所提方法mAP@20平均提升了2.52百分点;在EuroSAT数据集上取64 bits时,所提方法mAP@100提升了3.83百分点。 展开更多
关键词 遥感图像检索 对比学习 乘积量化 交叉学习
在线阅读 下载PDF
云辅助物联网环境下可验证的安全图像检索 被引量:1
14
作者 郭佳琦 马智 +2 位作者 王文胜 田聪 段振华 《通信学报》 北大核心 2025年第3期28-44,共17页
针对现有的云辅助物联网环境中图像检索精度和效率低、服务器潜在恶意性问题,提出一种可验证的安全图像检索方案。采用矩阵形式的索引和查询,结合基于容错学习的改进安全k近邻算法加密特征矩阵,提升索引和查询安全性。利用区块链技术,... 针对现有的云辅助物联网环境中图像检索精度和效率低、服务器潜在恶意性问题,提出一种可验证的安全图像检索方案。采用矩阵形式的索引和查询,结合基于容错学习的改进安全k近邻算法加密特征矩阵,提升索引和查询安全性。利用区块链技术,并结合四叉默克哈希树和高效短签名,实现搜索结果的可验证性。安全性和性能分析表明,所提方案在保证索引和查询安全性的同时,显著降低了索引和查询的加密计算复杂度及密钥存储开销。所提方案在提高图像检索精度和安全性的同时,优化了计算与存储资源,适用于云辅助物联网环境。 展开更多
关键词 图像安全检索 安全k近邻算法 容错学习问题 物联网
在线阅读 下载PDF
基于迁移知识的跨模态双重哈希 被引量:1
15
作者 钟建奇 林秋斌 曹文明 《电子学报》 北大核心 2025年第1期209-220,共12页
随着社交网络的普及和多媒体数据的急剧增长,有效的跨模态检索引起了人们越来越多的关注.由于哈希有效的检索效率和低存储成本,其被广泛用于跨模态检索任务中.然而,这些基于深度学习的跨模态哈希检索方法大多数是利用图像网络和文本网... 随着社交网络的普及和多媒体数据的急剧增长,有效的跨模态检索引起了人们越来越多的关注.由于哈希有效的检索效率和低存储成本,其被广泛用于跨模态检索任务中.然而,这些基于深度学习的跨模态哈希检索方法大多数是利用图像网络和文本网络各自生成对应模态的哈希码,难以获得更加有效的哈希码,无法进一步减小不同模态数据之间的模态鸿沟.为了更好地提高跨模态哈希检索的性能,本文提出了一种基于迁移知识的跨模态双重哈希(Cross-modal Dual Hashing based on Transfer Knowledge,CDHTK).CDHTK通过结合图像网络、知识迁移网络以及文本网络进行跨模态哈希检索任务.对于图像模态,CDHTK融合图像网络和知识迁移网络各自生成的哈希码,进而生成具有判别性的图像哈希码;对于文本模态,CDHTK融合文本网络和知识迁移网络各自生成的哈希码,从而生成有效的文本哈希码.CDHTK通过采用预测标签的交叉熵损失、生成哈希码的联合三元组量化损失以及迁移知识的差分损失来共同优化哈希码的生成过程,从而提高模型的检索效果,在2个常用的数据集(IAPR TC-12,MIR-Flickr 25K)上进行的实验验证了CDHTK的有效性,比当前最先进的跨模态哈希方法(Adaptive Label correlation based asymm Etric Cross-modal Hashing,ALECH)分别高出6.82%和5.13%. 展开更多
关键词 跨模态 图像-文本检索 双重哈希 迁移知识
在线阅读 下载PDF
基于MFF-SFE的遥感图文跨模态检索方法 被引量:1
16
作者 钟金彦 陈俊 +2 位作者 李宇 吴业炜 葛小青 《中国科学院大学学报(中英文)》 北大核心 2025年第2期236-247,共12页
遥感图文跨模态检索技术能够从海量的遥感数据中快速获取有价值的信息,但现有遥感图文检索方法对遥感图像中的多尺度信息利用不足、目标信息识别效果不佳,检索精度相对较低。为此,提出一种新的遥感图文跨模态检索方法。该方法主要包括... 遥感图文跨模态检索技术能够从海量的遥感数据中快速获取有价值的信息,但现有遥感图文检索方法对遥感图像中的多尺度信息利用不足、目标信息识别效果不佳,检索精度相对较低。为此,提出一种新的遥感图文跨模态检索方法。该方法主要包括一个多尺度特征融合模块和一个显著特征增强模块,分别用于融合遥感图像的多尺度信息、加强对遥感图像目标信息的表达能力,从而提高遥感图文跨模态检索精度。在2个公开的遥感图像文本数据集上进行实验验证,结果表明,在遥感图文跨模态检索任务中,该方法在大部分评价指标上都优于其他方法,具有最佳的总体检索性能。 展开更多
关键词 跨模态检索 遥感图像 深度学习 多尺度特征
在线阅读 下载PDF
面向大规模图像检索的哈希学习综述 被引量:1
17
作者 张雪凝 刘兴波 +3 位作者 宋井宽 聂秀山 王少华 尹义龙 《软件学报》 北大核心 2025年第1期79-106,共28页
随着互联网空间中图像数据的爆发式增长和图像应用领域的拓宽,大规模图像检索的需求与日俱增.哈希学习为大规模图像检索提供显著的存储与检索效率,并成为近年来一个研究热点.现有哈希学习综述存在着时效性弱与技术路线不清晰的问题,即... 随着互联网空间中图像数据的爆发式增长和图像应用领域的拓宽,大规模图像检索的需求与日俱增.哈希学习为大规模图像检索提供显著的存储与检索效率,并成为近年来一个研究热点.现有哈希学习综述存在着时效性弱与技术路线不清晰的问题,即多总结5–10年前的研究成果,且较少总结哈希学习算法各组成部分间的关联关系.鉴于此,通过总结近20年公开发表的哈希学习文献,对面向大规模图像检索的哈希学习进行系统的综述性研究.首先,介绍哈希学习的技术路线和哈希学习算法的主要组成部分,包括损失函数、优化策略及样本外扩展映射.其次,将面向图像检索的哈希学习算法分为无监督哈希方法和监督哈希方法两类,并分别梳理每类方法的研究现状和演化过程.然后,介绍哈希学习算法评估通用的图像数据集与评估指标,并通过对比实验分析部分经典算法的性能.最后,结合哈希学习的局限性与新挑战对其发展前景进行阶段性总结与展望. 展开更多
关键词 图像检索 大规模数据 近似最近邻检索 哈希学习 相似性保持
在线阅读 下载PDF
基于目标语义提示与双注意力感知的遥感图像文本检索方法
18
作者 田澍 张秉熙 +5 位作者 曹林 邢相薇 田菁 沈博 杜康宁 张晔 《电子与信息学报》 北大核心 2025年第6期1734-1746,共13页
高分辨率遥感图像场景复杂、语义信息丰富多样且目标尺度多变,容易引起特征空间中不同类别目标的图像特征分布混淆,导致模型难以高效捕获遥感目标文本语义与图像特征的潜在关联,进而影响遥感图像文本检索的精度。针对这一问题,该文提出... 高分辨率遥感图像场景复杂、语义信息丰富多样且目标尺度多变,容易引起特征空间中不同类别目标的图像特征分布混淆,导致模型难以高效捕获遥感目标文本语义与图像特征的潜在关联,进而影响遥感图像文本检索的精度。针对这一问题,该文提出基于目标语义提示与双注意力感知的遥感图像文本检索方法。该方法首先引入空间-通道协同注意力,利用空间-通道维度注意权重交互捕捉图像全局上下文特征。同时,为了实现遥感图像显著目标信息的多粒度精准表征,模型通过所构建的基于自适应显著性区域目标感知注意力机制,通过动态多尺度目标特征加权聚合,提升对目标局部区域显著性特征聚焦响应。此外,该文设计了目标类别概率先验引导策略,对文本描述进行目标类别语义词频统计,以获取高概率先验目标语义信息,进而指导在跨模态共性嵌入空间中的图像特征聚类,最终实现高效准确的图像-文本特征对齐。该方法在RSICD与RSITMD两组遥感图像文本检索基准数据集上开展实验评估。结果表明,所设计的方法在检索精度指标上展现出了卓越的性能优势。 展开更多
关键词 遥感图像 跨模态 图像文本检索 CLIP 空间通道注意力
在线阅读 下载PDF
融合图像与文本特征的组合检索方法
19
作者 秦钰淑 杨良怀 +1 位作者 朱艳超 龚卫华 《电子学报》 北大核心 2025年第2期558-567,共10页
随着电商领域图像数据的爆炸式增长,针对目标图像的检索成为信息检索研究中的挑战性工作.现有的传统图像检索模型仅依靠单一文本描述或相似图像,难以准确捕捉用户的检索意图,导致检索结果不理想.为了解决该难题,本文提出了一种融合图像... 随着电商领域图像数据的爆炸式增长,针对目标图像的检索成为信息检索研究中的挑战性工作.现有的传统图像检索模型仅依靠单一文本描述或相似图像,难以准确捕捉用户的检索意图,导致检索结果不理想.为了解决该难题,本文提出了一种融合图像与文本特征的组合检索方法,采用Swin Transformer(SwinT)提取参考图像的多层特征,将图像与文本特征在多个层级上进行融合,使文本特征能够多层次、细粒度地修改参考图像特征,以更接近目标图像特征.然后,将修改后的图像特征与目标图像特征嵌入到一个空间中进行相似性度量,并采用基于批次的分类损失来优化检索性能.在Fashion200k、MIT-States和CSS这3个数据集上的实验结果表明,相较于现有主流方法,本文方法在性能上平均提升了5个百分点. 展开更多
关键词 图像文本组合检索 图像特征 文本特征 特征融合
在线阅读 下载PDF
跨模态时尚检索的服装分层特征表示和关联学习
20
作者 姜爱萍 刘骊 +2 位作者 付晓东 刘利军 彭玮 《计算机辅助设计与图形学学报》 北大核心 2025年第4期654-667,共14页
针对时尚服装的图像和文本具有匹配视角单一、服装信息粒度细且模态关联性弱,导致跨模态时尚检索图文匹配不准确的问题,提出跨模态时尚检索的服装分层特征表示和关联学习方法.首先以成对的服装图文及标签为输入,通过构建服装分层特征表... 针对时尚服装的图像和文本具有匹配视角单一、服装信息粒度细且模态关联性弱,导致跨模态时尚检索图文匹配不准确的问题,提出跨模态时尚检索的服装分层特征表示和关联学习方法.首先以成对的服装图文及标签为输入,通过构建服装分层特征表示模块进行层次化的视觉和本文特征表示,提取得到服装图像的全局、款式、结构特征,以及服装文本的描述、主语、标签特征的分层表示;然后基于交叉注意和向量相似度进行层次化的关联计算,得到服装图文对的3层初始关系,并通过结合关系推理和聚合的分层关联学习,获得全局和描述、款式和主语、结构和标签3层关系;最终计算3层关系的关联得分,输出服装的图文匹配结果.在跨模态时尚检索基准数据集Fashion-gen上的实验结果表明,所提方法能够提升跨模态时尚检索的精度,与文中基线方法相比,在双向检索前1的召回率R@1上分别提升了10.26个百分点和14.22个百分点. 展开更多
关键词 跨模态时尚检索 图文匹配 服装分层特征 表示学习 关联学习
在线阅读 下载PDF
上一页 1 2 92 下一页 到第
使用帮助 返回顶部