期刊文献+
共找到901篇文章
< 1 2 46 >
每页显示 20 50 100
BDMFuse:Multi-scale network fusion for infrared and visible images based on base and detail features
1
作者 SI Hai-Ping ZHAO Wen-Rui +4 位作者 LI Ting-Ting LI Fei-Tao Fernando Bacao SUN Chang-Xia LI Yan-Ling 《红外与毫米波学报》 北大核心 2025年第2期289-298,共10页
The fusion of infrared and visible images should emphasize the salient targets in the infrared image while preserving the textural details of the visible images.To meet these requirements,an autoencoder-based method f... The fusion of infrared and visible images should emphasize the salient targets in the infrared image while preserving the textural details of the visible images.To meet these requirements,an autoencoder-based method for infrared and visible image fusion is proposed.The encoder designed according to the optimization objective consists of a base encoder and a detail encoder,which is used to extract low-frequency and high-frequency information from the image.This extraction may lead to some information not being captured,so a compensation encoder is proposed to supplement the missing information.Multi-scale decomposition is also employed to extract image features more comprehensively.The decoder combines low-frequency,high-frequency and supplementary information to obtain multi-scale features.Subsequently,the attention strategy and fusion module are introduced to perform multi-scale fusion for image reconstruction.Experimental results on three datasets show that the fused images generated by this network effectively retain salient targets while being more consistent with human visual perception. 展开更多
关键词 infrared image visible image image fusion encoder-decoder multi-scale features
在线阅读 下载PDF
A fast, accurate and dense feature matching algorithm for aerial images 被引量:2
2
作者 LI Ying GONG Guanghong SUN Lin 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2020年第6期1128-1139,共12页
Three-dimensional(3D)reconstruction based on aerial images has broad prospects,and feature matching is an important step of it.However,for high-resolution aerial images,there are usually problems such as long time,mis... Three-dimensional(3D)reconstruction based on aerial images has broad prospects,and feature matching is an important step of it.However,for high-resolution aerial images,there are usually problems such as long time,mismatching and sparse feature pairs using traditional algorithms.Therefore,an algorithm is proposed to realize fast,accurate and dense feature matching.The algorithm consists of four steps.Firstly,we achieve a balance between the feature matching time and the number of matching pairs by appropriately reducing the image resolution.Secondly,to realize further screening of the mismatches,a feature screening algorithm based on similarity judgment or local optimization is proposed.Thirdly,to make the algorithm more widely applicable,we combine the results of different algorithms to get dense results.Finally,all matching feature pairs in the low-resolution images are restored to the original images.Comparisons between the original algorithms and our algorithm show that the proposed algorithm can effectively reduce the matching time,screen out the mismatches,and improve the number of matches. 展开更多
关键词 feature matching feature screening feature fusion aerial image three-dimensional(3D)reconstruction
在线阅读 下载PDF
Image Feature Extraction and Matching of Augmented Solar Images in Space Weather
3
作者 WANG Rui BAO Lili CAI Yanxia 《空间科学学报》 CAS CSCD 北大核心 2023年第5期840-852,共13页
Augmented solar images were used to research the adaptability of four representative image extraction and matching algorithms in space weather domain.These include the scale-invariant feature transform algorithm,speed... Augmented solar images were used to research the adaptability of four representative image extraction and matching algorithms in space weather domain.These include the scale-invariant feature transform algorithm,speeded-up robust features algorithm,binary robust invariant scalable keypoints algorithm,and oriented fast and rotated brief algorithm.The performance of these algorithms was estimated in terms of matching accuracy,feature point richness,and running time.The experiment result showed that no algorithm achieved high accuracy while keeping low running time,and all algorithms are not suitable for image feature extraction and matching of augmented solar images.To solve this problem,an improved method was proposed by using two-frame matching to utilize the accuracy advantage of the scale-invariant feature transform algorithm and the speed advantage of the oriented fast and rotated brief algorithm.Furthermore,our method and the four representative algorithms were applied to augmented solar images.Our application experiments proved that our method achieved a similar high recognition rate to the scale-invariant feature transform algorithm which is significantly higher than other algorithms.Our method also obtained a similar low running time to the oriented fast and rotated brief algorithm,which is significantly lower than other algorithms. 展开更多
关键词 Augmented reality Augmented image image feature point extraction and matching Space weather Solar image
在线阅读 下载PDF
Underwater Image Enhancement Based on Multi-scale Adversarial Network
4
作者 ZENG Jun-yang SI Zhan-jun 《印刷与数字媒体技术研究》 CAS 北大核心 2024年第5期70-77,共8页
In this study,an underwater image enhancement method based on multi-scale adversarial network was proposed to solve the problem of detail blur and color distortion in underwater images.Firstly,the local features of ea... In this study,an underwater image enhancement method based on multi-scale adversarial network was proposed to solve the problem of detail blur and color distortion in underwater images.Firstly,the local features of each layer were enhanced into the global features by the proposed residual dense block,which ensured that the generated images retain more details.Secondly,a multi-scale structure was adopted to extract multi-scale semantic features of the original images.Finally,the features obtained from the dual channels were fused by an adaptive fusion module to further optimize the features.The discriminant network adopted the structure of the Markov discriminator.In addition,by constructing mean square error,structural similarity,and perceived color loss function,the generated image is consistent with the reference image in structure,color,and content.The experimental results showed that the enhanced underwater image deblurring effect of the proposed algorithm was good and the problem of underwater image color bias was effectively improved.In both subjective and objective evaluation indexes,the experimental results of the proposed algorithm are better than those of the comparison algorithm. 展开更多
关键词 Underwater image enhancement Generative adversarial network multi-scale feature extraction Residual dense block
在线阅读 下载PDF
Bidirectional parallel multi-branch convolution feature pyramid network for target detection in aerial images of swarm UAVs 被引量:4
5
作者 Lei Fu Wen-bin Gu +3 位作者 Wei Li Liang Chen Yong-bao Ai Hua-lei Wang 《Defence Technology(防务技术)》 SCIE EI CAS CSCD 2021年第4期1531-1541,共11页
In this paper,based on a bidirectional parallel multi-branch feature pyramid network(BPMFPN),a novel one-stage object detector called BPMFPN Det is proposed for real-time detection of ground multi-scale targets by swa... In this paper,based on a bidirectional parallel multi-branch feature pyramid network(BPMFPN),a novel one-stage object detector called BPMFPN Det is proposed for real-time detection of ground multi-scale targets by swarm unmanned aerial vehicles(UAVs).First,the bidirectional parallel multi-branch convolution modules are used to construct the feature pyramid to enhance the feature expression abilities of different scale feature layers.Next,the feature pyramid is integrated into the single-stage object detection framework to ensure real-time performance.In order to validate the effectiveness of the proposed algorithm,experiments are conducted on four datasets.For the PASCAL VOC dataset,the proposed algorithm achieves the mean average precision(mAP)of 85.4 on the VOC 2007 test set.With regard to the detection in optical remote sensing(DIOR)dataset,the proposed algorithm achieves 73.9 mAP.For vehicle detection in aerial imagery(VEDAI)dataset,the detection accuracy of small land vehicle(slv)targets reaches 97.4 mAP.For unmanned aerial vehicle detection and tracking(UAVDT)dataset,the proposed BPMFPN Det achieves the mAP of 48.75.Compared with the previous state-of-the-art methods,the results obtained by the proposed algorithm are more competitive.The experimental results demonstrate that the proposed algorithm can effectively solve the problem of real-time detection of ground multi-scale targets in aerial images of swarm UAVs. 展开更多
关键词 Aerial images Object detection feature pyramid networks multi-scale feature fusion Swarm UAVs
在线阅读 下载PDF
Image matching algorithm based on SIFT using color and exposure information 被引量:9
6
作者 Yan Zhao Yuwei Zhai +1 位作者 Eric Dubois Shigang Wang 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2016年第3期691-699,共9页
Image matching based on scale invariant feature transform(SIFT) is one of the most popular image matching algorithms, which exhibits high robustness and accuracy. Grayscale images rather than color images are genera... Image matching based on scale invariant feature transform(SIFT) is one of the most popular image matching algorithms, which exhibits high robustness and accuracy. Grayscale images rather than color images are generally used to get SIFT descriptors in order to reduce the complexity. The regions which have a similar grayscale level but different hues tend to produce wrong matching results in this case. Therefore, the loss of color information may result in decreasing of matching ratio. An image matching algorithm based on SIFT is proposed, which adds a color offset and an exposure offset when converting color images to grayscale images in order to enhance the matching ratio. Experimental results show that the proposed algorithm can effectively differentiate the regions with different colors but the similar grayscale level, and increase the matching ratio of image matching based on SIFT. Furthermore, it does not introduce much complexity than the traditional SIFT. 展开更多
关键词 scale invariant feature transform(SIFT) image matching color exposure
在线阅读 下载PDF
基于双目立体视觉的多分辨率图像匹配方法研究
7
作者 刘华春 吴广文 闫静莉 《现代电子技术》 北大核心 2025年第1期29-32,共4页
在双目立体视觉系统中,面对复杂场景时噪声会损害图像特征,增加提取难度,导致匹配精度和鲁棒性下降。因此,文中提出基于双目立体视觉的多分辨率图像匹配方法,旨在从不同尺度图像中有效获取信息并实现高精度匹配。该方法利用双目立体视... 在双目立体视觉系统中,面对复杂场景时噪声会损害图像特征,增加提取难度,导致匹配精度和鲁棒性下降。因此,文中提出基于双目立体视觉的多分辨率图像匹配方法,旨在从不同尺度图像中有效获取信息并实现高精度匹配。该方法利用双目立体视觉模型的双目旋转相机扫描目标并进行成像,根据内、外空间标定提升双目旋转相机的位置精度,保证目标的多分辨率成像效果;将其输入金字塔立体匹配网络中,通过网络中的类金字塔多空洞卷积操作提取双目图像特征,在此基础上,基于可变卷积增强其纹理特征细节;结合细粒度特征和互注意力机制完成双目图像匹配。测试结果显示,空间标定后,左、右两个相机的成像误差最小值分别为0.6 Pixel和0.4 Pixel;匹配点坐标偏差均值和坐标偏差方差值分别低于0.012和0.011,匹配效果良好。 展开更多
关键词 双目立体视觉 多分辨率 图像匹配 空间标定 双目旋转相机 特征提取 特征增强 细粒度
在线阅读 下载PDF
煤矿井下锚网特征掘进机视觉定位方法
8
作者 张旭辉 迟云凯 +6 位作者 杜昱阳 姜俊英 杨文娟 赵友军 万继成 王彦群 田琛辉 《煤田地质与勘探》 北大核心 2025年第6期259-270,共12页
【背景】煤矿井下掘进装备精确定位是实现综掘工作面自动化、智能化导控的重要基础。但因井下巷道狭长封闭、光照不足、纹理稀疏等因素,传统的视觉定位方法应用受限,基于此提出一种基于锚网特征的煤矿井下掘进机视觉定位方法。【方法】... 【背景】煤矿井下掘进装备精确定位是实现综掘工作面自动化、智能化导控的重要基础。但因井下巷道狭长封闭、光照不足、纹理稀疏等因素,传统的视觉定位方法应用受限,基于此提出一种基于锚网特征的煤矿井下掘进机视觉定位方法。【方法】采用三分支深度可分离卷积的图像增强网络,分别估计图像的反射、光照和噪声,在调整光照分量的同时抑制噪声的影响,得到了光照均匀、纹理清晰的图像,提升了视觉定位系统在复杂光照条件下的适应性;设计了适用于锚网线特征提取与匹配的方法,通过自适应阈值的EDLines(edge drawing lines)增强了对锚网线特征的提取能力,并利用结构相似度(structure similarity index measure,SSIM)提高了线特征的匹配的准确性;构建了最小化线特征重投影误差的位姿解算模型,结合位姿图优化,实现了掘进机的精确定位。搭建实验平台,对图像增强、线特征处理以及定位性能分别设计实验进行定量分析。【结果和结论】TSCRNET图像增强方法相较于MSRCR和Zero-DCE取得了更高的PSNR值与SSIM值;线特征处理方法相对于传统算法提取特征数量与匹配精度显著提高,为后续定位过程奠定了基础;定位实验部分,在EuRoC数据集以及实际巷道场景中将TSCR-NET算法与其它基于线特征的视觉定位方法进行对比,该算法在EuRoC数据集的9个数据序列中表现优于PL-VINS算法,在60 m范围内的巷道锚网环境中对机身进行连续跟踪,观测到该视觉定位方法最大误差为163 mm,与PL-VINS的最大误差213 mm相比,降低了23.5%,均方根误差由0.531降低至0.426,降低了19.8%,可见TSCR-NET算法具有更高的精度与稳定性,对掘进机在井下巷道锚网环境中的长距离位姿检测具有重要借鉴作用。 展开更多
关键词 掘进机 视觉定位 图像增强 线特征提取与匹配 运动估计 锚网特征 煤矿
在线阅读 下载PDF
基于云计算的多类型大规模激光图像快速识别研究
9
作者 李洋 张阳 陶锐 《激光杂志》 北大核心 2025年第2期149-153,共5页
大规模激光图像是指数量庞大、信息量丰富的激光扫描图像数据。这类图像在地理信息获取、城市规划、自动驾驶等领域的应用日益广泛,通常包含丰富的空间信息和细节特征,因此,存在处理复杂度高的问题,云计算作为一种新兴的计算模式,具有... 大规模激光图像是指数量庞大、信息量丰富的激光扫描图像数据。这类图像在地理信息获取、城市规划、自动驾驶等领域的应用日益广泛,通常包含丰富的空间信息和细节特征,因此,存在处理复杂度高的问题,云计算作为一种新兴的计算模式,具有强大的计算能力和灵活的资源配置优势,研究基于云计算的多类型大规模激光图像快速识别方法。通过非线性匹配方式处理激光图像,确定激光图像中目标点位姿变化矩阵;将处理后的激光图像,以机器算法作特征筛选,划分不同类型激光图像中的关键特征;采用云计算关联方法,构建快速识别模型,通过模型内目标函数,实现多类型大规模激光图像快速识别。实验结果表明:以两组不同类型的连续帧激光图像作为测试样本,所研究方法可以实现设计方案下的快速识别,具有应用价值。 展开更多
关键词 云计算 多类型 大规模 激光图像 快速识别 匹配方式 关键特征
在线阅读 下载PDF
基于显著性特征的多视角动作图像识别研究
10
作者 惠向晖 孙艳红 沈小乐 《现代电子技术》 北大核心 2025年第13期62-65,共4页
文中基于显著性特征的多视角动作图像识别方法,自动学习并提取出运动员动作的关键特征,有助于教练为运动员制定更科学、更个性化的训练计划。将人体骨架序列对齐到统一的时空坐标系中,计算距离图和角度图以捕捉骨架的空间特征,生成人体... 文中基于显著性特征的多视角动作图像识别方法,自动学习并提取出运动员动作的关键特征,有助于教练为运动员制定更科学、更个性化的训练计划。将人体骨架序列对齐到统一的时空坐标系中,计算距离图和角度图以捕捉骨架的空间特征,生成人体运动特征图;构建CNN+CA模型,将处理后的多视角动作视频帧生成感兴趣区域(ROI)拼接图,再将其输入到CNN中,提取多视角融合特征,并在CA模块中突出那些对于动作图像识别最为关键的区域;通过序列匹配算法将多视角动作识别问题转化为预测标签序列的匹配问题,为待识别动作图像分配动作类别标签,实现准确的多视角动作图像识别。实验结果表明:该方法不仅能够有效处理来自不同视角的动作图像,还能够准确识别出篮球运动员的多种动作。 展开更多
关键词 显著性特征 多视角动作图像 运动特征图 ROI拼接图 CNN CA模块 LSTM 序列匹配算法
在线阅读 下载PDF
局部密度差异引导的图像特征匹配算法
11
作者 肖剑 武亮亮 +1 位作者 何昕泽 胡欣 《哈尔滨工业大学学报》 北大核心 2025年第8期88-95,共8页
为解决预定义参数化模型的特征匹配方法通用性较低且鲁棒性较差的问题,根据正确匹配和误匹配的空间分布具有显著差异的现象,提出一种局部密度差异引导的特征匹配(RFM-LoDD)算法。首先,将假定特征匹配转换为能够表征特征匹配性质的空间... 为解决预定义参数化模型的特征匹配方法通用性较低且鲁棒性较差的问题,根据正确匹配和误匹配的空间分布具有显著差异的现象,提出一种局部密度差异引导的特征匹配(RFM-LoDD)算法。首先,将假定特征匹配转换为能够表征特征匹配性质的空间样本点,并引入概率距离计算样本点的局部密度。其次,在随机选取的40幅涉及不同变换模型的图像对上测试算法的最优参数设置,确定了具有全局最优的密度阈值和其他参数。最后,将样本点的局部密度与密度阈值进行比较,当样本点的局部密度大于密度阈值,则认为该样本点代表的假定匹配为正确匹配,否则,就认为其代表的假定匹配为误匹配。在代表图像对和公开数据集上进行的实验表明,RFM-LoDD算法在各种匹配场景下都能够保持良好的鲁棒性,特别是在内点率较低的Retina数据集和AdelaideRMF数据集上相比于先进的算法均取得了领先的F分数。此外,RFM-LoDD算法具有准线性的时间复杂度,在4个公开数据集上的平均运行时间约为40 ms,时间成本相比于经典的随机抽样一致性(RANSAC)算法降低了两个数量级。 展开更多
关键词 特征匹配 局部密度 误匹配剔除 图像配准 变换模型
在线阅读 下载PDF
基于异常检测的图像特征匹配算法
12
作者 肖剑 武亮亮 +1 位作者 何昕泽 胡欣 《浙江大学学报(工学版)》 北大核心 2025年第6期1140-1147,共8页
基于预定义参数化模型的特征匹配方法通用性较低,为此提出基于异常检测的特征匹配算法(RFM-AD).根据假定特征匹配构建异常检测样本,将特征匹配问题转换为异常样本点检测问题,引入局部异常因子(LOF)算法作为异常检测的基础.针对LOF算法... 基于预定义参数化模型的特征匹配方法通用性较低,为此提出基于异常检测的特征匹配算法(RFM-AD).根据假定特征匹配构建异常检测样本,将特征匹配问题转换为异常样本点检测问题,引入局部异常因子(LOF)算法作为异常检测的基础.针对LOF算法不能有效检测低密度样本的缺陷,引入并改进基于连通性的异常检测方法(COF),并基于引导匹配策略对COF算法和LOF算法进行融合.在随机选取的30幅涉及不同变换模型和噪声干扰的图像对上测试算法的参数设置,确定全局最优的关键参数.在4个公开数据集上进行实验,结果表明,本研究算法在面对大量异常值时具有良好的鲁棒性和匹配性能;在保证较高匹配准确率的情况下,本研究算法相比于RANSAC、LPM、RFM-SCAN等先进算法取得了较高的召回率;在内点率最低的Retina数据集上,本研究算法的F分数较高. 展开更多
关键词 特征匹配 异常检测 局部异常因子 误匹配剔除 图像配准
在线阅读 下载PDF
基于局部和全局特征的电力设备红外和可见光图像匹配方法
13
作者 冯旭刚 阮善会 +2 位作者 王正兵 安硕 张科琪 《电工技术学报》 北大核心 2025年第7期2236-2246,2305,共12页
针对电力设备红外和可见光图像匹配过程受图像局部灰度差异影响大,以及特征点描述和匹配困难的问题,该文提出了基于局部和全局特征的电力设备红外和可见光图像匹配方法。首先,利用多尺度角检测算法分别检测红外和可见光图像中的特征点,... 针对电力设备红外和可见光图像匹配过程受图像局部灰度差异影响大,以及特征点描述和匹配困难的问题,该文提出了基于局部和全局特征的电力设备红外和可见光图像匹配方法。首先,利用多尺度角检测算法分别检测红外和可见光图像中的特征点,再使用不同尺度的曲率信息为每个特征点分配特征主方向(CAO);其次,分别构建每个特征点的部分灰度不变特征描述符(PIIFD)和全局上下文特征描述符;然后,将两种特征描述符的相似度进行加权融合,并利用双向匹配方法和随机抽样一致(RANSAC)方法筛选出正确的匹配点对;最后,得到图像间的仿射变换模型参数。实验结果表明:该文匹配方法与PIIFD、Log-Gabor直方图描述符(LGHD)和CAO匹配算法相比,正确匹配数显著增加,平均准确率较其他三种算法分别提高了50.71、27.62、11.11个百分点,平均重复度分别提高了27.69、28.81、19.18个百分点。 展开更多
关键词 电力设备 图像匹配 红外和可见光图像 全局上下文描述符 特征相似度匹配
在线阅读 下载PDF
基于深度特征提取的深海序列图像拼接网络
14
作者 赵帅 张春堂 樊春玲 《电子测量技术》 北大核心 2025年第3期180-187,共8页
利用图像拼接获得海底全景图对了解深海地形地貌具有重要意义。受限于深海环境,海底图像特征模糊,序列图像的连续拼接需要一种稳定、有效的拼接网络。针对上述问题,本研究提出一种结合改进ALIKED(ALIKED-P)和LightGlue的深海序列图像拼... 利用图像拼接获得海底全景图对了解深海地形地貌具有重要意义。受限于深海环境,海底图像特征模糊,序列图像的连续拼接需要一种稳定、有效的拼接网络。针对上述问题,本研究提出一种结合改进ALIKED(ALIKED-P)和LightGlue的深海序列图像拼接网络AP-LG。首先,用可变形卷积v2替代ALIKED网络中可变形卷积,引入调节机制,增强网络的特征捕获能力;然后,通过特征金字塔网络实现多尺度特征融合,增强网络对环境变化的鲁棒性;最后,以LightGlue特征匹配网络为核心,基于单应性估计策略,实现多张序列图像的连续对齐拼接。实验结果表明,在UIEBD和DISD数据集上,AP-LG网络分别以32.91%和49.41%匹配率使得86.00%和93.60%的图像对匹配到100对以上的有效特征点,所提方法能够稳定提取深海图像特征,有效实现特征匹配,完成深海序列图像拼接。 展开更多
关键词 图像拼接 特征提取 特征匹配 ALIKED LightGlue
在线阅读 下载PDF
低光条件下结合FFE-Net网络的视觉SLAM算法
15
作者 陈孟元 李鹏飞 +3 位作者 符乙 杨苏朋 徐奥 杜鹏 《中国惯性技术学报》 北大核心 2025年第1期36-45,共10页
视觉同步定位与地图构建(SLAM)算法在低光照条件下容易出现跟踪丢失和特征匹配困难,造成闭环和定位精度降低。针对此问题,提出一种融合傅立叶特征增强网络(FFE-Net)的视觉SLAM算法。首先,通过对傅里叶频域和空间域进行跨域处理,设计傅... 视觉同步定位与地图构建(SLAM)算法在低光照条件下容易出现跟踪丢失和特征匹配困难,造成闭环和定位精度降低。针对此问题,提出一种融合傅立叶特征增强网络(FFE-Net)的视觉SLAM算法。首先,通过对傅里叶频域和空间域进行跨域处理,设计傅里叶空间亮度增强和特征细节恢复模块,提高了系统在低光照条件下的特征匹配数量及定位精度。其次,提出一种基于局部超像素特征描述符的闭环检测方法,通过规划特征区域生成特征描述符并结合词袋,共同完成对候选回环帧的筛选,提高闭环准确率。最后,在TUM_VI、KITTI和EUROC公开数据集上进行实验验证。实验结果表明,所提算法在TUM_VI上的绝对轨迹误差比ORB-SLAM3算法平均降低了27.16%,闭环精度比VINS-FUSION算法提升了5.0%。根据实际场景下的实验结果,所提算法的运动轨迹比VINS-FUSION更接近真实轨迹,表现出良好的构图能力。 展开更多
关键词 特征匹配 图像增强 特征描述符 闭环检测
在线阅读 下载PDF
跨模态时尚检索的服装分层特征表示和关联学习
16
作者 姜爱萍 刘骊 +2 位作者 付晓东 刘利军 彭玮 《计算机辅助设计与图形学学报》 北大核心 2025年第4期654-667,共14页
针对时尚服装的图像和文本具有匹配视角单一、服装信息粒度细且模态关联性弱,导致跨模态时尚检索图文匹配不准确的问题,提出跨模态时尚检索的服装分层特征表示和关联学习方法.首先以成对的服装图文及标签为输入,通过构建服装分层特征表... 针对时尚服装的图像和文本具有匹配视角单一、服装信息粒度细且模态关联性弱,导致跨模态时尚检索图文匹配不准确的问题,提出跨模态时尚检索的服装分层特征表示和关联学习方法.首先以成对的服装图文及标签为输入,通过构建服装分层特征表示模块进行层次化的视觉和本文特征表示,提取得到服装图像的全局、款式、结构特征,以及服装文本的描述、主语、标签特征的分层表示;然后基于交叉注意和向量相似度进行层次化的关联计算,得到服装图文对的3层初始关系,并通过结合关系推理和聚合的分层关联学习,获得全局和描述、款式和主语、结构和标签3层关系;最终计算3层关系的关联得分,输出服装的图文匹配结果.在跨模态时尚检索基准数据集Fashion-gen上的实验结果表明,所提方法能够提升跨模态时尚检索的精度,与文中基线方法相比,在双向检索前1的召回率R@1上分别提升了10.26个百分点和14.22个百分点. 展开更多
关键词 跨模态时尚检索 图文匹配 服装分层特征 表示学习 关联学习
在线阅读 下载PDF
基于文本生成与迭代匹配的图像-文本检索
17
作者 潘莹莹 马青 白琮 《计算机辅助设计与图形学学报》 北大核心 2025年第5期856-864,共9页
跨模态图文检索由于图像和文本的特征表示方式不同面临着模态异构问题,传统的公共空间方法难以度量图像和文本的相似性.为此,提出了基于文本生成与迭代匹配的跨模态图像文本检索框架,它包含了特征融合模块和文本生成模块.特征融合模块... 跨模态图文检索由于图像和文本的特征表示方式不同面临着模态异构问题,传统的公共空间方法难以度量图像和文本的相似性.为此,提出了基于文本生成与迭代匹配的跨模态图像文本检索框架,它包含了特征融合模块和文本生成模块.特征融合模块通过迭代融合的方式,多次对齐图像和文本,在不同的迭代步骤中聚合细粒度信息,捕获图像和文本之间的局部关联信息,优化了局部公共嵌入空间;文本生成模块采用特征转换的思路,由图像模态中的特征映射到文本模态中的句子特征,通过图文信息交互增强了图像和文本的整体语义相关性,优化了全局公共嵌入空间,挖掘出图像与文本更深层的语义信息,以提高跨模态图像文本检索模型的性能.在Flickr30K和COCO数据集上进行了实验,并与现有的模型进行比较,结果表明,该框架在Flickr30K和COCO上的整体性能分别提升了0.7%和1.2%.在文本检索任务的召回指标中,最高可以提升3.4%;在图像检索任务的召回指标中,最高可以提升4.6%.消融实验也证明了其中特征融合模块以及文本生成模块的有效性. 展开更多
关键词 跨模态图文检索 文本生成 公共空间 特征融合 迭代匹配
在线阅读 下载PDF
Integral Imaging与模拟退火相结合的深度测量方法研究 被引量:1
18
作者 刘献如 蔡自兴 +1 位作者 杨欣荣 伍春洪 《系统仿真学报》 CAS CSCD 北大核心 2009年第8期2303-2307,共5页
该文提出一种Integral Imaging和模拟退火相结合的深度测量方法。针对传统立体视深度测量的复杂性,采用全真三维显示技术Integral Imaging成像技术记录空间三维信息。利用带约束的特征匹配算法并综合多种信息分析Integral imaging视图... 该文提出一种Integral Imaging和模拟退火相结合的深度测量方法。针对传统立体视深度测量的复杂性,采用全真三维显示技术Integral Imaging成像技术记录空间三维信息。利用带约束的特征匹配算法并综合多种信息分析Integral imaging视图对之间的视差。将寻找匹配的问题设计为全局能量函数模型,并用模拟退火算法使该能量函数最小化,从而实现所有视图对中所有特征点的匹配。最后结合Integral Imaging深度估算公式获得空间深度信息。仿真结果表明该方法的有效性。 展开更多
关键词 INTEGRAL imagING 带约束的特征匹配 能量函数 模拟退火
在线阅读 下载PDF
基于特征点匹配的激光雷达与相机间外参标定方法
19
作者 李新 王肖霞 杨风暴 《现代电子技术》 北大核心 2025年第3期19-25,共7页
激光雷达点云和相机图像融合常被应用在多个领域,准确的外参标定是融合两种信息的前提。现有的基于特征的标定算法,提取的3D⁃2D特征存在不匹配的问题,影响了整体标定的性能。为此提出一种基于特征点匹配的激光雷达与相机外参标定方法。... 激光雷达点云和相机图像融合常被应用在多个领域,准确的外参标定是融合两种信息的前提。现有的基于特征的标定算法,提取的3D⁃2D特征存在不匹配的问题,影响了整体标定的性能。为此提出一种基于特征点匹配的激光雷达与相机外参标定方法。首先利用圆心特征提取算法从点云和图像中分别获取标定板上4个圆心特征点的三维和二维坐标;然后建立三维点云数据和二维图像数据中点对间约束关系;最后通过非线性优化算法得到激光雷达和相机标定的外参,利用外参矩阵将激光雷达点云投影在对应的图像上。实验结果表明,文中所提方法平均重投影误差在2.6像素内,与基于手动匹配的标定方法相比,精度提升了42.2%;与基于两孔圆形标定板的标定方法相比,精度提升了27.8%。 展开更多
关键词 激光雷达 点云 相机图像融合 外参标定 特征点匹配 平均重投影误差
在线阅读 下载PDF
融合注意力与多尺度特征的遥感图像配准 被引量:2
20
作者 倪力政 陈颖 +2 位作者 李翔 邓修涵 马腾 《计算机工程与应用》 北大核心 2025年第3期275-285,共11页
针对遥感图像地理信息复杂多变、局部细节与上下文信息难以被充分提取,以及部分配准模型精度较低、用时较长等问题,提出了一种融合注意力与多阶尺度特征的配准模型,在特征提取阶段引入Transformer与逆残差结构结合的轻量级卷积网络,通... 针对遥感图像地理信息复杂多变、局部细节与上下文信息难以被充分提取,以及部分配准模型精度较低、用时较长等问题,提出了一种融合注意力与多阶尺度特征的配准模型,在特征提取阶段引入Transformer与逆残差结构结合的轻量级卷积网络,通过嵌入混合注意力块加深对通道空间信息的关注,进一步地,为了更有效地捕获上下文特征信息,使用增强注意力的多尺度扩张卷积模块进行深层次过滤提取,以获取更精细和丰富的特征语义图。在匹配阶段采用互相关最优加权的双向匹配方法,计算密集对应关系得到双向参数,并通过参数回归网络加权合成最终变换参数,仿射变换完成图像配准。实验结果表明,关键点正确估计的比例系数为0.03、0.05和0.1的情况下,在三个数据集上的配准精度达到61.9%、86.2%、93.6%,而平均配准时间仅为1.05 s,证明了该模型有效提升遥感图像配准的精度和效率。 展开更多
关键词 遥感图像配准 上下文特征 增强注意力 双向匹配
在线阅读 下载PDF
上一页 1 2 46 下一页 到第
使用帮助 返回顶部