期刊文献+
共找到567篇文章
< 1 2 29 >
每页显示 20 50 100
复杂光照条件下全景图像拼接融合方法研究
1
作者 罗莹 姚湘 刘萌 《激光杂志》 北大核心 2025年第7期118-122,共5页
在复杂光照条件下,全景图像的亮度、对比度和色彩饱和度等都会受到严重的影响,导致图像质量下降。为了有效地整合多个视角下的图像信息、提高图像的清晰度和细节表现能力,提出复杂光照条件下全景图像拼接融合方法。结合激光雷达、摄像... 在复杂光照条件下,全景图像的亮度、对比度和色彩饱和度等都会受到严重的影响,导致图像质量下降。为了有效地整合多个视角下的图像信息、提高图像的清晰度和细节表现能力,提出复杂光照条件下全景图像拼接融合方法。结合激光雷达、摄像技术和计算机视觉测量技术,建立明亮的轮廓线,获取复杂光照条件下清晰的目标区域限界。为了提取全景图像中像素级的边缘特征,本方法应用Canny检测算法,并利用曲率尺度空间方法来识别曲率极值点作为特征。接着,对每个边缘点邻域进行多尺度平均值估计,并构建其梯度方向直方图以进行描述。在经过粗略和精细匹配过程之后,通过加权平均融合策略,实现了全景图像的无缝拼接。实验证明,该方法能够有效地进行全景图像的拼接融合,并取得了满意的结果。 展开更多
关键词 激光摄像技术 复杂光照条件 全景图像 拼接融合 曲率尺度空间算法
在线阅读 下载PDF
基于立体感感知的全景图像质量评价算法
2
作者 安平 汤旭锋 +1 位作者 杨超 黄新彭 《信号处理》 北大核心 2025年第4期759-769,共11页
无参考全景图像质量评价旨在客观衡量全景图像的人类视觉感知质量,而无需依赖原始图像的质量信息。随着虚拟现实技术的迅猛发展,全景图像质量评价的重要性日益凸显。然而,现有全景图像质量评价算法仍存在着一些限制,如不能很好模拟观察... 无参考全景图像质量评价旨在客观衡量全景图像的人类视觉感知质量,而无需依赖原始图像的质量信息。随着虚拟现实技术的迅猛发展,全景图像质量评价的重要性日益凸显。然而,现有全景图像质量评价算法仍存在着一些限制,如不能很好模拟观察者的浏览过程、未能有效考虑观看者的立体感知过程等。这严重影响了全景图像质量评价的准确性。为解决这一问题,本文提出一种基于沉浸式立体感知和视口感知交互的无参考全景图像质量评价算法。首先,设计一种视口提取策略,通过在球形域上提取特征视点,选择具有较高被观察概率的视点。对选定的视点提取相应的视口内容,并将多个视口内容并行输入特征编码器,以实现多尺度视口特征的提取。随后,鉴于当前实现多个视口间信息交互的方式尚存在局限性,本文提出一个视口特征交互模块,旨在实现对输入的多个视口内容进行跨视口的信息交互。最后,本文还探索了在缺乏视口采样的情况下,利用整个全景图像实现对立体感信息的获取,以实现对立体感过程建模从而提高整体评价性能。实验结果证明了本文提出算法的有效性,与当前最先进的质量评价算法相比之下,斯皮尔曼等级相关系数(Spearman Rank Order Correlation Coefficient,SROCC)指标和皮尔逊线性相关系数(Linear Pearson Correlation Coefficient,PLCC)在公开数据集CVIQD上分别达到0.72%和0.70%的提升,而在数据集OIQA上分别达到了1.10%和0.54%的提升。 展开更多
关键词 全景图像质量评价 视口提取 球面卷积 特征融合
在线阅读 下载PDF
基于多尺度卷积和选择性核双注意力机制的半监督全景X射线图像龋齿分割
3
作者 薛钟毫 姜金刚 +2 位作者 孙健鹏 潘洁 张嘉伟 《仪器仪表学报》 北大核心 2025年第6期241-250,共10页
全景X射线图像的龋齿分割是进行早期龋齿检测以及后续治疗的重要前提,为实现全景X射线图像中龋齿的精确自动分割,提出一种具有多尺度卷积和选择性核双注意力机制的半监督学习框架,该方法旨在利用大量未标注数据增强模型泛化能力,并缓解... 全景X射线图像的龋齿分割是进行早期龋齿检测以及后续治疗的重要前提,为实现全景X射线图像中龋齿的精确自动分割,提出一种具有多尺度卷积和选择性核双注意力机制的半监督学习框架,该方法旨在利用大量未标注数据增强模型泛化能力,并缓解龋齿病灶区域边界模糊、对比度低等问题。框架设计上,采用教师-学生双网络结构,通过多尺度卷积注意力机制对学生网络多层解码器进行深度监督,提升对边界细节和类间相似区域的判别能力。同时,引入选择性核注意力机制融合教师网络的多级预测结果,根据像素不确定性自适应选择不同卷积核,生成精确的不确定性掩模图,引导学生网络优化学习。实验在数据集1和2上进行,结果显示,在265切片数据上联合使用双注意力机制较基线模型在Dice系数、查准率和灵敏度分别提升3.91%、2.14%和5.35%;在530切片数据上则提升1.39%、5.69%和12.34%,验证了方法在大规模数据下的稳定性和适应性。与传统全监督模型相比,所提出的方法在Dice系数、查准率和灵敏度上最高分别提升22.27%、17.64%和24.57%;相比最新半监督模型也分别提升最多14.54%、14.81%和11.96%。本研究不仅有效提升了龋齿分割性能,同时也为全景X射线图像处理提供了一种精确的分割方案。 展开更多
关键词 龋齿分割 半监督学习 双注意力机制 全景X射线图像
在线阅读 下载PDF
伽马成像中光学全景融合的图像畸变校正方法
4
作者 何一帆 杨剑 +3 位作者 曾国强 杨新宇 田成帅 胡传皓 《核电子学与探测技术》 北大核心 2025年第4期472-480,共9页
伽马成像可提供核辐射场中放射源分布信息,广泛应用于核安全、核应急、核退役和核医学等领域。核辐射场图像还需与光学实景进行融合,才能为作业人员提供直观的可视化图像。本研究针对伽马相机,提出了一种光学全景的图像畸变校正方法,建... 伽马成像可提供核辐射场中放射源分布信息,广泛应用于核安全、核应急、核退役和核医学等领域。核辐射场图像还需与光学实景进行融合,才能为作业人员提供直观的可视化图像。本研究针对伽马相机,提出了一种光学全景的图像畸变校正方法,建立正方体棋盘格空间,通过识别全景图像内棋盘格的角点坐标对图像全局校正,减少了放射源的定位偏差。硬件系统采用两个220度视野的鱼眼镜头,背靠背获取360度的全景图像。基于理想的角点坐标和识别出的角点坐标,利用Delaunay三角剖分和仿射变换方法来校正图像,实现拼接图像的360度校正。该方法将所有图像角点像素坐标的均方根误差从148.22降到1.13,实测单个点状放射源的方位显示,其在水平方向的1.93度偏差和垂直方向上的-0.48度偏差得以校正。 展开更多
关键词 伽马相机 图像畸变校正 DELAUNAY三角剖分 仿射变换 全景图像
在线阅读 下载PDF
基于多视口自适应融合的全景图像质量评价
5
作者 冯晨曦 张地 +1 位作者 林敢 叶龙 《北京航空航天大学学报》 北大核心 2025年第7期2404-2414,共11页
现有的全景图像质量评价(OIQA)模型在提取各视口局部特征时相对独立,导致计算复杂度较高,且难以利用端到端的融合模型对各视口间的关联性进行刻画。针对该问题,提出了一种基于特征共享和多视口自适应融合的质量评价方法。利用共享的骨... 现有的全景图像质量评价(OIQA)模型在提取各视口局部特征时相对独立,导致计算复杂度较高,且难以利用端到端的融合模型对各视口间的关联性进行刻画。针对该问题,提出了一种基于特征共享和多视口自适应融合的质量评价方法。利用共享的骨干网络,将现有方法中互相独立的视口分割与计算任务转换到特征域,使得仅经1次前馈计算即可提取整个图像的局部特征。在此基础上,引入基于球面均匀采样的特征域视口分割方法以保证观察空间和表示空间的像素密度一致,并用语义信息指导各视口局部质量特征的自适应融合。所提方法在压缩的虚拟现实图像质量(CVIQ)数据集和OIQA数据集上的Pearson线性相关系数(PLCC)和Spearman秩相关系数(SRCC)均在0.96以上,与现有主流评价方法相比达到最优。相较于传统评价方法结构相似性指数(SSIM),所提方法在2个数据集上的平均PLCC和平均SRCC分别提高了9.52%和8.7%;相较于最新评价方法多感知特征图像质量评价(MPFIQA),所提方法在2个数据集上的平均PLCC和平均SRCC分别提高了1.71%和1.44%。 展开更多
关键词 全景图像 无参考图像质量评价 球面均匀采样 自适应特征融合 等距柱状投影
在线阅读 下载PDF
基于无监督学习的岩体孔壁全景展开图像拼接方法
6
作者 肖宇 李泽昊 王超 《工矿自动化》 北大核心 2025年第5期80-86,共7页
岩体孔壁全景展开图像拼接时采用传统方法时存在相邻图像间建立特征对应关系的鲁棒性不足,提取的图像特征点质量差、数量少等问题,采用有监督学习方法无法获取足够精确标注的匹配点对。针对上述问题,提出了一种基于无监督学习的岩体孔... 岩体孔壁全景展开图像拼接时采用传统方法时存在相邻图像间建立特征对应关系的鲁棒性不足,提取的图像特征点质量差、数量少等问题,采用有监督学习方法无法获取足够精确标注的匹配点对。针对上述问题,提出了一种基于无监督学习的岩体孔壁全景展开图像拼接方法。通过基于分组卷积改进的ResNet网络对相邻2幅待拼接的岩体孔壁全景展开图像进行多尺度特征提取;引入匹配度交叉相关计算模块识别和对齐特征图中的特征,进而确定对应特征图间的空间关系;通过全局和局部变形偏移量计算网络模块对图像进行精确的空间特征对齐;通过单应性变形模块与图像网格变形模块,有效消除相邻图像间的特征变形,实现图像间的整体对齐和精细的局部调整,精准配准局部特征和变形。实验结果表明:该方法能有效克服图像特征偏移、内容错位、细节特征丢失和拼接失败等问题,拼接处几乎没有明显的拼接痕迹,提高了拼接图像的整体质量和视觉效果;在均方根误差(RMSE)、重叠区域的峰值信噪比(PSNR)和结构相似性(SSIM)指标上均优于其他主流的图像拼接方法,显著提升了岩体孔壁全景展开图像拼接精度。 展开更多
关键词 岩体孔壁全景展开图像 图像拼接 无监督学习 全局和局部变形偏移量 单应性变形
在线阅读 下载PDF
基于曲面反射的单相机全景三维数字图像相关法
7
作者 马衍成 温清凤 +3 位作者 隋顺顺 陈俣泽 王亚琪 代祥俊 《光学精密工程》 北大核心 2025年第15期2478-2490,共13页
提出一种单相机双棱镜全景三维数字图像相关法,以实现360°表面变形测量,并验证其在圆管内表面形貌测量及管道缺陷检测中的有效性和实用性。首先,采用单相机结合双棱镜的光学系统,通过成一定角度摆放的两块棱镜折射光线,使单相机同... 提出一种单相机双棱镜全景三维数字图像相关法,以实现360°表面变形测量,并验证其在圆管内表面形貌测量及管道缺陷检测中的有效性和实用性。首先,采用单相机结合双棱镜的光学系统,通过成一定角度摆放的两块棱镜折射光线,使单相机同时捕获左右视角图像,达到双相机的成像效果。然后,利用凸面镜反射实现全景观测,覆盖待测内表面360°范围。最后,对采集的图像进行数字图像相关计算和坐标变换,重建三维形貌及变形场。结果表明,形貌测量的最大绝对误差为0.4 mm,大部分位置的最大绝对误差在0.1 mm以内。本文方法测量的应变与应变仪结果相比,最大相对误差为3.86%。本文通过光学设计简化了系统结构,实现了高精度管道内表面变形测量,具备一定的准确性与实用性。 展开更多
关键词 全景测量 数字图像相关 单相机 内表面变形
在线阅读 下载PDF
基于深度神经网络的铁路隧道全景图像拼接算法与应用
8
作者 陈晓冈 《中国铁路》 北大核心 2025年第8期53-58,共6页
铁路隧道是铁路线路的关键组成部分,维持隧道环境的安全和稳定对保障列车正常运行具有重大意义。在铁路隧道的安全监测中,图像数据的分析和处理占据重要地位,研究提出一种基于深度神经网络的铁路隧道全景图像拼接算法,将多张具有重叠区... 铁路隧道是铁路线路的关键组成部分,维持隧道环境的安全和稳定对保障列车正常运行具有重大意义。在铁路隧道的安全监测中,图像数据的分析和处理占据重要地位,研究提出一种基于深度神经网络的铁路隧道全景图像拼接算法,将多张具有重叠区域的图像拼接成大视场全景图。该算法通过将原始图像与蒙版相结合构建无先验信息子图数据集,训练深度神经网络学习最优参数,获得最优单应矩阵计算方法,并利用单应矩阵进行图像配准。此外,通过Voronoi规划寻找最佳拼接缝,并利用曝光补偿算法消除拼接图像亮度差异。在实际隧道数据集上,算法的性能指标RMSE、PSNR和SSIM分别达到2.94、26.59和0.806,均优于其他图像拼接算法,表明算法的有效性。 展开更多
关键词 铁路隧道 图像拼接 深度神经网络 全景图像 拼接算法
在线阅读 下载PDF
融合显著视口提取与跨层注意力的全景图像质量评价方法
9
作者 林恒 纪庆革 《计算机科学》 北大核心 2025年第9期249-258,共10页
全景图像作为沉浸式多媒体的重要内容形式,提供360度水平和180度垂直视角的视觉体验,直接影响用户在虚拟现实(Virtual Reality,VR)中的沉浸感。为解决全景图像质量评价中投影失真和多尺度特征利用不充分的问题,提出了一种显著视口注意... 全景图像作为沉浸式多媒体的重要内容形式,提供360度水平和180度垂直视角的视觉体验,直接影响用户在虚拟现实(Virtual Reality,VR)中的沉浸感。为解决全景图像质量评价中投影失真和多尺度特征利用不充分的问题,提出了一种显著视口注意力网络(Salient Viewport Attention Network,SVA-Net)。该网络由显著性引导的视口提取模块、跨层注意力依赖模块和多通道融合回归模块组成,旨在缓解投影失真问题,同时高效提取多尺度特征并增强特征表达能力。实验结果表明,SVA-Net在两个公开数据集上相比现有方法,在图像质量预测精度上有显著提升,并展示了良好的泛化能力。该方法通过结合显著视口采样和跨层注意力机制,增强了特征表示,提升了全景图像质量评价的准确性,预测结果更接近人类主观评价。 展开更多
关键词 全景图像 客观图像质量评价 交叉注意力 显著性增强 跨层注意力
在线阅读 下载PDF
PanoLoRA:基于Stable Diffusion的全景图像生成的高效微调方法
10
作者 叶文龙 陈斌 《图学学报》 北大核心 2025年第5期980-989,共10页
全景图像能表达周围环境整体的信息,已成为构建虚拟场景的重要表达方式之一。但在人工智能生成内容(AIGC)技术,尤其是大规模文本-图像数据集上训练的扩散模型和高效参数微调技术(PEFT)兴起的浪潮中,全景图像的生成和快速迁移的研究却尚... 全景图像能表达周围环境整体的信息,已成为构建虚拟场景的重要表达方式之一。但在人工智能生成内容(AIGC)技术,尤其是大规模文本-图像数据集上训练的扩散模型和高效参数微调技术(PEFT)兴起的浪潮中,全景图像的生成和快速迁移的研究却尚不充分。因此,针对全景图像数据集稀少、空间失真的特点,收集了一个总计14000张的开源全景图像数据集,通过投影转换对其进行了精细化的文本标注与筛选,在此基础上,提出了PanoLoRA方法。该方法在原有的卷积和自注意力模块提取空间特征的过程中,额外添加了球面卷积和LoRA模块,显式地提取全景图像球面特征,并与原有平面特征相融合,从而在保留了Stable Diffusion原有的强大图文生成能力的同时,实现了全景图像生成的高效迁移学习。实验结果表明,PanoLoRA在所收集到的文本-全景图像数据集上与最新的5种参数高效微调方法进行了比较,并取得了全面的优势,提高了图像生成的质量和图文一致性,并进行了一系列消融实验,验证了每个算法模块的有效性。 展开更多
关键词 扩散模型 全景图像 参数高效微调 迁移学习 LoRA
在线阅读 下载PDF
基于全景展开图像的水工隧洞渗水侵蚀病害快速检测方法研究 被引量:1
11
作者 傅金阳 王浩宇 +3 位作者 谢纪辰 祝志恒 张聪 伍军 《隧道建设(中英文)》 CSCD 北大核心 2024年第10期1971-1981,共11页
为解决水工隧洞尺寸较小、断面形式多变、洞内环境复杂、无信号覆盖给检测图像快速采集带来的难题,研制出一种无信号覆盖下图像实时传输以及适用于不同断面、尺寸下隧洞全断面采集的水工隧洞检测系统,采集重叠率和精度满足三维重建及对... 为解决水工隧洞尺寸较小、断面形式多变、洞内环境复杂、无信号覆盖给检测图像快速采集带来的难题,研制出一种无信号覆盖下图像实时传输以及适用于不同断面、尺寸下隧洞全断面采集的水工隧洞检测系统,采集重叠率和精度满足三维重建及对自主研发的衬砌展开影像生成器的要求;针对隧洞表观病害传统算法速度慢、精度低等问题,引入DenseNet主干网络和ECA注意力机制对YOLOv5检测算法进行改进,优化特征提取能力;针对单张图像识别难以反映病害整体分布、全景展开图尺寸过大网络难以捕获有效特征等问题,以全景展开图底层图像为种子点,利用方向搜索结合目标检测算法提出一种“段-环-点”的隧洞常见表观病害快速识别算法。现场应用表明:1)相比YOLOv7-tiny、YOLOv8、YOLOv9等模型,改进的YOLOv5模型在mAP和F 1上均有明显提高,可有效提升复杂背景下病害识别与边界定位精度,显著减少误检和漏检现象;2)所提技术适用于圆涵、箱涵等不同类型、尺寸的水工隧洞表观图像快速获取与全景识别,能够用于隧洞表观病害的展示和快速定位,可为病害整治措施的及时制定提供依据。 展开更多
关键词 水工隧洞 图像采集 全景展开图拼接 快速检测 精确定位 YOLOv5检测算法 DenseNet主干网络
在线阅读 下载PDF
面向360度全景图像显著目标检测的相邻协调网络
12
作者 陈晓雷 王兴 +1 位作者 张学功 杜泽龙 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第12期4529-4541,共13页
为解决360°全景图像显著目标检测(SOD)中的显著目标尺度变化和边缘不连续、易模糊的问题,该文提出一种基于相邻协调网络的360°全景图像显著目标检测方法(ACoNet)。首先,利用相邻细节融合模块获取相邻特征中的细节和边缘信息,... 为解决360°全景图像显著目标检测(SOD)中的显著目标尺度变化和边缘不连续、易模糊的问题,该文提出一种基于相邻协调网络的360°全景图像显著目标检测方法(ACoNet)。首先,利用相邻细节融合模块获取相邻特征中的细节和边缘信息,以促进显著目标的精确定位。其次,使用语义引导特征聚合模块来聚合浅层特征和深层特征之间不同尺度上的语义特征信息,并抑制浅层特征传递的噪声,缓解解码阶段显著目标与背景区域不连续、边界易模糊的问题。同时构建多尺度语义融合子模块扩大不同卷积层的多尺度感受野,实现精确训练显著目标边界的效果。在2个公开的数据集上进行的大量实验结果表明,相比于其他13种先进方法,所提方法在6个客观评价指标上均有明显的提升,同时主观可视化检测的显著图边缘轮廓性更好,空间结构细节信息更清晰。 展开更多
关键词 显著目标检测 深度学习 360°全景图像 多尺度特征
在线阅读 下载PDF
基于图像绘制的球面全景图生成及自动拼接技术研究 被引量:16
13
作者 华顺刚 张静 欧宗瑛 《大连理工大学学报》 EI CAS CSCD 北大核心 2003年第5期640-644,共5页
提出了一种基于球面投影模型的全景图像自动拼接算法,对手持相机获得的系列照片,构建了球面全景图像.使用等距离匹配算法计算相机的焦距,以相机焦距作为球体半径,将照片图像投影至球面上.两张相邻照片拼接时,以照片的投影图像最大宽度... 提出了一种基于球面投影模型的全景图像自动拼接算法,对手持相机获得的系列照片,构建了球面全景图像.使用等距离匹配算法计算相机的焦距,以相机焦距作为球体半径,将照片图像投影至球面上.两张相邻照片拼接时,以照片的投影图像最大宽度处一个像素对应的角度(弧度)为步长,从两图像中心处开始,取一定宽度的图像块进行匹配,找到两相邻照片最佳的拼接(经度)线,实现相邻两照片的自动拼接.将系列图像的拼接结果整合,得到360°视角的全景图像;然后进行上下层全景图像的拼接,生成全视角球面全景图,效果较好. 展开更多
关键词 球面全景 自动生成 自动拼接 图像绘制 等距离匹配算法 照片图像 虚拟现实
在线阅读 下载PDF
级联式生成对抗网络的全景图像修复 被引量:1
14
作者 徐嘉悦 赵建平 +3 位作者 李冠男 韩成 李华 徐超 《重庆理工大学学报(自然科学)》 CAS 北大核心 2024年第8期154-163,共10页
为了解决全景图像视场宽、畸变显著等问题,提出了一种级联式生成对抗网络的全景图像修复算法。第一阶段提出了一种双判别器生成对抗网络,通过对等矩形格式的全景图像进行立方体投影转换,对立方体六面图像进行修复,引入PatchGAN作为全局... 为了解决全景图像视场宽、畸变显著等问题,提出了一种级联式生成对抗网络的全景图像修复算法。第一阶段提出了一种双判别器生成对抗网络,通过对等矩形格式的全景图像进行立方体投影转换,对立方体六面图像进行修复,引入PatchGAN作为全局判别器捕获细节信息,局部判别器网络可以保证局部修复结果与周围区域的一致性。第二阶段提出了一种失真感知生成对抗网络,通过矩形混合卷积缓解全景图像失真,判别器引入谱归一化,与第一阶段进行级联以缓解立方体图像边界不连续问题,设计联合损失函数以优化网络修复效果。实验结果表明,所提算法无论从主观视觉评价或是从客观评价指标上均取得了优秀的效果,实现全景图像的有效修复。 展开更多
关键词 全景图像 图像修复 生成对抗网络 双判别器 投影转换 混合卷积
在线阅读 下载PDF
基于几何透视图像预处理和CNN的全景图像交通标志识别算法 被引量:2
15
作者 曹峻凡 张向利 +1 位作者 闫坤 张红梅 《计算机应用与软件》 北大核心 2024年第7期171-176,共6页
为解决深度学习方法在高清全景图像中检测交通标志遇到图形处理器资源不足、小目标容易漏检、检测速度过慢等问题,采用小目标过采样训练数据生成方法、图像分块和几何透视检测预处理方法以及改进的轻量神经网络Improved-Tiny-YOLOv3,提... 为解决深度学习方法在高清全景图像中检测交通标志遇到图形处理器资源不足、小目标容易漏检、检测速度过慢等问题,采用小目标过采样训练数据生成方法、图像分块和几何透视检测预处理方法以及改进的轻量神经网络Improved-Tiny-YOLOv3,提出了一种基于深度学习的轻量级全景图像中交通标志检测方法。并在Tsinghua-Tencent 100K数据集上进行了实验,mAP值达到92.7%,在Nvidia 1080Ti显卡上检测速度可达到20 FPS,实验结果验证了所提方法的有效性。 展开更多
关键词 交通标志检测识别 Improved-Tiny-YOLOv3 几何透视法 随机裁剪 CIoU 全景图像
在线阅读 下载PDF
全景分割与多视觉特征协同的图像描述生成方法 被引量:2
16
作者 刘明明 陆劲夫 +1 位作者 刘浩 张海燕 《计算机工程》 CAS CSCD 北大核心 2024年第11期308-317,共10页
现有基于Transformer架构的图像描述生成模型取得了较好的泛化性能,然而,大多数方法通常使用区域视觉特征进行编解码,导致无法全面利用整幅图像的细粒度信息,且存在视觉特征混淆问题。为此,将全景分割引入图像描述生成过程,使用基于全... 现有基于Transformer架构的图像描述生成模型取得了较好的泛化性能,然而,大多数方法通常使用区域视觉特征进行编解码,导致无法全面利用整幅图像的细粒度信息,且存在视觉特征混淆问题。为此,将全景分割引入图像描述生成过程,使用基于全景分割的掩膜视觉特征代替区域视觉特征,提出一种全景分割与多视觉特征协同的图像描述生成方法。该方法不仅可以有效解耦视觉表征,而且能够充分结合掩膜视觉特征和网格视觉特征的优势,提升图像描述生成的可解释性和描述性能。在MSCOCO标准数据集上进行定量和定性实验,结果表明,所提方法不仅可以显著提升现有模型的性能,同时能够增强图像描述生成过程的可解释性,CIDEr和BLEU-4指标分别达到138.5和41。 展开更多
关键词 图像理解 图像描述生成 全景分割 特征融合 视觉编码
在线阅读 下载PDF
基于全景展开图像的隧道围岩节理识别方法 被引量:2
17
作者 方星桦 阳军生 +2 位作者 黄定著 詹双桥 张聪 《长江科学院院报》 CSCD 北大核心 2024年第5期116-123,共8页
为了解决目前节理信息识别方法仅适用于局部岩体图像的问题,采用全景展开图像方法,将采集到的局部洞壁围岩图像进行特征点提取、点云模型重建、矫正拼接处理,获得高分辨率的隧道洞壁围岩全景展开图像。通过图像预处理、小尺寸特征图片的... 为了解决目前节理信息识别方法仅适用于局部岩体图像的问题,采用全景展开图像方法,将采集到的局部洞壁围岩图像进行特征点提取、点云模型重建、矫正拼接处理,获得高分辨率的隧道洞壁围岩全景展开图像。通过图像预处理、小尺寸特征图片的smaAt-Unet神经网络识别、小尺寸图片识别结果的融合拼接,对洞壁围岩全景展开图像的节理信息进行了区域粗略分割识别。采用Zhang-Suen算法和8邻域连通域分析方法,从骨架化与骨架线分离、毛刺剔除、骨架线连接方面进行了算法分析计算,完成了节理信息的细化提取。对体积节理数和节理空间产状信息进行了量化分析,最终建立了一种基于全景展开图像的隧道洞壁围岩节理信息识别方法。工程应用结果表明,洞壁围岩全景展开图像识别后,节理面空间方程的平均拟合误差为0.90,说明该识别方法能够较好地识别全景展开图像中的节理信息。另外,洞壁围岩图像采集具有时间短、易操作、灵活性较高的优点,对现场施工影响较小,该识别方法能够较为快速地完成节理信息识别,给现场施工与动态设计提供参考。 展开更多
关键词 隧道 洞壁围岩 全景展开图像 smaAt-Unet神经网络 节理识别
在线阅读 下载PDF
基于高光谱图像处理的陕西西安白杨寨晚唐墓M1373壁画颜料层研究
18
作者 严静 唐兴佳 +5 位作者 贺章 王曾 陈爱东 张朋昌 董文强 高婧威 《光谱学与光谱分析》 北大核心 2025年第4期1036-1044,共9页
2022年11月出土于陕西西安白杨寨晚唐墓M1373是一项保存较好的晚唐墓葬遗产,其多彩多姿的墓葬壁画对于研究晚唐时期的祭祀、礼仪、音乐、服饰、艺术等具有重要意义,特别是为研究唐宋之际的壁画风格题材转变提供了直接材料。然而,由于年... 2022年11月出土于陕西西安白杨寨晚唐墓M1373是一项保存较好的晚唐墓葬遗产,其多彩多姿的墓葬壁画对于研究晚唐时期的祭祀、礼仪、音乐、服饰、艺术等具有重要意义,特别是为研究唐宋之际的壁画风格题材转变提供了直接材料。然而,由于年代久远,该壁画颜料层依旧出现了许多典型病害,如颜料脱落、起甲、泥水污染等,加之后续揭取会给壁画颜料层带来人为干预,这会使得壁画信息受到一定影响。为此,利用高光谱成像技术在壁画揭取之前进行一体化图谱信息获取,而后采用光谱分析与高光谱图像处理技术对壁画表面颜料层进行分析,并以乐舞图为例,研究该壁画绘制的颜料与工艺。实验结果表明:该壁画红色、黄色、绿色等颜料采用了传统的赭石、土黄/石黄、石绿等矿物颜料,且在绘制地毯花卉时,红色颜料和绿色颜料被大量稀释使用,而黄色颜料使用并不明显;壁画绘制时用墨色或硬笔起底稿,用红线勾勒,底稿线与表层勾勒线大多存在偏移,且有些区域勾勒线与底稿线偏移较严重,说明起稿和定稿之间有一定的改动;同时,部分区域底稿线较为明显,部分区域则不太清晰,通过高光谱图像处理方法,发现了隐藏于颜料层表面或勾线之下的起稿线;该壁画主要采用了分布式非重叠二维直视的画面布局方式,空间立体感稍差,但对于乐手手指和乐笛交汇的多个位置,有的出现了前景与背景图案非重叠的二维直视绘制方式,有的出现了少量前景与背景图案重叠的二维透视绘制方式,说明该壁画在绘制前和绘制时进行较好的布局设计,且未出现明显的涂改。此外,还发现该壁画存在一些隐藏的污水污染病害。上述研究为该壁画的现场保护方案制定和后续研究与保护修复等提供了数据资料、研究方法和初步结论支撑。 展开更多
关键词 唐墓壁画 光谱分析 高光谱图像处理 壁画颜料层 壁画绘制工艺
在线阅读 下载PDF
基于多深度狭缝图像全景拼图的场景绘制 被引量:2
19
作者 蒋纯 石教英 潘志庚 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2002年第2期162-165,共4页
提出一种基于多个深度狭缝图像全景拼图的新的基于图像的绘制方法 ,可以进行大范围的基于图像绘制。本文首先介绍了深度狭缝图像和深度狭缝图像全景拼图的概念 ,在假设相机仅作平面移动的情况下 ,描述了利用深度狭缝图像生成原视点附近... 提出一种基于多个深度狭缝图像全景拼图的新的基于图像的绘制方法 ,可以进行大范围的基于图像绘制。本文首先介绍了深度狭缝图像和深度狭缝图像全景拼图的概念 ,在假设相机仅作平面移动的情况下 ,描述了利用深度狭缝图像生成原视点附近的近似场景和在多个深度狭缝图像全景拼图间作平滑切换的算法 ,并给出了从采样到绘制的实现。该方法具有采样简单 ,虚拟场景真实感强 ,支持连续大范围漫游的特点。文中给出了具体算法和实验结果 。 展开更多
关键词 基于图像绘制技术 全景 深度狭缝图像全景拼图 场景绘制 图像整合 虚拟漫游场景
在线阅读 下载PDF
利用分层深度全景图实现基于图像的绘制 被引量:2
20
作者 李新肖 郑南宁 乔瑛 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2000年第1期43-47,共5页
提出一个快速绘制的IBR新方法,它用分层深度全景图(LDP)作为三维模型的中间表示,通过LDP的重投影变换快速生成新的视图.LDP可以看作物体的一个全景视图,但在每个视线方向有多个不同深度的象素.当用n 个平面投影图... 提出一个快速绘制的IBR新方法,它用分层深度全景图(LDP)作为三维模型的中间表示,通过LDP的重投影变换快速生成新的视图.LDP可以看作物体的一个全景视图,但在每个视线方向有多个不同深度的象素.当用n 个平面投影图像建立LDP时,它的数据量不是取决于采样图像的数量,而是取决于物体表面的复杂性.由于LDP可以看作一个独立的图像坐标框架,McMillan 的顺次扫描重投影算法能够用于LDP中,避免了Z-缓冲或深度比较过程. 展开更多
关键词 全景 深度图像 图像变形 图形绘制
在线阅读 下载PDF
上一页 1 2 29 下一页 到第
使用帮助 返回顶部