期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
CNN结合Transformer的高光谱图像和LiDAR数据协同地物分类方法
1
作者 吴海滨 左云逸 +2 位作者 王爱丽 吕浩然 王敏慧 《仪器仪表学报》 北大核心 2025年第8期286-301,共16页
在高光谱图像与LiDAR数据协同分类的研究领域中,尽管CNN和Transformer在图像处理和数据分析中分别展现出对局部特征和全局依赖关系的敏锐洞察力,但二者的协同机制尚未充分挖掘,跨模态特征互补潜力未被有效释放。故提出了一种CNN结合Tran... 在高光谱图像与LiDAR数据协同分类的研究领域中,尽管CNN和Transformer在图像处理和数据分析中分别展现出对局部特征和全局依赖关系的敏锐洞察力,但二者的协同机制尚未充分挖掘,跨模态特征互补潜力未被有效释放。故提出了一种CNN结合Transformer的高光谱图像和LiDAR数据的多模态遥感数据协同地物分类方法。首先,该模型通过主成分分析对高光谱图像进行降维处理以去除光谱的冗余信息,继而利用CNN分层捕获局部纹理特征,同时借助Transformer自注意力机制构建全局光谱-空间表征。然后通过双向特征交互机制,将Transformer输出的全局上下文信息注入CNN特征通道,同时将CNN通道提取的局部细节反馈至Transformer支路,经特征耦合单元实现跨尺度特征对齐,强化模型对高光谱图像全局结构与局部细节的联合提取能力。对于LiDAR数据,采用动态卷积级联模块有效捕获高程信息和上下文关系,最终通过跨模态特征融合模块实现双源数据特征的深度交互与融合,在双模态语义互补中提升复杂地物的分类精度。在Houston2013、Trento和Augsburg这3个公开数据集上的实验表明,该方法总体分类精度分别达到99.85%、99.68%和97.34%,平均准确率分别达到99.87%、99.34%和90.60%,较GLT、HCT等主流方法的分类精度有所提高,充分证明所提方法进行多模态数据协同分类的优势和有效性。 展开更多
关键词 高光谱图像 LIDAR数据 TRANSFORMER 卷积神经网络 多模态数据
在线阅读 下载PDF
结合高效注意力机制的神经架构搜索高光谱图像分类
2
作者 陈海松 张康 +2 位作者 吕浩然 王爱丽 吴海滨 《液晶与显示》 北大核心 2025年第4期630-641,共12页
由于不同高光谱数据集在频带数、光谱范围和空间分辨率上存在显著差异,适用于不同高光谱数据集的最优网络结构也存在不同。此外,人工设计的深度学习网络需要调整大量的超参数,这无疑给设计一个适用于各种HSI数据集的通用分类模型带来了... 由于不同高光谱数据集在频带数、光谱范围和空间分辨率上存在显著差异,适用于不同高光谱数据集的最优网络结构也存在不同。此外,人工设计的深度学习网络需要调整大量的超参数,这无疑给设计一个适用于各种HSI数据集的通用分类模型带来了严重的挑战。本文提出了一种结合高效注意力机制的神经架构搜索算法,实现深度学习网络的自动设计以避免人工设计网络的偏差。首先,为了构建高效的搜索过程,本文构建了基于可微网络架构搜索的模型,该方法可以有效地提高超参数网络的搜索速度。然后,为了实现高精度的分类结果,本文设计了一个新型的模块化搜索空间。最后,考虑到高光谱数据集类不平衡带来的误分类问题,本文采用Poly损失函数增加少数类别的损失权重,从而提高模型对这些类别的识别能力。在公开高光谱数据集上的实验结果表明,本文方法的总体分类精度分别达到了99.50%、97.81%。本文提出的方法探索了神经架构搜索在高光谱分类任务上的应用,提高了分类精度和算法设计的效率。 展开更多
关键词 高光谱图像 图像分类 神经架构搜索 注意力机制
在线阅读 下载PDF
基于计算机视觉的人体内腔三维重建技术综述 被引量:12
3
作者 吴海滨 徐若彤 +4 位作者 王爱丽 于晓洋 岩堀祐之 赵蓝飞 刘赫 《计算机工程》 CAS CSCD 北大核心 2021年第10期1-15,共15页
医生通过内窥镜观察的人体内腔显示为二维图像,不能立体地展现内腔环境中病灶、血管及邻近组织的关系,而内腔三维重建及可视化技术能够清晰、全面地展现病灶及其他组织的三维形态,更好地辅助医生进行精准的手术判断。将人体内腔环境中... 医生通过内窥镜观察的人体内腔显示为二维图像,不能立体地展现内腔环境中病灶、血管及邻近组织的关系,而内腔三维重建及可视化技术能够清晰、全面地展现病灶及其他组织的三维形态,更好地辅助医生进行精准的手术判断。将人体内腔环境中的三维重建技术分为主动式测量方法与被动式测量方法,分类综述基于结构光、飞行时间、双目立体视觉、单目视觉的内腔三维重建技术及发展现状。针对同时定位与地图构建的内腔三维重建法,分析对比内腔环境下的特征点检测与匹配的发展、方法及特点,并对人体内腔三维重建的难点和未来发展趋势进行展望。 展开更多
关键词 内腔三维重建 结构光 飞行时间 双目立体视觉 单目视觉 特征点检测 特征点匹配
在线阅读 下载PDF
增强现实手术导航系统的投影显示技术综述 被引量:13
4
作者 吴海滨 徐恺阳 +3 位作者 于双 王爱丽 岩堀祐之 孙晓明 《光学精密工程》 EI CAS CSCD 北大核心 2021年第9期2019-2038,共20页
增强现实手术导航系统实现虚拟器官与真实场景的融合叠加显示,便于医生手术操作。综述了增强现实技术在不同临床领域中应用或研究的手术导航系统。鉴于增强现实技术为手术导航系统提供了更好的显示方式,从视频显示技术、立体显示技术和... 增强现实手术导航系统实现虚拟器官与真实场景的融合叠加显示,便于医生手术操作。综述了增强现实技术在不同临床领域中应用或研究的手术导航系统。鉴于增强现实技术为手术导航系统提供了更好的显示方式,从视频显示技术、立体显示技术和投影显示技术3种方式对术中增强现实显示技术进行分类总结。针对最有前景的投影显示技术,综述了针对解析表面和非解析表面的投影畸变校正关键技术的发展、方法及特点。最后,对投影显示技术的难点和未来发展趋势进行了展望。 展开更多
关键词 增强现实 手术导航 投影显示技术 投影畸变校正
在线阅读 下载PDF
结合空洞卷积和迁移学习改进YOLOv4的X光安检危险品检测 被引量:26
5
作者 吴海滨 魏喜盈 +3 位作者 刘美红 王爱丽 刘赫 岩堀祐之 《中国光学》 EI CAS CSCD 北大核心 2021年第6期1417-1425,共9页
由于X光安检图像存在背景复杂,重叠遮挡现象严重,危险品摆放方式、形状差异较大等问题,导致检测难度较高。针对上述问题,本文在YOLOv4的基础上,结合空洞卷积对其网络结构进行改进,加入空洞空间金字塔池化(Atrous Space Pyramid Pooling,... 由于X光安检图像存在背景复杂,重叠遮挡现象严重,危险品摆放方式、形状差异较大等问题,导致检测难度较高。针对上述问题,本文在YOLOv4的基础上,结合空洞卷积对其网络结构进行改进,加入空洞空间金字塔池化(Atrous Space Pyramid Pooling,ASPP)模型,以此增大感受野,聚合多尺度上下文信息。然后,通过K-means聚类方法生成更适合X光安检危险品检测的初始候选框。其中,模型训练时采用余弦退火优化学习率,进一步加速模型收敛,提高模型检测精度。实验结果表明,本文提出的ASPP-YOLOv4检测算法在SIXRay数据集上的mAP达到85.23%。该方法能有效减少X光安检图像中危险品的误检率,提高小目标危险品的检测能力。 展开更多
关键词 X光安检图像 YOLOv4 空洞卷积 空间金字塔池化 余弦退火
在线阅读 下载PDF
基于改进YOLO v5s算法的光伏组件故障检测 被引量:28
6
作者 孙建波 王丽杰 +1 位作者 麻吉辉 高玮 《红外技术》 CSCD 北大核心 2023年第2期202-208,共7页
针对无人机在光伏组件巡检任务中红外故障图像识别准确率低、检测速度慢的问题,提出一种特征增强的YOLO v5s故障检测算法。首先对损失函数进行优化,将原有的回归损失计算方法由GIOU(generalized intersection over union)改为功能更加... 针对无人机在光伏组件巡检任务中红外故障图像识别准确率低、检测速度慢的问题,提出一种特征增强的YOLO v5s故障检测算法。首先对损失函数进行优化,将原有的回归损失计算方法由GIOU(generalized intersection over union)改为功能更加强大的EIOU(efficient intersection over union)损失函数,并自适应调节置信度损失平衡系数,提升模型训练效果;随后,在每个检测层前分别添加InRe特征增强模块,通过丰富特征表达增强目标特征提取能力。最后,用创建的红外光伏数据集进行对比验证。实验结果表明:本文方法均值平均精度(mean average precision,mAP)为92.76%,检测速度(frame per second,FPS)达到42.37 FPS,其中热斑、组件脱落两种故障类型平均精度分别为94.85%、90.67%,完全能够满足无人机自动巡检的需求。 展开更多
关键词 故障检测 YOLO v5s EIOU 特征增强模块
在线阅读 下载PDF
双域掩码与多尺度局部重建的HSI和LiDAR数据协同分类方法
7
作者 左云逸 吴海滨 王爱丽 《红外与激光工程》 2025年第10期284-296,共13页
针对高光谱图像(Hyperspectral Images, HSI)与LiDAR数据协同分类中存在的标注成本高与精度不足的问题,提出一种基于双域掩码与多尺度局部重建的HSI-LiDAR跨模态分类方法。首先,构建包含空间和光谱分支的双分支掩码重建框架,通过掩码随... 针对高光谱图像(Hyperspectral Images, HSI)与LiDAR数据协同分类中存在的标注成本高与精度不足的问题,提出一种基于双域掩码与多尺度局部重建的HSI-LiDAR跨模态分类方法。首先,构建包含空间和光谱分支的双分支掩码重建框架,通过掩码随机图像块和通道进行特征学习。其次,设计分层多尺度局部重建结构,下层编码器学习细粒度特征,上层编码器恢复宏观语义信息。在解码阶段,采用反卷积上采样和自适应池化调整尺度,实现多层级重建目标的空间对齐,以监督编码器学习。同时,考虑到CNN优秀的局部特征提取能力,引入轻量级CNN网络提取高光谱图像的光谱-空间特征以及LiDAR数据的高程信息,形成CNN与Transformer的互补机制,能够提升模型的泛化性能。在Houston2018与Augsburg数据集上的实验表明,提出模型的总体准确率分别达到了93.09%和95.36%,相较于现有的S~2ATNet和SS-MAE等主流方法显著提升了分类准确率,验证了该方法的有效性和优越性。 展开更多
关键词 高光谱图像 LiDAR数据 自监督学习 掩码图像建模 多尺度局部重建
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部