期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
多频Transformer引导图聚合视网膜图像质量分级算法
1
作者 梁礼明 钟奕 +1 位作者 王成斌 康婷 《光电工程》 北大核心 2025年第6期109-124,共16页
针对视网膜图像质量分级任务中各等级样本数量差异大和分级效率不高的问题,提出一种多频Transformer引导图聚合视网膜图像质量分级算法。该算法首先对图像采取对比度受限直方图均衡化操作,突出关键细节特征,并采取Res Net50网络进行多... 针对视网膜图像质量分级任务中各等级样本数量差异大和分级效率不高的问题,提出一种多频Transformer引导图聚合视网膜图像质量分级算法。该算法首先对图像采取对比度受限直方图均衡化操作,突出关键细节特征,并采取Res Net50网络进行多级特征提取。然后设计频率通道重组Transformer模块,引入频域信息辅助建模全局特征,以优化全局与局部特征。随后构建图交叉特征聚合模块,采用跨尺度交叉注意力机制引导图聚合,实现不同源特征对齐,进而增强模型对多层次特征敏感性。最后搭建加权损失函数,聚焦模型对少数类样本关注度。在Eye-Quality和RIQA-RFMiD数据集上进行实验验证,其准确率分别为88.71%和84.95%,精确率分别为87.78%和74.22%。实验结果表明,所提算法在视网膜图像质量评估领域具有一定应用价值。 展开更多
关键词 视网膜图像质量分级 频率通道重组Transformer模块 图交叉特征聚合模块 加权损失
在线阅读 下载PDF
基于CABFAM-Transformer的输电线路在线测距实测行波预分类方法
2
作者 唐玉涛 束洪春 +3 位作者 刘皓铭 苏萱 韩一鸣 代月 《电工技术学报》 北大核心 2025年第5期1455-1470,共16页
行波采集装置是电力系统保护与测距的重要设备,广泛应用于110 kV及以上输电线路,且正向配电网延拓。由于启动灵敏,非故障信息的采集给故障辨识与行波测距带来了挑战。该文提出了一种基于卷积注意力机制的特征聚合模块(CABFAM)与自适应Tr... 行波采集装置是电力系统保护与测距的重要设备,广泛应用于110 kV及以上输电线路,且正向配电网延拓。由于启动灵敏,非故障信息的采集给故障辨识与行波测距带来了挑战。该文提出了一种基于卷积注意力机制的特征聚合模块(CABFAM)与自适应Transformer模型的输电线路实测故障性质识别方法。首先,通过CBAM机制增强卷积层提取特征信息的表达与理解能力;然后,构建自适应编码层级调整机制的Transformer模型库,以获取多层次差异化特征信息;最后,利用云南电网110~220 kV输电线路的5076条实测数据及220 kV DL站H-P线的15924条伪实测数据进行训练与测试,针对16种典型行波数据进行分类。测试结果表明,该方法降低了模型参数量,提高了准确度,算法的多个关键指标均有不同幅度的提升,表现出优异的检测精度与识别效率。 展开更多
关键词 行波采集装置 基于卷积注意力机制的特征聚合模块 CABFAM 自适应Transformer 实测数据故障辨识
在线阅读 下载PDF
特征自适应融合插值的点云语义分割算法 被引量:2
3
作者 朱芬芬 王蕾 刘华 《现代电子技术》 2023年第12期175-181,共7页
点云语义分割是场景理解的基础问题。大多数针对大场景点云的语义分割方法精心设计局部特征聚合模块以减少降采样点云过程中的信息损失,然而未能高效地利用多尺度局部特征推理点云语义信息。为此,文中提出一种多尺度特征自适应融合的插... 点云语义分割是场景理解的基础问题。大多数针对大场景点云的语义分割方法精心设计局部特征聚合模块以减少降采样点云过程中的信息损失,然而未能高效地利用多尺度局部特征推理点云语义信息。为此,文中提出一种多尺度特征自适应融合的插值方法,以实现更准确的大场景点云语义分割算法。首先,通过注意力机制的局部特征聚合模块学习点云内部的语义关系,描述局部模式的各项异性;然后,以不同的采样率随机地采样点云产生多尺度的稀疏局部特征图;最后,使用特征自适应融合的插值法代替广泛使用的最近邻插值法,恢复全分辨率的特征图,为原始密度的点云提供更准确的语义信息。在SemanticKITTI和S3DIS两个大场景点云数据集上对所提算法进行评估,结果表明,所提算法的平均交并比(mIoU)分别为54.24%、75.5%,平均准确率(mACC)分别达到88.92%、86.5%,比大多数主流算法的分割效果更加准确。 展开更多
关键词 点云语义分割 注意力机制 自适应融合插值 局部特征聚合模块 深度学习 随机降采样
在线阅读 下载PDF
基于光场EPI图像栈的6D位姿估计方法 被引量:3
4
作者 李扬 张旭东 +1 位作者 孙锐 范之国 《电子测量与仪器学报》 CSCD 北大核心 2023年第4期122-130,共9页
光场相机单次拍摄可以同时记录光线的强度与方向信息,相较于RGB相机能够更好地揭示场景的三维结构和几何特征,在目标6D位姿估计领域具有独特优势。针对现有RGB位姿估计方法存在复杂场景下检测精度低、鲁棒性差的问题,本文首次提出了一... 光场相机单次拍摄可以同时记录光线的强度与方向信息,相较于RGB相机能够更好地揭示场景的三维结构和几何特征,在目标6D位姿估计领域具有独特优势。针对现有RGB位姿估计方法存在复杂场景下检测精度低、鲁棒性差的问题,本文首次提出了一种基于光场图像的端到端卷积神经网络目标位姿估计方法。该方法首先利用双路EPI编码模块实现高维光场数据的处理,通过重构出光场EPI图像栈和引入水平和垂直EPI卷积算子,提高对光场空间角度信息关联的建模能力,并由双分支孪生网络进行光场图像的浅层特征提取。其次,设计了带跳跃连接的特征聚合模块,对串联后的水平和垂直方向光场EPI浅层特征进行全局上下文聚合,使网络在逐像素关键点位置预测时有效结合全局和局部特征线索。针对光场数据不足问题,本文使用Lytro Illum光场相机采集真实场景,构建了一个丰富且场景复杂的光场位姿数据集——LF-6Dpose。在光场位姿数据集LF-6Dpose上的实验结果表明,该方法在ADD-S和2D Projection指标下平均位姿检测精度分别为57.61%和91.97%,超越了其他基于RGB的先进方法,能够更好地解决复杂场景下的目标6D位姿估计问题。 展开更多
关键词 光场 6D位姿估计 光场位姿数据集 EPI图像栈 特征聚合模块 关键点
在线阅读 下载PDF
基于循环生成对抗网络的人脸素描合成 被引量:3
5
作者 葛延良 孙笑笑 +2 位作者 张乔 王冬梅 王肖肖 《吉林大学学报(理学版)》 CAS 北大核心 2022年第4期897-905,共9页
针对当前卷积神经网络通常以降低感受野为条件获得多尺度图像特征,以及很难捕获各特征通道之间重要关系的问题,结合循环生成对抗网络结构的特点提出一种新的多尺度自注意力机制的循环生成对抗网络.首先,在生成器中使用VGG16模块组成U-Ne... 针对当前卷积神经网络通常以降低感受野为条件获得多尺度图像特征,以及很难捕获各特征通道之间重要关系的问题,结合循环生成对抗网络结构的特点提出一种新的多尺度自注意力机制的循环生成对抗网络.首先,在生成器中使用VGG16模块组成U-Net结构网络,以增强对图像特征信息的提取,同时对网络中的下采样和上采样进行改进,以提高特征分辨率,获取更多的细节信息;其次,设计多尺度特征聚合模块,采用不同采样率的多个并行空洞卷积,整合了不同尺度上的空间信息,在保持图像较大感受野的同时,多比例地捕捉图像信息;最后,为捕获空间维度和通道维度中的特征依赖关系,设计像素自注意力模块对空间维度和通道维度上的语义依赖关系进行建模,以增强图像特征的表现能力,提高生成素描图像的质量. 展开更多
关键词 深度学习 循环生成对抗网络 空洞卷积 多尺度特征聚合模块 像素自注意力模块
在线阅读 下载PDF
基于退钻过程检测的矿井下钻杆计数方法研究
6
作者 胡玮 王满利 +2 位作者 张长森 田子建 张善文 《煤炭学报》 2025年第S1期697-707,共11页
针对现有的矿井下钻杆计数方法存在误检率较高、效率较低的问题,设计一种特征编码式计数方法,其主要通过对钻机退钻过程检测结果的分析处理,统计实际打入的钻杆数量,可以有效提高计数的准确性及工作效率。由于矿井下的环境十分复杂,由... 针对现有的矿井下钻杆计数方法存在误检率较高、效率较低的问题,设计一种特征编码式计数方法,其主要通过对钻机退钻过程检测结果的分析处理,统计实际打入的钻杆数量,可以有效提高计数的准确性及工作效率。由于矿井下的环境十分复杂,由视频监控获取到的图像易受噪声、灯光等因素的影响,造成现有的目标检测算法存在特征提取困难和识别率低等问题。并且,这些算法模型复杂度高且计算量大,不利于在边缘端进行部署。针对这些问题,提出一种基于YOLOv8n改进的钻机退钻过程检测算法,称为YOLOv8n–SDM。首先,设计新的空间金字塔池化模块来增强模型的特征提取能力,同时降低矿井下复杂背景对退钻检测的干扰;然后,提出具有2种变换结构的特征聚合模块,替换原模型中的C2f模块,其在获取丰富的特征信息的同时有效降低模型的复杂度与计算量;最后,为进一步提升模型对不规则特征的辨识能力,设计了一种多尺度融合探测头来提高模型对钻机等目标的识别率。实验结果表明:改进后的YOLOv8n–SDM算法和原YOLOv8n算法相比,精度、召回率、mAP@0.5以及mAP@0.5–0.95值分别提升了2.7%、2.6%、2.2%以及1%,模型参数量、占用存储空间和GFLOPs值分别降低了32.2%、30.2%和31.7%。相较主流算法能够在复杂的矿井场景下实现更精准的钻机退钻过程检测,满足实际部署和应用的需求。 展开更多
关键词 钻杆计数 钻机退钻过程检测 YOLOv8n 特征聚合模块 多尺度融合探测头
在线阅读 下载PDF
改进YOLO11的高精度课堂行为检测算法
7
作者 曹燚 曹倩 +1 位作者 钱承山 袁程胜 《计算机科学与探索》 2025年第8期2135-2148,共14页
针对课堂场景中学生目标小、分布密集且易被遮挡,导致检测精度低、识别效果不佳的问题,提出了一种基于YOLO11改进的课堂行为检测算法MFD-YOLO。该算法通过一系列创新设计,显著提升了课堂行为检测的精度和识别效果。设计了多维度特征流... 针对课堂场景中学生目标小、分布密集且易被遮挡,导致检测精度低、识别效果不佳的问题,提出了一种基于YOLO11改进的课堂行为检测算法MFD-YOLO。该算法通过一系列创新设计,显著提升了课堂行为检测的精度和识别效果。设计了多维度特征流动网络(MFFN),通过结合维度感知选择性融合模块和多维特征扩散机制,增强了小目标的特征表示能力,显著提高了检测精度。在主干网络中构建了特征增强聚合模块(FEAM),通过整合不同尺度感受野的信息来优化特征提取过程,增强了网络对多尺度特征的增强与聚合能力,从而提高了对密集学生群体的检测能力。将传统检测头改进为动态检测头(DyHead),通过增强多尺度感知能力,有效提升了对被遮挡学生的识别能力,减少了误检和漏检现象。实验结果表明,与基础模型YOLO11n相比,MFD-YOLO在POCO数据集上的mAP0.50和mAP0.50:0.95分别提高了4.2和6.0个百分点,显著提升了检测精度,并有效降低了误检和漏检率;在SCB-Dataset3数据集上,mAP0.50和mAP0.50:0.95分别提高了3.4和4.4个百分点,进一步验证了改进算法的适用性和鲁棒性,证明了其在课堂行为检测中的应用潜力。 展开更多
关键词 课堂行为检测 高精度 YOLO11 多维度特征流动网络(MFFN) 特征增强聚合模块(FEAM)
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部