期刊文献+
共找到199篇文章
< 1 2 10 >
每页显示 20 50 100
改进YOLOv5s的路面坑槽目标检测模型 被引量:1
1
作者 赵江平 王欣然 吴立舟 《中国安全科学学报》 北大核心 2025年第1期67-74,共8页
为提高道路安全巡检工作中路面坑槽隐患的检测效率和自动化水平,降低交通事故发生概率,构建一种基于改进YOLOv5s的路面坑槽隐患智能检测模型。在原YOLOv5s网络中加入自适应空间特征融合(ASFF)模块,将主干网络替换为FasterNet网络,引入... 为提高道路安全巡检工作中路面坑槽隐患的检测效率和自动化水平,降低交通事故发生概率,构建一种基于改进YOLOv5s的路面坑槽隐患智能检测模型。在原YOLOv5s网络中加入自适应空间特征融合(ASFF)模块,将主干网络替换为FasterNet网络,引入轻量通道注意力(ECA)模块;通过消融试验分析改进模块对检测模型性能的影响,验证目标检测效果,并开发交互式可视化检测界面。结果表明:改进后的模型精度、召回率和平均检测精度分别提升了4.1%、9.9%和5.6%。较原网络有较为显著的提升,具有良好的检测效果,能够满足路面坑槽自动化检测的应用需求,提高巡检效率,减少因路面坑槽导致的交通事故。 展开更多
关键词 YOLOv5s 路面坑槽 目标检测 自适应空间特征融合(ASFF) FasterNet
在线阅读 下载PDF
基于特征融合和增强的蚕茧图像分类模型
2
作者 刘莫尘 侯欣 +6 位作者 韦伟 张鑫山 李法德 宋占华 张桂征 梁光健 闫银发 《蚕业科学》 北大核心 2025年第1期59-67,共9页
为对原料茧中的上车茧和下茧进行准确分类,实现蚕茧分拣智能化、机械化,文中提出了一种基于多尺度特征融合和增强的双线性池化分类模型。首先以ResNet41作为特征提取骨干网络构建双线性池化模型,增强网络特征提取能力的同时得到不同维... 为对原料茧中的上车茧和下茧进行准确分类,实现蚕茧分拣智能化、机械化,文中提出了一种基于多尺度特征融合和增强的双线性池化分类模型。首先以ResNet41作为特征提取骨干网络构建双线性池化模型,增强网络特征提取能力的同时得到不同维度语义信息;然后引入自适应空间特征融合模块,融合蚕茧浅层图像信息和深层语义信息,解决ResNet41在特征提取过程中出现的信息丢失问题;最后采用挤压和激发模块抑制冗余信息,降低分类偏差。改进模型B-Res41-ASE在测试集中的分类准确率和F 1值分别为93.7%和94.9%,对上车茧的分类精确率为97.8%,对黄斑茧、柴印茧、烂茧、瘪茧、薄皮茧等下茧的分类精确率分别为96.4%、93.7%、98.6%、94.5%、93.1%,相比于改进前模型和常用的细粒度分类模型均有明显优势,且B-Res41-ASE对蚕茧的可判别区域的聚焦更精准。实验结果表明,文中提出的优化方法在分类准确率、鲁棒性等方面优于其他蚕茧分类模型,可为蚕茧智能分拣提供理论依据。 展开更多
关键词 蚕茧分类 双线性池化 自适应空间特征融合 可视化分析
在线阅读 下载PDF
三维人体姿态估计中的多尺度时空特征融合
3
作者 张宇 刘骊 +2 位作者 付晓东 刘利军 彭玮 《计算机辅助设计与图形学学报》 北大核心 2025年第1期75-88,共14页
针对视频输入的单人三维人体姿态估计中表征不精确、融合不充分、结果不平滑的问题,提出三维人体姿态估计的多尺度时空特征融合方法.首先在空域定义关节点、肢体和上/下身人体标记并通过位置嵌入表示人体的空间多尺度特征;然后结合自注... 针对视频输入的单人三维人体姿态估计中表征不精确、融合不充分、结果不平滑的问题,提出三维人体姿态估计的多尺度时空特征融合方法.首先在空域定义关节点、肢体和上/下身人体标记并通过位置嵌入表示人体的空间多尺度特征;然后结合自注意力机制和多层感知机构建空间多尺度特征融合模块,融合关节点、肢体和上/下身三个空间多尺度特征,得到初步姿态特征序列;最后建立时序多尺度编码进行时序特征融合获得最终姿态特征序列,并通过时序解码,优化生成细化的三维人体姿态.在Human3.6M数据集上的实验结果表明,所提方法的平均每关节位置P-MPJPE和速度误差MPJVE分别为33.6和2.4,较对比方法降低了2.3%和4.0%,能够降低计算复杂度,提高三维人体姿态估计精度,生成准确、平滑的三维人体姿态估计结果.此外,在HumanEva-I数据集的测试结果表明,所提方法也具有一定的泛化性. 展开更多
关键词 三维人体姿态估计 多尺度特征 自注意力机制 时空特征融合 时序编码
在线阅读 下载PDF
基于多尺度空间-光谱特征提取的颜料高光谱图像分类方法
4
作者 汤斌 罗希玲 +6 位作者 王建旭 范文奇 孙玉宇 刘家路 唐欢 赵雅 钟年丙 《光谱学与光谱分析》 北大核心 2025年第8期2364-2372,共9页
颜料不仅赋予文物色彩和美感,更承载着丰富的历史、文化与技术信息,因此对颜料的准确分类与识别是古代彩绘作品修复、保护及学术研究的重要基础。通过检测颜料的种类与化学成分,不仅能帮助确定作品的创作年代、地域特征及工艺风格,还能... 颜料不仅赋予文物色彩和美感,更承载着丰富的历史、文化与技术信息,因此对颜料的准确分类与识别是古代彩绘作品修复、保护及学术研究的重要基础。通过检测颜料的种类与化学成分,不仅能帮助确定作品的创作年代、地域特征及工艺风格,还能为科学修复提供指导依据。然而,传统颜料分析受限于样品尺寸、表面平整度,且部分分析方法需要取样,对文物造成不可逆损伤,这使得古书画颜料的检测面临诸多挑战。高光谱成像技术(HSI)凭借其无损检测、广域扫描及获取完整光谱信息的优势,成为文物颜料分析的重要工具。HSI克服了样品表面不平整、尺寸受限等问题,能够从不同波段获取细致的光谱和空间信息,帮助提取颜料的微观特征。旨在利用HSI技术实现古书画颜料的精准分类与深度特征提取,以应对复杂场景下的颜料检测挑战。为此,我们提出了一种多尺度空间-光谱特征融合的方法,在分析过程中结合不同层次的信息:利用光谱-空间注意力机制捕捉细节特征,并通过视觉转换器(ViT)模型获取图像整体的高层语义信息,从而增强对复杂颜料特征的表示能力和分类性能。实验结果表明,该方法在模拟画作样品上的分类性能显著优于传统和其他深度学习模型:与支持向量机(SVM)相比,分类精度提升了34.35%;相较于HyBridSN与SSRN模型,精度分别提高了8.93%和5.6%。本方法不仅提升了颜料检测的准确性,还为古书画的科学修复和价值保护提供了无损、可靠的技术支持,并为文物保护的智能化发展奠定了技术基础。 展开更多
关键词 高光谱成像 多尺度特征融合 Vision Transformer 光谱-空间注意力 颜料分类
在线阅读 下载PDF
融合时空注意力机制的多尺度卷积车辆轨迹预测 被引量:1
5
作者 闫建红 刘芝妍 王震 《计算机工程》 北大核心 2025年第8期406-414,共9页
车辆轨迹预测是自动驾驶的重要环节,提升车辆轨迹预测的可靠性和准确性对自动驾驶安全性有很大帮助。道路上车辆行驶受交通环境影响,考虑相邻车辆运动和相对空间位置等交通环境因素,在长短期记忆(LSTM)神经网络编码器-解码器模型基础上... 车辆轨迹预测是自动驾驶的重要环节,提升车辆轨迹预测的可靠性和准确性对自动驾驶安全性有很大帮助。道路上车辆行驶受交通环境影响,考虑相邻车辆运动和相对空间位置等交通环境因素,在长短期记忆(LSTM)神经网络编码器-解码器模型基础上引入时空注意力机制,通过时间注意力层关注目标车辆和相邻车辆的历史轨迹,空间注意力层关注车辆的相对空间位置。为了增强特征提取程度和实现更全面的特征融合,使用多尺度卷积社交池增大感受野,融合多尺度特征,并提出基于LSTM编码器-解码器架构融合多尺度卷积社交池和时空注意力机制的车辆轨迹预测模型MCS-STA-LSTM。通过学习车辆运动相互依赖关系,以达到获得目标车辆未来轨迹基于机动类别的多模态预测分布的目的。在公开数据集NGSIM上进行训练、验证和测试,实验结果表明,相较于其他轨迹预测模型,该方法在3 s内的均方根误差平均降低了9.35%,5 s内均方根误差平均降低了5.53%,提高了轨迹预测准确性,在中短期预测上更具有优势。 展开更多
关键词 多尺度卷积社交池化 轨迹预测 长短期记忆神经网络 时空注意力机制 多尺度特征融合
在线阅读 下载PDF
基于多尺度渐近金字塔的太阳电池缺陷检测网络
6
作者 朱磊 耿萃萃 +3 位作者 李博涛 潘杨 张博 姚丽娜 《太阳能学报》 北大核心 2025年第5期267-274,共8页
以YOLOv8网络为基础提出一种多尺度渐近金字塔网络MSANet。首先使用带有分层特征融合结构的特征提取块M-Block替换常规卷积层,以增强网络对多尺度目标的特征提取能力;其次引入空间注意力机制(SRU),抑制背景区域的特征冗余,使网络能更关... 以YOLOv8网络为基础提出一种多尺度渐近金字塔网络MSANet。首先使用带有分层特征融合结构的特征提取块M-Block替换常规卷积层,以增强网络对多尺度目标的特征提取能力;其次引入空间注意力机制(SRU),抑制背景区域的特征冗余,使网络能更关注重点区域的同时减少参数量的引入;最后提出一种改进渐近金字塔网络AFPNa结构,缓解网络在特征融合过程中信息的丢失或退化问题,提升缺陷检测精度。实验结果表明,与YOLOv8原模型及RTMDET等7种先进检测网络相比,MSANet具有更高的检测精度,相较原模型均值平均精度提升5.7个百分点。 展开更多
关键词 缺陷检测 深度学习 太阳电池 分层特征融合结构 多尺度渐近金字塔 空间注意力机制
在线阅读 下载PDF
基于多尺度特征融合与重构卷积的肝肿瘤图像分割方法
7
作者 马金林 酒志青 +4 位作者 马自萍 夏明格 张凯 程叶霞 马瑞士 《华南理工大学学报(自然科学版)》 北大核心 2025年第5期94-108,共15页
针对肝肿瘤图像特征表达能力不足和全局上下文信息传递受限的问题,该文提出一种基于改进U-Net的肝肿瘤图像分割方法。首先,设计了一种低秩重构卷积来优化传统卷积运算所导致的大量参数问题,并用其构建使用残差结构改进编解码器的卷积核... 针对肝肿瘤图像特征表达能力不足和全局上下文信息传递受限的问题,该文提出一种基于改进U-Net的肝肿瘤图像分割方法。首先,设计了一种低秩重构卷积来优化传统卷积运算所导致的大量参数问题,并用其构建使用残差结构改进编解码器的卷积核重构模块,使编码器保留更多的细节信息,并使解码器能更有效地恢复信息,以提升肝肿瘤图像特征的表达能力。然后,为丰富全局上下文信息的传递,设计了三分支空间金字塔池化模块来优化瓶颈结构的信息传递,打破单一路径的限制。接着,设计了多尺度特征融合模块来优化编码器信息的复用机制,增强模型对全局上下文信息的建模能力,并提升其在提取不同尺度肝肿瘤图像特征时的效能。最后,在LiTS2017和3DIRCADb数据集上对该文方法的性能进行了测试。实验结果表明:在LiTS2017数据集上的肝脏图像分割任务中,该文方法的Dice系数和IoU值分别达97.56%和95.25%,在肝肿瘤图像分割任务中的Dice系数和IoU值分别达89.71%和81.58%;在3DIRCADb数据集上的肝脏图像分割任务中,该文方法的Dice系数和IoU值分别达97.63%和95.39%,在肝肿瘤图像分割任务中的Dice系数和IoU值分别达89.62%和81.63%。 展开更多
关键词 肝肿瘤图像分割 卷积核重构 空间金字塔池化 多尺度特征融合
在线阅读 下载PDF
自然环境下改进YOLOv5对小目标苹果的检测
8
作者 刘子龙 张磊 《系统仿真学报》 北大核心 2025年第8期2124-2138,共15页
针对苹果的分布通常会存在遮挡、小目标,以及密集目标等问题,提出了一种改进YOLOv5的目标检测算法。在YOLOv5的基础上加入了坐标注意力机制、感受野模块,以及自适应空间特征融合,加强了对小目标检测的能力。将YOLOv5中使用的CIoU替换为... 针对苹果的分布通常会存在遮挡、小目标,以及密集目标等问题,提出了一种改进YOLOv5的目标检测算法。在YOLOv5的基础上加入了坐标注意力机制、感受野模块,以及自适应空间特征融合,加强了对小目标检测的能力。将YOLOv5中使用的CIoU替换为了SIoU,提高了目标检测框的位置预测精度。将部分普通卷积替换为了深度可分离卷积,减少了计算量。实验结果表明:改进YOLOv5的综合性能要优于原始YOLOv5及其他算法,mAP值相比原始YOLOv5提升了9.6%。 展开更多
关键词 智能农业 坐标注意力机制 感受野 自适应空间特征融合 小目标检测 YOLOv5
在线阅读 下载PDF
基于全局层次化特征融合和多任务学习的异常流量检测方法
9
作者 刘会景 唐永旺 《计算机应用与软件》 北大核心 2025年第9期376-382,389,共8页
针对当前基于深度学习的方法对于网络流量表征和泛化能力方面较弱的问题,提出一种基于全局层次化特征融合和多任务学习的异常流量检测方法。该文将原始流量以会话流为单位进行切分,构建全局层次化特征融合框架,并行提取会话流空间和时... 针对当前基于深度学习的方法对于网络流量表征和泛化能力方面较弱的问题,提出一种基于全局层次化特征融合和多任务学习的异常流量检测方法。该文将原始流量以会话流为单位进行切分,构建全局层次化特征融合框架,并行提取会话流空间和时间特征进行残差融合;设计会话记录多分类为主任务,会话流多分类和会话流对是否为上下文关系为辅助任务的多任务学习框架;输入会话流对进行训练和预测。在TON_IoT数据集上验证,二分类和多分类的准确率分别为94.35%和91.96%,相较于对比方法,在准确率和精度最优时误报率较低。 展开更多
关键词 深度学习 时间特征 空间特征 层次化特征融合 多任务学习 异常流量
在线阅读 下载PDF
基于多浮标空间多特征融合的海水溶解氧浓度预测
10
作者 朱奇光 申震 +4 位作者 李享 魏祯 乔文静 张淋淞 陈颖 《海洋学报》 北大核心 2025年第1期104-116,共13页
溶解氧浓度是衡量海水水质的重要指标之一。为了及时掌握海水水质变化情况,降低海水污染风险及其带来的损失,建立海洋水质参数预测机制至关重要。为此,本文提出了一种基于浮标网络时空信息融合和改进生成对抗网络(Generative Adversaria... 溶解氧浓度是衡量海水水质的重要指标之一。为了及时掌握海水水质变化情况,降低海水污染风险及其带来的损失,建立海洋水质参数预测机制至关重要。为此,本文提出了一种基于浮标网络时空信息融合和改进生成对抗网络(Generative Adversarial Networks,GAN)的海水溶解氧浓度预测模型,旨在整合监测区域内浮标网络的拓扑信息并实现浮标传感器的多特征融合。该模型利用图注意力网络(Graph Attention Mechanism,GAT)挖掘不同近邻点对目标节点的影响,计算邻接节点的权重,从而捕获浮标数据的时空特征;通过双头注意力机制与双时间尺度更新规则(Two Time-Scale Update Rule,TTUR)优化GAN预测网络及网络训练过程,改善生成对抗网络的训练速度平衡问题,提高生成器网络的拟合效果。以均方误差、均方根误差、平均绝对误差与决定系数为评价指标进行模型预测性能对比,结果表明,所提出模型的各项评价指标均优于其他模型,能够有效挖掘多浮标的空间信息,克服了传统方法在海水溶解氧浓度预测中存在的精度低、无法灵活利用历史空间数据、训练稳定性差和速度慢等不足,可为海洋水质监测及预测提供重要的技术支撑。 展开更多
关键词 溶解氧浓度预测 空间多特征融合 GAT GAN TTUR
在线阅读 下载PDF
结合特征融合与混合注意力的细粒度图像分类
11
作者 潘卫华 魏明月 苏攀 《计算机应用与软件》 北大核心 2025年第9期210-219,共10页
为充分提取细粒度图像中的局部关键特征,提出特征融合与混合注意力相结合的细粒度图像分类算法。该文利用SE(Squeeze-and-Excitation Networks)引入通道注意力,提高特征提取能力;提出特征融合,充分融合跨通道交互后的低层和高层语义信息... 为充分提取细粒度图像中的局部关键特征,提出特征融合与混合注意力相结合的细粒度图像分类算法。该文利用SE(Squeeze-and-Excitation Networks)引入通道注意力,提高特征提取能力;提出特征融合,充分融合跨通道交互后的低层和高层语义信息;改进选择性稀疏采样(Selective Sparse Sampling,S3N)方法引入空间注意力获取显著采样图;构造一个能够端到端训练的两分支分类模型,以交叉验证的方式提高分类准确率。该算法在CUB-200-2011、FGVC-Aircraft和Stanford Cars数据集上分别达到了87.84%、93.59%和94.25%的分类准确率,优于骨干网络和当前主流算法。 展开更多
关键词 细粒度图像分类 通道注意力 空间采样 特征融合 交叉验证
在线阅读 下载PDF
结合倒残差自注意力机制的遥感图像目标检测
12
作者 赵文清 赵振寰 巩佳潇 《智能系统学报》 北大核心 2025年第1期64-72,共9页
针对遥感图像目标检测存在背景信息干扰严重、待检测目标尺寸差异大等问题,提出一种结合倒残差自注意力机制的目标检测方法。首先,使用具有强特征提取能力的倒残差自注意力机制骨干网络充分提取目标特征,降低复杂背景信息的干扰;其次,... 针对遥感图像目标检测存在背景信息干扰严重、待检测目标尺寸差异大等问题,提出一种结合倒残差自注意力机制的目标检测方法。首先,使用具有强特征提取能力的倒残差自注意力机制骨干网络充分提取目标特征,降低复杂背景信息的干扰;其次,构造多尺度空间金字塔池化模块,提供多尺度感受野,增强捕捉不同尺寸目标的能力;最后,提出轻量级特征融合模块,对骨干网络提取的特征图进行融合,充分结合低层与高层特征,提高网络对不同尺寸目标的检测能力。与传统网络及其他改进目标检测算法进行对比,实验发现该方法的检测精度明显优于其他算法。此外,在DIOR数据集和RSOD数据集上设计消融实验,结果表明,该方法在DIOR数据集与RSOD数据集上的平均精度均值比YOLOv8算法分别提升4.6和4.2百分点,明显提升遥感图像目标检测的精度。 展开更多
关键词 遥感图像 目标检测 倒残差 自注意力机制 多尺度 空间金字塔 特征提取 特征融合
在线阅读 下载PDF
基于深度学习的车道线检测算法
13
作者 岳永恒 赵志浩 《华南理工大学学报(自然科学版)》 北大核心 2025年第9期22-30,共9页
针对智能车辆在复杂场景下的车道线检测准确性问题,该文提出了一种融合多尺度空间注意力机制和路径聚合网络(PANet)的车道线检测算法。该算法首先引入行锚框UFLD车道线检测模型,并结合深度可分离卷积的特征金字塔增强模块PANet,以实现... 针对智能车辆在复杂场景下的车道线检测准确性问题,该文提出了一种融合多尺度空间注意力机制和路径聚合网络(PANet)的车道线检测算法。该算法首先引入行锚框UFLD车道线检测模型,并结合深度可分离卷积的特征金字塔增强模块PANet,以实现图像的多尺度特征提取;接着,网络框架中设计多尺度空间注意力模块,且引入SimAM轻量级注意力机制,以增强对目标特征的聚焦能力;然后,设计自适应特征融合模块,通过智能调整不同尺度特征图的融合权重,对PANet输出的特征图进行跨尺度融合,以提升网络对复杂特征的提取能力。在TuSimple数据集上的实验结果表明,所提算法的检测精度为96.84%,较原算法提升了1.02个百分点,优于传统的主流算法;在CULane数据集上的实验结果表明,所提算法的F_(1)值为72.74%,优于传统的主流算法,较原算法提升了4.34个百分点,尤其在强光和阴影等极端场景下的检测性能提升显著,说明所提算法在复杂场景下具有优异的检测能力;实时性测试结果显示,所提算法的推理速度达118.0 f/s,满足智能车辆的实时性需求。 展开更多
关键词 车道线检测 深度学习 多尺度空间注意力机制 自适应特征融合
在线阅读 下载PDF
基于改进YOLOv7tiny的无人机小目标检测
14
作者 倪健 申奥 王峥 《计算机工程与设计》 北大核心 2025年第11期3065-3073,共9页
针对航拍图像中小目标密集遮挡等问题,提出一种基于YOLOv7tiny改进的小目标检测算法。增加一个微小目标检测层,增强模型对特征的捕捉能力;使用自适应空间融合改进FPN结构,促进主干网络输出的非相邻层特征图融合;提出多尺度感知卷积MSACo... 针对航拍图像中小目标密集遮挡等问题,提出一种基于YOLOv7tiny改进的小目标检测算法。增加一个微小目标检测层,增强模型对特征的捕捉能力;使用自适应空间融合改进FPN结构,促进主干网络输出的非相邻层特征图融合;提出多尺度感知卷积MSAConv,增强卷积神经网络捕获目标特征信息的能力;引入RFCA注意力机制模块,解决参数共享问题,增强特征提取能力。实验结果表明,改进后模型在VisDrone2019数据集上mAP50达到了40.6%,较基准模型提升了5.2%。 展开更多
关键词 无人机 YOLOv7tiny 小目标检测 自适应空间融合 感受野注意力 多尺度特征信息 深度学习
在线阅读 下载PDF
基于航拍图像的自适应感知目标检测网络 被引量:1
15
作者 袁玲玲 陈春梅 +2 位作者 朱天鑫 邓豪 刘桂华 《电子测量技术》 北大核心 2025年第2期57-65,共9页
由于无人机拍摄高度和角度的多样性,其图像往往呈现背景复杂且小目标居多的特征,这导致了相关检测算法性能较差。针对此问题,本文提出了一种基于自适应感知网络的航拍图像车辆检测方法,旨在从提高车辆特征显著度和改善特征信息损失两个... 由于无人机拍摄高度和角度的多样性,其图像往往呈现背景复杂且小目标居多的特征,这导致了相关检测算法性能较差。针对此问题,本文提出了一种基于自适应感知网络的航拍图像车辆检测方法,旨在从提高车辆特征显著度和改善特征信息损失两个方面来提升小目标的检测性能。首先,为了提取更高效的特征表征,提出了自适应感知特征提取模块,该模块通过捕捉长程依赖关系和更强的几何特征表示,能够自适应地对物体的形状进行建模。其次,为了减少下采样和连续池化造成的信息损失,设计了双分支空间感知下采样模块,该模块混合不同通道的特征图,以最大限度地保留小目标特征信息。然后,在特征融合网络中,引入了具有丰富空间信息的浅层特征图,以增强小目标的检测能力。最后,设计了新的动态回归损失函数DEIoU,该函数引入惩罚项来度量真实框与检测框之间横纵比的相关性,从而进一步提高网络的预测精度。在Visdrone数据集上的实验结果表明,所提方法的平均精度均值mAP达到了70%,推理速度达到了99.26 fps,实现了较好的速度与精度的平衡,并且所提方法在UCAS-AOD数据集上取得了最佳的检测精度,具有较强的泛化能力。 展开更多
关键词 无人机 目标检测 自适应感知特征提取 特征融合网络 双分支空间感知下采样
在线阅读 下载PDF
基于频域和空域多特征融合的深度伪造检测方法 被引量:2
16
作者 董佳乐 邓正杰 +1 位作者 李喜艳 王诗韵 《图学学报》 北大核心 2025年第1期104-113,共10页
在当今社会,面部伪造技术的迅速发展对社会安全构成了巨大挑战,尤其是在深度学习技术被广泛应用于生成逼真的伪造视频的背景下。这些高质量的伪造内容不仅威胁到个人隐私,还可能被用于不法活动。面对这一挑战,传统的基于单一特征的伪造... 在当今社会,面部伪造技术的迅速发展对社会安全构成了巨大挑战,尤其是在深度学习技术被广泛应用于生成逼真的伪造视频的背景下。这些高质量的伪造内容不仅威胁到个人隐私,还可能被用于不法活动。面对这一挑战,传统的基于单一特征的伪造检测方法已经难以满足检测需求。因此,提出了一种基于频域和空域多特征融合的深度伪造检测方法,以提高面部伪造内容的检测准确率和泛化能力。并将频域动态划分为3个频带来提取在空域中无法挖掘的伪造伪影;对空域使用EfficientNet_b4网络和Transformer架构多尺度划分图像块来计算不同块的差异、根据上下图像块之间的一致性信息来进行检测以及捕获更精细的伪造特征信息;最后使用查询-键-值机制的融合块,将上述中的频域和空域的方法进行融合,从而更全面地挖掘到2个域中的特征信息,提升伪造检测的准确性和迁移性。大量的实验结果显示该方法有效,其性能明显优于传统深度伪造检测方法。 展开更多
关键词 深度伪造检测 EfficientNet_b4网络 频域特征 空域特征 特征融合
在线阅读 下载PDF
基于权重融合特征重标定网络的运动想象脑电分类 被引量:1
17
作者 莫云 李易 +3 位作者 张本鑫 路仲伟 莫禾胜 李智 《电子测量与仪器学报》 北大核心 2025年第1期70-79,共10页
时-频-空特征在运动想象脑电分类中广泛应用,但如何有效利用这些特征提高运动想象分类准确率仍是难点。传统方法通过特征选择剔除冗余信息,但往往忽视了时-频-空特征的组间依赖关系。为此,提出一种基于权重融合特征重标定网络的脑电分... 时-频-空特征在运动想象脑电分类中广泛应用,但如何有效利用这些特征提高运动想象分类准确率仍是难点。传统方法通过特征选择剔除冗余信息,但往往忽视了时-频-空特征的组间依赖关系。为此,提出一种基于权重融合特征重标定网络的脑电分类模型。首先,提取时-频-空特征,揭示其分组结构,将每组时-频-空特征作为一个整体,并视为一个特征图。然后,建立两个分支分别获取特征图的通道权重:一个分支通过全局平均池化获取全局信息的通道权重,另一个分支通过全局最大池化获取局部信息的通道权重。接着,设计权重融合操作,将两种通道权重融合,并对特征图进行重缩放,从而实现时-频-空特征的组间依赖关系建模。最后,使用两层全连接层进行分类。在4个公开的运动想象脑电数据集上进行了实验验证,所提出的方法平均分类准确率高达80.72%,优于18种特征选择方法和现有的特征重标定网络方法,以及大多数近期文献的分类结果。实验结果表明,所提方法在实际应用中具有良好的潜力,有望在未来的脑机接口研究和康复训练中得到广泛应用。 展开更多
关键词 脑电分类 运动想象 特征重标定 时-频-空特征 权重融合
在线阅读 下载PDF
基于大模型的钻井现场人体姿态估计方法研究 被引量:1
18
作者 刘兆年 连远锋 +2 位作者 师印亮 王宁 姜彬 《钻采工艺》 北大核心 2025年第1期104-112,共9页
准确的人体姿态估计对钻井现场员工行为的监测和安全预警至关重要。针对钻井平台现场监控视频中存在高反光、高模糊和遮挡问题,提出一种基于双向特征融合的人体姿态估计模型,通过构建一种高效的双向特征融合机制,在ViT预训练模型的基础... 准确的人体姿态估计对钻井现场员工行为的监测和安全预警至关重要。针对钻井平台现场监控视频中存在高反光、高模糊和遮挡问题,提出一种基于双向特征融合的人体姿态估计模型,通过构建一种高效的双向特征融合机制,在ViT预训练模型的基础上引入空洞金字塔池化技术捕捉的图像多尺度空间特征。该机制可同时关注ViT预训练模型内部特征、多尺度空间特征以及两者间的交互特征,实现多类特征的高效集成。实验结果表明,通过与基准模型HRNet的对比,文章方法在KAP和KAR上分别实现了3.6%和4.1%的显著提升。同时,在南海某平台的智能监控系统中对所提出的模型进行应用测试,仍然显示出较高的准确性,为后续深入研究员工不安全行为的智能分析提供了精确的动作估计基础。 展开更多
关键词 人体姿态估计 预训练大模型 空洞金字塔池化 双向特征融合
在线阅读 下载PDF
基于改进YOLOv8n的井下人员多目标检测 被引量:2
19
作者 问永忠 贾澎涛 +2 位作者 夏敏高 张龙刚 王伟峰 《工矿自动化》 北大核心 2025年第1期31-37,77,共8页
针对井下危险区域人员监测视频存在光照不均匀、目标尺度不一致、遮挡等复杂情况,基于YOLOv8n网络结构,提出一种改进的井下人员多目标检测算法—YOLOv8n-MSMLAS。该算法对YOLOv8n的Neck层进行改进,添加多尺度空间增强注意力机制(MultiSE... 针对井下危险区域人员监测视频存在光照不均匀、目标尺度不一致、遮挡等复杂情况,基于YOLOv8n网络结构,提出一种改进的井下人员多目标检测算法—YOLOv8n-MSMLAS。该算法对YOLOv8n的Neck层进行改进,添加多尺度空间增强注意力机制(MultiSEAM),以增强对遮挡目标的检测性能;在C2f模块中引入混合局部通道注意力(MLCA)机制,构建C2f-MLCA模块,以融合局部和全局特征信息,提高特征表达能力;在Head层检测头中嵌入自适应空间特征融合(ASFF)模块,以增强对小尺度目标的检测性能。实验结果表明:(1)与Faster R-CNN,SSD,RT-DETR,YOLOv5s,YOLOv7等主流模型相比,YOLOv8n-MSMLAS综合性能表现最佳,mAP@0.5和mAP@0.5:0.95分别达到93.4%和60.1%,FPS为80.0帧/s,参数量为5.80×106个,较好平衡了模型的检测精度和复杂度。(2)YOLOv8n-MSMLAS在光照不均、目标尺度不一致、遮挡等条件下表现出较好的检测性能,适用于现场检测。 展开更多
关键词 煤矿井下危险区域 井下人员多目标检测 YOLOv8n 多尺度空间增强注意力机制 自适应空间特征融合 轻量化混合局部通道注意力机制
在线阅读 下载PDF
三维卷积与Transformer支持下联合空谱特征的高光谱影像分类 被引量:1
20
作者 何光 吴田军 《计算机工程与应用》 北大核心 2025年第2期259-272,共14页
由于CNN对局部特征提取能力强,目前仍是高光谱影像处理和分析中的主流深度模型,但是CNN感受野有限,无法建立长距离依赖关系,学习全局语义信息受限。Transformer的自注意力机制可以对输入序列中的每个位置进行注意力计算,从而能有效获取... 由于CNN对局部特征提取能力强,目前仍是高光谱影像处理和分析中的主流深度模型,但是CNN感受野有限,无法建立长距离依赖关系,学习全局语义信息受限。Transformer的自注意力机制可以对输入序列中的每个位置进行注意力计算,从而能有效获取全局上下文信息。如何实现CNN和Transformer的技术耦合并充分利用空间信息和光谱信息进行高光谱遥感影像分类是一个重要的待研问题。鉴于此,提出一种新的基于三维卷积和Transformer的高光谱遥感影像分类方法,尝试联合空谱特征实现解译能力的提升。使用主成分分析方法对高光谱遥感影像沿垂直方向降维;用非负矩阵分解算法对降维后遥感影像沿水平方向进行空间特征提取,将两种工具处理后遥感影像进行拼接,以充分保留信息;再用三维卷积核对拼接后遥感影像进行空间特征和光谱特征的综合提取;用Transformer的注意力机制对提取空间信息和光谱信息的遥感影像序列建立长距离依赖关系并使用多层感知机完成分类任务。实验表明,所提方法在WHU-Hi龙口、汉川、洪湖以及雄安新区马蹄湾村数据集上均表现出比对比方法更优异的分类性能,表明该方法具有一定的泛化性和稳健性。 展开更多
关键词 非负矩阵分解 特征融合 三维卷积 空谱联合 TRANSFORMER 高光谱遥感影像分类
在线阅读 下载PDF
上一页 1 2 10 下一页 到第
使用帮助 返回顶部