期刊文献+
共找到5,451篇文章
< 1 2 250 >
每页显示 20 50 100
基于局部特征匹配和伪标签细化的纯无监督行人重识别
1
作者 刘国权 陈尚良 +3 位作者 秦晨旭 周书民 周焕银 王小刚 《现代电子技术》 北大核心 2026年第6期174-183,共10页
针对无监督行人重识别中聚类生成伪标签时存在较大噪声的问题,提出一种基于局部特征匹配与伪标签细化的纯无监督方法。该方法不依赖任何源域信息,仅从图像级考虑样本之间的相关性,并为其分配鲁棒的伪标签用于训练。首先,设计一个局部特... 针对无监督行人重识别中聚类生成伪标签时存在较大噪声的问题,提出一种基于局部特征匹配与伪标签细化的纯无监督方法。该方法不依赖任何源域信息,仅从图像级考虑样本之间的相关性,并为其分配鲁棒的伪标签用于训练。首先,设计一个局部特征匹配模块,通过对齐样本的局部特征并进行相似度排序,合理表征样本之间全局与局部特征的相关性。随后,引入相关性评分模块,在综合考虑样本的全局特征和局部特征之间的相关性的基础上,对聚类生成的伪标签的合理性进行打分。在此基础上,通过伪标签细化模块,依据评分结果分别对样本的全局和局部特征伪标签进行细化。最后,使用细化后的伪标签训练网络,并在训练过程中持续更新伪标签。在Market-1501、DukeMTMC-ReID和MSMT17公开行人重识别数据集上对所提方法进行实验验证,结果表明,该方法的mAP分别达到81.9%、71.1%和31.6%,效果良好。 展开更多
关键词 行人重识别 无监督 伪标签细化 局部特征匹配 神经网络 消融实验 相关性评分
在线阅读 下载PDF
深度学习驱动的视频编码:方法、进展与展望
2
作者 何小海 李鑫磊 +5 位作者 魏海涛 毕晓东 聂尧佳 熊志娜 张皓彦 熊淑华 《数据采集与处理》 北大核心 2026年第2期515-542,共28页
随着视频数据量的爆炸式增长,有限的网络带宽和高计算资源需求对视频传输与存储提出了严峻挑战。在此背景下,持续开发高效的视频编码方法以保障在资源受限条件下提供高质量视频服务具有至关重要的理论意义与应用价值。然而,传统混合视... 随着视频数据量的爆炸式增长,有限的网络带宽和高计算资源需求对视频传输与存储提出了严峻挑战。在此背景下,持续开发高效的视频编码方法以保障在资源受限条件下提供高质量视频服务具有至关重要的理论意义与应用价值。然而,传统混合视频编码框架已逐渐遭遇瓶颈,编码性能的进一步提升越来越困难。近年来,深度学习凭借其强大的非线性拟合与表征能力,为视频编码领域的优化带来了契机。本文对基于深度学习驱动的视频编码技术进行了系统而详细的分析。首先,简要介绍传统编码框架下的视频编码技术,并进一步探讨结合深度学习在帧内/帧间预测等关键模块中的优化;然后,重点讨论了基于深度学习的端到端视频编码框架的发展历程及关键技术路线,并对其性能进行对比分析;最后,进一步介绍深度学习在视频编码领域的重要研究成果,剖析现有技术所面临的挑战和局限性,并对未来视频编码技术的发展趋势进行了展望。 展开更多
关键词 视频压缩 深度学习 神经网络 结合学习的视频编码 端到端视频编码
在线阅读 下载PDF
多模态融合的输电线路部件多尺度检测方法
3
作者 周景 赵毅 刘心 《电子测量技术》 北大核心 2026年第1期188-198,共11页
在输电线路无人机巡检航拍图像的关键部件检测任务中,针对单一模态检测方法精度低和小目标漏检率高的问题,提出了一种融合可见光图像和红外图像的多模态多尺度目标检测方法。首先,该网络构建了并行的双流特征提取主干,旨在同步处理可见... 在输电线路无人机巡检航拍图像的关键部件检测任务中,针对单一模态检测方法精度低和小目标漏检率高的问题,提出了一种融合可见光图像和红外图像的多模态多尺度目标检测方法。首先,该网络构建了并行的双流特征提取主干,旨在同步处理可见光与红外图像,以充分利用前者丰富的色彩与纹理细节信息,以及后者卓越的成像稳定性与高对比度特性。其次,为实现跨模态信息的交互与互补,设计了多模态特征交互融合模块(MFIFM),该模块能动态地调整不同模态特征的融合权重,自适应地整合最具判别力的信息,有效缓解模态差异带来的信息冲突。此外,为提升对小目标部件的感知能力,提出了混合残差多尺度Transformer(HRMS Transformer)模块嵌入到双流主干中,通过多头窗口注意力机制,层级式特征重组以及与残差相结合的策略,增强全局上下文信息提取能力。实验结果表明,该模型精度mAP@50和mAP@50:95较现有单模态方法分别提升5.35%和4.48%。验证了多模态融合技术在输电线路检测领域的有效性和可用性。 展开更多
关键词 输电线路检测 多模态特征融合 Swing Transformer 注意力机制 双流主干网络 深度学习
在线阅读 下载PDF
改进YOLOv8n的轻量化车钥匙检测系统
4
作者 陈聪明 李俊俊 《电子测量技术》 北大核心 2026年第2期1-8,共8页
针对家庭复杂场景下车钥匙难以凭借人眼快速识别与定位的问题,本研究设计了一种基于E-YOLOv8n模型的实时检测系统。该系统通过无线USB摄像头采集视频流,搭载E-YOLOv8n模型的计算终端进行实时目标检测,并通过音频报警模块反馈检测结果。... 针对家庭复杂场景下车钥匙难以凭借人眼快速识别与定位的问题,本研究设计了一种基于E-YOLOv8n模型的实时检测系统。该系统通过无线USB摄像头采集视频流,搭载E-YOLOv8n模型的计算终端进行实时目标检测,并通过音频报警模块反馈检测结果。其中,E-YOLOv8n模型为核心部分,其改进如下:首先,优化网络结构,采用DSConv重构骨干网络,精简P5输出,降低网络计算冗余;其次,设计DSPPF模块,提高多尺度特征融合能力并降低计算量;再次,在骨干网络末端嵌入Coord注意力机制模块,通过坐标注意力聚焦关键特征并抑制背景干扰;最后,采用轻量化检测头LWD模块,保持检测精度并提高模型计算效率。基于自建的车钥匙数据集,实验结果表明:E-YOLOv8n模型与初始YOLOv8n模型相比,计算量、参数量和模型大小分别降低了53.8%、32.8%、52.4%,精确度提升1.7%,提升性能的同时大幅轻量化,便于将其部署到家庭环境中计算资源受限的设备使用。 展开更多
关键词 车钥匙 YOLOv8 DSConv DSPPF模块 Coord注意力机制 LWD模块
在线阅读 下载PDF
基于重构难度感知的视频快照压缩成像方法
5
作者 陈灿 石鹏飞 +2 位作者 周超 胡俊 张登银 《计算机研究与发展》 北大核心 2026年第2期448-459,共12页
人工智能应用需要有与之适配的高速视频成像新技术以便更好地感知周围环境,基于深度学习的快照压缩成像(snapshot compressive imaging,SCI)提供了一种具有前景的解决方案。如何利用深度学习技术从观测值中重构高速视频是领域的前沿热... 人工智能应用需要有与之适配的高速视频成像新技术以便更好地感知周围环境,基于深度学习的快照压缩成像(snapshot compressive imaging,SCI)提供了一种具有前景的解决方案。如何利用深度学习技术从观测值中重构高速视频是领域的前沿热点。然而,现有重构方法注重挖掘先验信息以提升重构质量,忽略了掩码和图像纹理对重构难度的影响,使得重构质量仍有进一步提高的空间。针对这个问题,提出一种基于重构难度感知的快照压缩成像方法RdpSCI(reconstruction difficulty perception-based SCI)。基于观测值中包含的信息由掩码和图像纹理共同决定观察,所提方法提出挖掘掩码和图像纹理与重构难度之间的关联,引导深度网络进行重构。特别地,提出一种改进残差密集连接网络模块I-ResDNet(improved ResDNet),通过引入重构难度权重向量引导特征融合,并创新地在ResDNet中引入通道打乱操作,降低特征融合效果对于通道划分方式的依赖,能够在不显著增加模型参数量的情况下增强特征融合能力。实验表明,RdpSCI相比于领域现有最优方法STFormer和EfficientSCI,在基准灰度数据集和基准彩色数据集上,重构结果的峰值信噪比分别有0.68 dB和0.54 dB的提升。 展开更多
关键词 计算成像 快照压缩成像 视频压缩感知 视频重构 重构难度感知
在线阅读 下载PDF
改进YOLOv10的复杂场景人体跌倒检测方法
6
作者 郭莉 张雪松 +1 位作者 李萌萌 金花 《电子测量技术》 北大核心 2026年第3期204-212,共9页
针对复杂场景中高动态人体运动引发的跌倒特征判别性下降、小目标难以识别、关键部位遮挡等问题,提出了一种基于改进YOLOv10的人体跌倒检测算法ICI-YOLO。通过引入上下文锚点注意力替换骨干网络中的部分自注意力机制,实现了全局上下文... 针对复杂场景中高动态人体运动引发的跌倒特征判别性下降、小目标难以识别、关键部位遮挡等问题,提出了一种基于改进YOLOv10的人体跌倒检测算法ICI-YOLO。通过引入上下文锚点注意力替换骨干网络中的部分自注意力机制,实现了全局上下文依赖与细粒度空间融合表征;融合了迭代注意力机制对骨干网络C2f进行重构,强化关键区域语义表达能力;并提出融合交互卷积和跨尺度特征融合的交互式特征融合网络,提升了模型多尺度特征融合能力。实验表明,改进后的ICI-YOLO模型在自制人体跌倒行为检测数据集FALL上召回率和mAP@0.5分别提升了4.3%和2.2%,在公开数据集DiverseFALL10500上准确率和mAP@0.5:0.95分别提升了2.0%和1.5%,且在与主流实时检测算法的对比中展现出更优的检测性能。 展开更多
关键词 人体跌倒检测 YOLOv10 上下文锚点注意力 迭代注意力 交互卷积
在线阅读 下载PDF
基于视觉联合检测的球团矿粒径检测方法
7
作者 龚玉洁 王旭 +2 位作者 郭海杰 丁志星 崔雪红 《电子测量技术》 北大核心 2026年第2期203-211,共9页
针对工业球团矿图像分割任务中存在的小目标密集粘连、易受遮挡等技术难题,提出基于YOLOv11与SAM2的视觉联合检测实例分割方法(YO-SAM2)。首先,通过CSC模块改进YOLOv11的C3k2模块,增强网络对密集小目标特征的表达能力。其次,设计小目标... 针对工业球团矿图像分割任务中存在的小目标密集粘连、易受遮挡等技术难题,提出基于YOLOv11与SAM2的视觉联合检测实例分割方法(YO-SAM2)。首先,通过CSC模块改进YOLOv11的C3k2模块,增强网络对密集小目标特征的表达能力。其次,设计小目标混合融合特征金字塔网络(SHFPN),在P2层增加特征图输出以捕捉细节信息,添加跨层交互并采用基于内容引导注意力机制的混合融合策略,提升多尺度特征融合效能。此外,引入解耦空间-通道上采样模块(DSCU)替代原始上采样方法,生成更具表达力的特征表征。最后,通过嵌入可学习Adapter适配器对SAM2分割模型进行参数高效微调,有效提升模型对特定工业场景的适应性和泛化性。实验结果表明,YO-SAM2在球团矿数据集的mIoU达90.3%,与Mask R-CNN、YOLOv8-seg等主流分割算法相比,取得了最佳分割效果。该方法有效解决了工业场景下球团矿分割的精度与鲁棒性问题,为智能工业质检提供了可靠的技术方案。 展开更多
关键词 实例分割 多尺度特征融合 细节信息 参数微调
在线阅读 下载PDF
基于深度学习的自动拾取网球机器人
8
作者 梁宏宇 闫坤 郝航勃 《电子测量技术》 北大核心 2026年第3期213-222,共10页
本文提出了一种基于深度学习的自动拾取网球机器人,旨在解决网球场地人工捡球效率低、耗时长的问题。该机器人通过集成树莓派5B主控板、STM32RCT6单片机、USB摄像头和无刷直流电机等硬件模块,结合轻量化的YOLOv11、改进的DBSCAN聚类路... 本文提出了一种基于深度学习的自动拾取网球机器人,旨在解决网球场地人工捡球效率低、耗时长的问题。该机器人通过集成树莓派5B主控板、STM32RCT6单片机、USB摄像头和无刷直流电机等硬件模块,结合轻量化的YOLOv11、改进的DBSCAN聚类路径规划算法、双闭环PID算法以及碾压滚轴式的捡球机械结构,实现了对网球的高效识别、路径优化和自主拾取。研究中对YOLOv11进行了轻量化改进,采用StarNet主干网络、C3k2_Faster模块和共享卷积轻量化检测头SCLD-Head,显著降低了模型的计算需求。实验结果表明,改进后的模型参数量减少了80.8%,GFLOPs仅为1.7,mAP@0.75达到0.980 6,检测速度达到129.7fps。此外,基于DBSCAN聚类算法的路径规划通过密度聚类和距离加权模型优化了捡球路径,提高了机器人在复杂环境下的适应性和鲁棒性。实验结果表明,该模型成功部署于树莓派平台后,系统能够在不同光照条件下准确识别网球,并达到9~12fps的检测速度,单次可拾取7~9个网球,能够显著提升网球拾取效率,具有重要的应用价值和市场潜力。 展开更多
关键词 网球拾取机器人 树莓派 YOLOv11轻量化 路径规划 双闭环PID 网球拾取结构
在线阅读 下载PDF
改进YOLOv8n的航拍多尺度目标检测模型
9
作者 贾亮 陈茂辉 +1 位作者 王琪 徐城 《电子测量技术》 北大核心 2026年第1期237-246,共10页
针对无人机航拍图像中目标小而密集,且极易出现漏检和误检等情况,文章提出一种改进YOLOv8n的无人机航拍复杂背景下多尺度目标检测模型UCM-YOLOv8。首先设计一种集聚合与扩散特性于一体的金字塔式网络结构,让每个尺度的特征都具有详细的... 针对无人机航拍图像中目标小而密集,且极易出现漏检和误检等情况,文章提出一种改进YOLOv8n的无人机航拍复杂背景下多尺度目标检测模型UCM-YOLOv8。首先设计一种集聚合与扩散特性于一体的金字塔式网络结构,让每个尺度的特征都具有详细的上下文信息。其次,提出任务动态对齐检测头,从多个卷积层中学习交互特征,提高检测精度。此外,将卷积加性自注意力机制与C2f模块有效融合,进一步增强特征表达能力。最后,为抑制低分辨率图像产生的有害梯度,运用Wise-Inner损失函数替换原CIou损失函数。在VisDrone2019数据集上进行对比实验和消融实验,mAP50值较基线模型提升了10.8%,参数量减少了9.6%。证明本模型在无人机航拍视角下的小目标检测效果优异,适合无人机航拍图像的应用。 展开更多
关键词 无人机航拍 目标检测 损失函数 空间金字塔 解耦检测头 多尺度
在线阅读 下载PDF
基于YOLOv8改进的无人机航拍路面损伤检测算法
10
作者 张亚军 苗皓源 +1 位作者 马薇 马冲 《电子测量技术》 北大核心 2026年第2期181-191,共11页
针对无人机航拍路面损伤检测任务中,现有路面损伤检测算法存在模型复杂度过高以及复杂背景下漏检、误检的问题,提出了一种轻量化的路面损伤检测算法DFS-YOLO。首先,提出C2f-DWR模块,引入多膨胀率并行空洞卷积结构,扩大模型感受野,增强... 针对无人机航拍路面损伤检测任务中,现有路面损伤检测算法存在模型复杂度过高以及复杂背景下漏检、误检的问题,提出了一种轻量化的路面损伤检测算法DFS-YOLO。首先,提出C2f-DWR模块,引入多膨胀率并行空洞卷积结构,扩大模型感受野,增强对高层语义信息的利用。其次,设计了轻量化的快速层次尺度特征金字塔FHSFPN,在减少模型复冗余的同时提升特征融合效果。最后,引入ShapeIoU损失函数,关注路面损伤的自身形状与尺度,提高模型的鲁棒性。实验结果表明,DFS-YOLO在China Drone和UAPD数据集上的mAP50分别较YOLOv8s提升4.6%和2.1%,参数量和计算量分别降低39.1%和20.4%,实现了轻量化与准确性的良好平衡,展现出较高的实际应用潜力。 展开更多
关键词 路面损伤检测 YOLOv8 C2f-DWR FHSFPN ShapeIoU 轻量化
在线阅读 下载PDF
基于改进YOLO11n的轻量级密集行人检测算法
11
作者 黄思禄 钟寒 《电子测量技术》 北大核心 2026年第3期243-253,共11页
在密集行人场景中,由于遮挡严重、小目标多、尺度变化大,且环境复杂,容易造成行人漏检、错检及定位不准等问题。针对以上挑战,本文提出了一种轻量化的密集行人检测算法DC-YOLO。该算法基于YOLO11n,在主干网络上提出了轻量级特征提取网络... 在密集行人场景中,由于遮挡严重、小目标多、尺度变化大,且环境复杂,容易造成行人漏检、错检及定位不准等问题。针对以上挑战,本文提出了一种轻量化的密集行人检测算法DC-YOLO。该算法基于YOLO11n,在主干网络上提出了轻量级特征提取网络EfficientNetV2S-S3,提高模型对小目标和多尺度目标的特征提取能力,降低模型参数量和计算成本;在颈部网络上提出了P-LightNeck模块,进一步提高了对小目标的特征融合能力,实现检测精度与效率的协同优化;引入RepNCSPELAN4卷积模块,通过多尺度卷积和重参数化技术,强化遮挡目标的特征提取能力,并提高推理效率;设计了动态多尺度协同注意力模块DynaMSAttn,增强模型对不同尺度目标和复杂环境的适应性。实验结果显示,与YOLO11n相比,DC-YOLO算法在CrowdHuman数据集上,mAP@0.5、mAP@0.5-0.95分别提升4.7%和4.5%,同时参数量降低了46.2%,通过对比实验和消融实验,验证了DC-YOLO算法在密集行人检测任务中具有优秀的检测效果和鲁棒性。 展开更多
关键词 密集行人检测 YOLO11 轻量化模型 多尺度卷积 动态注意力机制
在线阅读 下载PDF
融合先验掩膜与YOLOv8的FOD检测方法研究
12
作者 费春国 陈世洪 《电子测量技术》 北大核心 2026年第2期65-78,共14页
为了解决YOLOv8在检测机场跑道异物时由于某些异物体积较小、空间位置随机及异物间尺度差距大而引起的漏检误检问题,本文对YOLOv8进行改进,提出应用先验掩膜的针对小目标的AMMS-YOLOv8。首先在主干网络中,引入各向同性边缘检测算子并构... 为了解决YOLOv8在检测机场跑道异物时由于某些异物体积较小、空间位置随机及异物间尺度差距大而引起的漏检误检问题,本文对YOLOv8进行改进,提出应用先验掩膜的针对小目标的AMMS-YOLOv8。首先在主干网络中,引入各向同性边缘检测算子并构建EIEStim,增强模型的小边缘感知及预处理能力。同时替换下采样,将改进后的接受场注意力应用在检测领域,构建LDFDS,增强空间感知并保护微小语义信息;其次重构Neck层结构,允许多尺度特征聚合,构建出CCFPN以增强模型对多尺度异物的语义感知;最后向检测头中嵌入先验异物掩膜特征,并将其与深度特征级联形成了MSN-Head,以强化模型空间感知力。使用自建的复杂场景异物数据集对模型检测能力进行验证分析,在该数据集上AMMS-YOLOv8的mAP50及mAP50-95分别提升了1.8%及1.7%,准确率、召回率、F1函数分别达到了0.971、0.976和0.973,相比原网络有很大提升。实验结果验证了改进方法的有效性,同时应用向复杂场景异物数据集中加入FOD-A的混合数据集和复杂输电线路异物数据集对AMMS-YOLOv8做了泛化性及鲁棒性对比实验,经实验表明各项指标均有提升。 展开更多
关键词 YOLOv8 机场跑道异物(FOD) 目标检测 深度学习
在线阅读 下载PDF
基于STM32的巨型视频矩阵切换系统设计
13
作者 顾逸韬 肖金球 汪俞成 《现代电子技术》 北大核心 2026年第8期54-60,共7页
随着多媒体技术的发展,音视频录制规格与质量逐渐提高,人们对于影音体验的要求也随之增多,因此对视频切换监控系统的要求越来越严格,亟需性能更好、稳定性更高的音视频系统。在闭路电视监控系统与高清视频监控系统中,高质量视频信号和VG... 随着多媒体技术的发展,音视频录制规格与质量逐渐提高,人们对于影音体验的要求也随之增多,因此对视频切换监控系统的要求越来越严格,亟需性能更好、稳定性更高的音视频系统。在闭路电视监控系统与高清视频监控系统中,高质量视频信号和VGA信号要求使用高带宽、高稳定性、低串扰、低成本的切换系统,以完成信号源的切换过程。该方案采用STM32F103ZET6、LC4384V和AD8118三大主流器件,非常适用于复合视频路由,可实现音视频信号单对单、单对多、多对单及多对多的输入输出切换,最多可达128路。该系统可应用于CCTV闭路电视监控、分量视频路由,以及视频会议、数字签名等场景中的高清视频路由器。测试结果表明,所提系统相较于传统视频切换矩阵,具备更好的实时级联控制能力、更多的输入输出接口与良好的堆叠扩展性能,且操作相对简单。在扩展级联时无需额外上位机控制,实现了更好的效果,并且在总体上降低了设备硬件成本。 展开更多
关键词 视频矩阵 视频信号 矩阵切换 CAN总线 CPLD 模拟交叉点 数字交叉点 实时操作系统
在线阅读 下载PDF
面向大语言模型的医学图像语义挖掘跨模态哈希
14
作者 刘青海 吴钱林 +2 位作者 罗佳 唐伦 徐黎明 《电子与信息学报》 北大核心 2026年第3期1167-1179,共13页
针对医学图像与文本深层语义关系建模不足的挑战,该文提出基于大语言模型(LLM)驱动的医学图像语义挖掘哈希方法。首先,联合大语言模型的语义泛化能力,设计了图像描述型、诊断报告总结型和联合模态推理型提示模板进行模态数据增强,从而... 针对医学图像与文本深层语义关系建模不足的挑战,该文提出基于大语言模型(LLM)驱动的医学图像语义挖掘哈希方法。首先,联合大语言模型的语义泛化能力,设计了图像描述型、诊断报告总结型和联合模态推理型提示模板进行模态数据增强,从而实现了对医学图像和诊断报告数据的深层次语义挖掘。其次,设计了结构化编码层,以确保图像和文本的特征能够在统一的嵌入空间内进行精确匹配。然后,设计了提示指令模板,采用软提示和硬提示相结合的方式微调大语言模型,实现图像和文本特征的对齐。最后,引入高斯2元受限玻尔兹曼机进行概率化哈希映射,有效保留数据结构信息。实验验证,该方法与最近的经典跨模态哈希检索方法相比,在两个数据集上平均检索精度分别提升7.21%和7.72%。 展开更多
关键词 跨模态检索 哈希编码 大语言模型 语义对齐 数据增强
在线阅读 下载PDF
适应遥感船舶图像的轻量化旋转小目标检测网络 被引量:5
15
作者 孙伟 沈欣怡 +1 位作者 张小瑞 管菲 《电子测量与仪器学报》 北大核心 2025年第4期122-131,共10页
遥感图像船舶目标小、背景复杂、姿态变化大,传统船舶检测算法为提升精度,往往忽视了模型规模和实时性,难以应用到资源受限的设备上。针对上述问题,提出一种适应遥感船舶图像的轻量化旋转小目标检测网络(RFDNet)。考虑到遥感船舶图像拍... 遥感图像船舶目标小、背景复杂、姿态变化大,传统船舶检测算法为提升精度,往往忽视了模型规模和实时性,难以应用到资源受限的设备上。针对上述问题,提出一种适应遥感船舶图像的轻量化旋转小目标检测网络(RFDNet)。考虑到遥感船舶图像拍摄距离远而导致图片中目标较小且图像中包含丰富的背景信息,设计注意力卷积融合双分支网络(ACFNet),通过对局部特征信息与全局空间感知信息的充分提取,提高船舶小目标检测精度;为避免船舶目标姿态各异而导致检测时的精度下降,利用旋转目标方向信息引入旋转边界框损失函数,获得更准确的边界框回归损失,提升任意方向旋转船舶目标的检测性能;针对为提高模型精度而带来的参数量增加问题,在特征融合部分引入轻量级卷积,将卷积、深度可分离卷积以及通道混洗相结合,减少模型的参数量。通过对比实验和消融实验证明,RFDNet在HRSC2016数据集和DOTA数据集上的平均精度均值(mAP)分别达到了97.63%和81.63%,模型参数降到了2.99×10^(6),在有效提升检测精度的同时实现了模型的轻量化设计,为遥感船舶目标检测算法在资源受限设备上的应用提供了新思路。 展开更多
关键词 遥感图像 旋转目标检测 深度学习 特征融合 损失函数
在线阅读 下载PDF
融合多源信息及图像特征泛化的空气质量检测 被引量:1
16
作者 王晓婷 崔雅博 刘丽娜 《电子测量技术》 北大核心 2025年第13期166-173,共8页
针对空气PM_(2.5)浓度检测过度依赖专业设备的问题,提出了一种融合多源信息及图像特征泛化的空气质量检测算法。首先采用EfficientNet-B0作为主干网络对输入的大气可见光图像进行特征编码,将温度、湿度、风速、气压和光照强度等多源气... 针对空气PM_(2.5)浓度检测过度依赖专业设备的问题,提出了一种融合多源信息及图像特征泛化的空气质量检测算法。首先采用EfficientNet-B0作为主干网络对输入的大气可见光图像进行特征编码,将温度、湿度、风速、气压和光照强度等多源气象信息映射为与大气图像对应的特征向量,并与大气图像特征进行拼接融合;然后利用全连接层将全局特征输出为标量,并利用损失函数检测出空气的PM_(2.5)浓度;最后在网络模型训练阶段,通过对大气图像不同尺度的特征进行随机泛化增强来丰富样本分布空间,使网络能够在有限的数据样本中学习到更多特征,从而有效改善了检测网络的性能。实验结果表明:设计的检测方法与几种主流的方法相比具有更高的检测精度和稳定性,在测试集上得到的RMSE和R-squared分别为21.55μg/m^(3)和0.923,通过对8个场景检测,得到结果的平均误差仅为5.2%,最大误差也仅为7.6%,能够适应各类极端大气污染环境的空气质量检测任务。 展开更多
关键词 空气质量 PM_(2.5)检测 卷积神经网络 多源信息 特征泛化增强 特征融合
在线阅读 下载PDF
面向高分辨率图像传输的CNN网络编码方案研究 被引量:1
17
作者 刘娜 杨颜博 +2 位作者 张嘉伟 李宝山 马建峰 《西安电子科技大学学报》 北大核心 2025年第2期225-238,共14页
网络编码技术可以有效提升网络的吞吐率,然而,传统网络编码的编解码复杂度高且难以自适应环境噪声等动态因素的影响而容易导致解码失真,近年来有研究者引入神经网络以优化网络编码过程,但在高分辨率图像传输任务中,现有的神经网络编码... 网络编码技术可以有效提升网络的吞吐率,然而,传统网络编码的编解码复杂度高且难以自适应环境噪声等动态因素的影响而容易导致解码失真,近年来有研究者引入神经网络以优化网络编码过程,但在高分辨率图像传输任务中,现有的神经网络编码方案对高维度空间信息的捕捉能力不足,带来较大的通信及计算开销。为此,文中提出采用二维卷积神经网络(CNN)对各网络节点的编解码器进行参数化设计的联合源的深度学习网络编码方案,通过CNN捕捉深层空间结构信息并降低网络节点的计算复杂度。在信源节点,通过卷积层运算实现对传输数据的降维处理,提升数据的传输速率;在中间节点,接收来自两个信源的数据并通过CNN编码压缩至单个信道传输;在信宿节点,对接收到的数据利用CNN进行升维解码而恢复出原始图像。实验表明,在不同信道带宽占用比和信道噪声水平下,该方案在峰值信噪比和结构相似度上展现出优良的解码性能。 展开更多
关键词 网络编码 深度学习 卷积神经网络 高分辨率图像 图像通信
在线阅读 下载PDF
改进YOLOv8的密集人群口罩检测算法 被引量:3
18
作者 伍锡如 梁诗意 《电子测量技术》 北大核心 2025年第1期55-63,共9页
针对公共场合密集人群场景下由于人群遮挡导致的信息缺失及检测目标较小、分辨率低导致人脸佩戴口罩检测算法检测困难的问题,提出了一种改进YOLOv8的密集人群口罩检测算法。采用GD机制代替YOLOv8中FPN结构解决跨层信息传输中信息丢失的... 针对公共场合密集人群场景下由于人群遮挡导致的信息缺失及检测目标较小、分辨率低导致人脸佩戴口罩检测算法检测困难的问题,提出了一种改进YOLOv8的密集人群口罩检测算法。采用GD机制代替YOLOv8中FPN结构解决跨层信息传输中信息丢失的问题,GD使用一个统一的模块收集和融合所有层级的信息,实现网络跨层信息的无损传输,增强了网络特征提取能力。在GD机制中插入ODconv模块对GD传输的信息沿4个维度进行学习,提高模型低分辨目标和小目标的检测精度。此外,引入了一种轻量化检测头SCSBD,对占比过高的YOLOv8检测头进行轻量化处理,平衡模型大小。实验结果表明,改进后的网络在精确率、召回率和平均精度上分别提升了13.6%、1.5%和6.9%,对人脸口罩的检测精度达到了81.1%,模型权重文件仅为25 MB,模型大小介于YOLOv8s和Gold-YOLO-S之间,达到了大小和精度的平衡。 展开更多
关键词 密集人群 口罩检测 YOLOv8 GD机制 ODConv SCSBD 特征提取 轻量化
在线阅读 下载PDF
改进YOLOv11的无人机航拍图像检测算法 被引量:1
19
作者 李珺 丁彬彬 +1 位作者 史维娟 杨琳 《电子测量技术》 北大核心 2025年第18期111-121,共11页
针对无人机航拍图像检测任务中,存在目标尺寸微小且背景环境复杂,往往会导致漏检和误检的问题,本文提出了一种基于YOLOv11的航拍图像小目标检测算法WT-YOLO。首先,考虑到无人机航拍图像普遍为小目标的问题,调整了YOLOv11颈部网络的结构... 针对无人机航拍图像检测任务中,存在目标尺寸微小且背景环境复杂,往往会导致漏检和误检的问题,本文提出了一种基于YOLOv11的航拍图像小目标检测算法WT-YOLO。首先,考虑到无人机航拍图像普遍为小目标的问题,调整了YOLOv11颈部网络的结构,改变了输出特征图的尺寸,提高了算法对小目标的检测能力。其次,结合WTConv,重新设计了Bottleneck和C3k2模块的结构,命名为C3k2-WT,来实现特征的高效提取。再次,引入Focal-Modulation来替换SPPF,通过在不同的空间尺度上聚焦和调制特征,使得模型在处理复杂场景时更具鲁棒性;最后,设计了共享卷积检测头,通过卷积共享机制,减少了模型的参数量,同时增强了特征图之间的全局信息融合能力。改进后的算法在VisDrone2019数据集上的实验表明,相较于基础YOLOv11s模型,准确率(P)、召回率(R)和检测精度(mAP50)分别提升了5.6%,5.9%和7.5%,并且参数量下降了约1/4,对比其他算法表现出了良好的性能。 展开更多
关键词 航拍图像 目标检测 YOLOv11 无人机 小目标
在线阅读 下载PDF
基于改进Vision Transformer的水稻叶片病害图像识别 被引量:1
20
作者 朱周华 周怡纳 +1 位作者 侯智杰 田成源 《电子测量技术》 北大核心 2025年第10期153-160,共8页
水稻叶片病害智能识别在现代农业生产中具有重要意义。针对传统Vision Transformer网络缺乏归纳偏置,难以有效捕捉图像局部细节特征的问题,提出了一种改进的Vision Transformer模型。该模型通过引入内在归纳偏置,增强了对多尺度上下文... 水稻叶片病害智能识别在现代农业生产中具有重要意义。针对传统Vision Transformer网络缺乏归纳偏置,难以有效捕捉图像局部细节特征的问题,提出了一种改进的Vision Transformer模型。该模型通过引入内在归纳偏置,增强了对多尺度上下文以及局部与全局依赖关系的建模能力,同时降低了对大规模数据集的需求。此外,Vision Transformer中的多层感知器模块被Kolmogorov-Arnold网络结构取代,从而提升了模型对复杂特征的提取能力和可解释性。实验结果表明,所提模型在水稻叶片病害识别任务中取得了优异的性能,识别准确率达到了98.62%,较原始ViT模型提升了6.2%,显著提高了对水稻叶片病害的识别性能。 展开更多
关键词 水稻叶片病害 图像识别 Vision Transformer网络 归纳偏置 局部特征
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部