期刊文献+
共找到31篇文章
< 1 2 >
每页显示 20 50 100
基于多分支HRNet的图像篡改检测与定位模型 被引量:1
1
作者 曾桢 谭平 《现代电子技术》 北大核心 2025年第3期35-42,共8页
传统的篡改方法如拷贝粘贴和拼接已演变为利用深度学习生成的高质量伪造图像,这些篡改技术在图像纹理和细节上留下难以察觉的痕迹,如高频噪声模式的异常、颜色分布的微妙变化,以及边缘区域的不自然过渡。这些痕迹分布在不同分辨率层次... 传统的篡改方法如拷贝粘贴和拼接已演变为利用深度学习生成的高质量伪造图像,这些篡改技术在图像纹理和细节上留下难以察觉的痕迹,如高频噪声模式的异常、颜色分布的微妙变化,以及边缘区域的不自然过渡。这些痕迹分布在不同分辨率层次和空间位置,增加了检测的难度。现有模型在整合多尺度和多位置特征时存在不足,难以有效捕捉局部细微纹理变化。针对这一问题,文中提出一种基于多分支HRNet的图像篡改检测与定位模型。该模型通过集成纹理增强模块,增强对图像篡改细节特征的捕获能力。同时,结合Spatial Weighting与Cross Resolution Weighting策略优化特征融合,并使用新的损失函数W_Arcloss,显著提升了模型在复杂篡改检测任务中的性能。在CASIA、Columbia、COVERAGE和NIST16等数据集上,该模型的检测准确度相较于PSCC⁃Net、HIFI⁃Net模型分别平均提升了6.5%与0.8%,并且泛化能力得到提升。这些结果证明了模型在处理多种篡改类型时的有效性和鲁棒性,为图像篡改检测与定位领域提供了新的研究视角和技术手段。 展开更多
关键词 图像篡改检测 深度学习 多分支hrnet 纹理增强模块 Spatial Weighting Cross Resolution Weighting W_Arcloss
在线阅读 下载PDF
基于改进HRNet和椭圆拟合的PDC钻头复合片磨损定级方法
2
作者 程占波 熊凌 +3 位作者 丁昕 陈刚 叶道辉 李姝凡 《石油机械》 北大核心 2025年第8期25-34,43,共11页
针对目前PDC钻头复合片磨损定级存在效率低、标准性差、精度不足等问题,提出一种基于改进HRNet和椭圆拟合的磨损定级方法。使用语义分割算法对复合片轮廓进行提取,使用深度可分离卷积替换HRNet网络的普通卷积,对网络特征提取层的4个不... 针对目前PDC钻头复合片磨损定级存在效率低、标准性差、精度不足等问题,提出一种基于改进HRNet和椭圆拟合的磨损定级方法。使用语义分割算法对复合片轮廓进行提取,使用深度可分离卷积替换HRNet网络的普通卷积,对网络特征提取层的4个不同分辨率输出通过CGAF模块进行特征融合,同时对融合特征图引入EMA注意力模块。通过RANSAC椭圆拟合算法进行数据预处理、拟合椭圆筛选及内点补充,进而提高分割复合片的拟合精度。并对复合片进行磨损定级。试验结果表明:改进后的HRNet网络平均交并比、类别平均像素准确率与原HRNet网络相比达到97.60%和98.79%,参数量降低72%,模型大小减小70%,定级准确率达到96.5%,单张复合片定级所需平均时间仅为0.261 s。所得结论可为油田降低钻井成本提供理论参考。 展开更多
关键词 PDC钻头复合片 磨损定级 hrnet网络模型 椭圆拟合 CGAF模块 语义分割
在线阅读 下载PDF
基于改进HRNet和PPM的图像语义分割方法的研究
3
作者 师佳琪 杨皓浚 +1 位作者 刘晓悦 陈鑫 《现代电子技术》 北大核心 2025年第7期29-34,共6页
为解决现有语义分割模型无法兼顾全局语义信息与局部细节信息,以及残差模块细节特征提取能力弱的问题,提出一种语义分割方法。在HRNet的基础上引入了金字塔池化模块,兼顾了全局语义信息和局部细节信息,同时在原有残差模块Basic Block的... 为解决现有语义分割模型无法兼顾全局语义信息与局部细节信息,以及残差模块细节特征提取能力弱的问题,提出一种语义分割方法。在HRNet的基础上引入了金字塔池化模块,兼顾了全局语义信息和局部细节信息,同时在原有残差模块Basic Block的基础上引入大核深度卷积提高模型的细节特征提取能力,大幅度提高模型的精度。在PASCAL VOC2012图像数据集上的实验表明,相较于原始HRNet等其他分割网络,该算法取得了分割精度的显著提升,平均分割精度达到了89.27%。各设计模块的有效性也通过消融实验得以验证,尤其是改进Basic Block对提升分割性能具有关键作用,该模型大幅度提升了图像语义分割精度,提供了一种高效率、稳定且适用场景更加普遍的多尺度语义分割算法。 展开更多
关键词 hrnet 金字塔池化模块 大核深度卷积 残差模块 语义分割 深度学习
在线阅读 下载PDF
基于改进HRNet的高速公路路域内光伏板信息提取
4
作者 王靖凯 葛星彤 +2 位作者 李兆博 丁翔 彭玲 《测绘通报》 北大核心 2025年第5期74-78,99,共6页
随着绿色能源需求的日益增长,高速公路路域内光伏板基础设施成为可再生能源发展的一种重要途径。收费站和服务区作为高速公路路域的重要组成部分,其光伏发电也受到重视。本文研究了利用深度学习方法通过高分辨率遥感影像识别高速公路路... 随着绿色能源需求的日益增长,高速公路路域内光伏板基础设施成为可再生能源发展的一种重要途径。收费站和服务区作为高速公路路域的重要组成部分,其光伏发电也受到重视。本文研究了利用深度学习方法通过高分辨率遥感影像识别高速公路路域内收费站和服务区配置光伏板信息的技术方法。以江苏省作为研究试验区,下载全省谷歌19级遥感影像数据,通过制作样本,使用现有经典语义分割网络HRNet、ResNet、FCN和U-Net对试验区进行信息提取,获得光伏板信息提取结果;通过消融试验证实了本文融合CBAM注意力机制的HRNet语义分割网络提取效果最佳。该方法为高速公路路域内收费站和服务区的光伏板智能监测管理提供了技术支撑。 展开更多
关键词 高速公路路域内光伏 高分辨率遥感影像 改进的hrnet语义分割网络 CBAM注意力机制 江苏省试验区
在线阅读 下载PDF
基于HRNet和自注意力机制的多源遥感影像水稻提取 被引量:3
5
作者 蔡玉林 刘照磊 +2 位作者 孟祥磊 王思超 高洪振 《农业工程学报》 EI CAS CSCD 北大核心 2024年第4期186-193,共8页
为了提高协同光学和雷达影像提取水稻的精度,该研究通过改进深度学习网络HRNet,提出一种多级特征融合的框架方法,改进后的MSATT-HRNet模型综合利用欧空局哥白尼项目哨兵1号(Sentinel-1)的双极化合成孔径雷达(synthetic aperture radar,S... 为了提高协同光学和雷达影像提取水稻的精度,该研究通过改进深度学习网络HRNet,提出一种多级特征融合的框架方法,改进后的MSATT-HRNet模型综合利用欧空局哥白尼项目哨兵1号(Sentinel-1)的双极化合成孔径雷达(synthetic aperture radar,SAR)影像和哨兵2号(Sentinel-2)多光谱光学影像,提取了湖南省长沙市望城区水稻种植区域。针对HRNet网络的改进主要包括两部分:1)设计了通道注意力机制与最大池化组成的卷积组用于提取SAR特征,同时将自注意力模块嵌入HRNet基础特征提取模块中用于提取多光谱光学影像的特征;2)为了探索双模态特征之间的内在互补关系,设计了由通道注意力与空间注意力组成的特征融合模块。研究针对改进模型进行了消融试验,并将MSATT-HRNet与其他常用深度学习方法(MCANet、Deeplabv3、Unet)进行了比较。结果表明,该研究提出的多源数据融合方法能够利用不同数据源的互补优势。水稻种植区域提取结果的总体精度、Kappa系数分别达到97.04%和0.961,与MCANet、Deeplabv3、Unet相比,总体精度分别提高6.90、2.67和2.98个百分点,Kappa系数分别提高0.055、0.025和0.030。证实了该方法可以有效提高水稻的判别精度。研究通过深度学习技术与遥感影像的耦合,为南方多云雨地区水稻制图提供了一种可行的选择。 展开更多
关键词 遥感 合成孔径雷达 水稻 光学影像 hrnet 注意力机制
在线阅读 下载PDF
基于HRNet的高分辨率遥感影像道路提取方法 被引量:9
6
作者 陈雪梅 刘志恒 +2 位作者 周绥平 余航 刘彦明 《系统工程与电子技术》 EI CSCD 北大核心 2024年第4期1167-1173,共7页
高分辨率遥感影像中,传统的道路提取方法存在着精度低、鲁棒性低的问题,提出基于高分辨率网络(high-resolution net, HRNet)实现高分辨率遥感影像道路分割。对HRNet进行改进,将相同分辨率的HRNet子网的输出与输出层结果进行拼接并输入... 高分辨率遥感影像中,传统的道路提取方法存在着精度低、鲁棒性低的问题,提出基于高分辨率网络(high-resolution net, HRNet)实现高分辨率遥感影像道路分割。对HRNet进行改进,将相同分辨率的HRNet子网的输出与输出层结果进行拼接并输入非局部块,两个损失函数Cross-entropy Loss和Dice Loss用来解决道路数据集样本不平衡问题。实验结果表明,改进的HRNet在公开的CHN6-CUG道路数据集上的分割性能与其他方法相比对道路的提取效果更好,在召回率、均交并比和F1分数3个方面分别达到了97.65%、84.91%和97.25%。 展开更多
关键词 高分辨率网络 非局部块 遥感影像 深度学习
在线阅读 下载PDF
融合Lite-HRNet的Yolo v5双模态自动驾驶小目标检测方法 被引量:10
7
作者 刘子龙 沈祥飞 《汽车工程》 EI CSCD 北大核心 2022年第10期1511-1520,1536,共11页
针对目前自动驾驶领域的目标检测算法在对道路小目标和密集目标进行检测的时候出现漏检的问题,提出一种融合Lite-HRNet的Yolo v5网络。首先为了获得高分辨率的特征检测图将Lite-HRNet作为Yolo v5的主干网络,以增强对小目标及密集目标的... 针对目前自动驾驶领域的目标检测算法在对道路小目标和密集目标进行检测的时候出现漏检的问题,提出一种融合Lite-HRNet的Yolo v5网络。首先为了获得高分辨率的特征检测图将Lite-HRNet作为Yolo v5的主干网络,以增强对小目标及密集目标的检测。为提升暗光场景下的检测性能,将红外图像与可见光图像进行动态权值融合,充分发挥可见光图像与红外图像的互补优势。由于主干网络进行了充分的特征融合,为加快检测速度取消在检测层中的特征融合结构。其次为了加快收敛速度和提高回归精度采用α-EIoU作为边界框损失函数,同时为选取针对数据集更合适的先验框,使用二分K-means算法进行聚类,并且使用小目标数据增强算法对数据集进行样本扩充。最后在flir数据集上进行对比测试,根据实验结果,提出的算法比Yolo v5在平均精度上提高了7.64%,小目标和密集目标的漏检率明显减少。 展开更多
关键词 自动驾驶 目标检测 红外图像 Yolo v5 小目标 Lite-hrnet
在线阅读 下载PDF
基于HRNet的高分辨率遥感影像建筑物变化信息提取 被引量:12
8
作者 陈智朗 付振华 +4 位作者 朱紫阳 王慧慧 刘沁雯 杨钰灵 许耿然 《测绘通报》 CSCD 北大核心 2022年第5期126-132,共7页
建筑物图斑变化检测是遥感影像信息提取的重要内容之一,对于土地调查、自然资源常态化监测、土地执法监测等具有重要意义。岭南地区建设结构复杂,高分辨率遥感影像信息丰富,包含建筑结构细节多种多样,加上成像的季节不同、时间不同等因... 建筑物图斑变化检测是遥感影像信息提取的重要内容之一,对于土地调查、自然资源常态化监测、土地执法监测等具有重要意义。岭南地区建设结构复杂,高分辨率遥感影像信息丰富,包含建筑结构细节多种多样,加上成像的季节不同、时间不同等因素导致建筑物变化信息的自动提取十分困难。针对此问题,本文提出了基于HRNet的语义分割模型,通过筛选保留高分辨率的特征层,从而保留更细节的图像信息。此外,结合图像分割二值化对结果进行优化,在一定程度上提高了高分辨率遥感影像建筑物变化自动检测的能力。 展开更多
关键词 高分辨率遥感影像 建筑物变化信息提取 hrnet 图像分割二值化
在线阅读 下载PDF
基于CBAM-U-HRNet模型和Sentinel-2数据的棉花种植地块提取 被引量:5
9
作者 靳宁 孙林 +3 位作者 张东彦 张选 李毅 姚宁 《农业机械学报》 EI CAS CSCD 北大核心 2023年第11期159-168,共10页
棉花是我国重要的经济作物和战略储备物资,及时、准确地获取棉花空间分布信息对于棉花产量预测、农业政策的制定与调整具有重要意义。针对高分辨率遥感影像获取难度大以及传统机器学习对特征信息利用不足的问题,本文以新疆南部地区图木... 棉花是我国重要的经济作物和战略储备物资,及时、准确地获取棉花空间分布信息对于棉花产量预测、农业政策的制定与调整具有重要意义。针对高分辨率遥感影像获取难度大以及传统机器学习对特征信息利用不足的问题,本文以新疆南部地区图木舒克市为目标区域,提出一种以U-HRNet为基本框架,融合CBAM注意力机制的CBAM-U-HRNet棉花种植地块提取模型。选择U-Net、HRNet和U-HRNet作为对比模型,评估CBAM-U-HRNet模型在Sentinel-2(10 m)和GF-2(1 m)2种空间分辨率数据集上的表现以及在棉花地块提取的优势。结果表明,基于Sentinel-2遥感影像的CBAM-U-HRNet组合模型对棉花地块的提取精度最优,mIoU和mPA分别达到92.78%和95.32%。与Sentinel-2数据集相比,空间分辨率更高的GF-2数据在HRNet、U-Net和U-HRNet网络上取得了更高的精度。对于两种不同空间分辨率的数据集,基于CBAM-U-HRNet模型的棉花地块提取精度较为接近,表明CBAM-U-HRNet模型能够减少由于数据集空间分辨率不同导致的错分。与随机森林算法相比,CBAM-U-HRNet模型对棉花地块提取的准确率更高。研究结果可以为干旱地区棉花识别与种植地块快速提取提供技术支撑。 展开更多
关键词 棉花 种植地块提取 注意力机制 CBAM-U-hrnet模型 Sentinel-2
在线阅读 下载PDF
一种改进型Dense-HRNet和基尼指数动态加权决策的表情识别算法 被引量:2
10
作者 蓝峥杰 王烈 黄莹 《电讯技术》 北大核心 2022年第11期1683-1690,共8页
针对当前人脸表情识别算法识别精度不高、网络鲁棒性差的缺点,设计了一种改进型Dense-HRNet特征提取网络,使用稠密连接机制强化了HRNet中浅层特征与深层特征间的传递和融合方式。同时,提出了一种基于基尼指数动态加权决策算法,根据每一... 针对当前人脸表情识别算法识别精度不高、网络鲁棒性差的缺点,设计了一种改进型Dense-HRNet特征提取网络,使用稠密连接机制强化了HRNet中浅层特征与深层特征间的传递和融合方式。同时,提出了一种基于基尼指数动态加权决策算法,根据每一卷积神经网络(Convolutional Neural Network,CNN)支路分类的确定性,为各支路输出动态地赋予权重,提高多路CNN支路融合决策的准确性,解决了由于单路CNN分类不确定性引起的偶然误差。在FER2013数据集和CK+数据集上进行实验,所提方法分类准确率分别达到73.36%和97.59%。 展开更多
关键词 人脸表情识别 Dense-hrnet 基尼指数 加权决策
在线阅读 下载PDF
应用U-HRNet+SoftTripleLoss的HiFi-Net伪造图像检测技术研究 被引量:2
11
作者 宋家骏 刘桂雄 +1 位作者 黄家曦 张国才 《中国测试》 CAS 北大核心 2023年第9期37-45,共9页
伪造图像若被不当利用会带来严重负面影响,不同伪造图像生成方法导致伪造属性差异,使得研究统一图像伪造检测、定位方法具有很大挑战性。该文提出一种应用U-HRNet+SoftTripleLoss的HiFi-Net伪造图像检测方法,首先采用U-HRNet替代HiFi-Ne... 伪造图像若被不当利用会带来严重负面影响,不同伪造图像生成方法导致伪造属性差异,使得研究统一图像伪造检测、定位方法具有很大挑战性。该文提出一种应用U-HRNet+SoftTripleLoss的HiFi-Net伪造图像检测方法,首先采用U-HRNet替代HiFi-Net特征提取网络,其网络结构促进学习图像深层特征以获取更高级的语义信息,增加多个阶段、融合通道以改善高分辨率特征;其次引入SoftTripleLoss模块,学习无约束采样的伪造属性特征嵌入表示以改善特征嵌入分布,从而更好地区分细粒度伪造属性,进而提高细粒度伪造图像分类准确率。实验表明,使用上述技术构建的检测模型像素级别总体评价指标AUC、F1分别为0.9928、0.9760,较原文献模型提高0.0025、0.0082;图像级别总体评价指标细粒度属性分类准确率Acc达98.05%,较原文献模型提高1.23%。 展开更多
关键词 伪造图像 伪造属性分类 HiFi-Net U-hrnet SoftTripleLoss
在线阅读 下载PDF
3D-HRNet网络在珠海一号高光谱影像的自然资源监测应用及生态环境分析 被引量:1
12
作者 曹德龙 林震 +2 位作者 唐廷元 李楚钰 王晓锐 《自然资源遥感》 CSCD 北大核心 2023年第4期34-42,共9页
遥感和深度学习方法结合应用于自然资源的监测、评估是一种高效的方法。该研究综合考虑珠海一号高光谱影像的特性,在HRNet网络中引入3D卷积模块提出3D-HRNet网络用于自然资源调查监测的语义分割模型,并以遥感影像计算生物丰富度指数、... 遥感和深度学习方法结合应用于自然资源的监测、评估是一种高效的方法。该研究综合考虑珠海一号高光谱影像的特性,在HRNet网络中引入3D卷积模块提出3D-HRNet网络用于自然资源调查监测的语义分割模型,并以遥感影像计算生物丰富度指数、植被覆盖指数、水网密度指数、土地应力指数、污染负荷指数和环境约束指数构建生态指数(ecological index,EI)生态评价模型,对北京市北部部分区域进行自然资源监测和评估。结果表明:①3D-HRNet模型提取自然资源的平均总体精度为0.83,F1分数为0.83,Kappa系数为0.73,比HRNet模型分别高0.04,0.04和0.06,比3D-CNN模型分别高0.04,0.05和0.06,说明3D-HRNet模型提取高光谱影像的自然资源结果比HRNet模型更好,即3D卷积模块能更好地利用高光谱间特性提取信息;②利用EI生态评价模型对北京市北部部分区域2020年生态环境进行评价,其EI平均值为68.2,反映了区域内生态状况良好,与北京市生态环境状况公报结论接近,说明遥感用于EI生态评价的可行性,为区域生态状况的时空分析提出创新性方法。 展开更多
关键词 3D-hrnet 珠海一号高光谱影像 自然资源调查监测 EI生态评价
在线阅读 下载PDF
改进的HRNet应用于路面裂缝分割与检测 被引量:13
13
作者 张伯树 张志华 张洋 《测绘通报》 CSCD 北大核心 2022年第3期83-89,共7页
针对利用传统卷积神经网络进行路面裂缝分割时存在准确率低、信息丢失及边缘模糊的问题,本文提出了基于改进HRNet模型的路面裂缝分割算法。模型在原始HRNet的基础上进行改进,主干网络部分采用DUC模块代替双线性插值上采样;下采样改为pas... 针对利用传统卷积神经网络进行路面裂缝分割时存在准确率低、信息丢失及边缘模糊的问题,本文提出了基于改进HRNet模型的路面裂缝分割算法。模型在原始HRNet的基础上进行改进,主干网络部分采用DUC模块代替双线性插值上采样;下采样改为passthrough layer代替原始卷积;在模型解码部分,进行逐级上采样的同时引入SE-Block,对不同特征层的融合重新标定权重。通过与原始HRNet及传统卷积神经网络U-Net对比可知,本文算法在公共数据与自制数据集上的分割精度表现优秀,F1分值分别达到了91.31%和78.69%,可以很好地满足实际工程的需求。 展开更多
关键词 路面裂缝 hrnet DUC passthrough layer SE-Block 图像分割
在线阅读 下载PDF
基于E-HRNet的路面破损区域识别方法 被引量:7
14
作者 张大伟 田抑阳 +1 位作者 徐培娟 钟琛 《北京交通大学学报》 CAS CSCD 北大核心 2023年第4期110-119,共10页
针对现有路面破损区域识别方法识别效率低、泛化性能差等问题,提出了一种基于深度高分辨率网络HRNet的路面坑槽和裂缝识别方法.采用车载单目相机实地采集路面坑槽和裂缝图像,并对图像进行预处理和标注,生成路面破损数据集.在原HRNet基础... 针对现有路面破损区域识别方法识别效率低、泛化性能差等问题,提出了一种基于深度高分辨率网络HRNet的路面坑槽和裂缝识别方法.采用车载单目相机实地采集路面坑槽和裂缝图像,并对图像进行预处理和标注,生成路面破损数据集.在原HRNet基础上,对其网络特征提取层的4个不同分辨率表征分别融合改进的卷积注意力模块,形成E-HRNet网络模型.为了提高EHRNet模型的推理速度,对其各步骤中不同分辨率分支的残差层数进行了优化,并采用联合损失函数对该模型进行监督训练.试验结果表明:E-HRNet网络模型对路面坑槽和裂缝区域分割的平均像素精度和平均交并比分别达到了94.53%和88.31%,与原HRNet网络模型相比,平均像素准确率增加了6.53%,平均交并比提升了5.38%,平均类别准确率提高了1.39%;模型检测帧率提高了30.3%,而模型体积则减少了42.6%,可满足模型轻量化和实时检测的需求;与DDRNet、Deep⁃labV3+等同类模型相比,E-HRNet网络模型对坑槽和裂缝区域的分割精度更高,有效地避免了漏检、误检以及边界模糊等问题的出现,具有更好的实时性和泛化性. 展开更多
关键词 视觉感知 E-hrnet 路面破损识别 路面坑槽 裂缝
在线阅读 下载PDF
多尺度和多层级特征融合的人体姿态估计 被引量:2
15
作者 王燕妮 胡敏 +2 位作者 韩世鹏 陈艺瑄 吕昊 《计算机工程与应用》 北大核心 2025年第6期199-209,共11页
人体姿态估计的精度提升通常依赖于特征融合,但是现有特征融合策略往往忽略了尺度特征和层级特征之间的交互作用。为了充分利用不同特征之间的互补性,提出了一种新特征融合策略用以提升人体姿态估计精度,即多尺度和多层级特征融合网络(m... 人体姿态估计的精度提升通常依赖于特征融合,但是现有特征融合策略往往忽略了尺度特征和层级特征之间的交互作用。为了充分利用不同特征之间的互补性,提出了一种新特征融合策略用以提升人体姿态估计精度,即多尺度和多层级特征融合网络(multi-scale and multi-level network,MSLNet)。采用高分辨率网络(high-resolution network,HRNet)作为主干,通过跨尺度信息交互,实现不同分辨率特征图之间的信息交换,获取同时包含细粒度和粗粒度的姿态特征;引入期望最大化注意力-加权双向特征金字塔网络(expectation maximization attention-bidirectional feature pyramid network,EMA-BiFPN),实现多尺度特征融合后的多层级特征聚合,从局部到全局捕捉人体姿态的细节和关联信息;设计由残差结构组成的关键点检测头,完成输出特征的最终融合并提升人体关键点检测准确率。实验结果表明,MSLNet在COCO和MPII数据集上分别取得了75.8%和91.1%的准确率,实现了最优精度,充分验证了MSLNet能够融合尺度和层级之间的互补特征,进而提升人体姿态估计精度。 展开更多
关键词 高分辨率网络(hrnet) 人体姿态估计 期望最大化注意力 双向特征金字塔网络 特征融合
在线阅读 下载PDF
融合局部感知增强的投篮上肢动作分解与高精度识别算法
16
作者 任宇飞 刘海林 《现代电子技术》 北大核心 2025年第18期119-124,共6页
为解决传统动作识别算法在处理篮球训练图像时存在的关节遮挡、感受野过大等问题,提出一种融合局部感知增强的高精度上肢动作分解识别模型。该模型通过轻量级HRNet分支提取人体全局结构特征,结合双流金字塔模块增强局部关节感知能力。... 为解决传统动作识别算法在处理篮球训练图像时存在的关节遮挡、感受野过大等问题,提出一种融合局部感知增强的高精度上肢动作分解识别模型。该模型通过轻量级HRNet分支提取人体全局结构特征,结合双流金字塔模块增强局部关节感知能力。空间流采用空洞卷积扩大手部感受野,时间流利用光流捕捉球员上肢的相对运动情况,显著提升了遮挡场景下的手部定位精度。同时,模型中还设计了时空分解模块进行空间与时序特征分析,强制网络聚焦并学习帧间的运动一致性,使数据处理的过程更具鲁棒性。最后引入自适应加权单元,最终输出高精度的关节点坐标。实验测试结果表明:所提模型的mAP@0.5达到86.9%,动作分类的F1值为95.3%,均优于目前的主流算法;且关键帧检出率为91.1%,帧率达到47 f/s,实时性良好,充分证明了该模型能够为篮球训练与赛事智能化分析提供可靠的技术手段。 展开更多
关键词 hrnet模型 双流金字塔 图卷积网络 时间卷积网络 人体动作识别 图像分析
在线阅读 下载PDF
基于重参数化大核卷积的高分辨率姿态估计
17
作者 陈佳艺 黄晓宇 +1 位作者 吴胜昔 王学武 《华东理工大学学报(自然科学版)》 北大核心 2025年第3期341-352,共12页
尽管人体姿态估计领域的研究已取得显著进展,但面对动态场景变化、目标遮挡及背景复杂等难题,实现高精度、强鲁棒性的姿态估计依然面临巨大挑战。为解决这些问题,特别是关键点遮挡、重合及复杂环境干扰问题,本文提出了一种融合大核卷积... 尽管人体姿态估计领域的研究已取得显著进展,但面对动态场景变化、目标遮挡及背景复杂等难题,实现高精度、强鲁棒性的姿态估计依然面临巨大挑战。为解决这些问题,特别是关键点遮挡、重合及复杂环境干扰问题,本文提出了一种融合大核卷积技术的高分辨率人体姿态估计模型(RepLK-HRNet)。该模型的核心在于特征提取网络的独特设计,通过引入重参数化大核卷积策略,增强了模型捕捉多尺度、多层次特征信息的能力,同时通过调整网络结构,显著降低了参数量和计算复杂度。实验结果表明,相较于传统的高分辨率网络(HRNet)模型,RepLK-HRNet模型在标准数据集MS COCO2017上的精度提高了1.83%,在遮挡数据集OCHuman上的精度提高了23.7%,计算复杂度参数Params和GFLOPs分别下降了63.84%、37.69%。RepLK-HRNet模型在常规及遮挡、关键点混淆等条件下的人体姿态估计精度均实现了显著提升,展现了出色的鲁棒性和泛化能力,同时还满足了实际应用中对计算效率和存储空间的要求。 展开更多
关键词 姿态估计 重参数化大核卷积 hrnet 感受野 特征融合
在线阅读 下载PDF
基于多注意力机制的人体姿态检测模型
18
作者 于松正 谭钦红 《激光杂志》 北大核心 2025年第5期78-85,共8页
提出了一种以高分辨率网络(High Resolution Net,HRNet)为基础,融合多注意力机制的人体姿态检测模型,解决了HRNet忽略不同通道间特征信息的依赖关系以及对空间特征信息关注度不足的问题。从通道域与空间域两方面着手,设计了全局通道空... 提出了一种以高分辨率网络(High Resolution Net,HRNet)为基础,融合多注意力机制的人体姿态检测模型,解决了HRNet忽略不同通道间特征信息的依赖关系以及对空间特征信息关注度不足的问题。从通道域与空间域两方面着手,设计了全局通道空间注意力(GCSA)模块和全局分组坐标注意力(GGCA)模块,并将其分别引入至网络Layer1层与Stage层以扩大网络感受野,加强特征提取的全面性与多样性。最后使用深度可分离卷积(Depthwise Separable Convolution,DSC)代替网络中传统卷积以平衡网络改进所带来的参数量与计算量的增长。实验结果表明,提出的模型在COCO数据集上检测精度达到77.8%,在MPII数据集上准确度达到了91.7%。相较于基准网络HRNet准确度分别提高了3.4%和1.3%。且与其他常用姿态检测网络相比,本网络具有更高的检测精度,能够更好地应用于日常场景。 展开更多
关键词 人体姿态检测 hrnet 注意力机制 深度学习 卷积神经网络
在线阅读 下载PDF
高分辨率关系图卷积网络遥感语义分割方法
19
作者 王寅达 陈嘉辉 +2 位作者 彭玲 李兆博 杨丽娜 《中国科学院大学学报(中英文)》 北大核心 2025年第1期107-115,共9页
遥感影像语义分割是遥感图像处理分析的重要任务,尤其是在多类别语义分割方面。目前方法主要围绕卷积神经网络展开,但卷积仅关注图像局部信息而忽视全局信息。因此,受高分辨率网络(HRNet)和关系图卷积网络(R-GCN)启发,提出一种高分辨率... 遥感影像语义分割是遥感图像处理分析的重要任务,尤其是在多类别语义分割方面。目前方法主要围绕卷积神经网络展开,但卷积仅关注图像局部信息而忽视全局信息。因此,受高分辨率网络(HRNet)和关系图卷积网络(R-GCN)启发,提出一种高分辨率关系图卷积网络(HRGCN),用于多类别语义分割。首先对原始图像做简单线性迭代聚类(SLIC),利用该结果分割HRNet输出的特征图,获得同质性高且包含多分辨率信息的超像素块;然后基于超像素块构建图节点和边,使用R-GCN对图节点分类,从而学习到不同地物间长距离依赖关系,并完成遥感影像的提取分类。利用HRGCN模型在Potsdam和Vaihingen数据集上进行实验,将结果与已有方法对比,F_(1)值和MIoU值均有不同程度提升,证明该方法具有较好的先进性。 展开更多
关键词 遥感影像 R-GCN hrnet 超像素 语义分割 图像处理
在线阅读 下载PDF
结合注意力机制和多尺度特征融合的三维手部姿态估计
20
作者 郭诗月 党建武 +1 位作者 王阳萍 雍玖 《计算机应用》 北大核心 2025年第4期1293-1299,共7页
针对因遮挡和自相似性导致的从单张RGB图像估计三维手部姿态不精确的问题,提出结合注意力机制和多尺度特征融合的三维手部姿态估计算法。首先,提出结合扩张卷积和CBAM(Convolutional Block Attention Module)注意力机制的感受强化模块(S... 针对因遮挡和自相似性导致的从单张RGB图像估计三维手部姿态不精确的问题,提出结合注意力机制和多尺度特征融合的三维手部姿态估计算法。首先,提出结合扩张卷积和CBAM(Convolutional Block Attention Module)注意力机制的感受强化模块(SEM),以替换沙漏网络(HGNet)中的基本块(Basicblock),在扩大感受野的同时增强对空间信息的敏感性,从而提高手部特征的提取能力;其次,设计一种结合SPCNet(Spatial Preserve and Contentaware Network)和Soft-Attention改进的多尺度信息融合模块SS-MIFM(SPCNet and Soft-attention-Multi-scale Information Fusion Module),在充分考虑空间内容感知机制的情况下,有效地聚合多级特征,并显著提高二维手部关键点检测的准确性;最后,利用2.5D姿态转换模块将二维姿态转换为三维姿态,从而避免二维关键点坐标直接回归计算三维姿态信息导致的空间丢失问题。实验结果表明,在InterHand2.6M数据集上,所提算法的双手关节点平均误差(MPJPE)、单手MPJPE和根节点平均误差(MRRPE)分别达到了12.32、9.96和29.57 mm;在RHD(Rendered Hand pose Dataset)上,与InterNet和QMGR-Net算法相比,所提算法的终点误差(EPE)分别降低了2.68和0.38 mm。以上结果说明了所提算法能够更准确地估计手部姿态,且在一些双手交互和遮挡的场景下有更高的鲁棒性。 展开更多
关键词 手部姿态估计 多尺度特征融合 注意力机制 高分辨率网络 沙漏网络
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部