期刊文献+
共找到138篇文章
< 1 2 7 >
每页显示 20 50 100
基于Keypoint RCNN改进模型的物体抓取检测算法 被引量:14
1
作者 夏浩宇 索双富 +2 位作者 王洋 安琪 张妙恬 《仪器仪表学报》 EI CAS CSCD 北大核心 2021年第4期236-246,共11页
机器人抓取在工业中的应用有两个难点:如何准确地检测可抓取物体,以及如何从检测出的多个物体中选择最优抓取目标。本文在Keypoint RCNN模型中引入同方差不确定性学习各损失的权重,并在特征提取器中加入注意力模块,构成了Keypoint RCNN... 机器人抓取在工业中的应用有两个难点:如何准确地检测可抓取物体,以及如何从检测出的多个物体中选择最优抓取目标。本文在Keypoint RCNN模型中引入同方差不确定性学习各损失的权重,并在特征提取器中加入注意力模块,构成了Keypoint RCNN改进模型。基于改进模型提出了两阶段物体抓取检测算法,第一阶段用模型预测物体掩码和关键点,第二阶段用掩码和关键点计算物体的抓取描述和重合度,重合度表示抓取时的碰撞程度,根据重合度可以从多个可抓取物体中选择最优抓取目标。对照实验证明,相较原模型,Keypoint RCNN改进模型在目标检测、实例分割、关键点检测上的性能均有提高,在自建数据集上的平均精度分别为85.15%、79.66%、86.63%,机器人抓取实验证明抓取检测算法能够准确计算物体的抓取描述、选择最优抓取,引导机器人无碰撞地抓取目标。 展开更多
关键词 抓取检测 keypoint RCNN改进模型 损失权重 注意力模块 抓取描述 重合度 最优抓取
在线阅读 下载PDF
融合边缘特征与细节感知网络的YOLOv8s髋关节关键点检测算法 被引量:1
2
作者 吕佳 段训禄 陈欣 《光电工程》 北大核心 2025年第3期84-99,共16页
髋关节关键点的准确识别对于提高发育性髋关节发育不良诊断精度具有重要意义。然而,在儿童髋关节X射线图像中,关键点所在的骨骼区域通常对比度低和边缘模糊,导致边缘特征不明显。同时,在特征提取过程中,下采样操作会进一步弱化边缘信息... 髋关节关键点的准确识别对于提高发育性髋关节发育不良诊断精度具有重要意义。然而,在儿童髋关节X射线图像中,关键点所在的骨骼区域通常对比度低和边缘模糊,导致边缘特征不明显。同时,在特征提取过程中,下采样操作会进一步弱化边缘信息。此外,关键点邻域内的关键结构易受背景干扰,这些因素均限制了关键点的精确定位。为此,本文提出了一种融合边缘特征与细节感知网络的YOLOv8s髋关节关键点检测算法。该算法在网络中设计了边缘特征强化模块,以捕获关键点周围空间信息并增强其所在的边缘特征;同时,提出细节感知网络,对多层级特征进行融合与优化,增强对图像中细微结构的感知能力。本文使用重庆医科大学附属儿童医院影像科提供的髋关节X射线图像数据集进行实验,结果显示,关键点的平均定位误差和平均角度误差降低至4.2090pixel和1.4872°,相较于YOLOv8s降低了6.8%和9.9%,显著优于现有方法。实验证明,本文算法有效提升了关键点的检测精度,为临床诊断提供了重要参考。 展开更多
关键词 发育性髋关节发育不良 关键点检测 YOLOv8s 边缘特征强化 细节感知网络
在线阅读 下载PDF
基于深度学习的家蚕计数与体长测量研究
3
作者 刘莫尘 孙崇凯 +6 位作者 李正浩 常昊 尚明瑞 宋占华 刘贤军 孙廷举 闫银发 《山东农业大学学报(自然科学版)》 北大核心 2025年第4期616-627,共12页
家蚕计数与体长测量是在家蚕养殖过程中的必要环节,传统家蚕计数及体长测量方法主要人工完成,易受主观因素影响,较难实现对家蚕数量和家蚕体长的快速、准确监控。本文使用深度学习的方法实现了家蚕计数及家蚕体长测量,以饲料育家蚕为研... 家蚕计数与体长测量是在家蚕养殖过程中的必要环节,传统家蚕计数及体长测量方法主要人工完成,易受主观因素影响,较难实现对家蚕数量和家蚕体长的快速、准确监控。本文使用深度学习的方法实现了家蚕计数及家蚕体长测量,以饲料育家蚕为研究对象,构建了家蚕关键点检测数据集,提出了YOLOv8-Pose-GE算法。该算法在YOLOv8-Pose的Backbone部分加入GAM注意力机制,可以放大全局交互,进行多层感知器的3D排列,提高模型特征提取能力的同时减少信息损失;在Neck部分添加ECA注意力机制,具有实现全局空间信息聚合的部分和进行跨通道交互进行建模的部分,可以提升模型对重要特征的感知能力,使模型更好的处理提取家蚕关键点特征。YOLOv8-Pose-GE的mAP、P和R分别为94.7%、95.31%和87.98%,均优于其他常用的关键点检测算法。该算法同时兼顾了速度,其FPS达到37.61 s^(−1)。本方法可以依靠YOLOv8-Pose-EG的head部分输出的坐标来对家蚕及家蚕关键点位置进行定位,并按顺序依次用直线连接家蚕关键点,由连线长度得到家蚕体长,同时实现家蚕计数。本文对家蚕拍摄录像中随机截取10帧图片进行计数实验,其MAE_L、MRE_L和MSD_L由分别为1.6头、3.6%和2.1头,说明模型具有较高的准确性的同时具有较高的稳定性。本文对40头家蚕(1-5龄家蚕中各随机取8头)进行测量实验,由结果分析得,该算法具有家蚕龄期越高,测量效果越好的特点,尤其5龄,MAE_L、MRE_L、MSD_L和PCC分别为12.29 px、1.87%、4.15px和0.977,总体误差较小。该算法满足家蚕计数及体长测量的需要,为提高家蚕养殖的质量,加强家蚕品种选育提供技术支持。 展开更多
关键词 家蚕 深度学习 计数 体长 关键点检测
在线阅读 下载PDF
基于改进YOLO11的站场图图元检测方法
4
作者 李开成 李相龙 +1 位作者 袁磊 魏国栋 《北京交通大学学报》 北大核心 2025年第5期198-208,共11页
针对铁路信号系统站场图图纸信息难以提取的问题,提出一种基于YOLO11改进的站场图图元检测模型YOLO11-AT,通过构建融合目标检测与关键点检测的检测模型,实现了图元检测与关键点的自动提取.首先,在颈部网络部分引入了注意力尺度序列融合(... 针对铁路信号系统站场图图纸信息难以提取的问题,提出一种基于YOLO11改进的站场图图元检测模型YOLO11-AT,通过构建融合目标检测与关键点检测的检测模型,实现了图元检测与关键点的自动提取.首先,在颈部网络部分引入了注意力尺度序列融合(Attentional Scale Se-quence Fusion,ASF)模块,融合不同尺度的特征,增强模型对小目标的检测性能;其次,在检测头部分采用了任务对齐动态检测头(Task Align Dynamic Detect Head,TADDH),通过任务对齐机制改善分类任务和定位任务之间的特征交互,减少特征冲突,提高密集目标检测精度;最后,采用切片辅助超推理(Slicing Aided Hyper Inference,SAHI)技术提高模型在高分辨率站场图像上的检测精度.在构建的多样式站场图数据集上,对提出的方法进行实验验证.实验结果表明:相较于YOLO11s-pose,YOLO11-AT在精确率、召回率、mAP0.5和mAP0.5-kp分别提升了9%、2.2%、4.2%和3.2%,同时参数量下降了4.3%;与现有主流检测模型相比,YOLO11-AT在检测精度与效率之间取得了更优的平衡;研究结果能够适应多种样式的站场图,可以满足实际应用的需求,为站场图图纸的自动化信息提取提供了一种可行的解决方案. 展开更多
关键词 站场图 图像识别 YOLO11 关键点检测 图纸信息提取
在线阅读 下载PDF
基于关键点和步行特征的猪只跛行检测方法
5
作者 杨秋妹 黄森鹏 +3 位作者 肖德琴 惠向阳 黄一桂 李文刚 《农业机械学报》 北大核心 2025年第5期466-474,共9页
猪只跛行问题为猪场的生产和管理带来了挑战,因此准确检测猪只跛行情况至关重要。目前猪场主要依赖人工观察和记录,效率低耗时长,且可能存在主观误差。鉴于此,提出一种基于关键点和步行特征的猪只跛行检测方法。首先,定义并确定了猪只... 猪只跛行问题为猪场的生产和管理带来了挑战,因此准确检测猪只跛行情况至关重要。目前猪场主要依赖人工观察和记录,效率低耗时长,且可能存在主观误差。鉴于此,提出一种基于关键点和步行特征的猪只跛行检测方法。首先,定义并确定了猪只的关键点信息,关键点包括猪只的腿、膝盖、背部等重要部位。基于关键点,采用改进YOLO v8n-pose模型进行检测。该模型在YOLO v8n-pose的基础上,在颈部引入BiFPN双向特征金字塔网络进行多尺度特征融合,同时在骨干网络中引入RepGhost网络,以降低特征提取网络的参数量和浮点运算量。然后利用检测出的关键点坐标计算猪只的步长、膝盖弯曲程度和背部曲率等步行特征,并将这些特征输入到K最近邻算法进行跛行与非跛行的分类。实验结果表明,改进YOLO v8n-pose模型平均精度均值(mAP)达到92.4%,比原始YOLO v8n-pose模型提高4.2个百分点。与其他关键点检测模型(HRNet-w32、Lite-HRNet、ResNet50、ViPNAS和Hourglass)相比,mAP分别提高10.2、11.6、14.2、11.8、12.5个百分点。K近邻算法在猪只跛行测试集上的检测精度为81.7%,比BP算法、Decision Tree算法和SVM算法分别提高1.5、11.3、6.5个百分点。以上结果表明,本文提出的猪只跛行检测方法可行,能够为猪场检测提供技术支持。 展开更多
关键词 猪只 跛行 关键点检测 YOLO v8n-pose 步行特征
在线阅读 下载PDF
煤矿井下人员危险行为检测方法
6
作者 张旭辉 余恒翰 +6 位作者 杜昱阳 杨文娟 赵亦辉 万继成 王彦群 赵典 汤杜炜 《工矿自动化》 北大核心 2025年第5期64-71,共8页
井下人员危险行为检测是煤矿安全防控的关键环节。现有目标检测技术用于人员危险行为检测时,受煤矿井下复杂工况、设备遮挡、多目标密集、粉尘干扰等因素影响,存在特征提取不准确等问题,且未明确界定人员危险行为。以YOLOv8−pose模型为... 井下人员危险行为检测是煤矿安全防控的关键环节。现有目标检测技术用于人员危险行为检测时,受煤矿井下复杂工况、设备遮挡、多目标密集、粉尘干扰等因素影响,存在特征提取不准确等问题,且未明确界定人员危险行为。以YOLOv8−pose模型为基准架构,采用DCNv4和PConv模块融合的DCNv4−PConv混合模块代替标准卷积,添加混合局部通道注意力(MLCA)模块,并采用感受野注意力卷积(RFAConv)模块替换检测头,构建了PMR−YOLO模型,用于检测井下监控图像中人体关键点,提升检测精度和运算速度。在此基础上设计了人员行为识别算法,将井下人员行为划分为9种类别,基于YOLOv8−pose模型检测的人体关键点形成人体骨架,判断人员行为类别型。采用DsLMF+数据集进行消融实验、对比实验和人员行为识别实验,结果表明:DCNv4−PConv混合模块、MLCA模块、RFAConv模块的引入有效提高了YOLOv8−pose模型的精确度、召回率和平均精度均值(mAP);PMR−YOLO模型对人体关键点特征提取的精确度、召回率和mAP分别为0.893,0.841,0.852,较YOLOv8−pose模型分别提高了6.9%,14.4%,10.5%;基于PMR−YOLO模型的检测方法可有效识别井下人员9种行为类别,识别准确率均不低于96%。 展开更多
关键词 视频识别 危险行为检测 人员行为识别 YOLOv8−pose模型 人体关键点检测
在线阅读 下载PDF
卫星单目位姿估计的关键点检测与不确定度同步预测
7
作者 苏昂 王梓 +1 位作者 王靖皓 李璋 《国防科技大学学报》 北大核心 2025年第2期98-108,共11页
卫星单目视觉位姿估计通常先提取卫星图像关键特征点,再求解n点透视(perspective-n-points, PnP)问题得到摄像机与卫星之间的相对位姿关系,其中卫星关键点检测的精度是决定单目位姿估计精度的关键。针对该问题提出一种卫星关键点高精度... 卫星单目视觉位姿估计通常先提取卫星图像关键特征点,再求解n点透视(perspective-n-points, PnP)问题得到摄像机与卫星之间的相对位姿关系,其中卫星关键点检测的精度是决定单目位姿估计精度的关键。针对该问题提出一种卫星关键点高精度检测方法,该算法在预测关键点图像坐标的同时给出关键点坐标预测的不确定度,在此基础上构建加权的PnP约束方程求解相对位置和姿态,显著提升了卫星单目位姿估计精度。在公开的卫星单目位姿估计SPEED数据集上开展了相关实验,实验结果表明提出的同步预测关键点坐标与不确定度的卫星关键点检测方法能够有效提升关键点检测精度,并且通过求解加权的单目位姿估计问题显著提升了卫星单目位姿估计精度。 展开更多
关键词 关键点检测 不确定度预测 TRANSFORMER 单目视觉 卫星位姿估计
在线阅读 下载PDF
基于智能形状匹配的零件全尺寸在线视觉检测方法
8
作者 许桢英 杨为涛 +2 位作者 雷英俊 刘鑫 沙之洵 《电子测量与仪器学报》 北大核心 2025年第8期218-229,共12页
针对传统视觉方法在测量不同工件全尺寸时的局限性,提出了一种基于形状匹配的工件全尺寸在线检测方法。该方法通过将目标工件图像输入到改进的Superpoin关键点检测网络,得到所有关键点,并利用关键点实现工件轮廓的描述;然后将关键点模... 针对传统视觉方法在测量不同工件全尺寸时的局限性,提出了一种基于形状匹配的工件全尺寸在线检测方法。该方法通过将目标工件图像输入到改进的Superpoin关键点检测网络,得到所有关键点,并利用关键点实现工件轮廓的描述;然后将关键点模板与目标工件的关键点一起输入点渲染层,使用增强关键点位置信息的Superglue特征全匹配算法,提取与模板点匹配的关键点,以及关键点之间的距离,实现工件的全尺寸测量。为了验证方法的有效性,分别进行了量块尺寸检测实验,标定板尺寸检测实验和原电池尺寸检测实验,实验结果表明,对于25 mm零级量块(精度优于±0.14μm)的尺寸检测实验,系统十次重复测量结果的最大偏差为±0.02 mm,标准差为0.01 mm,表明系统具有较高的重复性精度;对于棋盘格标定板,尺寸测量误差不超过±0.03 mm,验证了该方法的可行性;在原电池的尺寸测量实验中,七号电池尺寸检测的误差范围为±0.03 mm,平均耗时为0.08 s,五号电池的尺寸检测误差为±0.03 mm,平均耗时为0.09 s,均能够满足该企业原电池产线生产过程中,在线检测的±0.05 mm精度要求和0.1 s的实时性检测要求。相比于传统算法需要针对不同工件采用不同的检测算法,所提出的方法能够有效适应不同工件的尺寸检测需求,并可广泛应用于工业现场的零件在线全尺寸检测。 展开更多
关键词 关键点检测 特征匹配 在线尺寸检测 全尺寸
在线阅读 下载PDF
LFTA:轻量级特征提取与加性注意力的特征匹配方法
9
作者 郭志强 汪子涵 +1 位作者 王永圣 陈鹏羽 《电子与信息学报》 北大核心 2025年第8期2872-2882,共11页
近年来,特征匹配技术在计算机视觉任务中得到了广泛应用,如3维重建、视觉定位和即时定位与地图构建(SLAM)等。然而,现有匹配算法面临精度与效率的权衡困境:高精度方法常因复杂模型设计导致计算复杂度攀升,难以满足实时需求;而快速匹配... 近年来,特征匹配技术在计算机视觉任务中得到了广泛应用,如3维重建、视觉定位和即时定位与地图构建(SLAM)等。然而,现有匹配算法面临精度与效率的权衡困境:高精度方法常因复杂模型设计导致计算复杂度攀升,难以满足实时需求;而快速匹配策略通过特征简化或近似计算虽实现亚线性时间复杂度,却因表征能力受限与误差累积,无法达到实际应用中的精度要求。为此,该文提出一种基于加性注意力的轻量化特征匹配方法—LFTA。该方法通过轻量化多尺度特征提取网络生成高效特征表示,并引入三重交换融合注意力机制,提升了在复杂场景下的特征鲁棒性;同时提出了自适应高斯核生成关键点热力图和动态非极大值抑制算法,以提高关键点的提取精度;此外,该文设计了结合加性Transformer注意力机制和深度可分离卷积位置编码的轻量化模块,对粗粒度匹配结果进行微调,从而生成高精度的像素级匹配点对。为了验证所提方法的有效性,在MegaDepth和ScanNet两个公开数据集上进行了实验评估,并通过消融实验和对比实验验证了各模块的贡献和模型的综合性能。实验结果表明,所提算法在姿态估计上的性能相比于轻量化的算法有显著提升,且与性能较高的算法相比推理时间有显著下降,实现了高效性与高精度的平衡。 展开更多
关键词 特征匹配 加性注意力机制 轻量化网络 自适应关键点提取 像素级匹配
在线阅读 下载PDF
基于关键点矫正机制的设施化养殖条件下死鱼识别方法
10
作者 万鹏 肖畅宇 +2 位作者 汪荣 雷翔 范豪 《农业工程学报》 北大核心 2025年第12期269-277,共9页
针对设施化养殖条件下鱼群养殖密度大,养殖池中死亡鱼体不能及时检测识别容易腐烂导致疾病传播、造成鱼群死亡的问题,该研究提出了一种根据鱼体水下姿态特征结合关键点矫正机制的死鱼识别方法;并以圆形养殖池养殖模式下的大口黑鲈(Micro... 针对设施化养殖条件下鱼群养殖密度大,养殖池中死亡鱼体不能及时检测识别容易腐烂导致疾病传播、造成鱼群死亡的问题,该研究提出了一种根据鱼体水下姿态特征结合关键点矫正机制的死鱼识别方法;并以圆形养殖池养殖模式下的大口黑鲈(Micropterus salmoides)为研究对象,通过水下机器人采集养殖池底部正常鱼体、濒死鱼体、死亡鱼体等图像,构建了水下死鱼目标检测和死亡鱼体关键点检测数据集;根据传统多层感知机模型构建了一种MLP-Block(multilayer perceptron block)多层感知机模块,提出了一种多路径坐标注意力机制MSPCA(multi split channel attention),引入优化动态卷积网络,构建了MLPNet-Pose网络模型;基于该网络模型,利用分组解耦头融合鱼体特征,实现死鱼目标检测以及死亡鱼体关键点检测,同时通过关键点矫正机制提高鱼体姿态识别的准确性。试验结果表明:改进后算法在测试数据集上对水下正常鱼群和死鱼的检测准确率分别为99.1%和96.0%。改进后的水下鱼体关键点检测算法具有较高的检测精度、检测速度和较低的参数量,可以为水下死鱼识别和鱼体关键点检测提供一定的理论和技术基础。 展开更多
关键词 死鱼识别 关键点矫正机制 设施化养殖 水下鱼群检测 深度学习
在线阅读 下载PDF
2024中国教育技术研究前沿与热点年度报告 被引量:2
11
作者 李雅瑄 陈昂轩 贾积有 《中国电化教育》 北大核心 2025年第5期61-67,共7页
2024年中国教育技术研究紧密围绕教育强国建设这一战略方向,以人工智能与教育深度融合为核心动力,通过教师专业发展与数字化教学创新夯实实践基础,依托国家智慧教育平台提供平台支撑,推动数字化背景下的教育评价改革,致力于实现乡村教... 2024年中国教育技术研究紧密围绕教育强国建设这一战略方向,以人工智能与教育深度融合为核心动力,通过教师专业发展与数字化教学创新夯实实践基础,依托国家智慧教育平台提供平台支撑,推动数字化背景下的教育评价改革,致力于实现乡村教育振兴与城乡均衡发展,深入思考数智时代的教育本质与价值,积极服务新质生产力建设。研究表明,教育技术创新正在从单一的技术应用转向更深层次的教育变革,既要发挥技术赋能作用,又要坚守教育本质,在智能时代中探索教育高质量发展的中国方案。展望未来,中国教育技术研究将继续以服务教育强国建设为根本方向,以促进人的全面发展为核心目标,通过数字化转型推动教育理念、模式和体系的创新,为新时代教育高质量发展贡献智慧力量。 展开更多
关键词 中国教育技术 中国电化教育 研究重点 研究脉络 未来展望
在线阅读 下载PDF
基于改进YOLOv8n-Pose的羊只围产期行为识别方法
12
作者 孙思晗 孙小华 +2 位作者 王超 袁万哲 王福顺 《农业工程学报》 北大核心 2025年第12期258-268,共11页
在现代畜牧业中,自动化识别羊只围产期行为能及时发现潜在的健康问题和生产异常,从而有效保障羊只健康、降低出生羊羔死亡率、提升繁殖效益。针对羊只围产期部分行为特征的高度相似以及羊只生产环境中存在复杂光照条件和背景干扰等问题... 在现代畜牧业中,自动化识别羊只围产期行为能及时发现潜在的健康问题和生产异常,从而有效保障羊只健康、降低出生羊羔死亡率、提升繁殖效益。针对羊只围产期部分行为特征的高度相似以及羊只生产环境中存在复杂光照条件和背景干扰等问题,该研究提出了一种改进YOLOv8n-Pose关键点检测模型与BP神经网络相结合的羊只围产期行为识别方法。首先,为提升关键点检测的精度,新增P2检测层,显著增强模型对小尺度特征的捕获能力,为复杂行为的关键点定位提供更精细的支持。其次,针对复杂环境中的特征表达问题,引入多尺度注意力模块(multi-scale attention block,MAB),以动态权重机制强化模型对全局与局部特征的交互建模能力,提升在复杂光照环境下的稳健性和泛化性能。此外,考虑到模型参数量较大导致部署困难,采用基于L1范数的剪枝策略,对优化后的模型进行参数压缩与冗余移除,既有效降低了计算复杂度,又保证了高效性与模型性能的平衡。最后,基于改进模型精准提取12个关键点坐标信息后,结合5个关节角度、2对关键点相对位置以及关键点识别个数,构建包含32个行为特征向量的多维数据集,并将其作为输入传递至BP神经网络进行羊只围产期行为分类。试验结果表明,在自建羊只围产期数据集上,改进的YOLOv8n-Pose模型检测羊只关键点较原模型平均精度值mAP50提升4.6个百分点,m AP50:95提升6.7个百分点。BP神经网络对羊只围产期行为进行分类,其F1分数达到95.7%。研究结果验证基于关键点的识别方法在复杂的围产期行为识别中具有明显优势,为畜牧业智能化管理提供有效的技术支持。 展开更多
关键词 行为识别 YOLOv8n-Pose 关键点检测 围产期 BP神经网络
在线阅读 下载PDF
基于关键点的挖掘机工作装置姿态检测
13
作者 陈新 兰媛 +1 位作者 牛蔺楷 钮晨光 《机械设计与制造》 北大核心 2025年第10期146-150,155,共6页
近年来,我国市场经济快速发展,基础建设投资持续增加,挖掘机在建筑施工、矿山开采、国防工程等土石方作业中应用日益广泛。在挖掘机自动化研究领域,传统接触式传感器常被用于工作装置姿态测量,但设备振动和碰撞容易导致传感器损坏。虽... 近年来,我国市场经济快速发展,基础建设投资持续增加,挖掘机在建筑施工、矿山开采、国防工程等土石方作业中应用日益广泛。在挖掘机自动化研究领域,传统接触式传感器常被用于工作装置姿态测量,但设备振动和碰撞容易导致传感器损坏。虽然基于人工标记的视觉检测方法被提出作为替代方案,但其存在标记易污染、检测困难等问题。针对上述问题,本研究提出一种无人工标记的视觉检测方法,以挖掘机杆件铰点为测量对象。研究采用Keypoint RCNN深度学习算法,通过标注杆件铰点构建数据集,并以此训练视觉检测模型。该模型能够准确识别杆件铰点,结合关键点约束关系与相机成像原理,实现三维坐标解算与杆件姿态角计算。实验结果显示,该姿态测量系统性能优异,瞬时测量偏差与平均测量偏差均控制在±1°以内,满足视觉伺服系统的姿态预测精度要求。同时,系统每帧图像处理时间平均仅为200ms,具备良好的实时性,可有效应用于挖掘机工作装置姿态测量。 展开更多
关键词 挖掘机 关键点 工作装置姿态 实时测量
在线阅读 下载PDF
基于骨骼关键点的东北虎幼虎行为识别与跟踪
14
作者 刘淑聪 刘梦雨 +3 位作者 刘丹 张馨洋 马光凯 姜广顺 《野生动物学报》 北大核心 2025年第4期723-733,共11页
东北虎(Panthera tigris altaica)幼虎的行为研究对其保护生物学与发育生态学至关重要。传统人工观察方法效率低下且易受主观因素影响,亟需发展自动化、客观的技术手段。为此,提出并验证了一种基于骨骼关键点的深度学习框架,以实现对东... 东北虎(Panthera tigris altaica)幼虎的行为研究对其保护生物学与发育生态学至关重要。传统人工观察方法效率低下且易受主观因素影响,亟需发展自动化、客观的技术手段。为此,提出并验证了一种基于骨骼关键点的深度学习框架,以实现对东北虎幼虎行为的精准识别与跟踪。基于黑龙江东北虎林园和横道河子东北虎林园共计15只东北虎幼虎的监控视频,构建了包含16个人工标注关键点的姿态估计数据集及5种常见行为的行为识别数据集。利用训练好的高分辨率网络(HRNet)生成初始姿态数据,通过连续关键点序列关联行为标签与个体ID,构建了行为识别与跟踪数据集。在该数据集上,采用多个行为识别网络进行对比实验,并应用字节跟踪算法(ByteTrack)进行多目标个体跟踪。结果表明:注意力增强自适应图卷积神经网络(attention-enhanced adaptive graph convolutional neural network,AAGCN)在幼虎行为识别任务中的准确率最优,达76.59%;ByteTrack在个体跟踪中的多目标跟踪准确率(multiple object tracking accuracy,MOTA)高达92.76%。本方法在东北虎幼虎行为识别与跟踪中表现优异,为圈养大型猫科(Felidae)动物幼崽的行为量化与分析提供了可靠工具,对野生动物保护和繁育管理具有直接应用价值。 展开更多
关键词 东北虎幼虎 姿态估计 行为识别 骨骼关键点 多目标跟踪 深度学习
在线阅读 下载PDF
基于多尺度注意力机制TransUNet的双目视觉定位与测量方法
15
作者 杨玉 许四祥 +1 位作者 张梦权 吴端正 《光学精密工程》 北大核心 2025年第16期2502-2515,共14页
针对传统双目视觉特征检测算法检测效率低以及大多网络模型对于全局重要特征的关注度不足、参数量过大等问题,提出一种基于多尺度注意力机制TransUNet网络的双目视觉的连铸坯定位与测量方法。首先使用标定后的平行双目相机采集连铸坯左... 针对传统双目视觉特征检测算法检测效率低以及大多网络模型对于全局重要特征的关注度不足、参数量过大等问题,提出一种基于多尺度注意力机制TransUNet网络的双目视觉的连铸坯定位与测量方法。首先使用标定后的平行双目相机采集连铸坯左右图像数据,构建数据集。接着,以TransUNet网络作为基础框架,引入改进的Transformer层实现全局上下文信息的提取;提出一种全局坐标分组注意力模块GSGA(Global Spatial Group Attention)添加在每个解码器末尾,利用分组和多尺度注意力机制提高对全局重要特征的关注度;在编码器和解码器跳跃连接及双线性插值后加入CBAM(Convolutional Block Attention Module)模块,结合空间和通道注意力机制提升关键点识别能力。最后,结合双目视觉原理对网络输出的关键点坐标实现三维坐标重建和测距。实验结果显示:相较于Transformer模型,均方根误差和归一化误差分别下降了40.96%和45.83%,参数量和浮点运算量分别减少了10.58%和8.21%,单批次推理时间缩短了30.52%。在三维测距上,测量相对误差达到0.137%,显著优于传统特征检测算法,满足双目视觉定位与测量要求。 展开更多
关键词 双目视觉 TransUNet 关键点检测 注意力机制
在线阅读 下载PDF
矿井环境下视觉特征点算法的适用性研究
16
作者 汪嘉文 廖晨非 +5 位作者 赵忠琦 黄誌鹏 谢沛龙 刘心怡 侯彦虎 杨克虎 《矿业科学学报》 北大核心 2025年第3期531-541,共11页
基于深度学习的特征点算法作为机器视觉底层核心算法之一,可服务于多种矿井应用,已成为矿山新型装备视觉感知能力的底层核心技术。光照变化、多粉尘、环境纹理缺失和纹理结构重复等矿井环境特点对特征点算法提出更高的挑战。为有效评估... 基于深度学习的特征点算法作为机器视觉底层核心算法之一,可服务于多种矿井应用,已成为矿山新型装备视觉感知能力的底层核心技术。光照变化、多粉尘、环境纹理缺失和纹理结构重复等矿井环境特点对特征点算法提出更高的挑战。为有效评估特征点算法在矿井环境中的适用性,构建2类数据集:矿井煤壁图像测试数据集包含20组具有挑战性的煤壁或巷道壁图像序列;巷道巡检图像数据集包含轮式机器人巡检过程中的589帧图像数据。通过对比试验评估多种特征点算法,包括尺度不变特征变换(SIFT)、ORB、加速稳健特征(SURF)、AKAZE、L2-Net、HardNet、GeoDesc、SuperPoint、R2D2和DISK。结果表明:特征点算法整体表现优异,特别是R2D2优势显著。此外,还评估特征点算法在低功耗边缘计算平台上的运行效率,进一步验证其在实际应用中的可行性。 展开更多
关键词 智慧矿山 特征点算法 矿井图像 数据集 深度学习
在线阅读 下载PDF
高架草莓果实及采摘点检测算法研究
17
作者 高宁 王笑荣 +3 位作者 孟繁骁 陈发军 刘义哲 王伟 《包装与食品机械》 北大核心 2025年第5期13-24,共12页
在复杂棚架环境下,为提高草莓采摘机器人对果实及其采摘点的同步检测精度和速度,提出一种用于高架草莓成熟果实及采摘点的联合检测算法。以YOLOv8n-Pose为基准模型,提出一种YOLOv8-SY模型,通过引入多尺度卷积模块MSGConv,构建MSGBottlen... 在复杂棚架环境下,为提高草莓采摘机器人对果实及其采摘点的同步检测精度和速度,提出一种用于高架草莓成熟果实及采摘点的联合检测算法。以YOLOv8n-Pose为基准模型,提出一种YOLOv8-SY模型,通过引入多尺度卷积模块MSGConv,构建MSGBottleneck及MSGC2f模块,优化主干网络,增强特征提取能力;将多层次特征融合模块SDI,与ASF-YOLO的颈部网络结合,强化特征融合,提升检测精度;结合果实图像及其辅助点补偿定位方法,对3种高架草莓的成熟果实及采摘点进行联合检测。结果表明,改进后的模型在目标与关键点检测中的P,R,mAP_(@0.5),AP_(@OKS)=0.5指标分别达95.2%,93.8%,97.4%,95.5%,较原模型分别提升2.5,2.9,2.6,1.7个百分点;在300张涵盖各类遮挡的复杂实际场景图像测试中,X,Y轴方向和欧氏距离误差均值分别为-0.65,-0.11,5.58像素,10像素以内定位成功率达86.44%。研究为高架草莓采摘自动化作业机械的研发与应用提供技术支撑。 展开更多
关键词 草莓采摘 关键点检测 辅助点补偿定位 YOLOv8-SY
在线阅读 下载PDF
基于关键点检测的直升机驾驶状态检测方法
18
作者 胡晨煜 陈仁文 +4 位作者 侯欣彤 郑博宇 魏祖盛 丁名豪 曹文彬 《电光与控制》 北大核心 2025年第8期92-97,共6页
传统传感器获取直升机驾驶员驾驶状态需要穿戴额外设备,会影响驾驶,因此提出了一种基于关键点检测的直升机驾驶状态检测方法。将直升机驾驶状态分解为人体姿态动作和驾驶部件位置信息,利用自建直升机驾驶数据集对设计模型进行训练。提... 传统传感器获取直升机驾驶员驾驶状态需要穿戴额外设备,会影响驾驶,因此提出了一种基于关键点检测的直升机驾驶状态检测方法。将直升机驾驶状态分解为人体姿态动作和驾驶部件位置信息,利用自建直升机驾驶数据集对设计模型进行训练。提出了通过驾驶部件坐标回归判断驾驶部件状态的方法,以及通过驾驶员姿态的坐标回归建立驾驶员姿态模型的方法。测试结果表明,所提方法对直升机驾驶员的驾驶动作的识别平均精度达到了0.9231,操作部件位置的识别平均精度达到了0.9861,验证了通过坐标回归建立驾驶员姿态模型的可行性。 展开更多
关键词 关键点检测 驾驶状态 实时检测 人体姿态估计
在线阅读 下载PDF
多分辨率特征融合的人体下肢关键点检测
19
作者 夏晓华 向浩鸣 +3 位作者 陈坚 冯鑫淼 邱法博 王耀耀 《光学精密工程》 北大核心 2025年第14期2291-2302,共12页
现有的人体关键点检测模型缺乏对高分辨率特征的关注,训练中使用的数据集分辨率较低且标注误差较大,导致其在步态分析等任务中检测结果不稳定,定位精度较差。针对上述问题,提出一种基于多分辨率特征融合的人体下肢关键点检测模型,以高... 现有的人体关键点检测模型缺乏对高分辨率特征的关注,训练中使用的数据集分辨率较低且标注误差较大,导致其在步态分析等任务中检测结果不稳定,定位精度较差。针对上述问题,提出一种基于多分辨率特征融合的人体下肢关键点检测模型,以高分辨率图像作为网络输入,利用微调的MobiliNet v1网络结合注意力机制提取全局低分辨率特征,初步预测关键点位置,通过与之并行的浅层网络提取局部高分辨率特征,然后采用连续残差结构与注意力机制将不同分辨率特征融合,提升预测关键点的准确性,并有效缓解高分辨率图像带来的高计算量问题。通过预标记的方式制作高分辨率、高精度的人体下肢关键点数据集以确保模型训练的准确性。以模型复杂度、检测速度、检测精确率以及检测误差为评价指标,与其他经典和先进的方法进行实验对比。结果表明,所提模型的测试检测率达到95.2%,均优于Light⁃weight-OpenPose,HRNet-W32,HRNet-W48,YOLO-Pose,RTMPose和SimCC模型,检测精确率提升了4.1%~83.6%,FPS提升了7.6~13.9。证明了提出的模型在高精度人体下肢关键点检测中的有效性。 展开更多
关键词 人体下肢关键点检测 多分辨率特征融合 注意力机制 预标记
在线阅读 下载PDF
奶牛脸部及关键点检测数据集 被引量:1
20
作者 侯现坤 黄小平 +5 位作者 黄飞 豆子豪 郑寰宇 王晨洋 冯涛 刘梦艺 《中国科学数据(中英文网络版)》 2025年第1期14-23,共10页
奶牛脸部及关键点检测可以帮助牛场构建识别系统以及对牛脸进行姿态估计,帮助牛场智能化升级。基于深度学习的奶牛脸部及关键点检测模型需要数据集进行训练,以提高模型的准确性和鲁棒性。因此,在自然条件拍摄的奶牛脸部数据集,对于奶牛... 奶牛脸部及关键点检测可以帮助牛场构建识别系统以及对牛脸进行姿态估计,帮助牛场智能化升级。基于深度学习的奶牛脸部及关键点检测模型需要数据集进行训练,以提高模型的准确性和鲁棒性。因此,在自然条件拍摄的奶牛脸部数据集,对于奶牛脸部及关键点检测模型训练,实现牛脸识别系统搭建以及牛脸姿态估计至关重要。本数据集包含了不同角度、不同光照、不同数量等复杂环境下的奶牛脸部的图像,共2538张图像。使用Labelme软件对奶牛脸部以及左右眼睛中心、鼻子中间、左右嘴角5个关键点进行标注,得到2538个json标注文件。并将标注的COCO(json)格式文件转为YOLO(txt)格式文件,把图片以及对应的txt格式标签按照4:1的比例划分训练集和测试集,用于训练YOLOv5-Pose、YOLOv7-Pose、YOLOv8-Pose等关键点检测模型。实验表明,本数据集在奶牛脸部及关键点检测模型上表现良好,为奶牛脸部及关键点检测等方向上的研究和应用提供了有价值的图像数据资源。 展开更多
关键词 奶牛 深度学习 牛脸检测 关键点检测
在线阅读 下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部