期刊文献+
共找到548篇文章
< 1 2 28 >
每页显示 20 50 100
Intelligent Recognition Using Ultralight Multifunctional Nano‑Layered Carbon Aerogel Sensors with Human‑Like Tactile Perception 被引量:4
1
作者 Huiqi Zhao Yizheng Zhang +8 位作者 Lei Han Weiqi Qian Jiabin Wang Heting Wu Jingchen Li Yuan Dai Zhengyou Zhang Chris RBowen Ya Yang 《Nano-Micro Letters》 SCIE EI CAS CSCD 2024年第1期172-186,共15页
Humans can perceive our complex world through multi-sensory fusion.Under limited visual conditions,people can sense a variety of tactile signals to identify objects accurately and rapidly.However,replicating this uniq... Humans can perceive our complex world through multi-sensory fusion.Under limited visual conditions,people can sense a variety of tactile signals to identify objects accurately and rapidly.However,replicating this unique capability in robots remains a significant challenge.Here,we present a new form of ultralight multifunctional tactile nano-layered carbon aerogel sensor that provides pressure,temperature,material recognition and 3D location capabilities,which is combined with multimodal supervised learning algorithms for object recognition.The sensor exhibits human-like pressure(0.04–100 kPa)and temperature(21.5–66.2℃)detection,millisecond response times(11 ms),a pressure sensitivity of 92.22 kPa^(−1)and triboelectric durability of over 6000 cycles.The devised algorithm has universality and can accommodate a range of application scenarios.The tactile system can identify common foods in a kitchen scene with 94.63%accuracy and explore the topographic and geomorphic features of a Mars scene with 100%accuracy.This sensing approach empowers robots with versatile tactile perception to advance future society toward heightened sensing,recognition and intelligence. 展开更多
关键词 Multifunctional sensor Tactile perception Multimodal machine learning algorithms Universal tactile system Intelligent object recognition
在线阅读 下载PDF
Optimizing Deep Learning Parameters Using Genetic Algorithm for Object Recognition and Robot Grasping 被引量:2
2
作者 Delowar Hossain Genci Capi Mitsuru Jindai 《Journal of Electronic Science and Technology》 CAS CSCD 2018年第1期11-15,共5页
The performance of deep learning(DL)networks has been increased by elaborating the network structures. However, the DL netowrks have many parameters, which have a lot of influence on the performance of the network. We... The performance of deep learning(DL)networks has been increased by elaborating the network structures. However, the DL netowrks have many parameters, which have a lot of influence on the performance of the network. We propose a genetic algorithm(GA) based deep belief neural network(DBNN) method for robot object recognition and grasping purpose. This method optimizes the parameters of the DBNN method, such as the number of hidden units, the number of epochs, and the learning rates, which would reduce the error rate and the network training time of object recognition. After recognizing objects, the robot performs the pick-andplace operations. We build a database of six objects for experimental purpose. Experimental results demonstrate that our method outperforms on the optimized robot object recognition and grasping tasks. 展开更多
关键词 Deep learning(DL) deep belief neural network(DBNN) genetic algorithm(GA) object recognition robot grasping
在线阅读 下载PDF
Human-Object Interaction Recognition Based on Modeling Context 被引量:1
3
作者 Shuyang Li Wei Liang Qun Zhang 《Journal of Beijing Institute of Technology》 EI CAS 2017年第2期215-222,共8页
This paper proposes a method to recognize human-object interactions by modeling context between human actions and interacted objects.Human-object interaction recognition is a challenging task due to severe occlusion b... This paper proposes a method to recognize human-object interactions by modeling context between human actions and interacted objects.Human-object interaction recognition is a challenging task due to severe occlusion between human and objects during the interacting process.Since that human actions and interacted objects provide strong context information,i.e.some actions are usually related to some specific objects,the accuracy of recognition is significantly improved for both of them.Through the proposed method,both global and local temporal features from skeleton sequences are extracted to model human actions.In the meantime,kernel features are utilized to describe interacted objects.Finally,all possible solutions from actions and objects are optimized by modeling the context between them.The results of experiments demonstrate the effectiveness of our method. 展开更多
关键词 human-object interaction action recognition object recognition modeling context
在线阅读 下载PDF
Adaptive key SURF feature extraction and application in unmanned vehicle dynamic object recognition 被引量:1
4
作者 杜明芳 王军政 +2 位作者 李静 李楠 李多扬 《Journal of Beijing Institute of Technology》 EI CAS 2015年第1期83-90,共8页
A new method based on adaptive Hessian matrix threshold of finding key SRUF ( speeded up robust features) features is proposed and is applied to an unmanned vehicle for its dynamic object recognition and guided navi... A new method based on adaptive Hessian matrix threshold of finding key SRUF ( speeded up robust features) features is proposed and is applied to an unmanned vehicle for its dynamic object recognition and guided navigation. First, the object recognition algorithm based on SURF feature matching for unmanned vehicle guided navigation is introduced. Then, the standard local invariant feature extraction algorithm SRUF is analyzed, the Hessian Metrix is especially discussed, and a method of adaptive Hessian threshold is proposed which is based on correct matching point pairs threshold feedback under a close loop frame. At last, different dynamic object recognition experi- ments under different weather light conditions are discussed. The experimental result shows that the key SURF feature abstract algorithm and the dynamic object recognition method can be used for un- manned vehicle systems. 展开更多
关键词 dynamic object recognition key SURF feature feature matching adaptive Hessianthreshold unmanned vehicle
在线阅读 下载PDF
Object Recognition Algorithm Based on an Improved Convolutional Neural Network 被引量:1
5
作者 Zheyi Fan Yu Song Wei Li 《Journal of Beijing Institute of Technology》 EI CAS 2020年第2期139-145,共7页
In order to accomplish the task of object recognition in natural scenes,a new object recognition algorithm based on an improved convolutional neural network(CNN)is proposed.First,candidate object windows are extracted... In order to accomplish the task of object recognition in natural scenes,a new object recognition algorithm based on an improved convolutional neural network(CNN)is proposed.First,candidate object windows are extracted from the original image.Then,candidate object windows are input into the improved CNN model to obtain deep features.Finally,the deep features are input into the Softmax and the confidence scores of classes are obtained.The candidate object window with the highest confidence score is selected as the object recognition result.Based on AlexNet,Inception V1 is introduced into the improved CNN and the fully connected layer is replaced by the average pooling layer,which widens the network and deepens the network at the same time.Experimental results show that the improved object recognition algorithm can obtain better recognition results in multiple natural scene images,and has a higher degree of accuracy than the classical algorithms in the field of object recognition. 展开更多
关键词 object recognition selective search algorithm improved convolutional neural network(CNN)
在线阅读 下载PDF
Role of Cannabinoid CB1 Receptor in Object Recognition Memory Impairment in Chronically Rapid Eye Movement Sleep-deprived Rats
6
作者 Kaveh Shahveisi Seyedeh Marziyeh Hadi +1 位作者 Hamed Ghazvini Mehdi Khodamoradi 《Chinese Medical Sciences Journal》 CAS CSCD 2023年第1期29-37,共9页
Objective We aimed to investigate whether antagonism of the cannabinoid CB1 receptor(CB1R)could affect novel object recognition(NOR)memory in chronically rapid eye movement sleep-deprived(RSD)rats.Methods The animals ... Objective We aimed to investigate whether antagonism of the cannabinoid CB1 receptor(CB1R)could affect novel object recognition(NOR)memory in chronically rapid eye movement sleep-deprived(RSD)rats.Methods The animals were examined for recognition memory following a 7-day chronic partial RSD paradigm using the multiple platform technique.The CB1R antagonist rimonabant(1 or 3 mg/kg,i.p.)was administered either at one hour prior to the sample phase for acquisition,or immediately after the sample phase for consolidation,or at one hour before the test phase for retrieval of NOR memory.For the reconsolidation task,rimonabant was administered immediately after the second sample phase.Results The RSD episode impaired acquisition,consolidation,and retrieval,but it did not affect the reconsolidation of NOR memory.Rimonabant administration did not affect acquisition,consolidation,and reconsolidation;however,it attenuated impairment of the retrieval of NOR memory induced by chronic RSD.Conclusions These findings,along with our previous report,would seem to suggest that RSD may affect different phases of recognition memory based on its duration.Importantly,it seems that the CB1R may,at least in part,be involved in the adverse effects of chronic RSD on the retrieval,but not in the acquisition,consolidation,and reconsolidation,of NOR memory. 展开更多
关键词 REM sleep deprivation novel object recognition memory cannabinoid CB1 receptor RIMONABANT
在线阅读 下载PDF
PF-YOLO:An Improved YOLOv8 for Small Object Detection in Fisheye Images
7
作者 Cheng Zhang Cheng Xu Hongzhe Liu 《Journal of Beijing Institute of Technology》 2025年第1期57-70,共14页
Top-view fisheye cameras are widely used in personnel surveillance for their broad field of view,but their unique imaging characteristics pose challenges like distortion,complex scenes,scale variations,and small objec... Top-view fisheye cameras are widely used in personnel surveillance for their broad field of view,but their unique imaging characteristics pose challenges like distortion,complex scenes,scale variations,and small objects near image edges.To tackle these,we proposed peripheral focus you only look once(PF-YOLO),an enhanced YOLOv8n-based method.Firstly,we introduced a cutting-patch data augmentation strategy to mitigate the problem of insufficient small-object samples in various scenes.Secondly,to enhance the model's focus on small objects near the edges,we designed the peripheral focus loss,which uses dynamic focus coefficients to provide greater gradient gains for these objects,improving their regression accuracy.Finally,we designed the three dimensional(3D)spatial-channel coordinate attention C2f module,enhancing spatial and channel perception,suppressing noise,and improving personnel detection.Experimental results demonstrate that PF-YOLO achieves strong performance on the challenging events for person detection from overhead fisheye images(CEPDTOF)and in-the-wild events for people detection and tracking from overhead fisheye cameras(WEPDTOF)datasets.Compared to the original YOLOv8n model,PFYOLO achieves improvements on CEPDTOF with increases of 2.1%,1.7%and 2.9%in mean average precision 50(mAP 50),mAP 50-95,and tively.On WEPDTOF,PF-YOLO achieves substantial improvements with increases of 31.4%,14.9%,61.1%and 21.0%in 91.2%and 57.2%,respectively. 展开更多
关键词 FISHEYE object detection and recognition small object detection deep learning
在线阅读 下载PDF
小样本条件下基于YOLOv7的小目标检测方法
8
作者 路琪 郭乐江 +2 位作者 于元强 刘飞 熊鑫 《现代电子技术》 北大核心 2025年第5期153-161,共9页
低空慢速小目标的监视一直是预警探测领域的重点和难点。目前主流的基于卷积神经网络的目标检测算法主要设计应用于VOC数据集或COCO数据集,在特定场景下检测精度并不理想。YOLO是目前应用最广泛的单阶段目标检测算法之一,在检测速度方... 低空慢速小目标的监视一直是预警探测领域的重点和难点。目前主流的基于卷积神经网络的目标检测算法主要设计应用于VOC数据集或COCO数据集,在特定场景下检测精度并不理想。YOLO是目前应用最广泛的单阶段目标检测算法之一,在检测速度方面具有独特的优势。利用可见光成像手段获取小型无人机目标图片,基于YOLOv7算法改进了其特征增强网络,提出一种三分支并行特征金字塔网络,以获得更多的小目标上下文语义特征;将改进后的算法与生成对抗网络进行级联,旨在生成更真实的超分辨率图像,从而提高检测精度。与目前最先进的目标检测方法相比,该方法在满足检测实时性要求的前提下,使得检测精度有了显著的提升。由于训练集有限,为了提高泛化能力,还提出了SOD-Mosaic数据增强方法,该方法提高了检测器的鲁棒性和泛化能力。 展开更多
关键词 自动目标识别 卷积神经网络 小目标检测 数据增强 特征增强 特征金字塔网络
在线阅读 下载PDF
基于改进YOLOv7的航拍图像下松材线虫病疫木识别
9
作者 胡丹妮 吴红玉 叶振 《林业工程学报》 北大核心 2025年第2期147-155,共9页
松材线虫病是一种危害程度极高的传染性松树病害。为精确掌握大尺度范围松材线虫病疫木的数量和分布,提出了一种基于改进YOLOv7的无人机航拍图像下松材线虫病疫木检测模型。首先,针对因航拍图像背景复杂而导致的疫木错检漏检问题,在模... 松材线虫病是一种危害程度极高的传染性松树病害。为精确掌握大尺度范围松材线虫病疫木的数量和分布,提出了一种基于改进YOLOv7的无人机航拍图像下松材线虫病疫木检测模型。首先,针对因航拍图像背景复杂而导致的疫木错检漏检问题,在模型主干特征提取部分引入SimAM注意力机制,以便模型更好地聚焦松材线虫病疫木颜色、纹理等关键特征;其次,用ConvNeXt网络对Head部分的ELAN-W网络进行替换,以提高模型对单株疫木的特征提取效率,在降低模型参数量的同时提升模型检测速度;然后,引入SPD-Conv以提高低分辨率航拍图像下小目标的检测精度;最后,将颈部网络的卷积替换为CoordConv,以更好地感受特征图中疫木的位置信息。在自建的松材线虫病疫木数据集中进行了大量验证,结果表明:经改进后的YOLOv7模型检测精确度为91.1%,召回率为93.5%,F_(1)分数为92.3%,与原YOLOv7模型及其他当前主流模型相比,各项主要指标均有一定提升。在选取的两块不同区域测试样地上的实验结果表明,本模型具有较好的适应性,可有效应用于大尺度松材线虫病疫木普查任务中。 展开更多
关键词 松材线虫病 大尺度范围疫木识别 无人机航拍图像 目标检测 YOLOv7
在线阅读 下载PDF
基于SCI-XDNet-CFF轻量化网络的井下运煤皮带异物识别 被引量:1
10
作者 孙亚琳 孙鹏翔 +2 位作者 薛晔 刘泽宇 孙贵有 《煤矿现代化》 2025年第1期40-46,51,共8页
矿井煤炭开采面与地面距离较长,需要通过运煤皮带进行长距离运输,在运输过程中,存在大块矸石、锚杆等异物损坏皮带、堵塞落煤口的问题,易引发安全问题,因此,运煤皮带运输异物分类具有重要意义。为克服井下环境光照强度弱、识别精度低、... 矿井煤炭开采面与地面距离较长,需要通过运煤皮带进行长距离运输,在运输过程中,存在大块矸石、锚杆等异物损坏皮带、堵塞落煤口的问题,易引发安全问题,因此,运煤皮带运输异物分类具有重要意义。为克服井下环境光照强度弱、识别精度低、模型参数量大的问题,提出一种结合低光照图像增强的XDNet-CFF轻量化网络。首先,采用预训练的自校准光照图像增强模型对井下运煤皮带图像进行低光照图像增强,有效提高图像质量;其次,设计一种基于Xcpetion-DenseNet121和跨层特征融合的深度网络,在提高特征提取能力的同时,将底层细节特征与上层语义特征相结合,减少信息丢失,丰富特征表示;然后,通过全连接层和softmax完成运煤皮带异物识别;最后,为实现移动端部署和识别预警,应用剪枝方法对模型进行压缩,大幅减少模型参数量,降低开销。结果表明,所提模型在运煤皮带异物数据集上准确率、精度、召回率、F1分数分别达到0.9467、0.9512、0.9416、0.9464,均优于主流模型,同时,参数量仅8.98 M,满足实际生产部署需求。 展开更多
关键词 低光照图像增强 XDNet-CFF 跨层特征融合 运煤皮带 异物识别
在线阅读 下载PDF
Bioinspired Passive Tactile Sensors Enabled by Reversible Polarization of Conjugated Polymers
11
作者 Feng He Sitong Chen +3 位作者 Ruili Zhou Hanyu Diao Yangyang Han Xiaodong Wu 《Nano-Micro Letters》 SCIE EI CAS 2025年第1期361-377,共17页
Tactile perception plays a vital role for the human body and is also highly desired for smart prosthesis and advanced robots.Compared to active sensing devices,passive piezoelectric and triboelectric tactile sensors c... Tactile perception plays a vital role for the human body and is also highly desired for smart prosthesis and advanced robots.Compared to active sensing devices,passive piezoelectric and triboelectric tactile sensors consume less power,but lack the capability to resolve static stimuli.Here,we address this issue by utilizing the unique polarization chemistry of conjugated polymers for the first time and propose a new type of bioinspired,passive,and bio-friendly tactile sensors for resolving both static and dynamic stimuli.Specifically,to emulate the polarization process of natural sensory cells,conjugated polymers(including poly(3,4-ethylenedioxythiophen e):poly(styrenesulfonate),polyaniline,or polypyrrole)are controllably polarized into two opposite states to create artificial potential differences.The controllable and reversible polarization process of the conjugated polymers is fully in situ characterized.Then,a micro-structured ionic electrolyte is employed to imitate the natural ion channels and to encode external touch stimulations into the variation in potential difference outputs.Compared with the currently existing tactile sensing devices,the developed tactile sensors feature distinct characteristics including fully organic composition,high sensitivity(up to 773 mV N^(−1)),ultralow power consumption(nW),as well as superior bio-friendliness.As demonstrations,both single point tactile perception(surface texture perception and material property perception)and two-dimensional tactile recognitions(shape or profile perception)with high accuracy are successfully realized using self-defined machine learning algorithms.This tactile sensing concept innovation based on the polarization chemistry of conjugated polymers opens up a new path to create robotic tactile sensors and prosthetic electronic skins. 展开更多
关键词 Passive tactile sensors Reversible polarization of conjugated polymers Tactile perception Machine learning algorithm object recognition
在线阅读 下载PDF
地铁车辆附着异物的数据集扩充方法和检测模型随机mixup训练方法研究(下)
12
作者 黎志国 《铁道技术监督》 2025年第3期61-65,共5页
现有的地铁车辆异物检测模型存在真实训练数据匮乏、检测精度低等问题,难以满足实际应用的需要。对此,从公开数据集和互联网中收集废弃塑料袋等异物图像并标注异物轮廓,利用随机旋转、缩放等方法扩展图像数据,利用泊松融合算法,将异物... 现有的地铁车辆异物检测模型存在真实训练数据匮乏、检测精度低等问题,难以满足实际应用的需要。对此,从公开数据集和互联网中收集废弃塑料袋等异物图像并标注异物轮廓,利用随机旋转、缩放等方法扩展图像数据,利用泊松融合算法,将异物图像与可能附着异物的图像随机融合,生成附着异物图像数据集。采用随机mixup方法,利用扩充后的数据集,训练基于YOLOv4网络的地铁车辆附着异物检测模型,并开展验证试验。试验结果表明,利用扩充后的异物数据集,采用随机mixup方法训练后的检测模型,检测效果更佳。 展开更多
关键词 地铁车辆 附着异物 图像识别 深度卷积神经网络 目标检测 数据集 模型训练 训练方法
在线阅读 下载PDF
基于FasterYOLOv9-Slim的轻量级工厂化养殖鱼群识别
13
作者 张鑫 于红 +4 位作者 吴子健 程志澳 高陈成 杨宗轶 王悦 《渔业现代化》 北大核心 2025年第1期99-109,共11页
针对计算资源有限的工厂化养殖对鱼群识别精度和速度之间的平衡要求,提出一种基于YOLOv9和FasterNet改进的轻量级养殖鱼群识别模型FasterYOLOv9-Slim。首先在YOLOv9中引入轻量级骨干网络FasterNet以减少模型参数和计算量;其次利用高维... 针对计算资源有限的工厂化养殖对鱼群识别精度和速度之间的平衡要求,提出一种基于YOLOv9和FasterNet改进的轻量级养殖鱼群识别模型FasterYOLOv9-Slim。首先在YOLOv9中引入轻量级骨干网络FasterNet以减少模型参数和计算量;其次利用高维检测头剪枝(HDPrune)降低网络深度以减少干扰信息积累;最后结合改进的特征融合模块FasterRepNCSPELAN4和下采样模块ADown、DownSimper,构建高效的颈部网络(DFA-Neck),增强特征表达同时降低计算需求。为验证所提出算法的有效性,设计了消融试验和对比试验,消融试验结果表明,FasterNet和HDPrune分别在降低参数和减弱干扰信息方面起到有效作用,DFA-Neck在整体网络中有效地协调了两者;对比试验结果显示,FasterYOLOv9-Slim在工厂化养殖红鳍东方鲀数据集上的表现超越了YOLOv7、YOLOv8和YOLOv10系列模型中同等规模的先进识别模型,保证高精度的同时,参数值分别降低了34.14%、64.02%和22.22%。在与ShuffleNet、MobileNet和RepViT等先进轻量级网络的对比中展现出较好的综合性能。研究表明:该方法能够有效平衡模型在计算资源有限的工厂化养殖条件下鱼群识别的精度和速度。 展开更多
关键词 养殖鱼群 YOLOv9 目标识别 模型剪枝 轻量化
在线阅读 下载PDF
基于目标检测的紫外光火情预警系统设计
14
作者 董钢 李成勇 卢瑛 《激光杂志》 北大核心 2025年第3期216-219,共4页
近年来,频频发生的火灾,造成大量的人员伤亡及财产损失,因此,火情预警越来越关键。为了有效解决火情预警系统反应相对缓慢及检测范围有限,造成预警能力受限的问题。结合火情特点,使用Jetson Nano(人工智能边缘计算套件)为主控中心,利用L... 近年来,频频发生的火灾,造成大量的人员伤亡及财产损失,因此,火情预警越来越关键。为了有效解决火情预警系统反应相对缓慢及检测范围有限,造成预警能力受限的问题。结合火情特点,使用Jetson Nano(人工智能边缘计算套件)为主控中心,利用LabelImg(标签)将两千多张图像数据进行标记,通过YOLOv5(目标检测算法)训练,得到火灾图像的训练权重;Jetson Nano读取紫外摄像头采集到的图像数据经训练权重推测是否发生火灾,若发生火灾则通过Jetson Nano的串口向微控制器发送数据,触发报警。本设计经过测试对火灾以及烟雾检测的正确率达97%以上,识别烟雾火灾的准确度高,火情预警迅速。相比于传统火灾检测技术,检测范围更广,精度更高,不易受环境影响。 展开更多
关键词 目标检测 图像识别 火灾检测 特征提取
在线阅读 下载PDF
基于YOLO车道多目标检测识别系统的研究
15
作者 陈晓东 《内燃机与配件》 2025年第5期11-13,共3页
为了解决人眼视力范围有限、疏忽等问题所引发的碰撞等交通事故,采用计算机视觉进行目标智能检测和识别,目前深度学习算法是目标检测识别的热门研究方向,主要有YOLO(You Only Look Once)、VGG、SSD(Single Shot MultiBox Detector)、Cor... 为了解决人眼视力范围有限、疏忽等问题所引发的碰撞等交通事故,采用计算机视觉进行目标智能检测和识别,目前深度学习算法是目标检测识别的热门研究方向,主要有YOLO(You Only Look Once)、VGG、SSD(Single Shot MultiBox Detector)、CornerNet等算法,其中YOLO网络容易训练和调整,运行速度快,可达到实时检测效果,针对车道多目标检测的时效性等问题,文中提出基于YOLO车道多目标检测识别系统。该系统可以实时地检测出车道目标及类型的概率,同时通过多次实验,设置合适置信度,提高识别准确性,对于车辆和行人识别准确率在0.85以上,如果训练样本库数量继续增加,准确率还会提高,有效避免因人为疏忽发生碰撞等问题,对智能车道偏离辅助系统有一定的应用价值。 展开更多
关键词 YOLO 多目标 检测 识别 车道
在线阅读 下载PDF
多特征融合下连续帧图像运动目标识别方法
16
作者 刘朝霞 《现代电子技术》 北大核心 2025年第5期49-52,共4页
针对不同类型运动目标形状不同、运动模式不一致导致识别难度大的问题,文中提出一种多特征融合下连续帧图像运动目标识别方法。通过摄像机对目标进行连续帧图像采集,从中提取图像颜色及纹理特征,经归一化操作和特征间的欧氏距离融合提... 针对不同类型运动目标形状不同、运动模式不一致导致识别难度大的问题,文中提出一种多特征融合下连续帧图像运动目标识别方法。通过摄像机对目标进行连续帧图像采集,从中提取图像颜色及纹理特征,经归一化操作和特征间的欧氏距离融合提取多特征后,进行近似距离计算并排序,将前一部分作为长短期记忆网络输入特征向量,构建运动目标识别模型,输出连续帧图像运动目标识别结果。通过实验验证,该方法能够通过一种可视化的页面将识别结果显示出来,便于用户快速、准确地理解和分析识别结果,识别速度快、稳定可靠,可以为相关领域提供有效的技术支持。 展开更多
关键词 多特征融合 连续帧图像 运动目标识别 特征提取 颜色特征 纹理特征 欧氏距离 长短期记忆网络
在线阅读 下载PDF
基于改进YOLOv7算法的学生课堂行为识别研究
17
作者 张小妮 杨萌萌 +1 位作者 张军锋 苏利萍 《现代信息科技》 2025年第4期69-73,共5页
学生课堂行为识别能够有效提升课堂教学效果,是智慧教育不可或缺的一环。鉴于缺乏相关研究数据,文章首先构建了学生课堂行为数据集。在特殊的课堂环境中,学生数量众多且常相互遮挡,后排学生目标体积较小,所以在复杂多变的环境下,难以将... 学生课堂行为识别能够有效提升课堂教学效果,是智慧教育不可或缺的一环。鉴于缺乏相关研究数据,文章首先构建了学生课堂行为数据集。在特殊的课堂环境中,学生数量众多且常相互遮挡,后排学生目标体积较小,所以在复杂多变的环境下,难以将学生行为与周围背景区分开来。因此,文章提出一种基于改进YOLOv7目标检测算法的学生行为识别方法(YL7CA),将CA注意力机制嵌入到YOLOv7中,以便更准确地检测学生行为。该方法在自建数据集上获得了92.6%的检测精度,能有效检测出抬头、低头、转头、玩手机、读写、睡觉这六类常见的学生课堂行为。 展开更多
关键词 YOLOv7 行为识别 注意力机制 目标检测
在线阅读 下载PDF
基于深度学习的煤矿井下人员不安全行为检测与识别
18
作者 郭孝园 朱美强 +1 位作者 田军 朱贝贝 《工矿自动化》 北大核心 2025年第3期138-147,共10页
针对井下目标发生多尺度变化、运动目标遮挡及目标与环境过于相似等问题,提出了一种基于深度学习的煤矿井下人员不安全行为检测与识别方法。采用自上而下的策略,构建了一种基于自注意力机制的目标检测模型YOLOv5s_swin:在基于自注意力... 针对井下目标发生多尺度变化、运动目标遮挡及目标与环境过于相似等问题,提出了一种基于深度学习的煤矿井下人员不安全行为检测与识别方法。采用自上而下的策略,构建了一种基于自注意力机制的目标检测模型YOLOv5s_swin:在基于自注意力机制的模型Transformer基础上引入滑动窗口操作,得到Swin-Transformer,再利用Swin-Transformer对传统YOLOv5s模型进行改进,得到YOLOv5s_swin。针对井下人员与监控探头间距不定导致的人体检测框多尺度变化问题,在检测出人员目标的基础上,使用高分辨率特征提取网络对人体的关节点进行提取,再通过时空图卷积网络(ST-GCN)进行行为识别。实验结果表明:YOLOv5s_swin的精确度达98.9%,在YOLOv5s的基础上提升了1.5%,推理速度达102帧/s,满足实时性检测要求;高分辨率特征提取网络能够准确提取不同尺度的目标人体关节点,特征通道数更多的HRNet_w48网络性能优于HRNet_w32;在复杂工矿条件下,ST-GCN模型的准确率和召回率都较高,可准确地对矿工行为进行分类,推理速度达31帧/s,满足井下监测需求。 展开更多
关键词 井下不安全行为识别 目标检测 深度学习 自注意力机制 YOLOv5s 高分辨率特征提取网络 时空图卷积网络
在线阅读 下载PDF
基于深度学习的鱼类识别相关技术研究现状及展望 被引量:4
19
作者 汤永华 张志鹏 +2 位作者 林森 刘兴通 张志佳 《海洋渔业》 CSCD 北大核心 2024年第2期246-256,共11页
为促进渔业生产智能化、现代化发展,综述了基于深度学习的鱼类识别相关技术。首先,从数据集构建、数据预处理、神经网络模型设计以及模型训练等4个方面阐述了基于深度学习的鱼类识别工作流程。然后,从图像分类、目标检测、图像分割3个... 为促进渔业生产智能化、现代化发展,综述了基于深度学习的鱼类识别相关技术。首先,从数据集构建、数据预处理、神经网络模型设计以及模型训练等4个方面阐述了基于深度学习的鱼类识别工作流程。然后,从图像分类、目标检测、图像分割3个角度总结了近几年鱼类识别相关技术的研究进展及应用成果。其中,图像分类主要用于识别个体鱼的色泽与种类,目标检测侧重于估计鱼群的数量和体型,而图像分割则在推断鱼类的状态和行为方面发挥着重要作用。同时,分析了不同方法所具备的优势,比较了各方法在数据集中的性能指标。最后,对深度学习在鱼类识别领域的下一步发展方向和研究重点进行了展望。综上,深度学习方法效率普遍较高、泛化能力普遍较强,深度学习技术在鱼类识别中的广泛应用能够为渔业科研人员提供有效的技术支撑。 展开更多
关键词 鱼类识别 深度学习 卷积神经网络 目标检测 图像分割 研究进展
在线阅读 下载PDF
基于CED-YOLOv5s模型的煤矸识别方法研究 被引量:4
20
作者 何凯 程刚 +3 位作者 王希 葛庆楠 张辉 赵东洋 《工矿自动化》 CSCD 北大核心 2024年第2期49-56,82,共9页
由于煤矿井下高噪声、低照度、运动模糊的复杂工况和煤矸易聚集现象,导致煤矸目标检测模型特征提取困难及煤矸分类、定位不准确问题。针对该问题,提出一种基于CED-YOLOv5s模型的煤矸识别方法。首先,在YOLOv5s主干网络中引入坐标注意力(... 由于煤矿井下高噪声、低照度、运动模糊的复杂工况和煤矸易聚集现象,导致煤矸目标检测模型特征提取困难及煤矸分类、定位不准确问题。针对该问题,提出一种基于CED-YOLOv5s模型的煤矸识别方法。首先,在YOLOv5s主干网络中引入坐标注意力(CA)机制,通过将坐标信息嵌入信道关系和长程依赖关系中对特征图进行编码,充分利用通道注意力信息和空间注意力信息,使模型更加关注重要特征,抑制无用信息。其次,在YOLOv5s的检测头部引入EIoU回归损失函数,将目标框与锚框的宽高差异最小化,以增强目标的位置和边界信息,提高模型在密集目标下的定位精度和收敛速度;最后,在YOLOv5s的检测头部引入轻量化解耦头,解耦出单独的特征通道,分别用于分类任务和回归任务,解决了原模型中耦合头部分类任务与回归任务的相互干扰问题,进一步提升了模型的并行运算效率与检测精度。实验结果表明:CED-YOLOv5s模型与其他YOLO系列目标检测模型相比,综合性能最佳,平均检测精度达94.8%,相较于YOLOv5s模型提升了3.1%,检测速度达84.8帧/s,可充分满足煤矿井下煤矸实时检测需求。 展开更多
关键词 煤矸识别 YOLOv5s 坐标注意力 损失函数 轻量化解耦头 密集目标定位
在线阅读 下载PDF
上一页 1 2 28 下一页 到第
使用帮助 返回顶部