期刊文献+
共找到508篇文章
< 1 2 26 >
每页显示 20 50 100
Visualization of flatness pattern recognition based on T-S cloud inference network 被引量:2
1
作者 张秀玲 赵亮 +1 位作者 臧佳音 樊红敏 《Journal of Central South University》 SCIE EI CAS CSCD 2015年第2期560-566,共7页
Flatness pattern recognition is the key of the flatness control. The accuracy of the present flatness pattern recognition is limited and the shape defects cannot be reflected intuitively. In order to improve it, a nov... Flatness pattern recognition is the key of the flatness control. The accuracy of the present flatness pattern recognition is limited and the shape defects cannot be reflected intuitively. In order to improve it, a novel method via T-S cloud inference network optimized by genetic algorithm(GA) is proposed. T-S cloud inference network is constructed with T-S fuzzy neural network and the cloud model. So, the rapid of fuzzy logic and the uncertainty of cloud model for processing data are both taken into account. What's more, GA possesses good parallel design structure and global optimization characteristics. Compared with the simulation recognition results of traditional BP Algorithm, GA is more accurate and effective. Moreover, virtual reality technology is introduced into the field of shape control by Lab VIEW, MATLAB mixed programming. And virtual flatness pattern recognition interface is designed.Therefore, the data of engineering analysis and the actual model are combined with each other, and the shape defects could be seen more lively and intuitively. 展开更多
关键词 pattern recognition T-S cloud inference network cloud model mixed programming virtual reality visual recognition
在线阅读 下载PDF
Place recognition based on saliency for topological localization 被引量:2
2
作者 王璐 蔡自兴 《Journal of Central South University of Technology》 EI 2006年第5期536-541,共6页
Based on salient visual regions for mobile robot navigation in unknown environments, a new place recognition system was presented. The system uses monocular camera to acquire omni-directional images of the environment... Based on salient visual regions for mobile robot navigation in unknown environments, a new place recognition system was presented. The system uses monocular camera to acquire omni-directional images of the environment where the robot locates. Salient local regions are detected from these images using center-surround difference method, which computes opponencies of color and texture among multi-scale image spaces. And then they are organized using hidden Markov model (HMM) to form the vertex of topological map. So localization, that is place recognition in our system, can be converted to evaluation of HMM. Experimental results show that the saliency detection is immune to the changes of scale, 2D rotation and viewpoint etc. The created topological map has smaller size and a higher ratio of recognition is obtained. 展开更多
关键词 visual saliency place recognition mobile robot localization hidden Markov model
在线阅读 下载PDF
ISAR target recognition based on non-negative sparse coding
3
作者 Ning Tang Xunzhang Gao Xiang Li 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2012年第6期849-857,共9页
Aiming at technical difficulties in feature extraction for the inverse synthetic aperture radar (ISAR) target recognition, this paper imports the concept of visual perception and presents a novel method, which is ba... Aiming at technical difficulties in feature extraction for the inverse synthetic aperture radar (ISAR) target recognition, this paper imports the concept of visual perception and presents a novel method, which is based on the combination of non-negative sparse coding (NNSC) and linear discrimination optimization, to recognize targets in ISAR images. This method implements NNSC on the matrix constituted by the intensities of pixels in ISAR images for training, to obtain non-negative sparse bases which characterize sparse distribution of strong scattering centers. Then this paper chooses sparse bases via optimization criteria and calculates the corresponding non-negative sparse codes of both training and test images as the feature vectors, which are input into k neighbors classifier to realize recognition finally. The feasibility and robustness of the proposed method are proved by comparing with the template matching, principle component analysis (PCA) and non-negative matrix factorization (NMF) via simulations. 展开更多
关键词 inverse synthetic aperture radar (ISAR) PRE-PROCESSING non-negative sparse coding (NNSC) visual percep-tion target recognition.
在线阅读 下载PDF
基于卷积神经网络视觉识别的智能输液系统的研发与初步应用
4
作者 徐海利 潘红英 +4 位作者 黄晨 徐虹霞 陈玉萍 张文娟 乔凯 《中国护理管理》 北大核心 2025年第4期625-629,共5页
目的:探讨基于卷积神经网络视觉识别的智能输液系统在临床应用中的有效性和安全性,以期为智能输液系统在普通病房的应用提供参考借鉴。方法:便利选取2022年10月及2023年3月于浙江省某三级甲等医院普通外科病房的280例患者及16名护士为... 目的:探讨基于卷积神经网络视觉识别的智能输液系统在临床应用中的有效性和安全性,以期为智能输液系统在普通病房的应用提供参考借鉴。方法:便利选取2022年10月及2023年3月于浙江省某三级甲等医院普通外科病房的280例患者及16名护士为研究对象,其中患者包括智能输液系统建立前的140例和建立后的140例。比较智能输液系统建立前后护士的工作负担、患者的满意度以及病区的噪声水平。结果:智能输液系统建立后护士往返护士站的次数少于之前(P<0.05);患者对智能输液系统的满意度高于之前(P<0.05);护士应铃时长短于之前(P<0.05);噪声水平低于之前(P<0.05)。结论:基于卷积网络视觉识别的智能输液系统可以减轻护士的工作负担,提升患者满意度,对改善输液护理质量及病区环境具有重要价值。 展开更多
关键词 卷积神经网络 视觉识别 智能输液系统 护理质量
在线阅读 下载PDF
基于高光谱成像的烟火药快速可视化识别方法
5
作者 李云鹏 王宏炜 +3 位作者 代雪晶 武连全 胡伟成 张彦春 《光谱学与光谱分析》 北大核心 2025年第8期2183-2189,共7页
涉爆现场勘查工作中,烟火药的快速探测和准确识别对重大突发爆炸案件的防控与快速处置起着至关重要的作用,而当前对烟火药等爆炸物进行现场快速检测方法大多存在识别速度低、可视化困难等问题。鉴于此,提出一种基于高光谱成像技术结合... 涉爆现场勘查工作中,烟火药的快速探测和准确识别对重大突发爆炸案件的防控与快速处置起着至关重要的作用,而当前对烟火药等爆炸物进行现场快速检测方法大多存在识别速度低、可视化困难等问题。鉴于此,提出一种基于高光谱成像技术结合单类支持向量机(OCSVM)快速发现与识别烟火药的方法。首先,使用高光谱相机采集检材400~720 nm波段的高光谱数据,运用主成分分析(PCA)对数据进行降维,通过乘性散射校正(MSC)消除样本表面颗粒散射引起的基线偏移,使用Savitzky-Golay(SG)平滑抑制高频噪声,提升光谱信噪比。其次,为减少模型复杂度提高效率,通过Kennnard-Stone(K-S)方法从光谱数据中选取代表性的烟火药样本作为数据集,以4∶1的比例将其划分为训练集和测试集,在此基础上建立OCSVM模型。再次,为验证模型对烟火药的识别能力,使用相同的训练集建立孤立森林(iForest)、自编码器(AE)模型,对比三种模型对烟火药的识别能力。最后,将识别结果映射到检材的RGB图像中,采取掩膜操作标记目标类像素得到识别图像,实现烟火药的可视化识别效果。结果表明,OCSVM方法对多种检材识别的总体精度高于0.95、F1得分和AUC值超过0.8、识别时间低于2 s,OCSVM在分类准确率、运行速度、F1得分和曲线下面积(AUC)等指标上的表现均优于孤立森林模型和自编码器模型。在可视化识别方面,经过映射和掩膜操作后得到基于OCSVM模型的识别图像可以较为准确的反映出烟火药在所有检材中的分布情况,而基于孤立森林和自编码器模型的识别图像未能很好的反映烟火药在黄色纸和黑色涤纶布料上的分布。研究表明,本文提出的基于高光谱成像结合OCSVM的烟火药识别方法具有识别准确率高、反应速度快、泛化能力强的特点,能够快速、准确、无损地识别检材中的烟火药。其识别精度、识别速度以及可视化效果可很好的适用于涉爆现场烟火药的快速发现与临场检测,为现场勘查中烟火药的搜寻提供一种有效方法。 展开更多
关键词 高光谱成像技术 单类支持向量机 烟火药 可视化识别
在线阅读 下载PDF
人工智能生成艺术图像的信任研究
6
作者 陈莉 刘艺东 +1 位作者 王康 陈欣星 《包装工程》 北大核心 2025年第18期359-367,共9页
目的人工智能生成的艺术图像在包装设计领域已有大量实践案例,但并非所有AI生成的图像都能被用户接受。探索艺术图像的属性如何影响人们判断艺术图像是否由AI生成,重点不在于用户是否分辨出了AI生成的艺术图像,而在于用户是否“信任”... 目的人工智能生成的艺术图像在包装设计领域已有大量实践案例,但并非所有AI生成的图像都能被用户接受。探索艺术图像的属性如何影响人们判断艺术图像是否由AI生成,重点不在于用户是否分辨出了AI生成的艺术图像,而在于用户是否“信任”图像的绘制方式,以此为设计师筛选AI生成的艺术图像及AI生成图像技术发展提供实证参考和建议。方法基于艺术图像的复杂度、样本熵和艺术风格3种属性分类艺术图像数据库中AI生成艺术图像与真人绘制艺术图像;筛选160张不同复杂度、艺术风格的艺术图像,参与者对每幅艺术图像是否由AI生成的信任程度进行打分;对参与者进行艺术知识水平问卷测试;分析艺术图像属性和参与者对图像绘制方式的信任程度。结果熵对于参与者信任没有显著影响,复杂度和个体艺术知识水平对于参与者信任图像的绘制方式有显著影响。结论研究结果对于理解艺术图像的用户信任构建具有实际意义,加深了对图像属性如何影响人类感知的理解。 展开更多
关键词 信任 艺术图像设计 人工智能生成 复杂度 视觉认知
在线阅读 下载PDF
基于注意力机制和能量函数的动作识别算法
7
作者 王丽芳 吴荆双 +1 位作者 尹鹏亮 胡立华 《计算机应用》 北大核心 2025年第1期234-239,共6页
针对零样本动作识别(ZSAR)算法的框架缺乏结构性指导的问题,以基于能量的模型(EBM)指导框架设计,提出基于注意力机制和能量函数的动作识别算法(ARAAE)。首先,为了得到EBM的输入,设计了光流加3D卷积(C3D)架构的组合以提取视觉特征,从而... 针对零样本动作识别(ZSAR)算法的框架缺乏结构性指导的问题,以基于能量的模型(EBM)指导框架设计,提出基于注意力机制和能量函数的动作识别算法(ARAAE)。首先,为了得到EBM的输入,设计了光流加3D卷积(C3D)架构的组合以提取视觉特征,从而达到空间去冗余的效果;其次,将视觉Transformer(ViT)用于视觉特征的提取以减少时间冗余,同时利用ViT配合光流加C3D架构的组合以减少空间冗余,从而获得非冗余视觉空间;最后,为度量视觉空间和语义空间的相关性,实现能量评分评估机制,设计联合损失函数来进行优化实验。采用6个经典ZSAR算法及近年文献里的算法在两个数据集HMDB51和UCF101进行实验的结果表明:相较于CAGE(Coupling Adversarial Graph Embedding)、Bi-dir GAN(Bi-directional Generative Adversarial Network)和ETSAN(Energy-based Temporal Summarized Attentive Network)等算法,在平均分组的HMDB51数据集上,ARAAE平均识别准确率提升至(22.1±1.8)%,均明显优于对比算法;在平均分组的UCF101数据集上,ARAAE的平均识别准确率提升至(22.4±1.6)%,略优于对比算法;在以81/20为分割方式的UCF101数据集上,ARAAE的平均识别准确率提升至(40.2±2.6)%,均大于对比算法。可见,ARAAE在ZSAR中能有效提高识别性能。 展开更多
关键词 零样本动作识别 能量函数 注意力机制 光流法 视觉特征
在线阅读 下载PDF
基于循环双谱与改进VGGNet的常规雷达目标分类
8
作者 李秋生 熊芳茂 朱化娟 《航空兵器》 北大核心 2025年第4期95-102,共8页
针对传统雷达目标识别方法在低分辨率和强噪声背景下识别性能受限的问题,本文提出了一种融合循环谱切片与深度学习技术的创新性解决方案。首先,采用时域平滑法计算雷达信号的循环谱,并通过对目标循环谱切片的理论分析获取其区分性特征... 针对传统雷达目标识别方法在低分辨率和强噪声背景下识别性能受限的问题,本文提出了一种融合循环谱切片与深度学习技术的创新性解决方案。首先,采用时域平滑法计算雷达信号的循环谱,并通过对目标循环谱切片的理论分析获取其区分性特征。然后,将切片谱图输入改进型深度卷积生成对抗网络(Deep Convolutional Generative Adversarial Networks,DCGAN)进行数据增强处理,以扩充样本规模并提升模型的泛化能力。在此基础上,利用改进的视觉几何组网络(Visual Geometry Group Network,VGGNet)自动提取表征目标循环平稳性的特征量值。实验结果表明,循环谱能有效表征目标信号的本质属性,并展现对噪声和杂波的强效抑制能力。在有限样本和低信噪比条件下,所提方法的分类准确率显著提升,向站飞行姿态目标分类准确率分别达到98.46%(f=f_(c))与98.40%(f=0),背站飞行姿态目标分类准确率分别为98.30%(f=f_(c))与98.13%(f=0),相较于传统方法和原始VGGNet网络,准确率分别提升了2.06%~2.40%和1.89%~2.34%。 展开更多
关键词 电子战 雷达目标 目标识别 循环谱 深度卷积生成对抗网络 视觉几何组网络
在线阅读 下载PDF
基于改进YOLOv8n的散养鸭蛋识别与定位 被引量:2
9
作者 龚东军 林卫国 +3 位作者 杨浩 陈瑞 王巧华 王树才 《农业工程学报》 北大核心 2025年第1期161-170,共10页
为解决鸭蛋捡拾机器人对中远距离散养鸭蛋识别困难与定位精度差等问题,该研究先以YOLOv8n原始模型为基础,采用添加针对小目标检测的P2检测头的升级模型YOLOv8n-P2,使模型能够在目标特征保存更完整的大尺寸特征图中进行检测,并引入卷积... 为解决鸭蛋捡拾机器人对中远距离散养鸭蛋识别困难与定位精度差等问题,该研究先以YOLOv8n原始模型为基础,采用添加针对小目标检测的P2检测头的升级模型YOLOv8n-P2,使模型能够在目标特征保存更完整的大尺寸特征图中进行检测,并引入卷积模块注意力机制模块(convolutional block attention module,CBAM)与Involution内卷算子,增强特征图不同通道之间的联系,提高模型网络在通道维度上的感知能力和对小目标的检测能力。其次,在图像目标识别的基础上,提出了一种基于机器人操作系统(robot operating system,ROS)的视觉定位方法,通过机器视觉识别与坐标变换(transform,TF),实现了鸭蛋捡拾机器人搭载深度相机在运动过程中对目标鸭蛋的高精度实时视觉定位。试验结果表明,改进模型YOLOv8n-P2-CBAM-INV的权重文件大小为20.80 MB,每秒浮点计算量为51.4 G,单张图像平均检测用时14.5 ms,精确率和召回率分别为98.30%和96.60%,相较于原始模型YOLOv8n,在测试集上平均精度均值提高了7.1个百分点,该模型在6.0 m距离测试,平均精度均值达到98.0%,相较于原始模型YOLOv8n提高了29.4个百分点。最后,通过在0.5~3.0 m范围的移动机器人视觉定位试验表明,该定位方法可实现移动捡蛋机器人在实验室内对中远距离鸭蛋的高精度实时运动定位,最大定位误差可控制在0.03 m以内。此改进模型可部署到移动边缘计算图像处理平台,不仅可为移动捡蛋机器人提供支持,也可为类似的自主移动采收作业机器人提供一定借鉴。 展开更多
关键词 目标检测 视觉定位 鸭蛋 识别 YOLOv8n 机器人操作系统
在线阅读 下载PDF
基于改进YOLOv8的小棚架下无核白葡萄果梗识别 被引量:2
10
作者 李涛 买买提明·艾尼 +1 位作者 古丽巴哈尔·托乎提 杨佳雨 《中国农机化学报》 北大核心 2025年第2期259-263,278,共6页
小棚架下准确识别无核白葡萄果梗是葡萄采摘机器人自动采摘任务的关键。针对新疆吐鲁番市小棚架下鲜食无核白葡萄果梗识别效果差的问题,提出一种基于YOLOv8的无核白葡萄果梗识别模型Small—YOLO,实现无核白葡萄果梗的自动识别。在原有... 小棚架下准确识别无核白葡萄果梗是葡萄采摘机器人自动采摘任务的关键。针对新疆吐鲁番市小棚架下鲜食无核白葡萄果梗识别效果差的问题,提出一种基于YOLOv8的无核白葡萄果梗识别模型Small—YOLO,实现无核白葡萄果梗的自动识别。在原有的模型结构上改进目标检测头,提高浅层与深层网络的特征融合,增加对无核白葡萄果梗信息提取的能力。在浅层网络中采用可变形卷积DCN以增强卷积操作对形态变化的建模能力,使得卷积核可以更好地适应输入特征图中的不规则变形,有助于提高视觉模型在处理不同尺度、形态和变换目标时的性能。增加坐标注意力机制CA,优化无核白葡萄果梗识别的准确率。结果表明,改进后的识别模型对无核白葡萄果梗平均精度mAP值达到76.2%。与YOLOv3—tiny、YOLOv5n、YOLOv6、YOLOv7、YOLOv8n等算法相比,mAP值分别提升23.9%、8%、7.6%、9.2%、7%,同时保持较快的检测速度,实现在小棚架下无核白葡萄机械采摘可能性。 展开更多
关键词 无核白葡萄 采摘机器人 果梗识别 坐标注意力机制 可变形卷积 视觉模型
在线阅读 下载PDF
基于多模态视听融合的Transformer语音识别算法研究 被引量:2
11
作者 赵小芬 彭朋 《传感器与微系统》 北大核心 2025年第2期48-52,共5页
针对单模态语音识别在复杂环境中易受噪音、口音、语速等因素干扰的局限性,本研究提出一种基于多模态视听融合的Transformer语音识别算法。通过综合音频和视频两种模态信息,并引入不同模态间的动态权重分配机制,有效解决了模态间信息分... 针对单模态语音识别在复杂环境中易受噪音、口音、语速等因素干扰的局限性,本研究提出一种基于多模态视听融合的Transformer语音识别算法。通过综合音频和视频两种模态信息,并引入不同模态间的动态权重分配机制,有效解决了模态间信息分布不均的问题。通过将原始音频和视觉信号转换为Transformer模型可处理的特征表示,并结合编码器和解码器结构实现语音到文本的精确转换,利用多头自注意力机制捕捉序列间的内在相关性。实验结果表明,本算法在字错误率上降低了6%~22%,显著提升了语音识别率,验证了算法的有效性和优越性。 展开更多
关键词 多模态 视听融合 语音识别 TRANSFORMER 动态权重分配机制
在线阅读 下载PDF
视觉和传感器融合的多模态猪只行为识别 被引量:1
12
作者 陈虹余 尹令 +2 位作者 杨明 张素敏 林俊勇 《农业工程学报》 北大核心 2025年第8期194-203,共10页
为提升复杂场景下猪只行为识别准确率,该研究针对不同场景数据,采用不同处理策略提出一种融合视觉和传感器技术的多模态猪行为识别方法,具体为光线不足时,使用传感器数据进行行为分类;光线充足但猪只被严重遮挡时,结合视频和传感器数据... 为提升复杂场景下猪只行为识别准确率,该研究针对不同场景数据,采用不同处理策略提出一种融合视觉和传感器技术的多模态猪行为识别方法,具体为光线不足时,使用传感器数据进行行为分类;光线充足但猪只被严重遮挡时,结合视频和传感器数据实现行为分类;光线充足且猪只未被严重遮挡时,用视频数据建立FE-TSM(feature extention-temporal shift module)模型完成行为分类。采用该方法对8头长白猪每头7 d的视频和传感数据分析,将猪只行为分为“侧卧”“伏坐”“半坐”“采食”和“运动”5类。试验结果对比显示,仅用传感器数据平均行为识别准确率为68.60%,仅用视觉数据的平均准确率为78.78%,而采用融合传感器和视频数据的多模态方法平均识别准确率为88.82%,由此可知多模态方法在复杂场景下对猪只行为识别分析具有更高的准确率。 展开更多
关键词 传感器 多模态行为识别 复杂场景 视觉技术
在线阅读 下载PDF
基于视觉识别对靶喷雾机器人设计与试验 被引量:2
13
作者 樊雪南 胡军 +1 位作者 刘昶希 石航 《农机使用与维修》 2025年第1期10-14,共5页
针对传统大面积无差别喷洒农药会对环境造成污染、易产生农药残留危害健康的问题,设计了一种基于视觉识别对靶喷雾机器人,解决大豆田常规施药除草造成的农药浪费问题。通过树莓派、CMOS相机搭配舵机实现采集处理图像,并将其搭载至橡胶... 针对传统大面积无差别喷洒农药会对环境造成污染、易产生农药残留危害健康的问题,设计了一种基于视觉识别对靶喷雾机器人,解决大豆田常规施药除草造成的农药浪费问题。通过树莓派、CMOS相机搭配舵机实现采集处理图像,并将其搭载至橡胶轮式移动平台实现对靶喷雾机器人的设计。对靶喷雾机器人采用侧向施药方式,利用VP110-015喷嘴搭配12 V水泵实现精准喷施,经验证,视觉摄像头在距离目标1.1 m处采集320×240图片(.jpg格式)符合处理需求,延时导通继电器阻值为10000Ω可满足精准喷施要求,除草机器人单次喷雾量为0.002 L,单次喷雾覆盖三维空间0.004 m^(3)。当前进速度为0.10 m/s时,识别率达到90%以上,使用视觉识别系统精准判断施药对象,对靶喷施稗草可以减少73.34%的药液施用量。研究结果对减少农药使用量,提高对靶率,实现农业可持续发展具有重要意义。 展开更多
关键词 对靶喷雾机器人 视觉识别 对靶喷雾 树莓派
在线阅读 下载PDF
基于图像内容理解的判别性类别提示学习
14
作者 王楠井 刘阿建 +4 位作者 梁凤梅 张小梅 万军 谢珺 雷震 《电子学报》 北大核心 2025年第2期493-502,共10页
近年来,通过图像与文本的联合表示,基于对比语言-图像预训练(Contrastive Language-Image Pre-training,CLIP)的方法将文本信息作为分类器的权值,在通用图像识别任务中展现出卓越性能.但是现有方法仅单独构建类别文本提示,比如上下文优... 近年来,通过图像与文本的联合表示,基于对比语言-图像预训练(Contrastive Language-Image Pre-training,CLIP)的方法将文本信息作为分类器的权值,在通用图像识别任务中展现出卓越性能.但是现有方法仅单独构建类别文本提示,比如上下文优化(Context Optimization,CoOp)和条件上下文优化(Conditional Context Optimization,CoCoOp)等,没有考虑图像的内容语义信息与类别的重要性,限制了模型对图像类别的理解与判别.为了解决上述问题,本文在CLIP的基础上提出了一种新方法:基于图像内容理解的判别性类别提示学习(Discriminative Category Prompt Learning based on image content understanding,DCPL),借助图像中丰富的内容特征来学习文本提示,提高文本提示对类别的判别性.具体来说,DCPL包含提示生成(Prompt Generation,PG)模块和文本监督(Text Supervision,TS)模块.PG模块将图像特征和初始化的查询向量作为输入,通过自注意力机制和交叉注意力机制使输出的文本提示中包含充分的图像语义信息;TS模块将固定的类别提示模板作为监督,为可学习文本提示在类别层面和logits层面注入类别信息,增强了类别的重要性.最后,DCPL在ImageNet、Caltech101和Oxford-Pets等11个公开分类数据集上的16-shots平均准确率达到了81.84%,较以往最优方法Cross-Modal的平均准确率提升了0.98个百分点. 展开更多
关键词 视觉-语言模型 图像识别 提示调优 注意力机制 文本监督(TS) 适配器微调 TRANSFORMER
在线阅读 下载PDF
松弛图嵌入的判别宽度学习系统以及在视觉识别中的应用
15
作者 金军委 常少凯 +5 位作者 耿彪 李艳婷 赵孟 王震 陈俊龙 李鹏 《自动化学报》 北大核心 2025年第6期1388-1402,共15页
宽度学习系统作为一种轻量级网络,在效率和准确性之间实现了良好的平衡.然而,宽度学习系统主要依赖严苛的二元标签进行监督并且在数据变换过程中忽视局部结构信息,这些问题限制了模型的性能.为解决此问题,提出一种松弛图嵌入的判别宽度... 宽度学习系统作为一种轻量级网络,在效率和准确性之间实现了良好的平衡.然而,宽度学习系统主要依赖严苛的二元标签进行监督并且在数据变换过程中忽视局部结构信息,这些问题限制了模型的性能.为解决此问题,提出一种松弛图嵌入的判别宽度学习系统模型并将其应用于视觉识别,旨在通过松弛图结构与柔性标签的引入提升模型性能.创新性如下:1)创新地使用双变换矩阵构建松弛图,将变换矩阵的责任分离,减少变换矩阵的负担,从而学习更加灵活的变换矩阵,解决了模型过拟合问题;2)引入柔性标签策略,扩大不同类别标签之间的距离,解决了严苛二元标签的问题,提高了模型的判别能力;3)提出一种基于交替方向乘子法的迭代优化算法,实现了模型的高效优化.在人脸图像数据集、物体图像数据集、场景图像数据集以及手写体图像数据集上的大量实验证明提出的模型与其他先进的识别算法相比具有优势. 展开更多
关键词 宽度学习系统 松弛图 柔性标签 视觉识别
在线阅读 下载PDF
瓦楞纸箱智能柔性贴标设备的设计与试验
16
作者 朱逸磊 袁浩 +3 位作者 王志 方晓波 符平彪 王振意 《包装与食品机械》 北大核心 2025年第3期105-112,共8页
针对传统瓦楞纸箱贴标设备在切换纸箱规格后,存在调控繁琐、效率低的问题,设计一款基于视觉技术的智能柔性贴标设备。结合瓦楞纸箱的智能柔性贴标需求,阐述设备的总体结构及工作原理;通过对贴标过程的分析,确定影响贴标精度的主要因素;... 针对传统瓦楞纸箱贴标设备在切换纸箱规格后,存在调控繁琐、效率低的问题,设计一款基于视觉技术的智能柔性贴标设备。结合瓦楞纸箱的智能柔性贴标需求,阐述设备的总体结构及工作原理;通过对贴标过程的分析,确定影响贴标精度的主要因素;通过单因素试验,得到最佳的参数设置;进行多次出标试验,拟合得到落标位置与出标延迟时间之间的数学关系;对样机进行20种不同贴标需求的切换测试。结果显示,上送标机构送标速度1 500 r/min、剥离高度6 mm、剥离角度25°,下送标机构送标速度1 400 r/min、剥离高度2 mm、剥离角度25°为最佳参数设置;一次调控的成功率为85%,耗时35~40 s;二次调控的成功率达到100%,整体用时97~101 s,远低于人工调控所需的15~30 min;最终贴标位置的偏差控制在5 mm以内,作业效率达30~90件/min。研究为包装设备的智能化和柔性化设计提供借鉴。 展开更多
关键词 贴标设备 视觉识别技术 上位机技术 调控效率
在线阅读 下载PDF
柔性封箱机烟箱牌号规格视觉复核系统的设计
17
作者 曹柱祥 杨彩虹 +5 位作者 蔡培良 余仕双 李鑫 卢波 朱树良 范宗进 《包装工程》 北大核心 2025年第11期243-249,共7页
目的解决柔性封箱机随机偶发的漏检和相机检测完成后因人工烟箱反置或放错工位造成烟箱错用的问题。方法通过运用图像视觉识别、PLC控制、数据比对等技术方法设计一种柔性封箱机烟箱牌号规格视觉复核系统,实时对多种牌号规格的烟箱进行... 目的解决柔性封箱机随机偶发的漏检和相机检测完成后因人工烟箱反置或放错工位造成烟箱错用的问题。方法通过运用图像视觉识别、PLC控制、数据比对等技术方法设计一种柔性封箱机烟箱牌号规格视觉复核系统,实时对多种牌号规格的烟箱进行检测,与原封箱机检测互不影响。结果系统安装后,检测效果精准,错误烟箱剔除准确率≥99.9%;误剔率≤0.01%,有效杜绝了不合格品流入下游环节。结论该视觉复核系统能准确保障柔性封箱机在多牌号、多规格的复杂卷烟生产计划下使用对应正确的烟箱,有利于提高生产效率,保障产品质量。 展开更多
关键词 柔性封箱机 视觉识别 烟箱复检
在线阅读 下载PDF
传染病与多重耐药菌感染智能识别防控系统的构建及应用
18
作者 李晨光 潘泽韬 +4 位作者 朱浩智 琚旭 何仲廉 李超峰 李欢 《中国感染控制杂志》 北大核心 2025年第4期499-505,共7页
目的以提升全流程管理成效为导向构建传染病与多重耐药菌感染的智能识别防控系统,研究其应用效果。方法基于实时精准反映感染状态与传播风险的个性化逻辑解析规则,搭建具有自动识别、动态标记、实时共享、前置预警及可视化指引功能的智... 目的以提升全流程管理成效为导向构建传染病与多重耐药菌感染的智能识别防控系统,研究其应用效果。方法基于实时精准反映感染状态与传播风险的个性化逻辑解析规则,搭建具有自动识别、动态标记、实时共享、前置预警及可视化指引功能的智能识别防控系统。选取2023年10月—2024年5月某三级甲等医院开展侵入性诊疗操作的两个平台科室的就诊患者为研究对象,采用自身对照法,按照传统人工模式管理为对照组,应用智能系统管理为试验组,比较系统应用前后识别防控效果的差异。结果共纳入研究对象2146例患者,应用智能系统后的感染者识别防控率和感染者识别准确率均较人工模式明显提升(分别从5.3%、72.4%提高至100%),差异均有统计学意义(均P<0.001)。感染信息中位前置预警时间达85.20 d,且实现100%前置预警。医护人员在感染信息识别管理环节的平均耗时节省4.71 h/d。结论本研究搭建的智能系统可显著改善传染病与多重耐药菌感染者从识别到防控环节的全流程管理成效,有效降低交叉感染风险,提高诊疗服务效率。 展开更多
关键词 传染病 多重耐药菌感染 智能识别 动态标记 可视化指引 预防与控制
在线阅读 下载PDF
视觉引导的卫星传感器自动准直快速搜索方法
19
作者 袁红磊 李广云 +3 位作者 范百兴 王力 李玉杰 隆昌宇 《测绘通报》 北大核心 2025年第1期66-71,共6页
随着航天卫星产业的迅速发展,卫星制造和发射进入了快速增长的阶段。随着批量卫星的生产制造,卫星传感器的位姿测量逐渐向自动化、智能化方向发展。为满足大批量卫星自动化准直测量技术的需求,相应的技术方法也应运而生。本文在现有的... 随着航天卫星产业的迅速发展,卫星制造和发射进入了快速增长的阶段。随着批量卫星的生产制造,卫星传感器的位姿测量逐渐向自动化、智能化方向发展。为满足大批量卫星自动化准直测量技术的需求,相应的技术方法也应运而生。本文在现有的卫星自动精测技术的基础上,对自动精测模型中光十字丝提取模型和自动化搜索算法进行了深入分析;针对自动精测模型存在的缺陷,提出了一种基于图卷积的光十字丝提取算法和自动搜索算法,极大地增大了自动搜索范围,以及提升了卫星自动化准直测量的效率。 展开更多
关键词 卫星自动化测量 十字丝图像识别 准直立方镜自动搜索 视觉引导 图卷积
在线阅读 下载PDF
基于RGB与骨骼数据的人体行为识别综述
20
作者 李仝伟 仇大伟 +1 位作者 刘静 逯英航 《计算机工程与应用》 北大核心 2025年第8期62-82,共21页
人体行为识别是计算机视觉领域中的重要研究方向,在人机交互、医疗康复、自动驾驶等领域具有广泛应用和重大意义。由于其方法的重要性和前沿性,对该领域进行全面、系统地总结具有极其重要的意义。深入探讨了基于RGB和骨骼数据模态的人... 人体行为识别是计算机视觉领域中的重要研究方向,在人机交互、医疗康复、自动驾驶等领域具有广泛应用和重大意义。由于其方法的重要性和前沿性,对该领域进行全面、系统地总结具有极其重要的意义。深入探讨了基于RGB和骨骼数据模态的人体行为识别方法;按照特征学习方式的不同,分为基于传统机器学习的手工特征提取方法和基于深度学习的深度特征提取方法。介绍了行为识别的基本流程,并总结了公开数据集。详述了基于RGB和骨骼数据模态的识别方法。对于RGB数据,分析了基于2D CNN、RNN和3D CNN的特征提取方法;对于骨骼数据,介绍了自上而下和自下而上的姿态评估算法,重点分析了基于RNN、CNN、GCN、Transformer和混合神经网络的分类算法。最后,展望了未来深度学习在人体行为识别中的五个研究方向。 展开更多
关键词 行为识别 计算机视觉 RGB数据 骨骼数据 特征提取 深度学习
在线阅读 下载PDF
上一页 1 2 26 下一页 到第
使用帮助 返回顶部