期刊文献+
共找到19篇文章
< 1 >
每页显示 20 50 100
视觉—语言—动作模型综述:从前史到前沿 被引量:2
1
作者 张慧 梁姝彤 +5 位作者 李明轩 田永林 葛经纬 于慧 李灵犀 王飞跃 《自动化学报》 北大核心 2025年第9期1922-1950,共29页
视觉-语言-动作(VLA)模型作为具身智能发展的核心方向,旨在构建统一的多模态表示与感知–决策–执行一体化架构,以突破传统模块化系统在功能割裂、语义对齐不足及泛化能力有限等方面的瓶颈.本文系统回顾前VLA时代的技术积淀,梳理模块化... 视觉-语言-动作(VLA)模型作为具身智能发展的核心方向,旨在构建统一的多模态表示与感知–决策–执行一体化架构,以突破传统模块化系统在功能割裂、语义对齐不足及泛化能力有限等方面的瓶颈.本文系统回顾前VLA时代的技术积淀,梳理模块化、端到端和混合三类主流建模范式,分析其结构特点、能力优势与面临的关键挑战.在此基础上,总结当前代表性VLA模型的体系结构、训练机制、多模态融合策略及应用成效,并对典型数据集与评测基准进行分类比较.最后,结合跨模态协同、知识注入、长时序规划与真实环境泛化等方面,展望未来VLA模型的发展趋势与研究方向. 展开更多
关键词 具身智能 视觉—语言—动作模型 多模态融合 端到端学习 任务泛化
在线阅读 下载PDF
基于神经网络的图像风格迁移算法综述 被引量:1
2
作者 王伟 张静宜 +1 位作者 温玉辉 魏云超 《电子学报》 北大核心 2025年第5期1692-1712,共21页
风格迁移作为图像编辑领域的一个关键研究方向,在艺术创作等领域展现出广泛的应用前景.自Gat-ys等人提出使用深度卷积特征间相关性捕获纹理信息并基于此实现风格迁移后,大量基于神经网络的风格迁移算法不断涌现.近年来随着各式生成模型... 风格迁移作为图像编辑领域的一个关键研究方向,在艺术创作等领域展现出广泛的应用前景.自Gat-ys等人提出使用深度卷积特征间相关性捕获纹理信息并基于此实现风格迁移后,大量基于神经网络的风格迁移算法不断涌现.近年来随着各式生成模型的兴起,将生成对抗网络、扩散模型等生成模型引入风格迁移工作获得了新的关注.此外,图像-文本跨模态任务的突破使得文本引导条件下的图像风格迁移成为可能.本文对当前先进的研究方法进行分类和描述.具体地,依据引导条件差异,将现有方法划分为图像引导的图像风格迁移方法、文本引导的图像风格迁移方法;依据网络架构的不同,将现有方法细分为基于自编码器的方法、基于生成对抗网络的方法、基于扩散模型的方法以及基于其他模型架构的方法,对当前图像风格迁移技术的研究进行全面的综述与分析.随后,介绍了图像风格迁移任务的数据集和评价体系,并从定量与定性方面对部分最先进的图像风格迁移方法进行实验和比较.最后,讨论了当前图像风格迁移技术面临的挑战,并对未来研究方向提出了展望. 展开更多
关键词 图像风格迁移 神经网络 图像编辑 多模态任务 计算机视觉 深度学习
在线阅读 下载PDF
联合测温贴片和计算机视觉的列车关键部件超温监测算法
3
作者 舒冬 张贝嘉 杨鸿泰 《城市轨道交通研究》 北大核心 2025年第3期186-191,共6页
[目的]由于基于温度传感器的列车关键部件温度监测方案存在投资及运维成本高昂的问题,难以满足大型工程项目中对该类部件温度监测广泛推广的需求,因此,亟须研发一种低造价且运维成本低的温度监测方案。[方法]提出了一种融合测温贴片和... [目的]由于基于温度传感器的列车关键部件温度监测方案存在投资及运维成本高昂的问题,难以满足大型工程项目中对该类部件温度监测广泛推广的需求,因此,亟须研发一种低造价且运维成本低的温度监测方案。[方法]提出了一种融合测温贴片和计算机视觉的超温监测算法。该算法遵循“先定位、后分割、再计算”的识别逻辑。通过采用二分k-means聚类算法并引入注意力机制对YOLOV3算法网络进行优化,实现了图像中测温贴片的精确定位;在U-Net++算法网络架构中嵌入主体边界分离模块,并在损失函数中增加相应的边界监督项,以增强边界分割效果,提高测温贴片在图像中的分割精度;对分割后的图像进行计算,根据测温贴片变色的相对体积质量来判定超温结果。[结果及结论]通过对SSD算法、Retina-Net算法、YOLOV3算法、YOLV4算法及改进后的YOLOV3算法等5种算法的定位精度进行试验对比,其定位准确率分别为95.32%、97.15%、98.09%、98.36%及99.21%,其中改进后的YOLOV3算法准确率接近100%。同时,对DeepLabV3+算法、U-Net++算法及改进后的U-Net++算法等3种算法的分割精度进行对比试验,结果显示分割精准度分别为95.97%、96.81%及98.36%,改进后的U-Net++算法表现最优。在真实测试集上进行的试验中,改进算法达到了99.30%的准确率。 展开更多
关键词 轨道交通列车 超温监测 机器视觉 测温贴片 多任务学习
在线阅读 下载PDF
不同感官整合任务对女性髌股关节痛患者下肢生物力学特征的影响
4
作者 范婷 张泽毅 《医用生物力学》 北大核心 2025年第2期291-299,共9页
目的 分析不同感官整合任务对女性髌股关节痛(patellofemoral pain, PFP)患者步行时下肢生物力学特征的影响,并探讨这些特征与髌股关节应力(patellofemoral joint stress, PFJS)的关系,为预防PFP复发提供参考。方法 招募36名女性PFP患者... 目的 分析不同感官整合任务对女性髌股关节痛(patellofemoral pain, PFP)患者步行时下肢生物力学特征的影响,并探讨这些特征与髌股关节应力(patellofemoral joint stress, PFJS)的关系,为预防PFP复发提供参考。方法 招募36名女性PFP患者,采集受试者步行时的运动学和动力学数据,通过单因素方差分析检验无任务、触觉整合任务、听觉整合任务及视觉整合任务对下肢生物力学特征的影响,通过Pearson相关分析探究上述生物力学特征与PFJS的关系。结果 与无任务相比,听觉整合任务下PFP患者的步长(P=0.004)和步频(P=0.001)显著降低,且二者与PFJS呈负相关(P<0.05)。触觉整合任务使髋关节内旋角(P=0.001)、踝关节内翻角(P=0.022)显著增加,上述指标与PFJS呈显著正相关(P<0.05)。视觉整合任务增大了PFP患者的髋关节内旋角(P=0.001)、膝关节屈曲角(P=0.019)、踝关节内翻角(P=0.003)和踝关节跖屈角(P=0.048),这些生物力学特征与PFJS呈正相关(P<0.05)。结论 听觉整合任务会使PFP患者的步长和步频降低,触觉和视觉整合任务会增加髋关节内旋角、踝关节内翻角。在此基础上,视觉整合任务还增大了步行时的膝关节屈曲角和踝关节跖屈角。整体看来,视觉整合任务对女性PFP患者步态生物力学的影响最大,这些生物力学特征变化与髌股关节应力升高有关。 展开更多
关键词 感官整合任务 触觉 听觉 视觉 髌股关节痛 髌股关节应力
在线阅读 下载PDF
机器人技术在蔬菜生产领域的应用现状及发展趋势
5
作者 梁明旭 袁昌荣 +1 位作者 夏先飞 宫庆硕 《智能化农业装备学报(中英文)》 2025年第4期50-63,共14页
中国作为世界最大的蔬菜生产国和消费国,蔬菜种植面积不断扩大,但面临机械化、智能化水平偏低以及人工成本连年增长的挑战。随着机器人技术的发展,农业机器人日益广泛地应用于蔬菜生产领域,已成为替代人工劳动、提升生产效率与质量的关... 中国作为世界最大的蔬菜生产国和消费国,蔬菜种植面积不断扩大,但面临机械化、智能化水平偏低以及人工成本连年增长的挑战。随着机器人技术的发展,农业机器人日益广泛地应用于蔬菜生产领域,已成为替代人工劳动、提升生产效率与质量的关键技术手段。为系统了解蔬菜生产领域机器人技术的研究现状并明确其未来发展方向,首先对农业机器人的定义进行了阐述。其次,聚焦蔬菜生产中播种移栽、田间管理和收获分选3大核心作业环节,整理国内外先进研究成果,分别从感知、决策和控制3个层面剖析相关研究进展,包括基于多信息融合的SLAM自主导航技术与路径规划原理;机器视觉在蔬菜生产各环节应用的技术路线与关键技术研究水平;以及针对特定农艺要求和作业环境特征,在作业执行机构及末端执行器控制技术方面取得的进展。最后,分析当前农业机器人在蔬菜生产中面临的主要技术挑战,即适用性和作业效率仍存在显著瓶颈,并对未来发展方向进行展望。未来研究应重点发展多功能作业机器人,需突破多机协同控制技术、深化专业化与模块化设计;同时,政策支持亦不可或缺。随着技术的持续进步和多方的协同努力,机器人技术有望成为推动农业劳动力结构优化、提升蔬菜生产效率、实现智慧农业的关键支撑。 展开更多
关键词 蔬菜生产 农业机器人 自主导航 机器视觉 作业执行与末端控制 多机协同控制
在线阅读 下载PDF
基于立体视觉的遥操作工程机器人自主作业系统 被引量:6
6
作者 唐新星 倪涛 +2 位作者 何丽鹏 张邦成 高金库 《农业机械学报》 EI CAS CSCD 北大核心 2012年第10期224-228,214,共6页
建立了基于立体视觉技术的遥操作工程机器人自主作业控制系统。采用立体视觉技术实现对目标物体的形状自动识别与空间定位,进行了遥操作工程机器人运动学方程求解、运动轨迹规划与控制的研究。针对液压伺服控制系统具有非线性、参数不... 建立了基于立体视觉技术的遥操作工程机器人自主作业控制系统。采用立体视觉技术实现对目标物体的形状自动识别与空间定位,进行了遥操作工程机器人运动学方程求解、运动轨迹规划与控制的研究。针对液压伺服控制系统具有非线性、参数不确定的特点,设计了模糊控制器。最后,在遥操作工程机器人实验台上进行了自主作业控制实验。实验结果表明,所构建的基于立体视觉技术的工程机器人自主作业控制系统,能够完成初步的自主作业任务,且作业过程比较流畅。 展开更多
关键词 遥操作工程机器人 自主作业 立体视觉 轨迹规划 模糊控制
在线阅读 下载PDF
基于立体视觉的遥控焊接机器人任务空间三维建模 被引量:2
7
作者 高洪明 梁志敏 +1 位作者 董娜 吴林 《焊接学报》 EI CAS CSCD 北大核心 2007年第11期5-8,共4页
为了克服人工遥操作的缺点,需要提高遥控焊接机器人的智能水平。准确的任务空间三维建模是遥控机器人规划、运动控制和其它自动化功能的基础。使用立体视觉技术对遥控焊接进行任务空间分析和三维重建。其中的立体匹配利用人机交互并结... 为了克服人工遥操作的缺点,需要提高遥控焊接机器人的智能水平。准确的任务空间三维建模是遥控机器人规划、运动控制和其它自动化功能的基础。使用立体视觉技术对遥控焊接进行任务空间分析和三维重建。其中的立体匹配利用人机交互并结合亚像素角点特征提取算法完成。该算法先检测Harris角点,然后进行亚像素优化,克服了视觉自动建模中计算复杂、鲁棒性差的缺点。任务空间三维重建的试验结果表明了该技术的可行性。 展开更多
关键词 立体视觉 遥控焊接机器人 三维重建 任务空间
在线阅读 下载PDF
视觉图灵:从人机对抗看计算机视觉下一步发展 被引量:9
8
作者 黄凯奇 赵鑫 +1 位作者 李乔哲 胡世宇 《图学学报》 CSCD 北大核心 2021年第3期339-348,共10页
计算机视觉一直是人工智能研究的热点方向,经过近60年的发展,已经在算法、技术和应用等方面取得了巨大的进步。近十年来,以大数据、大算力为基础的深度学习进一步推动计算机视觉走向大模型时代,但其算法适应能力仍然和人类存在较大差距... 计算机视觉一直是人工智能研究的热点方向,经过近60年的发展,已经在算法、技术和应用等方面取得了巨大的进步。近十年来,以大数据、大算力为基础的深度学习进一步推动计算机视觉走向大模型时代,但其算法适应能力仍然和人类存在较大差距。本文从视觉任务评估评测(评测数据集、评测指标、评估方式)出发,对计算机视觉的发展进行了总结,对现存的依赖大数据学习的计算机视觉发展问题进行了梳理和分析,从人机对抗智能评测提出了计算机视觉下一步发展方向:视觉图灵。最后对视觉图灵发展方向进行了思考和讨论,探讨了未来研究可能的方向。 展开更多
关键词 计算机视觉 视觉图灵 评估评测 图灵测试 数据集
在线阅读 下载PDF
基于深度学习的显著性目标检测方法综述 被引量:22
9
作者 罗会兰 袁璞 童康 《电子学报》 EI CAS CSCD 北大核心 2021年第7期1417-1427,共11页
显著性目标检测旨在对图像中最显著的对象进行检测和分割,是计算机视觉任务中重要的预处理步骤之一,且在信息检索、公共安全等领域均有广泛的应用.本文对近期基于深度学习的显著性目标检测模型进行了系统综述,从检测粒度的角度出发,综... 显著性目标检测旨在对图像中最显著的对象进行检测和分割,是计算机视觉任务中重要的预处理步骤之一,且在信息检索、公共安全等领域均有广泛的应用.本文对近期基于深度学习的显著性目标检测模型进行了系统综述,从检测粒度的角度出发,综述了将深度学习引入显著性目标检测领域之后的研究成果.首先,从三个方面对显著性目标检测方法进行了论述:稀疏检测方法,密集检测方法以及弱监督学习下的显著性目标检测方法.然后,简要介绍了用于显著性目标检测研究的主流数据集和常用性能评价指标,并对各类主流模型在三个使用最广泛的数据集上进行了性能比较分析.最后,本文分析了显著性目标检测领域目前存在的问题,并对今后可能的研究趋势进行了展望. 展开更多
关键词 显著性目标检测 深度学习 卷积神经网络 视觉显著性 弱监督学习 计算机视觉任务
在线阅读 下载PDF
面向在线语义分割机器视觉检测鉴别的多任务协同调度方法 被引量:1
10
作者 黄坚 刘桂雄 《激光杂志》 CAS 北大核心 2021年第8期62-67,共6页
在线语义分割机器视觉检测鉴别方法综合采用视觉成像技术、语义分割方法,感测被测对象特征与辨别被测对象优劣,在线应用要求鉴别时间短。提出一种面向在线语义分割机器视觉检测鉴别的多任务协同调度方法,首先建立检测鉴别多任务协同调... 在线语义分割机器视觉检测鉴别方法综合采用视觉成像技术、语义分割方法,感测被测对象特征与辨别被测对象优劣,在线应用要求鉴别时间短。提出一种面向在线语义分割机器视觉检测鉴别的多任务协同调度方法,首先建立检测鉴别多任务协同调度任务模型,将在线语义分割机器视觉检测鉴别流程抽象为定位、光源控制、相机成像、图像语义分割4种活动,以及高分辨率图像分块分割、分批调度分割2种子活动;其次研究检测鉴别协同调度、高分辨率图像分块调度、多网络多图像分批调度实现方法;最后,在线机箱装配质量检测鉴别系统进行应用试验。初步应用结果表明,单个机箱检测、小批量机箱检测鉴别总时间T_(inspect)分别为5.20 s、24.48 s,分别比典型多任务调度模型缩短34.59%、35.11%,多任务协同调度优化效果明显。方法具有建模简单、实时性好的特点,可拓展用于其它深度学习机器视觉检测鉴别中。 展开更多
关键词 机器视觉检测鉴别 深度学习 语义分割 多任务调度 协同调度
在线阅读 下载PDF
论生态经济研究视野的拓展 被引量:1
11
作者 李周 《企业经济》 CSSCI 北大核心 2018年第1期5-12,2,共8页
本文分析了生态经济研究中研究者拓展视野的重要性,论述了凌驾于地球或自然生态系统之上的以人为中心的研究视野的局限性。从产生的时代背景、关注的基本问题、研究的核心内容三个方面论述了生态经济学与主流经济学的差异。生态经济学... 本文分析了生态经济研究中研究者拓展视野的重要性,论述了凌驾于地球或自然生态系统之上的以人为中心的研究视野的局限性。从产生的时代背景、关注的基本问题、研究的核心内容三个方面论述了生态经济学与主流经济学的差异。生态经济学家要面对现实中不断出现的新问题,抓住可观察到的新现象增多、可获得的新信息增多和识别趋势的视野增大的时机,勇于创新、善于创新,构建新的理论体系、经济范畴、经济目标、生产方式、市场体系、核算体系和制度体系,实现经济学理论体系的超越。 展开更多
关键词 生态经济 研究视野 创新任务 机会与使命
在线阅读 下载PDF
视觉Transformer在低级视觉领域的研究综述 被引量:10
12
作者 朱凯 李理 +2 位作者 张彤 江晟 别一鸣 《计算机工程与应用》 CSCD 北大核心 2024年第4期39-56,共18页
Transformer是一种革命性的神经网络模型架构,最初为自然语言处理而设计,但其由于卓越的性能,在计算机视觉领域获得了广泛的应用。虽然关于Transformer在自然语言处理领域的应用有大量的研究和文献,但针对低级视觉任务的综述相对匮乏。... Transformer是一种革命性的神经网络模型架构,最初为自然语言处理而设计,但其由于卓越的性能,在计算机视觉领域获得了广泛的应用。虽然关于Transformer在自然语言处理领域的应用有大量的研究和文献,但针对低级视觉任务的综述相对匮乏。简要介绍了Transformer的原理并分析归纳了几种变体。在低级视觉任务的应用方面,将重点放在图像恢复、图像增强和图像生成这三个关键领域。通过详细分析不同模型在这些任务中的表现,探讨了它们在常用数据集上的性能差异。对Transformer在低级视觉领域的发展趋势进行了总结和展望,提出了未来的研究方向,以进一步推动Transformer在低级视觉任务中的创新和发展。这一领域的迅猛发展将为计算机视觉和图像处理领域带来更多的突破,为实际应用提供更加强大和高效的解决方案。 展开更多
关键词 TRANSFORMER 深度学习 注意力机制 计算机视觉 低级视觉任务
在线阅读 下载PDF
面向空间应用的视觉位姿估计技术综述 被引量:9
13
作者 周芮 刘延芳 +1 位作者 齐乃明 佘佳宇 《光学精密工程》 EI CAS CSCD 北大核心 2022年第20期2538-2553,共16页
随着人工智能的发展,基于计算机视觉的目标识别、位姿估计技术受到了广泛关注。目前,在交会对接等空间任务中,基于计算机视觉的合作目标位姿估计技术已取得广泛应用。但在非合作目标的视觉位姿估计问题上,由于空间中存在杂散光背景、表... 随着人工智能的发展,基于计算机视觉的目标识别、位姿估计技术受到了广泛关注。目前,在交会对接等空间任务中,基于计算机视觉的合作目标位姿估计技术已取得广泛应用。但在非合作目标的视觉位姿估计问题上,由于空间中存在杂散光背景、表面包覆层反射、光照强度变化剧烈等因素,导致特征提取困难、位姿估计易发散、存在累计误差等难题,这些也是亟待解决的热点问题。本文首先总结了空间任务中计算机视觉技术的发展及应用;然后,对视觉位姿估计技术进行概述,以深度学习算法作为切入点,系统地归纳了目标识别及位姿估计算法;最后,综述了深度学习在空间任务中的研究进展,并在任务需求和研究现状分析的基础上,针对空间任务的特殊性,讨论了一些未来的发展趋势。 展开更多
关键词 计算机视觉 图像处理 位姿估计 深度学习 空间任务
在线阅读 下载PDF
多视角视觉目标生成的空间机器人操作学习 被引量:3
14
作者 李林峰 王勇 +2 位作者 解永春 胡勇 陈奥 《空间控制技术与应用》 CSCD 北大核心 2022年第2期18-28,共11页
空间机器人操作一般采用多视角相机为机械臂提供视觉信息引导,全局相机引导远距离的前段操作,局部相机引导近距离的末端精细操作.针对多视角视觉信息融合与利用的自主性不足问题,提出一种多视角视觉目标生成的新方法,采用分层策略架构,... 空间机器人操作一般采用多视角相机为机械臂提供视觉信息引导,全局相机引导远距离的前段操作,局部相机引导近距离的末端精细操作.针对多视角视觉信息融合与利用的自主性不足问题,提出一种多视角视觉目标生成的新方法,采用分层策略架构,将图像输入映射到SE(3)空间上,形成多视角视觉目标,并根据相对误差建立多视角目标决策机制.地面试验结果表明,该方法能够快速响应(>30 fps)多类不同尺度的操作对象,并对静态、动态遮挡具有较强鲁棒性,具备执行视触融合、长序列复杂操作任务的能力. 展开更多
关键词 空间机器人操作 基于视觉的机器人操作 视觉目标生成 视触融合 多任务学习
在线阅读 下载PDF
基于空间结构化推理深度融合网络的RGB-D场景解析 被引量:5
15
作者 王泽宇 吴艳霞 +1 位作者 张国印 布树辉 《电子学报》 EI CAS CSCD 北大核心 2018年第5期1253-1258,共6页
为了弥补RGB-D场景解析中卷积神经网络空间结构化学习能力的不足,本文基于深度学习提出空间结构化推理深度融合网络,内嵌的结构化推理层有机地结合条件随机场和空间结构化推理模型,该层能够较为全面而准确地学习物体所处三维空间的物体... 为了弥补RGB-D场景解析中卷积神经网络空间结构化学习能力的不足,本文基于深度学习提出空间结构化推理深度融合网络,内嵌的结构化推理层有机地结合条件随机场和空间结构化推理模型,该层能够较为全面而准确地学习物体所处三维空间的物体分布以及物体间的三维空间位置关系.在此基础上,网络的特征融合层巧妙地利用深度置信网络和改进的条件随机场,该层可以根据融合生成的物体综合语义信息和物体间语义相关性信息完成深度结构化学习.实验结果表明,在标准RGB-D数据集NYUDv2和SUNRGBD上,空间结构化推理深度融合网络分别实现最优的平均准确率53.8%和54.6%,从而有助于实现机器人任务规划、车辆自动驾驶等智能计算机视觉任务. 展开更多
关键词 RGBD场景解析 深度学习 卷积神经网络 条件随机场 空间结构化推理模型 深度置信网络 计算机视觉 机器人任务规划 车辆自动驾驶
在线阅读 下载PDF
基于多任务模型的深度预测算法研究 被引量:1
16
作者 姚翰 殷雪峰 +3 位作者 李童 张肇轩 杨鑫 尹宝才 《图学学报》 CSCD 北大核心 2021年第3期446-453,共8页
图像的深度值预测是计算机视觉和机器人领域中的一个热门的研究课题。深度图的构建是三维重建的重要前提,传统方法主要依靠确定固定点深度进行人工标注或是根据相机的位置变化来进行双目定位预测深度,但这类方法一方面费时费力,另一方... 图像的深度值预测是计算机视觉和机器人领域中的一个热门的研究课题。深度图的构建是三维重建的重要前提,传统方法主要依靠确定固定点深度进行人工标注或是根据相机的位置变化来进行双目定位预测深度,但这类方法一方面费时费力,另一方面也受到相机位置、定位方式、分布概率性等因素的限制,准确率很难得到保证,从而导致预测的深度图难以完成后续三维重建等工作。通过引入基于多任务模块的深度学习方法,可以有效解决这一问题。针对场景图像提出一种基于多任务模型的单目图像深度预测网络,能同时训练学习深度预测、语义分割、表面向量估计3个任务,包括共有特征提取模块和多任务特征融合模块,能在提取共有特征的同时保证各个特征的独立性,提升各个任务的结构性的同时保证深度预测的准确性。 展开更多
关键词 计算机视觉 单目深度预测 多任务模型 语义分割 表面向量估计
在线阅读 下载PDF
监控场景下基于机器注意的多任务行人属性识别 被引量:2
17
作者 陈双叶 徐凯 胡鑫 《北京工业大学学报》 CAS CSCD 北大核心 2021年第5期472-479,共8页
行人属性作为一种高级语义特征,对照明、姿势改变等具有鲁棒性,已经被广泛用于行人重识别和视频分析中.为了提高监控场景下行人属性识别(pedestrian attribute recognition,PAR)的准确性,结合最新的人工智能(artificial intelligence,AI... 行人属性作为一种高级语义特征,对照明、姿势改变等具有鲁棒性,已经被广泛用于行人重识别和视频分析中.为了提高监控场景下行人属性识别(pedestrian attribute recognition,PAR)的准确性,结合最新的人工智能(artificial intelligence,AI)解释性研究,从机器注意的角度出发,综合考虑属性间的互斥性以及依赖性,提出一种限制神经网络注意的多任务行人属性识别方法.首先,根据神经网络对各属性的不同关注区域将行人属性识别划分为多个子任务;然后,通过端到端网络模型和辅助分类损失函数的设计,控制各子任务之间的信息共享,鼓励子任务内部属性相互竞争,不同子任务之间的属性相互促进;最后,融合各子任务的信息进行行人属性的预测.经过实验,该方法在2个监控场景中的公开数据集上取得了最佳的精度,证明了该方法的有效性. 展开更多
关键词 行人属性识别(PAR) 机器注意 多任务 人工智能(AI) 计算机视觉 卷积神经网络
在线阅读 下载PDF
基于车内外视觉信息的行人碰撞预警方法 被引量:5
18
作者 杨会成 朱文博 童英 《智能系统学报》 CSCD 北大核心 2019年第4期752-760,共9页
行人碰撞预警系统通常依据行人检测与碰撞时间判断的方式为驾驶员提供预警信息。为了提供更加可靠的危险判断依据,本文提出一种同时分析道路状况与驾驶员头部姿态的行人碰撞预警方法,用两个单目相机分别获取车辆内外环境图像。通道特征... 行人碰撞预警系统通常依据行人检测与碰撞时间判断的方式为驾驶员提供预警信息。为了提供更加可靠的危险判断依据,本文提出一种同时分析道路状况与驾驶员头部姿态的行人碰撞预警方法,用两个单目相机分别获取车辆内外环境图像。通道特征检测器用于定位行人,根据单目视觉距离测量方法估计出行人与自车间的纵向与横向距离。多任务级联卷积网络用于定位驾驶员面部特征点,通过求解多点透视问题获取头部方向角以反映驾驶员注意状态。结合行人位置信息与驾驶员状态信息,本文构建模糊推理系统判断碰撞风险等级。在实际路况下的实验结果表明,根据模糊系统输出的风险等级可以为预防碰撞提供有效的指导。 展开更多
关键词 碰撞预警 内外信息 行人定位 驾驶员状态 单目视觉 通道特征 多任务级联卷积网络 模糊推理系统
在线阅读 下载PDF
任务驱动下的“眼和视觉”跨学科教学设计
19
作者 李雪梅 张飞 《生物学教学》 北大核心 2024年第12期40-42,共3页
鲁科版初中生物学教材“眼和视觉”一节主要介绍了眼球的结构、视觉的形成和近视及其预防三方面内容,涉及的名词较多,比较抽象。在教学实践中,通过光线进入眼球的路径以及视网膜成像特点等探究实验,帮助学生推理视觉形成过程,引导其明... 鲁科版初中生物学教材“眼和视觉”一节主要介绍了眼球的结构、视觉的形成和近视及其预防三方面内容,涉及的名词较多,比较抽象。在教学实践中,通过光线进入眼球的路径以及视网膜成像特点等探究实验,帮助学生推理视觉形成过程,引导其明确近视成因及预防。借助“凸透镜成像”物理实验装置演示实验,开展“跨学科”探究,实现对教学难点问题的突破,帮助学生认识事物的本质,提升学生学科核心素养。 展开更多
关键词 跨学科 眼和视觉 任务驱动 初中生物学
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部