期刊文献+
共找到545篇文章
< 1 2 28 >
每页显示 20 50 100
MF-CFI:A fused evaluation index for camouflage patterns based on human visual perception 被引量:3
1
作者 Xin Yang Wei-dong Xu +1 位作者 Qi Jia Jun Liu 《Defence Technology(防务技术)》 SCIE EI CAS CSCD 2021年第5期1602-1608,共7页
The evaluation index of camouflage patterns is important in the field of military application.It is the goal that researchers have always pursued to make the computable evaluation indicators more in line with the huma... The evaluation index of camouflage patterns is important in the field of military application.It is the goal that researchers have always pursued to make the computable evaluation indicators more in line with the human visual mechanism.In order to make the evaluation method more computationally intelligent,a Multi-Feature Camouflage Fused Index(MF-CFI)is proposed based on the comparison of grayscale,color and texture features between the target and the background.In order to verify the effectiveness of the proposed index,eye movement experiments are conducted to compare the proposed index with existing indexes including Universal Image Quality Index(UIQI),Camouflage Similarity Index(CSI)and Structural Similarity(SSIM).Twenty-four different simulated targets are designed in a grassland background,28 observers participate in the experiment and record the eye movement data during the observation process.The results show that the highest Pearson correlation coefficient is observed between MF-CFI and the eye movement data,both in the designed digital camouflage patterns and largespot camouflage patterns.Since MF-CFI is more in line with the detection law of camouflage targets in human visual perception,the proposed index can be used for the comparison and parameter optimization of camouflage design algorithms. 展开更多
关键词 Camouflage evaluation visual perception Effect assessment Fused index Eye movement analysis
在线阅读 下载PDF
A GENERALIZED GOODNESS CRITERION FOR UNSUPERVISED NEURAL LEARNING OF VISUAL PERCEPTION
2
作者 Liu Jianqin(College of Information Engineering, Central South University of Technology, Changsha 410083, China) 《Journal of Central South University》 SCIE EI CAS 1996年第2期63-67,共5页
Unsupervised learning plays an important role in the neural networks. Focusing on the unsupervised mechanism of neural networks, a novel generalized goodness criterion for the unsupervised neural learning of visual pe... Unsupervised learning plays an important role in the neural networks. Focusing on the unsupervised mechanism of neural networks, a novel generalized goodness criterion for the unsupervised neural learning of visual perception based on the martingale measure is proposed in the paper. The differential geometrical structure is used as the framework of the whole inference and spatial statistical description with adaptive attribute is embedded in the corresponding nonlinear functional space. Consequently the integration of optimization process and computational simulation with the NeoDarwinian paradigm is obtained. And the generalization of the guidance for the evolutionary learning in the neural net framework, the convergence of the goodness and process of the evolution guaranteed by the mathematical features are discussed. This criterion has generic significance in the field of machine vision and visual pattern classification. 展开更多
关键词 visual perception UNSUPERVISED LEARNING NEURAL network
在线阅读 下载PDF
Natural Scene Classification Inspired by Visual Perception and Cognition Mechanisms
3
作者 ZHANG Rui 《重庆理工大学学报(自然科学)》 CAS 2011年第7期24-43,共20页
The process of human natural scene categorization consists of two correlated stages: visual perception and visual cognition of natural scenes.Inspired by this fact,we propose a biologically plausible approach for natu... The process of human natural scene categorization consists of two correlated stages: visual perception and visual cognition of natural scenes.Inspired by this fact,we propose a biologically plausible approach for natural scene image classification.This approach consists of one visual perception model and two visual cognition models.The visual perception model,composed of two steps,is used to extract discriminative features from natural scene images.In the first step,we mimic the oriented and bandpass properties of human primary visual cortex by a special complex wavelets transform,which can decompose a natural scene image into a series of 2D spatial structure signals.In the second step,a hybrid statistical feature extraction method is used to generate gist features from those 2D spatial structure signals.Then we design a cognitive feedback model to realize adaptive optimization for the visual perception model.At last,we build a multiple semantics based cognition model to imitate human cognitive mode in rapid natural scene categorization.Experiments on natural scene datasets show that the proposed method achieves high efficiency and accuracy for natural scene classification. 展开更多
关键词 natural scene classification visual perception model visual cognition model
在线阅读 下载PDF
时空特征强化与感知的视觉目标跟踪方法 被引量:1
4
作者 郭虎升 刘正琪 +1 位作者 刘艳杰 王文剑 《陕西师范大学学报(自然科学版)》 北大核心 2025年第1期60-70,共11页
多数基于Transformer的目标跟踪模型提取的目标局部空间特征信息有限且时间特征利用不足,显著影响了目标跟踪模型在处理目标遮挡、形变或尺度变化等复杂场景下的性能。为此,提出一种时空特征强化与感知的视觉目标跟踪方法(visual object... 多数基于Transformer的目标跟踪模型提取的目标局部空间特征信息有限且时间特征利用不足,显著影响了目标跟踪模型在处理目标遮挡、形变或尺度变化等复杂场景下的性能。为此,提出一种时空特征强化与感知的视觉目标跟踪方法(visual object tracking method with spatial-temporal feature enhancement and perception,STFEP)。一方面,该方法使用Transformer进行搜索区域与时间上下文特征的提取与融合,以得到全局特征信息,通过设计的局部卷积神经网络,提取目标的局部特征信息,并与目标的全局特征信息相关联,进一步强化目标的特征表示。另一方面,提出了时空特征感知机制,对不同时刻的特征信息进行可靠性和必要性分析,构建动态模板以感知更丰富的时空信息,使模型适应目标及场景的复杂变化。在TrackingNet、GOT-10k、LaSOT、UAV123多个数据集上的实验结果表明,研究所提方法能够准确鲁棒的对目标进行跟踪,并在GOT-10k数据集上取得了最优的结果,AO、SR 0.5以及SR 0.75分别达到了73.7%、83.8%、70.6%。 展开更多
关键词 视觉目标跟踪 时空特征强化 全局-局部信息关联 时空特征感知 动态模板
在线阅读 下载PDF
视觉感知对热舒适判断的影响机制——以城市口袋公园为切入点 被引量:1
5
作者 李芝也 王学润 许烁钰 《生态学报》 北大核心 2025年第12期5660-5673,共14页
口袋公园作为城市开放空间的重要组成部分,常呈斑块状散布于城市结构中,承担着市民户外活动的重要功能。在全球高温热浪频发的背景下,改善口袋公园热环境,是优化城市环境、降低市民健康风险、提升市民生活福祉的有效途径。传统热舒适研... 口袋公园作为城市开放空间的重要组成部分,常呈斑块状散布于城市结构中,承担着市民户外活动的重要功能。在全球高温热浪频发的背景下,改善口袋公园热环境,是优化城市环境、降低市民健康风险、提升市民生活福祉的有效途径。传统热舒适研究主要是在物理热环境基础上,引入人体代谢率、皮肤温度、服装热阻等指标,结合问卷进行舒适度评价。在景感生态学理论支撑下,热舒适研究进一步拓展至热感知研究。以厦门老城区口袋公园为例,选取典型景观实景照片,在实验室环境中进行视觉刺激实验。研究突破了传统热舒适指标体系,从心理、行为、生理三个维度展开互证,具体为:在主观的心理数据(问卷)基础上增加客观的行为数据(眼动)与生理数据(皮电EDA)的比较研究,揭示了主、客观指标在热舒适判断中的表征特点与差异,并从“感觉-认知-决策”的心理路径解析差异存在的原因。实验数据客观描述了个体在视觉感知中的身心状态,充分解释了视觉行为特征、心理认知、情绪压力之间的关联,揭示了视觉感知对热舒适判断的影响机制。研究结果表明:(1)对公园景观的视觉关注行为主要遵循个体的兴趣爱好、需求意愿;(2)人们更多地通过快速扫视的方式对与热环境相关的景观要素进行信息捕获;(3)视觉感知信息结合个体的热联想经验,最终转换为对热舒适体验的判断;(4)视觉刺激引发的皮电变化率和阴影、植物总体占比率呈现显著的正相关,说明阴影、植物总体占比率可能是影响公园热舒适体验的关键因素。总之,研究以可持续发展为目标,关注人地关系,研究结论突破了城市设计中追求绿视率、景观趣味性等的传统思路,在热环境优化目标下提出了绿植、阴影结合设计的新视角,为建设低碳节能、宜居亲人的未来城市提供了更加精细化、科学化的思路。 展开更多
关键词 景感生态学 视觉感知 个体热舒适 人因实验 口袋公园
在线阅读 下载PDF
针对降雨模拟方法的机器视觉真实度对比研究
6
作者 陈君毅 夏天 +5 位作者 刘镇源 贾通 王潇屹 马雪寒 邢星宇 吴建峰 《汽车工程》 北大核心 2025年第3期449-459,共11页
针对降雨这一视觉感知系统高暴露率及高风险触发条件,各类降雨模拟方法是主要的测试手段,但模拟降雨的真实度,会影响到测试结果的置信度。本文从图像质量与目标检测两方面选取指标,量化降雨对机器视觉产生的影响,以真实降雨下指标变化... 针对降雨这一视觉感知系统高暴露率及高风险触发条件,各类降雨模拟方法是主要的测试手段,但模拟降雨的真实度,会影响到测试结果的置信度。本文从图像质量与目标检测两方面选取指标,量化降雨对机器视觉产生的影响,以真实降雨下指标变化的数值范围与趋势为基准,对比研究不同降雨模拟方法在机器视觉维度上的真实度。此外,本文采集无雨及各级真实降雨图像共1 950张构建数据集,以得到真实降雨对机器视觉影响的统计性规律,并选取2处模拟降雨测试场地、3款仿真软件和1个生成模型进行降雨模拟测试,横向对比分析不同类型降雨模拟方法的真实度。结果显示,图像质量方面,仿真软件与场地模拟降雨设备能较好地在破坏程度的数值范围与趋势上模拟真实降雨;目标检测方面,仿真软件与生成模型在分类置信度变化值的数值范围上更接近真实降雨。总体来说,在机器视觉真实度方面数字仿真模拟降雨表现较好,后续依次为场地物理模拟降雨和生成模型模拟降雨,为智能网联汽车视觉感知系统的预期功能安全测试提供了参考。 展开更多
关键词 降雨模拟 真实度分析 机器视觉 视觉感知系统
在线阅读 下载PDF
船行视角下山地城市滨江界面动态视觉感知评价
7
作者 罗丹 魏茹虹 《风景园林》 北大核心 2025年第2期102-109,共8页
【目的】连续的船行观景视角是山地城市滨江界面视觉景观感知研究的重要切入点,对该视角下的城市界面动态视觉感知研究可为宜居山地城市建设提供理论支持与实践指导。【方法】以重庆“两江四岸”核心区滨江界面为研究区域,根据游船视角... 【目的】连续的船行观景视角是山地城市滨江界面视觉景观感知研究的重要切入点,对该视角下的城市界面动态视觉感知研究可为宜居山地城市建设提供理论支持与实践指导。【方法】以重庆“两江四岸”核心区滨江界面为研究区域,根据游船视角下的界面特征,利用层次分析法拟合眼动行为、问卷、空间指标等主客观数据建立评价模型,评价整体界面和视觉单元景观的视觉感知规律。【结果】可读性对整体界面视觉评价结果有显著影响,是导致界面感知差异的重要因素;多层次单元、特色单元、凹形单元、填充式单元和自然式单元5类单元结构中填充式单元视觉感知评价较低。视觉轨迹自上而下移动,视觉停留区集中于界面下端的江岸部分,游船、标志建筑、空间交界处是重要的视觉聚集点。【结论】基于整体界面空间层次、组成要素完整度、视觉反馈点控制提出可读性维度的优化建议,形成了从感知评价到空间优化的技术路径。 展开更多
关键词 风景园林 视觉感知 山地城市 滨江界面 眼动实验
在线阅读 下载PDF
中外经典座椅视觉偏好差异研究
8
作者 赵立杉 张茜玥 张凯旋 《家具与室内装饰》 北大核心 2025年第7期8-14,共7页
为探索Z世代专业用户群体与非专业用户群体对中外经典座椅的视觉偏好差异,总结归纳其视觉偏好,并从中获得设计启示与指导方法。首先收集整理中外设计史上的经典座椅,将样本进行分类、灰度处理及拉丁方形式排列;其次采用语义感知差异法,... 为探索Z世代专业用户群体与非专业用户群体对中外经典座椅的视觉偏好差异,总结归纳其视觉偏好,并从中获得设计启示与指导方法。首先收集整理中外设计史上的经典座椅,将样本进行分类、灰度处理及拉丁方形式排列;其次采用语义感知差异法,对不同背景用户进行语义差异法评价调查,运用眼动追踪技术获取用户眼动指标数据,对比不同背景用户的语义感知与视觉偏好差异。通过实验分析发现,不同背景用户均对有靠背有扶手类型的座椅视觉偏好均值较高;有靠背无扶手类型的座椅在语义评价及视觉关注度均值上均存在显著性。本研究通过眼动实验弥补了传统主观评价的不足,增加定量数据支撑,研究表明不同背景用户对于座椅外观造型的语义感知度与视觉偏好具有相关性,为座椅造型设计领域提供了科学的数据支持与理论指导。 展开更多
关键词 眼动实验 Z世代 经典座椅 语义感知 视觉偏好差异
在线阅读 下载PDF
医学人类学视觉场中的疾病与健康
9
作者 杜靖 《思想战线》 北大核心 2025年第2期59-73,共15页
从生病到恢复健康过程中觉知到的世界,不同于健康状态下人们置身其中的世界。这些世界包括体内物质性世界、体内精神世界、体外自然世界、社会生活世界和宇宙论世界。疾病及治疗是我们看到不同层级世界的一种缘起和媒介。在生病和治疗... 从生病到恢复健康过程中觉知到的世界,不同于健康状态下人们置身其中的世界。这些世界包括体内物质性世界、体内精神世界、体外自然世界、社会生活世界和宇宙论世界。疾病及治疗是我们看到不同层级世界的一种缘起和媒介。在生病和治疗过程中,不同行动主体的觉知机制与方式不一样。有的借助富有习性的身体,有的借助现代技术,有的借助梦的解析和催眠手段,让病人身体内部世界图像及病因显现出来。在知觉现象学看来,生病中的医学人类学家更能用自己的身体觉知“疾病世界”,摆脱一般学术概念的支配。现有绝大部分人类学民族志作品是在人类学家健康状态下完成的,应该建立一种基于非健康状态下的人类学知识构架,这也许是医学人类学能够为人类学做出的最大反思性贡献。此外,医生不应只坐在医院里诊治,要到社会世界中去察知病情和病因。 展开更多
关键词 知觉现象学 实践人类学 医学人类学视觉场 疾病与健康
在线阅读 下载PDF
基于光信标的井下视觉精确定位方法
10
作者 刘毅 王可翔 +3 位作者 程浩 李长鑫 胡成玺 赵莉莉 《工矿自动化》 北大核心 2025年第7期135-141,共7页
煤矿井下UWB定位技术受多径效应、定位分站部署稀疏及通信线缆依赖性的限制,存在定位稳定性差、精度不高和灾害场景下通信易中断等问题,不能满足井下无人驾驶车辆、机器人、自动采掘设备等智能移动装备的自主导航定位需求。针对上述问题... 煤矿井下UWB定位技术受多径效应、定位分站部署稀疏及通信线缆依赖性的限制,存在定位稳定性差、精度不高和灾害场景下通信易中断等问题,不能满足井下无人驾驶车辆、机器人、自动采掘设备等智能移动装备的自主导航定位需求。针对上述问题,提出了一种基于光信标的井下视觉精确定位方法。在巷道两侧成对部署光信标组,光信标周期性发送包含唯一编码的光信号;利用智能移动装备搭载的相机采集包含光信标组的图像;通过解析图像中的光信号得到唯一编码,并根据唯一编码查询光信标的已知坐标;基于光信标在图像中的像素位置及实际坐标,计算得到智能移动装备与光信标之间的距离,并采用透视n点(PnP)算法求解得到智能移动装备的三维坐标和姿态。在限定空间和巷道中进行了定位实验,结果表明,该方法可实现定位误差小于0.15m的三维精确定位和欧拉角误差小于7°的高精度姿态感知,优于UWB定位精度。与UWB定位相比,该方法无需无线通信网络支持,可完全通过机器视觉实现井下三维定位和姿态感知,特别适合在采掘工作面等电磁环境复杂且定位精度要求高的区域应用。 展开更多
关键词 井下精确定位 视觉定位 自主导航 光信标 三维定位 姿态感知 PnP算法
在线阅读 下载PDF
可重构智能超表面辅助的非视距人体生命体征感知 被引量:1
11
作者 李新羽 张静远 +4 位作者 蔡子轩 秦世龙 马骞 游检卫 崔铁军 《电子学报》 北大核心 2025年第1期1-13,共13页
本文提出非视距场景下的无接触式人体生命体征感知方法,将可重构智能超表面与人体无线感知技术相结合,利用可重构智能超表面对电磁波的灵活调控能力,实现有障碍物遮挡情况下的人体生命体征监测.本文首先通过视觉辅助机制,利用Yolo-v7深... 本文提出非视距场景下的无接触式人体生命体征感知方法,将可重构智能超表面与人体无线感知技术相结合,利用可重构智能超表面对电磁波的灵活调控能力,实现有障碍物遮挡情况下的人体生命体征监测.本文首先通过视觉辅助机制,利用Yolo-v7深度学习模型,实现人体目标的定位.在此基础上,可重构智能超表面根据人体位置估计结果进行编码优化,进而改变感知信号传播路径,实现非视距场景下的人体感知;同时,本文针对传统变分模态分解算法在人体生命体征感知方面的不足,进一步提出一种基于滤波的变分模态分解算法,实现人体呼吸、心跳速率的精准估计.实验结果表明,视觉辅助模块可以准确定位人体胸腔所在位置,从而使可重构智能超表面能够精准调控电磁波束,使感知信号聚焦于人体.所提出的基于滤波的变分模态分解算法可以实现人体生命体征精准估计,其呼吸和心跳平均估计误差分别为0.6 RPM和5.3 BPM.与此同时,进一步分析与讨论也证明了基于可重构智能超表面的感知方案在非视距场景下进行人体生命体征感知的有效性和准确性. 展开更多
关键词 可重构智能超表面 非视距感知 人体无线感知 生命体征探测 变态模式分解 视觉辅助
在线阅读 下载PDF
基于随机森林的公园生态景观视觉感知综合评价方法
12
作者 崔欣雨 莫路锋 +2 位作者 王国英 易晓梅 吴鹏 《生态学报》 北大核心 2025年第11期5277-5288,共12页
随着城市化进程的加快、环境保护需求的提升以及人们对高品质生活的追求,城市公园的景观视觉感知舒适度研究逐渐成为城市规划与管理中的关键议题,然而现有研究尚未形成系统的评价指标和量化方法。为解决这一问题,在景感生态学理论基础上... 随着城市化进程的加快、环境保护需求的提升以及人们对高品质生活的追求,城市公园的景观视觉感知舒适度研究逐渐成为城市规划与管理中的关键议题,然而现有研究尚未形成系统的评价指标和量化方法。为解决这一问题,在景感生态学理论基础上,提出了一种基于随机森林的公园景观视觉感知综合评价方法。该方法结合语义分割技术与HSB(色调、饱和度、亮度)颜色模型,从空间、自然、建筑与色彩四个维度对景观特征进行量化,拓展了城市公园景观的评价体系。通过与逐步线性回归模型的对比分析,验证了随机森林回归模型在公园景观视觉感知舒适度预测中的优越性,并探讨了其在不同视觉感知舒适度评估中的表现。研究基于杭州市10个滨水城市公园的景观图像数据集展开,实验发现,天空开敞度、水域覆盖度、树木丰富度、草本植物丰富度、草地覆盖度及开花植物丰富度对视觉感知舒适度具有正向影响,而道路铺装度与冷暖色调对比度则产生负向影响。随机森林回归模型的R^(2)(0.814)显著高于逐步线性回归模型的R^(2)(0.601),在不同视觉评分等级下展现出较高的预测准确度,尤其在极端评分(1级与5级)的预测中表现尤为突出。研究不仅为城市公园的规划建设与景观优化提供了理论基础与技术支持,也为城市高质量发展与精细化管理提供了有效的技术手段。 展开更多
关键词 公园景观 视觉感知舒适度 随机森林 景观规划
在线阅读 下载PDF
面向煤矿综掘工作面复杂环境的视觉感知系统
13
作者 苏国用 胡坤 +2 位作者 王鹏彧 赵东洋 张辉 《浙江大学学报(工学版)》 北大核心 2025年第5期995-1006,1030,共13页
针对煤矿恶劣环境下视觉检测算法鲁棒性不足的难题,提出面向煤矿综掘工作面复杂环境的视觉感知系统.该系统采用ELAN-DS特征提取模块、SimAM注意力模块与解耦检测头对YOLOv7-tiny算法进行优化,构建煤矿综掘工作面视觉检测网络(CMCE-Net).... 针对煤矿恶劣环境下视觉检测算法鲁棒性不足的难题,提出面向煤矿综掘工作面复杂环境的视觉感知系统.该系统采用ELAN-DS特征提取模块、SimAM注意力模块与解耦检测头对YOLOv7-tiny算法进行优化,构建煤矿综掘工作面视觉检测网络(CMCE-Net).将CMCE-Net迁移部署到视觉感知终端平台内,测试CMCE-Net在煤矿实际作业工况下的检测性能,基于煤矿综掘工作面数据集开展验证实验.实验结果表明,CMCE-Net的检测精度达到89.5%,相较于YOLOv7-tiny算法提升了5.2%.与Faster RCNN、YOLOv7-tiny、YOLOv8s等8种算法相比,综合检测性能最佳,模型复杂度处于较低水平.在视觉感知终端平台内,CMCE-Net对测试视频的检测速度最高达到33.4帧/s,在人机多目标混杂工况下,CMCE-Net对装备与人员的检测精度均大于90.0%. 展开更多
关键词 综掘工作面 关键目标 视觉感知 检测网络
在线阅读 下载PDF
面向运动视觉的环境视觉信息分析与感知测度方法研究进展
14
作者 朱海鹏 孔宇航 《风景园林》 北大核心 2025年第5期12-21,共10页
【目的】人们对周围环境的认知在很大程度上依赖于运动过程中的视觉感知,系统评述运动过程中视觉信息获取与主观感知反馈间的动态关联性,为以人为本的城市公共空间设计优化提供技术路径。【方法】以环境视觉信息分析和主观感知测度为核... 【目的】人们对周围环境的认知在很大程度上依赖于运动过程中的视觉感知,系统评述运动过程中视觉信息获取与主观感知反馈间的动态关联性,为以人为本的城市公共空间设计优化提供技术路径。【方法】以环境视觉信息分析和主观感知测度为核心,系统综述环境视觉信息分析方法、运动视觉模拟技术及序列主观感知测度方法。【结果】全景图像能够完整记录环境视觉信息、准确标定“视点-环境”空间关系,在全景绿视率、天空率等静态视觉信息量化方面应用成熟,但在光流、运动视差等动态视觉信息分析方面,仍需要提高量化精度、实现动态视觉信息的快速识别与实时计算。运动视觉模拟方法强调将虚拟现实(virtual reality,VR)技术与运动传感设备相结合,以提升运动视觉体验的真实性与沉浸感;序列主观感知测度可结合心理物理学方法与可穿戴传感器,实现对环境刺激的毫秒级响应;机器学习技术在视觉感知评价中展现出巨大潜力。【结论】未来研究应提升动态视觉信息分析精度,强化序列感知测度中的多模态数据融合技术,优化机器学习模型的情境适应性与泛化能力,为运动视觉感知研究提供更有效的技术路径。 展开更多
关键词 风景园林 景观感知 动态视觉感知 全景视觉技术 视觉信息测度 运动视觉模拟 视觉感知评价
在线阅读 下载PDF
基于机器视觉的煤矿多场景关键目标检测方法研究
15
作者 苏国用 帅洪锌 +3 位作者 邓海顺 王鹏彧 赵东洋 庞子金 《电子测量与仪器学报》 北大核心 2025年第7期212-226,共15页
针对煤矿井下复杂作业场景中高粉尘、低照度、人机多目标混杂与跨尺度变化等因素导致作业人员与装备的目标检测效果不佳问题,提出一种基于机器视觉的煤矿多场景关键目标检测方法。首先,采用CGNet(context guided network)特征提取模块、... 针对煤矿井下复杂作业场景中高粉尘、低照度、人机多目标混杂与跨尺度变化等因素导致作业人员与装备的目标检测效果不佳问题,提出一种基于机器视觉的煤矿多场景关键目标检测方法。首先,采用CGNet(context guided network)特征提取模块、SlimNeck特征融合模块与Dyhead动态检测头对YOLOv5s算法进行优化,以构建YOLOv5s-CSD网络模型。其次,基于自建煤矿数据集,围绕YOLOv5s-CSD模型开展消融实验、对比实验与嵌入式检测实验。实验结果表明,在煤矿井下掘进、支锚、采煤与辅助运输4种复杂作业场景中,YOLOv5s-CSD的检测精度达91.0%,相较于YOLOv5s算法提升了3.5%,并且其与YOLOv9s、YOLOv11s、YOLOv12s等6种主流目标检测算法相比,模型复杂度适中且检测精度最高。在实验测试平台上,YOLOv5s-CSD模型对工作人员、支护装置、电机车等7类关键目标的实时检测精度均在90.0%以上,并且其实时检测速度达38.6 fps,检测精度高且实时性强,可为煤矿井下复杂环境的视觉动态感知提供技术支撑。 展开更多
关键词 复杂作业场景 机器视觉 目标检测 YOLO 视觉动态感知
在线阅读 下载PDF
多模态文本视觉大模型机器人地形感知算法研究
16
作者 孙浩 谢滔 +5 位作者 何龙 郭文忠 虞永方 吴其军 王建伟 东辉 《图学学报》 北大核心 2025年第3期558-567,共10页
为提升机器人在动态复杂环境下对地形的智能感知能力,提出了一种基于多模态文本视觉大模型信息融合地形分割算法,集成了SLIC图像数据预处理、CLIP和SAM掩码生成模块、Dice系数后处理。首先,对原始输入图像进行SLIC预处理,得到图像分割子... 为提升机器人在动态复杂环境下对地形的智能感知能力,提出了一种基于多模态文本视觉大模型信息融合地形分割算法,集成了SLIC图像数据预处理、CLIP和SAM掩码生成模块、Dice系数后处理。首先,对原始输入图像进行SLIC预处理,得到图像分割子块,通过增加提示点提高后续掩码质量,可显著提高地形分类准确度。然后,通过文本-图像预训练大模型CLIP,将输入视觉图像和预设地形文本信息进行匹配,并借助其可解释性和零次学习,生成各地形提示点集合。由SAM大模型接受上述集合生成带有语义标签的掩码数据,并通过Dice系数后处理筛选可用掩码。以Cityscapes数据集为地形分割样本,验证了该算法相较于监督和无监督学习框架下主流分割算法的优越性,在无需标记数据的情况下,实现了76.58%的有效掩码生成率,IoU达到90.14%。针对四足机器人地形感知任务,添加U-net编/解码器网络量化验证模块。以生成掩码作为数据集,构建轻量化地形分割模型,部署在四足机器人的边缘计算设备,并在真实环境中开展地形分割实验。实验结果表明,2种掩码优化方法分别使模型MIo U提升了2.36%和2.56%,最终轻量化模型MIoU达到96.34%,地形分割精度可靠,该算法有效指导了机器人快速地从起点安全行进到目标地,并有效避开草地等非几何障碍物。 展开更多
关键词 深度学习 文本视觉大模型 足式机器人 地形感知 计算机视觉
在线阅读 下载PDF
基于无人机视觉的船舶靠泊距离感知研究
17
作者 董瑞恒 张英俊 +1 位作者 张浩泽 鲁洪瑞 《电子测量技术》 北大核心 2025年第2期170-177,共8页
为解决船舶靠泊过程中视野受限问题,实现靠泊距离的可视化,提出了一种基于无人机视觉的靠泊距离感知方法。首先,利用无人机采集船舶靠泊视频,在YOLOv8分割模型的基础上加入EMA注意力机制,实现对船舶边缘的精细化分割;接下来,通过区域生... 为解决船舶靠泊过程中视野受限问题,实现靠泊距离的可视化,提出了一种基于无人机视觉的靠泊距离感知方法。首先,利用无人机采集船舶靠泊视频,在YOLOv8分割模型的基础上加入EMA注意力机制,实现对船舶边缘的精细化分割;接下来,通过区域生长算法和霍夫直线检测方法提取泊位线;最后,利用最近距离求解模型,将船舶和泊位转换到三维世界坐标系中,并搜索船舶与泊位间的最近距离。实验结果表明,加入EMA注意力机制后的算法对船舶分割的精度可达到92.3%,船舶与泊位间最近距离的误差小于0.1 m。该方法不仅可以监控靠泊船舶周围的环境,而且能够实现船舶与泊位间距离的可视化,在靠泊操作中具有很好的应用前景。 展开更多
关键词 船舶靠泊 无人机 视觉感知 深度学习 视觉测量
在线阅读 下载PDF
植物色彩景观视觉感知量化研究进展与展望
18
作者 罗媛媛 黄燕 +1 位作者 周晨 张梁 《中国城市林业》 2025年第1期73-80,共8页
植物的色彩具有主观视觉的第一特征,植物色彩景观的品质是园林绿化质量的直接体现。对截至2022年12月31日的国内外相关文献进行回顾和总结,梳理植物色彩景观量化研究的国内外现状进展、前沿热点和发展趋势,结果发现:1)基于色彩量化技术... 植物的色彩具有主观视觉的第一特征,植物色彩景观的品质是园林绿化质量的直接体现。对截至2022年12月31日的国内外相关文献进行回顾和总结,梳理植物色彩景观量化研究的国内外现状进展、前沿热点和发展趋势,结果发现:1)基于色彩量化技术,对植物色彩与人体响应尤其是与视觉响应的关系、植物色彩景观规划设计应用研究是国内外共同的关注重点,“美景度”和“视觉感知”是共同的研究前沿热点。2)植物色彩景观的视觉审美评价方法各有其优势和局限,设计实践多基于色彩调和理论提出植物搭配的方法,或基于色彩的生理、心理感知提出植物品种建议。最后,基于研究现状中存在的问题,从多学科融合选取色彩评价指标、多视角交叉选取视觉感知的评价方法、多方法结合构建植物色彩景观的数字化营造模式3方面进行展望。 展开更多
关键词 视觉感知 植物色彩景观 审美评价 量化研究 CiteSpace可视化分析
在线阅读 下载PDF
基于SAM2的腹腔镜手术多目标自动分割方法
19
作者 刘成 张家意 +2 位作者 袁烽 张睿 高欣 《图学学报》 北大核心 2025年第5期969-979,共11页
腹腔镜术中场景的自动分割是手术机器人实现自主操作的关键基础,当前仍面临三重挑战:手术目标间纹理高度相似且边界模糊,导致相似目标难以精确分割;从亚毫米级缝合线到厘米级脏器组织存在显著尺度差异,制约了多目标同步分割精度提升;运... 腹腔镜术中场景的自动分割是手术机器人实现自主操作的关键基础,当前仍面临三重挑战:手术目标间纹理高度相似且边界模糊,导致相似目标难以精确分割;从亚毫米级缝合线到厘米级脏器组织存在显著尺度差异,制约了多目标同步分割精度提升;运动伪影和烟雾遮挡等干扰进一步影响术中多目标完整分割的鲁棒性。为此,提出基于视觉大模型SAM2的腹腔镜手术多目标自动分割方法(SAM2-MSNet)。采用LoRA+微调策略优化SAM2图像编码器,高效适配腹腔镜图像的纹理特征表达;设计跨尺度特征同步提取模块,实现多尺度目标的精确分割;构建特征关系全局感知模块,增强网络对运动伪影及烟雾遮挡等干扰的鲁棒性;并引入方向梯度直方图驱动的伪标签辅助监督机制,显著提升目标边缘分割精度。实验结果表明,SAM2-MSNet在Endovis2018和AutoLaparo数据集上分别取得了70.2%和69.6%的平均交并比(mIoU),和78.5%和75.0%的平均Dice系数(mDice)。在推理速度与SAM2-UNet相当(23帧/秒VS.25帧/秒)的前提下,其分割精度显著提升了3.0%和6.7%(mIoU)和2.8%和6.8%(mDice)。SAM2-MSNet实现了对腹腔镜手术场景高精度全自动分割,为手术机器人自主化进程提供了关键技术支撑。 展开更多
关键词 腹腔镜手术场景分割 视觉大模型 跨尺度特征同步提取 特征关系全局感知 伪标签辅助监督
在线阅读 下载PDF
生物启发的运动行人视觉不变性响应神经网络
20
作者 于世海 胡滨 《计算机科学》 北大核心 2025年第7期170-188,共19页
视觉不变性是生物视脑认知机能的重要神经调谐响应特性,但目前还尚无关于该神经特性在运动行人视觉感知问题研究中的计算模型。针对该问题,基于哺乳动物视觉神经结构特性,借助人类大脑内侧颞叶区(MTL)神经元尖峰响应机理以及人体运动力... 视觉不变性是生物视脑认知机能的重要神经调谐响应特性,但目前还尚无关于该神经特性在运动行人视觉感知问题研究中的计算模型。针对该问题,基于哺乳动物视觉神经结构特性,借助人类大脑内侧颞叶区(MTL)神经元尖峰响应机理以及人体运动力学特性,提出一种适用于运动行人视觉感知与不变性响应的人工视觉神经网络(mpvirNN)。所提出的神经网络包括两个部分:突触前网络和突触后网络。突触前网络基于哺乳动物视网膜视觉信息加工处理机制,感知视野域中行人对象的低阶视觉运动信息;突触后网络提取行人运动周期频率视觉线索,整合输出表征视觉响应的神经膜电位簇。系统性的实验研究表明,mpvirNN能有效感知视觉场景中的运动行人对象,产生具有视觉不变性特性的神经尖峰响应输出。研究涉及生物视脑认知神经机制启发的运动行人视觉动态信息加工处理,可为人工智能中的行人检测与认知识别研究提供新思想、新方法。 展开更多
关键词 视觉不变性 神经尖峰响应 人体运动力学特性 运动行人 视网膜神经 视觉运动感知
在线阅读 下载PDF
上一页 1 2 28 下一页 到第
使用帮助 返回顶部