期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
视觉图灵三境界:大模型时代下视觉智能进展与展望
1
作者 黄凯奇 武美奇 +2 位作者 陈宏昊 丰效坤 张岱凌 《图学学报》 北大核心 2025年第5期919-930,共12页
视觉图灵是通过图灵评测的方式对计算机视觉模型进行评估,为计算机视觉的发展提供了类人评估基准。随着大模型时代的到来,计算机视觉技术的飞速发展极大提升了视觉能力,尤其在图像分类、物体检测分割以及视频理解等领域表现出色。然而,... 视觉图灵是通过图灵评测的方式对计算机视觉模型进行评估,为计算机视觉的发展提供了类人评估基准。随着大模型时代的到来,计算机视觉技术的飞速发展极大提升了视觉能力,尤其在图像分类、物体检测分割以及视频理解等领域表现出色。然而,与人类视觉相比,这些算法在适应性、跨场景泛化和高层次认知推理等方面仍存在显著差距。本文从视觉图灵的三重境界(看所见、看所知和看所想)出发对视觉智能发展进行了梳理,对大模型时代下智能技术面临的瓶颈与挑战进行了整理和分析,介绍了视觉智能从物理世界感知到语义理解认知再到主观心理建模的能力跃迁路径,为推动计算机视觉技术更加接近人类的视觉感知与认知能力的发展提供了思路。 展开更多
关键词 视觉图灵三境界 视觉图灵 多模态大模型 视觉智能 类人智能
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部