期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于多模态大模型的影像智能分析——以影像民族志为例
1
作者 富晓星 赵璐楠 王安顶 《广东社会科学》 2025年第5期180-192,287,288,共15页
随着多模态大模型推动社会科学质性研究的智能化转型,影像民族志分析在技术升级的要求下面临着长视频深度解析的复杂挑战。本研究提出一种基于多模态大模型(MLLM)的影像智能分析框架,通过“切片-重组”技术路径将当前存在技术难点的长... 随着多模态大模型推动社会科学质性研究的智能化转型,影像民族志分析在技术升级的要求下面临着长视频深度解析的复杂挑战。本研究提出一种基于多模态大模型(MLLM)的影像智能分析框架,通过“切片-重组”技术路径将当前存在技术难点的长视频理解转化为可操作的文本分析任务,结合扎根理论编码与时间戳回溯机制,构建非结构化影像到结构化片段的跨模态解析体系。研究发现:MLLM具备时序推理、跨尺度细节捕捉及多模态语义融合能力,但仍需结合知识图谱优化文化特异性知识识别精度。该方法实现了传统影像分析在数量、质量和效率上的三重技术突破,不仅验证了跨模态理论的可迁移性,更揭示了社会科学研究在数字时代深度融合技术逻辑的必要性。 展开更多
关键词 多模态大模型 影像智能分析 视频理解 影像民族志
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部