期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于多模态大模型的影像智能分析——以影像民族志为例
1
作者
富晓星
赵璐楠
王安顶
《广东社会科学》
2025年第5期180-192,287,288,共15页
随着多模态大模型推动社会科学质性研究的智能化转型,影像民族志分析在技术升级的要求下面临着长视频深度解析的复杂挑战。本研究提出一种基于多模态大模型(MLLM)的影像智能分析框架,通过“切片-重组”技术路径将当前存在技术难点的长...
随着多模态大模型推动社会科学质性研究的智能化转型,影像民族志分析在技术升级的要求下面临着长视频深度解析的复杂挑战。本研究提出一种基于多模态大模型(MLLM)的影像智能分析框架,通过“切片-重组”技术路径将当前存在技术难点的长视频理解转化为可操作的文本分析任务,结合扎根理论编码与时间戳回溯机制,构建非结构化影像到结构化片段的跨模态解析体系。研究发现:MLLM具备时序推理、跨尺度细节捕捉及多模态语义融合能力,但仍需结合知识图谱优化文化特异性知识识别精度。该方法实现了传统影像分析在数量、质量和效率上的三重技术突破,不仅验证了跨模态理论的可迁移性,更揭示了社会科学研究在数字时代深度融合技术逻辑的必要性。
展开更多
关键词
多模态大模型
影像智能分析
视频理解
影像民族志
在线阅读
下载PDF
职称材料
题名
基于多模态大模型的影像智能分析——以影像民族志为例
1
作者
富晓星
赵璐楠
王安顶
机构
中国人民大学社会学理论与方法研究中心
出处
《广东社会科学》
2025年第5期180-192,287,288,共15页
基金
国家自然科学基金项目“基于垂域多模态大模型的非遗影像活态传承与文化发展研究”(项目号72574225)的阶段性成果。
文摘
随着多模态大模型推动社会科学质性研究的智能化转型,影像民族志分析在技术升级的要求下面临着长视频深度解析的复杂挑战。本研究提出一种基于多模态大模型(MLLM)的影像智能分析框架,通过“切片-重组”技术路径将当前存在技术难点的长视频理解转化为可操作的文本分析任务,结合扎根理论编码与时间戳回溯机制,构建非结构化影像到结构化片段的跨模态解析体系。研究发现:MLLM具备时序推理、跨尺度细节捕捉及多模态语义融合能力,但仍需结合知识图谱优化文化特异性知识识别精度。该方法实现了传统影像分析在数量、质量和效率上的三重技术突破,不仅验证了跨模态理论的可迁移性,更揭示了社会科学研究在数字时代深度融合技术逻辑的必要性。
关键词
多模态大模型
影像智能分析
视频理解
影像民族志
分类号
C3 [社会学]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于多模态大模型的影像智能分析——以影像民族志为例
富晓星
赵璐楠
王安顶
《广东社会科学》
2025
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部