微信版 移动版

人类学

基于多模态大模型的影像智能分析——以影像民族志为例

2026-02-17 作者: 富晓星,赵璐楠,王安顶

【作者简介】富晓星,中国人民大学社会学理论与方法研究中心教授;赵璐楠,中国人民大学社会学院人类学博士生;王安顶,中国人民大学国家治理大数据和人工智能创新平台研究实习员(北京 100872)。

【文章来源】《人大复印报刊资料》2025年第12期

【内容提要】随着多模态大模型推动社会科学质性研究的智能化转型,影像民族志分析在技术升级的要求下面临着长视频深度解析的复杂挑战。本研究提出一种基于多模态大模型(MLLM)的影像智能分析框架,通过“切片-重组”技术路径将当前存在技术难点的长视频理解转化为可操作的文本分析任务,结合扎根理论编码与时间戳回溯机制,构建非结构化影像到结构化片段的跨模态解析体系。研究发现:MLLM具备时序推理、跨尺度细节捕捉及多模态语义融合能力,但仍需结合知识图谱优化文化特异性知识识别精度。该方法实现了传统影像分析在数量、质量和效率上的三重技术突破,不仅验证了跨模态理论的可迁移性,更揭示了社会科学研究在数字时代深度融合技术逻辑的必要性。

【关 键 词】多模态大模型/ 影像智能分析/ 视频理解/ 影像民族志/

【基金项目】本文是国家自然科学基金项目“基于垂域多模态大模型的非遗影像活态传承与文化发展研究”(项目号72574225)的阶段性成果。

【全文链接】https://hffaz89a1d8c8d150461ch6n5bnu6oqnkq6c6vghhb.libproxy.ruc.edu.cn/qw/detail?id=907593

0
热门文章 HOT NEWS