-
题名资源受限场景下的虚假信息识别技术研究
- 1
-
-
作者
武成龙
胡明昊
廖劲智
杨慧
赵翔
-
机构
国防科技大学大数据与决策实验室
军事科学院信息研究中心
国防大学军事管理学院
中国电子科技集团公司第三十研究所
-
出处
《计算机科学》
CSCD
北大核心
2024年第11期15-22,共8页
-
基金
国家重点研发计划(2022YFB3102600)
国家自然科学基金(72301284,62376284)。
-
文摘
近年来,社交媒体因其开放性和便捷性,为虚假信息的扩散和泛滥提供了温床。相较于单模态虚假信息,多模态虚假信息通过融合文本和图片等多种信息形式,创造出更具迷惑性的虚假内容,造成更深远的影响。现有的多模态虚假信息识别方法大多基于小模型,而多模态大模型的快速发展为多模态虚假信息的识别提供了新思路。然而,这些模型通常参数众多、计算资源消耗大,无法直接部署在计算和能量资源受限的场景中。为了解决以上问题,提出一种基于多模态大模型Long-CLIP的多模态虚假信息识别模型。该模型能够处理长文本,关注更多粗粒度和细粒度细节。同时,利用高效多粒度分层剪枝进行模型压缩,得到一个更加轻量化的多模态虚假信息识别模型,以适应资源受限场景。最后,在微博数据集上,通过与微调前后的当前流行的多模态大模型和其他剪枝方法进行对比,验证了该模型的有效性。结果显示,基于Long-CLIP的多模态虚假信息识别模型在模型参数和推理时间方面远少于当前流行的多模态大模型,但检测效果更佳。模型压缩后,在检测效果仅下降0.01的情况下,模型参数减少50%,推理时间减少1.92s。
-
关键词
虚假信息识别
多模态大模型
资源受限
模型压缩
剪枝
-
Keywords
Fake news detection
Multimodal large models
Resource-constrained
Model compression
Pruning
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-