-
题名基于图文多模态融合的文档片段语义相似度判定算法
- 1
-
-
作者
潘媛
梁国迪
邵馨叶
李芹
-
机构
云南电网有限责任公司信息中心
-
出处
《电子设计工程》
2024年第3期106-109,114,共5页
-
基金
云南电网有限责任公司信息中心项目(059300HK42210001)。
-
文摘
为使网络主机的差异性赋值能力得到保障,实现对相似性文档片段语义信息的准确判别,提出基于图文多模态融合的文档片段语义相似度判定算法。在多模态融合条件的基础上,联合图像区域检测结果、文本区域检测结果,建立完整的词袋模型,实现基于图文多模态融合的文档片段标注。根据文本数据预处理条件,确定关键词权值指标,联合已知文档片段语义信息,求取相似性度量值的准确计算结果,完成文档片段语义相似度判定算法的设计。对比实验结果可知,在图文多模态融合技术的支持下,差异性赋值指标的平均值达到了1.0,对于网络主机而言,其在准确判别相似性文档片段语义信息方面的应用能力得到了保障。
-
关键词
图文多模态融合
文档片段
语义相似度
词袋模型
关键词权值
差异性赋值
-
Keywords
multi⁃modal fusion of image and text
document fragment
semantic similarity
word bag model
key words weight
difference assignment
-
分类号
TN918.4
[电子电信—通信与信息系统]
TP391
[自动化与计算机技术—计算机应用技术]
-