多模态命名实体识别研究进展被引量：4

Review of Multimodal Named Entity Recognition Studies

导出

摘要【目的】梳理归纳多模态命名实体识别研究成果,为后续相关研究提供参考与借鉴。【文献范围】在Web of Science、IEEE Xplore、ACM Digital Library、中国知网数据库中,以“多模态命名实体识别”“多模态信息抽取”“多模态知识图谱”为检索词进行文献检索,共筛选出83篇代表性文献。【方法】从概念、特征表示、融合策略和预训练模型4个方面对多模态命名实体识别研究进行总结论述,指出现存问题和未来研究方向。【结果】多模态命名实体识别目前主要围绕模态特征表示和融合两个方面展开且在社交媒体领域取得了一定进展,需要进一步改进多模态细粒度特征提取和语义关联映射方法以提升模型的泛化性和可解释性。【局限】直接以多模态命名实体识别为研究主题的文献数量较少,在支撑综述结果方面存在局限性。【结论】针对多模态命名实体识别亟需解决的问题展望未来发展趋势,为进一步拓宽多模态学习在下游任务应用的研究范畴、破解模态壁垒和语义鸿沟提供了新思路。 [Objective]This paper reviews multimodal named entity recognition research to provide references for future studies.[Coverage]We selected 83 representative papers using“multimodal named entity recognition”,“multimodal information extraction”,and“multimodal knowledge graph”as the search terms for the Web of Science,IEEE Xplore,ACM digital library,and CNKI databases.[Methods]We summarized the multimodal named entity recognition research in four aspects:concepts,feature representation,fusion strategies,and pre-trained models.We also identified existing problems and future research directions.[Results]Multimodal named entity recognition studies focus on modal feature representation and fusion.It made some progress in the field of social media.They need to improve multimodal fine-grained feature extraction and semantic association mapping methods to enhance the models’generalization and interpretability.[Limitations]There is insufficient literature directly using multimodal named entity recognition as a research topic.[Conclusions]Our study provides new ideas to expand the applications of multimodal learning,break the modal barriers,and bridge the semantic gaps.

作者韩普陈文祺 Han Pu;Chen Wenqi(School of Management,Nanjing University of Posts and Telecommunications,Nanjing 210003,China;Provincial Key Laboratory of Data Engineering and Knowledge Service(Nanjing University),Nanjing 210023,China)

机构地区南京邮电大学管理学院数据工程与知识服务省高校重点实验室(南京大学)

出处《数据分析与知识发现》 EI CSSCI CSCD 北大核心 2024年第4期50-63,共14页 Data Analysis and Knowledge Discovery

基金国家社会科学基金项目(项目编号:22BTQ096) 江苏高校青蓝工程江苏省研究生科研创新计划基金项目(项目编号:KYCX23_0930)的研究成果之一

关键词多模态命名实体识别特征表示多模态融合多模态预训练 Multimodal Named Entity Recognition Feature Representation Multimodal Fusion Multimodal Pre-training

分类号 TP391 [自动化与计算机技术—计算机应用技术] G35 [文化科学—情报学]

作者简介通讯作者:韩普,ORCID:0000-0001-5867-4292,E-mail:hanpu@njupt.edu.cn。

引文网络
相关文献

参考文献9

1何俊,张彩庆,李小珍,张德海.面向深度学习的多模态融合技术研究综述[J].计算机工程,2020,46(5):1-11. 被引量：75
2王惠茹,李秀红,李哲,马春明,任泽裕,杨丹.多模态预训练模型综述[J].计算机应用,2023,43(4):991-1004. 被引量：10
3范涛,王昊,陈玥彤.基于深度迁移学习的地方志多模态命名实体识别研究[J].情报学报,2022,41(4):412-423. 被引量：15
4尹奇跃,黄岩,张俊格,吴书,王亮.基于深度学习的跨模态检索综述[J].中国图象图形学报,2021,26(6):1368-1388. 被引量：22
5李志义,黄子风,许晓绵.基于表示学习的跨模态检索模型与特征抽取研究综述[J].情报学报,2018,37(4):422-435. 被引量：21
6唐樾,马静.基于增强对抗网络和多模态融合的谣言检测方法[J].情报科学,2022,40(6):108-114. 被引量：8
7胡峰松,张璇.基于梅尔频率倒谱系数与翻转梅尔频率倒谱系数的说话人识别方法[J].计算机应用,2012,32(9):2542-2544. 被引量：23
8李晓腾,张盼盼,勾智楠,高凯.基于多任务学习的多模态命名实体识别方法[J].计算机工程,2023,49(4):114-119. 被引量：5
9吴友政,李浩然,姚霆,何晓冬.多模态信息处理前沿综述:应用、融合和预训练[J].中文信息学报,2022,36(5):1-20. 被引量：25

二级参考文献60

1汪峥,连翰,王建军.说话人识别中特征参数提取的一种新方法[J].复旦学报（自然科学版）,2005,44(1):197-200. 被引量：16
2于明,袁玉倩,董浩,王哲.一种基于MFCC和LPCC的文本相关说话人识别方法[J].计算机应用,2006,26(4):883-885. 被引量：14
3CAMBELL J P. Speaker recognition: a tutorial [ J]. Proceedings of the IEEE, 1997, 185(9) : 1437 - 1462.
4DAVIS S B, MERMELSTEIN P. Comparison of parametric repre- sentations for monosyllabic word recognition in continuously spoken sentences [ J]. IEEE Transactions on Acoustics, Speech and Signal Processing, 1980, 28(4) : 357 - 365.
5QIAN ZHEN, LIU LI-YAN, LI XUE-YAO. Speaker identification based on MFCC and IMFCC [ C]//ICISE: Proceedings of 2009 the 1st International Conference on Information Science and Engineer- ing. Piscataway, NJ: IEEE Press, 2009:5416 - 5419.
6FISHER R A. The use of multiple measurements in taxonomic prob- lems [J]. Annals of Eugenics, 1936, 7(1) : 179 - 188.
7ZHU JIAN-WEI, SUN SI-IUI-FA, DAN ZHI-PING, et al. MFCC extraction based on f-ratio and correlated distance criterion in speak- er recognition[ C]// MINES ' 09: Proceedings of the 2009 Interna- tional Conference on Multimedia Information Networking and Securi- ty. Washington, DC: IEEE Computer Society, 2009:329-333.
8RGOUTAM S, SANDIPAN C, SUMAN S. An f-ratio based optimi- zation technique for automatic speaker recognition system [ C]// Proceedings of the IEEE INDICON 2004 India Annual Conference. Piscataway, NJ: IEEE Press, 2005:352-355.
9HU YI, LOIZOU P C. Subjective evaluation and comparison of speech enhancement algorithms [ J]. Speech Communication, 2007, 49(7/8) : 588 - 601.
10SANDIPAN C, ANINDYA R, SOURAV M, et al. Capturing com- plementary information via reversed filter bank and parallel imple- mentation with MFCC for improved text-independent speaker identifi- cation[ C]//Proceedings of the International Conference on Compu- ting: Theory and Applications. Piscataway, NJ: IEEE Press, 2007: 463 - 467.

共引文献185

1邹浩立.基于融合几何特征时空图卷积网络的动作识别[J].计算机系统应用,2022,31(10):261-269. 被引量：1
2闫慧,贾诗威,吴兆桐,李阳,程宇.2022—2023年情报学前沿进展综述[J].情报学进展,2024(1):420-477.
3汪文隽,王亦天,操玮,任思儒.基于多模态投资者情绪数据的USD/CNY汇率波动率预测研究[J].计算机应用研究,2020,37(S02):152-155. 被引量：2
4陶友山.姚桥矿井改扩建工程移交生产[J].煤矿设计,2000(5):11-12.
5鲜晓东,樊宇星.基于Fisher比的梅尔倒谱系数混合特征提取方法[J].计算机应用,2014,34(2):558-561. 被引量：17
6黄锐,陆安江,张正平.一种改进型的MEL滤波器混合特征参数提取方法研究[J].通信技术,2014,47(12):1388-1391. 被引量：2
7史小元,景新幸,曾敏,杨海燕.基于改进PNCC和i-vector的说话人识别鲁棒性[J].计算机工程与设计,2017,38(4):1071-1075. 被引量：3
8董长青,刘永贤,赵甲,胡葳,赵涛.基于深度学习算法的车辆视觉检测方法的研究[J].制造业自动化,2019,41(3):113-116. 被引量：7
9高铭,孙仁诚.基于改进MFCC的说话人特征参数提取算法[J].青岛大学学报（自然科学版）,2019,32(1):61-65. 被引量：11
10李志义,许洪凯,段斌.基于深度学习CNN模型的图像情感特征抽取研究[J].图书情报工作,2019,63(11):96-107. 被引量：24

同被引文献57

1张殿元,余传明.基于知识增强与多模态融合的医疗视觉问答模型[J].数据分析与知识发现,2024,8(8):226-239. 被引量：3
2肖莉,杨传书,费海涛,王玉娟.关于石油工程信息化需求与建设策略的思考[J].石油钻探技术,2011,39(3):81-85. 被引量：28
3马天寿,陈平,黄万志,胡泽.钻井井下工程参数测量仪研究进展[J].断块油气田,2011,18(3):389-392. 被引量：13
4孟小峰,杜治娟.大数据融合研究:问题与挑战[J].计算机研究与发展,2016,53(2):231-246. 被引量：140
5杨红军,张遂安,秦菁,袁玉.基于多源信息融合的煤层气水平井随钻判识技术[J].煤炭科学技术,2016,44(5):100-105. 被引量：6
6汪子豪,秦其明,孙元亨,张添源,任华忠.基于BP神经网络的地表温度空间降尺度方法[J].遥感技术与应用,2018,33(5):793-802. 被引量：12
7钱浩东,温馨,甘红梅,陈思锦,李丰成.井筒工程“大数据”的建立与应用实践[J].钻采工艺,2019,42(2):38-41. 被引量：15
8吴信东,董丙冰,堵新政,杨威.数据治理技术[J].软件学报,2019,30(9):2830-2856. 被引量：194
9ARTUN Emre,KULGA Burak.基于模糊推理的致密砂岩气储集层重复压裂井选择方法[J].石油勘探与开发,2020,47(2):383-389. 被引量：10
10王敏生,光新军.智能钻井技术现状与发展方向[J].石油学报,2020,41(4):505-512. 被引量：81

引证文献4

1张菲菲,王茜,王学迎,余义兵,娄文强,彭冯佳.油气井工程多源多模态数据融合技术与展望[J].天然气工业,2024,44(9):152-166. 被引量：7
2满芳滕,朱艳辉,张志轩,应旭剑,陈豪.基于视觉与文本语义增强的多模态命名实体识别方法[J].湖南工业大学学报,2025,39(1):64-71.
3赖超文.基于AI的多模态沟通设计:整合视觉、听觉与文本信息[J].张江科技评论,2024(9):100-103.
4韩普,李雄.基于增强异构图融合的多模态医学实体识别研究[J].现代情报,2025,45(6):34-45.

二级引证文献7

1王建龙,王越支,邱卫红,于琛,张菲菲,王学迎.基于大数据与融合模型的钻井智能辅助决策系统[J].石油钻探技术,2024,52(5):105-116. 被引量：3
2胡月,魏文澜,李玉强,樊雪儿,程嘉瑞.基于数字孪生的天然气井多源数据融合温度场分析[J].机电工程技术,2025,54(1):102-107.
3廖华林,屈峰涛,许玉强,魏凯.复合模型与模糊推理联合的溢流风险分级评估新方法[J].天然气工业,2025,45(3):140-151.
4冉瑞平,孙长浩,刘长春,王立平,黄凯,穆泽宇.基于PSO-CNN-GRU-Attention的油气井生产监测与数字孪生管控研究[J].油气井测试,2025,34(1):55-61.
5光新军,马广军,闫娜,胡越发,李婧.智慧油气藏数字孪生技术新进展与发展思考[J].世界石油工业,2025,32(2):13-22.
6石祥超,陈帅,肖文强,焦烨,王兆巍.砂岩地层可钻性预测方法:微观结构与矿物组分模型[J].天然气工业,2025,45(4):98-108.
7顿小妹,周海韵,车坚女,张鹏.基于数据挖掘的生产智能预警系统的开发与应用[J].数字技术与应用,2025,43(3):196-198.

1徐连瑞,游雄.任务驱动视角下机器地图现状与发展[J].武汉大学学报（信息科学版）,2024,49(4):609-623. 被引量：2
2吴越,孙海春.基于图神经网络的知识图谱补全研究综述[J].数据分析与知识发现,2024,8(3):10-28. 被引量：5
3宝日彤,孙海春.多文档摘要研究综述[J].数据分析与知识发现,2024,8(2):17-32. 被引量：1
4张雄涛,祝娜,郭玉慧.基于图神经网络的会话推荐方法综述[J].数据分析与知识发现,2024,8(2):1-16. 被引量：2
5王志永,刘晶晶,王新明,陈博文,聂伟,张瀚林,刘洪海.孤独症人工智能诊疗进展及前沿[J].数据与计算发展前沿,2024,6(3):15-27.
6能力巅峰941型的武器与任务应用[J].舰船知识,2023(5):93-95.
7吴欣雨,李涵昱,张智雄,吴振新.科技文献评价中语义新颖性研究综述[J].数据分析与知识发现,2024,8(3):29-40. 被引量：2
8Keiko da Costa Oikawa,Fabrício Bruno Cardoso,Filipe M.Bonone,Samuel Pereira de Souza,Vitor da Silva Loureiro,Alfred Sholl-Franco.Bibliographical Review on Rehabilitation of Executive Functions in Patients With Developmental Coordination Disorder(DCD)[J].Psychology Research,2024,14(2):45-56.
9张志远,张维彦,宋雨秋,阮彤.基于跨层级多视角特征的多语言事件探测[J].计算机科学,2024,51(5):208-215.
10阮光册,钟静涵,张祎笛.基于深度学习的术语识别研究综述[J].数据分析与知识发现,2024,8(4):64-75. 被引量：3

数据分析与知识发现

2024年第4期

浏览历史

内容加载中请稍等...

多模态命名实体识别研究进展被引量：4

参考文献9

二级参考文献60

共引文献185

同被引文献57

引证文献4

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

多模态命名实体识别研究进展 被引量：4

参考文献9

二级参考文献60

共引文献185

同被引文献57

引证文献4

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

多模态命名实体识别研究进展被引量：4