基于关联信息增强与关系平衡的场景图生成方法被引量：1

Scene graph generation method based on association information enhancement and relationship balance

在线阅读下载PDF

导出

摘要利用场景图的上下文信息可以帮助模型理解目标之间的关联作用;然而,大量不相关的目标可能带来额外噪声,进而影响信息交互,造成预测偏差。在嘈杂且多样的场景中,即使几个简单的关联目标,也足够推断目标所处的环境信息,并消除其他目标的歧义信息。此外,在面对真实场景中的长尾偏差数据时,场景图生成(SGG)的性能难以令人满意。针对上下文信息增强和预测偏差的问题,提出一种基于关联信息增强与关系平衡的SGG(IERB)方法。IERB方法采用一种二次推理结构,即根据有偏场景图的预测结果重新构建不同预测视角下的关联信息并平衡预测偏差。首先,聚焦不同视角下的强相关目标以构建上下文关联信息;其次,利用树型结构的平衡策略增强尾部关系的预测能力;最后,采用一种预测引导方式在已有场景图的基础上预测优化。在通用的数据集Visual Genome上的实验结果表明,与3类基线模型VTransE(Visual Translation Embedding network)、Motif和VCTree(Visual Context Tree)相比,所提方法在谓词分类(PredCls)任务下的均值召回率mR@100分别提高了11.66、13.77和13.62个百分点,验证了所提方法的有效性。 Utilizing contextual information of scene graphs can help models understand the correlation effect among targets.However,a large number of unrelated targets may introduce additional noise,affecting information interaction and causing prediction biases.In noisy and diverse scenes,even a few simple associated targets are sufficient to infer environmental information of the target and eliminate ambiguity information of other targets.In addition,Scene Graph Generation(SGG)faces challenges when dealing with long-tailed biased data in real-world scenarios.To address the problems of contextual information optimization and prediction biases,an association Information Enhancement and Relationship Balance based SGG(IERB)method was proposed.In IERB method,a secondary reasoning structure was employed according to biased scene graph prediction results,to reconstruct association information under different prediction angles of view and balance the prediction biases.Firstly,strongly correlated targets from different angles of view were focused on to construct the contextual association information.Secondly,the prediction capability for tail relationships was enhanced using a balancing strategy of tree structure.Finally,a prediction-guided approach was used to optimize predictions based on the existing scene graph.Experimental results on Visual Genome dataset show that compared with three baseline models Visual Translation Embedding network(VTransE),Motif,and Visual Context Tree(VCTree),the proposed method improves the mean Recall mR@100 in the Predicate Classification(PredCls)task by 11.66,13.77 and 13.62 percentage points,respectively,demonstrating the effectiveness of the proposed method.

作者李林昊韩冬董永峰李英双王振 LI Linhao;HAN Dong;DONG Yongfeng;LI Yingshuang;WANG Zhen(School of Artificial Intelligence,Hebei University of Technology,Tianjin 300401,China;Hebei Province Key Laboratory of Big Data Computing(Hebei University of Technology),Tianjin 300401,China;Hebei Data Driven Industrial Intelligent Engineering Research Center(Hebei University of Technology),Tianjin 300401,China)

机构地区河北工业大学人工智能与数据科学学院河北省大数据计算重点实验室(河北工业大学) 河北省数据驱动工业智能工程研究中心(河北工业大学)

出处《计算机应用》北大核心 2025年第3期953-962,共10页 journal of Computer Applications

基金国家自然科学基金资助项目(62306103)。

关键词场景图生成信息增强有偏预测关系平衡预测优化 Scene Graph Generation(SGG) information enhancement biased prediction relationship balancing prediction optimization

分类号 TP391.41 [自动化与计算机技术—计算机应用技术] TP18 [自动化与计算机技术—控制理论与控制工程]

作者简介李林昊(1989-),男,山东威海人,副教授,博士,CCF会员,主要研究方向:机器学习、计算机视觉、知识推理;韩冬(1998-),男,黑龙江齐齐哈尔人,硕士研究生,主要研究方向:机器学习、计算机视觉;通信作者:董永峰(1977-),男,河北定州人,教授,博士,CCF会员,主要研究方向:人工智能、计算机视觉、智能信息处理,电子邮箱dongyf@hebut.edu.cn;李英双(1986-),女,河北衡水人,工程师,硕士,主要研究方向:人工智能;王振(1989-),男,河北唐山人,副教授,博士,主要研究方向:机器学习、计算机视觉、可信学习。

引文网络
相关文献

同被引文献2

1段静雯,闵卫东,杨子元,张煜,陈鑫浩,杨升宝.提取全局语义信息的场景图生成算法[J].中国图象图形学报,2022,27(7):2214-2225. 被引量：3
2王立春,付芳玉,徐凯,徐洪波,尹宝才.基于双分支多头注意力的场景图生成方法[J].北京工业大学学报,2024,50(10):1198-1205. 被引量：1

引证文献1

1李俊良,吕诗融,李炜.基于Transformer架构的端到端粗-精网络场景图生成方法[J].工程科学与技术,2025,57(5):344-354.

1王立春,付芳玉,徐凯,徐洪波,尹宝才.基于双分支多头注意力的场景图生成方法[J].北京工业大学学报,2024,50(10):1198-1205. 被引量：1
2陈林,王化笛.人工智能时代教育数字化转型:出场语境、内涵特征及其实现路径[J].基础教育,2024,21(5):49-61. 被引量：2
3杨文恺.大数据智能化基础网络架构设计[J].上海信息化,2025(2):39-42.
4王立春,付芳玉,徐凯,徐洪波,尹宝才.区域敏感的场景图生成方法[J].北京工业大学学报,2025,51(1):51-58.
5孙玲杰.金融手段在我国地方财政管理中的应用探析[J].科技与金融,2025(1):114-117.
6涂春华.以“真课”育“真人”——小学数学“真实课堂”的实践探索[J].华夏教师,2025(3):103-104.
7田辉.韩国语教育中终结词尾分布的表述方法——以分析《新经典韩国语精读教程》教材为例[J].中国朝鲜语文,2024(3):50-57.
8刘雅兰,单晓艳.素养导向下小学数学教学目标设计的思考与实践——以“平行四边形的面积”为例[J].黑龙江教育(教育与教学),2025(2):28-30.
9Xiaomin Wang,Di Zhou,Xiao Zhuang,Jian Ge,and Jiawei Xiang.SGG-DGCN:Wind Turbine Anomaly Identification by Using Deep Graph Convolutional Networks with Similarity Graph Generation Strategy[J].Journal of Dynamics, Monitoring and Diagnostics,2024,3(4):258-267.
10刘青梅.改良与延续:石破政府“令和的日本列岛改造计划”政策分析及展望[J].现代日本经济,2025,44(2):1-11.

计算机应用

2025年第3期

浏览历史

内容加载中请稍等...

基于关联信息增强与关系平衡的场景图生成方法被引量：1

同被引文献2

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于关联信息增强与关系平衡的场景图生成方法 被引量：1

同被引文献2

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于关联信息增强与关系平衡的场景图生成方法被引量：1