-
题名基于标签层次结构的视觉关系检测模型
- 1
-
-
作者
王元龙
雷鸣
王智强
张虎
李茹
梁吉业
-
机构
山西大学计算机与信息技术学院
山西大学计算智能与中文信息处理教育部重点实验室
-
出处
《电子学报》
EI
CAS
CSCD
北大核心
2023年第12期3496-3506,共11页
-
基金
国家重点研发计划(No.2020AAA0106100)
国家自然科学基金(No.62176145)。
-
文摘
视觉关系检测是在目标识别的基础上,进一步检测出目标之间的关系,属于视觉理解和推理的关键技术.然而,由于关系标签视觉上的相似性以及数据不平衡问题造成少样本的尾部关系检测召回率较低.为了提高尾部关系的检测效果,本文将关系标签进行粗细粒度划分构建了标签的层次结构表示,提出了基于标签层次结构的视觉关系检测模型.模型利用视觉关系之间的相似性以及数据带有的偏见性构建关系标签的层次结构表示,以此将关系区分为粗粒度关系和细粒度关系,使尾部关系在由粗粒度到细粒度的结构上获得更多的关注.同时,针对标签层次结构的性质设计其损失函数,该损失函数通过结构化信息逐层学习不同类别关系之间的差异,使模型更好的检测尾部细粒度关系.分别在公开数据集Visual Relationship Detection(VRD)和Visual Genome(VG)中验证了本文模型检测尾部关系的效果.与现有模型相比,在VRD数据集中平均召回率mR@20、mR@50和mR@100分别提高了0.62%、1.57%和2.47%;在VG数据集中,mR@20、mR@50和mR@100分别提高了0.67%、0.83%和1.15%.
-
关键词
视觉关系检测
标签层次结构表示
长尾分布
粗粒度关系
细粒度关系
-
Keywords
visual relationship detection
tag hierarchical representation
long-tailed distributions
coarse-grained relationship
fine-grained relationship
-
分类号
TP391.7
[自动化与计算机技术—计算机应用技术]
-
-
题名深层次标签辅助分类任务的层次标签文本分类方法
被引量:1
- 2
-
-
作者
曹渝昆
魏子越
唐艺嘉
金成坤
李云峰
-
机构
上海电力大学计算机科学与技术学院
中国商飞上海航空工业(集团)有限公司信息中心
-
出处
《计算机工程与应用》
CSCD
北大核心
2024年第10期105-112,共8页
-
基金
国家自然科学基金青年基金(61802249)。
-
文摘
层次标签文本分类是自然语言处理领域中一项具有挑战性的任务,每个文档需要被正确分类到对应具有层次结构的多个标签中。然而在标签集中,由于标签包含的语义信息不充分,同时被归类到深层次标签的文档数量过少,深层次标签训练不充分,导致显著的标签训练不平衡问题。基于此,提出了深层次标签辅助分类任务的层次标签文本分类方法(DLAC)。该方法提出了一种深层次标签辅助分类器,在标签语义增强的基础上有效利用文本特征与深层次标签对应的父标签结点(即浅层次标签的丰富特征)来提升深层次标签的分类性能。与11种算法在三个数据集上的对比实验结果表明,模型能够有效提升深层次标签的分类性能,并取得良好效果。
-
关键词
层次标签文本分类
标签层次结构
全局标签分类通道
深层次标签辅助分类通道
-
Keywords
hierarchical label text classification
label hierarchy
global label classification channel
deep label assisted clas-sification channel
-
分类号
TP311.1
[自动化与计算机技术—计算机软件与理论]
-