-
题名基于多层语言特征的辞格多标签分类方法研究
- 1
-
-
作者
黄欢
李宝安
张凯
滕尚志
吕学强
-
机构
北京信息科技大学网络文化与数字传播重点实验室
昆明理工大学云南省人工智能重点实验室
-
出处
《中文信息学报》
北大核心
2025年第8期31-41,共11页
-
基金
国家自然科学基金(62171043)
网络文化与数字传播北京市重点实验室开放课题(10522220010001,10520220010001)
国家语委科研项目(ZDI145-63,ZDI145-10)。
-
文摘
多标签辞格自动分类研究深受中文篇章智能评测的密切关注。传统辞格自动识别方法存在仅考虑句子语义忽略字词语义信息,以及仅使用单一类别的标签描述等问题。针对以上两个问题,该文提出了一种联合多层次语法、语义和标签信息的多标签辞格分类模型,该模型利用BERT提取修辞文本的字粒度语义向量,通过句法依存树和图卷积神经网络提取词粒度语法、语义向量并进行交互融合。将字粒度向量表示、词粒度向量表示拼接,并通过自注意力机制捕获两者间的语义信息,利用注意力机制融合文本信息和标签信息实现分类。实验表明,该模型在公开数据集AAPD和构建的辞格数据集CRTD上与其他模型相比具有更好的辞格多标签分类性能,在F1评价指标上分别提升了3%和2%。
-
关键词
多标签分类
辞格识别
句法依存分析
文本标签融合
-
Keywords
multi-label text classification
rhetoric recognition
syntactic dependency analysis
text label fusion
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名一种标签融合驱动的中文医疗实体关系抽取方法
- 2
-
-
作者
陈闯
张维彦
阮彤
郑红
-
机构
华东理工大学信息科学与工程学院
-
出处
《华东理工大学学报(自然科学版)》
北大核心
2025年第2期260-269,共10页
-
基金
上海市促进产业高质量发展专项资金(2021-GZL-RGZN-01018)。
-
文摘
医疗实体关系抽取是推动医疗信息化建设的关键步骤,旨在从医疗文本中抽取结构化的三元组信息。针对现有方法对实体类型标签和关系标签利用不充分的问题,提出了一种标签融合驱动的中文医疗实体关系抽取框架。首先,将实体关系抽取任务拆分成双向的4个命名实体识别任务,并将每个任务的标签替换为头尾实体类型标签和关系标签的融合;其次,设计了三元组构造策略以最大限度利用双向抽取出的三元组;最后,利用三元组双向过滤模型筛选候选三元组。结果表明,该方法相较于GPLinker在F1指标上提升了3.01%。此外,该方法在医疗领域的重叠关系、多三元组和跨句三元组复杂场景中也表现出了优秀的性能。
-
关键词
医疗文本
实体关系抽取
标签融合
双向抽取
三元组过滤模型
-
Keywords
medical text
entity relation extraction
label fusion
bidirectional extraction
triplet filter model
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于标签推理和注意力融合的多标签文本分类方法
被引量:5
- 3
-
-
作者
田雨薇
张智
-
机构
武汉科技大学计算机科学与技术学院
武汉科技大学大数据科学与工程研究院
湖北省智能信息处理与实时工业系统重点实验室
-
出处
《计算机应用研究》
CSCD
北大核心
2022年第11期3315-3319,3326,共6页
-
基金
国家自然科学基金资助项目(61673304)
国家社会科学基金重大计划资助项目(11&ZD189)。
-
文摘
目前许多多标签文本分类方法主要关注文档表示,而丢失了大量标签相关的语义信息,导致分类效果不理想。针对以上问题,提出一种基于标签推理和注意力融合的分类方法,挖掘文档中与标签相关的特征以及相似标签之间的相关性,学习标签信息进行标签推理,同时采用注意力机制自学习地融合文档表示和标签表示,最终完成多标签分类任务。在AAPD和RCV1-V2数据集上进行实例验证,该方法的F_(1)值分别达到了0.732和0.887,与其他最新方法相比其准确度均有提升,实验结果证明了标签推理和注意力融合策略的有效性。
-
关键词
标签推理
注意力融合
多标签文本分类
-
Keywords
label reasoning
attention fusion
multi-label text classification
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名采用标签组合与融合注意力的多标签文本分类
被引量:1
- 4
-
-
作者
邬鑫珂
孙俊
李志华
-
机构
江南大学人工智能与计算机学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2023年第6期125-133,共9页
-
基金
国家自然科学基金(U1836218,61672263)。
-
文摘
传统的多标签文本分类算法在挖掘标签的关联信息和提取文本与标签之间的判别信息过程中存在不足,由此提出一种基于标签组合的预训练模型与多粒度融合注意力的多标签文本分类算法。通过标签组合的预训练模型训练得到具有标签关联性的文本编码器,使用门控融合策略融合预训练语言模型和词向量得到词嵌入表示,送入预训练编码器中生成基于标签语义的文本表征。通过自注意力和多层空洞卷积增强的标签注意力分别得到全局信息和细粒度语义信息,自适应融合后输入到多层感知机进行多标签预测。在特定威胁识别数据集和两个通用多标签文本分类数据集上的实验结果表明,提出的方法在能够有效捕捉标签与文本之间的关联信息,并在F1值、汉明损失和召回率上均取得了明显提升。
-
关键词
多标签文本分类
融合注意力机制
空洞卷积
-
Keywords
multi-label text classification
fusion attention mechanism
dilation convolution
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-