期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
面向长尾分布的民众诉求层次多标签分类模型
1
作者 刘昕 杨大伟 +3 位作者 邵长恒 王海文 庞铭江 李艳茹 《计算机应用》 北大核心 2025年第1期82-89,共8页
接诉即办是实现社会治理智能化、提高人民满意度的重要举措,其中精准分析民众诉求智能匹配工单处理部门,实现诉求的快速响应、高效办理尤为关键;然而,民众诉求数据中的诉求描述不清晰、类别混淆且比例失衡会导致诉求类别分析困难,影响... 接诉即办是实现社会治理智能化、提高人民满意度的重要举措,其中精准分析民众诉求智能匹配工单处理部门,实现诉求的快速响应、高效办理尤为关键;然而,民众诉求数据中的诉求描述不清晰、类别混淆且比例失衡会导致诉求类别分析困难,影响了智能派单的效率与准确性。针对上述问题,提出编解码器结构的诉求层次多标签分类模型(HMCHotline)。首先,在文本编码器中引入诉求领域中的细粒度关键词先验知识以抑制噪声干扰,并融合诉求的时空信息提高语义特征的判别力;其次,利用标签层次结构生成具有层次与语义感知的标签嵌入,并构建基于Transformer模型的标签解码器,利用诉求的语义特征和标签嵌入进行标签解码;同时,在标签的层级依赖关系基础上引入动态标签表策略限制标签的解码范围,以解决标签不一致问题;最后,采用Softmax分组策略将样本数量相近的标签类别分为同组进行Softmax操作,从而缓解由标签长尾分布导致的分类准确率低的问题。在Hotline、RCV1(Reuters Corpus VolumeⅠ)-v2和WOS(Web Of Science)数据集上的实验结果表明,相较于层次感知的标签语义匹配网络(HiMatch),所提模型的Micro-F1分别提高了1.65、2.06和0.43个百分点,验证了模型的有效性。 展开更多
关键词 接诉即办 智能派单 层次多标签分类 先验知识 长尾分布 编解码器
在线阅读 下载PDF
基于多尺度特征提取的层次多标签文本分类方法 被引量:1
2
作者 武子轩 王烨 于洪 《郑州大学学报(理学版)》 CAS 北大核心 2025年第2期24-30,共7页
针对现有的特征提取方法忽略文本局部和全局联系的问题,提出了基于多尺度特征提取的层次多标签文本分类方法。首先,设计了多尺度特征提取模块,对不同尺度特征进行捕捉,更好地表示文本语义。其次,将层次特征嵌入文本表示中,得到具有标签... 针对现有的特征提取方法忽略文本局部和全局联系的问题,提出了基于多尺度特征提取的层次多标签文本分类方法。首先,设计了多尺度特征提取模块,对不同尺度特征进行捕捉,更好地表示文本语义。其次,将层次特征嵌入文本表示中,得到具有标签特征的文本语义表示。最后,在标签层次结构的指导下对输入文本构建正负样本,进行对比学习,提高分类效果。在WOS、RCV1-V2、NYT和AAPD数据集上进行对比实验,结果表明,所提模型在评价指标上表现出色,超过了其他主流模型。此外,针对层次分类提出层次Micro-F 1和层次Macro-F 1指标,并对模型效果进行了评价。 展开更多
关键词 层次多标签文本分类 多尺度特征提取 对比学习 层次Micro-F 1 层次Macro-F 1
在线阅读 下载PDF
层次多标签文本分类方法 被引量:12
3
作者 赵海燕 曹杰 +1 位作者 陈庆奎 曹健 《小型微型计算机系统》 CSCD 北大核心 2022年第4期673-683,共11页
现实世界的大量应用,比如文档归类、网页分类、专利分类等,其类别信息(标签)是一个具有层次关系的体系,对它们进行自动分类涉及到在此层次标签体系中选择多个正确的标签,因此形成了一类层次多标签文本分类问题.如何学习和利用这些不同... 现实世界的大量应用,比如文档归类、网页分类、专利分类等,其类别信息(标签)是一个具有层次关系的体系,对它们进行自动分类涉及到在此层次标签体系中选择多个正确的标签,因此形成了一类层次多标签文本分类问题.如何学习和利用这些不同层级的关系、并对分类结果从层级关系遵循性的角度进行评价成为层次多标签分类问题的难点和挑战.本文对层次多标签文本分类的研究现状进行了系统化的总结.目前的方法从是否使用层次结构可以分为平面方法和层次方法,而层次方法又可以分为局部方法、全局方法和混合方法.这些方法包含了使用不同技术的多种模型.文中还分析了层次多标签文本分类任务的挑战和难点,并对本领域未来的研究方向进行了展望. 展开更多
关键词 层次多标签 文本分类 层次结构 文本表示
在线阅读 下载PDF
面向泛娱乐文本的层次多标签分类方法
4
作者 陈若愚 刘秀磊 于汝意 《计算机应用与软件》 北大核心 2023年第1期60-65,共6页
针对泛娱乐领域文本情报预测类别标签具备有向无环图(DAG)结构的特点,提出一种考虑标签层次结构的基于最优路径层次多标签分类方法。根据现有标签构建DAG结构并将其转化为较易处理的树形结构;采用局部策略为树形结构中每个节点分别训练... 针对泛娱乐领域文本情报预测类别标签具备有向无环图(DAG)结构的特点,提出一种考虑标签层次结构的基于最优路径层次多标签分类方法。根据现有标签构建DAG结构并将其转化为较易处理的树形结构;采用局部策略为树形结构中每个节点分别训练基分类器,同时为每个节点设置贡献值,贡献值由分类器输出概率与层次权重组合而成,贡献值大于阈值时该节点设置为1,否则为0;对树形结构进行深度优先遍历生成路径,计算各路径得分,选择满足层次约束并得分最高的路径作为最终预测集合。在泛娱乐公开文本信息数据集上进行了4组实验,结果表明该方法相较于分类器链、二元分析、SVM多标签分类和MLKNN算法,分类效果更优。 展开更多
关键词 层次多标签分类 最优路径 有向无环图结构 树形结构
在线阅读 下载PDF
科技资源文本层次多标签分类方法 被引量:5
5
作者 王岳 李雅文 李昂 《计算机工程与应用》 CSCD 北大核心 2023年第13期92-98,共7页
科技资源文本层次多标签分类(hierarchical multi-label text classification,HMTC)用于将科技资源文本分配到一个具有层级结构的标签体系中。提出基于注意力机制的科技资源文本层次多标签分类算法(academic resource text hierarchical... 科技资源文本层次多标签分类(hierarchical multi-label text classification,HMTC)用于将科技资源文本分配到一个具有层级结构的标签体系中。提出基于注意力机制的科技资源文本层次多标签分类算法(academic resource text hierarchical multi-label classification based on attention,AHMCA)。通过整合文本、关键词、层次结构等特征构造注意力机制层,对HMCN-F(hierarchical multi-label classification network-feed-forward)网络进行改进,将科技资源文档逐级分类到最相关的类别中。细节上,主要利用word2vec与BiLSTM来获得文本、关键词、层次结构的嵌入向量和隐向量表示;利用层次注意力机制捕获关键词、标签层次结构与文本词向量之间的关联关系来强化重点词向量的权重,从而生成特定于层级的文档嵌入向量,替代HMCN-F中原始的文本嵌入。实验结果验证了AHMCA方法的有效性。 展开更多
关键词 层次多标签分类 注意力机制 BiLSTM word2vec
在线阅读 下载PDF
基于多标签层次聚类的GPR图像双曲波提取方法 被引量:3
6
作者 李文生 原达 +1 位作者 苗翠 王冬雨 《图学学报》 CSCD 北大核心 2020年第3期399-408,共10页
探地雷达(GPR)图像双曲波提取是分析地下目标位置和结构的重要方法,但在真实环境中,由于噪声和杂波的干扰,使得提取出的双曲波存在结构不完整、碎片化和形状异常等问题,不利于数据分析和三维建模等后续操作。为此,提出了一种基于多标签... 探地雷达(GPR)图像双曲波提取是分析地下目标位置和结构的重要方法,但在真实环境中,由于噪声和杂波的干扰,使得提取出的双曲波存在结构不完整、碎片化和形状异常等问题,不利于数据分析和三维建模等后续操作。为此,提出了一种基于多标签层次聚类的双曲波提取方法(MHCE)。首先通过信息熵评价像素邻域的稳定性,构造了基于信息熵的距离度量来进行层次聚类;然后利用聚类后的邻接空间进行多标签聚类以降低杂波和噪声对双曲波提取的影响;最后结合多标签聚类结果的拟合形状和纹理方向提取双曲波。实验表明,该方法对于真实GPR图像双曲波具有较好的鲁棒性,能够获得规范化的双曲波形状和位置参数。 展开更多
关键词 探地雷达图像 双曲波 信息熵 多标签层次聚类 鲁棒性
在线阅读 下载PDF
基于矩阵分解和注意力多任务学习的客服投诉工单分类 被引量:5
7
作者 宋勇 严志伟 +4 位作者 秦玉坤 赵东明 叶晓舟 柴园园 欧阳晔 《电信科学》 2022年第2期103-110,共8页
投诉工单自动分类是通信运营商客服数字化、智能化发展的要求。客服投诉工单的类别有多层,每一层有多个标签,层级之间有所关联,属于典型的层次多标签文本分类问题,现有解决方法大多数基于分类器同时处理所有的分类标签,或者对每一层级... 投诉工单自动分类是通信运营商客服数字化、智能化发展的要求。客服投诉工单的类别有多层,每一层有多个标签,层级之间有所关联,属于典型的层次多标签文本分类问题,现有解决方法大多数基于分类器同时处理所有的分类标签,或者对每一层级分别使用多个分类器进行处理,忽略了层次结构之间的依赖。提出了一种基于矩阵分解和注意力的多任务学习的方法(MF-AMLA),处理层次多标签文本分类任务。在通信运营商客服场景真实投诉工单分类数据下,与该场景常用的机器学习算法和深度学习算法的Top1F1值相比分别最大提高了21.1%和5.7%。已在某移动运营商客服系统上线,模型输出的正确率97%以上,对客服坐席单位时间的处理效率提升22.1%。 展开更多
关键词 层次多标签分类 注意力机制 多任务学习 客服工单分类
在线阅读 下载PDF
基于知识推荐的校园百科平台研究 被引量:1
8
作者 任敏 许玲 +1 位作者 王峰 吴超 《中国科学技术大学学报》 CAS CSCD 北大核心 2020年第8期1072-1076,共5页
2018年中国科学技术大学推出“校园百科”项目,旨在利用智能化技术实现校园文化积累与推广的新途径.“校园百科”的推出是以建设校园文化积累的知识库和校园文化分享平台为目的,用于鼓励师生积极参与校园文化建设,并为师生提供文化信息... 2018年中国科学技术大学推出“校园百科”项目,旨在利用智能化技术实现校园文化积累与推广的新途径.“校园百科”的推出是以建设校园文化积累的知识库和校园文化分享平台为目的,用于鼓励师生积极参与校园文化建设,并为师生提供文化信息智能化检索和个性推荐的服务.为此以中国科学技术大学校园百科建设为背景,重点介绍了校园百科平台建设中所涉及的关键技术(层次多标签分类、智能搜索和协同过滤标签推荐),并展示了校园百科平台的设计架构和主要功能,最后简要介绍了我校校园百科的使用评估. 展开更多
关键词 校园百科 层次多标签分类 全文检索 协同过滤标签推荐
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部