期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于非平衡损失函数的细粒度多标签专利分类方法研究
1
作者 魏超 毛一雷 +2 位作者 李琳珊 王弋波 李妙钰 《高技术通讯》 北大核心 2025年第4期393-402,共10页
细粒度多标签专利分类方法面临非平衡专利分类标签,导致分类精度退化。为此,本文聚焦基于深度学习的多标签文本分类方法,将非平衡损失函数作为分类器的目标函数,然后通过基于深度学习的微调训练进行分类器最优化求解,引导分类器对非平... 细粒度多标签专利分类方法面临非平衡专利分类标签,导致分类精度退化。为此,本文聚焦基于深度学习的多标签文本分类方法,将非平衡损失函数作为分类器的目标函数,然后通过基于深度学习的微调训练进行分类器最优化求解,引导分类器对非平衡类别进行再平衡,缓解标签非平衡问题。选择2017-2022年“光伏”领域的英文专利构建实验数据集进行实证,最佳微平均F1值为0.4969,宏平均F1值为0.3329,汉明损失为0.1745,相比于基于二元交叉熵(binary cross entropy,BCE)模型,分别提升25%、80%和8%。实验结果表明,该方法实现了面向“大组/小组”级多标签专利分类,改善了多标签分类的整体效果,提升了少样本类别效果。 展开更多
关键词 多标签专利分类 深度学习 非平衡损失函数
在线阅读 下载PDF
基于文本及历史数据的多标签专利分类算法研究 被引量:2
2
作者 徐雪洁 王宝会 《计算机科学》 CSCD 北大核心 2024年第5期172-178,共7页
专利分类是专利数据挖掘领域一项非常重要的任务,该任务的目标是为给定专利文献分配若干个国际专利分类(IPC)号,近几年针对该任务的很多研究都集中在通过挖掘专利文本表示对IPC分类体系中部级或大类级分类号的多分类预测。而实际场景中... 专利分类是专利数据挖掘领域一项非常重要的任务,该任务的目标是为给定专利文献分配若干个国际专利分类(IPC)号,近几年针对该任务的很多研究都集中在通过挖掘专利文本表示对IPC分类体系中部级或大类级分类号的多分类预测。而实际场景中,一篇专利往往有多个分类号,是一种多标签分类任务,且除了专利的文本内容外,每个专利都有对应的专利权组织,专利权组织的历史专利申请行为会有一定的业务倾向,这种申请行为的偏好表示能有效提高专利分类准确度。然而,目前专利分类的相关研究中并没有充分利用到专利的历史数据,针对IPC体系小类的多标签分类问题,提出了一个综合考虑专利内容的专利自动分类模型。首先用BERT预训练语言模型初始化专利文本表示,再利用Text-CNN捕捉局部特征获得将其输出作为专利文本的最终表示;其次,通过Bi-LSTM对历史专利文本及专利标签进行双通道聚合,学习该组织的历史专利申请行为表示;最后,将专利的文本表示与历史专利申请行为表示进行融合后做预测。在真实专利数据集上,将所提模型与基于专利文本挖掘的不同基线进行了对比实验,结果表明基于专利文本和历史数据建模的深度学习分类算法在精确度上有很大的提升。 展开更多
关键词 深度学习 多标签专利自动分类 IPC分类 专利
在线阅读 下载PDF
基于图注意力网络的多标签专利分类方法 被引量:1
3
作者 谭晏松 宋铁成 《计算机应用与软件》 北大核心 2023年第11期194-200,共7页
针对当前大多数基于特征工程和机器学习的专利分类方法存在准确性低以及泛化能力差的问题,提出一种基于注意力感知深度学习模型的多标签专利分类方法。该文将输入数据表示为文本图的形式,并利用图注意力卷积网络学习构建的文本图,并通... 针对当前大多数基于特征工程和机器学习的专利分类方法存在准确性低以及泛化能力差的问题,提出一种基于注意力感知深度学习模型的多标签专利分类方法。该文将输入数据表示为文本图的形式,并利用图注意力卷积网络学习构建的文本图,并通过引入BiLSTM层作为新的聚合函数来表征文本图各节点的差异性和代表的语义信息设计了一个非局部二阶注意层用于捕捉专利文档中的远程和细粒度的语义信息,消除因国际专利分类标签跨域引起的语义模糊;使用Softmax分类器来完成多标签专利的分类任务。所提方法在多标签专利分类任务具有良好的分类精度,相对于其他分类方法,性能有所提高。 展开更多
关键词 多标签专利分类 深度学习 图注意力卷积网络 非局部二阶注意力
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部