期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
深层次标签辅助分类任务的层次标签文本分类方法 被引量:1
1
作者 曹渝昆 魏子越 +2 位作者 唐艺嘉 金成坤 李云峰 《计算机工程与应用》 CSCD 北大核心 2024年第10期105-112,共8页
层次标签文本分类是自然语言处理领域中一项具有挑战性的任务,每个文档需要被正确分类到对应具有层次结构的多个标签中。然而在标签集中,由于标签包含的语义信息不充分,同时被归类到深层次标签的文档数量过少,深层次标签训练不充分,导... 层次标签文本分类是自然语言处理领域中一项具有挑战性的任务,每个文档需要被正确分类到对应具有层次结构的多个标签中。然而在标签集中,由于标签包含的语义信息不充分,同时被归类到深层次标签的文档数量过少,深层次标签训练不充分,导致显著的标签训练不平衡问题。基于此,提出了深层次标签辅助分类任务的层次标签文本分类方法(DLAC)。该方法提出了一种深层次标签辅助分类器,在标签语义增强的基础上有效利用文本特征与深层次标签对应的父标签结点(即浅层次标签的丰富特征)来提升深层次标签的分类性能。与11种算法在三个数据集上的对比实验结果表明,模型能够有效提升深层次标签的分类性能,并取得良好效果。 展开更多
关键词 层次标签文本分类 标签层次结构 全局标签分类通道 深层次标签辅助分类通道
在线阅读 下载PDF
文档上下文异构表示的句子级关系抽取方法
2
作者 曹渝昆 程宇 +3 位作者 何祯奕 徐康乐 颜家洛 李云峰 《计算机工程》 CAS CSCD 北大核心 2024年第5期111-119,共9页
关系抽取是指从文本中识别2个实体的关系。现有研究利用数据分组处理取得了良好的效果,但由于组内数据之间交互较少,因此大多忽略了组内数据之间的关联。此外,部分方法定义了较多种类的标注信息,从而导致标注信息冗余。针对上述问题,提... 关系抽取是指从文本中识别2个实体的关系。现有研究利用数据分组处理取得了良好的效果,但由于组内数据之间交互较少,因此大多忽略了组内数据之间的关联。此外,部分方法定义了较多种类的标注信息,从而导致标注信息冗余。针对上述问题,提出一种文档上下文异构表示的句子级关系抽取方法。设计基于异构图网络的文档上下文信息模块,将组内数据中的词和关系建模为图上的节点,然后通过消息传递机制将组内信息进行交互,充分表征组内数据间的关联关系;设计基于异构图网络的关系信息模块用于捕捉关系信息,其与文档上下文信息模块中异构图网络参数共享,从而节约了计算资源;设计融合标记策略,引入一种逻辑上的虚拟标签减少标签种类,缓解标注信息冗余问题。实验结果表明,所构建模型在NYT和WebNLG数据集上的F1值分别为93.2%和94.7%,在复杂场景下的8个子任务中,取得了6个子任务的最优表现,验证了所提方法的有效性。 展开更多
关键词 融合标记 异构图网络 单模块单步模型 句子级关系抽取 自然语言处理
在线阅读 下载PDF
基于衰减传播的知识图谱增强推荐系统 被引量:3
3
作者 曹渝昆 方一新 +1 位作者 苗泽宇 李云峰 《计算机工程与应用》 CSCD 北大核心 2023年第10期180-186,共7页
基于知识图谱的推荐方法对于用户兴趣在知识图谱上的传播路径信息利用不足,没有充分考虑不同层次之间的路径传播。针对以上问题,提出基于衰减传播的知识图谱增强推荐系统(enhanced recommendation system based on attenuation propagat... 基于知识图谱的推荐方法对于用户兴趣在知识图谱上的传播路径信息利用不足,没有充分考虑不同层次之间的路径传播。针对以上问题,提出基于衰减传播的知识图谱增强推荐系统(enhanced recommendation system based on attenuation propagation for knowledge graphs,RSAP)。该模型设计基于知识图谱的兴趣图层内传播方法和层间传播方法,利用反映用户兴趣强弱变化的衰减因子,分别沿着知识图谱的不同方向提取用户兴趣表示,使用基于残差块的提纯网络来捕获用户兴趣的焦点,从而得到用于计算推荐得分的最终用户表示,并生成推荐结果。在三个公共知识图谱数据集上的对比实验结果证明,RSAP在多个基准评价指标上取得较好的效果,优于其他对比算法。 展开更多
关键词 推荐系统 知识图谱 衰减传播
在线阅读 下载PDF
结合知识图谱和文本层次结构的词义消歧方法
4
作者 曹渝昆 金成坤 +2 位作者 唐艺嘉 魏子越 李云峰 《计算机工程与应用》 CSCD 北大核心 2023年第14期158-165,共8页
当前带监督的词义消歧模型利用不同词义的注释信息和预训练的语言模型已经得到了较高的消歧结果。但是带监督的词义消歧模型的语义数据需要人工手动标注,使得带监督的词义消歧模型的扩展性较差。提出了一种结合知识图谱和文本层次结构... 当前带监督的词义消歧模型利用不同词义的注释信息和预训练的语言模型已经得到了较高的消歧结果。但是带监督的词义消歧模型的语义数据需要人工手动标注,使得带监督的词义消歧模型的扩展性较差。提出了一种结合知识图谱和文本层次结构的双编码器词义消歧方法,通过引入知识图谱中的结构化知识以补充更多的扩展语义信息,采用上下文输入文本的层次结构描述单词和短语的含义,并构筑基于BERT的双编码器,引入图注意力机制来降低上下文输入文本中的噪声信息,从而提高短语形式目标词的消歧准确率,最终提高方法的消歧效果。通过在5个测试数据集中与最新的9个对比算法的对比,该方法的消歧准确率大都优于对比算法,取得了较好的效果。 展开更多
关键词 词义消歧 知识图谱 BERT 图注意力机制
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部