期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
基于GoGCN的软件系统类交互关系预测 被引量:2
1
作者 何鹏 卫操 +2 位作者 吕晟凯 曾诚 李兵 《软件学报》 EI CSCD 北大核心 2023年第11期5029-5041,共13页
软件系统是一个复杂的人工制品,类之间的交互关系对软件质量有着潜在影响,如软件缺陷的级联传播效应就是一个典型.如何准确预测软件系统中类之间合理关系,优化设计结构是软件质量保障的一个开放问题.从软件网络观的视角,综合考虑软件系... 软件系统是一个复杂的人工制品,类之间的交互关系对软件质量有着潜在影响,如软件缺陷的级联传播效应就是一个典型.如何准确预测软件系统中类之间合理关系,优化设计结构是软件质量保障的一个开放问题.从软件网络观的视角,综合考虑软件系统中类与类之间关系(外部图),以及每个类内部方法之间关系(内部图),将软件系统抽象成一个图中图结构的软件网络,并在此基础上提出一种基于图中图卷积神经网络的类交互关系预测方法.首先对每个类内部图进行卷积得到类节点的初始特征,再通过外部图的卷积更新类节点的表征向量,最后通过计算类节点对的评估值进行交互预测.根据在6个Java开源项目上的实验结果显示,图中图结构有助于提高软件系统结构的表征能力,且所提方法与常规网络嵌入方法相比,AUC值和AP值的平均增长率超过5.5%.与此同时,和两种同行方法相比,AUC值和AP值的平均增长率分别在9.36%和5.22%以上. 展开更多
关键词 软件网络 图中图 图神经网络 链路预测 软件质量
在线阅读 下载PDF
基于知识增强和提示学习的小样本新闻主题分类方法 被引量:3
2
作者 余新言 曾诚 +2 位作者 王乾 何鹏 丁晓玉 《计算机应用》 CSCD 北大核心 2024年第6期1767-1774,共8页
基于预训练微调的分类方法通常需要大量带标注的数据,导致无法应用于小样本分类任务。因此,针对中文小样本新闻主题分类任务,提出一种基于知识增强和提示学习的分类方法KPL(Knowledge enhancement and Prompt Learning)。首先,利用预训... 基于预训练微调的分类方法通常需要大量带标注的数据,导致无法应用于小样本分类任务。因此,针对中文小样本新闻主题分类任务,提出一种基于知识增强和提示学习的分类方法KPL(Knowledge enhancement and Prompt Learning)。首先,利用预训练模型在训练集上学习最优的提示模板;其次,将提示模板与输入文本结合,使分类任务转化为完形填空任务;同时利用外部知识扩充标签词空间,丰富标签词的语义信息;最后,对预测的标签词与原始的标签进行映射。通过在THUCNews、SHNews和Toutiao这3个新闻数据集上进行随机采样,形成小样本训练集和验证集进行实验。实验结果表明,所提方法在上述数据集上的1-shot、5-shot、10-shot和20-shot任务上整体表现有所提升,尤其在1-shot任务上提升效果突出,与基线小样本分类方法相比,准确率分别提高了7.59、2.11和3.10个百分点以上,验证了KPL在小样本新闻主题分类任务上的有效性。 展开更多
关键词 新闻主题分类 提示学习 知识增强 小样本学习 文本分类
在线阅读 下载PDF
基于RoBERTa-RCNN和注意力池化的新闻主题文本分类 被引量:4
3
作者 王乾 曾诚 +2 位作者 何鹏 张海丰 余新言 《郑州大学学报(理学版)》 CAS 北大核心 2024年第2期43-50,共8页
针对中文新闻主题因缺乏上下文信息而造成语义模糊和用词规范性不高的问题,提出一种基于RoBERTa-RCNN和多头注意力池化机制的新闻主题文本分类方法。利用数据增强技术对部分训练数据进行回译处理,再通过自编码预训练模型和RCNN对文本进... 针对中文新闻主题因缺乏上下文信息而造成语义模糊和用词规范性不高的问题,提出一种基于RoBERTa-RCNN和多头注意力池化机制的新闻主题文本分类方法。利用数据增强技术对部分训练数据进行回译处理,再通过自编码预训练模型和RCNN对文本进行初步和深度的特征提取,并结合多头注意力思想改进最大池化层。该方法采用融合机制,改善了RCNN中最大池化策略单一和无法进行动态优化的缺陷。在三个新闻主题数据集上进行实验,使用更适用于新闻主题分类的Mish函数代替ReLU函数,并利用标签平滑来解决过拟合问题。结果表明,所提方法相比传统分类方法效果突出,并通过消融实验验证了模型在分类任务上的可行性。 展开更多
关键词 预训练语言模型 文本分类 循环卷积神经网络 注意力机制 标签平滑 数据增强
在线阅读 下载PDF
基于会话的多粒度图神经网络推荐模型 被引量:14
4
作者 任俊伟 曾诚 +2 位作者 肖丝雨 乔金霞 何鹏 《计算机应用》 CSCD 北大核心 2021年第11期3164-3170,共7页
基于会话的推荐旨在根据当前用户的匿名会话的点击序列信息来预测用户的下一次点击行为。现有方法多数都是通过对用户会话点击序列的物品信息进行建模,并学习物品的向量表示,进而进行推荐。而作为一种粗粒度的信息,物品的类别信息对物... 基于会话的推荐旨在根据当前用户的匿名会话的点击序列信息来预测用户的下一次点击行为。现有方法多数都是通过对用户会话点击序列的物品信息进行建模,并学习物品的向量表示,进而进行推荐。而作为一种粗粒度的信息,物品的类别信息对物品有聚合作用,可作为物品信息的重要补充。基于此,提出了基于会话的多粒度图神经网络推荐模型(SRMGNN)。首先,使用图神经网络(GNN)得到会话序列中的物品和物品类别的嵌入向量表示,并使用注意力网络捕捉用户的注意力信息;然后,将赋予了不同注意力权重值的物品和物品类别信息进行融合后,输入到门限循环单元(GRU)里;最后,通过GRU学习会话序列的物品时序信息,并给出推荐列表。在公开的Yoochoose数据集和Diginetica数据集上进行实验,实验结果验证了该模型在增加了物品类别信息后的优势,且实验结果表明了在Precision@20和MRR@20这2种评价指标上,该模型相较于短期注意力/记忆优先级(STAMP)模型、神经注意力(NARM)模型、GRU4REC等8种模型均有更好的效果。 展开更多
关键词 基于会话的推荐 多粒度 推荐模型 图神经网络 点击序列
在线阅读 下载PDF
结合广义自回归预训练语言模型与循环卷积神经网络的文本情感分析方法 被引量:10
5
作者 潘列 曾诚 +3 位作者 张海丰 温超东 郝儒松 何鹏 《计算机应用》 CSCD 北大核心 2022年第4期1108-1115,共8页
传统的机器学习方法在对网络评论文本进行情感极性分类时,未能充分挖掘语义信息和关联信息,而已有的深度学习方法虽能提取语义信息和上下文信息,但该过程往往是单向的,在获取评论文本的深层语义信息过程中存在不足。针对以上问题,提出... 传统的机器学习方法在对网络评论文本进行情感极性分类时,未能充分挖掘语义信息和关联信息,而已有的深度学习方法虽能提取语义信息和上下文信息,但该过程往往是单向的,在获取评论文本的深层语义信息过程中存在不足。针对以上问题,提出了一种结合广义自回归预训练语言模型(XLNet)与循环卷积神经网络(RCNN)的文本情感分析方法。首先,利用XLNet对文本进行特征表示,并通过引入片段级递归机制和相对位置信息编码,充分利用了评论文本的语境信息,从而有效提升了文本特征的表达能力;然后,利用RCNN对文本特征进行双向训练,并在更深层次上提取文本的上下文语义信息,从而提升了在情感分析任务中的综合性能。所提方法分别在三个公开数据集weibo-100k、waimai-10k和ChnSentiCorp上进行了实验,准确率分别达到了96.4%、91.8%和92.9%。实验结果证明了所提方法在情感分析任务中的有效性。 展开更多
关键词 评论文本 情感分析 XLNet 片段级递归机制 循环卷积神经网络
在线阅读 下载PDF
基于混合注意力模型的阴影检测方法 被引量:3
6
作者 谭道强 曾诚 +1 位作者 乔金霞 张俊 《计算机应用》 CSCD 北大核心 2021年第7期2076-2081,共6页
图像中阴影区域的存在会导致图像内容的不确定性,不利于其他计算机视觉任务,因此常将阴影检测作为计算机视觉算法的预处理过程。然而,现有的阴影检测算法大多采用多级网络结构,导致模型训练困难,虽然已经提出了一些采用单级网络结构的算... 图像中阴影区域的存在会导致图像内容的不确定性,不利于其他计算机视觉任务,因此常将阴影检测作为计算机视觉算法的预处理过程。然而,现有的阴影检测算法大多采用多级网络结构,导致模型训练困难,虽然已经提出了一些采用单级网络结构的算法,但它们只关注了局部的阴影,忽略了阴影之间的联系。针对该问题,为提升阴影检测的准确率和鲁棒性,提出了基于混合注意力模型的阴影检测方法。首先将预训练后的深层网络ResNext101作为前端特征提取网络,提取图像的基本特征;其次采用双向金字塔结构由浅入深、由深到浅的方式进行特征融合,并提出信息补偿机制减少深层语义信息丢失;然后结合空间注意力和通道注意力提出混合注意力模型进行特征融合,捕捉阴影区域和非阴影区域的差异;最后融合两个方向的预测结果从而得到最终的阴影检测结果。在公开数据集SBU、UCF上对所提方法进行可行性对比实验,结果表明,相较于DSC算法,所提方法的平衡误差率(BER)分别降低了30%和11%,说明它能够较好地抑制阴影错误检测并增强阴影细节。 展开更多
关键词 阴影检测 卷积神经网络 空间注意力 通道注意力 信息补偿机制 双向金字塔结构
在线阅读 下载PDF
结合ALBERT和双向门控循环单元的专利文本分类 被引量:29
7
作者 温超东 曾诚 +1 位作者 任俊伟 张䶮 《计算机应用》 CSCD 北大核心 2021年第2期407-412,共6页
随着专利申请数量的快速增长,对专利文本实现自动分类的需求与日俱增。现有的专利文本分类算法大都采用Word2vec和全局词向量(GloVe)等方式获取文本的词向量表示,舍弃了大量词语的位置信息且不能表示出文本的完整语义。针对上述问题,提... 随着专利申请数量的快速增长,对专利文本实现自动分类的需求与日俱增。现有的专利文本分类算法大都采用Word2vec和全局词向量(GloVe)等方式获取文本的词向量表示,舍弃了大量词语的位置信息且不能表示出文本的完整语义。针对上述问题,提出了一种结合ALBERT和双向门控循环单元(BiGRU)的多层级专利文本分类模型ALBERT-BiGRU。该模型使用ALBERT预训练的动态词向量代替传统Word2vec等方式训练的静态词向量,提升了词向量的表征能力;并使用BiGRU神经网络模型进行训练,最大限度保留了专利文本中长距离词之间的语义关联。在国家信息中心公布的专利数据集上进行有效性验证,与Word2vec-BiGRU和GloVe-BiGRU相比,ALBERT-BiGRU的准确率在专利文本的部级别分别提高了9.1个百分点和10.9个百分点,在大类级别分别提高了9.5个百分点和11.2个百分点。实验结果表明,ALBERT-BiGRU能有效提升不同层级专利文本的分类效果。 展开更多
关键词 专利文本 文本分类 ALBERT 双向门控循环单元 词向量
在线阅读 下载PDF
结合BERT和特征投影网络的新闻主题文本分类方法 被引量:23
8
作者 张海丰 曾诚 +3 位作者 潘列 郝儒松 温超东 何鹏 《计算机应用》 CSCD 北大核心 2022年第4期1116-1124,共9页
针对新闻主题文本用词缺乏规范、语义模糊、特征稀疏等问题,提出了结合BERT和特征投影网络(FPnet)的新闻主题文本分类方法。该方法包含两种实现方式:方式1将新闻主题文本在BERT模型的输出进行多层全连接层特征提取,并将最终提取到的文... 针对新闻主题文本用词缺乏规范、语义模糊、特征稀疏等问题,提出了结合BERT和特征投影网络(FPnet)的新闻主题文本分类方法。该方法包含两种实现方式:方式1将新闻主题文本在BERT模型的输出进行多层全连接层特征提取,并将最终提取到的文本特征结合特征投影方法进行提纯,从而强化分类效果;方式2在BERT模型内部的隐藏层中融合特征投影网络进行特征投影,从而通过隐藏层特征投影强化提纯分类特征。在今日头条、搜狐新闻、THUCNews-L、THUCNews-S数据集上进行实验,实验结果表明上述两种方式相较于基线BERT方法在准确率、宏平均F1值上均具有更好的表现,准确率最高分别为86.96%、86.17%、94.40%和93.73%,验证了所提方法的可行性和有效性。 展开更多
关键词 预训练语言模型 文本分类 新闻主题 BERT 特征投影网络
在线阅读 下载PDF
基于ALBERT-CRNN的弹幕文本情感分析 被引量:24
9
作者 曾诚 温超东 +2 位作者 孙瑜敏 潘列 何鹏 《郑州大学学报(理学版)》 北大核心 2021年第3期1-8,共8页
提出一种结合ALBERT预训练语言模型与卷积循环神经网络(convolutional recurrent neural network,CRNN)的弹幕文本情感分析模型ALBERT-CRNN。首先使用ALBERT预训练语言模型获取弹幕文本的动态特征表示,使得句子中同一个词在不同上下文... 提出一种结合ALBERT预训练语言模型与卷积循环神经网络(convolutional recurrent neural network,CRNN)的弹幕文本情感分析模型ALBERT-CRNN。首先使用ALBERT预训练语言模型获取弹幕文本的动态特征表示,使得句子中同一个词在不同上下文语境中具有不同的词向量表达;然后利用CRNN对特征进行训练,充分考虑了文本中的局部特征信息和上下文语义关联;最后通过Softmax函数得出弹幕文本的情感极性。在哔哩哔哩、爱奇艺和腾讯视频三个视频平台的弹幕文本数据集上进行实验,结果表明,ALBERT-CRNN模型在三个数据集上的准确率分别达到94.3%、93.5%和94.8%,相比一些传统模型具有更好的效果。 展开更多
关键词 弹幕文本 情感分析 词向量 预训练语言模型 卷积循环神经网络
在线阅读 下载PDF
多阅读器协作的RFID标签树形防碰撞算法 被引量:3
10
作者 宋建华 何帅 姚慧 《电子学报》 EI CAS CSCD 北大核心 2020年第8期1558-1564,共7页
在物联网复杂的应用环境中,射频识别技术中的标签碰撞问题作为造成其系统标签识别时间长,通信量大等问题的主要原因,已成为近年来本领域的核心研究热点之一.针对以上问题,本文提出一种多阅读器协作的树形防碰撞算法:在第一阶段,根据位... 在物联网复杂的应用环境中,射频识别技术中的标签碰撞问题作为造成其系统标签识别时间长,通信量大等问题的主要原因,已成为近年来本领域的核心研究热点之一.针对以上问题,本文提出一种多阅读器协作的树形防碰撞算法:在第一阶段,根据位追踪技术能够识别标签碰撞位的特点,阅读器通过判别待识别标签中的碰撞位,从待广播节点中删除已验证的无效节点;在第二阶段的循环广播中,阅读器间通过共享每次的广播的前缀与当次广播结果对自身的树形结构进行不断优化,优化策略是为每一个阅读器分配一个待广播节点队列,通过共享的信息计算待广播节点中含有标签的概率,依据其概率调整队列中待广播节点的优先级,并不断地删除无需广播的节点.在下一轮广播中阅读器选取含有标签概率最大的节点进行广播.仿真实验结果表明:提出的算法的平均标签识别效率达到59.9%,并且在总时隙数量方面有一定优势. 展开更多
关键词 射频识别 标签识别 多阅读器 二叉树 防碰撞
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部