期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
大规模标签图中的动态Top-K兴趣子图查询
1
作者 宋宝燕 贾春杰 +2 位作者 单晓欢 丁琳琳 丁兴艳 《计算机应用》 CSCD 北大核心 2018年第2期471-477,共7页
针对传统算法由于时间或空间复杂度过高而难以实现规模大且动态变化情况下标签图的Top-K子图查询问题,提出一种适用于大规模标签图的动态Top-K兴趣子图查询方法 DISQtop-K。该方法建立了包括节点拓扑结构特性(NTF)索引和边特性(EF)索引... 针对传统算法由于时间或空间复杂度过高而难以实现规模大且动态变化情况下标签图的Top-K子图查询问题,提出一种适用于大规模标签图的动态Top-K兴趣子图查询方法 DISQtop-K。该方法建立了包括节点拓扑结构特性(NTF)索引和边特性(EF)索引的图拓扑结构特性(GTSF)索引,利用该索引可有效剪枝过滤不满足限制条件的无效节点及边;基于GTSF索引提出了多因素候选集过滤策略,通过对查询图候选集进一步剪枝以获得较少的候选集;考虑到图的动态变化可能对匹配结果产生影响,提出了Top-K兴趣子图匹配验证方法——DISQtop-K,将匹配验证过程分为初始匹配和动态修正两个阶段,以尽可能保证查询结果的实时、准确。大量实验结果表明,相比RAM、RWM算法,DISQtop-K方法的索引创建时间较短且占用空间较少,能有效处理大规模标签图中的动态Top-K兴趣子图查询。 展开更多
关键词 大规模标签 动态Top-K 兴趣子图 子图查询
在线阅读 下载PDF
采用平衡函数的大规模多标签文本分类 被引量:1
2
作者 陈钊鸿 洪智勇 +1 位作者 余文华 张昕 《计算机工程与应用》 CSCD 北大核心 2024年第4期163-172,共10页
大规模多标签文本分类是自然语言处理领域的一项挑战性任务。该任务存在标签数据长尾分布的情况,在这种情况下,模型学习尾部标签分类能力不佳,导致模型的整体分类效果不理想。为解决以上问题,提出采用平衡函数的大规模多标签文本分类方... 大规模多标签文本分类是自然语言处理领域的一项挑战性任务。该任务存在标签数据长尾分布的情况,在这种情况下,模型学习尾部标签分类能力不佳,导致模型的整体分类效果不理想。为解决以上问题,提出采用平衡函数的大规模多标签文本分类方法。该方法使用BERT预训练模型对文本进行词嵌入处理,进一步使用预训练模型中多层编码器的拼接输出作为文本向量表示,获取了丰富的文本语义信息,提高了模型收敛速度。最后采用平衡函数针对预测标签的训练损失赋予不同的衰减权重,提高了方法在尾部标签分类上的学习能力。在Eurlex-4K和Wiki10-31K数据集上的实验结果表明,评价指标P@1、P@3和P@5上分别达到86.95%、74.12%、61.43%和88.57%、77.46%、67.90%。 展开更多
关键词 自然语言处理 大规模标签文本分类 BERT 平衡函数 深度学习
在线阅读 下载PDF
含缺失标签的大规模多标签分类算法 被引量:3
3
作者 刘依璐 曹付元 《计算机工程与应用》 CSCD 北大核心 2022年第17期148-157,共10页
在对大规模多标签数据进行人工标注时极易产生标签的缺失。现有算法大多利用被所有实例共享的全局标签相关性来解决该问题,即对不同实例而言,标签之间的相关性是相同的。然而在实际应用中,不同实例的标签相关性并非完全相同,此时采用局... 在对大规模多标签数据进行人工标注时极易产生标签的缺失。现有算法大多利用被所有实例共享的全局标签相关性来解决该问题,即对不同实例而言,标签之间的相关性是相同的。然而在实际应用中,不同实例的标签相关性并非完全相同,此时采用局部方式获取的标签相关性将更加准确。因此,本文提出一种基于局部标签相关性的解决方法。该方法利用局部标签相关性来恢复缺失标签,利用低秩矩阵分解技术来构造适用于大规模数据的分类器。此外,为了加快模型的训练,该方法将这两个过程融合到一个统一的框架中,并采用迭代优化的方式进行求解。大量实验结果表明,该方法在预测准确度上至少比现有算法高2个百分点,在训练速度上至少提升5个百分点。 展开更多
关键词 标签分类 缺失标签 大规模标签 局部标签相关性 低秩矩阵分解
在线阅读 下载PDF
SemFA:基于语义特征与关联注意力的大规模多标签文本分类模型 被引量:4
4
作者 王振东 董开坤 +1 位作者 黄俊恒 王佰玲 《计算机科学》 CSCD 北大核心 2023年第12期270-278,共9页
大规模多标签文本分类(XMTC)是从一个庞大且复杂的标签集合中查找与文本样本最相关标签的一项具有挑战性的任务。目前,基于Transformer模型的深度学习方法在XMTC上取得了巨大的成功。然而,现有方法都没能充分利用Transformer模型的优势... 大规模多标签文本分类(XMTC)是从一个庞大且复杂的标签集合中查找与文本样本最相关标签的一项具有挑战性的任务。目前,基于Transformer模型的深度学习方法在XMTC上取得了巨大的成功。然而,现有方法都没能充分利用Transformer模型的优势,忽略了文本不同粒度下细微的局部语义信息,同时标签与文本之间的潜在关联尚未得到稳健的建立与利用。对此,提出了一种基于语义特征与关联注意力的大规模多标签文本分类模型SemFA(An Extreme Multi-Label Text Classification Model Based on Semantic Features and Association-Attention)。在SemFA中,首先拼接多层编码器顶层输出作为全局特征。其次,结合卷积神经网络从多层编码器浅层向量中获取局部特征。综合丰富的全局信息和不同粒度下细微的局部信息获得更丰富、更准确的语义特征。最后,通过关联注意力机制建立标签特征与文本特征之间的潜在关联,引入关联损失作为潜在关联不断优化模型。在Eurlex-4K和Wiki10-31K两个公开数据集上的实验结果表明,SemFA优于大多数现有的XMTC模型,能有效地融合语义特征与关联注意力,提升整体的分类性能。 展开更多
关键词 自然语言处理 大规模标签文本分类 语义特征 预训练模型 注意力机制
在线阅读 下载PDF
层次序列索引的大规模动态标签图子图查询 被引量:1
5
作者 任成林 姜丽雁 +1 位作者 单晓欢 宋宝燕 《计算机工程与应用》 CSCD 北大核心 2019年第1期70-75,共6页
标签图常用于智能交通网、生物信息网等新兴领域的建模。子图查询作为图数据分析的关键问题,引起了研究者的广泛关注。对现有子图查询算法的研究发现,随着图数据规模增大且频繁更新,传统子图查询算法普遍存在查询效率低,存储开销大,忽... 标签图常用于智能交通网、生物信息网等新兴领域的建模。子图查询作为图数据分析的关键问题,引起了研究者的广泛关注。对现有子图查询算法的研究发现,随着图数据规模增大且频繁更新,传统子图查询算法普遍存在查询效率低,存储开销大,忽略顶点标签信息等问题。为此,提出了一种支持大规模动态标签图子图查询的层次序列索引(Dynamic Hierarchical Sequence,DHS),该索引提取数据图中带有顶点编号的层次拓扑序列关系以实现子图查询;针对图的动态变化,提出了更新点拓扑扩展式索引维护策略,仅从局部变化顶点及边开始进行增量式更新,大大降低了重建索引造成的巨大开销;提出了基于DHS索引的子图查询方法,仅需将查询图与数据图的层次序列进行匹配即可获得候选集,并在其上利用关系匹配策略获得最终查询结果。实验证明提出的方法在保证高效查询的同时降低了索引的创建及维护时间,提高了子图查询效率。 展开更多
关键词 大规模动态标签 子图查询 层次拓扑序列 图索引
在线阅读 下载PDF
基于自适应分裂树的RFID防碰撞算法 被引量:3
6
作者 文超 欧若风 凌力 《计算机工程》 CAS CSCD 北大核心 2011年第24期287-289,共3页
提出一种基于自适应分裂树的RFID防碰撞算法,通过估计碰撞集大小自适应地调整分裂规模,将碰撞标签均匀地划分到不同子集,实现快速分裂。仿真实验结果表明,该算法可以减少碰撞时隙和空闲时隙数目,系统效率较高,通信处理开销较小,适用于... 提出一种基于自适应分裂树的RFID防碰撞算法,通过估计碰撞集大小自适应地调整分裂规模,将碰撞标签均匀地划分到不同子集,实现快速分裂。仿真实验结果表明,该算法可以减少碰撞时隙和空闲时隙数目,系统效率较高,通信处理开销较小,适用于大规模标签的应用场合。 展开更多
关键词 无线射频识别 防碰撞算法 自适应分裂树 大规模标签
在线阅读 下载PDF
基于B+树的RFID防碰撞算法分析与改进 被引量:1
7
作者 孙建锋 冯超 张权 《计算机工程》 CAS CSCD 2013年第9期49-51,58,共4页
介绍基于B+树的无线射频识别防碰撞算法,分析不同分裂阶数对识别效率产生的影响。发现随着分裂阶数取值增大,标签分裂过程中产生的碰撞时隙减少但空闲时隙增多,导致算法整体识别效率下降。针对该问题,提出一种改进算法。利用阅读器动态... 介绍基于B+树的无线射频识别防碰撞算法,分析不同分裂阶数对识别效率产生的影响。发现随着分裂阶数取值增大,标签分裂过程中产生的碰撞时隙减少但空闲时隙增多,导致算法整体识别效率下降。针对该问题,提出一种改进算法。利用阅读器动态控制标签的分裂过程,使碰撞时隙和空闲时隙共同减少。同时考虑到标签的资源限制,不改变标签原有的硬件配置。实验结果表明,改进算法可提高识别效率、减小通信处理开销,适用于标签数量较大的应用场合。 展开更多
关键词 无线射频识别 防碰撞算法 B+树 大规模标签 识别效率 分裂阶数 动态控制
在线阅读 下载PDF
基于并行匹配的RFID自适应碰撞树算法 被引量:3
8
作者 贺晓霞 贾小林 《计算机工程与设计》 北大核心 2020年第8期2190-2194,共5页
为准确快速地识物联网系统中大规模标签,降低大规模标签下的碰撞次数和传输比特量,提出一种基于并行匹配方案的RFID自适应碰撞树算法(PACT)。通过使用并行匹配方案减少查询周期的数量,利用碰撞标签的数量自适应地选择搜索模式(二分支碰... 为准确快速地识物联网系统中大规模标签,降低大规模标签下的碰撞次数和传输比特量,提出一种基于并行匹配方案的RFID自适应碰撞树算法(PACT)。通过使用并行匹配方案减少查询周期的数量,利用碰撞标签的数量自适应地选择搜索模式(二分支碰撞树或八分支碰撞树)。理论分析和仿真结果表明,所提算法与现有基于树的算法相比,提高了系统的效率和标签识别的速度,降低了时间复杂度,特别是在大规模标签识别情况下,算法性能优势更为明显。 展开更多
关键词 射频识别 并行匹配 自适应碰撞树 八分支碰撞树 大规模标签
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部