期刊文献+
共找到27篇文章
< 1 2 >
每页显示 20 50 100
基于关联信息增强与关系平衡的场景图生成方法 被引量:1
1
作者 李林昊 韩冬 +2 位作者 董永峰 李英双 王振 《计算机应用》 北大核心 2025年第3期953-962,共10页
利用场景图的上下文信息可以帮助模型理解目标之间的关联作用;然而,大量不相关的目标可能带来额外噪声,进而影响信息交互,造成预测偏差。在嘈杂且多样的场景中,即使几个简单的关联目标,也足够推断目标所处的环境信息,并消除其他目标的... 利用场景图的上下文信息可以帮助模型理解目标之间的关联作用;然而,大量不相关的目标可能带来额外噪声,进而影响信息交互,造成预测偏差。在嘈杂且多样的场景中,即使几个简单的关联目标,也足够推断目标所处的环境信息,并消除其他目标的歧义信息。此外,在面对真实场景中的长尾偏差数据时,场景图生成(SGG)的性能难以令人满意。针对上下文信息增强和预测偏差的问题,提出一种基于关联信息增强与关系平衡的SGG(IERB)方法。IERB方法采用一种二次推理结构,即根据有偏场景图的预测结果重新构建不同预测视角下的关联信息并平衡预测偏差。首先,聚焦不同视角下的强相关目标以构建上下文关联信息;其次,利用树型结构的平衡策略增强尾部关系的预测能力;最后,采用一种预测引导方式在已有场景图的基础上预测优化。在通用的数据集Visual Genome上的实验结果表明,与3类基线模型VTransE(Visual Translation Embedding network)、Motif和VCTree(Visual Context Tree)相比,所提方法在谓词分类(PredCls)任务下的均值召回率mR@100分别提高了11.66、13.77和13.62个百分点,验证了所提方法的有效性。 展开更多
关键词 场景图生成 信息增强 有偏预测 关系平衡 预测优化
在线阅读 下载PDF
基于关系特征强化的全景场景图生成方法
2
作者 李林昊 王逸泽 +2 位作者 李英双 董永峰 王振 《计算机应用》 北大核心 2025年第2期584-593,共10页
全景场景图生成(PSGG)旨在识别图像中所有对象并自动地捕获所有对象间的语义关联关系。语义关联关系建模依赖目标对象及对象对(subject-object pair)的特征描述,然而现行工作中存在以下不足:采用边界框提取方式获取的对象特征较模糊;仅... 全景场景图生成(PSGG)旨在识别图像中所有对象并自动地捕获所有对象间的语义关联关系。语义关联关系建模依赖目标对象及对象对(subject-object pair)的特征描述,然而现行工作中存在以下不足:采用边界框提取方式获取的对象特征较模糊;仅关注对象的语义和空间位置特征,忽略了对关系预测同样重要的对象对的语义联合特征和相对位置特征;未能针对不同类型的对象对(如前景-前景、前景-背景、背景-背景)进行差异化特征提取,进而忽略了它们之间的差异性。针对上述问题,提出一种基于关系特征强化的全景场景图生成方法(RFE)。首先,通过引入像素级掩码区域特征,丰富对象特征的细节信息,同时有效地融合对象对的联合视觉特征、语义联合特征和相对位置特征;其次,根据对象对的不同类型,自适应地选择最适合本类型对象对的特征提取方式;最后,获得强化后更精确的关系特征用于关系预测。在PSG数据集上的实验结果表明,以VCTree(Visual Contexts Tree)、Motifs、IMP(Iterative Message Passing)和GPSNet为基线方法,ResNet-101为骨干网络,RFE在具有挑战性的SGGen任务上召回率(R@20)指标分别提高了4.37、3.68、2.08和1.80个百分点,验证了所提方法在PSGG的有效性。 展开更多
关键词 全景场景图生成 对象对联合特征 关系特征强化 语义关联关系 自适应选择
在线阅读 下载PDF
基于时空模式的轨迹数据聚类算法 被引量:18
3
作者 石陆魁 张延茹 张欣 《计算机应用》 CSCD 北大核心 2017年第3期854-859,895,共7页
针对轨迹聚类算法在相似性度量中多以空间特征为度量标准,缺少对时间特征的度量,提出了一种基于时空模式的轨迹数据聚类算法。该算法以划分再聚类框架为基础,首先利用曲线边缘检测方法提取轨迹特征点;然后根据轨迹特征点对轨迹进行子轨... 针对轨迹聚类算法在相似性度量中多以空间特征为度量标准,缺少对时间特征的度量,提出了一种基于时空模式的轨迹数据聚类算法。该算法以划分再聚类框架为基础,首先利用曲线边缘检测方法提取轨迹特征点;然后根据轨迹特征点对轨迹进行子轨迹段划分;最后根据子轨迹段间时空相似性,采用基于密度的聚类算法进行聚类。实验结果表明,使用所提算法提取的轨迹特征点在保证特征点具有较好简约性的前提下较为准确地描述了轨迹结构,同时基于时空特征的相似性度量因同时兼顾了轨迹的空间与时间特征,得到了更好的聚类结果。 展开更多
关键词 时空模式 轨迹数据 曲线边缘检测 相似性度量 密度聚类
在线阅读 下载PDF
基于路径和增强三元组文本的开放世界知识推理模型
4
作者 王利琴 耿智雷 +2 位作者 李英双 董永峰 边萌 《计算机应用》 北大核心 2025年第4期1177-1183,共7页
传统的基于表示学习的知识推理方法只能用于封闭世界的知识推理,有效进行开放世界的知识推理是目前的热点问题。因此,提出一种基于路径和增强三元组文本的开放世界知识推理模型PEOR(Path and Enhanced triplet text for Open world know... 传统的基于表示学习的知识推理方法只能用于封闭世界的知识推理,有效进行开放世界的知识推理是目前的热点问题。因此,提出一种基于路径和增强三元组文本的开放世界知识推理模型PEOR(Path and Enhanced triplet text for Open world knowledge Reasoning)。首先,使用由实体对间结构生成的多条路径和单个实体周围结构生成的增强三元组,其中路径文本通过拼接路径中的三元组文本得到,而增强三元组文本通过拼接头实体邻域文本、关系文本和尾实体邻域文本得到;其次,使用BERT(Bidirectional Encoder Representations from Transformers)分别编码路径文本和增强三元组文本;最后,使用路径向量和三元组向量计算语义匹配注意力,再使用语义匹配注意力聚合多条路径的语义信息。在3个开放世界知识图谱数据集WN18RR、FB15k-237和NELL-995上的对比实验结果表明,与次优模型BERTRL(BERT-based Relational Learning)相比,所提模型的命中率(Hits@10)指标分别提升了2.6、2.3和8.5个百分点,验证了所提模型的有效性。 展开更多
关键词 知识图谱 文本信息 预训练语言模型 开放世界知识推理 注意力机制
在线阅读 下载PDF
联合MOD11A1和地面气象站点数据的多站点温度预测深度学习模型 被引量:2
5
作者 张军 吴朋莉 +2 位作者 石陆魁 史进 潘斌 《计算机应用》 CSCD 北大核心 2023年第1期321-328,共8页
针对地面气象站点分布稀疏影响站点间关系以及站点间的关系强度推理难的问题,提出一种基于联合MOD11A1和地面气象站点数据的多站点温度预测深度学习模型(GDM)。GDM包括时空注意力(TSA)、双向图神经长短期记忆(DG-LSTM)网络编码和边-点... 针对地面气象站点分布稀疏影响站点间关系以及站点间的关系强度推理难的问题,提出一种基于联合MOD11A1和地面气象站点数据的多站点温度预测深度学习模型(GDM)。GDM包括时空注意力(TSA)、双向图神经长短期记忆(DG-LSTM)网络编码和边-点转换双向门控循环网络解码(EN-GRU)模块。首先使用TSA模块提取MOD11A1图像特征并形成多个虚拟气象站点的温度时间序列,缓解地面气象站点分布稀疏对站点间关系的影响;然后用DG-LSTM编码器通过融合两组温度时间序列来计算地面气象站点间和虚拟气象站点间的关系强度;最后用ENGRU解码器通过结合站点间的关系强度对地面气象站点的温度时间序列关系进行建模。实验结果表明,相较于二维卷积神经网络(2D-CNN)、长短期记忆全连接网络(LSTM-FC)、长短期记忆神经网络扩展网络(LSTME)和长短记忆与自适应提升集成网络(LSTM-AdaBoost),GDM在10个地面气象站点24 h内温度预测的平均绝对误差(MAE)分别减小0.383℃、0.184℃、0.178℃和0.164℃,能提高未来24 h多个气象站点温度的预测精度。 展开更多
关键词 温度预测 注意力机制 深度学习 长短期记忆网络 门控循环单元 图神经网络 MOD11A1 地面气象站点
在线阅读 下载PDF
不完整多视图聚类综述 被引量:2
6
作者 董瑶 付怡雪 +2 位作者 董永峰 史进 陈晨 《计算机应用》 CSCD 北大核心 2024年第6期1673-1682,共10页
多视图聚类是近年来图数据挖掘领域的研究热点。由于数据采集技术的限制或人为因素等原因常导致视图或样本缺失问题。降低多视图的不完整性对聚类效果的影响是多视图聚类目前面临的重大挑战。因此,综合研究不完整多视图聚类(IMC)近年的... 多视图聚类是近年来图数据挖掘领域的研究热点。由于数据采集技术的限制或人为因素等原因常导致视图或样本缺失问题。降低多视图的不完整性对聚类效果的影响是多视图聚类目前面临的重大挑战。因此,综合研究不完整多视图聚类(IMC)近年的发展具有重要的理论意义和实践价值。首先,归纳分析不完整多视图数据缺失类型;其次,详细比较基于多核学习(MKL)、矩阵分解(MF)学习、深度学习和图学习这4类IMC方法,分析代表性方法的技术特点和区别;再次,从数据集类型、视图和类别数量、应用领域等角度总结22个公开不完整多视图数据集;继次,总结评价指标,并系统分析现有不完整多视图聚类方法在同构和异构数据集上的性能表现;最后,归纳分析不完整多视图聚类目前存在的问题、未来的发展方向和现有应用领域。 展开更多
关键词 不完整性 多视图聚类 图数据挖掘 缺失视图 多视图学习
在线阅读 下载PDF
融合实体语义及结构信息的知识图谱推理 被引量:2
7
作者 王利琴 张特 +2 位作者 许智宏 董永峰 杨国伟 《计算机应用》 CSCD 北大核心 2024年第11期3371-3378,共8页
目前,图注意力网络(GAT)通过引入注意力机制对目标实体的邻域实体赋予不同权重并进行信息聚合,使得它更关注实体的局部邻域,忽略了图结构中实体和关系之间的拓扑结构;而且在多头注意力后将输出嵌入向量简单拼接或平均,导致注意力头之间... 目前,图注意力网络(GAT)通过引入注意力机制对目标实体的邻域实体赋予不同权重并进行信息聚合,使得它更关注实体的局部邻域,忽略了图结构中实体和关系之间的拓扑结构;而且在多头注意力后将输出嵌入向量简单拼接或平均,导致注意力头之间相互独立,未能捕捉不同注意力头的重要语义信息。针对GAT应用于知识图谱(KG)推理任务时未充分挖掘实体结构信息和语义信息的问题,提出融合实体语义及结构信息的知识图谱推理(FESSI)模型。首先,使用TransE将实体和关系表示为同一空间的嵌入向量。其次,提出交互注意力机制,将GAT中多头注意力重新融合成多个混合注意力,增强注意力头之间的交互性,以提取目标实体更丰富的语义信息;同时,利用关系图卷积网络(R-GCN)提取实体的结构信息,并通过权重矩阵学习GAT和R-GCN的输出特征向量。最后,使用ConvKB作为解码器进行评分。在知识图谱数据集Kinship、NELL-995和FB15K-237上的实验结果表明,FESSI模型的效果优于多数对比模型,在3个数据集的平均倒数排名(MRR)指标上的结果分别为0.964、0.565和0.562。 展开更多
关键词 知识图谱 知识图谱推理 关系图卷积网络 图注意力网络 交互注意力机制
在线阅读 下载PDF
融合先验知识和字形特征的中文命名实体识别 被引量:1
8
作者 董永峰 白佳明 +1 位作者 王利琴 王旭 《计算机应用》 CSCD 北大核心 2024年第3期702-708,共7页
针对命名实体识别(NER)任务中相关模型通常仅对字符及相关词汇进行建模,未充分利用汉字特有的字形结构信息和实体类型信息的问题,提出一种融合先验知识和字形特征的命名实体识别模型。首先,采用结合高斯注意力机制的Transformer对输入... 针对命名实体识别(NER)任务中相关模型通常仅对字符及相关词汇进行建模,未充分利用汉字特有的字形结构信息和实体类型信息的问题,提出一种融合先验知识和字形特征的命名实体识别模型。首先,采用结合高斯注意力机制的Transformer对输入序列进行编码,并从中文维基百科中获取实体类型的中文释义,采用双向门控循环单元(BiGRU)编码实体类型信息作为先验知识,利用注意力机制将它与字符表示进行组合;其次,采用双向长短时记忆(BiLSTM)网络编码输入序列的远距离依赖关系,通过字形编码表获得繁体的仓颉码和简体的现代五笔码,采用卷积神经网络(CNN)提取字形特征表示,并根据不同权重组合繁体与简体字形特征,利用门控机制将它与经过BiLSTM编码后的字符表示进行组合;最后,使用条件随机场(CRF)解码,得到命名实体标注序列。在偏口语化的数据集Weibo、小型数据集Boson和大型数据集PeopleDaily上的实验结果表明,与基线模型MECT(Multi-metadata Embedding based Cross-Transformer)相比,所提模型的F1值别提高了2.47、1.20和0.98个百分点,验证了模型的有效性。 展开更多
关键词 命名实体识别 注意力机制 卷积神经网络 双向长短时记忆 条件随机场
在线阅读 下载PDF
基于个性化学习和深层次细化的知识追踪
9
作者 李林昊 张晓倩 +2 位作者 董瑶 王旭 董永峰 《计算机应用》 CSCD 北大核心 2024年第10期3039-3046,共8页
针对知识追踪(KT)模型没有充分考虑学生间差异、挖掘知识状态与习题的高度匹配等问题,提出一种双层网络架构——基于个性化学习和深层次细化的知识追踪(PLDRKT)。首先,利用增强注意力机制得到习题的深层次细化表示;其次,从不同学生对习... 针对知识追踪(KT)模型没有充分考虑学生间差异、挖掘知识状态与习题的高度匹配等问题,提出一种双层网络架构——基于个性化学习和深层次细化的知识追踪(PLDRKT)。首先,利用增强注意力机制得到习题的深层次细化表示;其次,从不同学生对习题的难度感知和学习收益方面对初步知识状态进行个性化建模;最后,利用初步知识状态和深层习题表示得到学生的深层次知识状态并预测他们的未来答题情况。将PLDRKT模型与基于对抗训练的增强知识追踪(ATKT)和集成知识追踪(ENKT)等7种模型在Statics2011、ASSIST09、ASSIST15和ASSIST17数据集上进行对比实验。实验结果显示,PLDRKT模型的曲线下面积(AUC)均有增加,在4个数据集上与不考虑习题嵌入的最优基线模型相比,分别增加了0.61、1.32、5.29和0.19个百分点,可见PLDRKT模型可以较好地建模学生知识状态并预测回答。 展开更多
关键词 知识追踪 注意力 深层次细化 高度匹配 个性化
在线阅读 下载PDF
将行为依赖融入多任务学习的个性化推荐模型
10
作者 顾军华 李宁宁 +1 位作者 王鑫鑫 张素琪 《计算机科学与探索》 CSCD 北大核心 2024年第1期231-243,共13页
多种类型行为数据的引入缓解了协同过滤算法存在的数据稀疏和冷启动问题,在推荐领域被广泛研究和应用。尽管当前对多行为推荐的研究已经取得很大进展,但仍然存在以下问题:未能全面捕获行为之间复杂的依赖关系;忽略了行为特征与用户和项... 多种类型行为数据的引入缓解了协同过滤算法存在的数据稀疏和冷启动问题,在推荐领域被广泛研究和应用。尽管当前对多行为推荐的研究已经取得很大进展,但仍然存在以下问题:未能全面捕获行为之间复杂的依赖关系;忽略了行为特征与用户和项目的相关性。这导致学习到的特征向量无法准确表达用户的兴趣偏好,使得推荐结果存在偏差。为了解决以上问题,提出了将行为依赖融入多任务学习的个性化推荐模型(BDMR),将行为之间复杂的依赖关系分为特征相关性和时序相关性。首先,设置用户个性化行为向量,利用图神经网络处理多个单行为交互图,联合用户、项目和行为特征聚合高阶邻域信息,结合注意力机制学习行为之间的特征相关性;其次,将行为特征和项目特征构成的交互序列输入长短期记忆网络,捕获行为之间的时序相关性;最后,将个性化行为向量融入多任务学习框架获取更加准确的用户、行为和项目特征。为了验证提出模型的性能,在三个真实数据集上进行对比实验,在Yelp数据集上,相较于最优基线,HR和NDCG分别提升了1.5%和2.9%;在ML20M数据集上,HR和NDCG分别提升了2.0%和0.5%;在Tmall数据集上,HR和NDCG分别提升了25.6%和30.2%。实验结果表明,该模型优于其他的基准模型。 展开更多
关键词 多行为推荐 图神经网络 循环神经网络 多任务学习框架
在线阅读 下载PDF
基于MapReduce聚类和神经网络的公交车到站时间预测模型 被引量:10
11
作者 谢芳 顾军华 +1 位作者 张素琪 张建 《计算机应用》 CSCD 北大核心 2017年第A01期118-122,共5页
提出一种基于MapReduce的聚类和神经网络相结合的公交车到站时间预测模型。首先,结合公交车的运行特点,利用K-means聚类方法对公交车的运行时段进行划分,同一时段中的公交车运行数据具有较高的相似性;然后,分别对各个时段的公交车运行... 提出一种基于MapReduce的聚类和神经网络相结合的公交车到站时间预测模型。首先,结合公交车的运行特点,利用K-means聚类方法对公交车的运行时段进行划分,同一时段中的公交车运行数据具有较高的相似性;然后,分别对各个时段的公交车运行数据建立BP神经网络模型进行到站时间的预测;其次,在大数据平台上,针对聚类和神经网络相结合的分段预测模型,建立了基于MapReduce的并行化框架。最后,以公交车的实际运行数据为例进行仿真与验证。实验结果表明,该分段模型优于传统的BP神经网络预测模型,具有较高的预测精度和预测速度。 展开更多
关键词 公交车到站时间 预测 MAPREDUCE 聚类 BP神经网络
在线阅读 下载PDF
基于多尺度卷积特征融合的肺结节图像检索方法 被引量:9
12
作者 顾军华 王锋 +3 位作者 戚永军 孙哲然 田泽培 张亚娟 《计算机应用》 CSCD 北大核心 2020年第2期561-565,共5页
为了解决肺结节图像检索中特征提取难度大、检索精度低下的问题,提出了一种深度网络模型--LMSCRnet用于提取图像特征。首先采用多种不同尺寸滤波器卷积的特征融合方法以解决肺结节大小不一引起的局部特征难以获取的问题,然后引入SE-ResN... 为了解决肺结节图像检索中特征提取难度大、检索精度低下的问题,提出了一种深度网络模型--LMSCRnet用于提取图像特征。首先采用多种不同尺寸滤波器卷积的特征融合方法以解决肺结节大小不一引起的局部特征难以获取的问题,然后引入SE-ResNeXt块来得到更高级的语义特征同时减少网络退化,最后得到肺结节图像的高级语义特征表示。为满足现实中大数据量检索任务的需求,将距离计算及排序过程部署到Spark分布式平台上。实验结果表明,基于LMSCRnet的特征提取方法能够更好地提取图像高级语义信息,在肺结节预处理数据集LIDC上能够达到84.48%的准确率,检索精度高于其他检索方法,而且使用Spark分布式平台完成相似度匹配及排序过程使得检索方法能够满足大数据量检索任务需求。 展开更多
关键词 肺结节图像 图像检索 特征融合 并行优化 SPARK 深度学习
在线阅读 下载PDF
基于结构对应学习的跨语言情感分类研究 被引量:4
13
作者 汪鹏 赵学礼 +1 位作者 李娜娜 董永峰 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2017年第6期1133-1140,共8页
情感分类的主要目的是预测用户在互联网中发布情绪数据的极性(积极的或者消极的),各种语言的情感分析已经成为诸多应用的研究热点,然而由于不同语言的情感资源在质量和数量上的不平衡,通常使用源语言来改善目标语言的跨语言情感分类方法... 情感分类的主要目的是预测用户在互联网中发布情绪数据的极性(积极的或者消极的),各种语言的情感分析已经成为诸多应用的研究热点,然而由于不同语言的情感资源在质量和数量上的不平衡,通常使用源语言来改善目标语言的跨语言情感分类方法,来提高目标语言情感分类的准确性.传统的跨语言情感分类主要是通过机器翻译将目标语言映射到源语言中,但是分类的准确性严重受到机器翻译质量的影响.通过对跨领域文本分类的结构学习算法(SCL)的讨论和拉普拉斯映射对两种语言之间词对的影响,对跨语言结构对应学习算法(CLSCL)的改进,进而提出M-CLSCL算法,借助选出来的轴心词对来进行目标语言的情感分类,通过M-CLSCL方法与前述相关方法的实验结果进行比较,可以发现M-CLSCL提高了情感分类的准确性. 展开更多
关键词 跨语言情感分类 结构对应学习 拉普拉斯映射 轴心词对
在线阅读 下载PDF
融合多时间尺度和特征加强的知识图谱推荐模型 被引量:2
14
作者 张素琪 王鑫鑫 +1 位作者 佘世耀 顾军华 《计算机应用》 CSCD 北大核心 2022年第4期1093-1098,共6页
针对现有的知识图谱推荐模型没有考虑到用户的周期特征以及待推荐项目会对用户近期兴趣产生影响的问题,提出一种融合多时间尺度和特征加强的知识图谱推荐模型(MTFE)。首先,采用长短期记忆(LSTM)网络在不同时间尺度上挖掘用户的周期特征... 针对现有的知识图谱推荐模型没有考虑到用户的周期特征以及待推荐项目会对用户近期兴趣产生影响的问题,提出一种融合多时间尺度和特征加强的知识图谱推荐模型(MTFE)。首先,采用长短期记忆(LSTM)网络在不同时间尺度上挖掘用户的周期特征并融入到用户表示中;然后,通过注意力机制挖掘待推荐项目中与用户近期特征相关性较强的特征,将其加强后融入项目表示中;最后,通过评分函数计算用户对待推荐项目的评分。在真实数据集Last.FM、MovieLens-1M和MovieLens-20M上把所提模型和个性化实体推荐(PER)、协同知识嵌入(CKE)、LibFM、RippleNet、知识图卷积网络(KGCN)、协同知识感知注意网络(CKAN)等知识图谱推荐模型进行对比。实验结果表明,在三个数据集上MTFE相较于表现最优的对比模型的F1性能分别提升了0.78、1.63和1.92个百分点,AUC指标在三个数据集上分别提升了3.94、2.73和1.15个百分点。可见,所提模型相较于对比图谱推荐模型有更好的推荐效果。 展开更多
关键词 推荐算法 知识图谱 周期特征 时间尺度 近期特征 特征加强
在线阅读 下载PDF
基于迁移学习与多标签平滑策略的图像自动标注 被引量:11
15
作者 汪鹏 张奥帆 +1 位作者 王利琴 董永峰 《计算机应用》 CSCD 北大核心 2018年第11期3199-3203,3210,共6页
针对图像标注数据集标签分布不平衡问题,提出了基于标签平滑策略的多标签平滑单元(MLSU)。MLSU在网络模型训练过程中自动平滑数据集中的高频标签,使网络适当提升了低频标签的输出值,从而提升了低频标注词的标注性能。为解决图像标注数... 针对图像标注数据集标签分布不平衡问题,提出了基于标签平滑策略的多标签平滑单元(MLSU)。MLSU在网络模型训练过程中自动平滑数据集中的高频标签,使网络适当提升了低频标签的输出值,从而提升了低频标注词的标注性能。为解决图像标注数据集样本数量不足造成网络过拟合的问题,提出了基于迁移学习的卷积神经网络(CNN)模型。首先利用互联网上的大型公共图像数据集对深度网络进行预训练,然后利用目标数据集对网络参数进行微调,构建了一个多标签平滑卷积神经网络模型(CNN-MLSU)。分别在Corel5K和IAPR TC-12图像标注数据集上进行实验,在Corel5K数据集上,CNN-MLSU较卷积神经网络回归方法(CNN-R)的平均准确率与平均召回率分别提升了5个百分点和8个百分点;在IAPR TC-12数据集上,CNN-MLSU较两场K最邻近模型(2PKNN_ML)的平均召回率提升了6个百分点。实验结果表明,基于迁移学习的CNN-MLSU方法能有效地预防网络过拟合,同时提升了低频词的标注效果。 展开更多
关键词 图像自动标注 多标签平滑 迁移学习 卷积神经网络 图像检索
在线阅读 下载PDF
融合多跳关系路径信息的关系推理方法 被引量:4
16
作者 董永峰 刘超 +1 位作者 王利琴 李英双 《计算机应用》 CSCD 北大核心 2021年第10期2799-2805,共7页
针对目前知识图谱(KG)中存在大量关系的缺失,以及在进行关系推理时没有充分考虑两实体间多跳路径中隐含信息的问题,提出了一种融合多跳关系路径信息的关系推理方法。首先,对于给定的候选关系和两个实体,利用卷积运算将连接两个实体的多... 针对目前知识图谱(KG)中存在大量关系的缺失,以及在进行关系推理时没有充分考虑两实体间多跳路径中隐含信息的问题,提出了一种融合多跳关系路径信息的关系推理方法。首先,对于给定的候选关系和两个实体,利用卷积运算将连接两个实体的多跳关系路径编码到低维空间里并提取信息;其次,利用双向长短时记忆(BiLSTM)网络建模以生成关系路径表示向量,并利用注意力机制将其与候选关系表示向量进行组合;最后,采用多步推理方式找到匹配程度最高的关系作为推理结果并判断其精确率。与目前常用的路径排序算法(PRA)、神经网络模型Path-RNN以及强化学习模型MINERVA相比,在使用大型知识图谱数据集NELL995进行实验时,所提算法的平均精确率均值(MAP)分别提高了1.96、8.6和1.6个百分点;在使用小型知识图谱数据集Kinship进行实验时,所提方法的MAP比PRA、MINERVA分别提高了21.3、13和12.1个百分点。实验结果表明,所提算法能更加准确地推理出实体间的关系链接。 展开更多
关键词 知识图谱 关系推理 双向长短时记忆网络 注意力机制 卷积神经网络
在线阅读 下载PDF
基于深度学习的聚类综述 被引量:15
17
作者 董永峰 邓亚晗 +1 位作者 董瑶 王雅琮 《计算机应用》 CSCD 北大核心 2022年第4期1021-1028,共8页
聚类是一种寻找数据之间内在结构的技术,是许多数据驱动应用领域的一个基本问题,而聚类性能在很大程度上取决于数据表示的质量。近年来,深度学习因其强大的特征提取能力被广泛地应用于聚类任务,以学习更好的特征表示,显著提高了聚类性... 聚类是一种寻找数据之间内在结构的技术,是许多数据驱动应用领域的一个基本问题,而聚类性能在很大程度上取决于数据表示的质量。近年来,深度学习因其强大的特征提取能力被广泛地应用于聚类任务,以学习更好的特征表示,显著提高了聚类性能。首先,介绍了传统的聚类任务;然后,根据网络结构介绍了基于深度学习的聚类及代表性方法,指出了当前存在的问题,并介绍了基于深度学习的聚类在不同领域的应用;最后,对基于深度学习的聚类发展进行了总结与展望。 展开更多
关键词 聚类 深度学习 图聚类 特征表示 网络结构
在线阅读 下载PDF
基于Spark的并行FP-Growth算法优化及实现 被引量:10
18
作者 顾军华 武君艳 +2 位作者 许馨匀 谢志坚 张素琪 《计算机应用》 CSCD 北大核心 2018年第11期3069-3074,共6页
为了进一步提高在Spark平台上的频繁模式增长(FP-Growth)算法执行效率,提出一种新的基于Spark的并行FP-Growth算法——BFPG。首先,从频繁模式树(FP-Tree)规模大小和分区计算量对F-List分组策略进行改进,保证每个分区负载总和近似相等;然... 为了进一步提高在Spark平台上的频繁模式增长(FP-Growth)算法执行效率,提出一种新的基于Spark的并行FP-Growth算法——BFPG。首先,从频繁模式树(FP-Tree)规模大小和分区计算量对F-List分组策略进行改进,保证每个分区负载总和近似相等;然后,通过创建列表P-List对数据集划分策略进行优化,减少遍历次数,降低时间复杂度。实验结果表明,BFPG算法提高了并行FP-Growth算法挖掘效率,且算法具有良好的扩展性。 展开更多
关键词 大数据平台 关联规则 频繁项集 频繁模式增长算法 SPARK
在线阅读 下载PDF
在线学习资源推荐综述 被引量:11
19
作者 董永峰 王雅琮 +1 位作者 董瑶 邓亚晗 《计算机应用》 CSCD 北大核心 2023年第6期1655-1663,共9页
近年来越来越多的学校广泛使用网络在线授课,然而互联网中海量的学习资源令学习者难以抉择。因此,研究在线学习资源推荐并为学习者进行个性化推荐非常重要,这可以帮助学习者快速获取其所需的优质学习资源。针对在线学习资源推荐的研究现... 近年来越来越多的学校广泛使用网络在线授课,然而互联网中海量的学习资源令学习者难以抉择。因此,研究在线学习资源推荐并为学习者进行个性化推荐非常重要,这可以帮助学习者快速获取其所需的优质学习资源。针对在线学习资源推荐的研究现状,从以下5个方面进行分析总结。首先,总结了目前国内外在线教育平台在学习资源推荐方面的工作;其次,分析和探讨了以知识点习题、学习路径、学习视频和学习课程为学习资源推荐目标的4种算法;接着,分别从学习者和学习资源的角度出发,以具体的算法为例,详述了常用的基于学习者画像、基于学习者行为和基于学习资源本体的3种学习资源推荐算法;此外,总结了公开的在线学习资源数据集;最后,分析了学习资源推荐系统目前存在的问题和未来的发展方向。 展开更多
关键词 在线学习 在线教育平台 个性化推荐 学习资源推荐 智慧教育
在线阅读 下载PDF
融合协同过滤信息的知识图注意力网络 被引量:4
20
作者 顾军华 王锐 +1 位作者 李宁宁 张素琪 《计算机应用》 CSCD 北大核心 2022年第4期1087-1092,共6页
知识图谱(KG)能够缓解协同过滤算法存在的数据稀疏和冷启动问题,在推荐领域被广泛地研究和应用。现有的很多基于KG的推荐模型混淆了用户物品二部图中的协同过滤信息和KG中实体间的关联信息,导致学习到的用户向量和物品向量无法准确表达... 知识图谱(KG)能够缓解协同过滤算法存在的数据稀疏和冷启动问题,在推荐领域被广泛地研究和应用。现有的很多基于KG的推荐模型混淆了用户物品二部图中的协同过滤信息和KG中实体间的关联信息,导致学习到的用户向量和物品向量无法准确表达其特征,甚至引入与用户、物品无关的信息从而干扰推荐。针对上述问题提出一种融合协同信息的知识图注意力网络(KGANCF)。首先,为了避免KG实体信息的干扰,网络的协同过滤层从用户物品二部图中挖掘出用户和物品的协同过滤信息;然后,在知识图注意力嵌入层中应用图注意力机制,从KG中继续提取与用户和物品密切相关的属性信息;最后,在预测层将用户物品的协同过滤信息和KG中的属性信息融合,得到用户和物品最终向量表示,进而预测用户对物品的评分。在MovieLens-20M和Last.FM数据集上进行了实验,与协同知识感知注意力网络(CKAN)相比,KGANCF在MovieLens-20M数据集上的F1分数提升了1.1个百分点,曲线下面积(AUC)提升了0.6个百分点;而在KG相对稀疏的Last.FM数据集上,模型的F1分数提升了3.3个百分点,AUC提升了8.5个百分点。实验结果表明,KGANCF能够有效提高推荐结果的准确度,在KG稀疏的数据集上显著优于协同知识嵌入(CKE)、知识图谱卷积网络(KGCN)、知识图注意网络(KGAT)和CKAN模型。 展开更多
关键词 推荐系统 知识图谱 协同过滤 注意力机制 图神经网络
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部