期刊文献+
共找到22篇文章
< 1 2 >
每页显示 20 50 100
基于道格拉斯-普克算法的路网轨迹学习索引结构
1
作者 缪祝青 韩京宇 +3 位作者 李彩云 王彦之 毛毅 张怡婷 《计算机科学》 北大核心 2025年第8期136-145,共10页
近年来,基于位置服务的技术迅猛发展,产生了海量的路网轨迹数据。而路径范围查询作为一种路网轨迹查询类型,是支持其他查询类型的基础。为了实现对海量路网轨迹数据的高效索引,同时提供精确的路径范围查询服务,提出了一种基于道格拉斯-... 近年来,基于位置服务的技术迅猛发展,产生了海量的路网轨迹数据。而路径范围查询作为一种路网轨迹查询类型,是支持其他查询类型的基础。为了实现对海量路网轨迹数据的高效索引,同时提供精确的路径范围查询服务,提出了一种基于道格拉斯-普克算法的学习型索引结构(Douglas-Peuker Based Learned Index Structure,DPLI)。首先将轨迹数据分为多个轨迹段,然后取轨迹段中的点作为轨迹数据的表征,利用映射函数将其映射为一维映射值序列,而后根据键值数量将其划分为多个数据分片。在分片内将首尾数据组成一条线段,然后计算其余数据点距离线段的拟合误差,将超过误差阈值的数据点作为新的线段端点,递归分割原有的直线段,直到所有数据点的拟合误差小于阈值,从而拟合分段线性函数。采用多个路网数据和轨迹数据进行了充分的实验,实验结果表明:与传统索引方法相比,DPLI具有更快的构建效率和磁盘访问效率;与学习索引方法相比,DPLI保持了构建效率的优势,并且达到了100%查询召回率。 展开更多
关键词 位置服务 路网轨迹 学习型索引 范围查询 道格拉斯-普克算法
在线阅读 下载PDF
BiGCN-TL:软件错误部分定位场景下二分图图卷积神经网络Transformer定位模型
2
作者 施恩译 常舒予 +2 位作者 陈可佳 张扬 黄海平 《计算机科学》 北大核心 2025年第S1期862-872,共11页
在现代复杂软件项目中,软件错误与代码呈现“多对多”的对应关系,一个软件错误往往由多个代码变更集引起,一个代码变更集也会引起多个软件错误。因此,对于软件错误往往只能实现部分定位,难以追溯全部的相关代码。传统架构对于代码变更... 在现代复杂软件项目中,软件错误与代码呈现“多对多”的对应关系,一个软件错误往往由多个代码变更集引起,一个代码变更集也会引起多个软件错误。因此,对于软件错误往往只能实现部分定位,难以追溯全部的相关代码。传统架构对于代码变更集或软件错误语义特征的提取,往往只分别独立地依赖各自的上下文。现代软件项目规模庞大,代码依赖错综复杂、这样分别独立的语义提取方式,降低了单个文本语义特征的质量与鲁棒性,导致最终的定位性能下滑。为实现对软件错误相关代码的全面追溯,提出了BiGCN-TL模型。BiGCN-TL重点聚焦训练模型促进不同文本之间信息交互的能力,旨在降低对单个文本语义特征质量的依赖,使得在现代软件项目规模庞大、代码依赖错综复杂、单个文本语义特征提取困难的场景下,仍能通过高效的信息交互,提取到高质量语义特征,提高定位准确率。首先根据已知的部分定位关系,微调基于Transformer的预训练模型。然后,创新性地将软件错误和代码变更集建模成二分图的数据结构,借此充分利用已知的“多对多”关系,并使用微调后的编码器得到节点特征的初始表示。之后,基于二分图设计链接预测任务,训练GCN与二分类鉴别器。借助图卷积操作和注意力机制动态更新节点特征,重点训练模型促进文本信息的交互,动态更新节点特征的能力,从而得到高质量全局分类特征,最终输出匹配预测得分。在多个数据集上开展了对比实验,结果验证了BiGCN-TL相比传统方案的优越性,并通过消融实验确认了各模块的有效性。此外,通过探索多种预训练模型与GCN的组合,并结合具体案例和可视化分析,进一步验证了BiGCN-TL的通用性与鲁棒性。 展开更多
关键词 错误定位 预训练模型 链接预测 二分图 图神经网络
在线阅读 下载PDF
基于异常特征模式的心电数据标签清洗方法 被引量:3
3
作者 韩京宇 陈伟 +2 位作者 赵静 郎杭 毛毅 《计算机研究与发展》 EI CSCD 北大核心 2023年第11期2594-2610,共17页
心电图(electrocardiogram,ECG)异常的自动检测是一个典型的多标签分类问题,训练分类器需要大量有高质量标签的样本.但心电数据集异常标签经常缺失或错误,如何清洗弱标签得到干净的心电数据集是一个亟待解决的问题.在一个标签完整且准... 心电图(electrocardiogram,ECG)异常的自动检测是一个典型的多标签分类问题,训练分类器需要大量有高质量标签的样本.但心电数据集异常标签经常缺失或错误,如何清洗弱标签得到干净的心电数据集是一个亟待解决的问题.在一个标签完整且准确的示例数据集辅助下,提出一种基于异常特征模式(abnormality-feature pattern,AFP)的方法对弱标签心电数据进行标签清洗,以获取所有正确的异常标签.清洗分2个阶段,即基于聚类的规则构造和基于迭代的标签清洗.在第1阶段,通过狄利克雷过程混合模型(Dirichlet process mixture model,DPMM)聚类,识别每个异常标签对应的不同特征模式,进而构建异常发现规则、排除规则和1组二分类器.在第2阶段,根据发现和排除规则辨识初始相关标签集,然后根据二分类器迭代扩展相关标签并排除不相关标签.AFP方法捕捉了示例数据集和弱标签数据集的共享特征模式,既应用了人的知识,又充分利用了正确标记的标签;同时,渐进地去除错误标签和填补缺失标签,保证了标签清洗的可靠性.真实和模拟数据集上的实验证明了AFP方法的有效性. 展开更多
关键词 心电图 多标签分类 异常标签 异常特征模式 二分类器 标签清洗
在线阅读 下载PDF
面向深度学习的后门攻击及防御研究综述
4
作者 高梦楠 陈伟 +1 位作者 吴礼发 张伯雷 《软件学报》 北大核心 2025年第7期3271-3305,共35页
深度学习模型是人工智能系统的重要组成部分,被广泛应用于现实多种关键场景.现有研究表明,深度学习的低透明度与弱可解释性使得深度学习模型对扰动敏感.人工智能系统面临多种安全威胁,其中针对深度学习的后门攻击是人工智能系统面临的... 深度学习模型是人工智能系统的重要组成部分,被广泛应用于现实多种关键场景.现有研究表明,深度学习的低透明度与弱可解释性使得深度学习模型对扰动敏感.人工智能系统面临多种安全威胁,其中针对深度学习的后门攻击是人工智能系统面临的重要威胁.为了提高深度学习模型的安全性,全面地介绍计算机视觉、自然语言处理等主流深度学习系统的后门攻击与防御研究进展.首先根据现实中攻击者能力将后门攻击分为全过程可控后门、模型修改后门和仅数据投毒后门.然后根据后门构建方式进行子类划分.接着根据防御策略对象将现有后门防御方法分为基于输入的后门防御与基于模型的后门防御.最后汇总后门攻击常用数据集与评价指标,并总结后门攻击与防御领域存在的问题,在后门攻击的安全应用场景与后门防御的有效性等方面提出建议与展望. 展开更多
关键词 深度学习 后门攻击 后门防御 人工智能安全
在线阅读 下载PDF
科研论文的可比性评估与比较性引文生成方法
5
作者 李翔宇 陈景强 《计算机应用》 北大核心 2025年第6期1888-1894,共7页
针对比较性引文生成中面临的两大挑战——准确判定论文间的可比性及生成具有比较性的句子,提出科研论文的可比性评估(CA)与比较性引文生成方法SciCACG(Scientific Comparability Assessment and Citation Generation)。该方法构建了3个... 针对比较性引文生成中面临的两大挑战——准确判定论文间的可比性及生成具有比较性的句子,提出科研论文的可比性评估(CA)与比较性引文生成方法SciCACG(Scientific Comparability Assessment and Citation Generation)。该方法构建了3个核心模块:用于判断2篇论文是否具备可比性的CA模块、负责从论文与参考文献中抽取出具体的比较对象的比较对象抽取(CE)模块和用于生成相应的比较性引用句子的比较引文生成模块。首先,利用SciBERT(Scientific BERT)模型处理输入的2篇文章,并通过CA模块进行可比性的评估;其次,对于被判定为可比的文章,采用CE模块识别并抽取出关键的比较对象;最后,使用比较引文生成模块生成包含这些比较对象的比较性引文。实验结果显示,在CA阶段,所提方法在平均倒数排名(MRR)上达到了0.532,在召回率@10(R@10)上达到了0.731,较之前的SciBERT-FNN(Scientific Bidirectional Encoder Representations from Transformers-Feedforward Neural Network)方法在各个数据集上均有提升;在比较性引文生成中,相较于次优的BART-Large(Bidirectional and Auto-Regressive Transformers-Large)方法,所提方法的ROUGE(Recall-Oriented Understudy for Gisting Evaluation)-1、ROUGE-2和ROUGE-L的F1分数分别提高了1.90、1.29和2.55个百分点。此外,实验结果验证了科学文献自动化比较与分析技术对引文句子生成任务具有重要意义,特别是在提高比较信息的可追溯性和确保引用句子信息的全面性方面,展现出极大的实用价值。 展开更多
关键词 比较性引文 可比性评估 引文生成 文本生成 文本分类 比较对象抽取
在线阅读 下载PDF
基于智能合约的以太坊可信存证机制 被引量:29
6
作者 曹迪迪 陈伟 《计算机应用》 CSCD 北大核心 2019年第4期1073-1080,共8页
针对以太坊平台提供的数据管理功能简单且存在低吞吐率和高延迟的问题,提出一种基于智能合约的以太坊可信存证机制。首先针对以太坊平台暴露的数据管理问题提出一个基于智能合约的以太坊可信存证框架,然后通过集中化数据统一处理、认证... 针对以太坊平台提供的数据管理功能简单且存在低吞吐率和高延迟的问题,提出一种基于智能合约的以太坊可信存证机制。首先针对以太坊平台暴露的数据管理问题提出一个基于智能合约的以太坊可信存证框架,然后通过集中化数据统一处理、认证数据分布式存储以及高效动态取证这几个方面阐述所提机制的框架和实现,最后通过基于智能合约的系统开发表明了该机制的可实现性。实验及分析结果表明,该方法与传统关系数据库存证相比,增加了处理可信性、存储可信性和访问可信性;与区块链存证相比,丰富了数据管理功能、降低了区块存储成本、提高了存证效率。 展开更多
关键词 以太坊 智能合约 区块链 可信存证
在线阅读 下载PDF
基于对比学习和GIF标记的多模态对话回复检索 被引量:1
7
作者 黄懿蕊 罗俊玮 陈景强 《计算机应用》 CSCD 北大核心 2024年第1期32-38,共7页
社交媒体网站上使用GIF(Graphics Interchange Format)作为消息的回复相当普遍。但目前大多方法针对问题“如何选择一个合适的GIF回复消息”,没有很好地利用社交媒体上的GIF附属标记信息。为此,提出基于对比学习和GIF标记的多模态对话... 社交媒体网站上使用GIF(Graphics Interchange Format)作为消息的回复相当普遍。但目前大多方法针对问题“如何选择一个合适的GIF回复消息”,没有很好地利用社交媒体上的GIF附属标记信息。为此,提出基于对比学习和GIF标记的多模态对话回复检索(CoTa-MMD)方法,将标记信息整合到检索过程中。具体来说就是使用标记作为中间变量,文本→GIF的检索就被转换为文本→GIF标记→GIF的检索,采用对比学习算法学习模态表示,并利用全概率公式计算检索概率。与直接的文本图像检索相比,引入的过渡标记降低了不同模态的异质性导致的检索难度。实验结果表明,CoTa-MMD模型相较于深度监督的跨模态检索(DSCMR)模型,在PEPE-56多模态对话数据集和Taiwan多模态对话数据集上文本图像检索任务的召回率之和分别提升了0.33个百分点和4.21个百分点。 展开更多
关键词 跨模态检索 多模态对话 GIF 对比学习 表示学习
在线阅读 下载PDF
结构影响力及标签冲突感知的图课程学习方法
8
作者 刘祖龙 陈可佳 《计算机科学》 CSCD 北大核心 2024年第10期227-233,共7页
近年来,图神经网络(GNNs)已成为图学习领域的热点研究问题。受益于消息传递机制,GNNs在各类基于图的任务上均取得了优越的性能。现有的GNNs方法大多基于图中所有节点的训练难度相同的假设,然而,节点在结构影响力和邻域标签异配性等方面... 近年来,图神经网络(GNNs)已成为图学习领域的热点研究问题。受益于消息传递机制,GNNs在各类基于图的任务上均取得了优越的性能。现有的GNNs方法大多基于图中所有节点的训练难度相同的假设,然而,节点在结构影响力和邻域标签异配性等方面具有明显的差异。为此,提出了一种结构影响力及标签冲突感知的图课程学习方法(SILC-GCL),基于节点的训练难度对GNNs模型进行课程学习。首先,设计了一种综合考虑节点的PageRank影响力值以及邻域标签冲突程度的训练难度测量器;其次,采用了一个训练调度器,用于在每个训练阶段选择训练难度合适的节点并生成一个由易到难的训练节点序列;最后在GNNs骨架模型上进行训练。在6个现实网络数据集上进行的节点分类实验均验证了SILC-GCL方法的有效性。 展开更多
关键词 图表示学习 图神经网络 课程学习 节点分类
在线阅读 下载PDF
基于多步句子选择-重写模型生成科技文献创新点
9
作者 许贤哲 陈景强 《计算机科学》 CSCD 北大核心 2024年第10期344-350,共7页
近年来科技文献数量的显著增加,使得研究人员难以跟上自己所在领域的最新进展。为了保持对前沿研究的追踪,研究者通常依赖于阅读文献中的创新点,该部分简明扼要地概括了关键研究成果。然而,许多作者在文中并未充分地呈现文章的创新内容... 近年来科技文献数量的显著增加,使得研究人员难以跟上自己所在领域的最新进展。为了保持对前沿研究的追踪,研究者通常依赖于阅读文献中的创新点,该部分简明扼要地概括了关键研究成果。然而,许多作者在文中并未充分地呈现文章的创新内容,这导致读者难以快速掌握研究的核心内容。为了解决这一问题,提出了一个全新的任务,即自动生成科技文献的创新点摘要。该任务的难点之一在于目前缺少相关数据集,于是构建了科技创新点摘要语料库(SCSC)。另一个难点在于目前现有的生成式或抽取式模型在生成创新点方面分别存在冗余度过高和句与句之前缺乏关联性的问题。为了满足生成简洁、高质量创新点的需求,提出了MSSRsum模型(一个多步句子选择-重写模型)。最终实验表明,所提模型在SCSC和arXiv数据集上优于基线模型。 展开更多
关键词 摘要 科技文献 多步句子选择-重写 生成创新点
在线阅读 下载PDF
混合式的K-匿名特征选择算法 被引量:7
10
作者 杨柳 李云 《计算机应用》 CSCD 北大核心 2021年第12期3521-3526,共6页
K-匿名算法通过对数据的泛化、隐藏等手段使得数据达到K-匿名条件,在隐藏特征的同时考虑数据的隐私性与分类性能,可以视为一种特殊的特征选择方法,即K-匿名特征选择。K-匿名特征选择方法结合K-匿名与特征选择的特点使用多个评价准则选... K-匿名算法通过对数据的泛化、隐藏等手段使得数据达到K-匿名条件,在隐藏特征的同时考虑数据的隐私性与分类性能,可以视为一种特殊的特征选择方法,即K-匿名特征选择。K-匿名特征选择方法结合K-匿名与特征选择的特点使用多个评价准则选出K-匿名特征子集。过滤式K-匿名特征选择方法难以搜索到所有满足K-匿名条件的候选特征子集,不能保证得到的特征子集的分类性能最优,而封装式特征选择方法计算成本很大,因此,结合过滤式特征排序与封装式特征选择的特点,改进已有方法中的前向搜索策略,设计了一种混合式K-匿名特征选择算法,使用分类性能作为评价准则选出分类性能最好的K-匿名特征子集。在多个公开数据集上进行实验,结果表明,所提算法在分类性能上可以超过现有算法并且信息损失更小。 展开更多
关键词 混合式 过滤式特征排序 封装式特征选择 特征选择 隐私保护 K-匿名 前向搜索策略
在线阅读 下载PDF
基于状态精细化长短期记忆和注意力机制的社交生成对抗网络用于行人轨迹预测 被引量:6
11
作者 吴家皋 章仕稳 +1 位作者 蒋宇栋 刘林峰 《计算机应用》 CSCD 北大核心 2023年第5期1565-1570,共6页
针对当前行人轨迹预测研究仅考虑影响行人交互因素的问题,基于状态精细化长短期记忆(SR-LSTM)和注意力机制提出一种用于行人轨迹预测的社交生成对抗网络(SRA-SIGAN)模型,利用生成对抗网络(GAN)学习获得目标行人的运动规律。首先,使用SR-... 针对当前行人轨迹预测研究仅考虑影响行人交互因素的问题,基于状态精细化长短期记忆(SR-LSTM)和注意力机制提出一种用于行人轨迹预测的社交生成对抗网络(SRA-SIGAN)模型,利用生成对抗网络(GAN)学习获得目标行人的运动规律。首先,使用SR-LSTM作为位置编码器提取运动意图信息;其次,通过设置速度注意力机制合理地为同一场景中的行人分配影响力,以更好地处理行人的交互;最后,由解码器生成预测的未来轨迹。在多个公开数据集上的测试实验结果表明,SRA-SIGAN模型的总体表现良好。特别是在Zara1数据集上,与SR-LSTM模型相比,SRA-SIGAN模型的平均位移误差(ADE)和最终位移误差(FDE)分别减小了20.0%和10.5%;与社交生成对抗网络(SIGAN)模型相比,SRA-SIGAN的ADE和FDE分别下降了31.7%和24.4%。 展开更多
关键词 生成对抗网络 长短期记忆网络 行人轨迹预测 注意力机制 行人交互
在线阅读 下载PDF
低功耗蓝牙5.0邻居发现协议时延模型研究 被引量:7
12
作者 骆冰清 王佩佩 +1 位作者 王正康 孙知信 《通信学报》 EI CSCD 北大核心 2021年第6期226-237,共12页
针对低功耗蓝牙网络邻居发现时延难以评估的问题,面向蓝牙5.0标准提出一种基于中国剩余定理的低功耗蓝牙邻居发现时延分析模型,建立邻居发现过程中广播间隔、扫描间隔以及扫描窗口参数配置与发现时延大小的理论关系,验证了不同参数配置... 针对低功耗蓝牙网络邻居发现时延难以评估的问题,面向蓝牙5.0标准提出一种基于中国剩余定理的低功耗蓝牙邻居发现时延分析模型,建立邻居发现过程中广播间隔、扫描间隔以及扫描窗口参数配置与发现时延大小的理论关系,验证了不同参数配置条件对邻居发现时延大小的影响。实验结果表明,所提出的模型能够有效预测参数配置影响下的时延峰值,为不同的应用场景提供参数配置验证与指导。 展开更多
关键词 低功耗蓝牙 邻居发现 时延模型 参数配置
在线阅读 下载PDF
文本风格迁移研究综述 被引量:9
13
作者 陈可佳 费子阳 +1 位作者 陈景强 杨子农 《软件学报》 EI CSCD 北大核心 2022年第12期4668-4687,共20页
文本风格迁移是近年来自然语言处理领域的热点问题之一,旨在保留文本内容的基础上通过编辑或生成的方式更改文本的特定风格或属性(如情感、时态和性别等).旨在梳理已有的技术,以推进该方向的研究.首先,给出文本风格迁移问题的定义及其... 文本风格迁移是近年来自然语言处理领域的热点问题之一,旨在保留文本内容的基础上通过编辑或生成的方式更改文本的特定风格或属性(如情感、时态和性别等).旨在梳理已有的技术,以推进该方向的研究.首先,给出文本风格迁移问题的定义及其面临的挑战;然后,对已有方法进行分类综述,重点介绍基于无监督学习的文本风格迁移方法并将其进一步分为隐式和显式两类方法,对各类方法在实现机制、优势、局限性和性能等方面进行分析和比较;同时,还通过实验比较了几种代表性方法在风格迁移准确率、文本内容保留和困惑度等自动化评价指标上的性能;最后,对文本风格迁移研究进行总结和展望. 展开更多
关键词 文本风格迁移 自然语言处理 对抗学习 强化学习 机器翻译
在线阅读 下载PDF
条件变分时序图自编码器 被引量:2
14
作者 陈可佳 鲁浩 张嘉俊 《计算机研究与发展》 EI CSCD 北大核心 2020年第8期1663-1673,共11页
网络表示学习(也被称为图嵌入)是链接预测、节点分类、社区发现、图可视化等图任务的基础.现有大多数的图嵌入算法主要是针对静态图开发的,难以捕捉现实世界的网络随时间进化的动态特征.目前,针对动态网络表示学习方法的研究工作仍相对... 网络表示学习(也被称为图嵌入)是链接预测、节点分类、社区发现、图可视化等图任务的基础.现有大多数的图嵌入算法主要是针对静态图开发的,难以捕捉现实世界的网络随时间进化的动态特征.目前,针对动态网络表示学习方法的研究工作仍相对不足.提出了条件变分时序图自编码器(TS-CVGAE),可以同时学习动态网络的局部结构和随时间的演化模式.该方法首先改进了传统图卷积得到时序图卷积,并在条件变分自编码器的框架下使用时序图卷积对网络节点进行编码.训练结束后,条件变分自编码器的中间层就是最终的网络嵌入结果.实验结果表明,该方法在4个现实动态网络数据集上的链接预测表现均优于相关的静、动态网络表示学习方法. 展开更多
关键词 网络表示学习 条件变分自编码器 动态网络 图卷积 链接预测
在线阅读 下载PDF
面向云环境密文排序检索的字典划分向量空间模型 被引量:3
15
作者 陆佳行 戴华 +2 位作者 刘源龙 周倩 杨庚 《计算机应用》 CSCD 北大核心 2023年第7期1994-2000,共7页
针对传统向量空间模型(TVSM)生成的向量维度高,计算文档与检索关键词相关度的向量点积运算耗时长的问题,提出一种面向云环境密文排序检索的字典划分向量空间模型(DPVSM)。首先给出DPVSM的具体定义,并证明了DPVSM中检索关键词与文档的相... 针对传统向量空间模型(TVSM)生成的向量维度高,计算文档与检索关键词相关度的向量点积运算耗时长的问题,提出一种面向云环境密文排序检索的字典划分向量空间模型(DPVSM)。首先给出DPVSM的具体定义,并证明了DPVSM中检索关键词与文档的相关度得分与TVSM中的相关度得分完全相等;然后,采用等长字典划分方法,提出加密向量生成算法和文档与检索关键词相关度得分计算算法。实验结果表明,DPVSM文档向量的空间开销远少于TVSM,且文档数量越多开销降低越多;此外,DPVSM的检索向量的空间开销以及相关度得分计算的耗时也远低于TVSM。显然,DPVSM在生成向量的空间效率和相关度得分计算的时间效率上均优于TVSM。 展开更多
关键词 云计算 向量空间模型 可搜索加密 字典划分 多关键词检索
在线阅读 下载PDF
基于时滞特征的时序依赖情节发现 被引量:1
16
作者 顾佩月 刘峥 +1 位作者 李云 李涛 《计算机应用》 CSCD 北大核心 2019年第2期421-428,共8页
对于事件序列中的时序依赖发现,传统的频繁情节发现方法一方面使用时间窗口机制挖掘事件之间简单的关联依赖,另一方面无法有效处理事件的交叉时序关联。针对以上问题,提出了时滞情节发现的概念,在频繁情节发现的基础上,设计了一种基于... 对于事件序列中的时序依赖发现,传统的频繁情节发现方法一方面使用时间窗口机制挖掘事件之间简单的关联依赖,另一方面无法有效处理事件的交叉时序关联。针对以上问题,提出了时滞情节发现的概念,在频繁情节发现的基础上,设计了一种基于相邻事件匹配集(AEM)的时滞情节发现算法。首先,引入时滞的概率统计模型进行事件序列匹配,避免预先设定时间窗口,处理可能存在的交叉关联;然后,将时滞挖掘转化为最优化问题,使用迭代的方式得到时滞情节之间的时间间隔分布;最后,利用假设检验区分串行时滞情节和并行时滞情节。理论分析与实验结果表明,与目前最新的时滞挖掘方法迭代最近事件(ICE)算法相比,基于AEM的时滞情节发现算法模拟的时滞分布与真实时滞分布的平均KL距离为0. 056,缩短了20. 68%。基于AEM的时滞情节发现算法通过时滞的概率统计模型衡量事件多种匹配情况的可能性,获得一对多的相邻事件匹配集,比ICE算法中的一对一匹配更加有效地模拟了实际情况。 展开更多
关键词 时序依赖 事件序列 频繁情节 时滞 概率统计模型
在线阅读 下载PDF
基于生成对抗网络的系统日志级异常检测算法 被引量:11
17
作者 夏彬 白宇轩 殷俊杰 《计算机应用》 CSCD 北大核心 2020年第10期2960-2966,共7页
针对大规模软件系统自动化异常检测任务中异常样本过少且异常反馈不及时的问题,提出一种基于生成对抗网络(GAN)与注意力机制的日志级异常检测算法。首先,通过日志模板将非结构化的日志转化为结构化的事件,每一个事件包含了日志的时间戳... 针对大规模软件系统自动化异常检测任务中异常样本过少且异常反馈不及时的问题,提出一种基于生成对抗网络(GAN)与注意力机制的日志级异常检测算法。首先,通过日志模板将非结构化的日志转化为结构化的事件,每一个事件包含了日志的时间戳、签名与变量。其次,以滑动窗口的方式划分解析的事件序列,将产生的事件模式与下一时刻的事件组成真实的数据样本集。然后,将真实的事件模式作为训练样本输入来训练基于注意力机制的生成对抗网络,通过对抗学习的机制训练基于循环神经网络(RNN)的生成器直至收敛。最后,生成器通过输入的流式事件模式生成在新到来的事件模式下的正常与异常事件分布,并在系统管理员设置阈值的情况下,自动判断下一时刻的特定日志为正常事件或是异常事件。实验结果表明,提出的以门控循环单元网络为注意力权重并且用长短时记忆(LSTM)网络来解析事件模式的异常检测算法,比仅使用门控循环单元网络时的算法精准率提高了21.7%;此外,与日志级异常检测算法LogGAN相比,所提算法比LogGAN的异常检测精准率提升了7.8%。 展开更多
关键词 异常检测 生成对抗网络 注意力机制 循环神经网络 智能运维
在线阅读 下载PDF
图趋势过滤诱导的噪声容错多标记学习模型 被引量:1
18
作者 林腾涛 查思明 +1 位作者 陈蕾 龙显忠 《计算机应用》 CSCD 北大核心 2021年第1期8-14,共7页
针对多标记学习中特征噪声和标记噪声经常共同出现的问题,提出了一种图趋势过滤诱导的噪声容错多标记学习模型(GNTML)。该模型通过组稀疏约束桥接增强的标记,从而同时容忍特征噪声和标记噪声。模型的关键之处在于标记增强矩阵的学习。... 针对多标记学习中特征噪声和标记噪声经常共同出现的问题,提出了一种图趋势过滤诱导的噪声容错多标记学习模型(GNTML)。该模型通过组稀疏约束桥接增强的标记,从而同时容忍特征噪声和标记噪声。模型的关键之处在于标记增强矩阵的学习。为了在混合噪声场景下学习到合理的标记增强矩阵,首先通过引入图趋势过滤(GTF)机制来容忍含噪示例特征与标记之间关联的不一致性,从而减轻特征噪声对标记增强矩阵学习的影响;然后通过引入组稀疏约束的标记保真惩罚来减轻标记噪声对标记增强矩阵学习的影响,同时引入标记关联矩阵的稀疏约束来刻画标记之间的局部关联特性,使得样本标记能够在相似样本之间得到更好的传播;最后在7个真实多标记数据集上进行5个不同评价指标下的实验。实验结果表明,提出的模型在66.67%的情况下取得最优值或次优值,优于其他5个多标记学习算法,能有效地提高多标记学习的鲁棒性。 展开更多
关键词 多标记学习 噪声容错 组稀疏 标记增强 图趋势过滤
在线阅读 下载PDF
一种基于元路径拥塞模式挖掘的移动对象位置预测方法 被引量:1
19
作者 王宁 韩京宇 +1 位作者 王尚凌 万杨兰 《南京航空航天大学学报》 EI CAS CSCD 北大核心 2019年第5期675-680,共6页
路网上移动对象位置预测是许多位置相关服务的基础。目前移动对象位置预测方法没有充分考虑到轨迹数据中所蕴含的道路拥塞信息,而路网上的道路拥塞状态对移动对象的位置更新会产生巨大影响。提出基于元路径拥塞模式挖掘的方法(Meta-cong... 路网上移动对象位置预测是许多位置相关服务的基础。目前移动对象位置预测方法没有充分考虑到轨迹数据中所蕴含的道路拥塞信息,而路网上的道路拥塞状态对移动对象的位置更新会产生巨大影响。提出基于元路径拥塞模式挖掘的方法(Meta-congestion-pattern mining,MCPM)。在离线挖掘阶段,从历史轨迹的频繁路径(元路径)的紧集中挖掘当地的拥塞模式,并对运动模式进行建模,其中采用基于k均值的聚类算法解决数据稀疏性问题。在线预测阶段根据挖掘的拥塞模式和运动模式依概率进行预测。最后通过理论分析和实验验证得出了算法的有效性,与相同条件下的精度预测(WhereNext,WN)方法相比,平均预测准确性提高了近20%,预测时间平均缩短了近50%。 展开更多
关键词 移动对象 位置预测 GPS数据 位置相关服务
在线阅读 下载PDF
基于对比预测的自监督动态图表示学习方法 被引量:3
20
作者 蒋林浦 陈可佳 《计算机科学》 CSCD 北大核心 2023年第7期207-212,共6页
近年来,以图对比学习为代表的图自监督学习已成为图学习领域的热点研究问题,该类学习范式不依赖于节点的标签并具有良好的泛化能力。然而,大多数图自监督学习方法采用静态图结构设计学习任务,如对比图的结构学习节点级或者图级的表示等... 近年来,以图对比学习为代表的图自监督学习已成为图学习领域的热点研究问题,该类学习范式不依赖于节点的标签并具有良好的泛化能力。然而,大多数图自监督学习方法采用静态图结构设计学习任务,如对比图的结构学习节点级或者图级的表示等,而未考虑图随时间的动态变化信息。为此,文中提出了一种基于对比预测的自监督动态图表示学习方法(DGCP),利用对比损失引导嵌入空间捕获对预测未来图结构最有用的信息。首先,利用图神经网络对每个时间快照图编码,得到对应的节点表示矩阵;然后,使用自回归模型预测下一时间快照图中的节点表示;最后,利用对比损失和滑动窗口机制对模型进行端到端的训练。在真实图数据集上进行实验,结果表明,DGCP在链接预测任务上的表现优于基准方法。 展开更多
关键词 动态图表示学习 对比学习 图神经网络 链接预测
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部