期刊文献+
共找到86篇文章
< 1 2 5 >
每页显示 20 50 100
RESCAL-DLP:融合动态学习二元组的图谱嵌入模型
1
作者 冯勇 闫寒 +2 位作者 徐红艳 徐涵琪 贾永鑫 《中文信息学报》 北大核心 2025年第7期17-26,共10页
知识图谱现有数据集大多因不够完整导致嵌入表示不准确,目前主要是通过添加信息来保证嵌入准确性,但存在过多依赖添加三元组以外的附加信息、忽略挖掘三元组自身的有效信息等问题。二元组是由三元组中的关系与头实体或尾实体组成的实体... 知识图谱现有数据集大多因不够完整导致嵌入表示不准确,目前主要是通过添加信息来保证嵌入准确性,但存在过多依赖添加三元组以外的附加信息、忽略挖掘三元组自身的有效信息等问题。二元组是由三元组中的关系与头实体或尾实体组成的实体关系对,当前研究较少考虑利用二元组潜在的语义信息来提升嵌入的效果。为此,该文提出了一种融合动态学习二元组的图谱嵌入模型(RESCAL-DLP)。首先,使用正负实例构建策略进行数据扩充,使数据集包含更丰富的二元组的特征信息;其次,通过对比学习二元组的语义相似度来加强模型的学习能力,提升嵌入效果;最后,动态调整二元组学习权重进行模型训练。在两个公开标准数据集WN18RR、FB15K-237上进行链接预测实验以评估所提模型的效果。实验结果表明,所提模型相较于当前主流模型在各项指标上均有一定的提升,并在最小化计算资源和模型训练时间的前提下,取得了令人满意的结果。 展开更多
关键词 知识图谱 嵌入表示 数据扩充 二元组 对比学习
在线阅读 下载PDF
轨迹表示学习方法研究综述
2
作者 孟祥福 孙硕男 +2 位作者 张霄雁 冷强奎 方金凤 《计算机科学与探索》 北大核心 2025年第6期1437-1454,共18页
全球定位系统(GPS)、全球移动通信系统(GSM)的快速发展以及移动设备的普遍应用,产生了大量的轨迹数据。目前的轨迹数据处理方法通常以定长的向量形式输入到模型,因此如何将变长的轨迹数据转换成定长低维的嵌入向量十分重要。轨迹表示学... 全球定位系统(GPS)、全球移动通信系统(GSM)的快速发展以及移动设备的普遍应用,产生了大量的轨迹数据。目前的轨迹数据处理方法通常以定长的向量形式输入到模型,因此如何将变长的轨迹数据转换成定长低维的嵌入向量十分重要。轨迹表示学习旨在将轨迹数据转换为更具表达力和可解释性的表示形式。对轨迹表示学习的研究现状、方法及应用进行了全面综述。分类介绍了轨迹表示学习的关键技术,总结了现有轨迹公开数据集。将轨迹表示学习方法按照不同的下游任务进行分类,重点综述了轨迹表示学习方法在轨迹相似性计算、相似轨迹搜索、轨迹聚类、轨迹预测等领域的原理、优缺点和应用,并分别分析了每一类任务中具有代表性的模型结构和原理,及各类任务中不同方法的特点和优势。分析了当前轨迹表示学习所面临的挑战,探讨了如何解决轨迹表示学习中的数据稀疏性、多模态以及模型优化与隐私保护等问题,并提出了具体的研究思路和方法。 展开更多
关键词 轨迹表示学习 轨迹数据挖掘 轨迹相似性计算 相似轨迹搜索 轨迹聚类 轨迹预测
在线阅读 下载PDF
针对缺失实验室指标多约束表征学习的卵巢癌鉴别方法
3
作者 卢梓涵 黄方俊 +2 位作者 蔡光瑶 刘继红 甄鑫 《南方医科大学学报》 北大核心 2025年第1期170-178,共9页
目的探索基于多约束表征学习分类模型在面对缺失实验室指标的情况下鉴别卵巢癌的鉴别能力和应用价值。方法收集了2344例患者(393例卵巢癌和1951例对照)的缺失实验室指标表格型数据,使用本研究提出的基于判别学习和互信息以及特征投影重... 目的探索基于多约束表征学习分类模型在面对缺失实验室指标的情况下鉴别卵巢癌的鉴别能力和应用价值。方法收集了2344例患者(393例卵巢癌和1951例对照)的缺失实验室指标表格型数据,使用本研究提出的基于判别学习和互信息以及特征投影重要性得分一致性及缺失位置估算的表征学习分类模型对缺失的卵巢癌实验室指标特征进行投影到潜在空间得到分类模型。对提出的约束项进行消融实验,通过准确率、ROC曲线下面积(AUC)、敏感度、特异性说明约束项的可行性和有效项。采用交叉验证方法和准确率、AUC、敏感度、特异性评价该分类模型的鉴别性能。将本研究与其他用于缺失数据的插补方法进行对缺失数据处理后鉴别分类能力的对比。结果消融实验结果显示约束项之间有很好的相容性,每项约束项都有较好的鲁棒性。交叉验证结果显示,本研究提出的基于多约束表征学习分类模型在面对缺失实验室指标的情况下对卵巢癌的鉴别中的AUC、准确率、敏感度、特异性分别为0.915、0.888、0.774、0.910,其中AUC和敏感度优于其它缺失数据插补方法。结论基于多约束表征学习模型在缺失实验室指标鉴别卵巢癌的应用中具有优秀的鉴别能力和较高的应用价值。与其他缺失插补方法相比,本研究提出的多约束表征学习模型在针对卵巢癌缺失实验室指标的鉴别分类任务中具有较大的优势。 展开更多
关键词 缺失数据 多约束表征学习模型 判别分析 特征投影重要性得分一致性 缺失位置估算 互信息 卵巢癌
在线阅读 下载PDF
异质图表征学习综述
4
作者 李亚聪 刘皓冰 +2 位作者 蒋若冰 刘聪 朱燕民 《软件学报》 北大核心 2025年第6期2794-2826,共33页
异质图因其能够反映现实世界中实体及其复杂多样的关系,而在诸多领域中扮演着至关重要的角色.异质图表征学习技术,旨在将图中的信息有效地映射到低维空间中,以便捕获和利用节点间深层的语义关联,进而支持节点分类、聚类等下游分析任务.... 异质图因其能够反映现实世界中实体及其复杂多样的关系,而在诸多领域中扮演着至关重要的角色.异质图表征学习技术,旨在将图中的信息有效地映射到低维空间中,以便捕获和利用节点间深层的语义关联,进而支持节点分类、聚类等下游分析任务.深入调研异质图表征学习的最新研究进展,涵盖方法论和应用实践.首先对异质图的基本概念进行形式化定义,并讨论异质图表征学习的挑战.此外,从浅层模型和深度模型两个角度,系统地回顾当前主流的异质图表征学习方法,特别是深度模型,从异质图转换的视角出发进行分类并分析,进而对多种方法的优势、局限和适用场景进行详尽分析,旨在为读者提供一个全面的研究视角.此外,还介绍异质图表征学习研究中常用的数据集和工具,并探讨其在现实世界中的典型应用.最后,总结主要贡献,并对异质图表征学习领域的未来研究方向展望.本综述旨在为研究者提供一个关于异质图表征学习领域的全面认识,为未来的研究和应用奠定坚实的基础. 展开更多
关键词 异质图 图表征学习 图神经网络 深度学习 数据挖掘
在线阅读 下载PDF
基于判别字典学习的刀具磨损状态分类
5
作者 罗长源 袁德志 +1 位作者 李申申 朱锟鹏 《机床与液压》 北大核心 2025年第4期47-53,共7页
传统的数据驱动刀具磨损状态分类依赖于特征的提取与选择,极大影响分类性能。为了实现自动提取刀具磨损状态对应的特征,提出一种基于判别字典学习的刀具磨损状态分类模型(DDLC),此模型联合用于稀疏表示的判别字典和用于模式识别的线性... 传统的数据驱动刀具磨损状态分类依赖于特征的提取与选择,极大影响分类性能。为了实现自动提取刀具磨损状态对应的特征,提出一种基于判别字典学习的刀具磨损状态分类模型(DDLC),此模型联合用于稀疏表示的判别字典和用于模式识别的线性分类器,模型的结构简单、复杂度低、准确率高。在训练阶段,为了增强字典学习的可判别性,在字典学习过程中引入判别稀疏编码误差、重构误差和分类误差,建立了统一的字典学习优化目标。同时将多方向力进行数据级融合作为模型的输入信号。与其他经典的刀具磨损状态监测模型进行比较,所提模型的准确率和F1分数分别为98.46%和97.62%,证明了DDLC方法在刀具磨损状态分类方面的有效性和优越性,其检测精度满足实际加工需求,为刀具磨损状态监测提供了一种新方法。 展开更多
关键词 稀疏表示 判别字典学习 数据融合 刀具磨损状态监测
在线阅读 下载PDF
基于张量化图卷积网络和对比学习的多源数据表示学习模型
6
作者 龙雨菲 牟宇辰 刘晔 《计算机应用》 北大核心 2025年第5期1372-1378,共7页
针对现有多源数据表示学习模型在处理大规模复杂高维数据时存在的容易遗漏数据源间高阶关联信息和易受到噪声干扰的问题,提出一种基于张量化图卷积网络(T-GCN)和对比学习的多源数据表示学习模型(MSTGC)。首先,利用K近邻(KNN)算法和图卷... 针对现有多源数据表示学习模型在处理大规模复杂高维数据时存在的容易遗漏数据源间高阶关联信息和易受到噪声干扰的问题,提出一种基于张量化图卷积网络(T-GCN)和对比学习的多源数据表示学习模型(MSTGC)。首先,利用K近邻(KNN)算法和图卷积网络(GCN)统一多源数据维度,拼接得到张量化多源数据;其次,利用定义的张量图卷积算子实现高维图卷积运算,同时学习数据源内部信息及数据源间关联信息;最后,构建多源数据对比学习范式,通过添加基于语义一致性与标签一致性的对比约束,提升MS-TGC在处理含噪声数据时的表示学习准确率,增强模型的鲁棒性。实验结果表明,当有标签样本率为0.3时,与CONMF(Co-consensus Orthogonal Non-negative Matrix Factorization)模型相比,MS-TGC在BDGP和20newsgroup数据集上的半监督分类准确率分别提升了1.36和5.53个百分点。可见MS-TGC能够更有效地捕捉数据源间关联信息,降低噪声干扰,得到高质量多源数据表示。 展开更多
关键词 多源数据表示学习 图卷积神经网络 张量图卷积算子 对比学习 半监督分类
在线阅读 下载PDF
融合时频特征的多粒度时间序列对比学习方法
7
作者 叶力硕 何志学 《计算机科学》 北大核心 2025年第1期170-182,共13页
现有的时间序列对比学习方法存在增强样本构造方式过于依赖人工经验、泛化能力不足、正样本的定义方式不够通用、对比度量方式存在粗粒度表征等问题,使得整体的时序表示效果较差。为此,提出了一种融合时频特征的多粒度时间序列对比学习... 现有的时间序列对比学习方法存在增强样本构造方式过于依赖人工经验、泛化能力不足、正样本的定义方式不够通用、对比度量方式存在粗粒度表征等问题,使得整体的时序表示效果较差。为此,提出了一种融合时频特征的多粒度时间序列对比学习方法(Temporal-Spectral Deep Contrastive Network, TSDC)。该方法通过季节-趋势生成网络在时域内产生具有稳定变化的时序增强样本,通过多频带融合扰动操作在频域内产生非稳定变化的时序增强样本,两种增强样本通过实例级别的粗粒度对比以及维度级别的细粒度对比方式进行对比学习,使得模型在获得较好表征的同时能够较好地适应于下游不同类型的时序任务。在多个时间序列公开数据集上进行的分类、预测以及异常检测实验表明,由TSDC方法所得的表征用于下游任务的结果优于典型基线模型。 展开更多
关键词 时间序列 表示学习 对比学习 数据增强 多粒度对比
在线阅读 下载PDF
基于学习的源代码漏洞检测研究与进展 被引量:8
8
作者 苏小红 郑伟宁 +3 位作者 蒋远 魏宏巍 万佳元 魏子越 《计算机学报》 EI CSCD 北大核心 2024年第2期337-374,共38页
源代码漏洞自动检测是源代码漏洞修复的前提和基础,对于保障软件安全具有重要意义.传统的方法通常是基于安全专家人工制定的规则检测漏洞,但是人工制定规则的难度较大,且可检测的漏洞类型依赖于安全专家预定义的规则.近年来,人工智能技... 源代码漏洞自动检测是源代码漏洞修复的前提和基础,对于保障软件安全具有重要意义.传统的方法通常是基于安全专家人工制定的规则检测漏洞,但是人工制定规则的难度较大,且可检测的漏洞类型依赖于安全专家预定义的规则.近年来,人工智能技术的快速发展为实现基于学习的源代码漏洞自动检测提供了机遇.基于学习的漏洞检测方法是指使用基于机器学习或深度学习技术来进行漏洞检测的方法,其中基于深度学习的漏洞检测方法由于能够自动提取代码中漏洞相关的语法和语义特征,避免特征工程,在漏洞检测领域表现出了巨大的潜力,并成为近年来的研究热点.本文主要回顾和总结了现有的基于学习的源代码漏洞检测技术,对其研究和进展进行了系统的分析和综述,重点对漏洞数据挖掘与数据集构建、面向漏洞检测任务的程序表示方法、基于机器学习和深度学习的源代码漏洞检测方法、源代码漏洞检测的可解释方法、细粒度的源代码漏洞检测方法等五个方面的研究工作进行了系统的分析和总结.在此基础上,给出了一种结合层次化语义感知、多粒度漏洞分类和辅助漏洞理解的漏洞检测参考框架.最后对基于学习的源代码漏洞检测技术的未来研究方向进行了展望. 展开更多
关键词 软件安全 源代码漏洞检测 漏洞数据挖掘 漏洞特征提取 代码表示学习 深度学习 模型可解释性 漏洞检测
在线阅读 下载PDF
多任务联合学习的图卷积神经网络推荐 被引量:2
9
作者 王永贵 邹赫宇 《计算机工程与应用》 CSCD 北大核心 2024年第4期306-314,共9页
基于图神经网络的协同过滤推荐可以更有效地挖掘用户项目之间的交互信息,但其性能依然受到数据稀疏和表征学习质量不高问题的影响,因此提出一种多任务联合学习的图卷积神经网络推荐(multi-task joint learning for graph convolutional ... 基于图神经网络的协同过滤推荐可以更有效地挖掘用户项目之间的交互信息,但其性能依然受到数据稀疏和表征学习质量不高问题的影响,因此提出一种多任务联合学习的图卷积神经网络推荐(multi-task joint learning for graph convolutional neural network recommendations,MTJL-GCN)模型。利用图神经网络在用户-项目交互图上所聚集到的同质结构信息与初始嵌入信息形成结构邻居关系,设计节点邻居关系的对比学习辅助任务来缓解数据稀疏问题;向节点的原始表征添加随机的统一噪声进行表征级数据增强,构建节点表征关系的对比学习辅助任务,并提出直接优化对齐性和均匀性两个属性的学习目标来提高表征学习质量;将图协同过滤推荐任务与对比学习辅助任务和直接优化学习目标进行联合训练,从而提升推荐性能。在Amazon-books和Yelp2018两个公开数据集上进行实验,该模型在Recall@k和NDCG@k两个推荐性能指标上的表现均优于基线模型,证明了MTJL-GCN模型的有效性。 展开更多
关键词 推荐算法 图卷积神经网络 对比学习 表征学习 数据稀疏 协同过滤
在线阅读 下载PDF
电磁目标表征:知识-数据联合驱动新范式
10
作者 杨淑媛 杨晨 +1 位作者 冯志玺 潘求凯 《航空兵器》 CSCD 北大核心 2024年第2期17-31,共15页
电磁目标表征是电磁空间态势感知中的一项共性基础性问题。早期目标表征基于专家经验知识,需要设计者具有较强的专业背景与先验知识,其在复杂信号环境下的性能不佳。近年来发展起来的深度学习为复杂电磁环境下的目标信号表征提供了新的... 电磁目标表征是电磁空间态势感知中的一项共性基础性问题。早期目标表征基于专家经验知识,需要设计者具有较强的专业背景与先验知识,其在复杂信号环境下的性能不佳。近年来发展起来的深度学习为复杂电磁环境下的目标信号表征提供了新的途径,它通过模拟人脑的深层结构建立机器学习模型,以端到端的方式自动表征和处理目标数据,在电磁目标检测、分类、识别、参数估计、行为认知等感知任务中显示出良好的性能。然而,深度学习严重依赖海量高质量标注数据,在现实电磁环境中存在一定局限。将知识融入智能系统一直是人工智能的研究方向,结合知识与数据进行电磁目标表征,将有望提升目标感知精度与泛化能力,正在成为电磁目标表征中新的方向。本文回顾了电磁目标表征技术的发展过程,对新的知识-数据联合驱动的电磁目标感知范式进行了展望。 展开更多
关键词 目标表征 专家知识 深度学习 知识-数据联合驱动 知识图谱
在线阅读 下载PDF
基于图卷积神经网络的最短路径距离估计方法
11
作者 孟祥福 崔江燕 邓敏超 《智能系统学报》 CSCD 北大核心 2024年第6期1518-1527,共10页
路网最短路径距离估计问题的关键是提高估计准确度和减少模型训练时间。现有基于嵌入的最短路径距离估计方法要么模型的训练时间较长,要么通过牺牲估计精度来降低模型训练时间。针对以上问题,通过分析基于嵌入的最短路径距离估计方法,... 路网最短路径距离估计问题的关键是提高估计准确度和减少模型训练时间。现有基于嵌入的最短路径距离估计方法要么模型的训练时间较长,要么通过牺牲估计精度来降低模型训练时间。针对以上问题,通过分析基于嵌入的最短路径距离估计方法,提出路网最短路径距离估计编码器-解码器框架,归纳和整合这类方法的核心过程,并将核心过程分为嵌入方法、采样方案和模型训练3部分。在此基础上,提出一种基于图卷积网络的路网顶点嵌入方法(road graph convolutional networks and distance2vector,RGCNdist2vec),用于捕获路网的结构信息。在模型训练样本的采样方面,设计一种基于图逻辑分区的三阶段采样方法,能够选取少量优质样本用于模型训练。为验证模型及采样方案的有效性,在4个真实路网数据集上开展实验,并与现有相关模型进行对比,结果表明所提模型具有较高的估计准确性,并且模型训练时间降低为现有基线模型的1/4。 展开更多
关键词 最短路径距离计算 图神经网络 数据采样 表示学习 图卷积网络 图分区 深度学习 拓扑结构
在线阅读 下载PDF
知识图谱和表示学习在道路交通事故数据挖掘中的应用 被引量:3
12
作者 于德新 彭万里 +2 位作者 吴新程 陈云结 刘晓佳 《安全与环境学报》 CAS CSCD 北大核心 2024年第10期3950-3958,共9页
交通安全领域数据量庞大且蕴含丰富的语义信息,从海量道路交通事故数据中挖掘潜在的价值信息可为交通事故预防和智能研判提供支撑。然而,传统的事故分析方法在处理复杂且多语义交叉的事故数据时,存在一定的局限性。研究提出了一种基于... 交通安全领域数据量庞大且蕴含丰富的语义信息,从海量道路交通事故数据中挖掘潜在的价值信息可为交通事故预防和智能研判提供支撑。然而,传统的事故分析方法在处理复杂且多语义交叉的事故数据时,存在一定的局限性。研究提出了一种基于知识图谱和知识表示学习的事故数据挖掘方法。通过翻译距离嵌入(Translating Embedding,TransE)模型对道路交通事故知识图谱进行表示学习,将事故实体和致因关系映射到向量空间,并在向量匹配运算中捕捉向量之间的语义信息,进而挖掘潜在的交通事故信息。研究采用真实的事故数据进行试验验证,结果表明所提方法具有较高的准确率和较强的语义解析性能,可为道路交通事故碎片化信息的最大化利用提供新的方法和思路。 展开更多
关键词 安全工程 交通安全 道路交通事故 知识图谱 表示学习 数据挖掘与知识发现
在线阅读 下载PDF
平衡信息与动态更新的原型表示联邦学习 被引量:1
13
作者 徐炜钦 肖婷 王喆 《华东理工大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第6期905-912,共8页
联邦学习(FL)是一种分布式机器学习方法,旨在通过训练模型而不共享客户之间的原始数据来解决隐私问题。然而,跨客户端数据的异构性会阻碍FL中的优化收敛性和泛化性能。为了解决这个问题,本文提出了平衡信息与动态更新的联邦原型学习(BD-... 联邦学习(FL)是一种分布式机器学习方法,旨在通过训练模型而不共享客户之间的原始数据来解决隐私问题。然而,跨客户端数据的异构性会阻碍FL中的优化收敛性和泛化性能。为了解决这个问题,本文提出了平衡信息与动态更新的联邦原型学习(BD-FedProto)框架,它由两个组件组成:原型调度的动态聚合(DA)和对比原型聚合(CPA)。前者动态地调整局部学习和全局学习之间的比例,以平衡局部知识和全局知识的有效性;后者利用缺失的类作为负样本,通过统一的原型集群来学习未知的分布。在CIFAR-10和MNIST数据集上的实验结果表明,BD-FedProto能有效提高FL的分类性能和稳定性。 展开更多
关键词 联邦学习 特征空间聚合 原型表示 对比学习 数据异构
在线阅读 下载PDF
基于表征学习的离线强化学习方法研究综述 被引量:2
14
作者 王雪松 王荣荣 程玉虎 《自动化学报》 EI CAS CSCD 北大核心 2024年第6期1104-1128,共25页
强化学习(Reinforcement learning,RL)通过智能体与环境在线交互来学习最优策略,近年来已成为解决复杂环境下感知决策问题的重要手段.然而,在线收集数据的方式可能会引发安全、时间或成本等问题,极大限制了强化学习在实际中的应用.与此... 强化学习(Reinforcement learning,RL)通过智能体与环境在线交互来学习最优策略,近年来已成为解决复杂环境下感知决策问题的重要手段.然而,在线收集数据的方式可能会引发安全、时间或成本等问题,极大限制了强化学习在实际中的应用.与此同时,原始数据的维度高且结构复杂,解决复杂高维数据输入问题也是强化学习面临的一大挑战.幸运的是,基于表征学习的离线强化学习能够仅从历史经验数据中学习策略,而无需与环境产生交互.它利用表征学习技术将离线数据集中的特征表示为低维向量,然后利用这些向量来训练离线强化学习模型.这种数据驱动的方式为实现通用人工智能提供了新契机.为此,对近期基于表征学习的离线强化学习方法进行全面综述.首先给出离线强化学习的形式化描述,然后从方法、基准数据集、离线策略评估与超参数选择3个层面对现有技术进行归纳整理,进一步介绍离线强化学习在工业、推荐系统、智能驾驶等领域中的研究动态.最后,对全文进行总结,并探讨基于表征学习的离线强化学习未来所面临的关键挑战与发展趋势,以期为后续的研究提供有益参考. 展开更多
关键词 强化学习 离线强化学习 表征学习 历史经验数据 分布偏移
在线阅读 下载PDF
基于自适应跨域距离一致的有限数据图像修复
15
作者 厉嘉琦 肖婷 +1 位作者 杨孟平 王喆 《计算机工程与设计》 北大核心 2024年第12期3674-3680,共7页
针对现有深度学习图像修复方法在有限数据场景下存在的修复质量差、多样性弱等问题,在预训练基础上提出一种域自适应的方法,迁移源域中可学习的知识,补充训练中所需的信息。对源域和目标域中的特征信息进行探究,发现特征中的结构信息可... 针对现有深度学习图像修复方法在有限数据场景下存在的修复质量差、多样性弱等问题,在预训练基础上提出一种域自适应的方法,迁移源域中可学习的知识,补充训练中所需的信息。对源域和目标域中的特征信息进行探究,发现特征中的结构信息可作为公共表征,为域自适应提供学习的来源;为更有针对性地完成域自适应过程,提出一种自适应跨域距离一致性损失,自适应地调节损失权重,保留更多与目标域接近的源域相对距离,完成对源域知识的学习。实验结果表明,所提方法能有效提升修复质量和真实性,并且具有良好的泛化性。 展开更多
关键词 图像修复 深度学习 有限数据 预训练 域自适应 公共表征 相对距离
在线阅读 下载PDF
基于对比学习的时间序列聚类方法 被引量:1
16
作者 杨博 罗嘉琛 +2 位作者 宋艳涛 吴宏涛 彭甫镕 《计算机科学》 CSCD 北大核心 2024年第2期63-72,共10页
现有深度聚类方法严重依赖于复杂的特征提取网络和聚类算法,难以直观地定义时间序列的相似性。使用对比学习的方法可以从正负样本数据的角度定义时间序列的区间相似性,并对特征提取和聚类进行联合优化。基于对比学习的思想,提出了一种... 现有深度聚类方法严重依赖于复杂的特征提取网络和聚类算法,难以直观地定义时间序列的相似性。使用对比学习的方法可以从正负样本数据的角度定义时间序列的区间相似性,并对特征提取和聚类进行联合优化。基于对比学习的思想,提出了一种不依赖于复杂表示网络的时间序列聚类模型。同时,为解决现有时间序列数据增强方法难以描述时间序列的变换不变性的问题,提出了一种基于时间序列形状特征的数据增强方法,在忽略数据时域特征情况下捕捉序列的相似性。模型通过设置不同的形状转换参数构造正负样本对,学习特征表示并投影到特征空间,在实例级对比和聚类级对比层面利用交叉熵损失最大化正样本对相似性,最小化负样本对相似性,实现了端到端的联合学习表示和聚类分配。在32个UCR中的数据集上进行了大量实验,结果表明该模型可以在不依赖于特定表示学习网络的情况下得到与现有方法相当或优于现有方法的聚类结果。 展开更多
关键词 时间序列聚类 对比学习 数据增强 表示学习 联合优化
在线阅读 下载PDF
基于分层联邦框架的音频模型生成技术研究 被引量:1
17
作者 王健宗 张旭龙 +2 位作者 姜桂林 程宁 肖京 《智能系统学报》 CSCD 北大核心 2024年第5期1331-1339,共9页
针对音频模型,围绕下一代音频生成技术研究,构建联邦音频模型训练框架,面向超大规模音频数据进行音频表征学习,为音频下游任务提供高效鲁棒的解决方案。提出一种适用于音频模型的联邦学习框架,解决数据异构性、通信效率、隐私保护等问题... 针对音频模型,围绕下一代音频生成技术研究,构建联邦音频模型训练框架,面向超大规模音频数据进行音频表征学习,为音频下游任务提供高效鲁棒的解决方案。提出一种适用于音频模型的联邦学习框架,解决数据异构性、通信效率、隐私保护等问题;提出一种基于对比学习的音频模型的预训练方法,利用<音频,文本描述>数据学习语义特征,提高模型的泛化能力和多样化能力;提出一种基于提示学习的音频生成微调方法,利用少量标注数据提高模型的适应能力和定制化能力;提出一种音频模型分布式优化算法进行模型压缩,降低模型的复杂度和资源消耗,提高模型的部署效率和运行效率。通过在下游任务音效转换上的实验,提出的方法在语音质量平均意见得分可以达到3.81。实验结果表明,该方法在音效转换任务上取得了良好的效果。 展开更多
关键词 音频模型 联邦学习框架 音频表征学习 数据异构性 隐私保护 对比学习 提示学习 模型压缩
在线阅读 下载PDF
基于阻尼字典学习的三维地震数据重建 被引量:1
18
作者 周旸 黄炜霖 张靖 《石油物探》 CSCD 北大核心 2024年第3期558-570,共13页
为了降低地震数据采集成本、提高采集效率并保持数据规则和完整,首先,针对随机采集观测系统不规则的问题,提出了观测系统规则投影的技术流程,填补缺失的炮点和检波点信息,然后,在压缩感知的框架下,利用字典学习与稀疏表示进行三维地震... 为了降低地震数据采集成本、提高采集效率并保持数据规则和完整,首先,针对随机采集观测系统不规则的问题,提出了观测系统规则投影的技术流程,填补缺失的炮点和检波点信息,然后,在压缩感知的框架下,利用字典学习与稀疏表示进行三维地震数据重建。对提出的字典学习方法,利用批量正交匹配追踪避免直接对矩阵求逆造成的计算量大的问题,利用交替最小二乘代替奇异值分解提高计算效率,同时对稀疏系数进行阻尼约束,避免对噪声的拟合从而得到更好的字典。针对常规时间域字典学习地震数据重建方法存在计算效率低、弱信号保护能力差等问题,在频率域进行地震数据重建,对有效信号所在频带范围进行处理,有效减少计算量、压制噪声、提高重建结果的信噪比,形成了针对地震数据随机采集的观测系统规则投影、地震数据重建技术流程。实际资料应用结果表明,通过规则观测系统投影、地震数据重建有效提升了叠前地震资料品质,获得了较好的成像效果。 展开更多
关键词 字典学习 稀疏表示 阻尼约束 观测系统规则投影 地震数据重建
在线阅读 下载PDF
基于大规模集成学习的正脸姿态估计算法
19
作者 陈婉琪 邓春华 《计算机工程与设计》 北大核心 2024年第12期3592-3599,共8页
现有的正脸姿态估计任务依赖于头部3D姿态的估计和经验阈值的使用,这类方法存在主观性和鲁棒性不足的问题。为解决上述问题,提出一种基于大规模正脸数据驱动的集成学习算法。通过构建大规模正脸类别,解决正脸姿态分类中类内方差大而类... 现有的正脸姿态估计任务依赖于头部3D姿态的估计和经验阈值的使用,这类方法存在主观性和鲁棒性不足的问题。为解决上述问题,提出一种基于大规模正脸数据驱动的集成学习算法。通过构建大规模正脸类别,解决正脸姿态分类中类内方差大而类间方差小的问题,避免人为确定阈值带来的主观性问题。利用人脸特征中的姿态信息和大规模集成的方式,区分正脸图像和非正脸图像,提高分类能力,增强鲁棒性。实验结果表明,所提方法无需依赖关键点标注,具有较短的推理时间,在公共数据集上实现了正脸姿态估计。在光照变化、配饰遮挡、小角度和大角度的真实数据集上展示了高效的分类能力。 展开更多
关键词 正脸姿态估计 表征信息 最近邻分类 集成学习 余弦距离 机器学习 大规模数据
在线阅读 下载PDF
软件工程数据挖掘研究进展 被引量:24
20
作者 郁抒思 周水庚 关佶红 《计算机科学与探索》 CSCD 2012年第1期1-31,共31页
随着计算机软件的规模不断扩大,手工获取、开发和维护软件所需的信息越来越困难。数据挖掘技术可从软件工程数据中自动发现所需信息,加快软件开发进程。对软件工程数据挖掘的研究进展进行了综述。概述了软件工程数据挖掘的基本概念与技... 随着计算机软件的规模不断扩大,手工获取、开发和维护软件所需的信息越来越困难。数据挖掘技术可从软件工程数据中自动发现所需信息,加快软件开发进程。对软件工程数据挖掘的研究进展进行了综述。概述了软件工程数据挖掘的基本概念与技术挑战;详细评述了在软件工程各个阶段,数据挖掘技术所能发现的信息/知识,以及获取这些信息/知识的意义、难点、步骤和方法,重点介绍了数据预处理和数据表示方法;对软件工程数据挖掘研究的发展趋势进行了展望。 展开更多
关键词 软件工程 数据挖掘 数据表示 数据预处理 机器学习
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部