期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
多示例学习的簇频繁性分析及双角度融合嵌入
1
作者 杨梅 张靖宇 +1 位作者 闵帆 方宇 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第4期531-541,共11页
多示例学习(Multi-Instance Learning,MIL)的训练数据是由若干个未带标记的示例组成的带标记的包,基于嵌入的方法,通过将包嵌入成单向量来解决包表示问题,然而大部分现有方法忽略了示例与包的联系,难以保证所选示例的代表性.同时,单角... 多示例学习(Multi-Instance Learning,MIL)的训练数据是由若干个未带标记的示例组成的带标记的包,基于嵌入的方法,通过将包嵌入成单向量来解决包表示问题,然而大部分现有方法忽略了示例与包的联系,难以保证所选示例的代表性.同时,单角度的嵌入方法无法有效地提取正、负包的差异信息,使嵌入向量的质量较差.提出一种多示例学习的簇频繁性分析及双角度融合嵌入(FADE).簇频繁性分析技术从正、负子空间中分别筛选部分示例作为子空间的簇心,依据簇心将子空间聚类成簇,再计算簇频繁性指标,选择频繁性较高的簇的簇心组成子空间代表示例集.双角度融合嵌入技术基于正、负子空间代表示例集和差值嵌入函数,分别从正、负角度挖掘信息,融合两个角度信息获得最终的嵌入向量.在29个数据集上与七个MIL算法进行了对比实验,结果表明,FADE的分类准确率总体上优于七个对比算法,在图像数据集上有显著优势,在文本和网页数据集上也表现良好. 展开更多
关键词 多示例学习 嵌入方法 簇频繁性 示例来源 双角度融合
在线阅读 下载PDF
面向非均匀分布数据的代价敏感标记分布学习 被引量:1
2
作者 樊俊 张恒汝 +1 位作者 余一帆 闵帆 《西南大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第5期40-50,共11页
标记歧义近年来在机器学习和数据挖掘领域备受关注.标记分布学习(LDL)通过为样本分配概率标记来解决标记歧义问题.现有的LDL方法主要是为处理训练数据均匀分布的情况而设计的.然而,在实际应用中,训练数据往往呈现非均匀分布.因此,提出... 标记歧义近年来在机器学习和数据挖掘领域备受关注.标记分布学习(LDL)通过为样本分配概率标记来解决标记歧义问题.现有的LDL方法主要是为处理训练数据均匀分布的情况而设计的.然而,在实际应用中,训练数据往往呈现非均匀分布.因此,提出了一种代价敏感的标记分布学习方法(CSLDL),用以处理这种非均匀分布的数据.通过充分利用样本的密度信息,设计了一种新的损失函数.首先,将描述度集平均划分为多个区间,并统计这些区间中的样本个数,从而推导出每个类别标记的经验密度向量.其次,为了确保不同区间之间的连续性,利用邻居来对目标区间的经验密度进行修正.将经验密度向量与对称核进行卷积,以使每个区间不仅考虑当前区间,还考虑附近区间.最后,利用修正后的密度向量构建代价矩阵,并结合Kullback-Leibler(K-L)散度来处理非均匀分布的训练数据.CSLDL在10个真实世界的数据集上与6种最先进的算法进行了对比实验.实验结果充分验证了提出的方法的有效性和优越性. 展开更多
关键词 标记分布学习 标记歧义 非均匀分布数据 代价敏感 样本密度
在线阅读 下载PDF
高效联邦学习:范数加权聚合算法 被引量:1
3
作者 陈攀 张恒汝 闵帆 《计算机应用研究》 CSCD 北大核心 2024年第3期694-699,共6页
在联邦学习中,跨客户端的非独立同分布(non-IID)数据导致全局模型收敛较慢,通信成本显著增加。现有方法通过收集客户端的标签分布信息来确定本地模型的聚合权重,以加快收敛速度,但这可能会泄露客户端的隐私。为了在不泄露客户端隐私的... 在联邦学习中,跨客户端的非独立同分布(non-IID)数据导致全局模型收敛较慢,通信成本显著增加。现有方法通过收集客户端的标签分布信息来确定本地模型的聚合权重,以加快收敛速度,但这可能会泄露客户端的隐私。为了在不泄露客户端隐私的前提下解决non-IID数据导致的收敛速度降低的问题,提出FedNA聚合算法。该算法通过两种方法来实现这一目标。第一,FedNA根据本地模型类权重更新的L 1范数来分配聚合权重,以保留本地模型的贡献。第二,FedNA将客户端的缺失类对应的类权重更新置为0,以缓解缺失类对聚合的影响。在两个数据集上模拟了四种不同的数据分布进行实验。结果表明,与FedAvg相比,FedNA算法达到稳定状态所需的迭代次数最多可减少890次,降低44.5%的通信开销。FedNA在保护客户端隐私的同时加速了全局模型的收敛速度,降低了通信成本,可用于需要保护用户隐私且对通信效率敏感的场景。 展开更多
关键词 联邦学习 通信成本 隐私保护 非独立同分布 聚合 权重更新
在线阅读 下载PDF
融合梯度预测和无参注意力的高效地震去噪Transformer 被引量:1
4
作者 高磊 乔昊炜 +2 位作者 梁东升 闵帆 杨梅 《计算机科学与探索》 北大核心 2025年第5期1342-1352,共11页
压制随机噪声能够有效提升地震数据的信噪比(SNR)。近年来,基于卷积神经网络(CNN)的深度学习方法在地震数据去噪领域展现出显著性能。然而,CNN中的卷积操作由于感受野的限制通常只能捕获局部信息而不能建立全局信息的长距离连接,可能会... 压制随机噪声能够有效提升地震数据的信噪比(SNR)。近年来,基于卷积神经网络(CNN)的深度学习方法在地震数据去噪领域展现出显著性能。然而,CNN中的卷积操作由于感受野的限制通常只能捕获局部信息而不能建立全局信息的长距离连接,可能会导致细节信息的丢失。针对地震数据去噪问题,提出了一种融合梯度预测和无参注意力的高效Transformer模型(ETGP)。引入多头“转置”注意力来代替传统的多头注意力,它能在通道间计算注意力来表示全局信息,缓解了传统多头注意力复杂度过高的问题。提出了无参注意力前馈神经网络,它能同时考虑空间和通道维度计算注意力权重,而不向网络增加参数。设计了梯度预测网络以提取边缘信息,并将信息自适应地添加到并行Transformer的输入中,从而获得高质量的地震数据。在合成数据和野外数据上进行了实验,并与经典和先进的去噪方法进行了比较。结果表明,ETGP去噪方法不仅能更有效地压制随机噪声,并且在弱信号保留和同相轴连续性方面具有显著优势。 展开更多
关键词 地震数据去噪 卷积神经网络 TRANSFORMER 注意力模块 梯度融合
在线阅读 下载PDF
互补盲点策略和U型Transformer的地震数据去噪
5
作者 高磊 许轩 +1 位作者 罗芯汭 闵帆 《计算机应用研究》 北大核心 2025年第7期2056-2063,共8页
去除随机噪声可以显著提高地震数据的信噪比(SNR)。盲点驱动的无监督去噪方法无需标注数据,能自动提取特征,但其忽略了噪声相关性,导致去噪性能较差。为此,提出了互补盲点策略和U型Transformer的地震数据去噪框架(CBUTS)。首先,使用互... 去除随机噪声可以显著提高地震数据的信噪比(SNR)。盲点驱动的无监督去噪方法无需标注数据,能自动提取特征,但其忽略了噪声相关性,导致去噪性能较差。为此,提出了互补盲点策略和U型Transformer的地震数据去噪框架(CBUTS)。首先,使用互补盲点策略,通过迹线掩码和随机掩码互补采样,有效削弱噪声的空间联系;其次,引入可见盲点损失函数,融合非盲点和盲点去噪结果,降低信息损失;最后,设计了一种基于Transformer的U型盲点网络(STU-Net),通过增强全局和局部特征捕捉,进一步削弱噪声相关性,更准确地预测有效信号。实验结果表明,与经典以及先进的有监督和无监督方法进行比较,CBUTS在去除噪声和保留同相轴连续性方面效果更好。通过对结果的分析和比较,证明该方法完全适用于地震数据去噪。 展开更多
关键词 地震数据去噪 无监督 盲点策略 TRANSFORMER
在线阅读 下载PDF
基于用户评分习惯的无趣项识别及协同过滤方法
6
作者 彭子峰 张恒汝 +2 位作者 徐媛媛 余一帆 闵帆 《南京大学学报(自然科学版)》 北大核心 2025年第2期261-269,共9页
数据稀疏性和用户的选择偏差对协同过滤算法的推荐性能产生了负面影响,然而,现有的方法仅根据用户的评分信息进行加权矩阵分解,通过识别无趣项和使用统一的低值填充无趣项来缓解这些问题,而忽略了用户的评分习惯和项目质量差异.为了解... 数据稀疏性和用户的选择偏差对协同过滤算法的推荐性能产生了负面影响,然而,现有的方法仅根据用户的评分信息进行加权矩阵分解,通过识别无趣项和使用统一的低值填充无趣项来缓解这些问题,而忽略了用户的评分习惯和项目质量差异.为了解决这一问题,提出一种基于用户评分习惯的方法,结合显式反馈和隐式反馈的优点,并采用多种低值填充的填充策略.该方法分为识别无趣项和填充无趣项两个阶段.首先,在识别无趣项阶段,利用显式反馈数据挖掘用户的评分习惯并结合隐式反馈数据来推测使用前偏好;其次,在无趣项填充阶段,引入项目质量的概念,并根据显式反馈数据将无趣项划分为低质量和高质量两部分,分别以不同的低值填充.在两个公开数据集上进行实验,结果表明,提出的方法在无趣项的识别和填充阶段都优于已有方法,显著改善了协同过滤算法在top-N推荐中的性能. 展开更多
关键词 协同过滤 数据稀疏性 使用前偏好 推荐系统 选择偏差 无趣项
在线阅读 下载PDF
融合四种注意力机制的多尺度残差地震数据去噪网络
7
作者 高磊 樊星灿 +2 位作者 乔昊炜 闵帆 杨梅 《南京大学学报(自然科学版)》 CSCD 北大核心 2024年第5期763-775,共13页
去除随机噪声是地震数据处理的一个重要步骤.基于卷积神经网络的很多方法只考虑单尺度特征,不能自适应地线性聚合地震数据特征,因而难以去除复杂的噪声并保护弱信号.提出融合四种注意力机制的多尺度卷积残差地震去噪网络(MARN),它主要... 去除随机噪声是地震数据处理的一个重要步骤.基于卷积神经网络的很多方法只考虑单尺度特征,不能自适应地线性聚合地震数据特征,因而难以去除复杂的噪声并保护弱信号.提出融合四种注意力机制的多尺度卷积残差地震去噪网络(MARN),它主要包括三个部分:单尺度特征提取层、多尺度特征取层、特征恢复层.单尺度特征提取层使用单个相同卷积核提取全局特征.多尺度特征提取层包含多个残差多尺度注意力特征提取块(RMSAB),每块由多个多轴注意力多尺度特征融合块(MAFB)组成. MAFB包含三个结构:特征提取结构通过四种注意力机制提取局部细特征,特征融合结构融合四种注意力机制提取的特征,特征传输结构传递特征至特征恢复层.特征恢复层融合提取的单尺度和多尺度特征,获得去噪地震数据.实验结果表明,MARN不仅能更具针对性地去除随机噪声,还能更好地保留弱信号. 展开更多
关键词 去除随机噪声 卷积神经网络 多注意力机制 多尺度特征 残差网络
在线阅读 下载PDF
三支残差修正的时间序列预测 被引量:2
8
作者 方宇 贾春虹 +1 位作者 吴思琪 闵帆 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2023年第3期363-372,共10页
时间序列预测是大数据发展背景下的重要研究课题,具有广泛的应用前景,其主要任务是根据时序数据反映的发展规律去推测未来某阶段的走势,但大多数预测模型未能充分考虑残差带来的影响,无法取得更优的预测结果 .提出一种三支残差修正的融... 时间序列预测是大数据发展背景下的重要研究课题,具有广泛的应用前景,其主要任务是根据时序数据反映的发展规律去推测未来某阶段的走势,但大多数预测模型未能充分考虑残差带来的影响,无法取得更优的预测结果 .提出一种三支残差修正的融合时序预测模型,能够有效地将残差圈定在一定范围内,提高时间序列的预测精度.首先,利用时间序列分解算法STL (Seasonal-Trend Decomposition Procedure Based on Loess)将时间序列分解为趋势项、周期项和余项;其次,针对分解后的三个分量,设计轻量级梯度提升机(Lightweight Gradient Boosting Machine,LightGBM)和时间卷积网络(Temporal Convolutional Network,TCN)的融合预测模型;最后,结合三支决策理论设计了三支残差修正算法,修正余项预测过程中产生的残差,进而修正时间序列的预测结果 .实验结果证明,提出的模型在绝大多数情况下优于其他对比模型,预测效果更好. 展开更多
关键词 LightGBM STL TCN 时序预测 三支决策
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部