期刊文献+
共找到1,009篇文章
< 1 2 51 >
每页显示 20 50 100
Controlling update distance and enhancing fair trainable prototypes in federated learning under data and model heterogeneity
1
作者 Kangning Yin Zhen Ding +1 位作者 Xinhui Ji Zhiguo Wang 《Defence Technology(防务技术)》 2025年第5期15-31,共17页
Heterogeneous federated learning(HtFL)has gained significant attention due to its ability to accommodate diverse models and data from distributed combat units.The prototype-based HtFL methods were proposed to reduce t... Heterogeneous federated learning(HtFL)has gained significant attention due to its ability to accommodate diverse models and data from distributed combat units.The prototype-based HtFL methods were proposed to reduce the high communication cost of transmitting model parameters.These methods allow for the sharing of only class representatives between heterogeneous clients while maintaining privacy.However,existing prototype learning approaches fail to take the data distribution of clients into consideration,which results in suboptimal global prototype learning and insufficient client model personalization capabilities.To address these issues,we propose a fair trainable prototype federated learning(FedFTP)algorithm,which employs a fair sampling training prototype(FSTP)mechanism and a hyperbolic space constraints(HSC)mechanism to enhance the fairness and effectiveness of prototype learning on the server in heterogeneous environments.Furthermore,a local prototype stable update(LPSU)mechanism is proposed as a means of maintaining personalization while promoting global consistency,based on contrastive learning.Comprehensive experimental results demonstrate that FedFTP achieves state-of-the-art performance in HtFL scenarios. 展开更多
关键词 heterogeneous federated learning Model heterogeneity data heterogeneity Contrastive learning
在线阅读 下载PDF
3D Geological Modeling with Multi-source Data Integration in Polymetallic Region:A Case Study of Luanchuan,Henan Province,China 被引量:1
2
作者 Gongwen Wang~(1,2),Shouting Zhang~(1,2),Changhai Yan~3,Yaowu Song~3,Limei Wang~1 1.School of Earth Sciences and Resources,China University of Geosciences(Beijing),Beijing 100083,China. 2.State Key laboratory of Geological Processes and Mineral Resources,China University of Geosciences,Beijing 100083,China 3.Henan Institute of Geological Survey,Zhengzhou 450007,China 《地学前缘》 EI CAS CSCD 北大核心 2009年第S1期166-167,共2页
The development of 3D geological models involves the integration of large amounts of geological data,as well as additional accessible proprietary lithological, structural,geochemical,geophysical,and borehole data.Luan... The development of 3D geological models involves the integration of large amounts of geological data,as well as additional accessible proprietary lithological, structural,geochemical,geophysical,and borehole data.Luanchuan,the case study area,southwestern Henan Province,is an important molybdenum-tungsten -lead-zinc polymetallic belt in China. 展开更多
关键词 3D GEOLOGICAL modeling multi-source data MINERAL exploration METALLOGENIC model virtual GEOLOGICAL section Luanchuan POLYMETALLIC REGION
在线阅读 下载PDF
联邦原型学习的特征图中毒攻击和双重防御机制 被引量:2
3
作者 王瑞锦 王金波 +3 位作者 张凤荔 李经纬 李增鹏 陈厅 《软件学报》 北大核心 2025年第3期1355-1374,共20页
联邦学习是一种无需用户共享私有数据、以分布式迭代协作训练全局机器学习模型的框架.目前流行的联邦学习方法FedProto采用抽象类原型(称为特征图)聚合,优化模型收敛速度和泛化能力.然而,该方法未考虑所聚合的特征图的正确性,而错误的... 联邦学习是一种无需用户共享私有数据、以分布式迭代协作训练全局机器学习模型的框架.目前流行的联邦学习方法FedProto采用抽象类原型(称为特征图)聚合,优化模型收敛速度和泛化能力.然而,该方法未考虑所聚合的特征图的正确性,而错误的特征图可能导致模型训练失效.为此,首先探索针对FedProto的特征图中毒攻击,论证攻击者只需通过置乱训练数据的标签,便可将模型的推测准确率至多降低81.72%.为了抵御上述攻击,进一步提出双重防御机制,分别通过全知识蒸馏和特征图甄别排除错误的特征图.基于真实数据集的实验表明,防御机制可将受攻击模型的推测准确率提升1-5倍,且仅增加2%系统运行时间. 展开更多
关键词 联邦学习 数据异构 知识蒸馏 特征图中毒攻击 双重防御机制
在线阅读 下载PDF
基于异构数据的联邦学习自适应差分隐私方法研究 被引量:1
4
作者 徐茹枝 仝雨蒙 戴理朋 《信息网络安全》 北大核心 2025年第1期63-77,共15页
在联邦学习中,由于需要大量的参数交换,可能会引发来自不可信参与设备的安全威胁。为了保护训练数据和模型参数,必须采用有效的隐私保护措施。鉴于异构数据的不均衡特性,文章提出一种自适应性差分隐私方法来保护基于异构数据的联邦学习... 在联邦学习中,由于需要大量的参数交换,可能会引发来自不可信参与设备的安全威胁。为了保护训练数据和模型参数,必须采用有效的隐私保护措施。鉴于异构数据的不均衡特性,文章提出一种自适应性差分隐私方法来保护基于异构数据的联邦学习的安全性。首先为不同的客户端设置不同的初始隐私预算,对局部模型的梯度参数添加高斯噪声;其次在训练过程中根据每一轮迭代的损失函数值,动态调整各个客户端的隐私预算,加快收敛速度;接着设定一个可信的中央节点,对不同客户端的局部模型的每一层参数进行随机交换,然后将混淆过后的局部模型参数上传到中央服务器进行聚合;最后中央服务器聚合可信中央节点上传的混淆参数,根据预先设定的全局隐私预算阈值,对全局模型添加合适的噪声,进行隐私修正,实现服务器层面的隐私保护。实验结果表明,在相同的异构数据条件下,相对于普通的差分隐私方法,该方法具有更快的收敛速度以及更好的模型性能。 展开更多
关键词 联邦学习 异构数据 差分隐私 高斯噪声
在线阅读 下载PDF
机场智能跑道系统的多源数据集成与应用
5
作者 凌建明 侯天新 +2 位作者 刘诗福 陶泽峰 李沛霖 《同济大学学报(自然科学版)》 北大核心 2025年第7期1047-1054,共8页
在现有智能跑道内涵、架构基础上,针对智能跑道数据流转难题,系统分析了智能跑道海量、多源、异构、异频的数据特征。基于此,提出了面向智能跑道的多层次数据集成原理、多平台物理构成和全过程数据流架构。结合数据高效可靠利用、分类... 在现有智能跑道内涵、架构基础上,针对智能跑道数据流转难题,系统分析了智能跑道海量、多源、异构、异频的数据特征。基于此,提出了面向智能跑道的多层次数据集成原理、多平台物理构成和全过程数据流架构。结合数据高效可靠利用、分类长效保存需求,阐述了智能跑道数据预处理、标准化处理方法,总结了智能跑道数据存储特点,并建立了对应的多级存储架构与关联存储模式。日喀则定日机场落地应用表明,在不丢失有效信息的前提下减少无效信息超过95%,完成所有数据的统一管理、多源共享,推动智能跑道性能实时评价、风险超前预警、智能维护决策等优势功能的实现。 展开更多
关键词 机场工程 智能跑道 数据集成 多源异构 数据处理 数据存储
在线阅读 下载PDF
基于数据流分割和能耗感知的异构服务器系统任务调度
6
作者 杨晨 肖晶 王密 《计算机科学》 北大核心 2025年第2期291-298,共8页
异构服务器平台为大型系统提供了强大的计算能力,但也带来了系统复杂性和能耗管理方面的挑战。针对异构服务器系统中的依赖任务,深入探讨了基于数据流分割的能耗感知调度问题。首先,对系统环境、依赖任务及数据流传输模式进行了建模,并... 异构服务器平台为大型系统提供了强大的计算能力,但也带来了系统复杂性和能耗管理方面的挑战。针对异构服务器系统中的依赖任务,深入探讨了基于数据流分割的能耗感知调度问题。首先,对系统环境、依赖任务及数据流传输模式进行了建模,并将能耗感知调度问题表述为一个约束优化问题,以最小化任务的调度完成时间。随后,提出了一种基于数据流分割和任务优先级策略的能耗感知调度算法DSEA。该算法通过优化数据流分割策略、任务优先级和基于权重的能耗分配,为每个任务寻找近似最优的启动时间和服务器分配方案。为了验证所提方法的有效性,从阿里巴巴集群数据集中随机选取了1000个不同长度范围的作业进行仿真实验。实验结果表明,DSEA算法在不同应用场景下较3种现有算法表现出显著的性能优势。 展开更多
关键词 异构服务器 能耗感知 数据流分割 依赖任务调度 任务优先级
在线阅读 下载PDF
异构环境感知的幂律图流划分算法
7
作者 杨巍 白璐 +3 位作者 宁俊义 董建军 单春海 信俊昌 《计算机应用》 北大核心 2025年第S1期177-182,共6页
图划分在分布式处理大规模图数据中扮演着关键的角色。通过平衡节点的工作负载和通信成本,图划分算法提高了同构集群的幂律图处理效率。然而,异构集群节点的计算能力和通信能力不一致,节点处理相同工作负载的时间成本不同,且最慢的节点... 图划分在分布式处理大规模图数据中扮演着关键的角色。通过平衡节点的工作负载和通信成本,图划分算法提高了同构集群的幂律图处理效率。然而,异构集群节点的计算能力和通信能力不一致,节点处理相同工作负载的时间成本不同,且最慢的节点会成为系统瓶颈。为了解决上述问题,提出异构感知流划分(SHAP)算法。SHAP算法采用One-pass流式邻域启发式划分策略,根据节点的性能来最小化分区间的图处理时间。通过复制因子分析,SHAP算法的划分质量被证明具有理论上界。在一个具有4个真实世界图的异构集群中进行图处理实验的结果表明,与高度优先复制(HDRF)图划分算法相比,SHAP算法的图处理时间最多可以减少67.49%,而SHAP算法的复制因子最小仅为HDRF算法的47.06%。 展开更多
关键词 异构环境 图划分 分布式计算 图计算 数据管理
在线阅读 下载PDF
基于异构数据的患者术后非计划内再入院预测
8
作者 俞凯 董小锋 +2 位作者 袁贞明 崔朝健 罗伟斌 《工程科学与技术》 北大核心 2025年第1期89-97,共9页
非计划内再入院是医院风险管理的重要信号,也是医疗质量的重要指标。目前,再入院预测已经成为医疗系统的一项重要任务,大量学者结合机器学习技术提出非常多有效的预测方法,但大多仅以单一结构数据为研究对象或仅使用串联方法融合异构数... 非计划内再入院是医院风险管理的重要信号,也是医疗质量的重要指标。目前,再入院预测已经成为医疗系统的一项重要任务,大量学者结合机器学习技术提出非常多有效的预测方法,但大多仅以单一结构数据为研究对象或仅使用串联方法融合异构数据。前者未能充分利用电子病历中丰富的数据与信息,后者则未能更好地融合异构数据的信息。基于上述问题,本文提出了一种基于CTFN异构数据融合方法,结合患者出院小结文本与住院期间产生的横断面数据预测患者再入院风险。预测模型的构建分为3个步骤。首先,利用RoBerta模型提取患者出院小结中的特征信息并得到表征矩阵;其次,使用CNN模型学习患者横断面特征信息,得到表征矩阵;最后,通过CTFN方法融合两个表征矩阵,得到异构数据的表征矩阵并通过线性层分类器得到最后的预测结果。CTFN融合方法利用张量外积融合多个单模态表征矩阵,并增加CNN模型及残差结构设计加强异构数据模态内与模态间的信息学习。根据某公立医院的临床数据对上述方法进行验证,实验结果表明其表现出色,其中,召回率达到了76.1%,ROC曲线下面积达到了71.5%,均高于所对比的基线模型。证实了异构数据能提升分类器预测效果,且CTFN融合方法能够更好地融合异构数据间的信息,进一步提升分类器预测效果。 展开更多
关键词 异构数据 深度学习 张量融合 再入院 卷积网络 残差结构
在线阅读 下载PDF
异质环境下原型联邦学习模型距离校正与聚合算法
9
作者 王鑫 丁雪爽 《计算机工程与应用》 北大核心 2025年第7期176-187,共12页
针对联邦学习中因客户端数据集非独立同分布及设备算力参差不齐所导致的模型偏差大、收敛不稳定及泛化性差等问题,提出了一种基于原型联邦学习模型距离校正与聚合算法(FedMPD)。FedMPD在客户端本地构建嵌入网络提取异质数据特征,并通过... 针对联邦学习中因客户端数据集非独立同分布及设备算力参差不齐所导致的模型偏差大、收敛不稳定及泛化性差等问题,提出了一种基于原型联邦学习模型距离校正与聚合算法(FedMPD)。FedMPD在客户端本地构建嵌入网络提取异质数据特征,并通过设置局部与全局原型的修正项来校正客户端模型。此外,算法引入了原型距离约束条件,允许客户端根据局部原型与全局原型的距离阈值自适应调整训练周期,以缓解设备异质性的影响。在模型聚合阶段,FedMPD采用了一种加权聚合策略,该策略综合考虑客户端的数据量和局部原型质量,以更准确地量化不同客户端对全局模型的贡献度。实验结果表明,FedMPD在模型收敛稳定性、测试损失降低以及测试精度提升等方面均显著优于传统联邦学习算法,为异质环境下联邦学习提供了一种稳定、高效且逻辑严谨的方法。 展开更多
关键词 联邦学习 原型学习 对比损失 度量学习 异质性数据处理
在线阅读 下载PDF
用于交通流预测的时空异质化两阶段融合网络
10
作者 侯越 尹杰 +1 位作者 张志豪 卢可可 《华南理工大学学报(自然科学版)》 北大核心 2025年第5期82-93,共12页
针对现有交通流预测研究中存在的未能充分融合复杂时空相关性和时空异质性的问题,该文设计了一种基于栅格数据的交通流预测网络——时空异质化两阶段融合网络(Spatiotemporal Heterogeneous Two-Stage Fusion Neural Network,ST_HTFNN)... 针对现有交通流预测研究中存在的未能充分融合复杂时空相关性和时空异质性的问题,该文设计了一种基于栅格数据的交通流预测网络——时空异质化两阶段融合网络(Spatiotemporal Heterogeneous Two-Stage Fusion Neural Network,ST_HTFNN)。该网络使用分阶段、层次化的时空特征提取架构,采用静态和动态特征提取阶段串行的新模式,在静态特征提取阶段引入新颖的类曼巴线性注意力(Mamba-Like Linear Attention,MLLA)块作为静态异质化融合单元,实现空间上的相关性和异质性融合挖掘,在动态特征提取阶段设计了简单高效的动态异质化融合单元,通过膨胀卷积和门控机制的结合来自适应融合捕捉全局和局部的时空相关性和异质性。同时,针对细致到道路级的交通流特征,设计了道路特征增强模块来重建和增强道路信息,以解决深度卷积过程中道路特征平滑的问题。最后,设计了外部扰动特征融合模块来融合外部扰动特征对交通流预测结果的影响。在3个现实世界的交通数据集BikeNYC、TaxiCQ和TaxiBJ上进行的模型实验表明,ST_HTFNN模型展现出了超越现有基线模型的卓越性能,相应的预测精度平均绝对误差分别降低了6.13%、0.8%和7.01%。 展开更多
关键词 交通流预测 栅格数据 时空异质化 膨胀卷积 门控机制
在线阅读 下载PDF
基于多传感器数据融合的互异网络轴承故障诊断方法
11
作者 赵小强 李森 《计算机工程与应用》 北大核心 2025年第5期323-333,共11页
为了解决单传感器单一分支网络的输入容易受到外界干扰以及在不同域信号转换过程中丢失特征信息,导致故障诊断效果不佳的问题,提出了基于多传感器数据融合的互异网络轴承故障诊断方法。设计了数据预处理模块,以数据级的融合方式实现来... 为了解决单传感器单一分支网络的输入容易受到外界干扰以及在不同域信号转换过程中丢失特征信息,导致故障诊断效果不佳的问题,提出了基于多传感器数据融合的互异网络轴承故障诊断方法。设计了数据预处理模块,以数据级的融合方式实现来自多传感器的多角度故障特征互补,充分考虑了轴承设备多传感器之间的相关性。同时,将经过快速傅里叶变换(FFT)和频率切片小波变换(FSWT)处理后的信号融合为多域信号作为模型的输入,以多域信号独立作为模型输入的形式确保不同域信号在转换过程中关键的特征信息不会丢失。该方法针对不同的域信号设计了相对应的互异网络结构对多传感器数据高维非线性空间中的低维特征关键提取,这也为设备维修人员提供了更加可靠方便的维修手段。当其中一个分支网络的输入受到外界干扰时,另外两个分支网络会起到纠错的作用,不仅增强了网络的容错能力,同时也会增加网络的特征互补能力。利用记忆单元将特征视为不同的时间步,以此建立不同故障特征之间的依赖关系。为了防止模型陷入局部最优,使用适配于所提模型的学习率余弦退火算法优化模型训练。在两个轴承数据集上进行实验,结果表明,该方法拥有好的故障诊断效果和泛化能力,可以满足基于多传感器数据融合的轴承故障诊断任务。 展开更多
关键词 滚动轴承 故障诊断 多传感器 互异网络 数据融合 特征互补
在线阅读 下载PDF
数字孪生中混合知识蒸馏辅助的异构联邦类增量学习
12
作者 张铭泉 贾圆圆 张荣华 《智能系统学报》 北大核心 2025年第4期905-915,共11页
在数字孪生背景下,联邦学习面临数据非独立同分布和类别动态变化的挑战,即空间和时间范围内的数据异构问题。为解决这一问题,本文构建了一个数字孪生背景下的联邦类增量学习整体框架,并提出了一种混合知识蒸馏辅助的联邦类增量学习方法... 在数字孪生背景下,联邦学习面临数据非独立同分布和类别动态变化的挑战,即空间和时间范围内的数据异构问题。为解决这一问题,本文构建了一个数字孪生背景下的联邦类增量学习整体框架,并提出了一种混合知识蒸馏辅助的联邦类增量学习方法。具体来说,与传统联邦学习本地更新方式不同,本文方法通过自适应语义蒸馏损失和自适应注意力蒸馏损失集成的混合知识蒸馏方法提取旧全局模型中输出层的软标签语义知识和中间层的高维特征知识,使客户端模型在拟合新数据的同时有效减少对旧数据的遗忘,提升联邦类增量模型的性能。在相同的数据异构情况下,与对比模型相比,本文方法在CIFAR100数据集上精度提升1.85%~2.56%,在医学CT图像数据集OrganAMNIST、OrganCMNIST、OrganSMNIST上也取得了最优或次优的性能。 展开更多
关键词 数字孪生 联邦类增量学习 混合知识蒸馏 数据异构 图像分类 灾难性遗忘 CT图像 联邦学习
在线阅读 下载PDF
高性能YOLOv3-tiny嵌入式硬件加速器的混合优化设计
13
作者 谭会生 肖鑫凯 卿翔 《半导体技术》 CAS 北大核心 2025年第1期55-63,共9页
为解决在嵌入式设备中部署神经网络受算法复杂度、执行速度和硬件资源约束的问题,基于Zynq异构平台,设计了一个高性能的YOLOv3-tiny网络硬件加速器。在算法优化方面,将卷积层和批归一化层融合,使用8 bit量化算法,简化了算法流程;在加速... 为解决在嵌入式设备中部署神经网络受算法复杂度、执行速度和硬件资源约束的问题,基于Zynq异构平台,设计了一个高性能的YOLOv3-tiny网络硬件加速器。在算法优化方面,将卷积层和批归一化层融合,使用8 bit量化算法,简化了算法流程;在加速器架构设计方面,设计了可动态配置的层间流水线和高效的数据传输方案,缩短了推理时间,减小了存储资源消耗;在网络前向推理方面,针对卷积计算,基于循环展开策略,设计了8通道并行流水的卷积模块;针对池化计算,采用分步计算策略实现对连续数据流的高效处理;针对上采样计算,提出了基于数据复制的2倍上采样方法。实验结果表明,前向推理时间为232 ms,功耗仅为2.29 W,系统工作频率为200 MHz,达到了23.97 GOPS的实际算力。 展开更多
关键词 YOLOv3-tiny网络 异构平台 硬件加速器 动态配置架构 硬件混合优化 数据复制上采样
在线阅读 下载PDF
云计算环境下多模态异构网络数据安全存储方法
14
作者 李晓静 杨秀杰 《现代电子技术》 北大核心 2025年第6期63-67,共5页
为了快速、准确地存储多模态异构网络数据,提出一种云计算环境下多模态异构网络数据安全存储方法。采用编译套件部署多模态异构网络,利用后端编译模组生成网络的初始化配置,再利用前端编译模组分析与优化网络。针对多模态异构网络,构建... 为了快速、准确地存储多模态异构网络数据,提出一种云计算环境下多模态异构网络数据安全存储方法。采用编译套件部署多模态异构网络,利用后端编译模组生成网络的初始化配置,再利用前端编译模组分析与优化网络。针对多模态异构网络,构建包括客户端、服务器端、云存储服务插件、元数据存储的私有云存储架构。私有云存储架构采用虚拟化加解密方式,运行基于匿名广播加密的数据加密算法,引入拉格朗日插值方法,利用数据对应的会话密钥实现多模态异构网络数据的安全存储。实验结果表明,所提方法能够高效地存储多模态异构网络数据,数据传输的吞吐量高于3 Mb/s,加解密耗时低,存储的完整性高。 展开更多
关键词 云计算环境 多模态 异构网络 数据安全 存储方法 匿名广播加密 云存储架构
在线阅读 下载PDF
基于无人机多光谱数据和氮素空间分异的玉米冠层氮浓度估算 被引量:2
15
作者 郝琪 陈天陆 +4 位作者 王富贵 王振 白岚方 王永强 王志刚 《作物学报》 CAS 北大核心 2025年第1期189-206,共18页
作物冠层氮素营养的遥感诊断对指导作物精准施氮,提高作物氮效率和产量具有重要意义。本研究针对玉米冠层纵深大影响无人机估算氮浓度精度的问题,基于2022年和2023年不同氮肥运筹处理下田间无人机多光谱数据和氮浓度实测数据,分析玉米... 作物冠层氮素营养的遥感诊断对指导作物精准施氮,提高作物氮效率和产量具有重要意义。本研究针对玉米冠层纵深大影响无人机估算氮浓度精度的问题,基于2022年和2023年不同氮肥运筹处理下田间无人机多光谱数据和氮浓度实测数据,分析玉米冠层氮浓度空间分布特征,并利用随机森林算法确定估算冠层氮浓度的有效叶层。进一步结合随机森林算法和多光谱植被指数构建有效叶层氮浓度估算模型,最终将有效叶层氮浓度转换到冠层尺度实现冠层氮浓度的估算。结果表明:(1)九叶展期和大喇叭口期玉米冠层氮浓度表现为上层叶片>中层叶片>下层叶片,吐丝期和乳熟期表现为中层叶片>上层叶片>下层叶片。(2)各时期估算冠层氮浓度的有效叶层分别为下层、中层、中层和中层。与支持向量回归模型相比,随机森林回归估算冠层氮浓度的精度较高。(3)结合随机森林算法,基于有效叶层氮浓度估算冠层氮浓度的平均RMSE、NRMSE和MAE分别为0.10%、4.41%和0.07%,而直接基于植被指数估算冠层氮浓度的平均RMSE、NRMSE和MAE分别为0.19%、9.00%和0.15%。综上,玉米冠层氮浓度存在空间分异特征,估算冠层氮浓度时考虑基于随机森林和植被指数估算的有效叶层氮浓度能明显提高冠层氮浓度的估算精度。本研究确定的考虑空间分异的冠层氮浓度估算框架可为玉米氮素营养实时诊断提供理论支撑。 展开更多
关键词 玉米 冠层氮浓度 氮素空间分异 多光谱数据 机器学习
在线阅读 下载PDF
基于相似性的个性化联邦学习模型聚合框架 被引量:2
16
作者 武文媗 王灿 +2 位作者 黄静静 吴秋新 秦宇 《计算机应用研究》 北大核心 2025年第1期125-132,共8页
传统联邦学习中经过加权聚合得到的全局模型无法应对跨客户端的数据异构的问题。现有研究通过形成个性化模型应对,但个性化模型如何平衡全局的共性信息和本地的个性信息是一个挑战。针对上述问题,提出了一种个性化联邦学习模型聚合框架F... 传统联邦学习中经过加权聚合得到的全局模型无法应对跨客户端的数据异构的问题。现有研究通过形成个性化模型应对,但个性化模型如何平衡全局的共性信息和本地的个性信息是一个挑战。针对上述问题,提出了一种个性化联邦学习模型聚合框架FedPG(federated learning with personalized global model)。FedPG基于客户端模型的相似性,将归一化后的模型参数变化量的余弦相似度作为模型聚合的个性化权重,从而实现面向客户端的全局模型个性化聚合。通过引入平滑系数,该框架可以灵活地调整模型中共性信息和个性信息的比重。为了降低平滑系数的选择成本,进一步提出调度平滑系数的个性化联邦学习模型聚合框架FedPGS(federated learning with personalized global model and scheduled personalization)。在实验中,FedPG和FedPGS两个框架使得FedAvg、FedProto、FedProx算法在特征分布偏移的数据集上的准确率平均提升1.20~11.50百分点,且使得模型的准确率受恶意设备的影响更小。结果表明,FedPG和FedPGS框架在数据异构和存在恶意设备干扰的情况下能有效提升模型的准确率和鲁棒性。 展开更多
关键词 个性化联邦学习 余弦相似度 数据异构 模型聚合 恶意设备
在线阅读 下载PDF
大语言模型和知识图谱协同的跨域异质数据查询框架 被引量:2
17
作者 吴文隆 尹海莲 +7 位作者 王宁 徐梦飞 赵鑫喆 殷崭祚 刘元睿 王昊奋 丁岩 李博涵 《计算机研究与发展》 北大核心 2025年第3期605-619,共15页
大语言模型(large language model,LLM)技术热潮对数据质量的要求提升到了一个新的高度.在现实场景中,数据通常来源不同且高度相关.但由于数据隐私安全问题,跨域异质数据往往不允许集中共享,难以被LLM高效利用.鉴于此,提出了一种LLM和... 大语言模型(large language model,LLM)技术热潮对数据质量的要求提升到了一个新的高度.在现实场景中,数据通常来源不同且高度相关.但由于数据隐私安全问题,跨域异质数据往往不允许集中共享,难以被LLM高效利用.鉴于此,提出了一种LLM和知识图谱(knowledge graph,KG)协同的跨域异质数据查询框架,在LLM+KG的范式下给出跨域异质数据查询的一个治理方案.为确保LLM能够适应多场景中的跨域异质数据,首先采用适配器对跨域异质数据进行融合,并构建相应的知识图谱.为提高查询效率,引入线性知识图,并提出同源知识图抽取算法HKGE来实现知识图谱的重构,可显著提高查询性能,确保跨域异质数据治理的高效性.进而,为保证多域数据查询的高可信度,提出可信候选子图匹配算法Trust HKGM,用于检验跨域同源数据的置信度计算和可信候选子图匹配,剔除低质量节点.最后,提出基于线性知识图提示的多域数据查询算法MKLGP,实现LLM+KG范式下的高效可信跨域查询.该方法在多个真实数据集上进行了广泛实验,验证了所提方法的有效性和高效性. 展开更多
关键词 大语言模型 跨域异质数据 知识图谱 多域数据查询 数据治理
在线阅读 下载PDF
面向时空面板数据的综合评价模型构建及应用 被引量:2
18
作者 安博文 许培源 +1 位作者 何伟军 袁亮 《统计与信息论坛》 北大核心 2025年第1期3-20,共18页
相关特征、时间特征和空间特征是时空面板数据决策中无可避免的三重特征。以三重特征为切入点给出相关因子、时间因子和空间因子的内涵定义,基于非参数方法利用互信息、卷积算法和转移概率分别度量三种因子;以AHP方法为例构建面向时空... 相关特征、时间特征和空间特征是时空面板数据决策中无可避免的三重特征。以三重特征为切入点给出相关因子、时间因子和空间因子的内涵定义,基于非参数方法利用互信息、卷积算法和转移概率分别度量三种因子;以AHP方法为例构建面向时空面板数据的综合评价模型,按照六条路径构造三因子判断矩阵,对通过一致性检验的赋权类型采用SPBIC准则选出最优结果;通过2001-2021年290个城市的数字经济发展指数合成,讨论时空AHP在实证分析中的特有功能。实例结果表明:六种赋权类型的数字经济发展指数在动态演变、时间收敛和空间集聚等趋势上有同有异,SPBIC准则的作用在于从多种赋权类型中选出最优结果以保证量化分析结论的唯一性;评价指标权重系数具有时空双维异质性及指标维度异质性,具体表现在偏好程度及次序等方面且各指标权重系数的时空双维异质性亦有区别,体现出时空综合评价模型的特有功能--因时因地判断影响综合指数的关键因素;赋权结果对时间因子粘性和空间因子粘性具有敏感性,指标权重系数随两种因子粘性的变化趋势不同,两种因子粘性都会影响特定时期特定城市综合指数的相对大小及排名,这使得时空AHP在实证分析中具有时空性、普适性和异质性等功能--适时加入时间因子和空间因子、灵活设定跨度时间和辐射范围以及通过时空因子粘性进行异质性讨论。 展开更多
关键词 时空面板数据 AHP判断矩阵 时空双维异质性 时空因子粘性 数字经济
在线阅读 下载PDF
基于多源数据融合的新兴技术识别方法研究 被引量:3
19
作者 王宏 刘沁莹 +2 位作者 胡玉峰 王庆红 周育忠 《科技进步与对策》 北大核心 2025年第5期21-31,共11页
新兴技术在科技革命和产业变革中发挥着重要作用,准确把握新兴技术发展方向有助于国家政策制定和科技快速发展。融合学术论文和专利文献数据,构建一套新兴技术识别方法。通过主题N元语法(TNG)模型抽取和筛选技术主题,确定关键技术主题,... 新兴技术在科技革命和产业变革中发挥着重要作用,准确把握新兴技术发展方向有助于国家政策制定和科技快速发展。融合学术论文和专利文献数据,构建一套新兴技术识别方法。通过主题N元语法(TNG)模型抽取和筛选技术主题,确定关键技术主题,通过量化新兴技术的5项特征指标:影响力、增长性、连贯性、创新性、不确定性和模糊性,计算新兴指数得分,对多源数据融合新兴技术进行识别和预判。预测新兴技术未来发展趋势,可为电网领域可持续发展提供有价值的参考,验证研究方法的可行性和有效性。 展开更多
关键词 新兴技术 多源异构数据融合 新兴技术画像 机器学习
在线阅读 下载PDF
基于数据增强的异质图注意力网络
20
作者 杨应修 陈红梅 +1 位作者 周丽华 肖清 《计算机科学》 北大核心 2025年第3期180-187,共8页
异质图是由不同类型节点及边构成的图,可建模现实世界中各种类型对象及其关系。异质图嵌入旨在捕捉图中丰富的属性、结构和语义等信息,学习节点嵌入向量,用于节点分类、链接预测等任务,进而实现用户识别、商品推荐等应用。在异质图嵌入... 异质图是由不同类型节点及边构成的图,可建模现实世界中各种类型对象及其关系。异质图嵌入旨在捕捉图中丰富的属性、结构和语义等信息,学习节点嵌入向量,用于节点分类、链接预测等任务,进而实现用户识别、商品推荐等应用。在异质图嵌入方法中,元路径通常被用来获取节点间的高阶结构和语义信息,然而现有方法忽略了元路径实例中不同类型节点或异质图中不同类型邻居节点的差异,导致信息丢失,进而影响节点嵌入质量。针对上述问题,提出基于数据增强的异质图注意力网络(Heterogeneous graph Attention Network based on Data Augmentation,HANDA),以更好地学习节点嵌入向量。首先,提出基于元路径邻居的边增强。该方法基于元路径获取节点的元路径邻居,用节点及其元路径邻居形成的语义边增强异质图。这些增强边不仅蕴含了节点间的高阶结构和语义,还缓解了异质图的稀疏性。其次,提出融入节点类型注意力的节点嵌入。该方法采用多头注意力从多个角度学习不同直接边邻居及增强边邻居的重要性并在注意力中融入节点的类型信息,进而通过消息传递、直接边邻居及增强边邻居同时获取节点的属性、高阶结构和语义信息,提升了节点嵌入质量。在真实数据集上的实验验证了HANDA模型在节点分类、链接预测任务上的效果优于基准模型。 展开更多
关键词 异质图 嵌入 元路径 数据增强 图神经网络
在线阅读 下载PDF
上一页 1 2 51 下一页 到第
使用帮助 返回顶部