期刊文献+
共找到38篇文章
< 1 2 >
每页显示 20 50 100
一种基于数据独立性的SVC核参数选择方法
1
作者 马亮 王文剑 《广西师范大学学报(自然科学版)》 CAS 北大核心 2007年第4期59-62,共4页
提出一种选择支持向量分类(Support Vector Classification,SVC)最优核参数的算法,称为MI(Maximum Isolation)算法,通过定义样本间的独立性,可以获得最优核参数和相应的最优学习模型。该算法可以在支持向量机训练之前得到最优的核参数,... 提出一种选择支持向量分类(Support Vector Classification,SVC)最优核参数的算法,称为MI(Maximum Isolation)算法,通过定义样本间的独立性,可以获得最优核参数和相应的最优学习模型。该算法可以在支持向量机训练之前得到最优的核参数,计算代价较小,实验证明所提出的算法简单有效。 展开更多
关键词 支持向量机 核参数 MI算法 数据独立
在线阅读 下载PDF
面向非独立同分布数据的迭代式联邦学习 被引量:1
2
作者 陈洪洋 李晓会 王天阳 《计算机工程与设计》 北大核心 2025年第4期1064-1071,共8页
针对现有的面向非独立同分布(non-IID)数据的联邦学习优化算法存在训练的模型缺失个性化、模型在测试集上精度较低的问题,提出一种迭代凝聚式簇估计联邦学习算法FL-ICE(iterative cluster estimation federated)。各个客户端联合训练单... 针对现有的面向非独立同分布(non-IID)数据的联邦学习优化算法存在训练的模型缺失个性化、模型在测试集上精度较低的问题,提出一种迭代凝聚式簇估计联邦学习算法FL-ICE(iterative cluster estimation federated)。各个客户端联合训练单个全局共享模型,迭代地依据客户端更新的相似度执行簇估计并通过梯度下降优化簇估计参数,对全局模型进行个性化处理。实验结果表明,该算法可以有效提升模型在测试集上的准确性,使得更大比例的客户端达到目标精度。 展开更多
关键词 联邦学习 分布式机器学习 个性化模型 迭代式训练 簇估计算法 独立同分布数据 隐私保护
在线阅读 下载PDF
非独立同分布下联邦半监督学习的数据分享研究 被引量:1
3
作者 顾永跟 高凌轩 +1 位作者 吴小红 陶杰 《计算机工程》 CAS CSCD 北大核心 2024年第6期188-196,共9页
联邦学习作为一种保护本地数据隐私安全的分布式机器学习方法,联合分散的设备共同训练共享模型。通常联邦学习在数据均有标签情况下进行训练,然而现实中无法保证标签数据完全存在,提出联邦半监督学习。在联邦半监督学习中,如何利用无标... 联邦学习作为一种保护本地数据隐私安全的分布式机器学习方法,联合分散的设备共同训练共享模型。通常联邦学习在数据均有标签情况下进行训练,然而现实中无法保证标签数据完全存在,提出联邦半监督学习。在联邦半监督学习中,如何利用无标签数据提升系统性能和如何缓解数据异质性带来的负面影响是两大挑战。针对标签数据仅在服务器场景,基于分享的思想,设计一种可应用在联邦半监督学习系统上的方法Share&Mark,该方法将客户端的分享数据由专家标记后参与联邦训练。同时,为充分利用分享的数据,根据各客户端模型在服务器数据集上的损失值动态调整各客户端模型在联邦聚合时的占比,即ServerLoss聚合算法。综合考虑隐私牺牲、通信开销以及人工标注成本3个方面的因素,对不同分享率下的实验结果进行分析,结果表明,约3%的数据分享比例能平衡各方面因素。此时,采用Share&Mark方法的联邦半监督学习系统FedMatch在CIFAR-10和Fashion-MNIST数据集上训练的模型准确率均可提升8%以上,并具有较优的鲁棒性。 展开更多
关键词 联邦半监督学习 联邦学习 数据独立同分布 鲁棒性 聚合算法 数据分享
在线阅读 下载PDF
面向非独立同分布数据的车联网多阶段联邦学习机制 被引量:3
4
作者 唐晓岚 梁煜婷 陈文龙 《计算机研究与发展》 EI CSCD 北大核心 2024年第9期2170-2184,共15页
车联网在智慧城市建设中扮演着不可或缺的角色,汽车不仅仅是交通工具,更是大数据时代信息采集和传输的重要载体.随着车辆采集的数据量飞速增长和人们隐私保护意识的增强,如何在车联网环境中确保用户数据安全,防止数据泄露,成为亟待解决... 车联网在智慧城市建设中扮演着不可或缺的角色,汽车不仅仅是交通工具,更是大数据时代信息采集和传输的重要载体.随着车辆采集的数据量飞速增长和人们隐私保护意识的增强,如何在车联网环境中确保用户数据安全,防止数据泄露,成为亟待解决的难题.联邦学习采用“数据不动模型动”的方式,为保护用户隐私和实现良好性能提供了可行方案.然而,受限于采集设备、地域环境、个人习惯的差异,多台车辆采集的数据通常表现为非独立同分布(non-independent and identically distributed,non-IID)数据,而传统的联邦学习算法在non-IID数据环境中,其模型收敛速度较慢.针对这一挑战,提出了一种面向non-IID数据的车联网多阶段联邦学习机制,称为FedWO.第1阶段采用联邦平均算法,使得全局模型快速达到一个基本的模型准确度;第2阶段采用联邦加权多方计算,依据各车辆的数据特性计算其在全局模型中的权重,聚合后得到性能更优的全局模型,同时采用传输控制策略,减少模型传输带来的通信开销;第3阶段为个性化计算阶段,车辆利用各自的数据进行个性化学习,微调本地模型获得与本地数据更匹配的模型.实验采用了驾驶行为数据集进行实验评估,结果表明相较于传统方法,在non-IID数据场景下,FedWO机制保护了数据隐私,同时提高了算法的准确度. 展开更多
关键词 车联网 联邦学习 独立同分布数据 隐私保护 传输控制
在线阅读 下载PDF
车联网环境下面向异构数据的隐私保护联邦学习
5
作者 张宇 咸鹤群 《密码学报(中英文)》 北大核心 2025年第3期545-564,共20页
随着车联网和智能制造领域相关技术的快速发展,车联网与人工智能的结合成为现代智慧交通发展的新方向.本文提出了一个车联网环境下信息共享的隐私保护联邦学习框架.该框架旨在解决车联网环境中客户端训练条件不一致、客户端数据漂移和... 随着车联网和智能制造领域相关技术的快速发展,车联网与人工智能的结合成为现代智慧交通发展的新方向.本文提出了一个车联网环境下信息共享的隐私保护联邦学习框架.该框架旨在解决车联网环境中客户端训练条件不一致、客户端数据漂移和模型数据隐私泄露的问题.智能车辆的移动和分布式特性使得联邦学习面临着不同的挑战.在此框架中,引入性能增强的异构数据联邦学习算法.通过重写算法的训练优化步骤,并提出联邦学习广义更新规则,使得参数聚合过程可以考虑更多的因素.这本质上是一种归一化的平均方法,同时可以保证异构场景下更快的误差收敛.为了防止诚实且好奇的服务器和外部敌手从传输的参数中推断出隐私信息,现有方案使用差分隐私机制将噪声添加到本地参数以进行保护.然而,噪声会破坏学习过程并降低训练模型的效果.为此,本文提出了一种性能增强的差分隐私算法.该算法通过在本地优化目标函数中加入相应正则项,提高了训练模型对注入噪声的鲁棒性,降低了车联网设备在训练时受到的噪声影响,并给出了总的隐私预算统计.在合成数据集和真实世界的异构数据集上对框架的性能进行了评估.结果表明,框架表现优于现有的异构数据优化算法,且在相同的隐私保护水平下表现优于现有的基于差分隐私的联邦学习算法,更适用于车联网环境. 展开更多
关键词 车联网 联邦学习 独立同分布数据 差分隐私 效用隐私平衡
在线阅读 下载PDF
非独立数据及其协方差结构表达 被引量:3
6
作者 任仕泉 陈峰 杨树勤 《中国卫生统计》 CSCD 北大核心 1998年第4期4-8,共5页
目的:本文给出了非独立数据的定义及其特征。方法:探讨了几种常见的非独立数据(重复测量资料、纵向数据、交叉试验资料、多中心试验资料、整群抽样调查资料以及传染性或遗传性疾病资料等)之间的关系及其协方差结构。结果:提出了借... 目的:本文给出了非独立数据的定义及其特征。方法:探讨了几种常见的非独立数据(重复测量资料、纵向数据、交叉试验资料、多中心试验资料、整群抽样调查资料以及传染性或遗传性疾病资料等)之间的关系及其协方差结构。结果:提出了借助迭代法用广义最小二乘法来分析处理非独立数据的统计思路。结论:通过部分实例分析表明了几种常见的非独立数据协方差结构表达是合理的。 展开更多
关键词 独立数据 协方差结构 最小二乘法 疾病 调查
在线阅读 下载PDF
基于独立信息数据波动赋权的泥石流危险度评价 被引量:11
7
作者 陈鹏宇 余宏明 +2 位作者 刘勇 李才 彭祖武 《岩土力学》 EI CAS CSCD 北大核心 2013年第2期449-454,共6页
针对经典泥石流危险度评价中以灰色关联度作为次要危险因子筛选依据的不足,采用复相关系数作为泥石流次要危险因子筛选的依据,从而建立了泥石流危险度评价的主要危险因子与次要危险因子组合的多因子体系。在此基础上,针对次要危险与主... 针对经典泥石流危险度评价中以灰色关联度作为次要危险因子筛选依据的不足,采用复相关系数作为泥石流次要危险因子筛选的依据,从而建立了泥石流危险度评价的主要危险因子与次要危险因子组合的多因子体系。在此基础上,针对次要危险与主要危险因子之间存在显著相关性,同时为了体现次要危险因子对泥石流危险度的贡献作用,采用独立信息数据波动赋权法计算泥石流次要危险因子的权重,建立了泥石流危险度评价的计算公式。以此计算东川市12条泥石流沟的危险度评价结果,计算结果比经典方法更符合次要因子的补充地位,从而证明了该方法的合理性。 展开更多
关键词 危险度 泥石流 独立信息数据波动赋权法 复相关系数
在线阅读 下载PDF
独立于测试数据的字典编码方法 被引量:4
8
作者 吴海峰 詹文法 程一飞 《电子测量与仪器学报》 CSCD 北大核心 2016年第4期638-644,共7页
为减少测试数据量,提出一种新的独立于测试数据的字典编码方法。首先设计基于图论寻找团的启发式算法,合并相容扫描链,压缩测试数据宽度,然后利用最简分数对应浮点数的二进制形式生成字典,使用字典编码进一步压缩测试数据长度。该编码... 为减少测试数据量,提出一种新的独立于测试数据的字典编码方法。首先设计基于图论寻找团的启发式算法,合并相容扫描链,压缩测试数据宽度,然后利用最简分数对应浮点数的二进制形式生成字典,使用字典编码进一步压缩测试数据长度。该编码方法无需填充测试集中的无关位且字典的生成独立于测试数据,可以预先生成字典,缩短了测试时间;解压时无需存储字典,通过简单计算即可还原测试数据,减小了硬件开销。实验表明,该方法在ISCAS 89标准电路Mintest集上的平均压缩率达到65.57%,能够有效地压缩测试数据。 展开更多
关键词 测试数据压缩 相容组 字典编码 独立于测试数据
在线阅读 下载PDF
产业集聚效应测算的独立混合横截面数据模型 被引量:27
9
作者 吕晓英 吕胜利 《甘肃社会科学》 北大核心 2004年第5期232-236,共5页
本文指出了产业集聚效应研究中传统测算方法的局限 ,首次提出将横截面时间序列模型中的独立混合截面数据模型应用于产业集聚效应的测算 ,运用这种方法计算了 1985 - 2 0 0 2年兰州市工业行业的集聚效应 ,并从内部集聚经济。
关键词 产业集聚 独立混合横截面数据模型 兰州市
在线阅读 下载PDF
非独立数据内部相关系数的抽样分布
10
作者 顾海雁 陈峰 任仕泉 《中国卫生统计》 CSCD 北大核心 2002年第6期325-327,共3页
目的 研究非独立数据组内相关系数 ρ的抽样分布。 方法 用MonteCarlo方法从已知组内相关系数的假定总体中重复抽样 ,用RIGLS法拟合二水平模型 ,分别计算 ρ值以观察其分布类型。 结果 组内相关系数抽样分布类型随 ρ的数值大小而变... 目的 研究非独立数据组内相关系数 ρ的抽样分布。 方法 用MonteCarlo方法从已知组内相关系数的假定总体中重复抽样 ,用RIGLS法拟合二水平模型 ,分别计算 ρ值以观察其分布类型。 结果 组内相关系数抽样分布类型随 ρ的数值大小而变化 ,小于 0 5时为正偏态 ,大于 0 5时为负偏态 ,接近 0 5时为近似正态分布。其估计误差与 1水平和 2水平的样本含量有关 ,总样本含量相同时 ,2水平的样本含量越大 ,估计误差越小。结论 组内相关系数的大小反映非独立数据的共变关系大小 。 展开更多
关键词 组内相关系数 独立数据 MonteCrrlo方法 多水平模型 限制迭代广义最小二乘 卫生统计
在线阅读 下载PDF
面向非独立同分布数据的联邦学习研究进展 被引量:6
11
作者 郭桂娟 田晖 +3 位作者 皮慧娟 贾维嘉 彭绍亮 王田 《小型微型计算机系统》 CSCD 北大核心 2023年第11期2442-2449,共8页
在联邦学习中,因数据只需要在终端设备上进行训练而不需要上传到服务器端,从而有效的保证了数据的隐私性和安全性.目前关于联邦学习各方面的研究虽然取得了很大的进展,但是联邦学习中的非独立同分布数据问题仍然是一个难以攻克的难题.... 在联邦学习中,因数据只需要在终端设备上进行训练而不需要上传到服务器端,从而有效的保证了数据的隐私性和安全性.目前关于联邦学习各方面的研究虽然取得了很大的进展,但是联邦学习中的非独立同分布数据问题仍然是一个难以攻克的难题.本文对联邦学习中非独立同分布数据方面的研究进行了大量的调研,发现现有的研究主要涉及以下几个方面:性能优化、算法优化、模型优化、通信成本、隐私保护和个性化联邦学习等.为了归纳整理联邦学习中关于非独立同分布数据的相关研究,本文从以上各个方面详细介绍了现阶段联邦学习中有关非独立同分布数据的研究方案;最后分析了联邦学习中非独立同分布数据未来的研究方向,为今后联邦学习的研究指明方向. 展开更多
关键词 联邦学习 独立同分布数据 研究方案 研究进展
在线阅读 下载PDF
网络数据安全独立性之提倡及其刑法展开 被引量:14
12
作者 王惠敏 《法治研究》 CSSCI 2023年第3期117-131,共15页
我国刑法应当对数据安全加以独立保护,这不仅是基于数据安全刑法保护法益的需要,也是落实法秩序统一性原理的要求。为转变现行立法理念,提升立法技术,弥补处罚漏洞,我国刑法需要推进对数据安全的独立保护。首先,应当在刑法中构建信息安... 我国刑法应当对数据安全加以独立保护,这不仅是基于数据安全刑法保护法益的需要,也是落实法秩序统一性原理的要求。为转变现行立法理念,提升立法技术,弥补处罚漏洞,我国刑法需要推进对数据安全的独立保护。首先,应当在刑法中构建信息安全、数据安全和计算机信息系统安全并行的保护体系,专设“数据犯罪”专章或专节;其次,改变数据犯罪附属于信息犯罪、计算机信息系统犯罪的条款之立法模式,强化数据犯罪罪名与刑罚的主体性和独立性;再次,细化不同数据生存周期犯罪的罪状描述,贯彻数据分类分级保护理念;最后,通过刑事合规制度强化网络服务提供者职责,激励企业对涉及重大法益的犯罪行为事前进行预警和防控。 展开更多
关键词 计算机信息系统安全 数据安全独立保护 数据安全保护法益
在线阅读 下载PDF
非独立同分布工业大数据下联邦动态加权学习方法 被引量:4
13
作者 刘晶 朱家豪 +1 位作者 袁闰萌 季海鹏 《计算机集成制造系统》 EI CSCD 北大核心 2023年第5期1602-1614,共13页
联邦学习在不交换本地数据的情况下可以完成多方协作训练,很好地解决了工业物联网领域数据隐私保护及共享问题。但是传统的联邦学习在面对非独立同分布的工业数据时,会因为局部模型更新导致模型的偏移。针对上述问题,提出非独立同分布... 联邦学习在不交换本地数据的情况下可以完成多方协作训练,很好地解决了工业物联网领域数据隐私保护及共享问题。但是传统的联邦学习在面对非独立同分布的工业数据时,会因为局部模型更新导致模型的偏移。针对上述问题,提出非独立同分布工业大数据下联邦动态加权学习方法,该方法分为局部更新和全局聚合两个阶段。在局部更新阶段,利用联邦距离算法消除偏移程度过大的局部模型的影响;在全局聚合阶段,提出动态加权算法,动态的给对全局模型更有利的局部数据分配更大的训练权重。该方法既考虑了局部更新导致的模型偏移程度问题,又兼顾了偏移局部模型对全局模型的影响。通过实验验证了该方法在面对非独立同分布的工业数据时具有良好的效果。 展开更多
关键词 工业物联网 隐私保护 联邦学习 独立同分布数据
在线阅读 下载PDF
基于EMD最优匹配的分层联邦学习算法
14
作者 吴小红 李佩 +1 位作者 顾永跟 陶杰 《计算机工程》 北大核心 2025年第2期170-178,共9页
联邦学习允许多个客户端在不共享私有数据的情况下协同训练高性能的全局模型。在跨组织场景的水平联邦学习环境下,客户端本地数据分布中的统计异质性将降低全局模型的性能。为提升联邦学习的全局模型性能,同时避免牺牲客户端隐私和增加... 联邦学习允许多个客户端在不共享私有数据的情况下协同训练高性能的全局模型。在跨组织场景的水平联邦学习环境下,客户端本地数据分布中的统计异质性将降低全局模型的性能。为提升联邦学习的全局模型性能,同时避免牺牲客户端隐私和增加计算成本,提出一种新的混合联邦学习算法FedAvg-Match,其基本思路是通过改进联邦学习算法提升客户端的模型质量。该算法面向以不平衡标签分布为特征的数据异构性,在分层联邦学习框架下设计客户端分组聚合算法来减轻客户端数据异构性对模型性能的影响。针对客户端优化分组问题,设计一种基于动态规划的客户端匹配算法DP-ClientMatch,根据客户端的数据分布距离EMD得到最优的客户端分组匹配。在MNIST、Fashion-MNIST和CIFAR-103个数据集上的实验结果表明,与其他联邦学习算法相比,在高度统计异质性的联邦学习场景下,FedAvg-Match算法使全局模型测试精度最少可提高10百分点,可以显著提高联邦学习全局模型在图像分类任务上的性能。 展开更多
关键词 联邦学习 独立同分布数据 最优匹配 EMD最优匹配 模型质量
在线阅读 下载PDF
多数据库中间件的模型研究 被引量:13
15
作者 齐德昱 胡镜林 张鹏 《计算机工程与设计》 CSCD 北大核心 2005年第10期2602-2605,共4页
提出一种新的多数据库中间件架构,使得异源独立分布数据的“上推/受访/集成”模型化,从而使异源独立分布数据的存取/复用/集成,能像单一关系数据库那样走向模型化,建立“DBMS的DBMS”;讨论了该模型中的几个主要关键技术,如数据的一致性... 提出一种新的多数据库中间件架构,使得异源独立分布数据的“上推/受访/集成”模型化,从而使异源独立分布数据的存取/复用/集成,能像单一关系数据库那样走向模型化,建立“DBMS的DBMS”;讨论了该模型中的几个主要关键技术,如数据的一致性、数据的复制策略、局部数据源的即插即用研究、缓冲区系统中的数据名空间。 展开更多
关键词 数据库中间件 异源独立分布数据 全局数据对象模型
在线阅读 下载PDF
动态数据立方的范围查询
16
作者 李华旸 冯玉才 张志斌 《小型微型计算机系统》 CSCD 北大核心 2003年第11期2020-2023,共4页
根据 data cube层次性的特点和查询习惯提出了新的分块计算方法 ,并在此基础上提出了改进算法 .这种方法节约了存储空间 ,在 L BD粒度及其上的查询效率为 O(1 ) ,同时数据的更新时间大约为 O() ,还节约了大量的存储空间 ,并且使得数据... 根据 data cube层次性的特点和查询习惯提出了新的分块计算方法 ,并在此基础上提出了改进算法 .这种方法节约了存储空间 ,在 L BD粒度及其上的查询效率为 O(1 ) ,同时数据的更新时间大约为 O() ,还节约了大量的存储空间 ,并且使得数据立方具有了一定的结构独立性 ,能有效的减少重新构造数据立方 (reprocess)的次数 。 展开更多
关键词 范围查询(range query) 联机分析处理 数据立方 数据独立
在线阅读 下载PDF
引入第三方调节机制的我国独立董事制度再设计 被引量:1
17
作者 邱玉莲 余清平 《商业经济研究》 北大核心 2015年第8期90-92,共3页
独立董事制度引入我国已经有十余年的历史,取得一定效果的同时也受到很多质疑。本文从博弈论的视角分析了独立董事在我国未能充分发挥作用的原因,提出引入第三方独立董事数据库的建议,改变目前独立董事制度的选聘制度、薪酬发放方式以... 独立董事制度引入我国已经有十余年的历史,取得一定效果的同时也受到很多质疑。本文从博弈论的视角分析了独立董事在我国未能充分发挥作用的原因,提出引入第三方独立董事数据库的建议,改变目前独立董事制度的选聘制度、薪酬发放方式以及激励和约束机制,以期解决独立董事目前的困局。 展开更多
关键词 独立董事 博弈 独立董事数据
在线阅读 下载PDF
基于本地漂移和多样性算力的联邦学习优化算法
18
作者 张一鸣 曹腾飞 《计算机应用》 北大核心 2025年第5期1447-1454,共8页
针对联邦学习(FL)在边缘计算应用中所面临的非独立同分布(non-IID)数据和异构算力挑战,为了避免non-IID数据导致客户端模型更新出现较大偏差,从而引发模型不稳定的收敛,引入本地漂移变量的概念;并通过校正本地模型参数,将本地训练过程... 针对联邦学习(FL)在边缘计算应用中所面临的非独立同分布(non-IID)数据和异构算力挑战,为了避免non-IID数据导致客户端模型更新出现较大偏差,从而引发模型不稳定的收敛,引入本地漂移变量的概念;并通过校正本地模型参数,将本地训练过程与全局聚合过程分离,优化FL在non-IID数据训练过程中的性能。此外,鉴于边缘服务器算力的多样性,提出一种新的策略:从全局模型中划分出一个简化的神经网络子模型下发给算力受限的边缘服务器进行训练,而高算力的边缘服务器则使用整个全局模型进行训练;低算力边缘服务器训练所得的参数将上传至云服务器,通过冻结部分参数提高整个模型的拟合速度。结合以上2种方法,提出一种基于本地漂移和多样性算力的联邦学习优化算法(FedLD),旨在解决联邦学习在边缘计算应用中所面临的non-IID数据和多样性算力带来的异构挑战。实验结果表明,FedLD比FedAvg、SCAFFOLD和FedProx算法收敛更快、准确率更高,相较于FedProx,在50个客户端参与训练时,FedLD在MNIST、CIFAR-10和CIFAR-100数据集上分别将模型准确率提升了0.39%、3.68%和15.24%;与最新的FedProc算法相比,FedLD通信开销更低;在K最近邻(KNN)算法、长短期记忆(LSTM)模型和双向门控循环单元(GRU)模型上的对比实验结果也表明,结合FedLD后,这3种模型的预测精度均有约1%的提升。 展开更多
关键词 联邦学习 边缘计算 异构性 独立同分布数据 客户端漂移 多样性算力
在线阅读 下载PDF
基于联邦学习的含不平衡样本数据电力变压器故障诊断 被引量:24
19
作者 郭方洪 刘师硕 +3 位作者 吴祥 陈博 张文安 葛其运 《电力系统自动化》 EI CSCD 北大核心 2023年第10期145-152,共8页
基于海量样本数据的深度神经网络可以显著提升电力变压器的故障诊断效果,但实际环境中各变压器本地数据被“数据孤岛”隔离,难以进行集中式深度训练。联邦学习可以实现多源数据的共同建模,但各变压器的非独立同分布不平衡数据会使算法... 基于海量样本数据的深度神经网络可以显著提升电力变压器的故障诊断效果,但实际环境中各变压器本地数据被“数据孤岛”隔离,难以进行集中式深度训练。联邦学习可以实现多源数据的共同建模,但各变压器的非独立同分布不平衡数据会使算法性能严重下降。针对上述问题,提出一种基于联邦学习的含不平衡样本数据电力变压器故障诊断机制。与传统深度学习集中训练方式不同,文中采用多个参与者分布训练方式。每个参与者采用LeNet-5深度神经网络进行本地训练,中央服务器将本地模型进行聚合,同时引入改进的数据共享策略对云端共享数据进行选择性下发,以降低非独立同分布数据的不平衡性。实验结果证明,该机制实现了各变压器独立且不平衡数据的协同训练,对变压器故障类型的诊断精度可达到97%。 展开更多
关键词 电力变压器 故障诊断 LeNet-5网络 联邦学习 独立同分布数据
在线阅读 下载PDF
基于联邦学习的无线任务:数据非IID一定影响性能? 被引量:1
20
作者 董少鹏 杨晨阳 刘婷婷 《信号处理》 CSCD 北大核心 2021年第8期1365-1377,共13页
作为一种分布式训练框架,联邦学习在无线通信领域有着广阔的应用前景,也面临着多方面的技术挑战,其中之一源于参与训练用户数据集的非独立同分布(Independent and identically distributed,IID)。不少文献提出了解决方法,以减轻户数据集... 作为一种分布式训练框架,联邦学习在无线通信领域有着广阔的应用前景,也面临着多方面的技术挑战,其中之一源于参与训练用户数据集的非独立同分布(Independent and identically distributed,IID)。不少文献提出了解决方法,以减轻户数据集非IID造成的联邦学习性能损失。本文以平均信道增益预测、正交幅度调制信号的解调这两个无线任务以及两个图像分类任务为例,分析用户数据集非IID对联邦学习性能的影响,通过神经网络损失函数的可视化和对模型参数的偏移量进行分析,尝试解释非IID数据集对不同任务影响程度不同的原因。分析结果表明,用户数据集非IID未必导致联邦学习性能的下降。在不同数据集上通过联邦平均算法训练得到的模型参数偏移程度和损失函数形状有很大的差异,二者共同导致了不同任务受数据非IID影响程度的不同;在同一个回归问题中,数据集非IID是否影响联邦学习的性能与引起数据非IID的具体因素有关。 展开更多
关键词 联邦学习 数据集非独立同分布 平均信道增益 解调 损失函数可视化
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部