期刊文献+
共找到59篇文章
< 1 2 3 >
每页显示 20 50 100
基于概率相似度的不完备数据填补研究
1
作者 仝利红 孙士保 《现代电子技术》 北大核心 2025年第4期79-82,共4页
为提升数据的完整性,保证数据的效用程度,提出一种基于概率相似度的不完备数据填补方法。量化计算不完备数据的概率相似度矩阵,将计算结果和ROUSTIDA算法相结合进行不完备数据填补,获取完备数据集。在此基础上,构建决策规则,保证多属性... 为提升数据的完整性,保证数据的效用程度,提出一种基于概率相似度的不完备数据填补方法。量化计算不完备数据的概率相似度矩阵,将计算结果和ROUSTIDA算法相结合进行不完备数据填补,获取完备数据集。在此基础上,构建决策规则,保证多属性缺失数据的填补性能,并且设定可辨识矩阵优化算法的不完备数据填补效果。测试结果显示,所提方法能够计算不同数据对象之间的相似度值,可有效完成数据填补,填补后数据的完备程度均在95%以上,填补数据的填补值误差均在0.17以下,填补效果良好。 展开更多
关键词 概率相似度 不完备数据 数据填补 ROUSTIDA算法 相似度矩阵 可辨识矩阵 决策规则
在线阅读 下载PDF
基于CNN-LSTM模型的土壤温湿度缺失数据填补算法
2
作者 张瑛进 史志强 +1 位作者 古丽米拉·克孜尔别克 库木斯·阿依肯 《湖北农业科学》 2025年第2期179-183,196,共6页
针对因恶劣环境、电池耗尽、硬件故障等原因导致的土壤温湿度传感器数据丢失问题,提出一种基于卷积神经网络的长短期记忆网络(CNN-LSTM)填补模型。以闪电河流域2019年土壤温湿度数据为试验数据,分别选用CNN、LSTM、TCN、CNN-TCN、CNN-LS... 针对因恶劣环境、电池耗尽、硬件故障等原因导致的土壤温湿度传感器数据丢失问题,提出一种基于卷积神经网络的长短期记忆网络(CNN-LSTM)填补模型。以闪电河流域2019年土壤温湿度数据为试验数据,分别选用CNN、LSTM、TCN、CNN-TCN、CNN-LSTM 5个模型对土壤温湿度传感器网络缺失数据进行填补,并采用Adam算法优化模型,使用决定系数(R^(2))、均方根误差(RMSE)、平均绝对误差(MAE)指数对模型填补结果进行评价。结果表明,采用线性插补算法获得完整的数据,CNN-LSTM模型的R^(2)为0.999 9,高于其他模型,MAE、RMSE分别为0.001 85、0.019 70,均远低于其他模型。采用k近邻插补算法获得完整的数据,CNN-LSTM模型的MAE、RMSE分别为0.000 12、0.000 12,均远低于其他模型,R^(2)为0.999 4,高于CNN模型、TCN模型;CNN-LSTM模型对土壤温湿度传感器数据缺失值的填补效果最好。CNN-LSTM模型在处理大规模土壤温湿度传感器缺失数据问题时具有较好的可行性和精确度。 展开更多
关键词 CNN-LSTM模型 土壤 温湿度 缺失数据填补算法
在线阅读 下载PDF
基于泛化中心聚类的时间序列缺失数据填补方法
3
作者 于艳朋 惠向晖 《吉林大学学报(理学版)》 北大核心 2025年第4期1137-1142,共6页
针对填补时间序列中的缺失值通常依赖于已有数据的预测,由于时间序列的复杂性和不确定性导致预测结果常存在误差的问题,为保证数据填补效果,提出一种基于泛化中心聚类的时间序列缺失数据填补方法.首先,计算对象与类之间、类与类之间的距... 针对填补时间序列中的缺失值通常依赖于已有数据的预测,由于时间序列的复杂性和不确定性导致预测结果常存在误差的问题,为保证数据填补效果,提出一种基于泛化中心聚类的时间序列缺失数据填补方法.首先,计算对象与类之间、类与类之间的距离,量化数据点与聚类中心之间的相对位置关系,得到数据间的空间关系.其次,利用信息瓶颈算法对空间中的泛化中心进行聚类处理,将含有缺失数据的时间序列数据集划分到同一类中.最后,计算簇半径,对泛化中心聚类后产生的离群点数据再次进行可用、弱可用随机损坏数据划分,设置波动阈值,将位于波动阈值内的随机损坏数据与聚类中统一属性值进行字符串对比,实现时间序列缺失数据填补.实验结果表明,该方法在聚类过程中有较高的标准化互信息和命中率,在缺失数据填补时,可保证数据补齐率在80%以上,说明该方法可有效改善时间序列数据的完整性. 展开更多
关键词 泛化中心聚类 时间序列 缺失数据填补 信息瓶颈 随机损坏数据 补齐率
在线阅读 下载PDF
基于生成对抗网络的追尾事故数据填补方法研究 被引量:2
4
作者 周备 张莹 +2 位作者 张生瑞 周千喜 汪琴 《交通运输系统工程与信息》 EI CSCD 北大核心 2024年第1期132-137,198,共7页
深入分析交通事故数据可以为规避事故发生、降低事故严重程度提供重要理论依据,然而,在事故数据采集、传输、存储过程中往往会产生数据缺失,导致统计分析结果的准确性下降、模型的误判风险上升。本文以芝加哥2016—2021年的101452条追... 深入分析交通事故数据可以为规避事故发生、降低事故严重程度提供重要理论依据,然而,在事故数据采集、传输、存储过程中往往会产生数据缺失,导致统计分析结果的准确性下降、模型的误判风险上升。本文以芝加哥2016—2021年的101452条追尾事故数据为研究对象,将原始数据按照7∶3随机分为训练集和测试集。在训练集数据上,利用生成式插补网络(Generative Adversarial Imputation Network,GAIN)实现对缺失数据的填补。为对比不同数据填补方法的效果,同时选择多重插补(Multiple Imputation by Chained Equations,MICE)算法、期望最大化(Expectation Maximization,EM)填充算法、缺失森林(MissForest)算法和K最近邻(K-Nearest Neighbor,KNN)算法对同一数据集进行数据填补,并基于填补前后变量方差变化比较不同填补算法对数据变异性的影响。在完成数据填补的基础上,构建LightGBM三分类事故严重程度影响因素分析模型。使用原始训练集数据,以及填补后的训练集数据分别训练模型,并使用未经填补的测试集数据检验模型预测效果。结果表明,经缺失值填补后,模型性能得到一定改善,使用GAIN填补数据集训练的模型,相较于原始数据训练的模型,准确率提高了6.84%,F1提高了4.61%,AUC(Area Under the Curve)提高了10.09%,且改善效果优于其他4种填补方法。 展开更多
关键词 城市交通 数据填补 生成对抗网络 追尾事故 LightGBM模型
在线阅读 下载PDF
基于缺失数据填补的油浸式变压器故障诊断 被引量:7
5
作者 廖才波 杨金鑫 +3 位作者 邱志斌 胡雄 蒋子豪 李欣 《高电压技术》 EI CAS CSCD 北大核心 2024年第9期4091-4100,共10页
数据质量是影响变压器故障诊断模型准确性及可靠性的重要因素。针对现有变压器故障诊断模型对数据完整性要求较高等问题,以油浸式变压器为研究对象,提出了一种基于缺失数据填补的变压器故障诊断方法。首先,采用极端随机树(extremely ran... 数据质量是影响变压器故障诊断模型准确性及可靠性的重要因素。针对现有变压器故障诊断模型对数据完整性要求较高等问题,以油浸式变压器为研究对象,提出了一种基于缺失数据填补的变压器故障诊断方法。首先,采用极端随机树(extremely randomized trees,ERT)算法对变压器样本的缺失数据进行填补,通过与多种回归模型对比,评价ERT模型的预测效果。然后,基于油中溶解气体数据,提取能够反映变压器运行状态的16维特征集合,形成完备信息的变压器故障诊断样本。最后,利用树结构概率密度估计(tree-structured parzen estimator,TPE)算法实现梯度提升树(gradient boosting decision tree,GBDT)模型的参数优化,构建基于TPE-GBDT的变压器故障诊断模型。研究结果表明,在对缺失率为10%的变压器样本数据进行填补时,ERT算法的决定系数达到0.96,高于线性回归和随机森林回归等算法。此外,基于ERT填补后的样本数据在TPE-GBDT模型的平均诊断准确率和标准差分别为90.1%和0.036,其准确性和稳定性均优于线性判别分析和随机森林分类等算法。该方法能够有效提升变压器样本质量和故障诊断效果,可为变压器运维检修提供针对性的指导建议。 展开更多
关键词 变压器 缺失数据填补 极端随机树 故障诊断 梯度提升树 油中溶解气体分析
在线阅读 下载PDF
一种基于双聚类的缺失数据填补方法 被引量:12
6
作者 郝胜轩 宋宏 周晓锋 《计算机应用研究》 CSCD 北大核心 2015年第3期674-678,共5页
针对现实数据集的数据缺失问题,提出了一种基于双聚类的缺失数据填补新方法。该算法利用双聚类簇内平均平方残值越小簇内数据相似性越高的这一特性,将缺失数据的填补问题转换为求解特定双聚类簇最小平均平方残值的问题,进而实现了数据... 针对现实数据集的数据缺失问题,提出了一种基于双聚类的缺失数据填补新方法。该算法利用双聚类簇内平均平方残值越小簇内数据相似性越高的这一特性,将缺失数据的填补问题转换为求解特定双聚类簇最小平均平方残值的问题,进而实现了数据集中缺失元素的预测;再利用二次函数求解极小值的思想对包含有缺失数据的特定双聚类簇最小平均平方残值的问题进行求解,并进行了数学上的分析证明。最后进行仿真验证,通过观察UCI数据集的实验结果可知,提出的算法具有较高的填补准确性。 展开更多
关键词 缺失数据填补 双聚类 双聚类数据填补 数据清洗
在线阅读 下载PDF
基于动态概率路径事件模型的RFID数据填补算法 被引量:25
7
作者 谷峪 于戈 +1 位作者 李晓静 王义 《软件学报》 EI CSCD 北大核心 2010年第3期438-451,共14页
RFID数据采集过程中漏读现象频频发生,降低了RFID(radio frequency identification)应用中查询结果的准确性.目前解决漏读问题的算法主要是以RFID原始读数为粒度,并基于标签自身历史读数进行窗口平滑,这种作法会填补许多与查询无关的冗... RFID数据采集过程中漏读现象频频发生,降低了RFID(radio frequency identification)应用中查询结果的准确性.目前解决漏读问题的算法主要是以RFID原始读数为粒度,并基于标签自身历史读数进行窗口平滑,这种作法会填补许多与查询无关的冗余数据,并且在多逻辑区域参与的复杂应用中,填补准确率较差.为解决上述问题,首次将RFID数据从数据层抽象到逻辑区域层作为处理的粒度,提出3种基于动态概率路径事件模型的数据填补算法,通过挖掘已知的区域事件的顺序相关性来对后续发生的事件进行判断和填补.进一步,增加对时间因素的考虑,对概率路径事件模型进行扩展.大量实验证明,提出的各个算法在不同的情况下有着不同的性能优势,并且在精简性和准确性上要高于现有的策略. 展开更多
关键词 RFID技术 数据填补 概率路径事件模型 区域事件 漏读数据 冗余数据
在线阅读 下载PDF
基于不完备数据聚类的缺失数据填补方法 被引量:64
8
作者 武森 冯小东 单志广 《计算机学报》 EI CSCD 北大核心 2012年第8期1726-1738,共13页
缺失数据的处理是数据挖掘领域进行数据预处理的一个重要问题.传统的缺失数据填补方法大部分是基于概率分布等一些统计假设,对于大数据集的数据挖掘不一定是最适合的方法.受不完备数据分析(ROUSTIDA)未采用传统的概率统计学方法启发,提... 缺失数据的处理是数据挖掘领域进行数据预处理的一个重要问题.传统的缺失数据填补方法大部分是基于概率分布等一些统计假设,对于大数据集的数据挖掘不一定是最适合的方法.受不完备数据分析(ROUSTIDA)未采用传统的概率统计学方法启发,提出基于不完备数据聚类的缺失数据填补方法(MIBOI),针对分类变量不完备数据集定义约束容差集合差异度,直接计算不完备数据对象集合内所有对象的总体相异程度,以不完备数据聚类的结果为基础进行缺失数据的填补.采用UCI机器学习基准数据集进行实验表明,MIBOI对缺失数据的填补是有效可行的. 展开更多
关键词 数据填补 不完备数据 聚类 约束容差集合差异度
在线阅读 下载PDF
绿色数据中心不完备能耗大数据填补及分类算法研究 被引量:18
9
作者 袁景凌 钟珞 +3 位作者 杨光 陈旻骋 顾骏程 李涛 《计算机学报》 EI CSCD 北大核心 2015年第12期2499-2516,共18页
随着云计算和大数据时代的到来,大规模数据中心在全球范围内得到了广泛的部署.但大规模数据中心的高能耗仍然是当今亟待解决的问题.为解决这一问题,通常采用太阳能等可再生绿色新能源为数据中心供电.绿色数据中心能够根据新能源的变化... 随着云计算和大数据时代的到来,大规模数据中心在全球范围内得到了广泛的部署.但大规模数据中心的高能耗仍然是当今亟待解决的问题.为解决这一问题,通常采用太阳能等可再生绿色新能源为数据中心供电.绿色数据中心能够根据新能源的变化配合市电为数据中心提供高效、低能耗且稳定的电能供给,这是数据中心发展的趋势.文中针对数据收集不完善和断电等因素会造成一定程度的数据缺失情况,提出了一种基于完备相容类的不完备大数据填补算法,来填补数据中心的缺失数据;针对绿色数据中心能耗大数据的不稳定、间歇性和随时变化等特点,提出了一种基于离散弱相关的决策森林并行分类算法,通过对数据中心能耗大数据并行分类,来指导供电方式,以利于高效节能和延长电池寿命;此外进一步提出了一种增量更新决策森林的算法,来增量更新分类模型,该算法能够保障分类模型不断适应数据变化,防止分类准确率随时间而下降,从而避免电池频繁充放电,以保证稳定供电.整体来说,文中提出了一种数据中心能耗大数据管理模型,该模型针对大规模绿色数据中心的能源供给相关问题,运用不完备能耗大数据的填补、能耗大数据的并行分类、分类模型更新这三方面的技术方法,动态调控太阳能和市电供电端口,为数据中心提供高效、低能耗且稳定的电能供给.最后,采用绿色数据中心真实的能耗相关大数据集进行实验,实验结果说明文中提出的能耗大数据管理模型,能够帮助绿色数据中心有效管理太阳能和其他资源来配合市电提供稳定且充足的电能供应,从而为整个数据中心服务体系提供高效的能源服务. 展开更多
关键词 绿色数据中心 能耗大数据 不完备大数据填补 并行分类 增量更新 数据
在线阅读 下载PDF
基于最大方差权信息系数的煤气数据填补 被引量:6
10
作者 吕政 赵珺 +1 位作者 刘颖 王伟 《控制理论与应用》 EI CAS CSCD 北大核心 2015年第5期646-654,共9页
在数据的挖掘、建模与优化领域,数据的完整性与准确性是进行此类研究的基础.鉴于冶金能源系统的复杂性和现场数据采集过程易受干扰的特点,其数据在获取过程中极易发生数据缺失的现象,从而造成模型无法建立,隐含信息无法准确挖掘等情况.... 在数据的挖掘、建模与优化领域,数据的完整性与准确性是进行此类研究的基础.鉴于冶金能源系统的复杂性和现场数据采集过程易受干扰的特点,其数据在获取过程中极易发生数据缺失的现象,从而造成模型无法建立,隐含信息无法准确挖掘等情况.本文针对钢铁企业副产煤气的发生、消耗流量数据出现的缺失情况,通过分析相似工况下能源流量数据的相关特性,提出一种基于最大方差权信息系数的冶金企业副产煤气系统流量数据填补方法.该方法针对现场经常发生的两类数据缺失情况,即数据点间断缺失和数据长时间连续缺失,以最大方差权信息系数作为样本筛选准则,并采用基于核学习的方法对缺失数据进行填补.为验证本文提出的数据填补方法的有效性,本文对上海宝钢高炉、焦炉和冷热轧用户的实际生产数据的运行试验,结果表明该方法相比其他的方法存填补精度上有很大优势. 展开更多
关键词 冶金能源系统 数据填补 样本筛选 最大方差权信息系数
在线阅读 下载PDF
结合局部敏感哈希的k近邻数据填补算法 被引量:5
11
作者 郑奇斌 刁兴春 +2 位作者 曹建军 周星 许永平 《计算机应用》 CSCD 北大核心 2016年第2期397-401,共5页
k近邻(kNN)算法是缺失数据填补的常用算法,但由于需要逐个计算所有记录对之间的相似度,因此其填补耗时较高。为提高算法效率,提出结合局部敏感哈希(LSH)的k NN数据填补算法LSH-k NN。首先,对不存在缺失的完整记录进行局部敏感哈希,为之... k近邻(kNN)算法是缺失数据填补的常用算法,但由于需要逐个计算所有记录对之间的相似度,因此其填补耗时较高。为提高算法效率,提出结合局部敏感哈希(LSH)的k NN数据填补算法LSH-k NN。首先,对不存在缺失的完整记录进行局部敏感哈希,为之后查找近似最近邻提供索引;其次,针对枚举型、数值型以及混合型缺失数据分别提出对应的局部敏感哈希方法,对每一条待填补的不完整记录进行局部敏感哈希,按得到的哈希值找到与其疑似相似的候选记录;最后在候选记录中通过逐个计算相似度来找到其中相似程度最高的k条记录,并按照k NN算法对不完整记录进行填补。通过在4个真实数据集上的实验表明,结合局部敏感哈希的k NN填补算法LSH-k NN相对经典的k NN算法能够显著提高填补效率,并且保持准确性基本不变。 展开更多
关键词 数据质量 数据完整性 数据填补 K近邻算法 局部敏感哈希
在线阅读 下载PDF
海产品安全预警系统缺失数据填补方法 被引量:10
12
作者 鄂旭 林爽 金璐璐 《计算机工程与应用》 CSCD 北大核心 2015年第11期119-123,共5页
针对海产品安全预警系统中数据缺失问题,提出了一种缺失数据填补方法,目前,使用粗糙集填补的方法很多,但很多方法并没有考虑到每个对象缺失属性个数。该方法将存在缺失数据的信息表分为完备和不完备两部分,并分别对其进行处理,对缺失数... 针对海产品安全预警系统中数据缺失问题,提出了一种缺失数据填补方法,目前,使用粗糙集填补的方法很多,但很多方法并没有考虑到每个对象缺失属性个数。该方法将存在缺失数据的信息表分为完备和不完备两部分,并分别对其进行处理,对缺失数据填补时综合考虑属性重要性和缺失属性个数;不存在缺失数据的信息表则直接输出;实验结果表明方法能用于海产品安全预警系统中缺失数据填补。 展开更多
关键词 数据填补 海产品安全 相似矩阵
在线阅读 下载PDF
基于支持向量机的桥梁健康监测系统残缺数据填补 被引量:7
13
作者 符欲梅 朱芳 昝昕武 《传感技术学报》 CAS CSCD 北大核心 2012年第12期1706-1710,共5页
针对桥梁健康监测系统中采集数据具有小样本、非线性且时序的特点,提出一种基于支持向量机的残缺数据填补方法,在分析数据的自相关性基础上,利用支持向量回归机原理,选择适当维数的样本作为支持向量机的输入向量,据此进行了残缺数据的预... 针对桥梁健康监测系统中采集数据具有小样本、非线性且时序的特点,提出一种基于支持向量机的残缺数据填补方法,在分析数据的自相关性基础上,利用支持向量回归机原理,选择适当维数的样本作为支持向量机的输入向量,据此进行了残缺数据的预测;并与BP神经网络的填补效果相比较,实验结果显示了支持向量机在更小样本情况下填补残缺数据的优势和强泛化能力。 展开更多
关键词 桥梁健康监测系统 缺失数据填补 时间序列 支持向量机
在线阅读 下载PDF
利用聚类分析和离群点检测的数据填补方法 被引量:11
14
作者 马永军 汪睿 +1 位作者 李亚军 陈海山 《计算机工程与设计》 北大核心 2019年第3期744-747,761,共5页
为提高数据填补方法的正确率,提出利用核K-Means聚类和离群点检测来填补缺失数据的算法(KKMOD)。用核方法将数据集映射到高维空间,聚类后形成不同簇,在同簇内选择与缺失数据最相似的数据进行填补,使用核K-Means进行离群点检测,将检测到... 为提高数据填补方法的正确率,提出利用核K-Means聚类和离群点检测来填补缺失数据的算法(KKMOD)。用核方法将数据集映射到高维空间,聚类后形成不同簇,在同簇内选择与缺失数据最相似的数据进行填补,使用核K-Means进行离群点检测,将检测到的离群点去除填补值,重新放入数据集填补,算法不断迭代,直到填补的数据不再检测出离群点。实验结果表明,KKMOD方法能够充分考虑簇内关系,避免不同簇相互干扰,提高数据填补算法的正确率。 展开更多
关键词 核方法 聚类分析 缺失数据 数据填补 离群点检测
在线阅读 下载PDF
基于不完备集双聚类的缺失数据填补算法 被引量:12
15
作者 韩飞 沈镇林 《计算机工程》 CAS CSCD 北大核心 2016年第4期20-26,共7页
缺失数据填补是数据清洗领域的一个重要问题。由于绝大部分局部填补方法基于全部属性进行分类,未考虑对象属性之间的关联性,因此基于不完备集双聚类,提出一种缺失数据填补算法。该算法利用双聚类完美簇的平均平方残基为0及簇内的属性值... 缺失数据填补是数据清洗领域的一个重要问题。由于绝大部分局部填补方法基于全部属性进行分类,未考虑对象属性之间的关联性,因此基于不完备集双聚类,提出一种缺失数据填补算法。该算法利用双聚类完美簇的平均平方残基为0及簇内的属性值波动一致的特点,对缺失数据进行填补。通过数学分析,把寻找含有缺失值的最大完美簇问题转化为求解缺失对象与其他对象之间的最大相似属性集问题,在相同的最大相似属性集下,以缺失值的众数作为填补值。采用4组UCI数据集进行实验,结果表明,该算法相比ROUSTIDA算法平均提高了77.13%的填补值精确度。 展开更多
关键词 缺失数据填补 不完备集 双聚类 最大相似属性集 数据清洗 完美簇
在线阅读 下载PDF
缺失飞参数据填补的组合方法研究 被引量:6
16
作者 许磊 张凤鸣 《计算机工程与应用》 CSCD 北大核心 2010年第21期210-212,215,共4页
针对飞参数据的特点,将B样条曲线拟合和最小二乘支持向量机相互结合,提出了一种缺失飞参数据填补的组合方法。该方法将两者优势互补,对单一方法的填补结果进行加权平均,增强了算法的可靠性,提高了数据填补的精度。对比实验的结果表明了... 针对飞参数据的特点,将B样条曲线拟合和最小二乘支持向量机相互结合,提出了一种缺失飞参数据填补的组合方法。该方法将两者优势互补,对单一方法的填补结果进行加权平均,增强了算法的可靠性,提高了数据填补的精度。对比实验的结果表明了方法的可行性和适用性。 展开更多
关键词 飞参数据 数据填补 最小二乘支持向量机 B样条拟合
在线阅读 下载PDF
基于模糊聚类的蜂窝小区业务量数据填补算法 被引量:1
17
作者 杨苹 吕茵 黄锦成 《计算机工程》 CAS CSCD 北大核心 2011年第13期259-261,共3页
根据无线网络业务数据的特点,提出一种基于模糊聚类的数据填补算法。该算法考虑数据的周期性特点,并运用沉积的历史数据,对数据进行聚类分析得出标准模板,采用标准模板对缺失数据进行填补。利用该算法对小区小时话务量数据进行填补。实... 根据无线网络业务数据的特点,提出一种基于模糊聚类的数据填补算法。该算法考虑数据的周期性特点,并运用沉积的历史数据,对数据进行聚类分析得出标准模板,采用标准模板对缺失数据进行填补。利用该算法对小区小时话务量数据进行填补。实验结果表明,该算法平均误差率较小,无偏性较好,在数据缺失较为严重的情况下也能完成填补。 展开更多
关键词 数据填补 模糊聚类 GSM网络优化 聚类分析
在线阅读 下载PDF
基于缺失数据填补的辐射源识别方法 被引量:1
18
作者 刘海军 柳征 +1 位作者 姜文利 周一宇 《宇航学报》 EI CAS CSCD 北大核心 2010年第5期1438-1445,共8页
针对模板雷达特征参数残缺而造成的测量辐射源不能正确识别问题,提出了一种基于缺失数据填补的辐射源识别算法。该算法利用矢量神经网络对缺失数据进行填补,并对填补后的训练样本进行重新训练,从而得到网络结构参数。仿真实验表明本文... 针对模板雷达特征参数残缺而造成的测量辐射源不能正确识别问题,提出了一种基于缺失数据填补的辐射源识别算法。该算法利用矢量神经网络对缺失数据进行填补,并对填补后的训练样本进行重新训练,从而得到网络结构参数。仿真实验表明本文方法不仅能处理缺失数据,而且在噪声环境下也能识别区间类型和标量类型的输入矢量。 展开更多
关键词 辐射源识别 矢量神经网络 缺失数据填补
在线阅读 下载PDF
水资源消耗预测的异常值检测及缺失数据填补方法 被引量:8
19
作者 张峰 宋晓娜 +1 位作者 薛惠锋 王海宁 《统计与决策》 CSSCI 北大核心 2018年第16期13-17,共5页
可靠完整的水资源消耗历史时序数据是对其进行准确预测的基本前提。文章在参考现有数据异常值检测与缺失值处理方法的基础上,选取偏最小二乘法提取水资源消耗及社会经济相关指标数据主成分,并绘制其累计贡献度的Q2椭圆图辨识其存在的异... 可靠完整的水资源消耗历史时序数据是对其进行准确预测的基本前提。文章在参考现有数据异常值检测与缺失值处理方法的基础上,选取偏最小二乘法提取水资源消耗及社会经济相关指标数据主成分,并绘制其累计贡献度的Q2椭圆图辨识其存在的异常值,利用最小残差回归法对含有实际突变的时序数据进行预测分析,再构建基于粒子群优化的最小二乘支持向量机模型对其缺失数据进行填补。结果表明,通过偏最小二乘测算出主成分累计贡献度及绘制Q2椭圆图方法可借助异常值对整体数据的拉伸效应实现对异常点的检测;基于最小残差回归法对含有水资源消耗突变数据序列的预测要比传统最小二乘回归具有更高的精度;而运用粒子群优化的最小二乘支持向量机可进一步提升数据拟合效果,实现对水资源消耗缺失数据的合理填补。 展开更多
关键词 水资源消耗 异常值 缺失值 数据检测 数据填补
在线阅读 下载PDF
基于LSTM的活立木茎干水分缺失数据填补方法 被引量:7
20
作者 宋维 高超 +1 位作者 赵玥 赵燕东 《林业科学》 EI CAS CSCD 北大核心 2020年第2期134-141,共8页
【目的】研究植物茎体水分数据,针对相同数据段上的缺失数据,对比不同数据填补方法,验证LSTM模型填补茎干水分数据的有效性及准确性。【方法】选取2017年6月份栽种在北京市海淀区的紫薇树茎体水分完整数据,人工删去部分数据作为缺失数据... 【目的】研究植物茎体水分数据,针对相同数据段上的缺失数据,对比不同数据填补方法,验证LSTM模型填补茎干水分数据的有效性及准确性。【方法】选取2017年6月份栽种在北京市海淀区的紫薇树茎体水分完整数据,人工删去部分数据作为缺失数据,分别使用插值方法、RNN神经网络、LSTM神经网络对缺失部分进行填补,填补结果与原始数据比对并分析结果。基于神经网络预测值误差随预测时刻推后而增大的误差分布情况,本文提出了在神经网络预测值基础上加入对数据后期处理的方法:从缺失数据的正向和反向进行预测,将2个方向的预测值各自乘以一组按照预测时刻递减的权重值并相加,结合2个预测方向的优势,进一步提高预测准确度。【结果】3种方法中,RNN与LSTM神经网络方法较传统的插值方法优势明显:插值方法准确度在缺失值增多时迅速下降;神经网络方法下降速度较慢。当填补值与真实值误差在2%以内作为准确时,插值方法的填补准确率不足50%,RNN方法达到50%且不足60%,LSTM方法达到80%以上;当填补值与真实值误差在4%以内作为准确时,插值方法填补准确率为60%,RNN方法准确度最高达到90%,LSTM方法准确率在95%以上。在此基础上加入权重处理,对LSTM预测结果处理后误差在2%以内准确率达到97%,误差在3%以内准确率达到100%。选取一组测试数据代入模型,预测结果比训练数据预测结果精度有所下降,但双向预测方式优势更加明显。【结论】采用基于LSTM模型的双向综合预测法,可显著减小长期预测中的累计误差对预测结果的影响,提升了预测数据的准确度。与其他两类数据填补方法相比,基于LSTM神经网络的数据填补方法在长期缺失的时间序列数据填补上有较大优势。 展开更多
关键词 缺失数据 数据填补 时间序列 LSTM神经网络 茎体水分
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部