期刊文献+
共找到23篇文章
< 1 2 >
每页显示 20 50 100
基于概率相似度的不完备数据填补研究
1
作者 仝利红 孙士保 《现代电子技术》 北大核心 2025年第4期79-82,共4页
为提升数据的完整性,保证数据的效用程度,提出一种基于概率相似度的不完备数据填补方法。量化计算不完备数据的概率相似度矩阵,将计算结果和ROUSTIDA算法相结合进行不完备数据填补,获取完备数据集。在此基础上,构建决策规则,保证多属性... 为提升数据的完整性,保证数据的效用程度,提出一种基于概率相似度的不完备数据填补方法。量化计算不完备数据的概率相似度矩阵,将计算结果和ROUSTIDA算法相结合进行不完备数据填补,获取完备数据集。在此基础上,构建决策规则,保证多属性缺失数据的填补性能,并且设定可辨识矩阵优化算法的不完备数据填补效果。测试结果显示,所提方法能够计算不同数据对象之间的相似度值,可有效完成数据填补,填补后数据的完备程度均在95%以上,填补数据的填补值误差均在0.17以下,填补效果良好。 展开更多
关键词 概率相似度 不完备数据 数据填补 ROUSTIDA算法 相似度矩阵 可辨识矩阵 决策规则
在线阅读 下载PDF
基于生成对抗网络的追尾事故数据填补方法研究
2
作者 周备 张莹 +2 位作者 张生瑞 周千喜 汪琴 《交通运输系统工程与信息》 EI CSCD 北大核心 2024年第1期132-137,198,共7页
深入分析交通事故数据可以为规避事故发生、降低事故严重程度提供重要理论依据,然而,在事故数据采集、传输、存储过程中往往会产生数据缺失,导致统计分析结果的准确性下降、模型的误判风险上升。本文以芝加哥2016—2021年的101452条追... 深入分析交通事故数据可以为规避事故发生、降低事故严重程度提供重要理论依据,然而,在事故数据采集、传输、存储过程中往往会产生数据缺失,导致统计分析结果的准确性下降、模型的误判风险上升。本文以芝加哥2016—2021年的101452条追尾事故数据为研究对象,将原始数据按照7∶3随机分为训练集和测试集。在训练集数据上,利用生成式插补网络(Generative Adversarial Imputation Network,GAIN)实现对缺失数据的填补。为对比不同数据填补方法的效果,同时选择多重插补(Multiple Imputation by Chained Equations,MICE)算法、期望最大化(Expectation Maximization,EM)填充算法、缺失森林(MissForest)算法和K最近邻(K-Nearest Neighbor,KNN)算法对同一数据集进行数据填补,并基于填补前后变量方差变化比较不同填补算法对数据变异性的影响。在完成数据填补的基础上,构建LightGBM三分类事故严重程度影响因素分析模型。使用原始训练集数据,以及填补后的训练集数据分别训练模型,并使用未经填补的测试集数据检验模型预测效果。结果表明,经缺失值填补后,模型性能得到一定改善,使用GAIN填补数据集训练的模型,相较于原始数据训练的模型,准确率提高了6.84%,F1提高了4.61%,AUC(Area Under the Curve)提高了10.09%,且改善效果优于其他4种填补方法。 展开更多
关键词 城市交通 数据填补 生成对抗网络 追尾事故 LightGBM模型
在线阅读 下载PDF
双向长短期记忆网络在燃气异常数据填补中的应用研究
3
作者 胡殿涛 张芷若 +1 位作者 刘保祥 凡建功 《城市燃气》 2024年第4期10-14,共5页
完整、可靠的燃气调压站运行数据对于城燃企业运营管理至关重要,然而在实际运行中,由于诸如电子脉冲、通信中断等原因,造成燃气调压站产生的时序数据存在缺失、跳变等异常现象,严重影响数据的可靠性及数据的二次运用能力。因此本文提出... 完整、可靠的燃气调压站运行数据对于城燃企业运营管理至关重要,然而在实际运行中,由于诸如电子脉冲、通信中断等原因,造成燃气调压站产生的时序数据存在缺失、跳变等异常现象,严重影响数据的可靠性及数据的二次运用能力。因此本文提出了一种基于双向长短期记忆网络(BiLSTM)的方法,通过对历史数据的学习和分析,预测并填补异常数据,实验表明本文方法在时序缺失数据填补的平均相对误差率不超过10%,在数据异常填补处理方面具有一定可行性,为燃气时序数据填补提供了新的参考思路。 展开更多
关键词 燃气调压站 时序数据 异常数据填补 BiLSTM
在线阅读 下载PDF
基于缺失数据填补的辐射源识别方法 被引量:1
4
作者 刘海军 柳征 +1 位作者 姜文利 周一宇 《宇航学报》 EI CAS CSCD 北大核心 2010年第5期1438-1445,共8页
针对模板雷达特征参数残缺而造成的测量辐射源不能正确识别问题,提出了一种基于缺失数据填补的辐射源识别算法。该算法利用矢量神经网络对缺失数据进行填补,并对填补后的训练样本进行重新训练,从而得到网络结构参数。仿真实验表明本文... 针对模板雷达特征参数残缺而造成的测量辐射源不能正确识别问题,提出了一种基于缺失数据填补的辐射源识别算法。该算法利用矢量神经网络对缺失数据进行填补,并对填补后的训练样本进行重新训练,从而得到网络结构参数。仿真实验表明本文方法不仅能处理缺失数据,而且在噪声环境下也能识别区间类型和标量类型的输入矢量。 展开更多
关键词 辐射源识别 矢量神经网络 缺失数据填补
在线阅读 下载PDF
基于LSTM的活立木茎干水分缺失数据填补方法 被引量:7
5
作者 宋维 高超 +1 位作者 赵玥 赵燕东 《林业科学》 EI CAS CSCD 北大核心 2020年第2期134-141,共8页
【目的】研究植物茎体水分数据,针对相同数据段上的缺失数据,对比不同数据填补方法,验证LSTM模型填补茎干水分数据的有效性及准确性。【方法】选取2017年6月份栽种在北京市海淀区的紫薇树茎体水分完整数据,人工删去部分数据作为缺失数据... 【目的】研究植物茎体水分数据,针对相同数据段上的缺失数据,对比不同数据填补方法,验证LSTM模型填补茎干水分数据的有效性及准确性。【方法】选取2017年6月份栽种在北京市海淀区的紫薇树茎体水分完整数据,人工删去部分数据作为缺失数据,分别使用插值方法、RNN神经网络、LSTM神经网络对缺失部分进行填补,填补结果与原始数据比对并分析结果。基于神经网络预测值误差随预测时刻推后而增大的误差分布情况,本文提出了在神经网络预测值基础上加入对数据后期处理的方法:从缺失数据的正向和反向进行预测,将2个方向的预测值各自乘以一组按照预测时刻递减的权重值并相加,结合2个预测方向的优势,进一步提高预测准确度。【结果】3种方法中,RNN与LSTM神经网络方法较传统的插值方法优势明显:插值方法准确度在缺失值增多时迅速下降;神经网络方法下降速度较慢。当填补值与真实值误差在2%以内作为准确时,插值方法的填补准确率不足50%,RNN方法达到50%且不足60%,LSTM方法达到80%以上;当填补值与真实值误差在4%以内作为准确时,插值方法填补准确率为60%,RNN方法准确度最高达到90%,LSTM方法准确率在95%以上。在此基础上加入权重处理,对LSTM预测结果处理后误差在2%以内准确率达到97%,误差在3%以内准确率达到100%。选取一组测试数据代入模型,预测结果比训练数据预测结果精度有所下降,但双向预测方式优势更加明显。【结论】采用基于LSTM模型的双向综合预测法,可显著减小长期预测中的累计误差对预测结果的影响,提升了预测数据的准确度。与其他两类数据填补方法相比,基于LSTM神经网络的数据填补方法在长期缺失的时间序列数据填补上有较大优势。 展开更多
关键词 缺失数据 数据填补 时间序列 LSTM神经网络 茎体水分
在线阅读 下载PDF
融合多测点数据相关性的大坝监测历史数据填补 被引量:2
6
作者 刘鹤鹏 李登华 丁勇 《人民长江》 北大核心 2023年第9期245-251,共7页
基于历史数据的大坝安全监测预警、预报算法对数据集的质量要求较高,含有缺失值的数据集会明显降低算法结果的准确性。为提升数据质量,提出了一种融合多测点数据相关性的缺失值填补算法:基于各测点时间尺度的相关性,将满足一定相关度的... 基于历史数据的大坝安全监测预警、预报算法对数据集的质量要求较高,含有缺失值的数据集会明显降低算法结果的准确性。为提升数据质量,提出了一种融合多测点数据相关性的缺失值填补算法:基于各测点时间尺度的相关性,将满足一定相关度的时间序列作为预测模型的输入项,并引入迭代技术实现多测点的缺失值自动填补。为验证该算法对实际工程中不同类型缺失数据集的适用性,依据实测数据样本在缺失率、集中度、离散程度3个层次上共构造了12种不同类型的缺失数据集并进行试验。结果表明:针对不同类型的缺失数据集,该算法的RMSE均值在填补精度上较传统填补算法提升15%以上,nMAPE均值提升1%以上。 展开更多
关键词 大坝安全监测 数据填补 预测算法 缺失值
在线阅读 下载PDF
基于Apriori和GP-XGBoost的特高拱坝变形缺失数据填补方法 被引量:6
7
作者 吴诚姝 陈波 刘庭赫 《水资源与水工程学报》 CSCD 北大核心 2022年第6期151-158,166,共9页
变形监测数据作为特高拱坝服役性态最直观的表征,蕴藏着丰富的时空信息和演变规律,对工程长治久安意义重大。然而,多源多维的变形监测数据受仪器本身及外界因素影响,往往存在数据缺失的现象,会对接下来的数据分析工作造成干扰。针对大... 变形监测数据作为特高拱坝服役性态最直观的表征,蕴藏着丰富的时空信息和演变规律,对工程长治久安意义重大。然而,多源多维的变形监测数据受仪器本身及外界因素影响,往往存在数据缺失的现象,会对接下来的数据分析工作造成干扰。针对大坝变形监测序列中的缺失数据,基于Apriori关联规则算法挖掘测点变形在空间维度上的关联性,得到目标测点的强关联测点,随后以强关联测点的变形监测数据作为输入样本,利用贝叶斯优化的XGBoost回归模型填补了目标测点的空缺变形监测序列。结合锦屏一级特高拱坝工程实例表明,该填补方法实现了变形监测空缺信息的高效、精准填补,可用于类似大坝工程的变形缺失数据填补。 展开更多
关键词 特高拱坝 变形监测 缺失数据填补 Apriori关联规则 XGBoost回归
在线阅读 下载PDF
一种基于相关系数加权的离散型数据填补算法与分析 被引量:2
8
作者 王志刚 田立勤 毛亚琼 《现代电子技术》 北大核心 2020年第9期109-112,共4页
为解决具有关联性数据的缺失值问题,提出一种结合相关系数与相似性匹配作用于离散型数据填补缺失值的方法。首先,在非缺失数据源中挖掘频繁项集并计算数据属性间的相关性,计算出挖掘项的项内整体的相关性;然后,根据缺失数据所在项的非... 为解决具有关联性数据的缺失值问题,提出一种结合相关系数与相似性匹配作用于离散型数据填补缺失值的方法。首先,在非缺失数据源中挖掘频繁项集并计算数据属性间的相关性,计算出挖掘项的项内整体的相关性;然后,根据缺失数据所在项的非缺失前项与完整数据挖掘项的相似度选择填补项;填补项相似性一致则利用加权置信度进一步选取填补规则,一方面提高了Apriori挖掘规则集合的数量及质量,另一方面也保证了规则匹配的可靠性。经实验与相关方法比较,该方法提高了缺失数据填补的准确率与时间效率。 展开更多
关键词 离散数据填补 加权支持度 相关系数加权 缺失值填补 频繁项集挖掘 填补规则选取
在线阅读 下载PDF
基于VAEGAN的缺失数据填补研究 被引量:1
9
作者 徐晔波 倪颖杰 《信息工程大学学报》 2022年第2期224-229,共6页
数据的完整性对人工智能、数据挖掘的研究有重要意义,然而在数据从采集到应用的过程中,由于各种原因,经常会存在数据缺失的现象。为减少数据缺失对数据应用带来的影响,提出一种基于变分自编码器生成对抗网络(Variational Autoencoder Ge... 数据的完整性对人工智能、数据挖掘的研究有重要意义,然而在数据从采集到应用的过程中,由于各种原因,经常会存在数据缺失的现象。为减少数据缺失对数据应用带来的影响,提出一种基于变分自编码器生成对抗网络(Variational Autoencoder Generative Adversarial Net-work,VAEGAN)的缺失数据填补模型。模型根据不完整数据集中缺失信息构建缺失掩码,利用缺失掩码在无需完整数据参与的条件下设计重构损失函数和鉴别损失函数,在不完整数据集上采用变分推断的思想生成缺失数据的估计值,利用鉴别器对抗训练生成网络。最后在不同数据集、不同缺失的条件下与常用的缺失填补算法进行对比实验。 展开更多
关键词 缺失数据填补 生成式对抗网络 变分自编码器
在线阅读 下载PDF
基于数据填补的煤自燃温度预测模型 被引量:9
10
作者 翟小伟 罗金雷 +3 位作者 张羽琛 宋波波 郝乐 周妤婕 《工矿自动化》 CSCD 北大核心 2023年第1期28-35,98,共9页
现有煤自燃温度预测模型的建立大多基于较为完整的指标气体样本数据,但指标气体数据受仪器或人为因素影响,往往存在数据缺失现象,导致煤自燃温度预测准确率较低和过拟合等问题。针对上述问题,提出了将K近邻算法(KNN)、随机森林(RF)、决... 现有煤自燃温度预测模型的建立大多基于较为完整的指标气体样本数据,但指标气体数据受仪器或人为因素影响,往往存在数据缺失现象,导致煤自燃温度预测准确率较低和过拟合等问题。针对上述问题,提出了将K近邻算法(KNN)、随机森林(RF)、决策树(DT)及基于粒子群优化的支持向量回归等填补算法(PSO-SVR)应用于缺失值填补,缺失数据和填补后的数据通过RF、SVR和极限梯度提升树(XGBoost)算法分别进行训练,并通过PSO算法优化参数,构建了基于数据填补的RF、XGBoost和SVR煤自燃温度预测模型。利用煤自然发火实验选取CO,CO_(2),CH4,C_(2)H_(6),O_(2)作为指标气体,并设计整体缺失率为10%,20%,30%和CO,CO_(2)缺失率为40%,50%,60%共6种随机数据缺失,采用平均绝对误差百分比(MAPE)作为填补效果评价指标,采用MAPE、判断系数R^(2)和均方根误差(RMSE)作为模型性能评价指标,对4种填补算法和3种预测模型进行对比。对比分析结果表明:在6种数据缺失情况下,DT填补算法填补效果优于其他3种算法,在CO,CO_(2)存在较多缺失值时,RF算法的填补值与实际值的MAPE偏大;在不调参的情况下,XGBoost模型虽然在训练集效果极好,但极易过拟合,而SVR模型预测效果极差,无法满足预测要求;在6种数据缺失情况下,基于DT填补算法的PSO-SVR、RF与PSO-RF煤自燃温度预测模型的MAPE均在4%左右,基于DT填补算法的RF模型无需优化就能较好地预测出煤自燃温度,具有良好的稳定性。 展开更多
关键词 煤自燃 温度预测 指标气体 数据缺失填补 K近邻填补算法 随机森林填补算法 决策树回归填补算法 基于粒子群优化的支持向量回归填补算法
在线阅读 下载PDF
面向混合特征数据的粒子群填补方法 被引量:1
11
作者 刘艺 秦伟 +4 位作者 李庚松 刘坤 王强 郑奇斌 任小广 《国防科技大学学报》 EI CAS CSCD 北大核心 2024年第6期107-112,共6页
针对传统数据填补方法难以有效利用标签信息和缺失数据的随机信息的不足,提出面向混合型特征的粒子群优化填补算法。将连续型特征取值建模为高斯分布,均值和标准差作为优化参数。将离散型特征的取值概率作为参数进行优化。使用分类正确... 针对传统数据填补方法难以有效利用标签信息和缺失数据的随机信息的不足,提出面向混合型特征的粒子群优化填补算法。将连续型特征取值建模为高斯分布,均值和标准差作为优化参数。将离散型特征的取值概率作为参数进行优化。使用分类正确率作为优化目标,充分利用标签信息和缺失数据的随机信息。采用4种基于统计的方法和2种基于演化算法的填补方法作为对比,在6个典型的分类数据集上进行实验。结果表明,提出的方法在分类正确率指标上显著优于其他对比算法,同时具有较优的时间开销,能够有效解决混合特征数据缺失的问题。 展开更多
关键词 缺失数据 数据填补 粒子群优化 混合特征 分类
在线阅读 下载PDF
乏数据条件下土石坝安全监测数据的插补
12
作者 赵瑞桥 李登华 石北啸 《水利水运工程学报》 北大核心 2025年第2期144-152,共9页
水库大坝安全监测资料应及时整编分析,以便通过监测资料及时了解大坝性状,并为大坝总体安全评价提供基本资料。传统的大坝缺失数据补全方法依赖于完整的前置数据和经验基函数,这对数据缺乏的中小型土石坝效果不佳。利用经验模态分解算... 水库大坝安全监测资料应及时整编分析,以便通过监测资料及时了解大坝性状,并为大坝总体安全评价提供基本资料。传统的大坝缺失数据补全方法依赖于完整的前置数据和经验基函数,这对数据缺乏的中小型土石坝效果不佳。利用经验模态分解算法分析缺失测点和同源测点数据,可从较少的数据中提取有效信息。针对不同复杂度下分解得到的分量不统一问题,利用动态时间调整算法进行聚类整合。最后对聚类数据集分别建立基于门控循环单元的预测模型,构建乏数据下历史监测数据EMD-GRU填补算法。基于实际工程监测数据对该算法和传统算法进行对比发现,均方误差降低至0.6以下,在乏数据的背景下该算法比传统模型有更好的稳定性和泛化性。 展开更多
关键词 土石坝 安全监测 数据填补 数据
在线阅读 下载PDF
基于LSSVM的缺失飞行数据组合填补方法 被引量:2
13
作者 杨轲 张晓丰 +1 位作者 赵录峰 李正欣 《火力与指挥控制》 CSCD 北大核心 2013年第1期84-86,90,共4页
针对飞行数据的特点,将基于最小二乘支持向量机的一元填补方法和多元填补方法相互结合,提出了一种缺失飞行数据的组合填补方法。该方法将两者优势互补,既能反映出变量自身的变化趋势,同时也利用了相关变量间的作用信息,增强了算法的可靠... 针对飞行数据的特点,将基于最小二乘支持向量机的一元填补方法和多元填补方法相互结合,提出了一种缺失飞行数据的组合填补方法。该方法将两者优势互补,既能反映出变量自身的变化趋势,同时也利用了相关变量间的作用信息,增强了算法的可靠性,提高了数据填补的精度。实验结果表明了所提方法在缺失飞行数据填补中的有效性和适用性。 展开更多
关键词 飞行数据 多元时间序列 缺失数据 数据填补 最小二乘支持向量机
在线阅读 下载PDF
采场覆岩光纤监测数据LSSVM填补方法 被引量:6
14
作者 冀汶莉 郗刘涛 柴敬 《西安科技大学学报》 CAS 北大核心 2021年第1期160-171,共12页
完备的光纤监测数据是智能开采中矿压显现前兆信息识别、上覆岩层变形预测的基础,而实际得到的监测数据大多是不完整的。为有效填补光纤监测数据的缺失值,文中以采场覆岩光纤监测物理模拟实验中光纤传感器采集的数据为基础,分析了缺失... 完备的光纤监测数据是智能开采中矿压显现前兆信息识别、上覆岩层变形预测的基础,而实际得到的监测数据大多是不完整的。为有效填补光纤监测数据的缺失值,文中以采场覆岩光纤监测物理模拟实验中光纤传感器采集的数据为基础,分析了缺失数据的特征,建立了多测点单属性小样本缺失数据的最小二乘支持向量机(LSSVM)缺失数据填补方法。并将LSSVM与BP神经网络、3次样条插值等方法,在Fv11,Fv12光纤的6个不同数据集上,按照离散型、连续型、混合型3种数据缺失类型并产生不同缺失率,进行对比实验。针对离散型随机产生20%缺失数据,LSSVM,BP神经网络、3次样条插补方法的均方根误差(RMSE)平均值分别为0.0032,0.0056,0.0069,最大偏离量(MDE)平均值分别为0.012,0.022,0.028;针对连续型随机产生36%缺失数据,3种不同方法的RMSE平均值分别为0.0061,0.0077,0.0090,MDE平均值分别为0.021,0.028,0.041;前2类实验结果表明LSSVM方法均优于其他2种缺失值插补方法。当随机产生兼具离散和连续型缺失且缺失比例不同时,缺失比例小于30%时LSSVM方法略优于其他2种方法,当缺失率大于36%时LSSVM明显优于其他2种方法。综合所有实验结果表明,LSSVM插补方法对单属性小样本缺失数据填补是一种简单有效的填补方法。 展开更多
关键词 采矿工程 覆岩变形光纤监测 数据填补 最小二乘支持向量机 分布式光纤传感
在线阅读 下载PDF
基于传递函数的土壤数据库缺失数据的填补研究 被引量:6
15
作者 韩光中 杨银华 +1 位作者 吴彬 李山泉 《土壤》 CAS CSCD 北大核心 2019年第5期1036-1041,共6页
数据缺失在土壤调查研究中是一个非常普遍的现象,处理不当一定程度上会影响研究结果的可靠性。土壤转换函数(pedotransfer functions,PTFs)是简单、快速、大批量填补土壤数据库缺失信息的有效手段。但目前分析和厘定我国土壤数据库缺失... 数据缺失在土壤调查研究中是一个非常普遍的现象,处理不当一定程度上会影响研究结果的可靠性。土壤转换函数(pedotransfer functions,PTFs)是简单、快速、大批量填补土壤数据库缺失信息的有效手段。但目前分析和厘定我国土壤数据库缺失数据特征的研究较少,针对土壤数据库缺失数据的填补方法也亟待规范。本文对我国第二次土壤普查数据库进行分析,探讨该数据库的数据缺失特征,并对数据缺失严重的土壤属性进行预测,以期为今后的土壤数据库缺失数据填补工作提供参考。总体来看,质地(砂粒、粉粒和黏粒含量)、pH、有机质、全氮、全磷、全钾是土壤普查中最基础的调查项目,这些土壤属性信息的完整性最好。有效磷、速效钾和阳离子交换量数据有一定的缺失。碱解氮、容重、砾石含量、各种类型氧化铁数据缺失严重。在填补缺失数据时,建议首先考虑模型的稳定性,尽量使用那些相对稳定且数据完整性好的土壤属性来预测缺失数据。我国第二次土壤普查数据库基本都缺少空间属性信息,在填补缺失数据时最好采用简单而相对稳定的回归模型。利用回归分析得到的土壤传递函数可以较好地实现容重、碱解氮和部分阳离子交换量缺失数据的填补工作。尽管如此,由于部分土壤属性信息有一定的时效性,应用传递函数时要注意数据源的历史背景。 展开更多
关键词 土壤数据 数据缺失 传递函数 数据填补
在线阅读 下载PDF
不完备数据集的关联分析填补方法及应用 被引量:1
16
作者 伊卫国 冯向营 《大连交通大学学报》 CAS 2015年第6期99-101,共3页
为填补不完备数据集中的缺失数据,提出一种基于关联分析的填补方法.首先挖掘已有数据集的包含缺失属性值作为后件的关联规则,然后从得到的规则中选取满足条件的规则集;最后求得总体贡献度最大的后件作为缺失数据的填补.采用脑卒中数据... 为填补不完备数据集中的缺失数据,提出一种基于关联分析的填补方法.首先挖掘已有数据集的包含缺失属性值作为后件的关联规则,然后从得到的规则中选取满足条件的规则集;最后求得总体贡献度最大的后件作为缺失数据的填补.采用脑卒中数据集进行实验,其结果表明所提出的方法能够达到较好的填补效果. 展开更多
关键词 数据填补 缺失数据 关联分析 贡献度
在线阅读 下载PDF
多种缺失模式下交通数据组合近似填补方法
17
作者 郭凤香 黄金涛 +2 位作者 陈昱光 郭延永 刘攀 《交通运输系统工程与信息》 EI CSCD 北大核心 2023年第6期42-50,共9页
随着智能交通系统中采集和应用的基础数据规模不断扩大,数据缺失问题的重要性也日益凸显。针对交通数据中常出现的数据随机缺失和连续缺失问题,本文提出基于鲸鱼优化算法优化最小二乘支持向量机的组合近似填补方法(Combined Approximate... 随着智能交通系统中采集和应用的基础数据规模不断扩大,数据缺失问题的重要性也日益凸显。针对交通数据中常出现的数据随机缺失和连续缺失问题,本文提出基于鲸鱼优化算法优化最小二乘支持向量机的组合近似填补方法(Combined Approximate Filling,CAF)。考虑缺失数据整体变化趋势的同时,参考数据的波动特征,根据多重填补思想对缺失值分别使用单变量填补和多变量填补,然后引入图片识别中自适应阈值分割法对不同时段下的差异值进行动态划分处理,最后利用不同时段的动态差异度阈值将单变量填补和多变量填补的结果进行结合,完成缺失值的高精度近似填补。为验证填补方法的性能,利用云南省玉溪市大量实车轨迹处理数据设计多组实验。实验结果表明,在小样本数据中,CAF填补方法能够适应多种场合的填补工作,该方法总体优于其他方法,在不同缺失率下均表现良好,尤其是随机缺失填补,最大RMSE为0.365。实验还证明了该方法在不同缺失类型和不同数据离散度下数据填补效果相比于其他方法优势更加明显。 展开更多
关键词 智能交通 数据填补 最小二乘支持向量机 轨迹数据 差异度
在线阅读 下载PDF
生成式对抗网络的激光扫描数据缺失填补方法
18
作者 吴泓 黎宇轩 《激光杂志》 CAS 北大核心 2023年第10期189-193,共5页
在外物遮挡、扫描盲区等多种不利因素影响下,激光扫描数据存在缺失现象,影响数据质量,为了解决该难题,设计了基于生成式对抗网络的激光扫描数据缺失填补方法。首先采用坐标控制扫描模式采集不利因素影响下的激光扫描数据。然后利用生成... 在外物遮挡、扫描盲区等多种不利因素影响下,激光扫描数据存在缺失现象,影响数据质量,为了解决该难题,设计了基于生成式对抗网络的激光扫描数据缺失填补方法。首先采用坐标控制扫描模式采集不利因素影响下的激光扫描数据。然后利用生成式对抗网络进行数据填充操作,并判断数据完整性,实现激光扫描数据准确填补。最后测试结果表明,本方法能够提高激光扫描数据完整性,保证激光扫描数据的可靠性。 展开更多
关键词 生成式对抗网络 激光扫描 数据填补 数据完整性
在线阅读 下载PDF
基于归一化KNNI的随机森林填补算法 被引量:2
19
作者 游凤 李代伟 +3 位作者 张海清 汪杰 彭莉 王震 《成都信息工程大学学报》 2021年第1期32-40,共9页
随机森林填补算法在对不完备信息系统填补时具有可靠的填补性能,同时由于填补时需要多次进行随机森林建模导致算法计算量大。为了缩短算法的运行时间,提出了NKNNI-RFI(normalization k nearest neighbor imputation-random forest imput... 随机森林填补算法在对不完备信息系统填补时具有可靠的填补性能,同时由于填补时需要多次进行随机森林建模导致算法计算量大。为了缩短算法的运行时间,提出了NKNNI-RFI(normalization k nearest neighbor imputation-random forest imputation)缺失数据填补算法。通过改变R F I算法中预填补,即使用填补更为准确的归一化KNNl(normalization k nearest neighbor imputation,NKNNI)作为预填补,为RFI算法中使用随机森林模型预测填补值提供了更接近于原始数据集的数据,使RFI算法能够在更短的时间内完成填补任务且保持良好的填补效果。实验中使用10个UCI标准数据集,将提出的算法与RFI、NKNNI、SVMI和R0USTIDA算法进行比较并使用NRMSE、PFC和A R T填补评价方法对算法效果进行评价。实验结果表明:提出算法的NRMSE和PFC与RFI算法相同,NRMSE比NKNN1、SVM1和R0USTIDA算法约低0.02~0.8,PFC比NKNNI、SVMI和R0USTIDA算法约低0.01~0.6,ART相比RFI算法最大减少程度达53%。 展开更多
关键词 不完备信息系统 缺失数据填补 NKNNI 随机森林填补 填补评价方法
在线阅读 下载PDF
基于T-S模型的混凝土坝变形缺失信息填补方法
20
作者 范博伟 张怡雯 +1 位作者 邵晨飞 胡雅婷 《水利水电技术(中英文)》 北大核心 2021年第7期95-102,共8页
针对混凝土坝变形监测信息缺失的问题,依据同类测点空间变形上的关联性,提出了T-S模型填补方法。即:首先建立以邻近相关测点变形信息为输入、缺失测点变形信息为输出的T-S模糊模型;然后运用CFSFDP-FCM聚类算法进行模型前件辨识;最后基... 针对混凝土坝变形监测信息缺失的问题,依据同类测点空间变形上的关联性,提出了T-S模型填补方法。即:首先建立以邻近相关测点变形信息为输入、缺失测点变形信息为输出的T-S模糊模型;然后运用CFSFDP-FCM聚类算法进行模型前件辨识;最后基于交替优化的最小二乘法进行后件参数求解和缺失值填补。实例分析结果表明,该方法可有效挖掘测点间变形的关联关系,填补精度和有效性明显优于常规的反距离加权、多测点回归及BP网络填补方法,且对多测点缺失情况亦具有较好填补效果。 展开更多
关键词 变形数据填补 T-S模糊模型 模糊辨识 CFSFDP-FCM聚类 交替优化策略
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部