期刊文献+
共找到55篇文章
< 1 2 3 >
每页显示 20 50 100
基于概率相似度的不完备数据填补研究
1
作者 仝利红 孙士保 《现代电子技术》 北大核心 2025年第4期79-82,共4页
为提升数据的完整性,保证数据的效用程度,提出一种基于概率相似度的不完备数据填补方法。量化计算不完备数据的概率相似度矩阵,将计算结果和ROUSTIDA算法相结合进行不完备数据填补,获取完备数据集。在此基础上,构建决策规则,保证多属性... 为提升数据的完整性,保证数据的效用程度,提出一种基于概率相似度的不完备数据填补方法。量化计算不完备数据的概率相似度矩阵,将计算结果和ROUSTIDA算法相结合进行不完备数据填补,获取完备数据集。在此基础上,构建决策规则,保证多属性缺失数据的填补性能,并且设定可辨识矩阵优化算法的不完备数据填补效果。测试结果显示,所提方法能够计算不同数据对象之间的相似度值,可有效完成数据填补,填补后数据的完备程度均在95%以上,填补数据的填补值误差均在0.17以下,填补效果良好。 展开更多
关键词 概率相似度 不完备数据 数据填补 ROUSTIDA算法 相似度矩阵 可辨识矩阵 决策规则
在线阅读 下载PDF
不完备数据下的聚酯熔体特性黏度预测方法
2
作者 毕金茂 张朋 +2 位作者 张洁 赵春财 崔利 《上海交通大学学报》 EI CAS CSCD 北大核心 2024年第4期534-544,共11页
特性黏度是衡量聚酯熔体质量的关键指标,对其进行精准预测有利于提前发现聚酯熔体潜在的质量问题,及时调整工艺参数,减少企业损失.考虑到聚酯熔体生产过程的数据不完备性、数据时序性以及高维冗余性,提出了不完备数据下聚酯熔体的特性... 特性黏度是衡量聚酯熔体质量的关键指标,对其进行精准预测有利于提前发现聚酯熔体潜在的质量问题,及时调整工艺参数,减少企业损失.考虑到聚酯熔体生产过程的数据不完备性、数据时序性以及高维冗余性,提出了不完备数据下聚酯熔体的特性黏度预测方法.针对聚酯熔体极端生产环境造成的数据不完备问题,设计了以卷积神经网络判别器和注意力长短期记忆神经网络生成器为架构的缺失数据生成对抗网络(MDGAN),通过对抗生成机制实现了缺失数据的填充.针对聚酯熔体生产过程中高维冗余和时序双向因果特性,设计了基于极端梯度提升双向门控循环单元(XGBoost-BiGRU)的特性黏度预测模型,通过极端梯度提升算法进行特征筛选,获取预测模型输入变量,再利用双向门控循环单元捕捉数据的时序双向因果关系,实现特性黏度的精准预测.浙江某聚酯纤维生产企业的实际数据测试结果表明,MDGAN算法在不同缺失率数据集下的填充精度均优于KNN、RF、MICE、GAIN数据填充算法,XGBoost-BiGRU特性黏度预测方法较STL-GPR、CAGRU、BiGRU算法优势显著,结合MDGAN的特性黏度预测方法能有效解决数据不完备下的聚酯熔体特性黏度预测问题. 展开更多
关键词 特性黏度预测 不完备数据 生成对抗网络 循环神经网络
在线阅读 下载PDF
基于不完备数据聚类的缺失数据填补方法 被引量:64
3
作者 武森 冯小东 单志广 《计算机学报》 EI CSCD 北大核心 2012年第8期1726-1738,共13页
缺失数据的处理是数据挖掘领域进行数据预处理的一个重要问题.传统的缺失数据填补方法大部分是基于概率分布等一些统计假设,对于大数据集的数据挖掘不一定是最适合的方法.受不完备数据分析(ROUSTIDA)未采用传统的概率统计学方法启发,提... 缺失数据的处理是数据挖掘领域进行数据预处理的一个重要问题.传统的缺失数据填补方法大部分是基于概率分布等一些统计假设,对于大数据集的数据挖掘不一定是最适合的方法.受不完备数据分析(ROUSTIDA)未采用传统的概率统计学方法启发,提出基于不完备数据聚类的缺失数据填补方法(MIBOI),针对分类变量不完备数据集定义约束容差集合差异度,直接计算不完备数据对象集合内所有对象的总体相异程度,以不完备数据聚类的结果为基础进行缺失数据的填补.采用UCI机器学习基准数据集进行实验表明,MIBOI对缺失数据的填补是有效可行的. 展开更多
关键词 数据填补 不完备数据 聚类 约束容差集合差异度
在线阅读 下载PDF
基于泛化中心聚类的不完备数据集填补方法 被引量:11
4
作者 王妍 王凤桐 +2 位作者 王俊陆 宋宝燕 石展 《小型微型计算机系统》 CSCD 北大核心 2017年第9期2017-2021,共5页
随着信息技术、云计算、互联网以及社交网络等技术的不断发展,数据规模呈爆炸态势增长.在海量数据带来丰富信息的同时,如何对海量信息进行高效的预处理成为研究的热点.其中,对于缺失数据的处理就是数据预处理技术中一项重要的挑战.传统... 随着信息技术、云计算、互联网以及社交网络等技术的不断发展,数据规模呈爆炸态势增长.在海量数据带来丰富信息的同时,如何对海量信息进行高效的预处理成为研究的热点.其中,对于缺失数据的处理就是数据预处理技术中一项重要的挑战.传统的缺失数据的填补方法大部分都只考虑不完备集中数据完全缺失情况下的填补,然而,在海量数据集中,由于人为或者机械等原因会对数据造成一定程度的损坏,有些数据会完全缺失,而有些数据只是部分缺失,传统的填补方法未对不同程度上损坏的数据进行划分,全部按照完全缺失数据进行填补分析,忽略了部分缺失数据对数据填补结果的影响.因此,提出一种基于泛化中心聚类的填补方法(GCF),采用泛化中心聚类思想对数据进行分簇,并对随机损坏数据与聚类结果一起进行缺失数据的填补,以提高填补后数据集的正确率.实验表明,针对不同缺失度的数据集样本,提出的GCF策略在填补正确率方面都具有良好的表现. 展开更多
关键词 海量数据 不完备数据 泛化中心聚类 数据损坏度
在线阅读 下载PDF
从不完备数据中获取诊断规则的粗糙集方法 被引量:10
5
作者 黄文涛 王伟杰 +1 位作者 赵学增 代礼周 《电力系统自动化》 EI CSCD 北大核心 2005年第14期49-54,共6页
在故障诊断中,从不完备数据中获取规则要比从完备数据中获取规则困难。利用给出的分辨矩阵基元的定义,提出了一种直接从不完备数据中获取最优广义诊断决策规则的粗糙集方法。该方法以极大相容块为单位构造了不完备故障决策表的分辨矩阵... 在故障诊断中,从不完备数据中获取规则要比从完备数据中获取规则困难。利用给出的分辨矩阵基元的定义,提出了一种直接从不完备数据中获取最优广义诊断决策规则的粗糙集方法。该方法以极大相容块为单位构造了不完备故障决策表的分辨矩阵中的列元素,实现了不完备故障诊断决策表中面向对象的约简计算和最优广义故障诊断规则的获取。该方法不需要改变原始不完备故障诊断决策表的规模,且具有更高的约简计算效率。结合电力系统操作点的安全状态诊断实例给出了所提出的方法在工程实践中的应用步骤,并证明了该方法的有效性。 展开更多
关键词 故障诊断 不完备数据 粗糙集 规则获取
在线阅读 下载PDF
用人工神经网络进行空间不完备数据的插补 被引量:4
6
作者 何凯涛 陈明 +1 位作者 张治国 Jacques Yvon 《地质通报》 CAS CSCD 北大核心 2005年第5期476-479,共4页
在地学研究中,特别是区域性资料处理过程中,常常遇到“不完备数据”的问题,即所谓的“数据不全”。在尽量减小估计误差的条件下对缺失数据进行预测或插补,对于充分利用历史资料和已知信息,提高预测质量具有重要意义。利用径向基人工神... 在地学研究中,特别是区域性资料处理过程中,常常遇到“不完备数据”的问题,即所谓的“数据不全”。在尽量减小估计误差的条件下对缺失数据进行预测或插补,对于充分利用历史资料和已知信息,提高预测质量具有重要意义。利用径向基人工神经网络(RBF)同时具有自组织神经网络和回归网络的优点,可以对缺失数据进行预测。实际区域地球化学数据处理的结果表明,RBF网络对空间不完备数据的建模和预测具有优异的效果。 展开更多
关键词 空间不完备数据 人工神经网络 非线性 知识挖掘 数学地质 区域化探
在线阅读 下载PDF
基于不完备数据的汽轮机组故障诊断的粗糙集方法 被引量:6
7
作者 黄文涛 赵学增 +1 位作者 王伟杰 代礼周 《汽轮机技术》 北大核心 2004年第1期57-59,共3页
通常从不完备数据中获取规则要比从完备数据中获取规则困难,为了在故障诊断信息不完备的情况下提取简单有效的诊断规则,提出了一种从不完备数据中获取确定和不确定诊断决策规则的粗糙集方法。以某汽轮发电机组振动故障为例给出了该方法... 通常从不完备数据中获取规则要比从完备数据中获取规则困难,为了在故障诊断信息不完备的情况下提取简单有效的诊断规则,提出了一种从不完备数据中获取确定和不确定诊断决策规则的粗糙集方法。以某汽轮发电机组振动故障为例给出了该方法的具体实现过程,并验证了该方法的有效性。 展开更多
关键词 故障诊断 粗糙集理论 不完备数据 规则获取 汽轮机组
在线阅读 下载PDF
一种基于粗集理论不完备数据的改进算法 被引量:15
8
作者 张振华 刘文奇 《计算机工程与科学》 CSCD 2002年第4期41-42.6,共3页
本文在对粗集理论进行深入研究的基础上 ,依据决策规则独立原则 ,提出了一种改进的ROUSTIDA算法 ,有效地解决了原算法可能存在的决策规则矛盾的问题。实例表明此方法是行之有效的。
关键词 粗集理论 不完备数据 数据挖掘 数据 ROUSTIDA算法
在线阅读 下载PDF
基于最小描述长度的不完备数据处理 被引量:2
9
作者 李然 林和 李永礼 《兰州大学学报(自然科学版)》 CAS CSCD 北大核心 2006年第6期78-80,共3页
不完备数据是造成信息系统不确定的主要原因之一,对数据挖掘、知识发现等造成了困难.本文提出一种基于最小描述长度原则的不完备数据处理方法,实例证明这种方法是有效的.Rose工具的规则提取结果证明此方法在规则的集中性和支持度方面... 不完备数据是造成信息系统不确定的主要原因之一,对数据挖掘、知识发现等造成了困难.本文提出一种基于最小描述长度原则的不完备数据处理方法,实例证明这种方法是有效的.Rose工具的规则提取结果证明此方法在规则的集中性和支持度方面优于粗糙集辨识矩阵方法和Conditioned mean completer方法. 展开更多
关键词 最小描述长度 不完备数据 信息熵
在线阅读 下载PDF
一种从不完备数据集中发现规则的RS方法
10
作者 贺毅 蔡之华 毕进军 《计算机工程》 CAS CSCD 北大核心 2004年第8期162-163,共2页
Rough集(Rough sets, RS)理论被广泛应用于数据分类问题,该文用基于RS的方法从不完备数据集中产生确定和可能的规则集。提出了一种新的规则发现算法,可以同时从不完备数据集中产生规则和估计缺失值,并指出了进一步的研究方向。
关键词 不完备数据 ROUGH集 知识发现
在线阅读 下载PDF
基于粗糙集理论的不完备数据分析方法的混合信息系统填补算法 被引量:12
11
作者 彭莉 张海清 +3 位作者 李代伟 唐聃 于曦 何磊 《计算机应用》 CSCD 北大核心 2021年第3期677-685,共9页
为了提高基于粗糙集理论的不完备数据分析方法(ROUSTIDA)在实际应用中对包含离散型(如整型、字符串型、枚举型)、连续型(如浮点数表达)、缺失型属性的混合信息系统(HIS)数据的填补能力,提出了一种基于粗糙集理论的混合信息系统缺失值填... 为了提高基于粗糙集理论的不完备数据分析方法(ROUSTIDA)在实际应用中对包含离散型(如整型、字符串型、枚举型)、连续型(如浮点数表达)、缺失型属性的混合信息系统(HIS)数据的填补能力,提出了一种基于粗糙集理论的混合信息系统缺失值填补方法(RSHISMIA)。首先,根据决策属性等价类划分思想并按照决策属性对混合信息系统HIS进行划分,解决了填补后可能出现的决策规则冲突问题;其次,定义混合距离矩阵来合理量化对象间的相似性,从而筛选出具有填补能力的样本并克服ROUSTIDA无法处理连续性属性的缺点;然后,结合近邻思想解决了ROUSTIDA在无差别对象属性值发生冲突情况下无法对相同属性缺失数据进行填补的问题。最后,使用10个UCI标准数据集进行实验,将所提出的方法与ROUSTIDA、K近邻填补(KNNI)算法、随机森林填补(RFI)算法和矩阵分解(MF)等几种经典算法进行了比较。实验结果表明,与ROUSTIDA相比,所提方法在查全率上平均高出81%,在查准率上提升了5%~53%,且其归一化均方根误差(NRMSE)最多减小了0.12。此外,所提方法的分类准确率与ROUSTIDA相比平均提升了7%,且优于KNNI、RFI及MF等填补算法。 展开更多
关键词 基于粗糙集理论的不完备数据分析方法 混合信息系统 缺失值填补 混合距离 最近邻
在线阅读 下载PDF
多标记不完备数据的特征选择算法 被引量:3
12
作者 钱文彬 黄琴 +1 位作者 王映龙 杨珺 《计算机科学与探索》 CSCD 北大核心 2019年第10期1768-1780,共13页
多标记数据的特征选择是机器学习和数据挖掘领域的重要研究内容,当前对于多标记数据的特征选择研究大多是针对完备性数据,但在许多应用领域中,连续型数值数据较多,且由于诊测成本和隐私保护等因素导致数据往往呈现出不完备性。为解决上... 多标记数据的特征选择是机器学习和数据挖掘领域的重要研究内容,当前对于多标记数据的特征选择研究大多是针对完备性数据,但在许多应用领域中,连续型数值数据较多,且由于诊测成本和隐私保护等因素导致数据往往呈现出不完备性。为解决上述问题,提出了一种面向多标记不完备数据的特征选择算法。该算法将邻域粗糙集模型应用于多标记不完备数据的特征选择,根据邻域阈值求解多标记不完备数据的邻域粒度,并基于邻域粒度给出了度量多标记不完备数据的特征重要性准则,以此设计了面向多标记不完备数据的特征选择算法。最后,通过在Mulan数据集上的实验结果验证了算法的有效性和可行性。 展开更多
关键词 不完备数据 粗糙集 特征选择 属性约简
在线阅读 下载PDF
不完备数据下的免疫分类算法 被引量:3
13
作者 舒才良 严宣辉 曾庆盛 《计算机工程与应用》 CSCD 2012年第20期172-176,共5页
人工免疫识别系统(AIRS)是受生物免疫系统的启示而研发的一种比较有效的分类器,但也存在记忆细胞数目过于庞大,分类精度不高,特别是在数据不完备的情况下,分类精度低等缺陷。为了解决这个问题,提出了一种不完备数据下的免疫分类算法(ICA... 人工免疫识别系统(AIRS)是受生物免疫系统的启示而研发的一种比较有效的分类器,但也存在记忆细胞数目过于庞大,分类精度不高,特别是在数据不完备的情况下,分类精度低等缺陷。为了解决这个问题,提出了一种不完备数据下的免疫分类算法(ICAU),算法引入半监督学习机制和分类器融合投票决策的思想,利用多个AIRS分类器互相帮助学习训练,来提高AIRS在不完备数据下的分类精度。在UCI数据集上进行了实验,结果验证了ICAU算法的有效性。 展开更多
关键词 人工免疫系统 不完备数据 分类
在线阅读 下载PDF
基于q近邻的不完备数据三支决策聚类方法 被引量:5
14
作者 苏婷 于洪 《计算机科学与探索》 CSCD 北大核心 2016年第6期875-883,共9页
聚类是数据挖掘的重要技术之一,在许多实际应用领域,由于数据获取限制,数据误读,随机噪音等原因会造成大量的缺失数据,形成数据集的不完备性,而传统的聚类方法无法直接对这类数据集进行聚类分析。针对数值型数据,提出了一个基于三支决... 聚类是数据挖掘的重要技术之一,在许多实际应用领域,由于数据获取限制,数据误读,随机噪音等原因会造成大量的缺失数据,形成数据集的不完备性,而传统的聚类方法无法直接对这类数据集进行聚类分析。针对数值型数据,提出了一个基于三支决策的不完备数据聚类方法。首先找到不完备数据对象的q个近邻,使用q个近邻的平均值填充缺失的数据;然后在"完备的"数据集上使用基于密度峰值的聚类方法得到簇划分,对每个簇中含有不确定性的数据对象,使用三支决策的思想将其划分到边界域中。三支决策聚类结果采用区间集形式表示,通常一个簇被划分成正域、负域和边界域部分,可以更好地描述软聚类结果。在UCI数据集和人工数据集上的实验结果展示了算法的有效性。 展开更多
关键词 不完备数据 三支决策聚类 q近邻
在线阅读 下载PDF
面向代价敏感的多标记不完备数据特征选择算法 被引量:5
15
作者 黄琴 钱文彬 +1 位作者 王映龙 吴兵龙 《小型微型计算机系统》 CSCD 北大核心 2018年第12期2617-2624,共8页
代价敏感下的特征选择是机器学习和数据挖掘领域的重要研究内容,目前基于代价敏感的特征选择研究主要是面向单标记的数据,由于在许多应用领域数据往往是多标记连续型数据,且在数据获取过程中由于技术或成本限制导致数据呈现出不完备性.... 代价敏感下的特征选择是机器学习和数据挖掘领域的重要研究内容,目前基于代价敏感的特征选择研究主要是面向单标记的数据,由于在许多应用领域数据往往是多标记连续型数据,且在数据获取过程中由于技术或成本限制导致数据呈现出不完备性.为解决上述问题,提出了一种基于测试代价的多标记不完备数据特征选择算法.首先,算法利用粗糙集模型计算多标记不完备数据下的邻域粒度,并用均匀分布和正态分布两种分布函数计算每个特征的特征代价;然后,提出了一种基于测试代价的特征重要性计算方法,并在核特征的基础上,设计了启发式的特征选择算法;最后,通过在Mulan数据集上的实验结果进一步验证了算法的有效性和可行性. 展开更多
关键词 代价敏感 特征选择 属性约简 不完备数据 多标记分类
在线阅读 下载PDF
一种面向不完备数据的集对粒层次聚类算法 被引量:6
16
作者 张春英 高瑞艳 +4 位作者 范雨祥 王龙飞 裴天帅 冯晓泽 任静 《小型微型计算机系统》 CSCD 北大核心 2021年第3期522-530,共9页
针对现有层次聚类算法难以处理不完备数据集,同时考虑样本与类簇之间的不确定关系,提出一种面向不完备数据的集对粒层次聚类算法-SPGCURE.首先,采用集对信息粒的知识对缺失值进行处理,不同于以往算法中将缺失属性删除或者填充,用集对联... 针对现有层次聚类算法难以处理不完备数据集,同时考虑样本与类簇之间的不确定关系,提出一种面向不完备数据的集对粒层次聚类算法-SPGCURE.首先,采用集对信息粒的知识对缺失值进行处理,不同于以往算法中将缺失属性删除或者填充,用集对联系度中的差异度来表示缺失属性值,提出一种改进的集对信息距离度量方法,用于考量不完备数据样本间的紧密程度;其次,基于改进后的集对距离度量,给出各个类簇的类内平均距离的定义,形成以正同域Cs(样本一定属于类簇)、边界域Cu(样本可能属于类簇)和负反域Co(样本不属于类簇)表示的集对粒层次聚类;SPGCURE算法在完备和不完备数据都适用,最后,选用5个经典的UCI数据集,与常用的经典及改进聚类算法进行实验评价,结果表明,SPGCURE算法在准确度、F-measure、调整兰德系数和标准互信息等指标上均具有不错的聚类性能. 展开更多
关键词 不完备数据 集对信息粒 层次聚类 集对信息距离
在线阅读 下载PDF
不完备数据中面向特征值更新的增量特征选择方法 被引量:5
17
作者 唐荣 罗川 +1 位作者 曹潜 王思朝 《智能系统学报》 CSCD 北大核心 2021年第3期493-501,共9页
实际应用中,数据常常表现出不完备性和动态性的特点。针对动态不完备数据中的特征选择问题,提出了一种基于相容粗糙集模型和信息熵理论的增量式特征选择方法。首先,建立了不完备信息系统中特征值动态更新时论域上条件划分与决策分类的... 实际应用中,数据常常表现出不完备性和动态性的特点。针对动态不完备数据中的特征选择问题,提出了一种基于相容粗糙集模型和信息熵理论的增量式特征选择方法。首先,建立了不完备信息系统中特征值动态更新时论域上条件划分与决策分类的动态更新模式,分析了作为特征重要度评价准则的不完备相容信息熵的增量计算机制,并将该机制引入到启发式最优特征子集搜索过程中特征重要度的迭代计算,进一步设计了不完备数据中面向特征值动态更新的增量式特征选择算法。最后,在标准UCI数据集上从分类精度、决策性能和计算效率3个方面对文中所提出的增量算法的有效性和高效性进行了实验验证。 展开更多
关键词 特征选择 维度约简 粗糙集 信息熵 不完备数据 缺失值 启发式搜索 增量学习
在线阅读 下载PDF
数据不完备下基于CNN-GRU神经网络的地铁基坑变形预测方法研究
18
作者 周意 王章琼 +3 位作者 邹原耕 蔡永辉 徐晓雅 赵歧林 《城市轨道交通研究》 北大核心 2025年第6期32-36,53,共6页
[目的]为应对地铁基坑变形监测数据不完备导致的预测滞后和精度下降问题,提出一种基于CNN-GRU神经网络(卷积神经网络-门控循环单元神经网络)的基坑变形预测方法,并对此方法进行验证。[方法]利用基坑不完备变形监测数据和缺失监测点附近... [目的]为应对地铁基坑变形监测数据不完备导致的预测滞后和精度下降问题,提出一种基于CNN-GRU神经网络(卷积神经网络-门控循环单元神经网络)的基坑变形预测方法,并对此方法进行验证。[方法]利用基坑不完备变形监测数据和缺失监测点附近点位监测数据构建数据样本集,输入CNN模型中,完成缺失数据的填补修复,得到完整连续的基坑变形监测数据。利用小波分解提取变形监测数据中低频趋势分量和高频误差分量,利用GRU神经网络模型和ARMA(自回归滑动平均)模型分别对低频趋势分量和噪声分量进行预测,再将预测结果合并得到最终变形预测结果。结合南京某地铁车站基坑工程案例,对该方法的有效性进行了验证。[结果及结论]采用基于CNN-GRU神经网络的基坑变形预测方法对缺失率达到18.5%和10.1%的基坑变形数据修复后进行预测时,预测误差分别为1.9266%和1.2746%,预测精度分别提高了35%和6%,可以看出该方法的数据修复能力表现良好,数据修复可靠度较高。对比GA-BP神经网络预测方法和LSTM预测方法,该方法的预测精度提升了1倍以上,且较好解决了预测滞后的问题,预测精度能够满足实际工程需要。 展开更多
关键词 地铁 基坑变形预测方法 CNN-GRU神经网络 数据不完备
在线阅读 下载PDF
面向不完备混合数据的模糊多粒度异常检测
19
作者 唐宇皓 彭德中 袁钟 《计算机应用》 CSCD 北大核心 2024年第10期3097-3104,共8页
针对现有的异常检测方法大多无法有效处理不完备混合数据的问题,提出一种面向不完备混合数据的模糊多粒度异常检测算法ADFIIS(Anomaly Detection in Fuzzy Incomplete Information System),所提算法考虑在标称属性和在数值属性上出现缺... 针对现有的异常检测方法大多无法有效处理不完备混合数据的问题,提出一种面向不完备混合数据的模糊多粒度异常检测算法ADFIIS(Anomaly Detection in Fuzzy Incomplete Information System),所提算法考虑在标称属性和在数值属性上出现缺失值的情况,能处理混合属性数据。首先,定义属性之间的模糊相似度;其次,计算每个属性的模糊熵,基于熵的大小使用多粒度的思想构建多个属性序列;再次,计算每个样本的异常值以表征它的异常程度;最后,设计相应的ADFIIS算法并分析它的复杂度。在公开数据集上进行实验,将所提算法与ILGNI(Incomplete Local and Global Neighborhood Information network)等主流离群点检测算法对比。实验结果表明,ADFIIS在不完备混合数据集上的受试者操作特征(ROC)曲线效果更好。ADFIIS的曲线下面积(AUC)的平均值优于90%的对比方法,相较于同样能够处理不完备混合数据的ILGNI,它的AUC平均值提升了7个百分点。所提算法使用模型扩展法在不改变原始数据集的情况下对不完备数据集进行异常检测,拓展了异常检测的适用范围。 展开更多
关键词 模糊粗糙集 多粒度 异常检测 离群检测 不完备混合数据
在线阅读 下载PDF
数据不完备下基于特征识别的公交客流短时预测 被引量:2
20
作者 方晓平 林美 +1 位作者 陈维亚 潘鑫 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2020年第4期114-122,共9页
识别公交客流特征是提高短时预测质量的关键。但由于设备故障、数据收集受限等原因,客流数据属性往往是不完备的,这给特征识别和客流预测带来了挑战。文中以缺少乘客属性数据的长沙市104路公交卡数据为样本,利用卡号与出行时间的关联性... 识别公交客流特征是提高短时预测质量的关键。但由于设备故障、数据收集受限等原因,客流数据属性往往是不完备的,这给特征识别和客流预测带来了挑战。文中以缺少乘客属性数据的长沙市104路公交卡数据为样本,利用卡号与出行时间的关联性识别乘客出行频次,以此作为区分出行特征的变量,将客流总集划分为不同的特征子集,依据子集规模、方差确定变量最佳取值,推断客流特征。与直接预测客流总集相比,文中为每类子集建立季节性差分自回归滑动平均(SARIMA)模型分别进行预测,整合后得出的样本外平均绝对误差改善了36.11%,依据乘客出行特征建立的预测模型拟合度为0.95,可有效识别公交客流特征。 展开更多
关键词 公交客流 短时预测 不完备数据 出行特征 SARIMA模型
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部