期刊文献+
共找到21篇文章
< 1 2 >
每页显示 20 50 100
基于聚类的连续型数据缺失值充填方法 被引量:12
1
作者 李国和 杨绍伟 +1 位作者 吴卫江 郑艺峰 《计算机工程》 CAS CSCD 北大核心 2019年第9期32-39,共8页
在大数据应用中,多数建模方法是在完备数据集基础上进行的,但在数据采集过程或存储过程中容易出现数据缺失的现象,导致无法建模。为此,提出一种基于聚类的递归充填方法。使用同类簇的均值对不完备数据进行预填充,形成初始完备数据集,针... 在大数据应用中,多数建模方法是在完备数据集基础上进行的,但在数据采集过程或存储过程中容易出现数据缺失的现象,导致无法建模。为此,提出一种基于聚类的递归充填方法。使用同类簇的均值对不完备数据进行预填充,形成初始完备数据集,针对得到的完整数据进行聚类,并运用同类簇的均值修正初始充填值。根据充填效果误差判定充填稳定性,并进行多次递归聚类修正充填值,直到前后两次充填较为稳定或迭代次数超过阈值时停止迭代。实验结果表明,与均值充填、K最近邻充填、聚类充填及粗糙集不完备数据分析等方法相比,该方法能够进行更为精准的充填,使得最终充填更加接近真实数据。 展开更多
关键词 缺失值 预充填 聚类 递归充填 平方误差
在线阅读 下载PDF
基于密度和半监督学习的数据修复与聚类 被引量:1
2
作者 张倩倩 李国和 郑艺峰 《计算机工程与设计》 北大核心 2020年第3期676-681,共6页
针对现有数据修复算法需要数据集的完整性依赖等函数、不适用于简单数据集、不能充分利用背景知识等问题,提出一种基于密度和半监督学习的修复和聚类算法。遵循数据修复的最小改变原则,利用样本集自身的密度信息和背景知识形成临时聚类... 针对现有数据修复算法需要数据集的完整性依赖等函数、不适用于简单数据集、不能充分利用背景知识等问题,提出一种基于密度和半监督学习的修复和聚类算法。遵循数据修复的最小改变原则,利用样本集自身的密度信息和背景知识形成临时聚类簇;利用成对约束将临时聚类簇进行分割或者合并,形成最终聚类簇,在聚类的同时完成不精确数据的修复。实验结果表明,该算法适用于具有简单模式的样本集,是对现有基于完整性约束数据修复算法的扩展,提高了数据修复正确率和聚类精度。 展开更多
关键词 数据质量 数据清理 数据修复 成对约束 密度聚类
在线阅读 下载PDF
粒计算思维下的BP神经网络在金融趋势预测中的应用 被引量:9
3
作者 沈泽君 杨文元 《小型微型计算机系统》 CSCD 北大核心 2019年第3期527-532,共6页
BP(Back Propagation)神经网络在金融趋势预测上得到了广泛的应用,其通过反向传播误差来调整模型的权重与偏值,能够较强的适应金融的走向趋势.但是由于金融趋势的周期性变化多端,不同周期下对预测值的影响不一,传统的BP神经网络在金融... BP(Back Propagation)神经网络在金融趋势预测上得到了广泛的应用,其通过反向传播误差来调整模型的权重与偏值,能够较强的适应金融的走向趋势.但是由于金融趋势的周期性变化多端,不同周期下对预测值的影响不一,传统的BP神经网络在金融趋势预测上存在一定的局限性.本文充分考虑金融趋势周期粒度这一特性,提出了基于粒计算思维的BP神经网络(Back Propagation on Granular Computing,BPGC). BPGC算法首先对数据集进行不同粒度划分、构造粒度矩阵,然后根据粒度矩阵进行BP训练得出各粒度下的权值,最后对各粒度的预测结果进行加权平均,得出预测结果.在浦发银行股票收盘价数据集上进行实验,与传统的BP神经网络进行比对,实验结果验证了BPGC算法的有效性. 展开更多
关键词 粒计算 BP神经网络 粒度矩阵 金融趋势预测
在线阅读 下载PDF
利用一致性分析的高维类别不平衡数据特征选择 被引量:4
4
作者 曾海亮 林耀进 +1 位作者 王晨曦 陈祥焰 《小型微型计算机系统》 CSCD 北大核心 2020年第9期1946-1951,共6页
在高维小样本分类学习任务中,数据存在着高维性及类别不平衡问题.基于此,构建利用一致性分析的高维类别不平衡数据特征选择模型.首先通过定义融合类别信息来定义样本在特征空间的一致性,其次设计基于特征重要度的前向特征选择算法,最后... 在高维小样本分类学习任务中,数据存在着高维性及类别不平衡问题.基于此,构建利用一致性分析的高维类别不平衡数据特征选择模型.首先通过定义融合类别信息来定义样本在特征空间的一致性,其次设计基于特征重要度的前向特征选择算法,最后选取十二个数据集与七个算法进行对比分析,实验结果表明,该算法能显著提高小类预测精度. 展开更多
关键词 一致性分析 高维小样本 类别不平衡 特征选择
在线阅读 下载PDF
小样本类不平衡数据的一致性分析流特征选择 被引量:2
5
作者 林培榕 曾海亮 +2 位作者 王晨曦 卢舜 林耀进 《小型微型计算机系统》 CSCD 北大核心 2021年第11期2252-2258,共7页
在小样本分类学习任务中,数据存在着类别不平衡问题以及数据特征空间的动态演化性.基于此,构建小样本类不平衡数据的一致性分析流特征选择模型.首先,利用均值定义同类样本的类中心,然后通过样本在特征与标记的信息定义类中心的近邻;其次... 在小样本分类学习任务中,数据存在着类别不平衡问题以及数据特征空间的动态演化性.基于此,构建小样本类不平衡数据的一致性分析流特征选择模型.首先,利用均值定义同类样本的类中心,然后通过样本在特征与标记的信息定义类中心的近邻;其次,通过融合类别信息来定义类中心在特征空间的一致性;再次,设计流特征环境下的在线特征选择算法;最后,选取七个数据集与七个算法进行对比分析,实验结果表明,该算法能显著提高小类预测精度. 展开更多
关键词 高维小样本 类别不平衡 一致性分析 流特征选择
在线阅读 下载PDF
基于邻域粒化的多数据源高投票决策规则的挖掘 被引量:1
6
作者 陈辉皇 林耀进 +1 位作者 林国平 唐莉 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2017年第6期1063-1071,共9页
多数据源高投票决策规则挖掘是指从多数据源中挖掘存在大部分数据源且具有重要意义的决策规则,此类规则在银行理财产品营销、市场营销、疾病诊断等领域中具有指导性作用.利用样本邻域粒化来构建决策规则的表现形式,在此基础上定义了覆... 多数据源高投票决策规则挖掘是指从多数据源中挖掘存在大部分数据源且具有重要意义的决策规则,此类规则在银行理财产品营销、市场营销、疾病诊断等领域中具有指导性作用.利用样本邻域粒化来构建决策规则的表现形式,在此基础上定义了覆盖度、投票数等多种决策规则的度量指标,用以挖掘满足这些度量指标的高投票决策规则.实验结果验证了所提算法挖掘多源决策信息系统中的高投票决策规则挖掘的有效性. 展开更多
关键词 邻域粒化 多数据源 高投票决策规则 分类间隔
在线阅读 下载PDF
基于限制性随机游走局部谱近似社区发现算法 被引量:3
7
作者 吴卫江 桑睿彤 郑艺峰 《计算机工程与设计》 北大核心 2021年第9期2472-2477,共6页
针对大型网络中社区发现优化方法的效率问题,提出一种局部社区发现方法(LRW-LSA),从少量种子节点中识别本地社区的所有潜在社区成员。采用限制性随机游走进行采样处理,从种子节点出发得到一个相对较小的子图;利用种子的归一化指示向量... 针对大型网络中社区发现优化方法的效率问题,提出一种局部社区发现方法(LRW-LSA),从少量种子节点中识别本地社区的所有潜在社区成员。采用限制性随机游走进行采样处理,从种子节点出发得到一个相对较小的子图;利用种子的归一化指示向量对子图进行Lanczos迭代,得到相关节点与目标社区的隶属概率用以恢复出目标社区。在不同领域的真实数据集和合成数据集上进行实验,结果表明,LRW-LSA优于现有的社区发现方法。 展开更多
关键词 局部社区发现 限制性随机游走 Lanczos迭代 种子节点 目标社区
在线阅读 下载PDF
由粗到细的分层特征选择 被引量:7
8
作者 刘浩阳 林耀进 +3 位作者 刘景华 吴镒潾 毛煜 李绍滋 《电子学报》 EI CAS CSCD 北大核心 2022年第11期2778-2789,共12页
利用数据类别间层次结构关系进行分类学习任务广泛存在于疾病诊断、图像标注等领域.然而,数据特征空间的高维性,使得分层分类学习面临着时间复杂度高和存储负担大等问题.另外,现有研究工作都假设训练集标记粒度是充分细化,与实际分层分... 利用数据类别间层次结构关系进行分类学习任务广泛存在于疾病诊断、图像标注等领域.然而,数据特征空间的高维性,使得分层分类学习面临着时间复杂度高和存储负担大等问题.另外,现有研究工作都假设训练集标记粒度是充分细化,与实际分层分类学习中划分细粒度标记代价高,类别标记间存在语义歧义性等矛盾.为解决上述问题,提出一种由粗到细的分层特征选择算法.该算法考虑类内一致性和兄弟节点间的差异性以选择有代表性特征,同时在特征选择的过程中实现预测训练样本未知的细粒度标记.在7个基准数据集上的实验结果表明,所提算法的分类性能优于一些先进的对比算法,且能处理标记粒度不够细化的情况. 展开更多
关键词 特征选择 分层分类 标记层次结构 标记粒度 递归正则化 稀疏优化 全局最优解
在线阅读 下载PDF
区块链环境下用户身份匿名的量子委托计算协议 被引量:3
9
作者 王育齐 陈庚 钱伟中 《电子科技大学学报》 EI CAS CSCD 北大核心 2022年第6期802-811,共10页
在大数据背景下,数据安全与身份安全同等重要。其中,身份的盲性值得特别关注。为满足量子委托计算对数据与身份盲性的需求,提出一个在区块链环境下进行,能兼顾数据安全与身份安全的匿名量子委托计算协议。协议不依赖可信的第三方,用户... 在大数据背景下,数据安全与身份安全同等重要。其中,身份的盲性值得特别关注。为满足量子委托计算对数据与身份盲性的需求,提出一个在区块链环境下进行,能兼顾数据安全与身份安全的匿名量子委托计算协议。协议不依赖可信的第三方,用户能够匿名地参与委托计算协议,无需展示身份信息就可以完成委托的发送与结果的接收。在发送计算委托时,Alice使用环形网络对身份进行混淆以隐藏发送方。Bob使用受控量子隐形传态安全且匿名地反馈委托计算结果。另外,协议引入区块链技术协助第三方Charlie对用户的支付进行匿名审批。协议使用到的区块链与量子技术基本已实现,因此协议具有较高的可行性。进一步提出了改进协议,用户可以通过比对多委托方的计算结果来实现委托计算结果的可验证。该文提出的协议是一个面向大数据环境的实用协议框架,具有很好的迁移性。 展开更多
关键词 区块链 身份安全 量子委托计算 量子隐形传态
在线阅读 下载PDF
信息熵约束下的视频目标分割 被引量:2
10
作者 丁飞飞 杨文元 《计算机应用》 CSCD 北大核心 2018年第10期2782-2787,共6页
大部分基于图论的视频分割方法往往先通过分析运动和外观信息获得先验显著性区域,然后用最小化能量模型来进一步分割,这些方法常常忽略对外观信息精细化分析,建立的目标模型对复杂场景的鲁棒性不佳。根据信息熵能够度量样本纯度,信息熵... 大部分基于图论的视频分割方法往往先通过分析运动和外观信息获得先验显著性区域,然后用最小化能量模型来进一步分割,这些方法常常忽略对外观信息精细化分析,建立的目标模型对复杂场景的鲁棒性不佳。根据信息熵能够度量样本纯度,信息熵最小化和能量模型最小化具有一致的目标,提出一种信息熵约束下的视频目标分割方法。首先在经典光流法基础上结合点在多边形内部原理获得第一阶段的分割结果;然后以超像素为基本分割单元,获得均匀的运动和表现;最后在能量函数中引入信息熵约束项,构建前景背景像素标记的优化问题,通过最小化能量函数得到更精确的分割结果。在公开数据集上的实验结果表明目标模型中引入信息熵约束项能够有效提高视频目标分割的鲁棒性。 展开更多
关键词 光流 信息熵 超像素 视频分割 能量函数
在线阅读 下载PDF
一类特殊三维六度环面网络的直径公式 被引量:1
11
作者 钟玮 刘日华 陈宝兴 《计算机工程与应用》 CSCD 北大核心 2019年第13期119-122,共4页
六度网孔网络和六度环面网络在化学、计算机图形学和峰巢移动通信等领域都得到了十分广泛的应用。三维环面是二维环面的自然性推广。该文针对张震等人所提出的三维六度环面Cayley图网络模型的未解问题,给出了一类特殊三维六度环面网络... 六度网孔网络和六度环面网络在化学、计算机图形学和峰巢移动通信等领域都得到了十分广泛的应用。三维环面是二维环面的自然性推广。该文针对张震等人所提出的三维六度环面Cayley图网络模型的未解问题,给出了一类特殊三维六度环面网络的直径公式,并给予了详细的证明。 展开更多
关键词 三维六度环面网络 CAYLEY图 直径公式
在线阅读 下载PDF
基于互信息的多级特征选择算法 被引量:14
12
作者 雍菊亚 周忠眉 《计算机应用》 CSCD 北大核心 2020年第12期3478-3484,共7页
针对在特征选择中选取特征较多时造成的去冗余过程很复杂的问题,以及一些特征需与其他特征组合后才会与标签有较强相关度的问题,提出了一种基于互信息的多级特征选择算法(MI_MLFS)。首先,根据特征与标签的相关度,将特征分为强相关、次... 针对在特征选择中选取特征较多时造成的去冗余过程很复杂的问题,以及一些特征需与其他特征组合后才会与标签有较强相关度的问题,提出了一种基于互信息的多级特征选择算法(MI_MLFS)。首先,根据特征与标签的相关度,将特征分为强相关、次强相关和其他特征;其次,选取强相关特征后,在次强相关特征中,选取冗余度较低的特征;最后,选取能增强已选特征集合与标签相关度的特征。在15组数据集上,将MI_MLFS与ReliefF、最大相关最小冗余(mRMR)算法、基于联合互信息(JMI)算法、条件互信息最大化准则(CMIM)算法和双输入对称关联(DISR)算法进行对比实验,结果表明MI_MLFS在支持向量机(SVM)和分类回归树(CART)分类器上分别有13组和11组数据集获得了最高的分类准确率。相较多种经典特征选择方法,MI_MLFS算法有更好的分类性能。 展开更多
关键词 特征选择 互信息 多级 相关度 冗余度 分类准确率
在线阅读 下载PDF
基于各类支持度阈值独立挖掘的关联改进算法 被引量:14
13
作者 周忠眉 李家辉 《计算机工程与科学》 CSCD 北大核心 2019年第11期2088-2094,共7页
关联分类及较多的改进算法很难同时既具有较高的整体准确率又有较好的小类分类性能。针对此问题,提出了一种基于类支持度阈值独立挖掘的关联分类改进算法—ACCS。ACCS算法的主要特点是:(1)根据训练集中各类数量大小给出每个类类支持度... 关联分类及较多的改进算法很难同时既具有较高的整体准确率又有较好的小类分类性能。针对此问题,提出了一种基于类支持度阈值独立挖掘的关联分类改进算法—ACCS。ACCS算法的主要特点是:(1)根据训练集中各类数量大小给出每个类类支持度阈值的设定方法,并基于各类的类支持度阈值独立挖掘该类的关联分类规则,尽量使小类生成更多高置信度的规则;(2)采用类支持度对置信度相同的规则排序,提高小类规则的优先级;(3)用综合考虑置信度和提升度的新的规则度量预测未知实例。在多个数据集上的实验结果表明,相比多种关联分类改进算法,ACCS算法有更高的整体分类准确率,且在不平衡数据上也能取得较好的小类分类性能。 展开更多
关键词 关联分类 类支持度阈值 类支持度 分类准确率
在线阅读 下载PDF
利用邻域信息交互的在线流特征选择算法 被引量:4
14
作者 李珑珠 林耀进 +2 位作者 吕彦 卢舜 王晨曦 《计算机工程与应用》 CSCD 北大核心 2021年第21期102-108,共7页
开放动态环境下的机器学习任务面临着数据特征空间的高维性和动态性。目前已有在线流特征选择算法基本仅考虑特征的重要性和冗余性,忽略了特征的交互性。特征交互是指那些本身与标签单独统计时呈现无关或弱相关,但与其他特征结合时却能... 开放动态环境下的机器学习任务面临着数据特征空间的高维性和动态性。目前已有在线流特征选择算法基本仅考虑特征的重要性和冗余性,忽略了特征的交互性。特征交互是指那些本身与标签单独统计时呈现无关或弱相关,但与其他特征结合时却能与标签呈强相关的特征。基于此,提出一种基于邻域信息交互的在线流特征选择算法,该算法分为在线交互特征选择和在线冗余特征剔除两个阶段,即直接计算新到特征与整个已选特征子集的交互强弱程度,以及利用成对比较机制剔除冗余特征。在10个数据集上的实验结果表明了所提算法的有效性。 展开更多
关键词 特征选择 流特征 特征交互 邻域互信息
在线阅读 下载PDF
基于图像属性的零样本分类方法综述 被引量:3
15
作者 贾霄 郭顺心 赵红 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2021年第4期531-543,共13页
随着机器学习技术的不断发展,深度学习在许多研究领域取得了巨大的突破.然而,多数深度学习方法需要大量的有标注数据进行模型拟合,不符合现实世界的一些应用场景,而零样本学习则可有效地缓解该问题.具体地,零样本学习主要针对样本数量... 随着机器学习技术的不断发展,深度学习在许多研究领域取得了巨大的突破.然而,多数深度学习方法需要大量的有标注数据进行模型拟合,不符合现实世界的一些应用场景,而零样本学习则可有效地缓解该问题.具体地,零样本学习主要针对样本数量稀少、新样本的出现和分类任务人工标注成本高等一系列问题给出有效的解决方案,对图像分类有重要意义.系统综述基于图像属性的零样本学习方法:首先,系统概述零样本学习的定义及零样本学习的发展历程;其次,对基于图像属性的零样本分类的三类主要方法进行介绍,并讨论了各方法的区别和联系;最后,指出了零样本学习现在仍存在的问题以及未来发展的方向. 展开更多
关键词 深度学习 机器学习 零样本学习 图像分类
在线阅读 下载PDF
基于证据理论的覆盖决策信息系统约简的数值刻画 被引量:2
16
作者 张燕兰 李长清 许晴媛 《南京航空航天大学学报》 EI CAS CSCD 北大核心 2019年第5期599-608,共10页
决策为划分的覆盖决策信息系统的特征选择理论和方法日趋成熟。但在数据采集的过程中,有些数据集存在对象的决策缺失或决策不能完全确定情况,那么将决策刻画为覆盖更加合理。而决策为覆盖的覆盖决策信息系统特征选择的研究却很少见。本... 决策为划分的覆盖决策信息系统的特征选择理论和方法日趋成熟。但在数据采集的过程中,有些数据集存在对象的决策缺失或决策不能完全确定情况,那么将决策刻画为覆盖更加合理。而决策为覆盖的覆盖决策信息系统特征选择的研究却很少见。本文讨论决策为覆盖的覆盖决策信息系统的特征选择,利用证据理论中的信任函数和似然函数给出覆盖决策信息系统约简的等价刻画,从而给出求约简的算法,并以实例说明该方法的有效性。 展开更多
关键词 属性约简 覆盖信息系统 覆盖粗糙集 证据理论
在线阅读 下载PDF
基于格的分层无证书代理签名方案
17
作者 农强 张棒棒 欧阳玉豪 《计算机应用》 CSCD 北大核心 2023年第1期154-159,共6页
现有基于经典数论问题假设的无证书代理签名方案无法抵御量子计算机攻击,在应用于有大量用户的系统时会存在单点失效和不易扩展等局限。针对这些问题,提出一种基于格的分层无证书代理签名方案。首先,采用拒绝采样技术和无陷门技术提高... 现有基于经典数论问题假设的无证书代理签名方案无法抵御量子计算机攻击,在应用于有大量用户的系统时会存在单点失效和不易扩展等局限。针对这些问题,提出一种基于格的分层无证书代理签名方案。首先,采用拒绝采样技术和无陷门技术提高密钥生成的计算效率;其次,不同层级的原始签名人和代理签名人通过交换随机选取的矩阵进行互认证,实现代理授权;最后,在随机预言机模型下的小整数解(SIS)困难问题假设下证明了该方案的安全性。相较于现有的代理签名方案,所提方案允许签名人来自不同层级且隶属于不同密钥生成中心(KGC)。性能评价实验结果表明,该方案的公钥尺寸是一个常数,代理签名和验证开销与层级无关,且代理密钥和签名尺寸非层级的线性量。因此,该方案可更好地满足大规模分布式异构网络对均衡负载的需求,是高效可行的。 展开更多
关键词 分层 无证书 代理签名 单点失效 拒绝采样 无陷门
在线阅读 下载PDF
无向双环网络的强彩虹连通性 被引量:1
18
作者 刘杰 陈宝兴 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2019年第6期873-877,共5页
设n,s 1,s 2是3个正整数,满足1≤s 1<s 2<n/2,gcd(n,s 1,s 2)=1.无向双环网络G(n;±s 1,±s 2)是如下定义的无向图(V(G),E(G)):其节点集V(G)={0,1,…,n-1},边集E(G)={i→i+s l(mod n),i→i-s l(mod n),i→i+s 2(mod n),i... 设n,s 1,s 2是3个正整数,满足1≤s 1<s 2<n/2,gcd(n,s 1,s 2)=1.无向双环网络G(n;±s 1,±s 2)是如下定义的无向图(V(G),E(G)):其节点集V(G)={0,1,…,n-1},边集E(G)={i→i+s l(mod n),i→i-s l(mod n),i→i+s 2(mod n),i→i-s 2(mod n)|i=0,1,…,n-1}.本文中通过对无向双环网络任意两点之间的最短路径进行刻画,进而给出了该网络强彩虹连通的一个着色方案,最后得到了该网络强彩虹连通数的一个上界,该上界主要由G(n;±s 1,±s 2)所对应的同余方程xs 1+ys 2≡0(mod n)的最小非负解和最小交叉解的4个参数表示. 展开更多
关键词 无向双环网络 最短路径 彩虹路 强彩虹连通数
在线阅读 下载PDF
基于多次学习和关联度的关联分类改进算法 被引量:1
19
作者 李家辉 周忠眉 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2019年第4期564-572,共9页
基于支持度置信度框架的关联分类算法在生成规则时难以提出大量高质量规则,而且在一些数据集尤其是不平衡数据集上,部分训练实例未被产生的关联规则所覆盖,导致算法的分类准确率不高.基于以上问题提出了改进的关联分类的算法(Improved A... 基于支持度置信度框架的关联分类算法在生成规则时难以提出大量高质量规则,而且在一些数据集尤其是不平衡数据集上,部分训练实例未被产生的关联规则所覆盖,导致算法的分类准确率不高.基于以上问题提出了改进的关联分类的算法(Improved Algorithm based on Multiple learning and Correlation degree,IAMC).首先,在提取规则时,IAMC对训练集进行多次关联分类学习,尽量多地提出高质量的规则.其次,在生成规则时采用综合考虑了置信度,补类支持度的新度量关联度,以提高生成的规则的质量.最后,在关联分类规则提取后,对利用已有规则无法判断类别的和未被已有规则覆盖的训练实例用决策树方法再次提取规则,并加入到规则集中.实验结果表明,IAMC算法能提出更多高质量的规则,在多个UCI数据集上具有较高的分类准确率。 展开更多
关键词 关联分类 多次学习 关联度 分类准确率
在线阅读 下载PDF
基于抗噪声邻域粗糙集的在线流特征选择算法 被引量:1
20
作者 曾艺祥 林耀进 +1 位作者 李育林 王晨曦 《小型微型计算机系统》 CSCD 北大核心 2023年第7期1494-1499,共6页
在开放动态环境当中,特征是动态生成的,特征在不同时间戳内流入特征空间称为流特征.然而,在一些基于传统的邻域粗糙集流特征选择算法中,噪声点会对特征的依赖度计算造成影响.基于此,本文提出了基于抗噪声邻域粗糙集的在线流特征选择算法... 在开放动态环境当中,特征是动态生成的,特征在不同时间戳内流入特征空间称为流特征.然而,在一些基于传统的邻域粗糙集流特征选择算法中,噪声点会对特征的依赖度计算造成影响.基于此,本文提出了基于抗噪声邻域粗糙集的在线流特征选择算法.首先,充分考虑噪声点的影响,定义一种抗噪声的邻域关系,并设计基于抗噪声邻域的依赖度计算公式.进一步,考虑到特征对不同类别所提供的信息不同,结合类别正域,提出了一种新的在线相关性分析方法和冗余分析方法.在8个数据集上的实验研究表明,所提算法得到的特征子集优于一些在线流特征选择算法. 展开更多
关键词 在线特征选择 流特征 邻域粗糙集 邻域关系
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部