期刊文献+
共找到27篇文章
< 1 2 >
每页显示 20 50 100
基于标签传播增强的多通道图卷积网络
1
作者 袁立宁 冯文刚 刘钊 《计算机科学》 CSCD 北大核心 2024年第8期304-312,共9页
多数图卷积网络(GCN)模型通过设计高效的信息传递和保留方式提升节点分类任务的实验表现,忽略了节点标签信息在拓扑空间和属性空间的传播。针对上述问题,提出了一种基于标签传播算法(LPA)增强的多通道图卷积模型MGCN-LPA,同时增大同类... 多数图卷积网络(GCN)模型通过设计高效的信息传递和保留方式提升节点分类任务的实验表现,忽略了节点标签信息在拓扑空间和属性空间的传播。针对上述问题,提出了一种基于标签传播算法(LPA)增强的多通道图卷积模型MGCN-LPA,同时增大同类节点在属性和拓扑空间的关系权重,改善节点间特征和标签信息的传播。首先,计算不同节点的属性相似度值,并采用k近邻算法生成属性关系图;然后,利用结合了GCN和LPA的图卷积层GCN-LPA提取属性图和属性关系图的潜在特征,生成拓扑节点表示和属性节点表示;最后,将拓扑和属性表示进行融合,并将生成的最终表示用于节点分类任务。在3个基准图数据集上进行实验,MGCN-LPA的实验表现能够匹配当前较为先进的基线模型,其在Cora和Citeseer数据集上的分类结果相比表现最优的基线模型提升了9.3%和12%。上述实验结果表明,MGCN-LPA能够增大同类节点间路径的权重,从而增强同类节点间的信息传递,提升节点分类任务的实验表现。此外,消融实验结果表明,与仅使用拓扑空间或者属性空间信息的变体相比,融合两类信息的MGCN-LPA能够充分提取和保留原始图中蕴含的潜在特征,提升模型的表征能力和泛化性。 展开更多
关键词 图卷积网络 标签传播算法 属性图 属性关系图 节点分类
在线阅读 下载PDF
基于属性组合的集成学习算法 被引量:5
2
作者 付忠良 赵向辉 +1 位作者 苗青 姚宇 《计算机应用》 CSCD 北大核心 2010年第2期465-468,475,共5页
针对样本由数字属性构成的分类问题,在AdaBoost算法流程基础上,改传统的基于单属性分类器构造方法为基于组合属性分类器构造方法,提出了一种基于样本属性线性组合的集成学习算法。对属性组合系数的构造,提出了一般性的构造思路,按照该思... 针对样本由数字属性构成的分类问题,在AdaBoost算法流程基础上,改传统的基于单属性分类器构造方法为基于组合属性分类器构造方法,提出了一种基于样本属性线性组合的集成学习算法。对属性组合系数的构造,提出了一般性的构造思路,按照该思路,提出了几种具体的组合系数构造方法,并对构造方法的科学合理性进行了分析。利用UC I机器学习数据集中的数据对提出的方法进行了实验与分析,结果表明,基于属性组合的集成学习算法不仅有是有效的,而且比传统AdaBoost算法好。 展开更多
关键词 ADABOOST算法 属性组合 集成学习 分类器组合
在线阅读 下载PDF
基于属性值信息熵的KNN改进算法 被引量:32
3
作者 童先群 周忠眉 《计算机工程与应用》 CSCD 北大核心 2010年第3期115-117,共3页
为了克服传统KNN算法,距离加权-KNN算法在距离定义及投票方式上的不足,提出了一种基于属性值对类别重要性的改进算法Entropy-KNN。首先定义两个样本间的距离为相同属性值的平均信息熵,此距离可通过重要属性值有效度量样本之间的相似程度... 为了克服传统KNN算法,距离加权-KNN算法在距离定义及投票方式上的不足,提出了一种基于属性值对类别重要性的改进算法Entropy-KNN。首先定义两个样本间的距离为相同属性值的平均信息熵,此距离可通过重要属性值有效度量样本之间的相似程度,其次算法Entropy-KNN根据上述定义的距离选取与待测试样本距离最小的K个近邻,最后根据各类近邻样本点的平均距离及个数判断待测试样本的类别。在蘑菇数据集上的实验表明,Entropy-KNN算法的分类准确率高于传统KNN算法和距离加权KNN算法。 展开更多
关键词 分类 KNN算法 属性值 信息熵
在线阅读 下载PDF
数据挖掘分类问题的贪婪粗糙集约简算法 被引量:7
4
作者 张祥德 张巍 刘玉蓉 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2001年第5期580-583,共4页
基于贪婪算法和粗糙集方法 ,给出了一种处理数据挖掘分类问题的属性约简算法 :贪婪粗糙集约简算法GRSR ;在测试中得出的约简集为原始集的 1/ 3 ,表明了它是一个有效的算法·其想法是 :从初始约简集为空集开始 ,选择使分类质量最大... 基于贪婪算法和粗糙集方法 ,给出了一种处理数据挖掘分类问题的属性约简算法 :贪婪粗糙集约简算法GRSR ;在测试中得出的约简集为原始集的 1/ 3 ,表明了它是一个有效的算法·其想法是 :从初始约简集为空集开始 ,选择使分类质量最大的属性 ,将它加入约简集 ;再从余下的属性中选择使分类质量最大的属性并加入约简集 ,重复直至找到满意的约简集· 展开更多
关键词 数据挖掘 分类 属性约简 粗糙集 贫婪算法 数据库 人工智能 GRSR 模糊数学 数据约简
在线阅读 下载PDF
基于熵权的K最临近算法改进 被引量:18
5
作者 王增民 王开珏 《计算机工程与应用》 CSCD 北大核心 2009年第30期129-131,160,共4页
维度灾难直接影响到K最临近算法(KNN)的效率和准确率,将信息论中的信息熵理论与KNN算法结合起来,用信息熵理论进行属性约简,并根据特征属性与分类的相关度来确定各属性的权限,从而建立相关度与权重的内在联系。仿真实验表明,与传统的KN... 维度灾难直接影响到K最临近算法(KNN)的效率和准确率,将信息论中的信息熵理论与KNN算法结合起来,用信息熵理论进行属性约简,并根据特征属性与分类的相关度来确定各属性的权限,从而建立相关度与权重的内在联系。仿真实验表明,与传统的KNN相比,基于熵权的KNN改进方法在保持分类效率的情况下,使分类器的准确率得到了极大的提高。 展开更多
关键词 K最邻近算法 熵权 属性约简 分类
在线阅读 下载PDF
基于决策者偏好投影寻踪模型的多属性决策法 被引量:9
6
作者 高立群 李丹 王珂 《系统仿真学报》 EI CAS CSCD 北大核心 2007年第24期5751-5755,共5页
针对现有主观赋权法和客观赋权法的不足,提出了一种新的综合赋权方法——基于决策者偏好及投影寻踪聚类模型的综合赋权法。该方法运用投影寻踪聚类模型,把多属性决策问题中的高维数据转化到低维子空间,同时用自适应粒子群优化算法来优... 针对现有主观赋权法和客观赋权法的不足,提出了一种新的综合赋权方法——基于决策者偏好及投影寻踪聚类模型的综合赋权法。该方法运用投影寻踪聚类模型,把多属性决策问题中的高维数据转化到低维子空间,同时用自适应粒子群优化算法来优化投影指标函数和模型参数,获得了决策属性体系最佳投影方向和投影值,揭示了高维数据的结构特征。同时,也考虑了决策者对不同属性的偏好,使对属性的赋权达到主观与客观的统一。最后通过一个仿真实例说明了该方法的可行性与有效性。 展开更多
关键词 多属性决策 综合赋权 投影寻踪聚类模型 粒子群优化算法
在线阅读 下载PDF
支持向量机分类算法中多元变量共线性问题的改进 被引量:10
7
作者 惠守博 王文杰 《计算机工程与设计》 CSCD 北大核心 2006年第8期1385-1388,共4页
结合核主成分分析的主因子提取和支持向量机的分类机理,提出了一种组合建模算法。应用核主成分分析过程作为预处理器,可以把共线性的多元变量糅合为几个主因子,但基本不损失有效信息。然后进行基于支持向量机的分类建模和预测。这样不... 结合核主成分分析的主因子提取和支持向量机的分类机理,提出了一种组合建模算法。应用核主成分分析过程作为预处理器,可以把共线性的多元变量糅合为几个主因子,但基本不损失有效信息。然后进行基于支持向量机的分类建模和预测。这样不仅可以防止共线性多元变量对模型的负面影响,还可以降低数据维数,减少支持向量机分类过程中的复杂度和运算量。最后用实验进行评估所得到的训练模型,实例说明了所提方法的有效性。 展开更多
关键词 核主成分分析 支持向量机算法 多元共线性 核函数 分类算法 机器学习
在线阅读 下载PDF
数据挖掘中改进的C4.5决策树分类算法 被引量:25
8
作者 王文霞 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2017年第5期1274-1277,共4页
针对传统C4.5决策树分类算法需要进行多次扫描,导致运行效率低的缺陷,提出一种新的改进C4.5决策树分类算法.通过优化信息增益推导算法中相关的对数运算,以减少决策树分类算法的运行时间;将传统算法中连续属性的简单分裂属性改进为最优... 针对传统C4.5决策树分类算法需要进行多次扫描,导致运行效率低的缺陷,提出一种新的改进C4.5决策树分类算法.通过优化信息增益推导算法中相关的对数运算,以减少决策树分类算法的运行时间;将传统算法中连续属性的简单分裂属性改进为最优划分点分裂处理,以提高算法效率.实验结果表明,改进的C4.5决策树分类算法相比传统的C4.5决策树分类算法极大提高了执行效率,减小了需求空间. 展开更多
关键词 数据挖掘 C4.5决策树 分类算法 判别能力度量 连续属性
在线阅读 下载PDF
一种可伸缩的空间决策树分类挖掘算法 被引量:1
9
作者 赵秦怡 王丽珍 顾应龙 《计算机工程》 EI CAS CSCD 北大核心 2005年第7期93-95,共3页
提出了一个伸缩性好的空间决策树分类算法,在分类时既考虑待分类对象的非空间属性,又考虑其空间邻接对象的属性对其分类的影响。该算法没有训练数据库需存储于内存的限制,对训练库也没有记录个数及属性个数的限制,能生成简练、精确的决... 提出了一个伸缩性好的空间决策树分类算法,在分类时既考虑待分类对象的非空间属性,又考虑其空间邻接对象的属性对其分类的影响。该算法没有训练数据库需存储于内存的限制,对训练库也没有记录个数及属性个数的限制,能生成简练、精确的决策树。 展开更多
关键词 空间分类挖掘 算法的可伸缩性 属性列表 决策树分类
在线阅读 下载PDF
天地一体化智能网络流量实时分类 被引量:2
10
作者 杨力 王龙青 +1 位作者 潘成胜 蔡睿妍 《小型微型计算机系统》 CSCD 北大核心 2022年第7期1547-1552,共6页
天地一体化智能网络规模大,环境复杂,网络中流量业务类型繁多且流量具有突发性.本文结合Spark大数据分布式平台,根据流量的特点设计了SFFS-FCBF-C4.5(简称SFC)决策树分类模型,实现了大规模网络下流量的实时分类,以保障网络中资源的合理... 天地一体化智能网络规模大,环境复杂,网络中流量业务类型繁多且流量具有突发性.本文结合Spark大数据分布式平台,根据流量的特点设计了SFFS-FCBF-C4.5(简称SFC)决策树分类模型,实现了大规模网络下流量的实时分类,以保障网络中资源的合理分配和利用.SFC算法是在C4.5决策树算法的基础上结合了改进后的快速相关滤波算法(Fast Correlation-Based Filter Solution,FCBF)和连续型属性值离散化算法,可以在有效去除冗余特征和降低模型复杂度的同时,提高模型分类的速度和准确率.仿真结果表明,SFC决策树分类模型相比传统的流量分类模型具有较好的稳定性和较高的准确率,可以很好的适应复杂多变的网络环境.同时,Spark大数据分布式平台的应用大幅度提高了大规模网络下流量分类的速度,能够对海量流量进行实时分类. 展开更多
关键词 天地一体化智能网络 FCBF 连续型属性值离散化算法 SPARK 流量实时分类
在线阅读 下载PDF
一种基于属性分割的产生式/判别式混合分类器 被引量:1
11
作者 石洪波 柳亚琴 《计算机应用研究》 CSCD 北大核心 2012年第5期1654-1658,共5页
为了利用产生式和判别式方法各自的优势,研究了基于属性分割的产生式/判别式混合分类模型框架,提出了一种基于属性分割的产生式/判别式混合分类器学习算法GDGA。其利用遗传算法,将属性集X划分为两个子集XG和XD,并相应地将训练集D垂直分... 为了利用产生式和判别式方法各自的优势,研究了基于属性分割的产生式/判别式混合分类模型框架,提出了一种基于属性分割的产生式/判别式混合分类器学习算法GDGA。其利用遗传算法,将属性集X划分为两个子集XG和XD,并相应地将训练集D垂直分割为两个子集DG和DD,在两个训练子集上分别学习产生式分类器和判别式分类器;最后将两个分类器合并形成一个混合分类器。实验结果表明,在大多数数据集上,混合分类器的分类正确率优于其成员分类器。在训练数据不足或数据属性分布不清楚的情况下,该混合分类器具有特别的优势。 展开更多
关键词 分类 产生式 判别式 属性分割 遗传算法
在线阅读 下载PDF
多类SVM在图像艺术属性分类中的应用研究 被引量:3
12
作者 陈小娥 陈昭炯 《智能系统学报》 2009年第2期157-162,共6页
针对当前图像分类研究中,依据图像艺术风格属性进行分类的算法尚不多见的情况,实现了一种基于艺术属性的图像自动分类系统,其中主要涉及摄影作品、国画、水彩画、素描、油画等几种典型艺术风格的图像.系统采用支持向量机(SVM)作为分类器... 针对当前图像分类研究中,依据图像艺术风格属性进行分类的算法尚不多见的情况,实现了一种基于艺术属性的图像自动分类系统,其中主要涉及摄影作品、国画、水彩画、素描、油画等几种典型艺术风格的图像.系统采用支持向量机(SVM)作为分类器,运用分等级的分类方法,提出了一种针对艺术属性图像分类的特定SVM二叉树多类分类算法;而后通过对各类图像艺术风格特征的分析,分别提取了有代表性的、区分度好且易于计算的特征;最后针对各级分类特性和分类器总体特性进行了实验分析,实验结果表明,系统具有良好的分类性能. 展开更多
关键词 支持向量机 二叉树多类分类算法 图像艺术属性
在线阅读 下载PDF
基于连续属性分类规则挖掘的新算法研究 被引量:1
13
作者 厍向阳 薛惠锋 《计算机工程》 EI CAS CSCD 北大核心 2005年第18期28-30,共3页
分析了针对连续属性样本进行数据挖掘的缺陷,提出一种直接对连续属性样本进行分类规则挖掘的算法。它基于样本属性值分割点对实例样本进行分类,把分割点对实例样本的分类能力作为分割点选择的依据,将所有相容样本划分为分类属性值相同... 分析了针对连续属性样本进行数据挖掘的缺陷,提出一种直接对连续属性样本进行分类规则挖掘的算法。它基于样本属性值分割点对实例样本进行分类,把分割点对实例样本的分类能力作为分割点选择的依据,将所有相容样本划分为分类属性值相同的子集作为停机条件,实现连续属性样本分类规则挖掘的完全自动化。它考虑到数据挖掘的目标和要求,充分利用属性与类间的依赖性、属性间的互补性,达到样本分割点数少、分类规则简单和属性约减的目的。最后通过实例进行了验证,并与C4.5算法进行了比较。 展开更多
关键词 连续属性 数据挖掘 分类规则 新算法
在线阅读 下载PDF
基于粗糙集理论和朴素贝叶斯分类算法的汽轮发电机振动故障诊断 被引量:1
14
作者 高俊山 郎平 孙真和 《热力发电》 CAS 北大核心 2010年第2期28-31,36,共5页
汽轮发电机组结构及振动的复杂性使其故障具有多层次性和随机性,以及故障信息不完整性等特点。对此,提出了一种基于粗糙集理论与朴素贝叶斯分类算法的汽轮发电机组振动故障诊断方法。通过粗糙集理论求取最小属性约简集,并在此基础上利... 汽轮发电机组结构及振动的复杂性使其故障具有多层次性和随机性,以及故障信息不完整性等特点。对此,提出了一种基于粗糙集理论与朴素贝叶斯分类算法的汽轮发电机组振动故障诊断方法。通过粗糙集理论求取最小属性约简集,并在此基础上利用朴素贝叶斯分类算法诊断出故障概率最大的区,最后针对具体的故障设定值对该方法进行验证。实际算例结果表明,该方法能在故障信息不完整甚至丢失核心属性的情况下得到较好的诊断结果,提高了系统诊断的容错性。 展开更多
关键词 汽轮发电机组 振动故障诊断 粗糙集理论 朴素贝叶斯分类算法 属性约简 故障概率
在线阅读 下载PDF
粗糙集数据的高精度分类算法研究 被引量:1
15
作者 杨艳丽 《现代电子技术》 北大核心 2018年第10期154-156,160,共4页
针对传统高精度分类算法在面对不定因子时,无法确定计算数据信噪度,造成计算精度不佳的问题,提出基于属性约简的粗糙集数据的高精度分类算法。通过对影响粗糙集数据分类精度的各影响因素进行详细分析,对粗糙集数据属性进行约简,抵消对... 针对传统高精度分类算法在面对不定因子时,无法确定计算数据信噪度,造成计算精度不佳的问题,提出基于属性约简的粗糙集数据的高精度分类算法。通过对影响粗糙集数据分类精度的各影响因素进行详细分析,对粗糙集数据属性进行约简,抵消对应不定因子以及信噪数据,提高粗糙集数据分类精度。实验结果表明,采用改进分类算法相比传统分类方法,其分类精度及抗噪性均有提高,且其记录结果数据致盲率较低,具有一定优势。 展开更多
关键词 粗糙集数据 高精度分类算法 属性约简 属性集 数据集 抗噪性
在线阅读 下载PDF
基于统计学法则的连续属性值划分方法
16
作者 高洪涛 陆伟 杨余旺 《科学技术与工程》 北大核心 2018年第16期237-240,共4页
目前决策树中很多分类算法例如ID3/C4.5/C5.0等都依赖于离散的属性值,并且希望将它们的值域划分到一个有限区间。利用统计学法则,提出一种新的连续属性值的划分方法;该方法通过统计学法则来发现精准的合并区间。另外在此基础上,为提高... 目前决策树中很多分类算法例如ID3/C4.5/C5.0等都依赖于离散的属性值,并且希望将它们的值域划分到一个有限区间。利用统计学法则,提出一种新的连续属性值的划分方法;该方法通过统计学法则来发现精准的合并区间。另外在此基础上,为提高决策树算法分类学习性能,提出一种启发式的划分算法来获得理想的划分结果.在UCI真实数据集上进行仿真实验.结果表明获得了一个比较高的分类学习精度、与常见的划分算法比较起来有很好的分类学习能力。 展开更多
关键词 连续属性值 学习精度 统计学法则 分类算法
在线阅读 下载PDF
基于遗传算法的数量属性离散化算法
17
作者 谢娟英 刘芳 《陕西师范大学学报(自然科学版)》 CAS CSCD 北大核心 2004年第2期28-30,共3页
提出了在没有任何领域知识可供借鉴的情况下,基于聚类思想,利用遗传算法对数量型属性进行离散化的新算法———遗传C均值算法.该算法利用遗传算法具有全局寻优的特性,对训练样本根据其每一属性值进行聚类,将样本划分为不同的类,从而为... 提出了在没有任何领域知识可供借鉴的情况下,基于聚类思想,利用遗传算法对数量型属性进行离散化的新算法———遗传C均值算法.该算法利用遗传算法具有全局寻优的特性,对训练样本根据其每一属性值进行聚类,将样本划分为不同的类,从而为每一属性找到其值的最佳分割点.然后,对不同类赋以不同的编码.该算法的优点是能得到最优的离散化结果.在VC++6.0环境下实现了该算法.仿真实验证明该方法有效解决了利用粗糙集理论进行分类规则挖掘时,数量型属性的离散化问题. 展开更多
关键词 遗传算法 数量属性 离散化算法 分类规则挖掘 粗糙集理论
在线阅读 下载PDF
重要度集成的属性约简方法研究 被引量:7
18
作者 李京政 杨习贝 +2 位作者 窦慧莉 王平心 陈向坚 《智能系统学报》 CSCD 北大核心 2018年第3期414-421,共8页
启发式算法在求解约简的过程中逐步加入重要度最高的属性,但其忽视了数据扰动将会直接引起重要度计算的波动问题,从而造成约简结果的不稳定。鉴于此,提出了一种基于集成属性重要度的启发式算法框架。首先,在原始数据上进行多重采样;然后... 启发式算法在求解约简的过程中逐步加入重要度最高的属性,但其忽视了数据扰动将会直接引起重要度计算的波动问题,从而造成约简结果的不稳定。鉴于此,提出了一种基于集成属性重要度的启发式算法框架。首先,在原始数据上进行多重采样;然后,在每次循环过程中分别计算各个采样结果上的属性重要度并对这些重要度进行集成;最后,将集成重要度最大的属性加入到约简中去。利用邻域粗糙集方法进行的实验结果表明,基于集成重要度的属性约简算法不仅能够获取更加稳定的约简,而且利用所生成的约简能够得到一致性较高的分类结果。 展开更多
关键词 属性约简 分类 聚类 数据扰动 集成 启发式算法 邻域粗糙集 稳定性
在线阅读 下载PDF
基于蝙蝠算法的贝叶斯分类器优化研究 被引量:2
19
作者 蒋礼青 张明新 +1 位作者 郑金龙 戴娇 《计算机应用与软件》 CSCD 2016年第9期259-263,共5页
朴素贝叶斯分类器是一种应用广泛且简单有效的分类算法,但其条件独立性的"朴素贝叶斯假设"与现实存在差异,这种假设限制朴素贝叶斯分类器分类的准确率。为削弱这种假设,利用改进的蝙蝠算法优化朴素贝叶斯分类器。改进的蝙蝠... 朴素贝叶斯分类器是一种应用广泛且简单有效的分类算法,但其条件独立性的"朴素贝叶斯假设"与现实存在差异,这种假设限制朴素贝叶斯分类器分类的准确率。为削弱这种假设,利用改进的蝙蝠算法优化朴素贝叶斯分类器。改进的蝙蝠算法引入禁忌搜索机制和随机扰动算子,避免其陷入局部最优解,加快收敛速度。改进的蝙蝠算法自动搜索每个属性的权值,通过给每个属性赋予不同的权值,在计算代价不大幅提高的情况下削弱了类独立性假设且增强了朴素贝叶斯分类器的准确率。实验结果表明,该算法与传统的朴素贝叶斯和文献[6]的新加权贝叶斯分类算法相比,其分类效果更加精准。 展开更多
关键词 分类 朴素贝叶斯 属性加权 蝙蝠算法
在线阅读 下载PDF
面向一致性样本的属性约简 被引量:7
20
作者 高媛 陈向坚 +1 位作者 王平心 杨习贝 《智能系统学报》 CSCD 北大核心 2019年第6期1170-1178,共9页
作为粗糙集理论的一个核心内容,属性约简致力于根据给定的约束条件删除数据中的冗余属性。基于贪心策略的启发式算法是求解约简的一种有效手段,这一手段通常使用数据中的全部样本来度量属性的重要度从而进一步得到约简子集。但实际上,... 作为粗糙集理论的一个核心内容,属性约简致力于根据给定的约束条件删除数据中的冗余属性。基于贪心策略的启发式算法是求解约简的一种有效手段,这一手段通常使用数据中的全部样本来度量属性的重要度从而进一步得到约简子集。但实际上,不同样本对于属性重要度计算的贡献是不同的,有些样本对重要度贡献不高甚至几乎没有贡献,且当数据中的样本数过大时,利用全部样本进行约简求解会使得时间消耗过大而难以接受。为了解决这一问题,提出了一种基于一致性样本的属性约简策略。具体算法大致由3个步骤组成,首先,将满足一致性原则的样本挑选出来;其次,将这些选中的样本组成新的决策系统;最后,利用启发式框架在新的决策系统中求解约简。实验结果表明:与基于聚类采样的属性约简算法相比,所提方法能够提供更高的分类精度。 展开更多
关键词 属性约简 分类精度 聚类 一致性样本 集成 启发式算法 邻域粗糙集 多准则
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部