期刊文献+
共找到23篇文章
< 1 2 >
每页显示 20 50 100
改进型加权KNN算法的不平衡数据集分类 被引量:26
1
作者 王超学 潘正茂 +2 位作者 马春森 董丽丽 张涛 《计算机工程》 CAS CSCD 2012年第20期160-163,168,共5页
K最邻近(KNN)算法对不平衡数据集进行分类时分类判决总会倾向于多数类。为此,提出一种加权KNN算法GAK-KNN。定义新的权重分配模型,综合考虑类间分布不平衡及类内分布不均匀的不良影响,采用基于遗传算法的K-means算法对训练样本集进行聚... K最邻近(KNN)算法对不平衡数据集进行分类时分类判决总会倾向于多数类。为此,提出一种加权KNN算法GAK-KNN。定义新的权重分配模型,综合考虑类间分布不平衡及类内分布不均匀的不良影响,采用基于遗传算法的K-means算法对训练样本集进行聚类,按照权重分配模型计算各训练样本的权重,通过改进的KNN算法对测试样本进行分类。基于UCI数据集的大量实验结果表明,GAK-KNN算法的识别率和整体性能都优于传统KNN算法及其他改进算法。 展开更多
关键词 不平衡数据集 分类 K最邻近算法 权重分配模型 遗传算法 K-MEANS算法
在线阅读 下载PDF
基于KNN的特征自适应加权自然图像分类研究 被引量:17
2
作者 侯玉婷 彭进业 +1 位作者 郝露微 王瑞 《计算机应用研究》 CSCD 北大核心 2014年第3期957-960,共4页
针对自然图像类型广泛、结构复杂、分类精度不高的实际问题,提出了一种为自然图像不同特征自动加权值的K-近邻(K-nearest neighbors,KNN)分类方法。通过分析自然图像的不同特征对于分类结果的影响,采用基因遗传算法求得一组最优分类权... 针对自然图像类型广泛、结构复杂、分类精度不高的实际问题,提出了一种为自然图像不同特征自动加权值的K-近邻(K-nearest neighbors,KNN)分类方法。通过分析自然图像的不同特征对于分类结果的影响,采用基因遗传算法求得一组最优分类权值向量解,利用该最优权值对自然图像纹理和颜色两个特征分别进行加权,最后用自适应加权K-近邻算法实现对自然图像的分类。实验结果表明,在用户给定分类精度需求和低时间复杂度的约束下,算法能快速、高精度地进行自然图像分类。提出的自适应加权K-近邻分类方法对于门类繁多的自然图像具有普遍适用性,可以有效地提高自然图像的分类性能。 展开更多
关键词 K-近邻算法 基因算法 自然图像分类 特征加权
在线阅读 下载PDF
基于k-最近邻图的小样本KNN分类算法 被引量:27
3
作者 刘应东 牛惠民 《计算机工程》 CAS CSCD 北大核心 2011年第9期198-200,共3页
提出一种基于k-最近邻图的小样本KNN分类算法。通过划分k-最近邻图,形成多个相似度较高的簇,根据簇内已有标记的数据对象来标识同簇中未标记的数据对象,同时剔除原样本集中的噪声数据,从而扩展样本集,利用该新样本集对类标号未知数据对... 提出一种基于k-最近邻图的小样本KNN分类算法。通过划分k-最近邻图,形成多个相似度较高的簇,根据簇内已有标记的数据对象来标识同簇中未标记的数据对象,同时剔除原样本集中的噪声数据,从而扩展样本集,利用该新样本集对类标号未知数据对象进行类别标识。采用标准数据集进行测试,结果表明该算法在小样本情况下能够提高KNN的分类精度,减小最近邻阈值k对分类效果的影响。 展开更多
关键词 knn算法 k-最近邻图 小样本 图划分 分类算法
在线阅读 下载PDF
基于CEEMD和优化KNN的离心泵故障诊断方法 被引量:17
4
作者 杨波 黄倩 +1 位作者 付强 朱荣生 《机电工程》 CAS 北大核心 2022年第11期1502-1509,共8页
卧式离心泵实际测量中背景噪声含量较大,故障特征常被淹没,导致机械故障诊断效果较差,为了实时、精准地获得其运行状态,或对其进行故障诊断,提出了一种基于互补集合经验模态分解(CEEMD)和优化最邻近(KNN)算法的卧式离心泵机械故障诊断... 卧式离心泵实际测量中背景噪声含量较大,故障特征常被淹没,导致机械故障诊断效果较差,为了实时、精准地获得其运行状态,或对其进行故障诊断,提出了一种基于互补集合经验模态分解(CEEMD)和优化最邻近(KNN)算法的卧式离心泵机械故障诊断方法。首先,采集了卧式离心泵机械故障加速度信号,使用CEEMD对信号进行了一次分解,得到了本征模函数(IMF),采用相关系数法得到了IMF相关系数,确定了相关分量与不相关分量;其次,通过改进小波阈值去噪方法对不相关分量进行处理,提取了重构信号可分析的时频故障特征;最后,搭建了离心泵实验台,采用上述故障诊断方法对离心泵机械故障进行了分类诊断。研究结果表明:经CEEMD降噪后,信号评价指标信噪比(SNR)为2.2571,比原来的去噪方法提升了0.4381;优化后KNN分类对于卧式离心泵的机械故障诊断准确率可达96.7%,能够有效识别离心泵故障,达到智能诊断的目的。 展开更多
关键词 叶片式泵 故障信号分解 互补集合经验模态分解 改进小波阈值降噪 优化最邻近算法分类 本征模函数 相关分量/不相关分量
在线阅读 下载PDF
离散型增强烟花算法和kNN在特征选择中的研究 被引量:4
5
作者 黄欣 莫海淼 +1 位作者 赵志刚 曾敏 《计算机工程与应用》 CSCD 北大核心 2020年第16期112-117,共6页
特征选择是从原始特征集中选取特征子集,并且降低特征维度和减少冗余信息,从而达到提高分类准确度的效果。为了达到此效果,提出了新的特征选择算法。该算法使用经过离散化处理之后的增强烟花算法来搜索特征子集,同时将特征子集和经过惩... 特征选择是从原始特征集中选取特征子集,并且降低特征维度和减少冗余信息,从而达到提高分类准确度的效果。为了达到此效果,提出了新的特征选择算法。该算法使用经过离散化处理之后的增强烟花算法来搜索特征子集,同时将特征子集和经过惩罚因子处理之后约束条件融入到目标函数中,然后将搜索到的特征子集的数据放到kNN分类器进行训练和预测,最后使用十折交叉验证来检验分类的准确性。使用UCI数据进行仿真实验,仿真结果表明:与引导型烟花算法、烟花算法、蝙蝠算法、乌鸦算法、自适应粒子群算法相比,所提算法的总体性能优于其他五种算法。 展开更多
关键词 离散型增强烟花算法 特征选择 降维 分类 k近邻(knn)
在线阅读 下载PDF
用于WEB文档分类的并行KNN算法 被引量:1
6
作者 周朴雄 《计算机工程与应用》 CSCD 北大核心 2008年第25期155-156,共2页
针对WEB文档分类中KNN算法计算复杂度高的缺点,不同于以往从减少训练样本集大小和采用快速算法角度来降低KNN算法的计算复杂度,从并行的角度出发,提出一种在Hyper-cube SIMD模型上的并行算法,其关键部分的时间计算复杂度从O(n2)降为O(lo... 针对WEB文档分类中KNN算法计算复杂度高的缺点,不同于以往从减少训练样本集大小和采用快速算法角度来降低KNN算法的计算复杂度,从并行的角度出发,提出一种在Hyper-cube SIMD模型上的并行算法,其关键部分的时间计算复杂度从O(n2)降为O(log(n)),该算法与传统的串行算法相比,能显著地提高分类速度。 展开更多
关键词 文档分类 K最近邻 并行策略
在线阅读 下载PDF
一种基于Canopy和粗糙集的CRS-KNN文本分类算法 被引量:9
7
作者 姚彬修 倪建成 +2 位作者 于苹苹 曹博 李淋淋 《计算机工程与应用》 CSCD 北大核心 2017年第11期172-177,共6页
针对KNN算法的分类效率随着训练集规模和特征维数的增加而逐渐降低的问题,提出了一种基于Canopy和粗糙集的CRS-KNN(Canopy Rough Set-KNN)文本分类算法。算法首先将待处理的文本数据通过Canopy进行聚类,然后对得到的每个类簇运用粗糙集... 针对KNN算法的分类效率随着训练集规模和特征维数的增加而逐渐降低的问题,提出了一种基于Canopy和粗糙集的CRS-KNN(Canopy Rough Set-KNN)文本分类算法。算法首先将待处理的文本数据通过Canopy进行聚类,然后对得到的每个类簇运用粗糙集理论进行上、下近似分割,对于分割得到的下近似区域无需再进行分类,而通过上、下近似作差所得的边界区域数据需要通过KNN算法确定其最终的类别。实验结果表明,该算法降低了KNN算法的数据计算规模,提高了分类效率。同时与传统的KNN算法和基于聚类改进的KNN文本分类算法相比,准确率、召回率和F_1值都得到了一定的提高。 展开更多
关键词 Canopy聚类 粗糙集 K-最近邻(knn)算法 文本分类
在线阅读 下载PDF
面向申威架构的KNN并行算法实现与优化 被引量:8
8
作者 王其涵 庞建民 +3 位作者 岳峰 祝迪 沈莉 肖谦 《计算机工程》 CAS CSCD 北大核心 2023年第5期286-294,共9页
K近邻(KNN)是人工智能中最常用的分类算法,其性能提升对于海量数据的整理分析、大数据分类等任务具有重要意义。目前新一代神威超级计算机正处于应用发展的初始阶段,结合新一代申威异构众核处理器的结构特性,充分利用庞大的计算资源实... K近邻(KNN)是人工智能中最常用的分类算法,其性能提升对于海量数据的整理分析、大数据分类等任务具有重要意义。目前新一代神威超级计算机正处于应用发展的初始阶段,结合新一代申威异构众核处理器的结构特性,充分利用庞大的计算资源实现高效的KNN算法是海量数据分析整理的现实需求。根据SW26010pro处理器的结构特性,采用主从加速编程模型实现一种基础版本的KNN并行算法,其将计算核心传输到从核上,实现了线程级并行。分析影响基础并行算法性能的关键因素并提出优化算法SWKNN,不同于基础并行KNN算法的任务划分方式,SWKNN采用任务重划分策略,以避免冗余计算开销。通过数据流水优化、从核间通信优化、二次负载均衡优化等步骤减少不必要的通信开销,从而有效缓解访存压力并进一步提升算法性能。实验结果表明,与串行KNN算法相比,面向申威架构的基础并行KNN算法在SW26010pro处理器的单核组上可以获得最高48倍的加速效果,在同等数据规模下,SWKNN算法较基础并行KNN算法又可以获得最高399倍的加速效果。 展开更多
关键词 异构众核处理器 K近邻算法 并行计算 算法优化 分类性能
在线阅读 下载PDF
基于粗糙KNN算法的文本分类方法 被引量:5
9
作者 王渊 刘业政 姜元春 《合肥工业大学学报(自然科学版)》 CAS CSCD 北大核心 2014年第12期1513-1517,共5页
在文本分类中,数据规模过大或文本分布不均匀对传统KNN算法的准确率和效率具有重要影响。为了解决该问题,文章提出一种基于粗糙KNN(k-nearest neighbor)算法的文本分类新方法。首先引入粗糙集中的上下近似概念定义各类文本的上下近似空... 在文本分类中,数据规模过大或文本分布不均匀对传统KNN算法的准确率和效率具有重要影响。为了解决该问题,文章提出一种基于粗糙KNN(k-nearest neighbor)算法的文本分类新方法。首先引入粗糙集中的上下近似概念定义各类文本的上下近似空间,将文本向量空间分为核心和混合2大区域;然后改进传统KNN算法的隶属度函数;再针对不同的文本区域,采取差异化的分类策略以提高分类的效率和准确率。实验表明,基于粗糙KNN算法的文本分类方法在提高分类准确率的同时,分类的效率也有很大提高。 展开更多
关键词 文本分类 粗糙集 knn算法 核心区域 混合区域
在线阅读 下载PDF
基于BP改进的KNN算法在北京密云土地覆盖分类中的应用 被引量:9
10
作者 王佃来 宿爱霞 刘文萍 《科学技术与工程》 北大核心 2020年第23期9464-9471,共8页
针对k近邻(k-nearest neighbor,KNN)算法在土地覆盖分类中存在将山体阴影覆盖下植被误分成水体的问题,提出改进的KNN算法。改进算法充分利用神经网络能有效区分山体阴影覆盖下植被和水体的特性,实现BP神经网络与KNN算法的融合,整体提高... 针对k近邻(k-nearest neighbor,KNN)算法在土地覆盖分类中存在将山体阴影覆盖下植被误分成水体的问题,提出改进的KNN算法。改进算法充分利用神经网络能有效区分山体阴影覆盖下植被和水体的特性,实现BP神经网络与KNN算法的融合,整体提高了北京市密云区土地覆盖分类精度。实验结果表明:相对于支持向量机(support vector machine,SVM)、随机森林、BP神经网络和KNN算法,改进算法分类精度最高,达到了95.20%,分类精度比未改进KNN算法提高了6.43%。改进算法的Kappa系数在对比算法中也是最高的,达到0.93。此外,实验结果也表明改进算法可应用于中分辨率遥感图像分类中。 展开更多
关键词 knn算法 土地覆盖分类 遥感图像 BP神经网络
在线阅读 下载PDF
基于BP神经网络决策的KNN改进算法 被引量:20
11
作者 路敦利 宁芊 臧军 《计算机应用》 CSCD 北大核心 2017年第A02期65-67,88,共4页
针对K近邻(KNN)算法中算法精度受K值选取影响较大的问题,提出了一种使用BP神经网络来优化KNN算法的改进算法来降低K值选取对算法精度的影响同时提高K近邻算法的准确率。所提改进算法主要是使用BP神经网络对K近邻算法分类完成后的结果进... 针对K近邻(KNN)算法中算法精度受K值选取影响较大的问题,提出了一种使用BP神经网络来优化KNN算法的改进算法来降低K值选取对算法精度的影响同时提高K近邻算法的准确率。所提改进算法主要是使用BP神经网络对K近邻算法分类完成后的结果进行改进优化。首先,通过对训练样本使用K值不同的K近邻算法进行初步分类,同一数据会得到多个不同的初步分类结果集;然后将初步分类结果集作为BP神经网络的输入,再对BP神经网络进行训练分类。在多个数据集上的实验表明,基于BP神经网络决策的K近邻改进算法降低了K值对算法精度的影响,同时极大地提高了分类的准确率。 展开更多
关键词 K近邻 BP神经网络 算法精度 分类算法 K值
在线阅读 下载PDF
结合属性值贡献度与平均相似度的KNN改进算法 被引量:1
12
作者 张玲珠 周忠眉 《计算机工程与应用》 CSCD 北大核心 2010年第18期130-131,共2页
与传统的K-近邻算法不同,提出了一种结合属性值贡献度与平均相似度的KNN改进算法。首先考虑测试样本与相似样本点间的平均相似度,其次考虑不同类别中的相似样本点的个数,最后还考虑与相似样本相同的属性值对类别的贡献度。在蘑菇数据集... 与传统的K-近邻算法不同,提出了一种结合属性值贡献度与平均相似度的KNN改进算法。首先考虑测试样本与相似样本点间的平均相似度,其次考虑不同类别中的相似样本点的个数,最后还考虑与相似样本相同的属性值对类别的贡献度。在蘑菇数据集上进行实验结果表明,改进后的KNN分类算法的准确率比传统的K-近邻分类算法的准确率更高。 展开更多
关键词 分类 K-近邻算法 相似度
在线阅读 下载PDF
基于电源线和位置指纹的室内定位技术 被引量:9
13
作者 何坚 万志江 刘金伟 《电子与信息学报》 EI CSCD 北大核心 2014年第12期2902-2908,共7页
该文提出将室内环境不可或缺的电源线作为天线,通过在电源线上注入宽带高频信号构造室内空间的位置指纹,进而实现室内空间精确定位。首先介绍了电源线上宽带高频信号注入模块的实现技术,以及室内空间位置指纹的构造方法;其次,介绍了基... 该文提出将室内环境不可或缺的电源线作为天线,通过在电源线上注入宽带高频信号构造室内空间的位置指纹,进而实现室内空间精确定位。首先介绍了电源线上宽带高频信号注入模块的实现技术,以及室内空间位置指纹的构造方法;其次,介绍了基于朴素贝叶斯分类算法的室内定位原理;最后,通过实验分析证明在多训练样本情况下,基于朴素贝叶斯分类算法的定位算法比基于K最邻近点(KNN)分类算法的定位算法有更好的定位准确率和时间迁移适应能力。 展开更多
关键词 室内定位 位置指纹 朴素贝叶斯分类算法 K最邻近点
在线阅读 下载PDF
基于改进K最近邻分类算法的不良网页并行识别 被引量:6
14
作者 徐雅斌 李卓 陈俊伊 《计算机应用》 CSCD 北大核心 2013年第12期3368-3371,3379,共5页
互联网中,黄色、暴力、赌博、反动等不良网页大量存在。如果不进行有效过滤,将给搜索服务带来不良的影响。采用改进的K最近邻分类算法来提高识别的准确率,并在虚拟化平台上通过开源的Hadoop软件所提供的MapReduce模型进行分布式并行处... 互联网中,黄色、暴力、赌博、反动等不良网页大量存在。如果不进行有效过滤,将给搜索服务带来不良的影响。采用改进的K最近邻分类算法来提高识别的准确率,并在虚拟化平台上通过开源的Hadoop软件所提供的MapReduce模型进行分布式并行处理。对比实验结果表明,所采用的识别方法的识别准确率和识别效率都有较大的提高。 展开更多
关键词 不良网页 文本分类 K最近邻分类算法 HADOOP MAPREDUCE
在线阅读 下载PDF
熵可视化方法在恶意代码分类中的应用 被引量:9
15
作者 任卓君 陈光 《计算机工程》 CAS CSCD 北大核心 2017年第9期167-171,共5页
恶意代码激增极大地威胁着信息系统安全。为提高辨识效率,加快应急响应速度,结合信息熵的定义,利用Jaccard度量和K最近邻分类算法,提出一种新的用于研究恶意代码分类的可视化方法。将二进制文件经局部熵计算转换成熵像素图,从视觉角度... 恶意代码激增极大地威胁着信息系统安全。为提高辨识效率,加快应急响应速度,结合信息熵的定义,利用Jaccard度量和K最近邻分类算法,提出一种新的用于研究恶意代码分类的可视化方法。将二进制文件经局部熵计算转换成熵像素图,从视觉角度直观呈现恶意代码内部特征,通过降维显示机制提高相似度比对和分类的效率。实验结果表明,该方法使用66个族的664个由卡巴斯基命名规则命名的样本进行评估,平均分类准确率为93.67%,能有效地分类恶意代码样本。 展开更多
关键词 恶意代码 可视化 谱系分类 信息熵 Jaccard指数 K最近邻分类算法
在线阅读 下载PDF
三种分类算法的实验比较 被引量:2
16
作者 蔡巍 王永成 +1 位作者 李伟 尹中航 《上海交通大学学报》 EI CAS CSCD 北大核心 2004年第4期510-512,共3页
对文本自动分类算中的k最近邻算法、向量空间模型算法以及混合分类算法进行了比较分析,在构造分类用知识库的主题抽取方法相同的条件下,使用中国资讯行提供的2000篇网上新闻语料分别对3种分类算法作了实验研究.实验结果表明,针对网上新... 对文本自动分类算中的k最近邻算法、向量空间模型算法以及混合分类算法进行了比较分析,在构造分类用知识库的主题抽取方法相同的条件下,使用中国资讯行提供的2000篇网上新闻语料分别对3种分类算法作了实验研究.实验结果表明,针对网上新闻而言,混合分类算法性能指标优于另外2种算法.结合实验语料环境,对3种分类算法的适用范围作了分析. 展开更多
关键词 分类算法 K最近邻算法 向量空间模型算法 混合算法
在线阅读 下载PDF
基于自适应烟花算法和k近邻算法的特征选择算法 被引量:6
17
作者 黄欣 莫海淼 赵志刚 《计算机应用与软件》 北大核心 2020年第5期268-274,共7页
特征选择是从原始特征集中选取若干个特征子集,并降低数据维度和减少冗余信息,从而达到提高分类准确度的效果。为了达到此效果,将自适应烟花算法进行离散化处理,使用k近邻算法作为分类器,并提出新的特征选择算法。将特征子集引入目标函... 特征选择是从原始特征集中选取若干个特征子集,并降低数据维度和减少冗余信息,从而达到提高分类准确度的效果。为了达到此效果,将自适应烟花算法进行离散化处理,使用k近邻算法作为分类器,并提出新的特征选择算法。将特征子集引入目标函数,并使用惩罚因子来处理约束条件,采用十折交叉验证法来检验分类效果。使用机器学习常用的UCI数据集进行仿真实验,结果表明:与增强烟花算法、烟花算法、蝙蝠算法、粒子群算法和自适应粒子群算法相比,该算法的性能更优。 展开更多
关键词 自适应烟花算法 特征选择 分类 K近邻算法 十折交叉验证
在线阅读 下载PDF
基于计算统一设备架构的高铁故障诊断方法 被引量:3
18
作者 陈志 李天瑞 +1 位作者 李明 杨燕 《计算机应用》 CSCD 北大核心 2015年第10期2819-2823,共5页
为解决传统高铁振动信号故障诊断方法速度慢、难以满足实时处理的要求,提出一种基于计算统一设备架构(CUDA)加速的高铁振动信号故障诊断方法。首先利用CUDA架构对高铁数据进行经验模态分解(EMD),进而计算分解所得到的各个分量的模糊熵,... 为解决传统高铁振动信号故障诊断方法速度慢、难以满足实时处理的要求,提出一种基于计算统一设备架构(CUDA)加速的高铁振动信号故障诊断方法。首先利用CUDA架构对高铁数据进行经验模态分解(EMD),进而计算分解所得到的各个分量的模糊熵,最后利用最近邻分类(KNN)算法对多个模糊熵特征组成的特征空间进行故障分类。实验结果表明,该方法能高效地对高铁振动信号进行故障分类,运行速度较传统方法有明显提高。 展开更多
关键词 故障诊断 计算统一设备架构 经验模态分解 模糊熵 最近邻分类算法
在线阅读 下载PDF
基于多特征融合的唐卡图像法器识别方法 被引量:4
19
作者 王铁君 王维兰 《计算机工程》 CAS CSCD 北大核心 2016年第3期198-203,207,共7页
唐卡图像具有内容丰富、画面复杂、色彩表现层次多等特点,但部分图像存在破损残缺、清晰度不高的不足。为此,提出一种融合Hu矩和局部二进制模式的图像特征提取方法,提高目标图像的特征表现程度,并在此基础上给出一种改进的基于距离密度... 唐卡图像具有内容丰富、画面复杂、色彩表现层次多等特点,但部分图像存在破损残缺、清晰度不高的不足。为此,提出一种融合Hu矩和局部二进制模式的图像特征提取方法,提高目标图像的特征表现程度,并在此基础上给出一种改进的基于距离密度的K最近邻分类算法,该算法待测样本所属的类别与其周围邻近点的类别最相关,且距离越近,相关度越高。实验结果表明,与传统的k NN、神经网络和神经网络集成方法相比,该方法对唐卡图像中的法器对象具有更高的识别正确率,能有效实现唐卡图像中法器对象的分类识别。 展开更多
关键词 唐卡图像 图像识别 k最近邻分类算法 神经网络 局部二值模式
在线阅读 下载PDF
基于隐含狄利克雷分配模型的图像分类算法 被引量:9
20
作者 杨赛 赵春霞 《计算机工程》 CAS CSCD 2012年第14期181-183,共3页
概率隐含语义分析模型不适用于大规模图像数据集,为此,提出一种基于隐含狄利克雷分配模型(LDA)的图像分类算法。以BOF特征作为图像内容的初始描述,利用Gibbs抽样算法近似估算LDA模型参数,得到图像的隐含主题分布特征,并采用k近邻算法对... 概率隐含语义分析模型不适用于大规模图像数据集,为此,提出一种基于隐含狄利克雷分配模型(LDA)的图像分类算法。以BOF特征作为图像内容的初始描述,利用Gibbs抽样算法近似估算LDA模型参数,得到图像的隐含主题分布特征,并采用k近邻算法对图像进行分类。实验结果表明,与基于概率隐含语义分析模型的分类算法相比,该算法的分类性能较优。 展开更多
关键词 BOF模型 中层语义特征 隐含狄利克雷分配模型 隐含主题分布特征 K近邻算法 图像分类
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部