期刊文献+
共找到15篇文章
< 1 >
每页显示 20 50 100
基于改进K最近邻分类算法的不良网页并行识别 被引量:6
1
作者 徐雅斌 李卓 陈俊伊 《计算机应用》 CSCD 北大核心 2013年第12期3368-3371,3379,共5页
互联网中,黄色、暴力、赌博、反动等不良网页大量存在。如果不进行有效过滤,将给搜索服务带来不良的影响。采用改进的K最近邻分类算法来提高识别的准确率,并在虚拟化平台上通过开源的Hadoop软件所提供的MapReduce模型进行分布式并行处... 互联网中,黄色、暴力、赌博、反动等不良网页大量存在。如果不进行有效过滤,将给搜索服务带来不良的影响。采用改进的K最近邻分类算法来提高识别的准确率,并在虚拟化平台上通过开源的Hadoop软件所提供的MapReduce模型进行分布式并行处理。对比实验结果表明,所采用的识别方法的识别准确率和识别效率都有较大的提高。 展开更多
关键词 不良网页 文本分类 K最近邻分类算法 HADOOP MAPREDUCE
在线阅读 下载PDF
面向非平衡混合数据的改进计数最近邻分类算法 被引量:2
2
作者 廖志芳 陈宇宙 +1 位作者 樊晓平 瞿志华 《计算机工程与应用》 CSCD 北大核心 2008年第12期139-141,共3页
非平衡混合数据是指数据集中类别不同的样本在数量上存在着较大的差别;同时样本数据集中的数据是非单一的数据类型,即它包含多种类型,如数值型和文本型数据。在对混合型数据的分类算法中,计数最近邻分类算法(CwkNN)可以有效地对混合型... 非平衡混合数据是指数据集中类别不同的样本在数量上存在着较大的差别;同时样本数据集中的数据是非单一的数据类型,即它包含多种类型,如数值型和文本型数据。在对混合型数据的分类算法中,计数最近邻分类算法(CwkNN)可以有效地对混合型数据进行分类,但该算法对数据的非平衡性处理效果不是太理想。在CwkNN的基础之上结合数据的非平衡性特点提出了基于全局密度和K-密度的分类算法来提高少数类样本的权重,从而提高数据的分类精确度。实验结果表明,全局密度分类算法和CwkNN算法的分类精度相当,K-局部密度分类算法在一定程度上提高了分类的精度。 展开更多
关键词 计数最近邻分类算法 非平衡数据 全局密度 K-密度
在线阅读 下载PDF
基于局部特征尺度分解和核最近邻凸包分类算法的滚动轴承故障诊断方法 被引量:6
3
作者 杨宇 曾鸣 程军圣 《振动工程学报》 EI CSCD 北大核心 2013年第1期118-126,共9页
提出了一种基于局部特征尺度分解(Local characteristic-scale decomposition,LCD)和核最近邻凸包(Kernelnearest neighbor convex hull,KNNCH)分类算法的滚动轴承故障诊断方法。采用LCD方法对滚动轴承原始振动信号进行分解得到若干内... 提出了一种基于局部特征尺度分解(Local characteristic-scale decomposition,LCD)和核最近邻凸包(Kernelnearest neighbor convex hull,KNNCH)分类算法的滚动轴承故障诊断方法。采用LCD方法对滚动轴承原始振动信号进行分解得到若干内禀尺度分量(Intrinsic scale component,ISC),然后将这些ISC分量组成初始特征向量矩阵,再对该矩阵进行奇异值分解,提取奇异值作为故障特征向量并输入到KNNCH分类器,根据其输出结果来判断滚动轴承的工作状态和故障类型。LCD方法是一种新的自适应时频分析方法,非常适用于非平稳信号的处理,而KNNCH算法是一种基于核函数方法,并将凸包估计与最近邻分类思想相融合的模式识别算法,可直接应用于多类问题且需优化的参数只有核参数。实验分析结果表明,所提出的方法能有效地提取滚动轴承故障特征信息,而且在小样本的情况下仍能准确地对滚动轴承的工作状态和故障类型进行分类。同时,与支持向量机(Support vec-tor machine,SVM)算法的对比分析结果表明,KNNCH算法的分类性能的稳定性要高于SVM算法。 展开更多
关键词 滚动轴承 故障诊断 局部特征尺度分解 最近凸包分类算法 奇异值分解
在线阅读 下载PDF
基于k-最近邻分类增强学习的除冰机器人抓线控制 被引量:8
4
作者 魏书宁 王耀南 +1 位作者 印峰 杨易旻 《控制理论与应用》 EI CAS CSCD 北大核心 2012年第4期470-476,共7页
输电线柔性结构特性给除冰机器人越障抓线控制带来极大困难.本文提出了一种结合k–最近邻(k-nearest neighbor,KNN)分类算法和增强学习算法的抓线控制方法.利用基于KNN算法的状态感知机制选择机器人当前状态k个最邻近状态并且对之加权.... 输电线柔性结构特性给除冰机器人越障抓线控制带来极大困难.本文提出了一种结合k–最近邻(k-nearest neighbor,KNN)分类算法和增强学习算法的抓线控制方法.利用基于KNN算法的状态感知机制选择机器人当前状态k个最邻近状态并且对之加权.根据加权结果决定当前最优动作.该方法可以得到机器人连续状态的离散表达形式,从而有效解决传统连续状态泛化方法带来的计算收敛性和维数灾难问题.借助增强学习算法探测和适应环境的能力,该方法能够克服机器人模型误差和姿态误差,以及环境干扰等因素对抓线控制的影响.文中给出了算法具体实现步骤,并给出了应用此方法控制除冰机器人抓线的仿真实验. 展开更多
关键词 除冰机器人 k–最近邻分类算法 增强学习 维数灾难
在线阅读 下载PDF
基于LCD和KNNCH分类算法的齿轮故障诊断方法 被引量:10
5
作者 曾鸣 杨宇 +1 位作者 郑近德 程军圣 《中国机械工程》 EI CAS CSCD 北大核心 2014年第15期2049-2054,共6页
提出了一种基于局部特征尺度分解(LCD)和核最近邻凸包(KNNCH)分类算法的齿轮故障诊断方法。该方法采用LCD对齿轮原始振动信号进行分解得到若干内禀尺度分量(ISC),然后提取包含主要信息的ISC分量的能量作为特征向量输入到KNNCH分类器,根... 提出了一种基于局部特征尺度分解(LCD)和核最近邻凸包(KNNCH)分类算法的齿轮故障诊断方法。该方法采用LCD对齿轮原始振动信号进行分解得到若干内禀尺度分量(ISC),然后提取包含主要信息的ISC分量的能量作为特征向量输入到KNNCH分类器,根据其输出结果来判断齿轮的工作状态。实验分析结果表明,所提出的方法能有效地提取齿轮故障特征信息,而且在小样本的情况下仍能准确地对齿轮的工作状态进行识别。同时,与支持向量机(SVM)算法的对比分析结果表明,KNNCH算法能取得与SVM算法相当或更高的正确识别率。 展开更多
关键词 局部特征尺度分解(LCD) 最近凸包(KNNCH)分类算法 能量 齿轮 故障诊断
在线阅读 下载PDF
新的CDF文本分类特征提取方法 被引量:11
6
作者 熊忠阳 蒋健 张玉芳 《计算机应用》 CSCD 北大核心 2009年第7期1755-1757,共3页
对高维的特征集进行降维是文本分类过程中的一个重要环节。在研究了现有的特征降维技术的基础上,对部分常用的特征提取方法做了简要的分析,之后结合类间集中度、类内分散度和类内平均频度,提出了一个新的特征提取方法,即CDF方法。实验采... 对高维的特征集进行降维是文本分类过程中的一个重要环节。在研究了现有的特征降维技术的基础上,对部分常用的特征提取方法做了简要的分析,之后结合类间集中度、类内分散度和类内平均频度,提出了一个新的特征提取方法,即CDF方法。实验采用K-最近邻分类算法(KNN)来考查CDF方法的有效性。结果表明该方法简单有效,能够取得比传统特征提取方法更优的降维效果。 展开更多
关键词 文本分类 降维 特征提取 K-最近邻分类算法 评价函数
在线阅读 下载PDF
新的文本分类特征选择方法研究 被引量:7
7
作者 张玉芳 王勇 +1 位作者 刘明 熊忠阳 《计算机工程与应用》 CSCD 2013年第5期132-135,共4页
特征降维是文本分类过程中的一个重要环节。在现有特征选择方法的基础上,综合考虑特征词在正类和负类中的分布性质,综合四种衡量特征类别区分能力的指标,提出了一个新的特征选择方法,即综合比率(CR)方法。实验采用K-最近邻分类算法(KNN... 特征降维是文本分类过程中的一个重要环节。在现有特征选择方法的基础上,综合考虑特征词在正类和负类中的分布性质,综合四种衡量特征类别区分能力的指标,提出了一个新的特征选择方法,即综合比率(CR)方法。实验采用K-最近邻分类算法(KNN)来考查CR方法的有效性,实验结果表明该方法能够取得比现有特征选择方法更优的降维效果。 展开更多
关键词 特征降维 文本分类 特征选择 综合比率 K-最近邻分类算法
在线阅读 下载PDF
局部文本特征选取算法的比较和改进研究 被引量:6
8
作者 李纲 夏晨曦 郑重 《情报学报》 CSSCI 北大核心 2008年第4期506-511,共6页
本文通过实验比较了互信息、X^2统计算法和优势率三种算法在用于局部文本特征选取时对文本分类性能的影响。实验结果显示,在应用于局部特征选择的情况下,文本特征选取算法仍然可以将特征空间的维度降低90%以上,而不降低文本分类的... 本文通过实验比较了互信息、X^2统计算法和优势率三种算法在用于局部文本特征选取时对文本分类性能的影响。实验结果显示,在应用于局部特征选择的情况下,文本特征选取算法仍然可以将特征空间的维度降低90%以上,而不降低文本分类的性能。同时,我们发现在应用于局部文本特征选取时,优势率算法的性能不如互信息和X^2统计算法。另外,对于K最近邻分类算法,随着足值的增大,文本分类的查准率在增加,而查全率在降低。最后,本文详细分析了造成这三种算法性能差异的原因,并提出了一种改进算法,来提高优势率算法应用于局部文本特征选取时的性能。 展开更多
关键词 文本分类 局部特征选择 互信息算法 x^2统计算法 优势率算法 K最近邻分类算法
在线阅读 下载PDF
熵可视化方法在恶意代码分类中的应用 被引量:9
9
作者 任卓君 陈光 《计算机工程》 CAS CSCD 北大核心 2017年第9期167-171,共5页
恶意代码激增极大地威胁着信息系统安全。为提高辨识效率,加快应急响应速度,结合信息熵的定义,利用Jaccard度量和K最近邻分类算法,提出一种新的用于研究恶意代码分类的可视化方法。将二进制文件经局部熵计算转换成熵像素图,从视觉角度... 恶意代码激增极大地威胁着信息系统安全。为提高辨识效率,加快应急响应速度,结合信息熵的定义,利用Jaccard度量和K最近邻分类算法,提出一种新的用于研究恶意代码分类的可视化方法。将二进制文件经局部熵计算转换成熵像素图,从视觉角度直观呈现恶意代码内部特征,通过降维显示机制提高相似度比对和分类的效率。实验结果表明,该方法使用66个族的664个由卡巴斯基命名规则命名的样本进行评估,平均分类准确率为93.67%,能有效地分类恶意代码样本。 展开更多
关键词 恶意代码 可视化 谱系分类 信息熵 Jaccard指数 K最近邻分类算法
在线阅读 下载PDF
基于剪枝加权k-NN算法的雷达电磁行为识别 被引量:1
10
作者 程远国 唐文杰 满欣 《海军工程大学学报》 CAS 北大核心 2020年第3期7-11,共5页
为了更好地实施电子干扰和欺骗,针对目标雷达电磁行为识别问题,提出了一种新的算法。首先,给出了雷达电磁行为的形式化表述,并在此基础上将各项属性参数进行预处理;然后,通过改进的k-最近邻分类算法(k-nearest-neighbor classifier,k-NN... 为了更好地实施电子干扰和欺骗,针对目标雷达电磁行为识别问题,提出了一种新的算法。首先,给出了雷达电磁行为的形式化表述,并在此基础上将各项属性参数进行预处理;然后,通过改进的k-最近邻分类算法(k-nearest-neighbor classifier,k-NN)对数据进行处理,从而对未知的雷达电磁行为进行识别。实验结果表明:改进的算法引入剪枝加权策略可加强其分类识别能力,在分类准确率和时间效率上较原算法有一定的改善,对于雷达电磁行为的识别是有效可行的。 展开更多
关键词 雷达电磁行为 k-最近邻分类算法 分类识别
在线阅读 下载PDF
基于计算统一设备架构的高铁故障诊断方法 被引量:3
11
作者 陈志 李天瑞 +1 位作者 李明 杨燕 《计算机应用》 CSCD 北大核心 2015年第10期2819-2823,共5页
为解决传统高铁振动信号故障诊断方法速度慢、难以满足实时处理的要求,提出一种基于计算统一设备架构(CUDA)加速的高铁振动信号故障诊断方法。首先利用CUDA架构对高铁数据进行经验模态分解(EMD),进而计算分解所得到的各个分量的模糊熵,... 为解决传统高铁振动信号故障诊断方法速度慢、难以满足实时处理的要求,提出一种基于计算统一设备架构(CUDA)加速的高铁振动信号故障诊断方法。首先利用CUDA架构对高铁数据进行经验模态分解(EMD),进而计算分解所得到的各个分量的模糊熵,最后利用最近邻分类(KNN)算法对多个模糊熵特征组成的特征空间进行故障分类。实验结果表明,该方法能高效地对高铁振动信号进行故障分类,运行速度较传统方法有明显提高。 展开更多
关键词 故障诊断 计算统一设备架构 经验模态分解 模糊熵 最近邻分类算法
在线阅读 下载PDF
基于Spark的输变电线路实时故障监测研究 被引量:4
12
作者 陈建峡 朱季骐 +3 位作者 张月 张晓星 吕俊涛 白德盟 《计算机工程与应用》 CSCD 北大核心 2018年第5期265-270,共6页
输变电线路状态监测数据是智能电网中数据量很大的一部分,不仅包括在线的状态监测数据,还包括设备的基本信息、实验数据、缺陷记录等,在数据处理的可靠性和实时性方面的要求都很高。根据实际应用中输变电线路的故障类型,设计并实现了输... 输变电线路状态监测数据是智能电网中数据量很大的一部分,不仅包括在线的状态监测数据,还包括设备的基本信息、实验数据、缺陷记录等,在数据处理的可靠性和实时性方面的要求都很高。根据实际应用中输变电线路的故障类型,设计并实现了输变电线路实时数据故障监测模型。其中,利用高效处理实时数据的Spark系统,研发出基于Spark的分布式ISODATA和模糊KNN大数据分析算法,与单机KNN算法相比,在时间性能上提高了70.75%效率,具有明显的计算效率优势。 展开更多
关键词 实时大数据 输变电线路 故障监测 分布式迭代自组织数据分析算法(ISODATA) 分布式模糊k最近邻分类算法(KNN)
在线阅读 下载PDF
基于多特征融合的唐卡图像法器识别方法 被引量:4
13
作者 王铁君 王维兰 《计算机工程》 CAS CSCD 北大核心 2016年第3期198-203,207,共7页
唐卡图像具有内容丰富、画面复杂、色彩表现层次多等特点,但部分图像存在破损残缺、清晰度不高的不足。为此,提出一种融合Hu矩和局部二进制模式的图像特征提取方法,提高目标图像的特征表现程度,并在此基础上给出一种改进的基于距离密度... 唐卡图像具有内容丰富、画面复杂、色彩表现层次多等特点,但部分图像存在破损残缺、清晰度不高的不足。为此,提出一种融合Hu矩和局部二进制模式的图像特征提取方法,提高目标图像的特征表现程度,并在此基础上给出一种改进的基于距离密度的K最近邻分类算法,该算法待测样本所属的类别与其周围邻近点的类别最相关,且距离越近,相关度越高。实验结果表明,与传统的k NN、神经网络和神经网络集成方法相比,该方法对唐卡图像中的法器对象具有更高的识别正确率,能有效实现唐卡图像中法器对象的分类识别。 展开更多
关键词 唐卡图像 图像识别 k最近邻分类算法 神经网络 局部二值模式
在线阅读 下载PDF
一种垃圾邮件快速识别方法 被引量:2
14
作者 李霞 蒋盛益 《小型微型计算机系统》 CSCD 北大核心 2013年第3期498-502,共5页
k最近邻分类算法原理简单且分类性能好,但因其时间复杂度高,不适用于实际领域在线垃圾邮件过滤.本文在建模阶段首先对训练邮件进行初始聚类,将训练邮件划分为半径大小几乎相同的初始簇,然后使用共享最近邻图聚类算法对包含邮件的初始簇... k最近邻分类算法原理简单且分类性能好,但因其时间复杂度高,不适用于实际领域在线垃圾邮件过滤.本文在建模阶段首先对训练邮件进行初始聚类,将训练邮件划分为半径大小几乎相同的初始簇,然后使用共享最近邻图聚类算法对包含邮件的初始簇进行再聚类,最终聚类簇被看成是可以增量更新的分类模型,最后使用经典k最近邻分类算法在该分类模型上对未知邮件进行分类.在公开语料Ling-Spam上的实验结果表明,本文提出的垃圾邮件识别算法不仅具有较高的垃圾邮件识别精度,而且还具有较低的时间复杂度. 展开更多
关键词 垃圾邮件过滤 K最近邻分类算法 共享最近图聚类算法
在线阅读 下载PDF
基于近红外高光谱成像技术的宁夏羊肉产地鉴别 被引量:22
15
作者 王靖 丁佳兴 +2 位作者 郭中华 何凤杰 梁晓燕 《食品工业科技》 CAS CSCD 北大核心 2018年第2期250-254,260,共6页
使用900~1700 nm高光谱成像系统采集宁夏银川、固原、盐池三个不同产地的绵羊后腿样本的近红外高光谱数据,对光谱采用面积归一化方法预处理,利用SPA、CARS、UVE算法对预处理后的光谱数据提取特征波长分别为17、40、121个;结合PLS-DA及KN... 使用900~1700 nm高光谱成像系统采集宁夏银川、固原、盐池三个不同产地的绵羊后腿样本的近红外高光谱数据,对光谱采用面积归一化方法预处理,利用SPA、CARS、UVE算法对预处理后的光谱数据提取特征波长分别为17、40、121个;结合PLS-DA及KNN建立特征波段下的判别模型。结果表明KNN判别模型效果较差,3种特征波长中利用CARS提取的特征波长建模效果最佳,代替全光谱建立PLS-DA判别模型是可行的;综合对比模型效果,CARS-PLS-DA为最优模型,校正集正确率90.48%,预测集正确率84.21%。证明利用近红外高光谱成像技术对羊肉产地鉴别是可行的。 展开更多
关键词 高光谱成像技术 羊肉 偏最小二乘判别分析 K最近邻分类算法 鉴别
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部