期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
基于改进K最近邻分类算法的不良网页并行识别 被引量:6
1
作者 徐雅斌 李卓 陈俊伊 《计算机应用》 CSCD 北大核心 2013年第12期3368-3371,3379,共5页
互联网中,黄色、暴力、赌博、反动等不良网页大量存在。如果不进行有效过滤,将给搜索服务带来不良的影响。采用改进的K最近邻分类算法来提高识别的准确率,并在虚拟化平台上通过开源的Hadoop软件所提供的MapReduce模型进行分布式并行处... 互联网中,黄色、暴力、赌博、反动等不良网页大量存在。如果不进行有效过滤,将给搜索服务带来不良的影响。采用改进的K最近邻分类算法来提高识别的准确率,并在虚拟化平台上通过开源的Hadoop软件所提供的MapReduce模型进行分布式并行处理。对比实验结果表明,所采用的识别方法的识别准确率和识别效率都有较大的提高。 展开更多
关键词 不良网页 文本分类 k最近邻分类算法 HADOOP MAPREDUCE
在线阅读 下载PDF
基于k-最近邻分类增强学习的除冰机器人抓线控制 被引量:8
2
作者 魏书宁 王耀南 +1 位作者 印峰 杨易旻 《控制理论与应用》 EI CAS CSCD 北大核心 2012年第4期470-476,共7页
输电线柔性结构特性给除冰机器人越障抓线控制带来极大困难.本文提出了一种结合k–最近邻(k-nearest neighbor,KNN)分类算法和增强学习算法的抓线控制方法.利用基于KNN算法的状态感知机制选择机器人当前状态k个最邻近状态并且对之加权.... 输电线柔性结构特性给除冰机器人越障抓线控制带来极大困难.本文提出了一种结合k–最近邻(k-nearest neighbor,KNN)分类算法和增强学习算法的抓线控制方法.利用基于KNN算法的状态感知机制选择机器人当前状态k个最邻近状态并且对之加权.根据加权结果决定当前最优动作.该方法可以得到机器人连续状态的离散表达形式,从而有效解决传统连续状态泛化方法带来的计算收敛性和维数灾难问题.借助增强学习算法探测和适应环境的能力,该方法能够克服机器人模型误差和姿态误差,以及环境干扰等因素对抓线控制的影响.文中给出了算法具体实现步骤,并给出了应用此方法控制除冰机器人抓线的仿真实验. 展开更多
关键词 除冰机器人 k最近分类算法 增强学习 维数灾难
在线阅读 下载PDF
局部文本特征选取算法的比较和改进研究 被引量:6
3
作者 李纲 夏晨曦 郑重 《情报学报》 CSSCI 北大核心 2008年第4期506-511,共6页
本文通过实验比较了互信息、X^2统计算法和优势率三种算法在用于局部文本特征选取时对文本分类性能的影响。实验结果显示,在应用于局部特征选择的情况下,文本特征选取算法仍然可以将特征空间的维度降低90%以上,而不降低文本分类的... 本文通过实验比较了互信息、X^2统计算法和优势率三种算法在用于局部文本特征选取时对文本分类性能的影响。实验结果显示,在应用于局部特征选择的情况下,文本特征选取算法仍然可以将特征空间的维度降低90%以上,而不降低文本分类的性能。同时,我们发现在应用于局部文本特征选取时,优势率算法的性能不如互信息和X^2统计算法。另外,对于K最近邻分类算法,随着足值的增大,文本分类的查准率在增加,而查全率在降低。最后,本文详细分析了造成这三种算法性能差异的原因,并提出了一种改进算法,来提高优势率算法应用于局部文本特征选取时的性能。 展开更多
关键词 文本分类 局部特征选择 互信息算法 x^2统计算法 优势率算法 k最近邻分类算法
在线阅读 下载PDF
熵可视化方法在恶意代码分类中的应用 被引量:9
4
作者 任卓君 陈光 《计算机工程》 CAS CSCD 北大核心 2017年第9期167-171,共5页
恶意代码激增极大地威胁着信息系统安全。为提高辨识效率,加快应急响应速度,结合信息熵的定义,利用Jaccard度量和K最近邻分类算法,提出一种新的用于研究恶意代码分类的可视化方法。将二进制文件经局部熵计算转换成熵像素图,从视觉角度... 恶意代码激增极大地威胁着信息系统安全。为提高辨识效率,加快应急响应速度,结合信息熵的定义,利用Jaccard度量和K最近邻分类算法,提出一种新的用于研究恶意代码分类的可视化方法。将二进制文件经局部熵计算转换成熵像素图,从视觉角度直观呈现恶意代码内部特征,通过降维显示机制提高相似度比对和分类的效率。实验结果表明,该方法使用66个族的664个由卡巴斯基命名规则命名的样本进行评估,平均分类准确率为93.67%,能有效地分类恶意代码样本。 展开更多
关键词 恶意代码 可视化 谱系分类 信息熵 Jaccard指数 k最近邻分类算法
在线阅读 下载PDF
基于Spark的输变电线路实时故障监测研究 被引量:4
5
作者 陈建峡 朱季骐 +3 位作者 张月 张晓星 吕俊涛 白德盟 《计算机工程与应用》 CSCD 北大核心 2018年第5期265-270,共6页
输变电线路状态监测数据是智能电网中数据量很大的一部分,不仅包括在线的状态监测数据,还包括设备的基本信息、实验数据、缺陷记录等,在数据处理的可靠性和实时性方面的要求都很高。根据实际应用中输变电线路的故障类型,设计并实现了输... 输变电线路状态监测数据是智能电网中数据量很大的一部分,不仅包括在线的状态监测数据,还包括设备的基本信息、实验数据、缺陷记录等,在数据处理的可靠性和实时性方面的要求都很高。根据实际应用中输变电线路的故障类型,设计并实现了输变电线路实时数据故障监测模型。其中,利用高效处理实时数据的Spark系统,研发出基于Spark的分布式ISODATA和模糊KNN大数据分析算法,与单机KNN算法相比,在时间性能上提高了70.75%效率,具有明显的计算效率优势。 展开更多
关键词 实时大数据 输变电线路 故障监测 分布式迭代自组织数据分析算法(ISODATA) 分布式模糊k最近邻分类算法(kNN)
在线阅读 下载PDF
基于多特征融合的唐卡图像法器识别方法 被引量:4
6
作者 王铁君 王维兰 《计算机工程》 CAS CSCD 北大核心 2016年第3期198-203,207,共7页
唐卡图像具有内容丰富、画面复杂、色彩表现层次多等特点,但部分图像存在破损残缺、清晰度不高的不足。为此,提出一种融合Hu矩和局部二进制模式的图像特征提取方法,提高目标图像的特征表现程度,并在此基础上给出一种改进的基于距离密度... 唐卡图像具有内容丰富、画面复杂、色彩表现层次多等特点,但部分图像存在破损残缺、清晰度不高的不足。为此,提出一种融合Hu矩和局部二进制模式的图像特征提取方法,提高目标图像的特征表现程度,并在此基础上给出一种改进的基于距离密度的K最近邻分类算法,该算法待测样本所属的类别与其周围邻近点的类别最相关,且距离越近,相关度越高。实验结果表明,与传统的k NN、神经网络和神经网络集成方法相比,该方法对唐卡图像中的法器对象具有更高的识别正确率,能有效实现唐卡图像中法器对象的分类识别。 展开更多
关键词 唐卡图像 图像识别 k最近邻分类算法 神经网络 局部二值模式
在线阅读 下载PDF
一种垃圾邮件快速识别方法 被引量:2
7
作者 李霞 蒋盛益 《小型微型计算机系统》 CSCD 北大核心 2013年第3期498-502,共5页
k最近邻分类算法原理简单且分类性能好,但因其时间复杂度高,不适用于实际领域在线垃圾邮件过滤.本文在建模阶段首先对训练邮件进行初始聚类,将训练邮件划分为半径大小几乎相同的初始簇,然后使用共享最近邻图聚类算法对包含邮件的初始簇... k最近邻分类算法原理简单且分类性能好,但因其时间复杂度高,不适用于实际领域在线垃圾邮件过滤.本文在建模阶段首先对训练邮件进行初始聚类,将训练邮件划分为半径大小几乎相同的初始簇,然后使用共享最近邻图聚类算法对包含邮件的初始簇进行再聚类,最终聚类簇被看成是可以增量更新的分类模型,最后使用经典k最近邻分类算法在该分类模型上对未知邮件进行分类.在公开语料Ling-Spam上的实验结果表明,本文提出的垃圾邮件识别算法不仅具有较高的垃圾邮件识别精度,而且还具有较低的时间复杂度. 展开更多
关键词 垃圾邮件过滤 k最近邻分类算法 共享最近图聚类算法
在线阅读 下载PDF
基于近红外高光谱成像技术的宁夏羊肉产地鉴别 被引量:22
8
作者 王靖 丁佳兴 +2 位作者 郭中华 何凤杰 梁晓燕 《食品工业科技》 CAS CSCD 北大核心 2018年第2期250-254,260,共6页
使用900~1700 nm高光谱成像系统采集宁夏银川、固原、盐池三个不同产地的绵羊后腿样本的近红外高光谱数据,对光谱采用面积归一化方法预处理,利用SPA、CARS、UVE算法对预处理后的光谱数据提取特征波长分别为17、40、121个;结合PLS-DA及KN... 使用900~1700 nm高光谱成像系统采集宁夏银川、固原、盐池三个不同产地的绵羊后腿样本的近红外高光谱数据,对光谱采用面积归一化方法预处理,利用SPA、CARS、UVE算法对预处理后的光谱数据提取特征波长分别为17、40、121个;结合PLS-DA及KNN建立特征波段下的判别模型。结果表明KNN判别模型效果较差,3种特征波长中利用CARS提取的特征波长建模效果最佳,代替全光谱建立PLS-DA判别模型是可行的;综合对比模型效果,CARS-PLS-DA为最优模型,校正集正确率90.48%,预测集正确率84.21%。证明利用近红外高光谱成像技术对羊肉产地鉴别是可行的。 展开更多
关键词 高光谱成像技术 羊肉 偏最小二乘判别分析 k最近邻分类算法 鉴别
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部