期刊文献+
共找到990篇文章
< 1 2 50 >
每页显示 20 50 100
基于KNN-SVM的混合气体检测方法研究 被引量:4
1
作者 孙超 胡润泽 +2 位作者 吴中旭 刘年松 丁建军 《光谱学与光谱分析》 SCIE EI CAS 北大核心 2025年第1期117-124,共8页
当今混合气体检测的研究中,针对多组分气体数据进行分类预测的数学算法百花齐放,如何快速且准确的检测出气体的成分和浓度逐渐成为当今研究的热门。然而在一些研究中,气体数据特征难以捕捉和判断,泛化能力不足,对气体数据进行分类预测... 当今混合气体检测的研究中,针对多组分气体数据进行分类预测的数学算法百花齐放,如何快速且准确的检测出气体的成分和浓度逐渐成为当今研究的热门。然而在一些研究中,气体数据特征难以捕捉和判断,泛化能力不足,对气体数据进行分类预测的精度和效率表现较差。为此,针对一些数据偏差和泛化误差无界的问题,提出了一种K最近邻-支持向量机(KNN-SVM)算法,对一些难以作出分类的模糊气体数据进行二次分类,采用KNN和SVM两种算法共同抉择,更加全面的捕捉数据特征,根据实验确定各自算法的权重比从而提高判别气体类别的准确率,两种算法的集成也能提高算法的效率,对于不同种类的气体也能有良好的适应性的稳定性。该实验气体组分由12 mg·L^(-1)的C_(2)H_(2)、NO_(2)、SF_(6),10 mg·L^(-1)的NO_(2)、SF_(6)和5 mg·L^(-1)的C_(2)H_(2)(背景气体皆为N_(2))以及两瓶纯N_(2)的气瓶组成;通过互相混合和与N_(2)配比制备出实验设定的气体浓度。实验过程通过单一气体的检测可分别对三种气体获得60组训练集,并通过这60组数据可进行线性拟合得到每种气体的拟合线,得到气体浓度与气体吸收峰值的关系,通过实验检测得到的三种气体拟合线,其中C_(2)H_(2)拟合线的调整后R^(2)为0.991,NO_(2)拟合线的调整后R^(2)为0.981,SF_(6)拟合线的调整后R^(2)为0.987,可得气体检测的准确性。再通过互相混合进行检测可分别获得40组训练集,采用KNN-SVM算法对混合气体进行分类和预测,后通过拟合线即可反演出混合气体中每种气体的浓度。将该算法与传统SVM算法进行各种分类指标对比均可显示出该算法的有效性和优越性。实验结果表明,KNN-SVM算法在气体分类预测方面表现出卓越的性能,准确率高达99.167%,AUC(area under curve)值达99.375%。这一算法不仅提高了气体检测的准确性,还增强了泛化能力可适应多样化的气体组分,为实时气体检测系统提供了有力支持。 展开更多
关键词 光声光谱 气体检测 knn-SVM 分类预测
在线阅读 下载PDF
基于并行架构网络与改进动态FD-KNN的风力发电机轴承故障预警
2
作者 许伯强 王彪 +1 位作者 孙丽玲 尹彦博 《太阳能学报》 北大核心 2025年第10期753-765,共13页
针对当前风力发电机轴承故障预警准确率和可靠性不足的问题,提出一种基于并行架构网络与改进动态k近邻故障检测(FD-KNN)的风力发电机轴承故障预警方法。首先,对风力发电机的数据采集与监控(SCADA)数据进行相关性分析,筛选出与风力发电... 针对当前风力发电机轴承故障预警准确率和可靠性不足的问题,提出一种基于并行架构网络与改进动态k近邻故障检测(FD-KNN)的风力发电机轴承故障预警方法。首先,对风力发电机的数据采集与监控(SCADA)数据进行相关性分析,筛选出与风力发电机轴承关键变量高度相关的变量,并采用集合模态经验分解(EEMD)分解关键变量,深入挖掘关键变量内不同时间尺度的特征以及关键变量与高相关协变量的潜在相互作用。然后,构建一个结合自注意力机制的长短期记忆网络(SelfAttention-LSTM)和改进Transformer模型的新型并行架构网络,用以精确可靠地预测关键变量的未来状态。基于预测结果,计算残差,并结合风力发电机轴承的实时状态对FD-KNN算法进行动态优化,包括调整近邻规模、设置动态告警阈值和预警条件,以实现更为精准可靠的故障预警。最后,通过实际SCADA数据验证,结果表明该方法可提前识别风力发电机轴承故障,且在准确性和可靠性方面均表现出色。 展开更多
关键词 风电机组 数据采集与监视控制 轴承 深度学习 故障预警 改进动态FD-knn算法 可靠性
在线阅读 下载PDF
基于KNN算法建立晒后皮肤状态评估模型 被引量:1
3
作者 李以洪 许梦然 +4 位作者 盘瑶 吴金昊 刘琦 常思思 赵华 《日用化学工业(中英文)》 北大核心 2025年第3期349-357,共9页
探索不同剂量紫外线照射后皮肤指标变化趋势,建立晒后皮肤状态评估模型。首先,筛选出变化有规律且具灵敏性的指标,优化黑化模型进一步扩大样本库,利用临床专家对晒后皮肤状态的分级作为学习标准,基于K邻近分类算法(KNN)对指标数据进行... 探索不同剂量紫外线照射后皮肤指标变化趋势,建立晒后皮肤状态评估模型。首先,筛选出变化有规律且具灵敏性的指标,优化黑化模型进一步扩大样本库,利用临床专家对晒后皮肤状态的分级作为学习标准,基于K邻近分类算法(KNN)对指标数据进行训练识别,建立晒后皮肤状态分级评估模型,经10折交叉验证后超参数K=3时,模型的mmce均值为0.015,预测精度acc均值为0.985,预测的准确度高达98.5%。结果表明,该模型能够将晒后皮肤状态的主观评级客观量化,高效率、高精度识别晒后皮肤状态。研究结果可为晒后皮肤状态评估和晒后修护功效评价体系提供技术支持。 展开更多
关键词 日晒 皮肤状态 黑化模型 knn算法
在线阅读 下载PDF
激光引信地面目标识别KNN算法
4
作者 何海军 田博 +4 位作者 胡鹏飞 李林豪 王伟 李铁 李岗 《探测与控制学报》 北大核心 2025年第4期134-140,共7页
瞄准新一代激光对地近炸引信对地面目标精确识别的急切需求,基于激光引信弹目交会回波进行KNN算法的地面目标识别探索研究。首先通过雷达方程建立激光近炸引信的弹目交会回波方程;其次对回波数据进行归一化处理并将数据集划分为训练数... 瞄准新一代激光对地近炸引信对地面目标精确识别的急切需求,基于激光引信弹目交会回波进行KNN算法的地面目标识别探索研究。首先通过雷达方程建立激光近炸引信的弹目交会回波方程;其次对回波数据进行归一化处理并将数据集划分为训练数据集和测试数据集;然后提取回波数据的强散射点个数和等效目标尺寸特征;最后将得到的特征子集进行KNN算法的目标识别训练和测试。实验结果表明,基于KNN算法的识别方法准确率高,平均识别精度为86.3%。该算法能够较好地实现坦克、雷达车及装甲车三种不同地面目标的精确识别。 展开更多
关键词 激光引信 回波 特征提取 knn算法 地面目标识别
在线阅读 下载PDF
基于SVM-KNN算法的高铁行车调度员认知负荷脑电评估方法 被引量:1
5
作者 张光远 王敬儒 +3 位作者 梁心怡 秦诗雨 李莎 朱泊霖 《中国安全生产科学技术》 北大核心 2025年第7期166-172,共7页
为准确评估高铁行车调度员认知负荷,根据脑电特征解析其动态变化,从而提升工作效率,保障列车运行安全。通过采集模拟调度任务下的脑电信号,采用最大相关最小冗余算法(mRMR)对Welch法提取后的脑电特征进行进一步降维,并基于SVM-KNN融合... 为准确评估高铁行车调度员认知负荷,根据脑电特征解析其动态变化,从而提升工作效率,保障列车运行安全。通过采集模拟调度任务下的脑电信号,采用最大相关最小冗余算法(mRMR)对Welch法提取后的脑电特征进行进一步降维,并基于SVM-KNN融合分类算法建立高铁行车调度员认知负荷分级识别模型。研究结果表明:该模型以较少的特征维度实现较高的识别准确率,总体准确率达87.03%。对比得出,使用mRMR方法进行降维处理能够有效提高分类模型的识别准确率,同时SVM-KNN融合分类算法的识别准确率要高于单分类算法。研究结果可为实现高铁行车调度员认知负荷监测预警提供理论基础。 展开更多
关键词 高速铁路行车调度员 认知负荷 脑电信号 最大相关最小冗余 支持向量机 K近邻
在线阅读 下载PDF
基于内容特征kNN回归的零样本口音转换模型
6
作者 罗宜鑫 陈宁 +1 位作者 薛宇航 肖阳阳 《华东理工大学学报(自然科学版)》 北大核心 2025年第4期497-504,共8页
口音转换(Accent Conversion,AC)旨在将源口音语音转换为目标口音语音,并保持源说话人音色和语音内容不变。现有的AC模型缺乏对训练数据分布以外的语音口音转换的泛化性。本文提出基于内容特征k-邻近(kNN)回归的零样本AC模型。一方面,采... 口音转换(Accent Conversion,AC)旨在将源口音语音转换为目标口音语音,并保持源说话人音色和语音内容不变。现有的AC模型缺乏对训练数据分布以外的语音口音转换的泛化性。本文提出基于内容特征k-邻近(kNN)回归的零样本AC模型。一方面,采用WavLM第23层提取源和目标口音语音的内容特征,并利用kNN回归将源口音语音内容特征置换为目标口音语音及其最邻近的内容特征以实现口音转换;另一方面,为了保持转换后语音中源说话人音色,构建多说话人声码器对含有目标口音的语音内容特征和源说话人音色特征进行融合,以合成目标口音语音。该模型无需源口音语音参与训练,即可实现多种源口音到目标口音的转换。实验结果表明,该模型取得了比并行或非并行AC模型更好的客观与主观评价结果。 展开更多
关键词 口音转换 knn回归 零样本学习 语音转换 声码器
在线阅读 下载PDF
基于KNN-BP神经网络车辆驻留时间预测立体车库RGV待命位策略
7
作者 后国栋 李建国 《科学技术与工程》 北大核心 2025年第24期10478-10486,共9页
平面移动式立体车库待命位策略可以提高车辆出库效率,减少顾客等待时间,通过预测库内车辆出库时间节点,设计分区待命位策略。针对反向传播(back propagation, BP)神经网络存在样本依赖性较强的特点,提出一种K-近邻算法(k-nearest neighb... 平面移动式立体车库待命位策略可以提高车辆出库效率,减少顾客等待时间,通过预测库内车辆出库时间节点,设计分区待命位策略。针对反向传播(back propagation, BP)神经网络存在样本依赖性较强的特点,提出一种K-近邻算法(k-nearest neighbor, KNN)-BP神经网络预测模型,以是否为工作日、工作日特殊时段(如早高峰、晚高峰),气温,降水4个方面作为特征向量,采用二进制集合转换构建各特征向量集,通过KNN对异常数据进行分组,提高BP神经网络预测精度,并基于预测时间建立出库概率分布,设定区域优先级参数以及RGV(rail guided vehicle)待命位策略。编写仿真程序,以西安小寨某商用立体车库运行数据进行验证,仿真结果表明:KNN-BP神经网络预测模型R^(2)较传统BP神经网络提高了20.23%,设计待命位策略下较无待命位策略顾客平均等待时间减小35.82%,RGV平均服务时间降低39.51%,RGV运行能耗降低38.32%;较文献引用策略顾客平均等待时间减小14.18%,RGV平均服务时间降低13.29%,RGV运行能耗降低20.89%。研究成果为提高立体车库车运行效率提供参考。 展开更多
关键词 交通工程 立体车库 待命位 K-近邻算法(knn)-反向传播(BP)神经网络 RGV
在线阅读 下载PDF
基于SE-ResNet18-KNN的隧道围岩分级方法
8
作者 景建军 《铁道建筑》 北大核心 2025年第10期166-172,共7页
针对传统围岩分级方法存在主观性强、力学特征描述不全面、地下水影响量化分析不足等问题,以西渝高速铁路(西安—重庆)华蓥山隧道为背景,提出了基于SE-ResNet18-KNN的围岩分级方法。采集隧道掌子面图像建立数据库,在ResNet18网络中嵌入S... 针对传统围岩分级方法存在主观性强、力学特征描述不全面、地下水影响量化分析不足等问题,以西渝高速铁路(西安—重庆)华蓥山隧道为背景,提出了基于SE-ResNet18-KNN的围岩分级方法。采集隧道掌子面图像建立数据库,在ResNet18网络中嵌入SE注意力机制实现围岩节理裂隙和地下水特征识别,结合图像处理提取节理参数,最终通过KNN算法实现围岩等级判定。结果表明:引入SE注意力机制使模型准确率从87.6%提升至92.4%;模型对节理裂隙和地下水特征的识别准确率分别为92.4%、90.7%,有效实现了围岩地质特征识别;对比20组现场BQ分级数据,基于KNN算法的围岩分级结果与现场Ⅲ~Ⅴ级围岩划分具有较高一致性。本文方法实现了地质特征自动识别与参数量化相结合的精准分级,可为围岩分级提供参考。 展开更多
关键词 围岩分级 铁路隧道 深度学习 图像处理 knn分级算法
在线阅读 下载PDF
一种序列的加权kNN分类方法 被引量:15
9
作者 朱明旱 罗大庸 易励群 《电子学报》 EI CAS CSCD 北大核心 2009年第11期2584-2588,共5页
针对加权kNN(k-Nearest Neighbor)方法在对样本进行分类时,仅仅只利用了它的k近邻点来进行分类决策的不足,提出了一种序列的加权kNN分类方法.该方法在对某个测试样本进行分类时,除了利用它k近邻点所提供的类别信息外,还有效地利用了前... 针对加权kNN(k-Nearest Neighbor)方法在对样本进行分类时,仅仅只利用了它的k近邻点来进行分类决策的不足,提出了一种序列的加权kNN分类方法.该方法在对某个测试样本进行分类时,除了利用它k近邻点所提供的类别信息外,还有效地利用了前面已分类样本的类别信息,这使得测试样本的分类决策更加合理和有效.在Cohn-Kanade人脸库上进行的表情识别实验表明,在序列样本分类的场合,该方法的分类效果比加权kNN方法更好. 展开更多
关键词 加权knn 流形 贝叶斯规则 序列的加权knn
在线阅读 下载PDF
弛豫铁电陶瓷KNN-CZ的制备及储能性能研究
10
作者 庞国旺 张盼 +7 位作者 尹伟 杨亚宏 马亚斌 杨菲宇 马钧亮 王平 秦彦军 李萍 《人工晶体学报》 北大核心 2025年第1期139-145,共7页
利用无铅介电材料进行机械能收集和能量储存是环境友好型储能设备的必然选择。本文采用固相反应法制备了(1-x)[(K_(0.5)Na_(0.5))(Nb_(0.9)Sr_(0.05)Ta_(0.08))O_(3)]-x(CaZrO_(3))(KNN-CZ,x=0,0.05,0.07,0.09)陶瓷,并对其相结构、微观... 利用无铅介电材料进行机械能收集和能量储存是环境友好型储能设备的必然选择。本文采用固相反应法制备了(1-x)[(K_(0.5)Na_(0.5))(Nb_(0.9)Sr_(0.05)Ta_(0.08))O_(3)]-x(CaZrO_(3))(KNN-CZ,x=0,0.05,0.07,0.09)陶瓷,并对其相结构、微观形貌、介电及储能性能等进行了系统的研究。结果表明,KNN-CZ陶瓷表现出良好的弛豫性,且P-E电滞回线均较为“细瘦”,这是由于掺杂破坏了体系的长程有序性。其中,0.93KNN-0.07CZ的储能性能最优,有效储能密度为1.98 J/cm^(3),这是因为x=0.07时材料的储能效率(83.19%)和击穿场强较高(250 kV/cm)。本文研究结果提供了一种环保的、有前途的陶瓷电容器材料。 展开更多
关键词 弛豫铁电体 无铅弛豫铁电陶瓷 knn-CZ 储能性能 介电性能
在线阅读 下载PDF
KNN认知诊断法及其应用 被引量:5
11
作者 康春花 张淑君 +1 位作者 李元白 曾平飞 《江西师范大学学报(自然科学版)》 CAS 北大核心 2019年第2期135-141,159,共8页
将机器学习中的KNN算法迁移至认知诊断评估中,提出了KNN认知诊断法,并通过模拟和实证研究考察了KNN认知诊断法的效果和特征.结果表明:KNN认知诊断法具有较高的判准率,与PNN和MDD-R诊断法不相上下,甚至在某些情境下更高;KNN认知诊断法不... 将机器学习中的KNN算法迁移至认知诊断评估中,提出了KNN认知诊断法,并通过模拟和实证研究考察了KNN认知诊断法的效果和特征.结果表明:KNN认知诊断法具有较高的判准率,与PNN和MDD-R诊断法不相上下,甚至在某些情境下更高;KNN认知诊断法不受样本容量和被试知识状态分布形态的影响,体现了KNN算法作为非参数方法的特征;KNN认知诊断法具有较好的实证信效度. 展开更多
关键词 knn算法 knn认知诊断法 实证信效度
在线阅读 下载PDF
基于P2P结构的kNN查询框架 被引量:3
12
作者 宋晓宇 王睿 孙焕良 《沈阳建筑大学学报(自然科学版)》 CAS 2007年第6期1040-1043,共4页
目的提出一种基于P2P结构的移动对象kNN查询框架.方法假设移动对象具有计算处理能力和储存空间,在此基础上进行P2P结构的设计.查询的发起、响应以及计算等不借助中心服务器,而将其转移到移动对象上进行处理.采用距离-响应时间计算算法和... 目的提出一种基于P2P结构的移动对象kNN查询框架.方法假设移动对象具有计算处理能力和储存空间,在此基础上进行P2P结构的设计.查询的发起、响应以及计算等不借助中心服务器,而将其转移到移动对象上进行处理.采用距离-响应时间计算算法和kNN查询分段排序算法来进行移动对象kNN查询.结果距离-响应时间计算算法和kNN查询分段排序算法能较好利用框架中各个移动对象响应查询时存在间隔这一特征进行简化计算,提高了框架的工作效率,增强了查询实时性.在更新的过程中通过使用安全时间的概念来减少盲目的对象更新,减少了数据冗余.结论在模拟实验中,框架能充分发挥P2P结构的优点进行移动对象kNN查询,查询响应迅速,查询结果具有较好实时性. 展开更多
关键词 P2P 移动对象knn查询 距离-响应时间计算算法 knn查询分段排序算法
在线阅读 下载PDF
基于改进KNN算法的潜山复杂岩性测井识别方法 被引量:22
13
作者 孙岿 《特种油气藏》 CAS CSCD 北大核心 2022年第3期18-27,共10页
兴隆台中生界砾岩油气藏是辽河坳陷近年发现的大型整装构造-岩性油藏,探明程度低,勘探潜力大。油藏受岩相与构造的共同控制,储层非均质性极强,岩性类型复杂多样,导致测井识别难度较大,严重制约了该区的勘探进程。为此,依据岩心观察、岩... 兴隆台中生界砾岩油气藏是辽河坳陷近年发现的大型整装构造-岩性油藏,探明程度低,勘探潜力大。油藏受岩相与构造的共同控制,储层非均质性极强,岩性类型复杂多样,导致测井识别难度较大,严重制约了该区的勘探进程。为此,依据岩心观察、岩屑录井及薄片鉴定结果,按照储层分类评价需求及测井可识别原则,重新将研究区岩性划分为碎屑岩和火山岩两大类,具体包括花岗质砾岩、混合砾岩、砂岩、泥岩、玄武岩、凝灰岩等6种岩石类型。通过分析不同类型岩石的测井响应特征,建立岩性交会图版,确定敏感测井参数。在此基础上,针对测井数据特点,对K最邻近值(KNN)算法进行改进,提出了基于测井属性加权的剪切邻近(MKNN)机器学习算法,并用于岩性预测。结果表明:相比传统的K最邻近值(KNN)算法,MKNN算法效率更高,解决了KNN算法受岩性样本类型不均衡及测井参数重叠的影响,岩性识别准确率由82.3%提高至88.7%,有效地解决了勘探老区岩性精细评价问题。该研究对提高复杂岩性油藏的测井评价精度具有一定的借鉴意义。 展开更多
关键词 Mknn算法 knn算法 测井响应 岩性识别 机器学习 中生界 辽河坳陷
在线阅读 下载PDF
基于基尼的模糊kNN分类器(英文)
14
作者 尚文倩 瞿有利 +3 位作者 黄厚宽 朱海滨 林永民 董红斌 《广西师范大学学报(自然科学版)》 CAS 北大核心 2006年第4期87-90,共4页
随着网络的发展,大量的文档涌现在网上,自动文本分类成为处理海量数据的关键技术。在众多的文本分类算法中,kNN算法被证明是最好的文本分类算法之一。对于大多数文本分类来说,文本预处理是文本分类的瓶颈,文本预处理的好坏直接影响着分... 随着网络的发展,大量的文档涌现在网上,自动文本分类成为处理海量数据的关键技术。在众多的文本分类算法中,kNN算法被证明是最好的文本分类算法之一。对于大多数文本分类来说,文本预处理是文本分类的瓶颈,文本预处理的好坏直接影响着分类的性能。在此介绍了一种新的文本预处理算法——基于基尼的文本预处理算法。同时采用模糊集理论改进kNN的决策规则。这两者的结合使得模糊kNN比传统的kNN表现出更好的分类性能。实验结果证明这种改进是有效的,可行的。 展开更多
关键词 文本分类 knn 模糊knn 文本预处理 GINI INDEX
在线阅读 下载PDF
高维主存kNN连接索引结构的核心算法
15
作者 刘艳 郝忠孝 《计算机科学》 CSCD 北大核心 2011年第9期146-149,共4页
kNN(k最近邻)连接是高维数据库中的一种重要但代价昂贵的基本操作。随着RAM容量越来越大且价格逐渐低廉,更多的数据集能够被装入主存。如何实现快速主存kNN连接,引起人们的关注。索引Δ-tree-R和-Δtree-S是根据kNN连接的特点专门为主存... kNN(k最近邻)连接是高维数据库中的一种重要但代价昂贵的基本操作。随着RAM容量越来越大且价格逐渐低廉,更多的数据集能够被装入主存。如何实现快速主存kNN连接,引起人们的关注。索引Δ-tree-R和-Δtree-S是根据kNN连接的特点专门为主存kNN连接设计的索引。结合编码、节点中心重合技术,给出了构建Δ-tree-R和-Δtree-S的核心算法及相关证明,实验表明,基于该索引的主存kNN连接算法-Δtree-KNN-Join明显优于目前已存在的可用于主存的kNN连接算法Gorder。 展开更多
关键词 knn连接 高维空间 主存 索引结构 knn搜索
在线阅读 下载PDF
基于样本重要性原理的KNN文本分类算法 被引量:6
16
作者 万韩永 左家莉 +1 位作者 万剑怡 王明文 《江西师范大学学报(自然科学版)》 CAS 北大核心 2015年第3期297-303,314,共8页
KNN是重要数据挖掘算法之一,具有良好的文本分类性能.传统的KNN方法对所有样本权重看作相同,而忽略了不同样本对于分类贡献的不同.为了解决该个问题,提出了一种样本重要性原理,并在此基础上构造KNN分类器.应用随机游走算法识别类边界点... KNN是重要数据挖掘算法之一,具有良好的文本分类性能.传统的KNN方法对所有样本权重看作相同,而忽略了不同样本对于分类贡献的不同.为了解决该个问题,提出了一种样本重要性原理,并在此基础上构造KNN分类器.应用随机游走算法识别类边界点,并计算出每个样本点的边界值,生成每个样本点的重要性得分,将样本重要性与KNN方法融合形成一种新的分类模型——SI-KNN.在中英文文本语料上的实验表明:改进的SI-KNN分类模型相比于传统的KNN方法有一定的提高. 展开更多
关键词 文本分类 knn 样本重要性原理 SI-knn
在线阅读 下载PDF
KNN数据挖掘算法在北京地区霾等级预报中的应用 被引量:55
17
作者 熊亚军 廖晓农 +6 位作者 李梓铭 张小玲 孙兆彬 赵秀娟 赵普生 马小会 蒲维维 《气象》 CSCD 北大核心 2015年第1期98-104,共7页
利用北京地区2013年气象数据以及PM_(2.5)浓度数据与能见度数据进行对比分析,结果发现气温、气压、相对湿度、露点温度、地面U风、地面V风以及PM_(2.5)小时浓度这7个要素是影响北京地区霾等级的关键因素。利用气温、地面气压、相对湿度... 利用北京地区2013年气象数据以及PM_(2.5)浓度数据与能见度数据进行对比分析,结果发现气温、气压、相对湿度、露点温度、地面U风、地面V风以及PM_(2.5)小时浓度这7个要素是影响北京地区霾等级的关键因素。利用气温、地面气压、相对湿度、露点温度、U风、V风分量以及PM_(2.5)浓度作为7个属性特征,以霾等级做为标志量构建训练样本集,结合KNN(KNearest Neighbor)数据挖掘算法构建疆等级预报分类器,并开展霾等级客观识别实验。结果表明K=3时该分类器的分类预报效果最佳,其13个站点的分类准确率高达88.2%。基于该算法构建的KNN模型预报无霾时的漏报概率很小,准确率高达91.8%;预报有轻度霾、中度霾以及重度霾时,空报的概率仅分别为4.7%、1.4%和2.6%。2014年8月29日至9月2日北京地区一次霾天气过程的预报结果表明:南郊观象台、密云和延庆3站的预报准确率分别达到74%、64%和84%,但霾等级的精度方面还有待于进一步提高。 展开更多
关键词 数据挖掘 knn 预报
在线阅读 下载PDF
应用特征聚合进行中文文本分类的改进KNN算法 被引量:59
18
作者 张晓辉 李莹 +1 位作者 王华勇 赵宏 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2003年第3期229-232,共4页
针对以KNN为代表的VSM模型存在的向量各特征项孤立处理问题 ,提出了一种应用特征聚合方式的改进算法·该算法通过CHI概率统计计算文本特征词对分类的贡献 ,将对分类有相同贡献的文本特征词聚合 ,使用它们共同的分类贡献模式代替传... 针对以KNN为代表的VSM模型存在的向量各特征项孤立处理问题 ,提出了一种应用特征聚合方式的改进算法·该算法通过CHI概率统计计算文本特征词对分类的贡献 ,将对分类有相同贡献的文本特征词聚合 ,使用它们共同的分类贡献模式代替传统算法中单个词对应向量一维的方式·该算法提高了稀有词对分类的贡献、强化了关联词的分类效果、并降低了文本向量的维数·与传统KNN算法进行的对比实验证明 。 展开更多
关键词 改进knn算法 中文文本分类 分类贡献模式 特征聚合
在线阅读 下载PDF
使用KNN算法的文本分类 被引量:101
19
作者 张宁 贾自艳 史忠植 《计算机工程》 EI CAS CSCD 北大核心 2005年第8期171-172,185,共3页
介绍了数据挖掘的一个分枝——文本自动分类的相关技术,在对数据进行预处理的基础上,实现了K最近邻居分类算法,并结合实验结果对数据预处理在文本分类中的重要性进行了讨论。
关键词 数据挖掘 文本分类 knn算法 向量空间模型
在线阅读 下载PDF
基于聚类改进的KNN文本分类算法 被引量:69
20
作者 周庆平 谭长庚 +1 位作者 王宏君 湛淼湘 《计算机应用研究》 CSCD 北大核心 2016年第11期3374-3377,3382,共5页
传统的KNN文本分类算法是一种无监督的、无参数的、简单的、较流行的且容易实现的分类算法。但是KNN算法在处理文本分类的过程中需要不断地计算待测文本与样本的相似度,当文本数量更大时,算法的效率就会更差。为了提高传统KNN算法在文... 传统的KNN文本分类算法是一种无监督的、无参数的、简单的、较流行的且容易实现的分类算法。但是KNN算法在处理文本分类的过程中需要不断地计算待测文本与样本的相似度,当文本数量更大时,算法的效率就会更差。为了提高传统KNN算法在文本分类中的效率,提出一种基于聚类的改进KNN算法。算法开始之前采用改进χ~2统计量方法进行文本特征提取,再依据聚类方法将文本集聚类成几个簇,最后利用改进的KNN方法对簇类进行文本分类。实验对比与分析结果表明,该方法可以较好地进行文本分类。 展开更多
关键词 文本分类 knn 聚类化 训练集
在线阅读 下载PDF
上一页 1 2 50 下一页 到第
使用帮助 返回顶部