期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
利用最近邻信息快速分类多标签数据 被引量:3
1
作者 乔健 田庆 《计算机工程与应用》 CSCD 北大核心 2011年第32期138-140,190,共4页
为克服ML-KNN在分类效率方面的局限性,提出了一种基于KNN的快速多标签数据分类算法FKMC,利用待分类实例的k个最近邻的局部信息进行排序分类。从已分类数据实例集中选择待分类数据实例的k个最近邻;根据每个最近邻拥有的标签数和每个标签... 为克服ML-KNN在分类效率方面的局限性,提出了一种基于KNN的快速多标签数据分类算法FKMC,利用待分类实例的k个最近邻的局部信息进行排序分类。从已分类数据实例集中选择待分类数据实例的k个最近邻;根据每个最近邻拥有的标签数和每个标签归属的最近邻数对待分类实例进行排序分类。仿真结果表明,最近邻的选择方法对分类器性能有显著的影响;在分类效果上FKMC与ML-KNN相当,有时甚至优于后者;而在分类效率上FKMC则显著优于ML-KNN。 展开更多
关键词 最近邻 快速分类 多标签数据 快速多标签数据分类算法(fkmc)
在线阅读 下载PDF
基于多标签分类的传感器网络数据故障检测算法 被引量:1
2
作者 张振海 李士宁 +1 位作者 李志刚 左雪雯 《计算机应用研究》 CSCD 北大核心 2014年第12期3788-3791,3817,共5页
传感器网络中多种数据故障会同时出现,为了同时检测出多种数据故障,使用多标签分类模型对传感器网络数据故障的检测过程进行建模。为了提高多标签分类器对数据故障的检测性能,提出了一种基于多标签Relief F和遗传算法的特征选择算法。... 传感器网络中多种数据故障会同时出现,为了同时检测出多种数据故障,使用多标签分类模型对传感器网络数据故障的检测过程进行建模。为了提高多标签分类器对数据故障的检测性能,提出了一种基于多标签Relief F和遗传算法的特征选择算法。该方法将Relief F扩展成可以对特征子集进行评估的多标签Relief F,特征选择过程首先使用遗传算法搜索特征子集,然后使用多标签Relief F对特征子集进行评估。在三个多标签分类器上的实验结果表明,提出的特征选择算法可以显著地提升多标签分类器对传感器网络数据故障的检测性能。 展开更多
关键词 传感器网络 数据故障 多标签分类 RELIEFF 遗传算法
在线阅读 下载PDF
一种基于大脑情感学习的快速分类改进算法 被引量:2
3
作者 梅英 谭冠政 刘振焘 《电子学报》 EI CAS CSCD 北大核心 2017年第11期2663-2670,共8页
为了提高数据分类的快速性与准确性,本文在大脑情感学习(Brain Emotional Learning,BEL)模型的基础上,结合遗传算法(Genetic Algorithm,GA),提出了一种基于GA-BEL的快速分类改进算法.BEL模型根据大脑中杏仁体和眶额皮质之间相互学习的... 为了提高数据分类的快速性与准确性,本文在大脑情感学习(Brain Emotional Learning,BEL)模型的基础上,结合遗传算法(Genetic Algorithm,GA),提出了一种基于GA-BEL的快速分类改进算法.BEL模型根据大脑中杏仁体和眶额皮质之间相互学习的神经生物学原理建立,模拟了情感刺激在大脑短反射通路中被快速处理的过程.因此,基于BEL模型的网络运算速度快.进一步采用遗传算法优化BEL网络权值,提高其分类正确率.在UCI数据集上的对比实验结果表明,无论对于小样本还是大样本数据集,较其他分类算法,GA-BEL算法均有较高的分类正确率和计算效率. 展开更多
关键词 快速分类 大脑情感学习 遗传算法 数据
在线阅读 下载PDF
不确定数据分类的模糊随机森林算法 被引量:7
4
作者 丁恒兵 叶飞跃 《计算机工程与设计》 北大核心 2023年第11期3373-3379,共7页
实际应用中不确定数据的分类问题越来越受到人们的重视,不确定数据不但属性值是不确定的,类标签也可能不确定。提出的不确定离散化算法,使模糊决策树能够处理区间数据,统一了属性值不确定与类标签不确定的差异。由此提出的由模糊决策树... 实际应用中不确定数据的分类问题越来越受到人们的重视,不确定数据不但属性值是不确定的,类标签也可能不确定。提出的不确定离散化算法,使模糊决策树能够处理区间数据,统一了属性值不确定与类标签不确定的差异。由此提出的由模糊决策树构造模糊随机森林的模糊分类算法,既继承了模糊决策树对不确定数据分类的灵活性,又继承了随机森林的集成性、鲁棒性和随机性的优点。实验结果表明,对于不确定性数据分类问题,该算法性能优于现有的一些算法。 展开更多
关键词 不确定数据分类 模糊决策树 模糊随机森林 不确定离散化算法 区间数据 标签 概率分布函数
在线阅读 下载PDF
改进词向量和kNN的中文文本分类算法 被引量:12
5
作者 丁正生 马春洁 《现代电子技术》 2022年第1期100-103,共4页
为提高中文文本分类的效率和准确率,针对汉字象形字的特点和数据量剧增的大数据背景,建立基于深度学习的中文文本分类算法。首先根据汉字子字符(字形、偏旁、笔画等)象形字即形状自带含义的特点,建立基于子字符和上下文特征的双通道CBO... 为提高中文文本分类的效率和准确率,针对汉字象形字的特点和数据量剧增的大数据背景,建立基于深度学习的中文文本分类算法。首先根据汉字子字符(字形、偏旁、笔画等)象形字即形状自带含义的特点,建立基于子字符和上下文特征的双通道CBOW模型实现中文文本向量化;其次基于大数据的背景,针对传统的kNN算法分类速度慢的缺点,提出一种基于LSC聚类和多目标数据筛选的快速kNN分类算法;最后运用快速kNN算法对文本数据转化的特征词向量数据进行分类。实验结果表明,改进后的中文文本分类算法增加了算法的使用范围,能够更精确地处理中文文本数据,更快地处理大数据问题,在分类速率和效果上都有一定程度的提升。 展开更多
关键词 中文文本分类 文本向量化 快速kNN算法 词向量 双通道CBOW模型 特征向量 数据分类
在线阅读 下载PDF
改进的结合密度聚类的SVM快速分类方法 被引量:5
6
作者 张珍珍 董才林 +1 位作者 陈增照 何秀玲 《计算机工程与应用》 CSCD 北大核心 2011年第2期136-138,共3页
针对SVM在对大规模数据分类时求解规模过大的问题,提出了一种缩减数据集以提高训练速度的方法。该算法的第一步利用基于密度的方法大致定位能代表某个局域的质点,然后用SVM训练缩减后的数据得到一组支持向量,第二步的训练数据由支持向... 针对SVM在对大规模数据分类时求解规模过大的问题,提出了一种缩减数据集以提高训练速度的方法。该算法的第一步利用基于密度的方法大致定位能代表某个局域的质点,然后用SVM训练缩减后的数据得到一组支持向量,第二步的训练数据由支持向量以及其所代表的样本点构成。仿真实验证明该算法在保证分类准确率的情况下能有效地提高分类速度。 展开更多
关键词 密度聚类 SVM算法 快速分类 数据
在线阅读 下载PDF
ML-kNN算法在大数据集上的高效应用 被引量:6
7
作者 陆凯 徐华 《计算机工程与应用》 CSCD 北大核心 2019年第1期84-88,共5页
k近邻多标签算法(ML-k NN)是一种懒惰学习算法,并已经成功地应用到实际生活中。随着信息量的不断增大,将ML-kNN算法运用到大数据集上已是形势所需。利用聚类算法将数据集分为几个不同的部分,然后在每一个部分中使用ML-k NN算法,并在四... k近邻多标签算法(ML-k NN)是一种懒惰学习算法,并已经成功地应用到实际生活中。随着信息量的不断增大,将ML-kNN算法运用到大数据集上已是形势所需。利用聚类算法将数据集分为几个不同的部分,然后在每一个部分中使用ML-k NN算法,并在四个规模不同的数据集上进行了一系列实验。实验结果表明,基于此思想的ML-kNN算法不论在精度、性能还是效率上都略胜一筹。 展开更多
关键词 多标签分类 ML-kNN算法 聚类 数据
在线阅读 下载PDF
基于节点映射与标签数据构建的链接预测方法 被引量:6
8
作者 周娅 杨邦 《计算机工程与设计》 北大核心 2020年第2期373-380,共8页
为改进基于局部或全局信息相似性度量方法中存在的无法全面提取网络结构信息的问题,以及基于网络表示学习的方法不能对链接的不存在性进行度量的问题,提出一种结合节点向量化方法与机器学习分类算法的Net2Vec-CLP框架。使用具有重启机... 为改进基于局部或全局信息相似性度量方法中存在的无法全面提取网络结构信息的问题,以及基于网络表示学习的方法不能对链接的不存在性进行度量的问题,提出一种结合节点向量化方法与机器学习分类算法的Net2Vec-CLP框架。使用具有重启机制的随机游走方法获得节点环境序列,将源网络信息转换成向量表示,在此基础上生成标签数据集,使用带sigmoid核映射方法的SVM模型进行二分类预测。实验结果表明,算法在Facebook数据集上较Node2Vec方法AUC值提高了2.47%,在其它数据集上也有可观测的优势。同时,结合二分类思想的方法,其能明确度量不存在链接关系的数据。 展开更多
关键词 链接预测 节点映射 网络表示学习 标签数据构建 分类算法
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部