-
题名利用最近邻信息快速分类多标签数据
被引量:3
- 1
-
-
作者
乔健
田庆
-
机构
西北工业大学管理学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2011年第32期138-140,190,共4页
-
基金
教育部人文社科基金(No.09YJAZH072)
-
文摘
为克服ML-KNN在分类效率方面的局限性,提出了一种基于KNN的快速多标签数据分类算法FKMC,利用待分类实例的k个最近邻的局部信息进行排序分类。从已分类数据实例集中选择待分类数据实例的k个最近邻;根据每个最近邻拥有的标签数和每个标签归属的最近邻数对待分类实例进行排序分类。仿真结果表明,最近邻的选择方法对分类器性能有显著的影响;在分类效果上FKMC与ML-KNN相当,有时甚至优于后者;而在分类效率上FKMC则显著优于ML-KNN。
-
关键词
最近邻
快速分类
多标签数据
快速多标签数据分类算法(fkmc)
-
Keywords
nearest neighbors
fast classifying
multi-label data
Fast K-nearest neighbors based Multi-label Categorization(fkmc)
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于多标签分类的传感器网络数据故障检测算法
被引量:1
- 2
-
-
作者
张振海
李士宁
李志刚
左雪雯
-
机构
西北工业大学计算机学院
同济大学电子与信息工程学院
-
出处
《计算机应用研究》
CSCD
北大核心
2014年第12期3788-3791,3817,共5页
-
基金
国家科技重大专项基金资助项目(2012ZX03005007)
-
文摘
传感器网络中多种数据故障会同时出现,为了同时检测出多种数据故障,使用多标签分类模型对传感器网络数据故障的检测过程进行建模。为了提高多标签分类器对数据故障的检测性能,提出了一种基于多标签Relief F和遗传算法的特征选择算法。该方法将Relief F扩展成可以对特征子集进行评估的多标签Relief F,特征选择过程首先使用遗传算法搜索特征子集,然后使用多标签Relief F对特征子集进行评估。在三个多标签分类器上的实验结果表明,提出的特征选择算法可以显著地提升多标签分类器对传感器网络数据故障的检测性能。
-
关键词
传感器网络
数据故障
多标签分类
RELIEFF
遗传算法
-
Keywords
sensor network
data fault
multi-label classification
Relief F
genetic algorithm
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名一种基于大脑情感学习的快速分类改进算法
被引量:2
- 3
-
-
作者
梅英
谭冠政
刘振焘
-
机构
中南大学信息科学与工程学院
湖南文理学院电气与信息工程学院
中国地质大学自动化学院
-
出处
《电子学报》
EI
CAS
CSCD
北大核心
2017年第11期2663-2670,共8页
-
基金
国家自然科学基金(No.61403422)
湖南省教育厅科学研究项目(No17C1084)
-
文摘
为了提高数据分类的快速性与准确性,本文在大脑情感学习(Brain Emotional Learning,BEL)模型的基础上,结合遗传算法(Genetic Algorithm,GA),提出了一种基于GA-BEL的快速分类改进算法.BEL模型根据大脑中杏仁体和眶额皮质之间相互学习的神经生物学原理建立,模拟了情感刺激在大脑短反射通路中被快速处理的过程.因此,基于BEL模型的网络运算速度快.进一步采用遗传算法优化BEL网络权值,提高其分类正确率.在UCI数据集上的对比实验结果表明,无论对于小样本还是大样本数据集,较其他分类算法,GA-BEL算法均有较高的分类正确率和计算效率.
-
关键词
快速分类
大脑情感学习
遗传算法
数据集
-
Keywords
fast classification
brain emotional learning
genetic algorithm
datasets
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名不确定数据分类的模糊随机森林算法
被引量:7
- 4
-
-
作者
丁恒兵
叶飞跃
-
机构
上海电机学院电气学院
上海大学计算工程与科学学院
-
出处
《计算机工程与设计》
北大核心
2023年第11期3373-3379,共7页
-
基金
国家自然科学基金重大研究计划基金项目(91024012)。
-
文摘
实际应用中不确定数据的分类问题越来越受到人们的重视,不确定数据不但属性值是不确定的,类标签也可能不确定。提出的不确定离散化算法,使模糊决策树能够处理区间数据,统一了属性值不确定与类标签不确定的差异。由此提出的由模糊决策树构造模糊随机森林的模糊分类算法,既继承了模糊决策树对不确定数据分类的灵活性,又继承了随机森林的集成性、鲁棒性和随机性的优点。实验结果表明,对于不确定性数据分类问题,该算法性能优于现有的一些算法。
-
关键词
不确定数据分类
模糊决策树
模糊随机森林
不确定离散化算法
区间数据
类标签
概率分布函数
-
Keywords
uncertain data classification
fuzzy decision tree
fuzzy random forest
uncertain discretization algorithm
interval data
class label
probability distribution function
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名改进词向量和kNN的中文文本分类算法
被引量:12
- 5
-
-
作者
丁正生
马春洁
-
机构
西安科技大学
-
出处
《现代电子技术》
2022年第1期100-103,共4页
-
基金
国家自然科学基金项目(71473194)。
-
文摘
为提高中文文本分类的效率和准确率,针对汉字象形字的特点和数据量剧增的大数据背景,建立基于深度学习的中文文本分类算法。首先根据汉字子字符(字形、偏旁、笔画等)象形字即形状自带含义的特点,建立基于子字符和上下文特征的双通道CBOW模型实现中文文本向量化;其次基于大数据的背景,针对传统的kNN算法分类速度慢的缺点,提出一种基于LSC聚类和多目标数据筛选的快速kNN分类算法;最后运用快速kNN算法对文本数据转化的特征词向量数据进行分类。实验结果表明,改进后的中文文本分类算法增加了算法的使用范围,能够更精确地处理中文文本数据,更快地处理大数据问题,在分类速率和效果上都有一定程度的提升。
-
关键词
中文文本分类
文本向量化
快速kNN算法
词向量
双通道CBOW模型
特征向量
数据分类
-
Keywords
Chinese text classification
text vectorization
fast kNN algorithm
word embedding
two-channel CBOW model
feature vector
data classification
-
分类号
TN911.1-34
[电子电信—通信与信息系统]
TP3
[自动化与计算机技术—计算机科学与技术]
-
-
题名改进的结合密度聚类的SVM快速分类方法
被引量:5
- 6
-
-
作者
张珍珍
董才林
陈增照
何秀玲
-
机构
华中师范大学数学与统计学学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2011年第2期136-138,共3页
-
文摘
针对SVM在对大规模数据分类时求解规模过大的问题,提出了一种缩减数据集以提高训练速度的方法。该算法的第一步利用基于密度的方法大致定位能代表某个局域的质点,然后用SVM训练缩减后的数据得到一组支持向量,第二步的训练数据由支持向量以及其所代表的样本点构成。仿真实验证明该算法在保证分类准确率的情况下能有效地提高分类速度。
-
关键词
密度聚类
SVM算法
快速分类
大数据集
-
Keywords
density clustering
Support Vector Machine(SVM)algorithm
fast classification
large data sets
-
分类号
O235
[理学—运筹学与控制论]
-
-
题名ML-kNN算法在大数据集上的高效应用
被引量:6
- 7
-
-
作者
陆凯
徐华
-
机构
江南大学物联网工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2019年第1期84-88,共5页
-
基金
江苏省自然科学基金(No.BK20140165)
国家留学基金委项目(No.201308320030)
-
文摘
k近邻多标签算法(ML-k NN)是一种懒惰学习算法,并已经成功地应用到实际生活中。随着信息量的不断增大,将ML-kNN算法运用到大数据集上已是形势所需。利用聚类算法将数据集分为几个不同的部分,然后在每一个部分中使用ML-k NN算法,并在四个规模不同的数据集上进行了一系列实验。实验结果表明,基于此思想的ML-kNN算法不论在精度、性能还是效率上都略胜一筹。
-
关键词
多标签分类
ML-kNN算法
聚类
大数据集
-
Keywords
multi-label classification
Multi-Label k Nearest Neighbo(r ML-kNN)
cluster
big data set
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名基于节点映射与标签数据构建的链接预测方法
被引量:6
- 8
-
-
作者
周娅
杨邦
-
机构
桂林电子科技大学计算机与信息安全学院
-
出处
《计算机工程与设计》
北大核心
2020年第2期373-380,共8页
-
基金
国家自然科学基金项目(61662015)
广西科技厅科技开发重点基金项目(桂科攻1598019)
NSFC-广东联合基金重点基金项目(U1501252)
-
文摘
为改进基于局部或全局信息相似性度量方法中存在的无法全面提取网络结构信息的问题,以及基于网络表示学习的方法不能对链接的不存在性进行度量的问题,提出一种结合节点向量化方法与机器学习分类算法的Net2Vec-CLP框架。使用具有重启机制的随机游走方法获得节点环境序列,将源网络信息转换成向量表示,在此基础上生成标签数据集,使用带sigmoid核映射方法的SVM模型进行二分类预测。实验结果表明,算法在Facebook数据集上较Node2Vec方法AUC值提高了2.47%,在其它数据集上也有可观测的优势。同时,结合二分类思想的方法,其能明确度量不存在链接关系的数据。
-
关键词
链接预测
节点映射
网络表示学习
标签化数据构建
分类算法
-
Keywords
link prediction
node mapping
network representation learning
labeled data building
classification algorithm
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-