-
题名基于权值多样性的半监督分类算法
被引量:2
- 1
-
-
作者
毛铭泽
曹芮浩
闫春钢
-
机构
同济大学电子与信息工程学院
-
出处
《计算机应用》
CSCD
北大核心
2021年第9期2473-2480,共8页
-
基金
国家重点研发计划项目(2017YFB1001804)。
-
文摘
在实际生活中,可以很容易地获得大量系统数据样本,却只能获得很小一部分的准确标签。为了获得更好的分类学习模型,引入半监督学习的处理方式,对基于未标注数据强化集成多样性(UDEED)算法进行改进,提出了UDEED+——一种基于权值多样性的半监督分类算法。UDEED+主要的思路是在基学习器对未标注数据的预测分歧的基础上提出权值多样性损失,通过引入基学习器权值的余弦相似度来表示基学习器之间的分歧,并且从损失函数的不同角度充分扩展模型的多样性,使用未标注数据在模型训练过程中鼓励集成学习器的多样性的表示,以此达到提升分类学习模型性能和泛化性的目的。在8个UCI公开数据集上,与UDEED算法、S4VM(Safe Semi-Supervised Support Vector Machine)和SSWL(Semi-Supervised Weak-Label)半监督算法进行了对比,相较于UDEED算法,UDEED+在正确率和F1分数上分别提升了1.4个百分点和1.1个百分点;相较于S4VM,UDEED+在正确率和F1分数上分别提升了1.3个百分点和3.1个百分点;相较于SSWL,UDEED+在正确率和F1分数上分别提升了0.7个百分点和1.5个百分点。实验结果表明,权值多样性的提升可以改善UDEED+算法的分类性能,验证了其对所提算法UDEED+的分类性能提升的正向效果。
-
关键词
分类机器学习
未标注数据
半监督学习
集成学习
多样性
-
Keywords
classification machine learning
unlabeled data
semi-supervised learning
ensemble learning
diversity
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名基于单边抽样的LPU
- 2
-
-
作者
沈蕾
石盛平
燕继坤
-
机构
西南电子电信技术研究所信号盲处理国家重点实验室
-
出处
《计算机工程》
EI
CAS
CSCD
北大核心
2006年第23期216-217,223,共3页
-
基金
国家预研基金资助项目(514950307)
-
文摘
提出结合单边抽样Bagging与LPU的基本思想对不平衡数据进行分类。主要步骤是:将未标注实例全标为反类,和正例一起训练单边抽样Bagging学习器,将得到的学习器对未标注实例分类得到可靠的反例(RN),再用正例和RN训练SSBagging学习器。使用Rocchio和EM进行分类是Liu等提出的一种有代表性的LPU。比较了这种LPU和该文提出的方法,发现当数据的不平衡性很明显时,后者要优于前者。
-
关键词
不平衡分类
未标注数据
BAGGING
EM
-
Keywords
Classification of unbalanced data
Unlabeled data
Bagging
EM
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-