-
题名一种基于最大间隔的偏标记学习算法
被引量:1
- 1
-
-
作者
张仕将
柴晶
-
机构
太原理工大学信息与工程学院
-
出处
《科学技术与工程》
北大核心
2018年第28期109-115,共7页
-
基金
国家自然科学基金(61703299
61403273
+1 种基金
61402319)
山西省自然科学基金(201601D202044)资助
-
文摘
在机器学习中,偏标记学习是一类重要的弱监督学习框架;在该框架中训练示例不再具有单一明确的标记,每个训练示例的真实标记被隐藏在一个候选标记集中并且在学习过程中不可获知。为了解决从训练示例的候选标记集中学习真实标记的问题,基于最大间隔准则提出了一种新的偏标记学习算法;该算法是通过优化模型在候选标记集中最大输出与非候选标记集中最大输出之间的间隔,以及优化模型在候选标记集中最大输出与候选标记集中其他输出之间的间隔进行偏标记学习。采用改进的次梯度Pegasos算法完成模型参数的优化学习。在四组人工改造的UCI数据集中,在平均65%的情况下优于其他对比算法。在四组真实偏标记数据集中,相比其他对比算法,取得了4.4%~10.2%的性能提升。实验证明,具有更好的泛化性能。
-
关键词
偏标记学习
最大间隔准则
弱监督学习
pegasos算法
分类
-
Keywords
partial label learning
maximum margin criterion
weakly-supervised learning
pegasos algorithm
classification
-
分类号
TP391.75
[自动化与计算机技术—计算机应用技术]
-
-
题名基于间隔准则的优化排序多标记学习算法
- 2
-
-
作者
金亚洲
张正军
颜子寒
王雅萍
-
机构
南京理工大学理学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2020年第7期104-109,共6页
-
基金
全国统计科学研究项目“海量数据下半参数测量误差模型的统计建模和应用”(2018LD01)。
-
文摘
针对多标记学习分类问题,算法适应方法将其转化为排序问题,并将输出标记按照其与示例的相关性进行排序,该类方法取得了较好的分类效果。基于间隔准则提出一种多标记学习算法,通过优化模型在示例的相关标记集合中最小输出与不相关标记集合中最大输出的间隔损失来进行标记排序。在此基础上,为充分利用全部标记信息,提出一种改进的优化排序多标记学习算法,分别优化模型在示例的相关标记集合中平均输出与不相关标记集合中最大输出的间隔损失,以及优化模型在相关标记集合中最小输出与不相关标记集合中平均输出的间隔损失,从而实现标记排序。在模型的参数学习过程中,使用改进的次梯度Pegasos算法进行优化。将所提2种算法与ML-RBF、BP-MLL、ML-KNN多标记学习算法在4个多标记数据集上进行对比实验,结果表明,在HL、RL等5种不同的评价准则下,2种算法均能与对比算法取得相近的分类性能。
-
关键词
多标记学习
算法适应
标记排序
平均输出
间隔准则
pegasos算法
-
Keywords
multi-label learning
algorithm adaptation
label ranking
average output
margin criterion
pegasos algorithm
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-