期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
结合密度峰值和切边权值的自训练算法 被引量:4
1
作者 卫丹妮 杨有龙 仇海全 《计算机工程与应用》 CSCD 北大核心 2021年第2期70-76,共7页
针对自训练迭代过程中错误标记样本对算法性能的影响,提出了基于密度峰值和切边权值的自训练算法。用密度聚类方法发现数据集的空间结构,选出具有代表性的未标记样本进行标签预测。用切边权值作为统计量进行假设检验,判断样本是否被正... 针对自训练迭代过程中错误标记样本对算法性能的影响,提出了基于密度峰值和切边权值的自训练算法。用密度聚类方法发现数据集的空间结构,选出具有代表性的未标记样本进行标签预测。用切边权值作为统计量进行假设检验,判断样本是否被正确标记,进而用正确标记样本逐步扩充有标记样本集合,直至所有未标记样本标签预测完成。新算法既充分利用了样本数据的空间结构信息,又解决了部分样本被标记错误的问题,提高了算法的分类准确率。通过在真实数据集上实验验证了新算法的有效性。 展开更多
关键词 自训练 密度峰值 切边权值 假设检验
在线阅读 下载PDF
一种基于嵌入式的弱标记分类算法 被引量:2
2
作者 李亚重 杨有龙 仇海全 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2020年第4期549-560,共12页
对于高维标签的分类问题,标签嵌入法已经受到广泛关注.现有的嵌入方法大都需要完整的标签信息,也没有将特征空间考虑在内;同时,由于数据进行人工标注的成本高以及噪声干扰等原因,仅能获得数据的部分标签信息,使得含有缺失标签的高维标... 对于高维标签的分类问题,标签嵌入法已经受到广泛关注.现有的嵌入方法大都需要完整的标签信息,也没有将特征空间考虑在内;同时,由于数据进行人工标注的成本高以及噪声干扰等原因,仅能获得数据的部分标签信息,使得含有缺失标签的高维标签分类问题变得更加复杂.为解决这一问题,提出一种弱标记嵌入算法(Label Embedding for Weak Label Classification,LEWL).该算法利用矩阵的低秩分解模型,结合样本的流形结构恢复缺失标签;同时采用希尔伯特‐施密特独立标准技术(Hilbert‐Schmidt Independence Criterion,HSIC)使特征和标签相互作用,联合学习获得一个低维的嵌入空间,可以有效地减少模型的训练时间.通过在七个多标签数据集上与其他算法的对比实验,结果表明了所提算法的有效性. 展开更多
关键词 弱标记学习 标签嵌入 低秩分解 希尔伯特‐施密特独立标准 缺失标签
在线阅读 下载PDF
基于稀疏子空间的局部异常值检测算法 被引量:2
3
作者 覃凤婷 杨有龙 仇海全 《计算机工程与应用》 CSCD 北大核心 2020年第19期152-159,共8页
针对高维数据集中存在不相关的属性与冗余数据导致无法检测出异常值的问题,提出了一种新的基于稀疏子空间的局部异常值检测算法(SSLOD)。根据数据对象在每个维度上的局部密度定义了对象的异常因子;依据异常因子阈值约简数据集中与局部... 针对高维数据集中存在不相关的属性与冗余数据导致无法检测出异常值的问题,提出了一种新的基于稀疏子空间的局部异常值检测算法(SSLOD)。根据数据对象在每个维度上的局部密度定义了对象的异常因子;依据异常因子阈值约简数据集中与局部异常值不相关的属性以及冗余的数据对象;用改进的粒子群优化算法在约简后的数据集中搜索稀疏子空间,该子空间中的数据对象即为异常值。通过在仿真数据集和真实数据集上的综合实验验证了该算法的有效性和准确性。 展开更多
关键词 异常值检测 数据约简 粒子群算法 稀疏子空间
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部