期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
微阵列癌症数据误标记样本和异常样本识别的广义CL-stability算法
1
作者 周柚 张琛 +2 位作者 吴春国 时小虎 梁艳春 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2008年第3期509-511,共3页
针对微阵列癌症数据的特点,提出一种能识别数据集中误标记样本和异常样本的广义CL-stability算法.该算法以CL-stability为基本算子,通过样本的全局稳定性识别误标记样本或异常样本.实验结果表明,广义CL-stability算法对于识别微阵列癌... 针对微阵列癌症数据的特点,提出一种能识别数据集中误标记样本和异常样本的广义CL-stability算法.该算法以CL-stability为基本算子,通过样本的全局稳定性识别误标记样本或异常样本.实验结果表明,广义CL-stability算法对于识别微阵列癌症数据中的误标记样本优于已有算法,并能给出区分误标记样本和异常样本的信息. 展开更多
关键词 误标记样本识别 异常样本识别 微阵列 广义CL—stability算法
在线阅读 下载PDF
基于动态阈值和差异性检验的自训练算法
2
作者 吕佳 邱鸿波 肖锋 《智能系统学报》 CSCD 北大核心 2024年第4期839-852,共14页
针对自训练算法在迭代训练分类器的过程中存在难以有效选取高置信度样本以及误标记样本错误累积的问题,本文提出了基于动态阈值和差异性检验的自训练算法。引入样本的局部离群因子,据此剔除有标签样本中的离群点以及分类标注无标签样本... 针对自训练算法在迭代训练分类器的过程中存在难以有效选取高置信度样本以及误标记样本错误累积的问题,本文提出了基于动态阈值和差异性检验的自训练算法。引入样本的局部离群因子,据此剔除有标签样本中的离群点以及分类标注无标签样本,依据标注分批次处理无标签样本,以使模型更易选取到高置信度的无标签样本;根据新增伪标签样本的数量和对比隶属度的变化,设计一种动态隶属度阈值函数,提升高置信度样本的质量;定义密集距离度量样本间的差异性,分别计算伪标签样本与同类和不同类样本之间的密集距离之和,从而找出不确定度高的伪标签样本,并将此类样本并入下轮训练的无标签样本集中,缓解误标记样本错误累积的问题。实验结果表明,该算法在12个UCI基准数据集上均取得理想效果。 展开更多
关键词 自训练算法 误标记样本 高置信度样本 动态阈值 差异性检验 局部离群因子 对比隶属度 密集距离
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部