期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
面向元信息分类的支持向量机改进技术 被引量:1
1
作者 丁军平 蔡皖东 《西安交通大学学报》 EI CAS CSCD 北大核心 2011年第8期37-42,共6页
针对传统元信息分类方法的准确率不能满足主动P2P网络监测模型要求的问题,提出了一种基于改进支持向量机算法的元信息分类方法.该方法首先通过在加权最小二乘支持向量机的基础上加入对数据偏斜的处理,解决了元信息分类时关键词特征稀疏... 针对传统元信息分类方法的准确率不能满足主动P2P网络监测模型要求的问题,提出了一种基于改进支持向量机算法的元信息分类方法.该方法首先通过在加权最小二乘支持向量机的基础上加入对数据偏斜的处理,解决了元信息分类时关键词特征稀疏和样本高度不均衡问题,在对元信息文件名进行分词时,加入了词条之间的组合关系处理,在进行特征向量表示时,加入了对词条权值和语义属性的处理,最后使用基于粗糙集的属性规约方法进行特征向量选择,有效地降低了特征向量维度.实验结果表明,与传统方法相比,所提方法在进行元信息分类时能够大幅度提高分类准确率,准确率可达到97.8%,完全能够满足主动P2P网络监测模型的要求. 展开更多
关键词 元信息分类 支持向量 特征向量表示 粗糙集
在线阅读 下载PDF
基于样本动态权重的课程式半监督学习方法 被引量:1
2
作者 朱徽 胡斌 +1 位作者 宋怡宁 赵晓芳 《高技术通讯》 CAS 北大核心 2024年第4期342-355,共14页
本文针对半监督场景中极度匮乏的监督信号导致的标签传播困难、模型训练严重受噪声干扰等问题展开研究。伪标签化带来的噪声和低数据利用率导致的确认偏差,会随着自训练过程造成错误累积,进而形成不可逆偏差,损害性能。本文提出基于样... 本文针对半监督场景中极度匮乏的监督信号导致的标签传播困难、模型训练严重受噪声干扰等问题展开研究。伪标签化带来的噪声和低数据利用率导致的确认偏差,会随着自训练过程造成错误累积,进而形成不可逆偏差,损害性能。本文提出基于样本动态权重的课程式半监督学习方法,旨在通过非离散的课程设计,鼓励模型由简单至困难地利用样本,逐步构建分类面,进而缓解伪标签化过程中的噪声产生,增强模型泛化能力。从类内角度,提供弱监督信号的高置信度伪标签被混合用于构建特征原型,估计样本的学习难度。从类间角度,标签嵌入被用于评估类间语义相关度,课程式地减弱训练前期对语义相关类别间的辨别。在通用的半监督学习基准数据集上进行了广泛的实验和分析,证明了方法的有效性。 展开更多
关键词 半监督学习 特征表示向量 课程学习 特征原型 语义相关度
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部