期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
面向元信息分类的支持向量机改进技术
被引量:
1
1
作者
丁军平
蔡皖东
《西安交通大学学报》
EI
CAS
CSCD
北大核心
2011年第8期37-42,共6页
针对传统元信息分类方法的准确率不能满足主动P2P网络监测模型要求的问题,提出了一种基于改进支持向量机算法的元信息分类方法.该方法首先通过在加权最小二乘支持向量机的基础上加入对数据偏斜的处理,解决了元信息分类时关键词特征稀疏...
针对传统元信息分类方法的准确率不能满足主动P2P网络监测模型要求的问题,提出了一种基于改进支持向量机算法的元信息分类方法.该方法首先通过在加权最小二乘支持向量机的基础上加入对数据偏斜的处理,解决了元信息分类时关键词特征稀疏和样本高度不均衡问题,在对元信息文件名进行分词时,加入了词条之间的组合关系处理,在进行特征向量表示时,加入了对词条权值和语义属性的处理,最后使用基于粗糙集的属性规约方法进行特征向量选择,有效地降低了特征向量维度.实验结果表明,与传统方法相比,所提方法在进行元信息分类时能够大幅度提高分类准确率,准确率可达到97.8%,完全能够满足主动P2P网络监测模型的要求.
展开更多
关键词
元信息分类
支持
向量
机
特征
向量
表示
粗糙集
在线阅读
下载PDF
职称材料
基于样本动态权重的课程式半监督学习方法
被引量:
1
2
作者
朱徽
胡斌
+1 位作者
宋怡宁
赵晓芳
《高技术通讯》
CAS
北大核心
2024年第4期342-355,共14页
本文针对半监督场景中极度匮乏的监督信号导致的标签传播困难、模型训练严重受噪声干扰等问题展开研究。伪标签化带来的噪声和低数据利用率导致的确认偏差,会随着自训练过程造成错误累积,进而形成不可逆偏差,损害性能。本文提出基于样...
本文针对半监督场景中极度匮乏的监督信号导致的标签传播困难、模型训练严重受噪声干扰等问题展开研究。伪标签化带来的噪声和低数据利用率导致的确认偏差,会随着自训练过程造成错误累积,进而形成不可逆偏差,损害性能。本文提出基于样本动态权重的课程式半监督学习方法,旨在通过非离散的课程设计,鼓励模型由简单至困难地利用样本,逐步构建分类面,进而缓解伪标签化过程中的噪声产生,增强模型泛化能力。从类内角度,提供弱监督信号的高置信度伪标签被混合用于构建特征原型,估计样本的学习难度。从类间角度,标签嵌入被用于评估类间语义相关度,课程式地减弱训练前期对语义相关类别间的辨别。在通用的半监督学习基准数据集上进行了广泛的实验和分析,证明了方法的有效性。
展开更多
关键词
半监督学习
特征表示向量
课程学习
特征
原型
语义相关度
在线阅读
下载PDF
职称材料
题名
面向元信息分类的支持向量机改进技术
被引量:
1
1
作者
丁军平
蔡皖东
机构
西北工业大学计算机学院
出处
《西安交通大学学报》
EI
CAS
CSCD
北大核心
2011年第8期37-42,共6页
基金
国家高技术研究发展计划资助项目(2009AA01Z424)
文摘
针对传统元信息分类方法的准确率不能满足主动P2P网络监测模型要求的问题,提出了一种基于改进支持向量机算法的元信息分类方法.该方法首先通过在加权最小二乘支持向量机的基础上加入对数据偏斜的处理,解决了元信息分类时关键词特征稀疏和样本高度不均衡问题,在对元信息文件名进行分词时,加入了词条之间的组合关系处理,在进行特征向量表示时,加入了对词条权值和语义属性的处理,最后使用基于粗糙集的属性规约方法进行特征向量选择,有效地降低了特征向量维度.实验结果表明,与传统方法相比,所提方法在进行元信息分类时能够大幅度提高分类准确率,准确率可达到97.8%,完全能够满足主动P2P网络监测模型的要求.
关键词
元信息分类
支持
向量
机
特征
向量
表示
粗糙集
Keywords
meta-information elassification
support vector machine
feature vector representa-tion
rough set
分类号
TP393.0 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于样本动态权重的课程式半监督学习方法
被引量:
1
2
作者
朱徽
胡斌
宋怡宁
赵晓芳
机构
中国科学院计算技术研究所
中国科学院大学
中央军委国防动员部信息中心
中科苏州智能计算技术研究院
出处
《高技术通讯》
CAS
北大核心
2024年第4期342-355,共14页
基金
国家重点研发计划(2021YFF0703800)资助项目。
文摘
本文针对半监督场景中极度匮乏的监督信号导致的标签传播困难、模型训练严重受噪声干扰等问题展开研究。伪标签化带来的噪声和低数据利用率导致的确认偏差,会随着自训练过程造成错误累积,进而形成不可逆偏差,损害性能。本文提出基于样本动态权重的课程式半监督学习方法,旨在通过非离散的课程设计,鼓励模型由简单至困难地利用样本,逐步构建分类面,进而缓解伪标签化过程中的噪声产生,增强模型泛化能力。从类内角度,提供弱监督信号的高置信度伪标签被混合用于构建特征原型,估计样本的学习难度。从类间角度,标签嵌入被用于评估类间语义相关度,课程式地减弱训练前期对语义相关类别间的辨别。在通用的半监督学习基准数据集上进行了广泛的实验和分析,证明了方法的有效性。
关键词
半监督学习
特征表示向量
课程学习
特征
原型
语义相关度
Keywords
semi-supervised learning
feature representation vector
curriculum learning
prototype of fea-tures
semantic relevancy
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
面向元信息分类的支持向量机改进技术
丁军平
蔡皖东
《西安交通大学学报》
EI
CAS
CSCD
北大核心
2011
1
在线阅读
下载PDF
职称材料
2
基于样本动态权重的课程式半监督学习方法
朱徽
胡斌
宋怡宁
赵晓芳
《高技术通讯》
CAS
北大核心
2024
1
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部