期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于数据模糊性的PU学习研究
1
作者
李婷婷
吕佳
《北京师范大学学报(自然科学版)》
CAS
CSCD
北大核心
2020年第1期45-51,共7页
PU学习是指从正例样本和无标记样本中训练分类器的一种学习方法.针对传统PU学习中所含初始正例过少,难以有效地从无标记样本中选出可靠负例,且分类过程易受噪声点影响等问题.本文提出了一种基于数据模糊性来提取无标记样本中有效信息的P...
PU学习是指从正例样本和无标记样本中训练分类器的一种学习方法.针对传统PU学习中所含初始正例过少,难以有效地从无标记样本中选出可靠负例,且分类过程易受噪声点影响等问题.本文提出了一种基于数据模糊性来提取无标记样本中有效信息的PU学习方法:先对正例无标记样本集进行半监督聚类,选出靠近正例样本的低模糊度数据来扩充初始正例集,并选择远离正例样本的低模糊度数据作为可靠负例;再剪辑掉无标记样本中高模糊度数据;最后在扩充后的正例样本集和可靠负例集上训练分类器,对初始无标记样本集进行分类.在标准数据集上的对比实验证实了提出算法的有效性.
展开更多
关键词
PU学习
模糊性
可靠负例
噪声点
分类边界
在线阅读
下载PDF
职称材料
基于改进主动学习和自训练的联合算法
被引量:
1
2
作者
吕佳
傅屈寒
《北京师范大学学报(自然科学版)》
CAS
CSCD
北大核心
2022年第1期25-32,共8页
针对主动学习面向大型数据集人工标记成本过高和半监督自训练算法中存在误标记点影响的问题,提出了一种主动学习与半监督自训练交替迭代训练的联合算法.算法在训练过程中奇数轮次采用主动学习算法,偶数轮次采用自训练算法,通过2种算法...
针对主动学习面向大型数据集人工标记成本过高和半监督自训练算法中存在误标记点影响的问题,提出了一种主动学习与半监督自训练交替迭代训练的联合算法.算法在训练过程中奇数轮次采用主动学习算法,偶数轮次采用自训练算法,通过2种算法的交替迭代训练以弥补彼此不足.自训练算法对无标记样本的预测减轻了主动学习标记样本的负担,同时主动学习标记易变成噪声的样本,减轻了自训练算法训练过程中对样本的标记错误.提出了一种基于密度峰值聚类和隶属度的改进主动学习算法:将初始无标记样本聚类成簇,根据隶属度差值在每个簇内选取部分样本做人工标记,获得可表达样本的整体结构的均衡样本.仿真试验表明:提出的联合算法在性能上要优于2种单一算法.对比常见的主动学习算法,改进后的主动学习算法分类性能得到显著提升,将其应用于联合算法中的效果更具优势.
展开更多
关键词
主动学习
自训练算法
密度峰值聚类
联合算法
隶属度
在线阅读
下载PDF
职称材料
题名
基于数据模糊性的PU学习研究
1
作者
李婷婷
吕佳
机构
重庆师范大学计算机与信息科学学院重庆市数字农业服务工程技术研究中心
出处
《北京师范大学学报(自然科学版)》
CAS
CSCD
北大核心
2020年第1期45-51,共7页
基金
重庆市自然科学基金资助项目(cstc2014jcyjA40011)
重庆市教委科技资助项目(KJ1400513)
重庆师范大学科研资助项目(YKC19018)。
文摘
PU学习是指从正例样本和无标记样本中训练分类器的一种学习方法.针对传统PU学习中所含初始正例过少,难以有效地从无标记样本中选出可靠负例,且分类过程易受噪声点影响等问题.本文提出了一种基于数据模糊性来提取无标记样本中有效信息的PU学习方法:先对正例无标记样本集进行半监督聚类,选出靠近正例样本的低模糊度数据来扩充初始正例集,并选择远离正例样本的低模糊度数据作为可靠负例;再剪辑掉无标记样本中高模糊度数据;最后在扩充后的正例样本集和可靠负例集上训练分类器,对初始无标记样本集进行分类.在标准数据集上的对比实验证实了提出算法的有效性.
关键词
PU学习
模糊性
可靠负例
噪声点
分类边界
Keywords
PU-learning
fuzziness
reliable negative data
noise point
classification boundary
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
基于改进主动学习和自训练的联合算法
被引量:
1
2
作者
吕佳
傅屈寒
机构
重庆师范大学
计算机
与信息科学
学院
出处
《北京师范大学学报(自然科学版)》
CAS
CSCD
北大核心
2022年第1期25-32,共8页
基金
国家自然科学基金资助项目(11971084)
重庆市科技创新资助项目(KJCX2020024)
重庆市高校创新研究群体资助项目(CXQT20015)。
文摘
针对主动学习面向大型数据集人工标记成本过高和半监督自训练算法中存在误标记点影响的问题,提出了一种主动学习与半监督自训练交替迭代训练的联合算法.算法在训练过程中奇数轮次采用主动学习算法,偶数轮次采用自训练算法,通过2种算法的交替迭代训练以弥补彼此不足.自训练算法对无标记样本的预测减轻了主动学习标记样本的负担,同时主动学习标记易变成噪声的样本,减轻了自训练算法训练过程中对样本的标记错误.提出了一种基于密度峰值聚类和隶属度的改进主动学习算法:将初始无标记样本聚类成簇,根据隶属度差值在每个簇内选取部分样本做人工标记,获得可表达样本的整体结构的均衡样本.仿真试验表明:提出的联合算法在性能上要优于2种单一算法.对比常见的主动学习算法,改进后的主动学习算法分类性能得到显著提升,将其应用于联合算法中的效果更具优势.
关键词
主动学习
自训练算法
密度峰值聚类
联合算法
隶属度
Keywords
active learning
self-training algorithm
density peaks clustering
joint algorithm
membership degree
分类号
TP301 [自动化与计算机技术—计算机系统结构]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于数据模糊性的PU学习研究
李婷婷
吕佳
《北京师范大学学报(自然科学版)》
CAS
CSCD
北大核心
2020
0
在线阅读
下载PDF
职称材料
2
基于改进主动学习和自训练的联合算法
吕佳
傅屈寒
《北京师范大学学报(自然科学版)》
CAS
CSCD
北大核心
2022
1
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部