-
题名基于主动半监督学习的智能电网信调日志分类
被引量:4
- 1
-
-
作者
年素磊
黎铭
杜科
姜远
林为民
郭经红
-
机构
南京大学软件新技术国家重点实验室
中国电力科学研究院
-
出处
《计算机科学》
CSCD
北大核心
2012年第12期167-170,207,共5页
-
基金
国家自然科学基金(60903103)
国家电网公司科技项目(EPRIXXKJ[2012]2918)资助
-
文摘
智能电网的通信调度系统是智能电网正常运行的保证。为保证系统正确运行,值班员需要对电网信调系统的运行状态、突发事件、事故故障以及相应的处理方案进行记录。为帮助管理者及时了解智能电网信息调度系统的工作情况,发现潜在安全隐患,通常需要为这些日志数据标注其日志类型,以方便管理者查询和检索,因此,要求智能电网信息调度系统能够自动对每天记录的各种日志根据管理需要进行分类。对大量根据值班员自己理解和习惯撰写的日志进行自动分类,需要对由信息调度专家提供类型标注的大量日志数据进行学习。然而因人工阅读标注耗时、耗力,故在实际应用中往往仅能提供少量的标注,从而影响自动分类的性能。针对这一问题,提出了基于主动半监督学习的日志自动分类方法,该方法一方面利用主动学习找出对学习最有帮助的日志,获得其类型标注;另一方面,通过利用大量缺乏类型标注的日志进一步提升学习性能。在国家电网的智能电网信息调度日志数据上的应用结果表明,基于主动半监督学习,可获得比现有方法更优的日志自动分类性能。
-
关键词
数据挖掘
机器学习
主动半监督学习
信调日志分类
智能电网
-
Keywords
Data mining
Machine learning
Active semi-supervised learning
Log classification
Smart grid
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于主动学习的图半监督分类算法
被引量:1
- 2
-
-
作者
高成
陈秀新
于重重
刘宇
-
机构
北京工商大学计算机与信息工程学院
-
出处
《计算机工程与设计》
北大核心
2015年第7期1871-1875,共5页
-
基金
北京市自然科学基金B类重点基金项目(KZ201410011014)
-
文摘
为抑制噪声数据对分类结果的影响,将噪声处理算法与高斯随机域算法相结合,提出一种带噪声系数的高斯随机域学习算法;针对样本集不平衡性数据分类问题,考虑主动学习在样本不平衡问题中的应用,将主动学习与图半监督算法相结合,提出一种鲁棒性强的主动学习图半监督分类算法。利用基于样本划分的主动学习方法,对正类的近邻样本集中样本与特定类样本形成的新样本集做总体散度排序,筛选出能使新样本集中总体散度最小的样本,代替正类的近邻样本集中所有样本,形成平衡类。在UCI标准数据集上的实验结果表明,与标准的图半监督算法相比,该算法的分类精度更高、泛化能力更强。
-
关键词
带噪声系数的高斯随机域学习算法
样本不平衡问题
主动学习
图半监督算法
主动学习图半监督分类算法
-
Keywords
GRF with noise factor
sample imbalance problem
active learning
graph-based semi-supervised algorithm
active learning semi-supervised classification algorithms
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-