期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于随机平衡采样的不确定大数据流在线分类算法
1
作者
杨知玲
《现代电子技术》
2023年第19期125-128,共4页
不确定大数据流具有动态性和不平衡性特点,导致分类结果不精准,为此提出基于随机平衡采样的不确定大数据流在线分类算法。根据Spark框架大数据筛选结构,过滤筛选不确定大数据,释放不满足条件的大数据。应用Hoeffding算法计算实际值与观...
不确定大数据流具有动态性和不平衡性特点,导致分类结果不精准,为此提出基于随机平衡采样的不确定大数据流在线分类算法。根据Spark框架大数据筛选结构,过滤筛选不确定大数据,释放不满足条件的大数据。应用Hoeffding算法计算实际值与观测值之差,判断差值与属性差值之间的关系,确定最佳分类属性。随机设定最小类别与最大类别数目,对非平衡样本抽样,避免因样本规模过大而造成的样本损失。建立在线分类器,逐级筛选不确定大数据。通过计算不确定信息增益,获取归类最大可能性类别,实现大数据流的在线分类。由实验结果可知,该算法对数据集W1、W2、W3分类的准确率最低值分别达到90%、94%、83%,具有精准分类效果。
展开更多
关键词
随机平衡采样
不确定
大数据流
在线分类
属性差值
最佳分类属性
在线阅读
下载PDF
职称材料
基于RB-XGBoost算法的智能电网调度控制系统健康度评价模型
被引量:
41
2
作者
谈林涛
李军良
+4 位作者
任昺
何杨
高欣
徐建航
黄晴晴
《电力自动化设备》
EI
CSCD
北大核心
2020年第2期189-195,共7页
针对智能电网调度控制系统(D5000系统)健康度评价,基于专家经验的传统评价方法存在主观性较大的问题,机器学习多分类方法是提高评价客观性的一种有效手段,但健康度各等级样本数目间存在的不平衡问题导致分类准确率较低,为此提出一种基...
针对智能电网调度控制系统(D5000系统)健康度评价,基于专家经验的传统评价方法存在主观性较大的问题,机器学习多分类方法是提高评价客观性的一种有效手段,但健康度各等级样本数目间存在的不平衡问题导致分类准确率较低,为此提出一种基于随机平衡和极端梯度提升(RB-XGBoost)算法的D5000系统健康度评价模型。首先,针对系统各评价等级样本数目严重不平衡的问题,提出一种自适应随机平衡(RB)的混合采样方法,分别以等级间样本数目的最大值、最小值作为采样区间的上、下限,生成多个随机数对各等级样本数据进行欠采样或过采样,增加训练数据的多样性并降低其不平衡程度;然后,训练平衡后的样本数据,建立极端梯度提升(XGBoost)算法子模型,考虑到各子模型重要度的一致性,提出采用硬投票方式集成所有子模型,得到与D5000系统各子模块对应的评价模型;最后,根据该系统指标层级关系,在评价过程中采用并、串行结合的计算方式,构建包含17个RB-XGBoost模型的D5000系统整体健康度评价模型。8组KEEL数据库中多类不平衡数据集的实验结果表明,与现有同类典型方法相比,所提方法的平均分类准确率最高提升了6.79%,平均提升了2.03%;某网省级D5000系统的实时采集数据验证了所提方法的有效性。
展开更多
关键词
智能电网
D5000系统
健康度评价
多分类
自适应
随机平衡采样
XGBoost算法
在线阅读
下载PDF
职称材料
题名
基于随机平衡采样的不确定大数据流在线分类算法
1
作者
杨知玲
机构
华南农业大学珠江学院信息工程学院
出处
《现代电子技术》
2023年第19期125-128,共4页
基金
北方国际大学联盟第六期教育教学研究课题:课堂教学过程性评价优化与可视化平台设计(20210608004)
2021年度校级教学质量工程及教育教学改革建设项目:面向工程实践和创新能力培养的案例教学模式改革与实践——以《多媒体技术》课程为例(华农珠江教务〔2021〕100号)
+1 种基金
2022年度广东省教育科学规划课题(高等教育专项):大数据支持下的民办高校学生终身学习能力评价与培养策略研究——以广州市从化区民办高校为例(2022GXJK404)
2022年度广东省本科高校教学质量与教学改革工程建设项目:大数据驱动的课堂教学过程性评价改革探索与实践研究(粤教高函[2023]4号)。
文摘
不确定大数据流具有动态性和不平衡性特点,导致分类结果不精准,为此提出基于随机平衡采样的不确定大数据流在线分类算法。根据Spark框架大数据筛选结构,过滤筛选不确定大数据,释放不满足条件的大数据。应用Hoeffding算法计算实际值与观测值之差,判断差值与属性差值之间的关系,确定最佳分类属性。随机设定最小类别与最大类别数目,对非平衡样本抽样,避免因样本规模过大而造成的样本损失。建立在线分类器,逐级筛选不确定大数据。通过计算不确定信息增益,获取归类最大可能性类别,实现大数据流的在线分类。由实验结果可知,该算法对数据集W1、W2、W3分类的准确率最低值分别达到90%、94%、83%,具有精准分类效果。
关键词
随机平衡采样
不确定
大数据流
在线分类
属性差值
最佳分类属性
Keywords
random balanced sampling
uncertainty
big data flow
online classification
attribute difference
best classification attribute
分类号
TN911.1-34 [电子电信—通信与信息系统]
TP393 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于RB-XGBoost算法的智能电网调度控制系统健康度评价模型
被引量:
41
2
作者
谈林涛
李军良
任昺
何杨
高欣
徐建航
黄晴晴
机构
国家电网华中电力调控分中心
南瑞集团有限公司国网电力科学研究院
北京邮电大学自动化学院
出处
《电力自动化设备》
EI
CSCD
北大核心
2020年第2期189-195,共7页
文摘
针对智能电网调度控制系统(D5000系统)健康度评价,基于专家经验的传统评价方法存在主观性较大的问题,机器学习多分类方法是提高评价客观性的一种有效手段,但健康度各等级样本数目间存在的不平衡问题导致分类准确率较低,为此提出一种基于随机平衡和极端梯度提升(RB-XGBoost)算法的D5000系统健康度评价模型。首先,针对系统各评价等级样本数目严重不平衡的问题,提出一种自适应随机平衡(RB)的混合采样方法,分别以等级间样本数目的最大值、最小值作为采样区间的上、下限,生成多个随机数对各等级样本数据进行欠采样或过采样,增加训练数据的多样性并降低其不平衡程度;然后,训练平衡后的样本数据,建立极端梯度提升(XGBoost)算法子模型,考虑到各子模型重要度的一致性,提出采用硬投票方式集成所有子模型,得到与D5000系统各子模块对应的评价模型;最后,根据该系统指标层级关系,在评价过程中采用并、串行结合的计算方式,构建包含17个RB-XGBoost模型的D5000系统整体健康度评价模型。8组KEEL数据库中多类不平衡数据集的实验结果表明,与现有同类典型方法相比,所提方法的平均分类准确率最高提升了6.79%,平均提升了2.03%;某网省级D5000系统的实时采集数据验证了所提方法的有效性。
关键词
智能电网
D5000系统
健康度评价
多分类
自适应
随机平衡采样
XGBoost算法
Keywords
smart grid
D5000 system
health evaluation
multi-classification
adaptive random balance sampling
XGBoost algorithm
分类号
TM734 [电气工程—电力系统及自动化]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于随机平衡采样的不确定大数据流在线分类算法
杨知玲
《现代电子技术》
2023
0
在线阅读
下载PDF
职称材料
2
基于RB-XGBoost算法的智能电网调度控制系统健康度评价模型
谈林涛
李军良
任昺
何杨
高欣
徐建航
黄晴晴
《电力自动化设备》
EI
CSCD
北大核心
2020
41
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部