期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于UCI数据集的OCR光学字符识别 被引量:3
1
作者 史素霞 常婉秋 宋志英 《科技创新与应用》 2022年第35期50-53,共4页
该文通过实验利用公开规范的UCI数据集通过3个步骤建立字符识别模型,一是基于主成分分析,提取UCI记录中有较好识别效果的变量因子;二是基于逐步回归,初步建立字符识别模型;三是基于BP神经网络,对识别模型的各参数进行优化。结果表明,UC... 该文通过实验利用公开规范的UCI数据集通过3个步骤建立字符识别模型,一是基于主成分分析,提取UCI记录中有较好识别效果的变量因子;二是基于逐步回归,初步建立字符识别模型;三是基于BP神经网络,对识别模型的各参数进行优化。结果表明,UCI数据集中记录的16个参数变量可以通过7个主成分因子进行很好的描述;初步建立的回归识别模型显著性水平等于0.05;通过BP神经网络的学习优化,最终建立的识别模型精度为87.5%。总体来说,数据的预处理和神经网络的学习精度是字符识别精度的关键,可以通过对大量UCI数据集进行训练,提高字符识别的精度。 展开更多
关键词 字符识别 主成分分析 逐步回归模型 BP神经网络 uci数据集
在线阅读 下载PDF
基于FCM与KKT条件的增量学习方法 被引量:2
2
作者 张国兵 郎荣玲 《电子设计工程》 2014年第10期25-27,31,共4页
增量学习方法的思想是仅利用部分相关的样本集参与训练,即能够保留历史样本知识,又能够不断地吸收新的知识,提高机器学习效率和精度,解决了大量样本训练时间长和存储空间不足的问题。因此,如何有效地丢弃大量无效的样本点是增量学习算... 增量学习方法的思想是仅利用部分相关的样本集参与训练,即能够保留历史样本知识,又能够不断地吸收新的知识,提高机器学习效率和精度,解决了大量样本训练时间长和存储空间不足的问题。因此,如何有效地丢弃大量无效的样本点是增量学习算法研究的重点。文中提出了一种FCM(Fuzzy C-Means)和KKT(Karush-KuhnTucker)条件结合的增量学习方法,分别从历史样本集和新增样本集两个阶段对无效样本进行过滤,利用余下的样本进行训练。最后,利用UCI数据库中的4组数据进行实验分析,结果证明训练精度与全数据样本的训练精度几乎完全拟合。 展开更多
关键词 FCM KKT 训练精度 支持向量 uci数据库
在线阅读 下载PDF
基于集成学习的不完备数据补全算法研究 被引量:5
3
作者 丁敬安 张欣海 +1 位作者 胡博 周国民 《中国电子科学研究院学报》 北大核心 2020年第1期78-83,91,共7页
在数据挖掘领域中,对不完备数据进行补全,能够有效修复残缺的信息,提高挖掘效率和建模成功率。在大数据场景下,数据缺失机制的复杂性和数据的多源互补性得以呈现,以往单纯通过数据分布分析或关联分析进行分离修补的算法效果有限。文中... 在数据挖掘领域中,对不完备数据进行补全,能够有效修复残缺的信息,提高挖掘效率和建模成功率。在大数据场景下,数据缺失机制的复杂性和数据的多源互补性得以呈现,以往单纯通过数据分布分析或关联分析进行分离修补的算法效果有限。文中结合数据分布和属性关联两种角度,提出一种以EM、KNN、RF等8种算法为基学习器的异质集成学习数据补全算法模型HELITW,在Iris、Boston等5种UCI机器学习标准数据集为基础,分别以10%、20%和30%比例建立的随机缺失机制数据集上,将HELITW与其他8种算法进行数据补全实验对比研究,实验结果表明:随着数据残缺比例的增加,9种模型的修补效果总体上都随之降低;但在相同实验条件下,HELITW模型补全效果优于其它8种模型。 展开更多
关键词 不完备数据 uci数据集 异质集成学习 HELITW
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部