-
题名基于UCI数据集的OCR光学字符识别
被引量:3
- 1
-
-
作者
史素霞
常婉秋
宋志英
-
机构
河北政法职业学院建设工程与法务系
中国农业大学土地科学与技术学院
农业农村部农业灾害遥感重点实验室
-
出处
《科技创新与应用》
2022年第35期50-53,共4页
-
文摘
该文通过实验利用公开规范的UCI数据集通过3个步骤建立字符识别模型,一是基于主成分分析,提取UCI记录中有较好识别效果的变量因子;二是基于逐步回归,初步建立字符识别模型;三是基于BP神经网络,对识别模型的各参数进行优化。结果表明,UCI数据集中记录的16个参数变量可以通过7个主成分因子进行很好的描述;初步建立的回归识别模型显著性水平等于0.05;通过BP神经网络的学习优化,最终建立的识别模型精度为87.5%。总体来说,数据的预处理和神经网络的学习精度是字符识别精度的关键,可以通过对大量UCI数据集进行训练,提高字符识别的精度。
-
关键词
字符识别
主成分分析
逐步回归模型
BP神经网络
uci数据集
-
Keywords
character recognition
principal component analysis
stepwise regression model
BP neural network
uci dataset
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于FCM与KKT条件的增量学习方法
被引量:2
- 2
-
-
作者
张国兵
郎荣玲
-
机构
北京航空航天大学电子信息工程学院
-
出处
《电子设计工程》
2014年第10期25-27,31,共4页
-
基金
国家自然科学基金(61202078)
-
文摘
增量学习方法的思想是仅利用部分相关的样本集参与训练,即能够保留历史样本知识,又能够不断地吸收新的知识,提高机器学习效率和精度,解决了大量样本训练时间长和存储空间不足的问题。因此,如何有效地丢弃大量无效的样本点是增量学习算法研究的重点。文中提出了一种FCM(Fuzzy C-Means)和KKT(Karush-KuhnTucker)条件结合的增量学习方法,分别从历史样本集和新增样本集两个阶段对无效样本进行过滤,利用余下的样本进行训练。最后,利用UCI数据库中的4组数据进行实验分析,结果证明训练精度与全数据样本的训练精度几乎完全拟合。
-
关键词
FCM
KKT
训练精度
支持向量
uci数据库
-
Keywords
FCM
KKT
the training accuracy
support vector
uci dataset
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于集成学习的不完备数据补全算法研究
被引量:5
- 3
-
-
作者
丁敬安
张欣海
胡博
周国民
-
机构
杭州三汇数字信息技术有限公司
安徽工业大学管理科学与工程学院
中国电子科技集团公司电子科学研究院
社会安全风险感知与防控大数据应用国家工程实验室
浙江警察学院
-
出处
《中国电子科学研究院学报》
北大核心
2020年第1期78-83,91,共7页
-
基金
“十三五”国家重点研发计划(2017YFC0820503)。
-
文摘
在数据挖掘领域中,对不完备数据进行补全,能够有效修复残缺的信息,提高挖掘效率和建模成功率。在大数据场景下,数据缺失机制的复杂性和数据的多源互补性得以呈现,以往单纯通过数据分布分析或关联分析进行分离修补的算法效果有限。文中结合数据分布和属性关联两种角度,提出一种以EM、KNN、RF等8种算法为基学习器的异质集成学习数据补全算法模型HELITW,在Iris、Boston等5种UCI机器学习标准数据集为基础,分别以10%、20%和30%比例建立的随机缺失机制数据集上,将HELITW与其他8种算法进行数据补全实验对比研究,实验结果表明:随着数据残缺比例的增加,9种模型的修补效果总体上都随之降低;但在相同实验条件下,HELITW模型补全效果优于其它8种模型。
-
关键词
不完备数据
uci数据集
异质集成学习
HELITW
-
Keywords
incomplete data
uci dataset
heterogeneous ensembled learning
HELITW
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-