-
题名基于生成模型的Q-learning二分类算法
被引量:1
- 1
-
-
作者
尚志刚
徐若灏
乔康加
杨莉芳
李蒙蒙
-
机构
郑州大学电气工程学院
河南省脑科学与脑机接口技术重点实验室
-
出处
《计算机应用研究》
CSCD
北大核心
2020年第11期3326-3329,3333,共5页
-
基金
国家自然科学基金资助项目(U1304602)。
-
文摘
对于二分类问题,基于判别模型的分类器一般都是寻找一条最优判决边界,容易受到数据波动的影响。针对该问题提出一种基于生成模型的Q-learning二分类算法(BGQ-learning),将状态和动作分开编码,得到对应各类的判决函数,增加了决策空间的灵活性,同时在求解参数时,采用最小二乘时序差分(TD)算法和半梯度下降法的组合优化方法,加速了参数的收敛速度。设计实验对比了BGQ-learning算法与三种经典分类器以及一种新颖的分类器的分类性能,在UCI数据库七个数据集上的测试结果表明,该算法有着优良的稳定性以及良好的分类精确度。
-
关键词
Q-LEARNING
生成模型
二分类
最小二乘时序差分算法
半梯度下降法
-
Keywords
Q-learning
generative model
binary classification
least squares temporal-difference algorithm
semi-gradient descent
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-