-
题名一种双重正则化支持向量机的改进算法
- 1
-
-
作者
秦传东
刘三阳
-
机构
北方民族大学信息与计算科学学院
西安电子科技大学理学院
-
出处
《计算机工程》
CAS
CSCD
2012年第24期179-181,187,共4页
-
基金
国家自然科学基金资助项目(60974082)
国家自然科学基金青年基金资助项目(10901004)
-
文摘
针对L1范数支持向量机和L2范数支持向量机在分析部分小样本、高维数、变量高相关的数据时效果不理想的问题,在综合利用这2种支持向量机优点的基础上,提出一种双重正则化支持向量机的改进算法。通过正号函数和二次多项式损失函数将问题转化为可微的无条件约束优化问题,便于采用多种优化算法进行运算。实验结果证明,该改进算法可取得较好的分类准确率。
-
关键词
L1范数支持向量机
L2范数支持向量机
正号函数
二次多项式函数
BFGS算法
双重正则化
-
Keywords
L1-norm support vector machine
L2-norm support vector machine
positive function
quadratic polynomial function
BFGS algorithm
doubly regularization
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于深度强化学习的机械臂多模混合控制
被引量:1
- 2
-
-
作者
李家乐
张建锋
李彬
刘天琅
陈检
-
机构
西北农林科技大学信息工程学院
-
出处
《计算机工程与设计》
北大核心
2024年第9期2835-2843,共9页
-
基金
陕西省重点研发计划基金项目(2023-YBNY-212)
陕西省自然科学基金项目(2021JQ-179)。
-
文摘
针对基于深度强化学习控制的机械臂动态避障能力不足,在作业过程中存在多任务冲突问题,提出一种基于双重角色和正则化批评者算法(DARC)的多模混合控制方法。将任务分解为多段避障模式,借助人工势场法的斥力引力思想设计奖励函数并分别进行训练;将经过初步训练的多个模式以距离阈值或奖励积累阈值进行切换控制,消除混合控制存在的冲突;结合机械臂单元运动学特点设计具有软体性质的多连杆机械臂平面仿真模型。实验验证所提方法能够有效提升机械臂动态避障能力,避免多任务间的冲突。
-
关键词
深度强化学习
机械臂
双重演员正则化评论家算法(DARC)
奖励机制
动态避障
优先经验回放机制
连续动作控制
-
Keywords
deep reinforcement learning
manipulator
double actors regularized critics algorithm
reward and punishment mecha-nism
dynamic obstacle avoidance
prioritized experience replay
continuous action control
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-