期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于语言类任务的概念化强化学习框架
1
作者 彭少辉 胡杏 支天 《高技术通讯》 CAS 北大核心 2024年第6期555-566,共12页
语言类强化学习任务可以促进强化学习策略的泛化性,其关键问题是自动化学习观测和语言描述的通用表示。现有方法往往隐式学习联合表示,不可避免地引入训练集中的虚假相关信息,进而损伤策略的泛化性和训练效率。针对这一问题,本文提出了... 语言类强化学习任务可以促进强化学习策略的泛化性,其关键问题是自动化学习观测和语言描述的通用表示。现有方法往往隐式学习联合表示,不可避免地引入训练集中的虚假相关信息,进而损伤策略的泛化性和训练效率。针对这一问题,本文提出了概念化强化学习框架(CRL),其利用概念化这种从实体提取相似性生成抽象表示的认知方式,通过基于注意力机制的概念编码器和限制性损失函数显式地学习概括且抽象的概念化表示作为强化学习策略的输入。本文在常用的语言条件任务和文本游戏任务上验证了CRL的有效性,结果显示概念化表示大幅提升了策略的训练效率(最多70%)和泛化性能(最多30%),并有效提升了策略的可解释性。 展开更多
关键词 深度强化学习(DRL) 语言类强化学习任务 文本游戏 表示学习 互信息优化
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部