检索结果-维普期刊中文期刊服务平台

共找到1篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

基于语言类任务的概念化强化学习框架: 1; 作者彭少辉胡杏支天《高技术通讯》 CAS 北大核心 2024年第6期555-566,共12页; 语言类强化学习任务可以促进强化学习策略的泛化性,其关键问题是自动化学习观测和语言描述的通用表示。现有方法往往隐式学习联合表示,不可避免地引入训练集中的虚假相关信息,进而损伤策略的泛化性和训练效率。针对这一问题,本文提出了... 展开更多; 关键词深度强化学习(DRL) 语言类强化学习任务文本游戏表示学习互信息优化; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	基于语言类任务的概念化强化学习框架	彭少辉胡杏支天	《高技术通讯》 CAS 北大核心	2024	0	在线阅读下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析