期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
深度强化学习中策略表征研究简述
1
作者 陈真 吴卓屹 张霖 《系统仿真学报》 北大核心 2025年第7期1753-1769,共17页
深度强化学习(deep reinforcement learning,DRL)在多个领域取得了显著成功,但DRL的策略网络在泛化性、多任务适应性和样本效率等方面仍面临巨大挑战。策略表征作为提升DRL能力的重要研究方向,通过构建更高效、更泛化的策略表达形式,提... 深度强化学习(deep reinforcement learning,DRL)在多个领域取得了显著成功,但DRL的策略网络在泛化性、多任务适应性和样本效率等方面仍面临巨大挑战。策略表征作为提升DRL能力的重要研究方向,通过构建更高效、更泛化的策略表达形式,提升智能体对环境变化及新任务的适应能力。概述了策略表征领域的关键研究进展,介绍了从传统的基于多层感知机(multi-layer perceptron,MLP)策略到基于指针网络、序列生成模型、扩散模型、超网络、模块化设计以及专家混合模型以及基于序列化Token的跨模态策略等多样化策略架构,还从策略输入和中间表达的语义如何编码和优化等策略表征方法层面归纳分析前沿研究。总结并对未来可能的发展趋势进行了展望。 展开更多
关键词 策略表征 深度强化学习 泛化能力 多任务学习
在线阅读 下载PDF
掩码表征迁移策略下的锂电池变工况健康状态预测
2
作者 王一航 陈旭 +1 位作者 沈萌 赵春晖 《控制理论与应用》 EI CAS CSCD 北大核心 2024年第8期1377-1385,共9页
锂电池健康状态(SOH)预测可以对电池老化程度进行评估.由于电池工作状况的差异,锂电池训练数据(源域)和在线应用数据(目标域)具有不同的分布,而迁移学习是解决上述问题的有效方法.然而,一方面,传统迁移学习方法需要大量源域数据标签,而... 锂电池健康状态(SOH)预测可以对电池老化程度进行评估.由于电池工作状况的差异,锂电池训练数据(源域)和在线应用数据(目标域)具有不同的分布,而迁移学习是解决上述问题的有效方法.然而,一方面,传统迁移学习方法需要大量源域数据标签,而SOH测量困难,难以提供充足标签;另一方面,这些方法无法充分利用已有的专家知识.基于此,本文创新性地提出了一种掩码表征迁移策略(MFTS),实现了源域无标签场景下的变工况锂电池SOH预测.首先,设计了一种掩码自监督框架,其可以在无标签的情况下实现自动特征提取来表征源域数据.其次,提出了一种专家知识模块,引导所提特征逼近专家特征,从而实现了专家知识的融入.最后,提出了一种双学习率的方法对特征提取和SOH预测网络进行同步变速训练,在迁移源域知识的同时实现了目标域SOH的准确预测.基于NASA的公开数据集,所提出的MFTS模型在6组实验上的预测误差均不大于4.08%. 展开更多
关键词 锂离子电池 健康状态 掩码表征迁移策略 变工况迁移
在线阅读 下载PDF
元认知在画图表征策略和小学生数学问题解决能力中的中介作用 被引量:7
3
作者 窦菲菲 刘志敏 +3 位作者 张景焕 刘桂荣 初玉霞 任菲菲 《心理学探新》 CSSCI 2012年第2期129-133,共5页
该研究采用自然实验和问卷调查法,对268名小学五年级学生进行画图表征策略训练,在此基础上根据策略学习情况筛选出掌握了该策略的218名学生,以这些学生为被试,探讨元认知在画图表征策略和小学生数学问题解决能力中的作用。结果表明:(1)... 该研究采用自然实验和问卷调查法,对268名小学五年级学生进行画图表征策略训练,在此基础上根据策略学习情况筛选出掌握了该策略的218名学生,以这些学生为被试,探讨元认知在画图表征策略和小学生数学问题解决能力中的作用。结果表明:(1)策略学习后,小学生的画图表征策略水平和数学问题解决成绩均显著高于策略学习前。(2)画图表征策略通过元认知这一中介变量对小学生数学问题解决能力有显著的促进作用。 展开更多
关键词 元认知 画图表征策略 数学问题解决能力
在线阅读 下载PDF
比较应用题的问题表征策略研究 被引量:5
4
作者 冯虹 阴国恩 安容 《心理学探新》 CSSCI 北大核心 2007年第2期40-43,共4页
采用2×2×4三因素混合实验设计,对不同年级学生解比较应用题过程中的各种指标进行分析,结果表明:学生解比较应用题时的问题表征策略存在显著的年级差异;数学成绩优生、差生存在不同的问题表征策略;题目呈现方式对学生的问题表... 采用2×2×4三因素混合实验设计,对不同年级学生解比较应用题过程中的各种指标进行分析,结果表明:学生解比较应用题时的问题表征策略存在显著的年级差异;数学成绩优生、差生存在不同的问题表征策略;题目呈现方式对学生的问题表征策略有显著影响。 展开更多
关键词 比较应用题 问题表征策略 呈现方式
在线阅读 下载PDF
《牛津高阶英语词典》(第8版)动名兼类词条表征策略研究 被引量:13
5
作者 王仁强 王端 《外国语文》 北大核心 2016年第2期51-58,共8页
现代英语等分析语在社群语言层面词库中的概括词因转类而衍生的语法多功能现象(兼类现象)自20世纪以来一直饱受争议,并成为各个理论阵营争论的焦点,其中动名兼类尤甚。然而,绝大多数研究都是从形态学或句法学角度出发,对于兼类这种跨越... 现代英语等分析语在社群语言层面词库中的概括词因转类而衍生的语法多功能现象(兼类现象)自20世纪以来一直饱受争议,并成为各个理论阵营争论的焦点,其中动名兼类尤甚。然而,绝大多数研究都是从形态学或句法学角度出发,对于兼类这种跨越形态学、句法学和词汇学(词典学)的课题难以获得全面的认识,对于现代英语社群语言层面词库(即语文词典)中的动名兼类现状更是缺乏系统的实证研究。以自建的"《牛津高阶英语词典》(第8版)词类标注数据库"为基础,研究词典中动名兼类词条的表征策略。结果显示,动名兼类现象在现代英语中较为普遍,动名兼类词条占整部词典所收词条的5.8%,接近动词词条的比例;OALD-8所收录的2670个动名兼类词条中,严格意义上的兼类词为2285个,其余385个为同形词;在严格意义上的动名兼类词中,52.12%的词条设置了自指义项,其自指义项的表征呈现多样化特征,有助于满足学习者用户的编码需求。 展开更多
关键词 《牛津高阶英语词典》(第8版) 动名兼类 自指义项 表征策略
在线阅读 下载PDF
《新世纪汉英大词典》(第二版)兼类词表征策略研究 被引量:13
6
作者 王仁强 霍忠振 邓娇 《外国语文》 北大核心 2019年第2期11-22,共12页
词类标注在汉英词典编纂中是一件牵一发而动全身的大事,其中兼类处理尤甚。《新世纪汉英大词典》被誉为第四代汉英词典的开山之作,但至今缺乏对其词类标注进行系统研究。从双层词类范畴化理论视角,基于自建的"《新世纪》(第二版)... 词类标注在汉英词典编纂中是一件牵一发而动全身的大事,其中兼类处理尤甚。《新世纪汉英大词典》被誉为第四代汉英词典的开山之作,但至今缺乏对其词类标注进行系统研究。从双层词类范畴化理论视角,基于自建的"《新世纪》(第二版)词类标注数据库"和语料库使用模式调查,对其兼类词表征策略进行系统研究。研究发现,该词典在词类标注方面成绩与问题并存:总体而言,兼类词数量显著增加,微观结构更趋合理,但仍未能全面反映现代汉语中概括词的兼类现状;具有对称语义关系的词条在词类标注中尚存一定问题。《新世纪汉英大词典》(第二版)在词类标注上的困惑在很大程度上仍然是现代汉语等分析语词类研究困境的真实写照。 展开更多
关键词 《新世纪汉英大词典》(第二版) 词类标注 兼类 表征策略 双层词类范畴化理论
在线阅读 下载PDF
虚拟互动整合作为辩论语篇交流性意义构建的表征策略 被引量:1
7
作者 段红 《外国语文》 北大核心 2019年第1期22-28,共7页
虚拟互动整合是面对面言语互动的情景框架与特定心理空间的整合网络。本文以表演型辩论为对象,通过对不同辩论阶段言语互动情形的考察,认为虚拟互动整合是辩手序列性独白、论据论证和投票阶段的概念化和表征底层的统一整合模式,对话框... 虚拟互动整合是面对面言语互动的情景框架与特定心理空间的整合网络。本文以表演型辩论为对象,通过对不同辩论阶段言语互动情形的考察,认为虚拟互动整合是辩手序列性独白、论据论证和投票阶段的概念化和表征底层的统一整合模式,对话框架及其虚拟三方对话次框架构成思维、语言和语篇的基本结构。 展开更多
关键词 虚拟互动整合 意义构建 表征策略
在线阅读 下载PDF
用可视化图像表征突破框图推断题难点 被引量:3
8
作者 周昌林 《化学教学》 CAS 北大核心 2016年第5期82-86,共5页
从布鲁纳表征系统和发现学习等视角,系统研究了框图推断题的命题特点,结合一些例题,归纳出诸如关键物质特有的化学性质、连续反应以及两种物质双向转化等典型的物质相互转化的可视化图像表征。利用可视化图像表征,可以快速提取在框... 从布鲁纳表征系统和发现学习等视角,系统研究了框图推断题的命题特点,结合一些例题,归纳出诸如关键物质特有的化学性质、连续反应以及两种物质双向转化等典型的物质相互转化的可视化图像表征。利用可视化图像表征,可以快速提取在框图中涉及的物质问相互转化的隐含线索,帮助解题者集中有效信息,明确推断思路,达成思维最优化,形成完善的解题策略,有效突破框图推断题难点。发挥框图推断可视化图像表征的教学功能,提升学生信息提取能力,并提出了相应的教学建议。 展开更多
关键词 框图推断题 物质转化关系 可视化图像 表征解题策略 信息提取能力
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部