期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于因子分解机用于安全探索的Q表初始化方法
1
作者
曾柏森
钟勇
牛宪华
《计算机应用》
CSCD
北大核心
2022年第1期209-214,共6页
针对强化学习的大多数探索/利用策略在探索过程中忽略智能体随机选择动作带来的风险的问题,提出一种基于因子分解机(FM)用于安全探索的Q表初始化方法。首先,引入Q表中已探索的Q值作为先验知识;然后,利用FM建立先验知识中状态和行动间潜...
针对强化学习的大多数探索/利用策略在探索过程中忽略智能体随机选择动作带来的风险的问题,提出一种基于因子分解机(FM)用于安全探索的Q表初始化方法。首先,引入Q表中已探索的Q值作为先验知识;然后,利用FM建立先验知识中状态和行动间潜在的交互作用的模型;最后,基于该模型预测Q表中的未知Q值,从而进一步引导智能体探索。在OpenAIGym的网格强化学习环境Cliffwalk中进行的A/B测试里,基于所提方法的Boltzmann和置信区间上界(UCB)探索/利用策略的不良探索幕数分别下降了68.12%和89.98%。实验结果表明,所提方法提高了传统策略的探索安全性,同时加快了收敛。
展开更多
关键词
强化学习
Q-LEARNING
因子分解机
Q表初始化
安全探索
在线阅读
下载PDF
职称材料
贯彻总体国家安全观 创新新时代学校安全理论与实践——中国教育学会中小学安全教育与安全管理专业委员会第13届年会综述
被引量:
1
2
作者
董新良
李炫洁
刘琼
《教育理论与实践》
北大核心
2023年第5期61-64,共4页
2022年11月5日,以“总体国家安全观视域下学校安全理论与实践”为主题的中国教育学会中小学安全教育与安全管理专业委员会第13届学术年会在北京和山西太原同步举行,会议聚焦教育系统学习贯彻落实党的二十大有关精神,围绕“学校安全政策...
2022年11月5日,以“总体国家安全观视域下学校安全理论与实践”为主题的中国教育学会中小学安全教育与安全管理专业委员会第13届学术年会在北京和山西太原同步举行,会议聚焦教育系统学习贯彻落实党的二十大有关精神,围绕“学校安全政策解析”“学校安全教育体系构建”“学校安全风险治理”“学校安全实践探索”等议题进行了深入讨论,理清了工作思路,对深化学校安全研究、改进学校安全工作,起到了较大的启迪和指引作用。
展开更多
关键词
学校
安全
政策
学校
安全
教育体系
学校
安全
治理
学校
安全
实践
探索
在线阅读
下载PDF
职称材料
题名
基于因子分解机用于安全探索的Q表初始化方法
1
作者
曾柏森
钟勇
牛宪华
机构
中国科学院成都计算机应用研究所
中国科学院大学
成都工业学院网络与通信工程学院
通信抗干扰技术国家级重点实验室(电子科技大学)
西华大学计算机与软件工程学院
出处
《计算机应用》
CSCD
北大核心
2022年第1期209-214,共6页
基金
中国博士后科技基金资助项目(2019M663475)。
文摘
针对强化学习的大多数探索/利用策略在探索过程中忽略智能体随机选择动作带来的风险的问题,提出一种基于因子分解机(FM)用于安全探索的Q表初始化方法。首先,引入Q表中已探索的Q值作为先验知识;然后,利用FM建立先验知识中状态和行动间潜在的交互作用的模型;最后,基于该模型预测Q表中的未知Q值,从而进一步引导智能体探索。在OpenAIGym的网格强化学习环境Cliffwalk中进行的A/B测试里,基于所提方法的Boltzmann和置信区间上界(UCB)探索/利用策略的不良探索幕数分别下降了68.12%和89.98%。实验结果表明,所提方法提高了传统策略的探索安全性,同时加快了收敛。
关键词
强化学习
Q-LEARNING
因子分解机
Q表初始化
安全探索
Keywords
reinforcement learning
Q-learning
Factorization Machine(FM)
Q-table initialization
safe exploration
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
贯彻总体国家安全观 创新新时代学校安全理论与实践——中国教育学会中小学安全教育与安全管理专业委员会第13届年会综述
被引量:
1
2
作者
董新良
李炫洁
刘琼
机构
山西师范大学教育学部
山西师范大学教育科学学院
出处
《教育理论与实践》
北大核心
2023年第5期61-64,共4页
文摘
2022年11月5日,以“总体国家安全观视域下学校安全理论与实践”为主题的中国教育学会中小学安全教育与安全管理专业委员会第13届学术年会在北京和山西太原同步举行,会议聚焦教育系统学习贯彻落实党的二十大有关精神,围绕“学校安全政策解析”“学校安全教育体系构建”“学校安全风险治理”“学校安全实践探索”等议题进行了深入讨论,理清了工作思路,对深化学校安全研究、改进学校安全工作,起到了较大的启迪和指引作用。
关键词
学校
安全
政策
学校
安全
教育体系
学校
安全
治理
学校
安全
实践
探索
分类号
G627 [文化科学—教育学]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于因子分解机用于安全探索的Q表初始化方法
曾柏森
钟勇
牛宪华
《计算机应用》
CSCD
北大核心
2022
0
在线阅读
下载PDF
职称材料
2
贯彻总体国家安全观 创新新时代学校安全理论与实践——中国教育学会中小学安全教育与安全管理专业委员会第13届年会综述
董新良
李炫洁
刘琼
《教育理论与实践》
北大核心
2023
1
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部