期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
一种核的上下文多臂赌博机推荐算法 被引量:3
1
作者 王鼎 门昌骞 王文剑 《智能系统学报》 CSCD 北大核心 2022年第3期625-633,共9页
个性化推荐服务在当今互联网时代越来越重要,但是传统推荐算法不适应一些高度变化场景。将线性上下文多臂赌博机算法(linear upper confidence bound,LinUCB)应用于个性化推荐可以有效改善传统推荐算法存在的问题,但遗憾的是准确率并不... 个性化推荐服务在当今互联网时代越来越重要,但是传统推荐算法不适应一些高度变化场景。将线性上下文多臂赌博机算法(linear upper confidence bound,LinUCB)应用于个性化推荐可以有效改善传统推荐算法存在的问题,但遗憾的是准确率并不是很高。本文针对LinUCB算法推荐准确率不高这一问题,提出了一种改进算法K-UCB(kernel upper confidence bound)。该算法突破了LinUCB算法中不合理的线性假设前提,利用核方法拟合预测收益与上下文间的非线性关系,得到了一种新的在非线性数据下计算预测收益置信区间上界的方法,以解决推荐过程中的探索–利用困境。实验表明,本文提出的K-UCB算法相比其他基于多臂赌博机推荐算法有更高的点击率(click-through rate,CTR),能更好地适应变化场景下个性化推荐的需求。 展开更多
关键词 个性化推荐 变化场景 多臂赌博机 线性上下文多臂赌博机 核方法 点击率 线性 探索–利用困境
在线阅读 下载PDF
一种自适应的多臂赌博机算法 被引量:9
2
作者 章晓芳 周倩 +1 位作者 梁斌 徐进 《计算机研究与发展》 EI CSCD 北大核心 2019年第3期643-654,共12页
多臂赌博机问题是强化学习中研究探索和利用两者平衡的经典问题,其中,随机多臂赌博机问题是最经典的一类多臂赌博机问题,是众多新型多臂赌博机问题的基础.针对现有多臂赌博机算法未能充分使用环境反馈信息以及泛化能力较弱的问题,提出... 多臂赌博机问题是强化学习中研究探索和利用两者平衡的经典问题,其中,随机多臂赌博机问题是最经典的一类多臂赌博机问题,是众多新型多臂赌博机问题的基础.针对现有多臂赌博机算法未能充分使用环境反馈信息以及泛化能力较弱的问题,提出一种自适应的多臂赌博机算法.该算法利用当前估计值最小的动作被选择的次数来调整探索和利用的概率(chosen number of arm with minimal estimation, CNAME),有效缓解了探索和利用不平衡的问题.同时,该算法不依赖于上下文信息,在不同场景的多臂赌博机问题中有更好的泛化能力.通过理论分析给出了该算法的悔值(regret)上界,并通过不同场景的实验结果表明:CNAME算法可以高效地获得较高的奖赏和较低的悔值,并且具有更好的泛化能力. 展开更多
关键词 强化学习 多臂赌博机 探索和利用 自适应 上下文相关
在线阅读 下载PDF
多机协同探测传感器管理 被引量:3
3
作者 王楠 许蕴山 +1 位作者 夏海宝 王俊迪 《弹箭与制导学报》 北大核心 2019年第2期20-23,共4页
针对作战单元的体系化发展,作战任务通常由多平台协同完成,机载传感器作为获取战场信息的主要设备,必须在应用中对其进行有效的组织协调。文中针对多机协同探测的传感器管理问题进行研究。根据传感器与平台各自的动态特点,设计了一种双... 针对作战单元的体系化发展,作战任务通常由多平台协同完成,机载传感器作为获取战场信息的主要设备,必须在应用中对其进行有效的组织协调。文中针对多机协同探测的传感器管理问题进行研究。根据传感器与平台各自的动态特点,设计了一种双层管理系统进行传感器的综合管理,分层是基于物理动态与信息动态的差异进行的。其中基于物理动态的空时划分利用线性规划方法进行优化,基于信息动态的资源管理采用多臂赌博机(multi-armed bandit)模型的UCB(upper confidence bound)指数方法。 展开更多
关键词 传感器管理 协同探测 线性规划 多臂赌博机
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部