检索结果-维普期刊中文期刊服务平台

基于上下文多臂赌博机的边缘计算任务卸载动态定价算法: 1; 作者甘楠付晓东冯艳《计算机工程》北大核心 2025年第10期182-190,共9页; 现有边缘计算动态定价算法普遍基于博弈论模型与拍卖机制提出。以最大化服务提供商总收益为优化目标,现有定价算法在事先获取用户效用信息方面面临一定的难度,并且多数拍卖机制在选取价格时倾向于局部最优而非全局最优。针对上述问题,... 展开更多; 关键词边缘计算任务卸载动态定价上下文多臂赌博机汤姆森采样; 在线阅读下载PDF 职称材料

一种核的上下文多臂赌博机推荐算法被引量：3: 2; 作者王鼎门昌骞王文剑《智能系统学报》 CSCD 北大核心 2022年第3期625-633,共9页; 个性化推荐服务在当今互联网时代越来越重要,但是传统推荐算法不适应一些高度变化场景。将线性上下文多臂赌博机算法(linear upper confidence bound,LinUCB)应用于个性化推荐可以有效改善传统推荐算法存在的问题,但遗憾的是准确率并不... 展开更多; 关键词个性化推荐变化场景多臂赌博机线性上下文多臂赌博机核方法点击率非线性探索–利用困境; 在线阅读下载PDF 职称材料

一种自适应的多臂赌博机算法被引量：9: 3; 作者章晓芳周倩 +1 位作者梁斌徐进《计算机研究与发展》 EI CSCD 北大核心 2019年第3期643-654,共12页; 多臂赌博机问题是强化学习中研究探索和利用两者平衡的经典问题,其中,随机多臂赌博机问题是最经典的一类多臂赌博机问题,是众多新型多臂赌博机问题的基础.针对现有多臂赌博机算法未能充分使用环境反馈信息以及泛化能力较弱的问题,提出... 展开更多; 关键词强化学习多臂赌博机探索和利用自适应上下文相关; 在线阅读下载PDF 职称材料

多机协同探测传感器管理被引量：3: 4; 作者王楠许蕴山 +1 位作者夏海宝王俊迪《弹箭与制导学报》北大核心 2019年第2期20-23,共4页; 针对作战单元的体系化发展,作战任务通常由多平台协同完成,机载传感器作为获取战场信息的主要设备,必须在应用中对其进行有效的组织协调。文中针对多机协同探测的传感器管理问题进行研究。根据传感器与平台各自的动态特点,设计了一种双... 展开更多; 关键词传感器管理协同探测线性规划多臂赌博机; 在线阅读下载PDF 职称材料

题名基于上下文多臂赌博机的边缘计算任务卸载动态定价算法: 1; 作者甘楠付晓东冯艳; 机构昆明理工大学信息工程与自动化学院昆明理工大学云南省计算机技术应用重点实验室云南省科学技术院; 出处《计算机工程》北大核心 2025年第10期182-190,共9页; 基金国家自然科学基金(62362043) 云南省科技计划项目(202204BQ040010,202102AD080002)。; 文摘现有边缘计算动态定价算法普遍基于博弈论模型与拍卖机制提出。以最大化服务提供商总收益为优化目标,现有定价算法在事先获取用户效用信息方面面临一定的难度,并且多数拍卖机制在选取价格时倾向于局部最优而非全局最优。针对上述问题,提出一种基于上下文多臂赌博机(CMAB)的边缘计算任务卸载动态定价算法。首先,将边缘计算动态定价问题建模为CMAB模型;然后,设计一种基于汤姆森采样(TS)的任务卸载动态定价算法,运用贝叶斯后验来诱导服务提供商进行价格选取,通过每一轮的奖励收益更新对应参数,有效减少了动态定价过程中总收益的亏损值。最后,模拟真实的边缘环境进行实验,验证了定价算法的有效性。仿真实验结果表明,该定价算法在期望累积遗憾值与期望累积收益值方面都优于现有多臂赌博机(MAB)算法和定价算法。; 关键词边缘计算任务卸载动态定价上下文多臂赌博机汤姆森采样; Keywords edge computing task offloading dynamic pricing Contextual Multi-Armed Bandit(CMAB) Thompson Sampling(TS); 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名一种核的上下文多臂赌博机推荐算法被引量：3: 2; 作者王鼎门昌骞王文剑; 机构山西大学计算机与信息技术学院山西大学计算智能与中文信息处理教育部重点实验室; 出处《智能系统学报》 CSCD 北大核心 2022年第3期625-633,共9页; 基金国家自然科学基金项目(62076154,U1805263) 中央引导地方科技发展资金项目(YDZX20201400001224) +1 种基金山西省国际科技合作重点研发计划项目(201903D421050).; 文摘个性化推荐服务在当今互联网时代越来越重要,但是传统推荐算法不适应一些高度变化场景。将线性上下文多臂赌博机算法(linear upper confidence bound,LinUCB)应用于个性化推荐可以有效改善传统推荐算法存在的问题,但遗憾的是准确率并不是很高。本文针对LinUCB算法推荐准确率不高这一问题,提出了一种改进算法K-UCB(kernel upper confidence bound)。该算法突破了LinUCB算法中不合理的线性假设前提,利用核方法拟合预测收益与上下文间的非线性关系,得到了一种新的在非线性数据下计算预测收益置信区间上界的方法,以解决推荐过程中的探索–利用困境。实验表明,本文提出的K-UCB算法相比其他基于多臂赌博机推荐算法有更高的点击率(click-through rate,CTR),能更好地适应变化场景下个性化推荐的需求。; 关键词个性化推荐变化场景多臂赌博机线性上下文多臂赌博机核方法点击率非线性探索–利用困境; Keywords personalized recommendation changing scenarios multi-armed bandits linear contextual bandits kernel method click-through rate nonlinear exploration-exploitation dilemma; 分类号 TP181 [自动化与计算机技术—控制理论与控制工程]; 在线阅读下载PDF 职称材料

题名一种自适应的多臂赌博机算法被引量：9: 3; 作者章晓芳周倩梁斌徐进; 机构苏州大学计算机科学与技术学院计算机软件新技术国家重点实验室(南京大学); 出处《计算机研究与发展》 EI CSCD 北大核心 2019年第3期643-654,共12页; 基金国家自然科学基金项目(61772263 61772014 +1 种基金 61572375) 苏州市科技发展计划基金项目(SYG201807)~~; 文摘多臂赌博机问题是强化学习中研究探索和利用两者平衡的经典问题,其中,随机多臂赌博机问题是最经典的一类多臂赌博机问题,是众多新型多臂赌博机问题的基础.针对现有多臂赌博机算法未能充分使用环境反馈信息以及泛化能力较弱的问题,提出一种自适应的多臂赌博机算法.该算法利用当前估计值最小的动作被选择的次数来调整探索和利用的概率(chosen number of arm with minimal estimation, CNAME),有效缓解了探索和利用不平衡的问题.同时,该算法不依赖于上下文信息,在不同场景的多臂赌博机问题中有更好的泛化能力.通过理论分析给出了该算法的悔值(regret)上界,并通过不同场景的实验结果表明:CNAME算法可以高效地获得较高的奖赏和较低的悔值,并且具有更好的泛化能力.; 关键词强化学习多臂赌博机探索和利用自适应上下文相关; Keywords reinforcement learning multi-armed bandit exploration and exploitation adaptation contextual; 分类号 TP181 [自动化与计算机技术—控制理论与控制工程]; 在线阅读下载PDF 职称材料

题名多机协同探测传感器管理被引量：3: 4; 作者王楠许蕴山夏海宝王俊迪; 机构空军工程大学航空机务士官学校空军工程大学; 出处《弹箭与制导学报》北大核心 2019年第2期20-23,共4页; 文摘针对作战单元的体系化发展,作战任务通常由多平台协同完成,机载传感器作为获取战场信息的主要设备,必须在应用中对其进行有效的组织协调。文中针对多机协同探测的传感器管理问题进行研究。根据传感器与平台各自的动态特点,设计了一种双层管理系统进行传感器的综合管理,分层是基于物理动态与信息动态的差异进行的。其中基于物理动态的空时划分利用线性规划方法进行优化,基于信息动态的资源管理采用多臂赌博机(multi-armed bandit)模型的UCB(upper confidence bound)指数方法。; 关键词传感器管理协同探测线性规划多臂赌博机; Keywords sensor management cooperative detection linear programming multi-armed bandit; 分类号 TP183 [自动化与计算机技术—控制理论与控制工程]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	基于上下文多臂赌博机的边缘计算任务卸载动态定价算法	甘楠付晓东冯艳	《计算机工程》北大核心	2025	0	在线阅读下载PDF 职称材料
2	一种核的上下文多臂赌博机推荐算法	王鼎门昌骞王文剑	《智能系统学报》 CSCD 北大核心	2022	3	在线阅读下载PDF 职称材料
3	一种自适应的多臂赌博机算法	章晓芳周倩梁斌徐进	《计算机研究与发展》 EI CSCD 北大核心	2019	9	在线阅读下载PDF 职称材料
4	多机协同探测传感器管理	王楠许蕴山夏海宝王俊迪	《弹箭与制导学报》北大核心	2019	3	在线阅读下载PDF 职称材料