期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于高斯过程与批量汤普森抽样的动态定价策略
1
作者 毕文杰 王荣 《计算机工程与应用》 CSCD 北大核心 2022年第16期303-311,共9页
考虑短期内需求不确定情况下同类型产品的定价策略研究,引入高斯过程进行需求函数的学习,利用批量汤普森算法建立基于探索-利用的两阶段学习和决策过程的定价模型。在利用提出的GP-PTS(Gaussian process-parallel Thompson sampling)算... 考虑短期内需求不确定情况下同类型产品的定价策略研究,引入高斯过程进行需求函数的学习,利用批量汤普森算法建立基于探索-利用的两阶段学习和决策过程的定价模型。在利用提出的GP-PTS(Gaussian process-parallel Thompson sampling)算法完成数值实验和某平台出行的真实数据应用后得出的结果表明:算法的精准度取决于特征是否完备,若给定一个先验且产品特征完备时,基于GP-PTS算法模拟出来的价格会取得比目前平台价格策略更好的收益,为企业在短期内进行定价决策提供良好借鉴。 展开更多
关键词 动态定价 高斯过程 汤普森抽样 批量贝叶斯优化
在线阅读 下载PDF
在线学习方法综述:汤普森抽样和其他方法 被引量:6
2
作者 何斯迈 金羽佳 +1 位作者 王华 葛冬冬 《运筹学学报》 CSCD 北大核心 2017年第4期84-102,共19页
本文尝试对在线学习领域的最新研究成果、相关主要理论和算法进行综述.在线学习的内容非常广博,本文希望能够为读者介绍其中一些基本的算法和想法,从最经典的理论模型和算法设计开始,对在线学习的发展情况作一个一般性的介绍.首先,以经... 本文尝试对在线学习领域的最新研究成果、相关主要理论和算法进行综述.在线学习的内容非常广博,本文希望能够为读者介绍其中一些基本的算法和想法,从最经典的理论模型和算法设计开始,对在线学习的发展情况作一个一般性的介绍.首先,以经典的在线优化模型——多摇臂赌博机问题为例,引入了汤普森抽样算法和信心上界算法,分析、展示了它们的基本思路和最新成果,并进一步讨论了汤普森抽样算法在更复杂的在线学习问题中的变式和应用.本文同时对在线凸优化算法做了初步探讨,它也是解决多摇臂赌博机问题和其他许多在线学习的应用问题时一种强有力的工具. 展开更多
关键词 在线学习 多摇臂赌博机 汤普森抽样 信心上界算法 情境多摇臂赌博机 在线凸优化
在线阅读 下载PDF
基于智能体理论的空气悬架车身高度智能控制系统研究 被引量:3
3
作者 江洪 王鹏程 李仲兴 《重庆理工大学学报(自然科学)》 CAS 北大核心 2019年第4期17-25,共9页
为了进一步发挥空气悬架车身高度调节系统的性能,在Belief-Desire-Intention(BDI)框架下构建了目标车身高度控制智能体,并采用汤普森抽样算法构建智能体学习行为。结合车身高度调节系统模型,建立空气悬架车身高度智能控制系统。单一工... 为了进一步发挥空气悬架车身高度调节系统的性能,在Belief-Desire-Intention(BDI)框架下构建了目标车身高度控制智能体,并采用汤普森抽样算法构建智能体学习行为。结合车身高度调节系统模型,建立空气悬架车身高度智能控制系统。单一工况下的仿真结果验证了智能体学习行为的可行性以及学习结果的适用性;混合工况下的仿真结果验证了空气悬架车身高度智能控制系统的可行性和有效性。结果表明:在车身高度智能控制系统的控制下,簧上质量质心位置处的加权加速度均方根值上升了0. 45%,侧倾因子降低了22. 82%,在不恶化行驶平顺性的同时,提高了操纵稳定性。 展开更多
关键词 空气悬架 车身高度 智能体理论 强化学习 汤普森抽样
在线阅读 下载PDF
基于智能体理论的横向互联空气悬架控制研究 被引量:4
4
作者 李仲兴 管晓星 江洪 《汽车工程》 EI CSCD 北大核心 2019年第8期896-904,共9页
为缓解横向互联空气悬架车辆行驶平顺性与操纵稳定性之间的矛盾,基于智能体理论构建横向互联空气悬架互联状态控制智能体系统。首先建立横向互联空气悬架整车模型并通过试验验证其准确性,随后在传统BDI(belief-desire-intention)智能体... 为缓解横向互联空气悬架车辆行驶平顺性与操纵稳定性之间的矛盾,基于智能体理论构建横向互联空气悬架互联状态控制智能体系统。首先建立横向互联空气悬架整车模型并通过试验验证其准确性,随后在传统BDI(belief-desire-intention)智能体的基础上,加入汤普森抽样算法,建立具有在线自学习能力的仿天棚互联状态控制智能体。该智能体从传感器信息采集模块感知环境状态,通过其内部的推理过程和学习行为进行自学习,输出适应不同环境状态的仿天棚互联状态控制策略的关键参数——滞回区间至互联状态控制模块。在混合工况下进行仿真,结果表明,该系统使车辆在行驶平顺性与操纵稳定性之间取得了平衡。 展开更多
关键词 横向互联 空气悬架 智能体 BDI模型 汤普森抽样
在线阅读 下载PDF
频谱感知次序的在线最优选择
5
作者 周敏 王少尉 《国防科技大学学报》 EI CAS CSCD 北大核心 2020年第4期24-29,共6页
动态频谱接入是解决无线电频谱资源短缺和频谱使用效率低下问题的有效方法,它允许次级用户在授权频谱空闲时动态地接入,以进行数据传输。而频谱感知是实现动态频谱接入的关键挑战之一。由于次级用户的感知能力有限,为了获得更多的频谱... 动态频谱接入是解决无线电频谱资源短缺和频谱使用效率低下问题的有效方法,它允许次级用户在授权频谱空闲时动态地接入,以进行数据传输。而频谱感知是实现动态频谱接入的关键挑战之一。由于次级用户的感知能力有限,为了获得更多的频谱接入机会,需要尽快找到频谱空闲概率最大的频段,并研究频谱感知次序问题。考虑到频谱空闲概率对次级用户是不可知的,并且会随时间变化,提出了在线学习框架,把频谱感知次序问题归纳成经典多摇臂赌博机问题,并利用在线学习方法——满意折现汤普森抽样算法处理优化问题。仿真结果表明,和其他算法相比,所提算法可以获得更多的频谱接入机会并且能够跟踪频谱空闲概率的变化。 展开更多
关键词 动态频谱接入 频谱感知 在线学习 满意折现汤普森抽样
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部