-
题名考虑时变奖励的多摇臂算法在动态定价中的应用
被引量:1
- 1
-
-
作者
乔勋双
毕文杰
-
机构
中南大学商学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2021年第12期237-242,共6页
-
基金
国家自然科学基金重大研究计划-培育项目(91646115)。
-
文摘
考虑到动态定价是一个非固定性的多摇臂(Multi-Armed Bandit,MAB)问题,即厂商的利润会随时间变化,因此在相关研究基础上,研究了需求不确定情况下考虑时变奖励的置信区间上界(Upper Confidence Bound,UCB)算法在动态定价问题上的应用。将商品定价问题描述为一个多摇臂问题,并构建利润最大化模型求得最优解。仿真结果表明,通过将考虑时变奖励的置信区间上界算法与基础的多摇臂算法进行对比分析,所提出的算法学得的奖励更加接近真实奖励,收敛速度更快。相较于前人研究,该模型考虑了时变因素,更加符合现实场景中的动态定价,为厂商定价提供了相应的决策支持。
-
关键词
多摇臂算法
动态定价
置信区间上界算法
-
Keywords
multi-armed bandit algorithm
dynamic pricing
upper confidence bound
-
分类号
C93
[经济管理—管理学]
-