检索结果-维普期刊中文期刊服务平台

基于高斯过程与批量汤普森抽样的动态定价策略: 1; 作者毕文杰王荣《计算机工程与应用》 CSCD 北大核心 2022年第16期303-311,共9页; 考虑短期内需求不确定情况下同类型产品的定价策略研究,引入高斯过程进行需求函数的学习,利用批量汤普森算法建立基于探索-利用的两阶段学习和决策过程的定价模型。在利用提出的GP-PTS(Gaussian process-parallel Thompson sampling)算... 展开更多; 关键词动态定价高斯过程汤普森抽样批量贝叶斯优化; 在线阅读下载PDF 职称材料

在线学习方法综述:汤普森抽样和其他方法被引量：6: 2; 作者何斯迈金羽佳 +1 位作者王华葛冬冬《运筹学学报》 CSCD 北大核心 2017年第4期84-102,共19页; 本文尝试对在线学习领域的最新研究成果、相关主要理论和算法进行综述.在线学习的内容非常广博,本文希望能够为读者介绍其中一些基本的算法和想法,从最经典的理论模型和算法设计开始,对在线学习的发展情况作一个一般性的介绍.首先,以经... 展开更多; 关键词在线学习多摇臂赌博机汤普森抽样信心上界算法情境多摇臂赌博机在线凸优化; 在线阅读下载PDF 职称材料

基于智能体理论的空气悬架车身高度智能控制系统研究被引量：3: 3; 作者江洪王鹏程李仲兴《重庆理工大学学报（自然科学）》 CAS 北大核心 2019年第4期17-25,共9页; 为了进一步发挥空气悬架车身高度调节系统的性能,在Belief-Desire-Intention(BDI)框架下构建了目标车身高度控制智能体,并采用汤普森抽样算法构建智能体学习行为。结合车身高度调节系统模型,建立空气悬架车身高度智能控制系统。单一工... 展开更多; 关键词空气悬架车身高度智能体理论强化学习汤普森抽样; 在线阅读下载PDF 职称材料

基于智能体理论的横向互联空气悬架控制研究被引量：4: 4; 作者李仲兴管晓星江洪《汽车工程》 EI CSCD 北大核心 2019年第8期896-904,共9页; 为缓解横向互联空气悬架车辆行驶平顺性与操纵稳定性之间的矛盾,基于智能体理论构建横向互联空气悬架互联状态控制智能体系统。首先建立横向互联空气悬架整车模型并通过试验验证其准确性,随后在传统BDI(belief-desire-intention)智能体... 展开更多; 关键词横向互联空气悬架智能体 BDI模型汤普森抽样; 在线阅读下载PDF 职称材料

频谱感知次序的在线最优选择: 5; 作者周敏王少尉《国防科技大学学报》 EI CAS CSCD 北大核心 2020年第4期24-29,共6页; 动态频谱接入是解决无线电频谱资源短缺和频谱使用效率低下问题的有效方法,它允许次级用户在授权频谱空闲时动态地接入,以进行数据传输。而频谱感知是实现动态频谱接入的关键挑战之一。由于次级用户的感知能力有限,为了获得更多的频谱... 展开更多; 关键词动态频谱接入频谱感知在线学习满意折现汤普森抽样; 在线阅读下载PDF 职称材料

题名基于高斯过程与批量汤普森抽样的动态定价策略: 1; 作者毕文杰王荣; 机构中南大学商学院; 出处《计算机工程与应用》 CSCD 北大核心 2022年第16期303-311,共9页; 基金国家自然科学基金重大研究计划(91646115)。; 文摘考虑短期内需求不确定情况下同类型产品的定价策略研究,引入高斯过程进行需求函数的学习,利用批量汤普森算法建立基于探索-利用的两阶段学习和决策过程的定价模型。在利用提出的GP-PTS(Gaussian process-parallel Thompson sampling)算法完成数值实验和某平台出行的真实数据应用后得出的结果表明:算法的精准度取决于特征是否完备,若给定一个先验且产品特征完备时,基于GP-PTS算法模拟出来的价格会取得比目前平台价格策略更好的收益,为企业在短期内进行定价决策提供良好借鉴。; 关键词动态定价高斯过程汤普森抽样批量贝叶斯优化; Keywords dynamic pricing Gaussian process Thompson sampling parallel Bayesian optimization; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名在线学习方法综述:汤普森抽样和其他方法被引量：6: 2; 作者何斯迈金羽佳王华葛冬冬; 机构上海财经大学信息管理与工程学院复旦大学数学科学学院上海财经大学交叉科学研究院; 出处《运筹学学报》 CSCD 北大核心 2017年第4期84-102,共19页; 基金国家自然科学基金(No.11471205) 上海高校特聘教授(东方学者)岗位计划(No.15140002) +1 种基金 2016110392); 文摘本文尝试对在线学习领域的最新研究成果、相关主要理论和算法进行综述.在线学习的内容非常广博,本文希望能够为读者介绍其中一些基本的算法和想法,从最经典的理论模型和算法设计开始,对在线学习的发展情况作一个一般性的介绍.首先,以经典的在线优化模型——多摇臂赌博机问题为例,引入了汤普森抽样算法和信心上界算法,分析、展示了它们的基本思路和最新成果,并进一步讨论了汤普森抽样算法在更复杂的在线学习问题中的变式和应用.本文同时对在线凸优化算法做了初步探讨,它也是解决多摇臂赌博机问题和其他许多在线学习的应用问题时一种强有力的工具.; 关键词在线学习多摇臂赌博机汤普森抽样信心上界算法情境多摇臂赌博机在线凸优化; Keywords online learning, multi-armed bandit, Thompson sampling, upper confi-dence bound, contextual multi-armed bandit, online convex optimization; 分类号 O212.2 [理学—概率论与数理统计]; 在线阅读下载PDF 职称材料

题名基于智能体理论的空气悬架车身高度智能控制系统研究被引量：3: 3; 作者江洪王鹏程李仲兴; 机构江苏大学机械工程学院江苏大学汽车与交通工程学院; 出处《重庆理工大学学报（自然科学）》 CAS 北大核心 2019年第4期17-25,共9页; 基金国家自然科学基金资助项目(51575241); 文摘为了进一步发挥空气悬架车身高度调节系统的性能,在Belief-Desire-Intention(BDI)框架下构建了目标车身高度控制智能体,并采用汤普森抽样算法构建智能体学习行为。结合车身高度调节系统模型,建立空气悬架车身高度智能控制系统。单一工况下的仿真结果验证了智能体学习行为的可行性以及学习结果的适用性;混合工况下的仿真结果验证了空气悬架车身高度智能控制系统的可行性和有效性。结果表明:在车身高度智能控制系统的控制下,簧上质量质心位置处的加权加速度均方根值上升了0. 45%,侧倾因子降低了22. 82%,在不恶化行驶平顺性的同时,提高了操纵稳定性。; 关键词空气悬架车身高度智能体理论强化学习汤普森抽样; Keywords air suspension vehicle height agent theory reinforcement learning Thompson sampling algorithm; 分类号 TP272 [自动化与计算机技术—检测技术与自动化装置] U463 [机械工程—车辆工程]; 在线阅读下载PDF 职称材料

题名基于智能体理论的横向互联空气悬架控制研究被引量：4: 4; 作者李仲兴管晓星江洪; 机构江苏大学汽车与交通工程学院江苏大学机械工程学院; 出处《汽车工程》 EI CSCD 北大核心 2019年第8期896-904,共9页; 基金国家自然科学基金(51575241)资助; 文摘为缓解横向互联空气悬架车辆行驶平顺性与操纵稳定性之间的矛盾,基于智能体理论构建横向互联空气悬架互联状态控制智能体系统。首先建立横向互联空气悬架整车模型并通过试验验证其准确性,随后在传统BDI(belief-desire-intention)智能体的基础上,加入汤普森抽样算法,建立具有在线自学习能力的仿天棚互联状态控制智能体。该智能体从传感器信息采集模块感知环境状态,通过其内部的推理过程和学习行为进行自学习,输出适应不同环境状态的仿天棚互联状态控制策略的关键参数——滞回区间至互联状态控制模块。在混合工况下进行仿真,结果表明,该系统使车辆在行驶平顺性与操纵稳定性之间取得了平衡。; 关键词横向互联空气悬架智能体 BDI模型汤普森抽样; Keywords horizontal interconnection air suspension agent BDI model Thompson sampling; 分类号 U463.33 [机械工程—车辆工程]; 在线阅读下载PDF 职称材料

题名频谱感知次序的在线最优选择: 5; 作者周敏王少尉; 机构南京大学电子科学与工程学院; 出处《国防科技大学学报》 EI CAS CSCD 北大核心 2020年第4期24-29,共6页; 基金国家自然科学基金资助项目(61671233,61801208,61931023,U1936202)。; 文摘动态频谱接入是解决无线电频谱资源短缺和频谱使用效率低下问题的有效方法,它允许次级用户在授权频谱空闲时动态地接入,以进行数据传输。而频谱感知是实现动态频谱接入的关键挑战之一。由于次级用户的感知能力有限,为了获得更多的频谱接入机会,需要尽快找到频谱空闲概率最大的频段,并研究频谱感知次序问题。考虑到频谱空闲概率对次级用户是不可知的,并且会随时间变化,提出了在线学习框架,把频谱感知次序问题归纳成经典多摇臂赌博机问题,并利用在线学习方法——满意折现汤普森抽样算法处理优化问题。仿真结果表明,和其他算法相比,所提算法可以获得更多的频谱接入机会并且能够跟踪频谱空闲概率的变化。; 关键词动态频谱接入频谱感知在线学习满意折现汤普森抽样; Keywords dynamic spectrum access spectrum sensing online learning satisficing discounted Thompson sampling; 分类号 TN92 [电子电信—通信与信息系统]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	基于高斯过程与批量汤普森抽样的动态定价策略	毕文杰王荣	《计算机工程与应用》 CSCD 北大核心	2022	0	在线阅读下载PDF 职称材料
2	在线学习方法综述:汤普森抽样和其他方法	何斯迈金羽佳王华葛冬冬	《运筹学学报》 CSCD 北大核心	2017	6	在线阅读下载PDF 职称材料
3	基于智能体理论的空气悬架车身高度智能控制系统研究	江洪王鹏程李仲兴	《重庆理工大学学报（自然科学）》 CAS 北大核心	2019	3	在线阅读下载PDF 职称材料
4	基于智能体理论的横向互联空气悬架控制研究	李仲兴管晓星江洪	《汽车工程》 EI CSCD 北大核心	2019	4	在线阅读下载PDF 职称材料
5	频谱感知次序的在线最优选择	周敏王少尉	《国防科技大学学报》 EI CAS CSCD 北大核心	2020	0	在线阅读下载PDF 职称材料