期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
5
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于高斯过程与批量汤普森抽样的动态定价策略
1
作者
毕文杰
王荣
《计算机工程与应用》
CSCD
北大核心
2022年第16期303-311,共9页
考虑短期内需求不确定情况下同类型产品的定价策略研究,引入高斯过程进行需求函数的学习,利用批量汤普森算法建立基于探索-利用的两阶段学习和决策过程的定价模型。在利用提出的GP-PTS(Gaussian process-parallel Thompson sampling)算...
考虑短期内需求不确定情况下同类型产品的定价策略研究,引入高斯过程进行需求函数的学习,利用批量汤普森算法建立基于探索-利用的两阶段学习和决策过程的定价模型。在利用提出的GP-PTS(Gaussian process-parallel Thompson sampling)算法完成数值实验和某平台出行的真实数据应用后得出的结果表明:算法的精准度取决于特征是否完备,若给定一个先验且产品特征完备时,基于GP-PTS算法模拟出来的价格会取得比目前平台价格策略更好的收益,为企业在短期内进行定价决策提供良好借鉴。
展开更多
关键词
动态定价
高斯过程
汤普森抽样
批量贝叶斯优化
在线阅读
下载PDF
职称材料
在线学习方法综述:汤普森抽样和其他方法
被引量:
6
2
作者
何斯迈
金羽佳
+1 位作者
王华
葛冬冬
《运筹学学报》
CSCD
北大核心
2017年第4期84-102,共19页
本文尝试对在线学习领域的最新研究成果、相关主要理论和算法进行综述.在线学习的内容非常广博,本文希望能够为读者介绍其中一些基本的算法和想法,从最经典的理论模型和算法设计开始,对在线学习的发展情况作一个一般性的介绍.首先,以经...
本文尝试对在线学习领域的最新研究成果、相关主要理论和算法进行综述.在线学习的内容非常广博,本文希望能够为读者介绍其中一些基本的算法和想法,从最经典的理论模型和算法设计开始,对在线学习的发展情况作一个一般性的介绍.首先,以经典的在线优化模型——多摇臂赌博机问题为例,引入了汤普森抽样算法和信心上界算法,分析、展示了它们的基本思路和最新成果,并进一步讨论了汤普森抽样算法在更复杂的在线学习问题中的变式和应用.本文同时对在线凸优化算法做了初步探讨,它也是解决多摇臂赌博机问题和其他许多在线学习的应用问题时一种强有力的工具.
展开更多
关键词
在线学习
多摇臂赌博机
汤普森抽样
信心上界算法
情境多摇臂赌博机
在线凸优化
在线阅读
下载PDF
职称材料
基于智能体理论的空气悬架车身高度智能控制系统研究
被引量:
3
3
作者
江洪
王鹏程
李仲兴
《重庆理工大学学报(自然科学)》
CAS
北大核心
2019年第4期17-25,共9页
为了进一步发挥空气悬架车身高度调节系统的性能,在Belief-Desire-Intention(BDI)框架下构建了目标车身高度控制智能体,并采用汤普森抽样算法构建智能体学习行为。结合车身高度调节系统模型,建立空气悬架车身高度智能控制系统。单一工...
为了进一步发挥空气悬架车身高度调节系统的性能,在Belief-Desire-Intention(BDI)框架下构建了目标车身高度控制智能体,并采用汤普森抽样算法构建智能体学习行为。结合车身高度调节系统模型,建立空气悬架车身高度智能控制系统。单一工况下的仿真结果验证了智能体学习行为的可行性以及学习结果的适用性;混合工况下的仿真结果验证了空气悬架车身高度智能控制系统的可行性和有效性。结果表明:在车身高度智能控制系统的控制下,簧上质量质心位置处的加权加速度均方根值上升了0. 45%,侧倾因子降低了22. 82%,在不恶化行驶平顺性的同时,提高了操纵稳定性。
展开更多
关键词
空气悬架
车身高度
智能体理论
强化学习
汤普森抽样
在线阅读
下载PDF
职称材料
基于智能体理论的横向互联空气悬架控制研究
被引量:
4
4
作者
李仲兴
管晓星
江洪
《汽车工程》
EI
CSCD
北大核心
2019年第8期896-904,共9页
为缓解横向互联空气悬架车辆行驶平顺性与操纵稳定性之间的矛盾,基于智能体理论构建横向互联空气悬架互联状态控制智能体系统。首先建立横向互联空气悬架整车模型并通过试验验证其准确性,随后在传统BDI(belief-desire-intention)智能体...
为缓解横向互联空气悬架车辆行驶平顺性与操纵稳定性之间的矛盾,基于智能体理论构建横向互联空气悬架互联状态控制智能体系统。首先建立横向互联空气悬架整车模型并通过试验验证其准确性,随后在传统BDI(belief-desire-intention)智能体的基础上,加入汤普森抽样算法,建立具有在线自学习能力的仿天棚互联状态控制智能体。该智能体从传感器信息采集模块感知环境状态,通过其内部的推理过程和学习行为进行自学习,输出适应不同环境状态的仿天棚互联状态控制策略的关键参数——滞回区间至互联状态控制模块。在混合工况下进行仿真,结果表明,该系统使车辆在行驶平顺性与操纵稳定性之间取得了平衡。
展开更多
关键词
横向互联
空气悬架
智能体
BDI模型
汤普森抽样
在线阅读
下载PDF
职称材料
频谱感知次序的在线最优选择
5
作者
周敏
王少尉
《国防科技大学学报》
EI
CAS
CSCD
北大核心
2020年第4期24-29,共6页
动态频谱接入是解决无线电频谱资源短缺和频谱使用效率低下问题的有效方法,它允许次级用户在授权频谱空闲时动态地接入,以进行数据传输。而频谱感知是实现动态频谱接入的关键挑战之一。由于次级用户的感知能力有限,为了获得更多的频谱...
动态频谱接入是解决无线电频谱资源短缺和频谱使用效率低下问题的有效方法,它允许次级用户在授权频谱空闲时动态地接入,以进行数据传输。而频谱感知是实现动态频谱接入的关键挑战之一。由于次级用户的感知能力有限,为了获得更多的频谱接入机会,需要尽快找到频谱空闲概率最大的频段,并研究频谱感知次序问题。考虑到频谱空闲概率对次级用户是不可知的,并且会随时间变化,提出了在线学习框架,把频谱感知次序问题归纳成经典多摇臂赌博机问题,并利用在线学习方法——满意折现汤普森抽样算法处理优化问题。仿真结果表明,和其他算法相比,所提算法可以获得更多的频谱接入机会并且能够跟踪频谱空闲概率的变化。
展开更多
关键词
动态频谱接入
频谱感知
在线学习
满意折现
汤普森抽样
在线阅读
下载PDF
职称材料
题名
基于高斯过程与批量汤普森抽样的动态定价策略
1
作者
毕文杰
王荣
机构
中南大学商学院
出处
《计算机工程与应用》
CSCD
北大核心
2022年第16期303-311,共9页
基金
国家自然科学基金重大研究计划(91646115)。
文摘
考虑短期内需求不确定情况下同类型产品的定价策略研究,引入高斯过程进行需求函数的学习,利用批量汤普森算法建立基于探索-利用的两阶段学习和决策过程的定价模型。在利用提出的GP-PTS(Gaussian process-parallel Thompson sampling)算法完成数值实验和某平台出行的真实数据应用后得出的结果表明:算法的精准度取决于特征是否完备,若给定一个先验且产品特征完备时,基于GP-PTS算法模拟出来的价格会取得比目前平台价格策略更好的收益,为企业在短期内进行定价决策提供良好借鉴。
关键词
动态定价
高斯过程
汤普森抽样
批量贝叶斯优化
Keywords
dynamic pricing
Gaussian process
Thompson sampling
parallel Bayesian optimization
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
在线学习方法综述:汤普森抽样和其他方法
被引量:
6
2
作者
何斯迈
金羽佳
王华
葛冬冬
机构
上海财经大学信息管理与工程学院
复旦大学数学科学学院
上海财经大学交叉科学研究院
出处
《运筹学学报》
CSCD
北大核心
2017年第4期84-102,共19页
基金
国家自然科学基金(No.11471205)
上海高校特聘教授(东方学者)岗位计划(No.15140002)
+1 种基金
上海财经大学创新团队支持计划(Nos.2014110354
2016110392)
文摘
本文尝试对在线学习领域的最新研究成果、相关主要理论和算法进行综述.在线学习的内容非常广博,本文希望能够为读者介绍其中一些基本的算法和想法,从最经典的理论模型和算法设计开始,对在线学习的发展情况作一个一般性的介绍.首先,以经典的在线优化模型——多摇臂赌博机问题为例,引入了汤普森抽样算法和信心上界算法,分析、展示了它们的基本思路和最新成果,并进一步讨论了汤普森抽样算法在更复杂的在线学习问题中的变式和应用.本文同时对在线凸优化算法做了初步探讨,它也是解决多摇臂赌博机问题和其他许多在线学习的应用问题时一种强有力的工具.
关键词
在线学习
多摇臂赌博机
汤普森抽样
信心上界算法
情境多摇臂赌博机
在线凸优化
Keywords
online learning, multi-armed bandit, Thompson sampling, upper confi-dence bound, contextual multi-armed bandit, online convex optimization
分类号
O212.2 [理学—概率论与数理统计]
在线阅读
下载PDF
职称材料
题名
基于智能体理论的空气悬架车身高度智能控制系统研究
被引量:
3
3
作者
江洪
王鹏程
李仲兴
机构
江苏大学机械工程学院
江苏大学汽车与交通工程学院
出处
《重庆理工大学学报(自然科学)》
CAS
北大核心
2019年第4期17-25,共9页
基金
国家自然科学基金资助项目(51575241)
文摘
为了进一步发挥空气悬架车身高度调节系统的性能,在Belief-Desire-Intention(BDI)框架下构建了目标车身高度控制智能体,并采用汤普森抽样算法构建智能体学习行为。结合车身高度调节系统模型,建立空气悬架车身高度智能控制系统。单一工况下的仿真结果验证了智能体学习行为的可行性以及学习结果的适用性;混合工况下的仿真结果验证了空气悬架车身高度智能控制系统的可行性和有效性。结果表明:在车身高度智能控制系统的控制下,簧上质量质心位置处的加权加速度均方根值上升了0. 45%,侧倾因子降低了22. 82%,在不恶化行驶平顺性的同时,提高了操纵稳定性。
关键词
空气悬架
车身高度
智能体理论
强化学习
汤普森抽样
Keywords
air suspension
vehicle height
agent theory
reinforcement learning
Thompson sampling algorithm
分类号
TP272 [自动化与计算机技术—检测技术与自动化装置]
U463 [机械工程—车辆工程]
在线阅读
下载PDF
职称材料
题名
基于智能体理论的横向互联空气悬架控制研究
被引量:
4
4
作者
李仲兴
管晓星
江洪
机构
江苏大学汽车与交通工程学院
江苏大学机械工程学院
出处
《汽车工程》
EI
CSCD
北大核心
2019年第8期896-904,共9页
基金
国家自然科学基金(51575241)资助
文摘
为缓解横向互联空气悬架车辆行驶平顺性与操纵稳定性之间的矛盾,基于智能体理论构建横向互联空气悬架互联状态控制智能体系统。首先建立横向互联空气悬架整车模型并通过试验验证其准确性,随后在传统BDI(belief-desire-intention)智能体的基础上,加入汤普森抽样算法,建立具有在线自学习能力的仿天棚互联状态控制智能体。该智能体从传感器信息采集模块感知环境状态,通过其内部的推理过程和学习行为进行自学习,输出适应不同环境状态的仿天棚互联状态控制策略的关键参数——滞回区间至互联状态控制模块。在混合工况下进行仿真,结果表明,该系统使车辆在行驶平顺性与操纵稳定性之间取得了平衡。
关键词
横向互联
空气悬架
智能体
BDI模型
汤普森抽样
Keywords
horizontal interconnection
air suspension
agent
BDI model
Thompson sampling
分类号
U463.33 [机械工程—车辆工程]
在线阅读
下载PDF
职称材料
题名
频谱感知次序的在线最优选择
5
作者
周敏
王少尉
机构
南京大学电子科学与工程学院
出处
《国防科技大学学报》
EI
CAS
CSCD
北大核心
2020年第4期24-29,共6页
基金
国家自然科学基金资助项目(61671233,61801208,61931023,U1936202)。
文摘
动态频谱接入是解决无线电频谱资源短缺和频谱使用效率低下问题的有效方法,它允许次级用户在授权频谱空闲时动态地接入,以进行数据传输。而频谱感知是实现动态频谱接入的关键挑战之一。由于次级用户的感知能力有限,为了获得更多的频谱接入机会,需要尽快找到频谱空闲概率最大的频段,并研究频谱感知次序问题。考虑到频谱空闲概率对次级用户是不可知的,并且会随时间变化,提出了在线学习框架,把频谱感知次序问题归纳成经典多摇臂赌博机问题,并利用在线学习方法——满意折现汤普森抽样算法处理优化问题。仿真结果表明,和其他算法相比,所提算法可以获得更多的频谱接入机会并且能够跟踪频谱空闲概率的变化。
关键词
动态频谱接入
频谱感知
在线学习
满意折现
汤普森抽样
Keywords
dynamic spectrum access
spectrum sensing
online learning
satisficing discounted Thompson sampling
分类号
TN92 [电子电信—通信与信息系统]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于高斯过程与批量汤普森抽样的动态定价策略
毕文杰
王荣
《计算机工程与应用》
CSCD
北大核心
2022
0
在线阅读
下载PDF
职称材料
2
在线学习方法综述:汤普森抽样和其他方法
何斯迈
金羽佳
王华
葛冬冬
《运筹学学报》
CSCD
北大核心
2017
6
在线阅读
下载PDF
职称材料
3
基于智能体理论的空气悬架车身高度智能控制系统研究
江洪
王鹏程
李仲兴
《重庆理工大学学报(自然科学)》
CAS
北大核心
2019
3
在线阅读
下载PDF
职称材料
4
基于智能体理论的横向互联空气悬架控制研究
李仲兴
管晓星
江洪
《汽车工程》
EI
CSCD
北大核心
2019
4
在线阅读
下载PDF
职称材料
5
频谱感知次序的在线最优选择
周敏
王少尉
《国防科技大学学报》
EI
CAS
CSCD
北大核心
2020
0
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部