期刊文献+
共找到22篇文章
< 1 2 >
每页显示 20 50 100
基于一般和随机对策论框架下的多智能体学习 被引量:1
1
作者 欧海涛 张卫东 许晓鸣 《自动化学报》 EI CSCD 北大核心 2002年第3期423-426,共4页
将 Q- learning从单智能体框架上扩展到非合作的多智能体框架上 ,建立了在一般和随机对策框架下的多智能体理论框架和学习算法 ,提出了以 Nash平衡点作为学习目标 .给出了对策结构的约束条件 ,并证明了在此约束条件下算法的收敛性 。
关键词 随机对策论 多智能体学习 学习算法 强化学习
在线阅读 下载PDF
平均场型的随机微分对策和路径依赖的Bellman-Isaacs主方程
2
作者 郝涛 《数学年刊(A辑)》 CSCD 北大核心 2024年第4期373-400,共28页
作者研究由路径依赖平均场随机微分方程驱动的零和随机微分对策.动力系统和价值泛函的系数均依赖于解的路径以及路径的分布.采用典则场景下的非预期策略对反馈控制的弱解框架,因此值函数定义在平方可积的概率测度空间上.通过调整测试函... 作者研究由路径依赖平均场随机微分方程驱动的零和随机微分对策.动力系统和价值泛函的系数均依赖于解的路径以及路径的分布.采用典则场景下的非预期策略对反馈控制的弱解框架,因此值函数定义在平方可积的概率测度空间上.通过调整测试函数空间使其具备必要的局部紧性,给出路径依赖Bellman-Isaacs主方程粘性解的内生性定义.证明值函数的正则性和动态规划原理,从而得到相关的Bellman-Isaacs主方程解的一种概率解释. 展开更多
关键词 随机微分对策 路径依赖的平均场随机微分方程 Bellman-Isaacs主方程 动态规划 粘性解
在线阅读 下载PDF
基于随机微分对策的纵向合作广告模型 被引量:23
3
作者 聂佳佳 熊中楷 《管理工程学报》 CSSCI 北大核心 2010年第3期136-143,131,共9页
本文利用随机微分对策理论研究了供应链中的纵向合作广告问题,建立了一个随机微分对策模型。运用汉密尔顿-雅可比-贝尔曼方程分别求得了Stackelberg博弈和合作博弈下均衡的全国性广告投入、地方性广告投入、制造商商誉的期望值、方差和... 本文利用随机微分对策理论研究了供应链中的纵向合作广告问题,建立了一个随机微分对策模型。运用汉密尔顿-雅可比-贝尔曼方程分别求得了Stackelberg博弈和合作博弈下均衡的全国性广告投入、地方性广告投入、制造商商誉的期望值、方差和商誉的概率分布函数以及Stackelberg博弈下均衡的广告分担比例,并对此两种博弈进行了比较。结果发现,合作博弈下制造商和零售商的广告投入分别高于Stackelberg博弈下的广告投入,而且在一定条件下,合作博弈下供应链的总利润高于Stackelberg博弈下的总利润。同时,合作博弈下制造商的商誉期望值高于Stackelberg博弈下的期望值,但其方差也高于Stackelberg博弈下商誉的方差。而且研究发现在一定条件下制造商具有一致渐进稳定的商誉概率分布函数。最后,运用效用理论对系统增量利润进行了划分。 展开更多
关键词 供应链 合作广告 随机微分对策 STACKELBERG博弈 合作博弈
在线阅读 下载PDF
重复n人随机合作对策的核心 被引量:3
4
作者 高作峰 鄂成国 +1 位作者 徐东方 王彩虹 《高校应用数学学报(A辑)》 CSCD 北大核心 2007年第1期1-8,共8页
以Su ijs等人(1995)引入的随机合作对策的模型为基础,建立了重复n人随机合作对策的理论,定义了重复n人随机合作对策的支付序列以及支付序列的优超关系,并由此给出了重复n人随机合作对策的核心、超可加性和凸性的定义,并讨论了该核心的... 以Su ijs等人(1995)引入的随机合作对策的模型为基础,建立了重复n人随机合作对策的理论,定义了重复n人随机合作对策的支付序列以及支付序列的优超关系,并由此给出了重复n人随机合作对策的核心、超可加性和凸性的定义,并讨论了该核心的一些特征和性质. 展开更多
关键词 随机对策 重复n人随机合作对策 核心 超可加性 凸性
在线阅读 下载PDF
离散时间二人随机微分对策问题信息模式的数学描述 被引量:4
5
作者 范红旗 王胜 付强 《电子学报》 EI CAS CSCD 北大核心 2010年第6期1355-1361,共7页
在离散时间二人随机微分对策问题研究中,信息模式概念尚缺乏统一而准确的描述.针对这一问题,首先将Witsenhausen关于信息模式的相关概念应用到该问题,从数学上严格定义了信息模式及其相关概念,然后对几种典型信息模式的性质及相应对策... 在离散时间二人随机微分对策问题研究中,信息模式概念尚缺乏统一而准确的描述.针对这一问题,首先将Witsenhausen关于信息模式的相关概念应用到该问题,从数学上严格定义了信息模式及其相关概念,然后对几种典型信息模式的性质及相应对策问题最优解的结构形式作出了严格的证明.相关概念与性质为离散时间二人随机微分对策问题的研究提供了重要的理论工具. 展开更多
关键词 随机微分对策 信息模式 状态估计 最优控制 控制律
在线阅读 下载PDF
凸随机合作对策的核心 被引量:3
6
作者 刘微 高作峰 +1 位作者 张晓玲 张海峰 《运筹与管理》 CSCD 2005年第5期59-62,共4页
本文将凸性扩展到随机合作对策中,从而得到凸随机合作对策具有超可加性与非空的核心,且凸随机合作对策的核心满足Minkowski和与Minkowski差。
关键词 随机合作对策 核心 Minkowski和 凸性 随机变量
在线阅读 下载PDF
一种随机微分对策的Nash平衡 被引量:1
7
作者 张卓奎 陈慧婵 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2000年第5期635-637,共3页
利用动态规划原理和值函数的概念 ,在It^o微分的意义下讨论了IHRS线性二次型随机控制问题的最优控制率 ,研究了具有参数的动态系统和具有参数的价值函数的IHRS线性二次型两人非零和随机微分对策 。
关键词 随机微分对策 随机控制 NASH平衡 动态规划
在线阅读 下载PDF
股价服从跳—扩过程证券组合的随机微分对策 被引量:1
8
作者 刘宣会 胡奇英 《工程数学学报》 CSCD 北大核心 2003年第2期65-71,共7页
在股价服从跳 扩过程时,同时考虑流通性这一因素水平,研究两人零和随机微分对策问题,在采用对数效用时分别获得了投资者的最优投资策略。
关键词 证券投资组合 跳跃-扩散过程 随机微分对策 效用函数 It'o过程
在线阅读 下载PDF
随机矩阵对策及其在舰艇作战方案中的应用 被引量:1
9
作者 王天虹 宋业新 《兵工自动化》 2010年第6期22-24,共3页
根据随机矩阵对策的最优策略和对策值的定义,讨论对策结果(最优策略和对策值)关于随机矩阵中各随机变量分布函数的稳定性,给出了具体的稳定性分析方法。并以舰艇作战方案为例,建立了随机双矩阵对策模型,研究结果对于双方资源分配,提高... 根据随机矩阵对策的最优策略和对策值的定义,讨论对策结果(最优策略和对策值)关于随机矩阵中各随机变量分布函数的稳定性,给出了具体的稳定性分析方法。并以舰艇作战方案为例,建立了随机双矩阵对策模型,研究结果对于双方资源分配,提高作战效能具有一定的军事应用价值。 展开更多
关键词 随机矩阵对策 分布函数 稳定性分析 舰艇作战方案
在线阅读 下载PDF
重复n人随机合作对策的强ε核心
10
作者 白红信 高作峰 +1 位作者 于泳波 王清 《统计与决策》 CSSCI 北大核心 2008年第12期30-32,共3页
文章以文献[1]引入的随机合作对策的核心及文献[5]中引入的重复人随机合作对策的核心为基础,定义了随机合作对策的强ε核心及重复n人随机合作对策的强ε核心,从理论上弥补了核心常常为空的缺陷,并给出了这两类强ε核心的一些特征和性质。
关键词 随机合作对策 重复人随机合作对策 核心 强核心
在线阅读 下载PDF
多目标的随机结盟对策的ZS-值
11
作者 张晓玲 高作峰 +1 位作者 刘微 姜宁 《运筹与管理》 CSCD 2006年第2期60-64,共5页
本文研究的是多目标随机结盟对策的问题,是将单目标的随机结盟对策的ZS-值拓展到多目标的随机结盟对策上,同时考虑了局中人对不同目标的偏好程度,从而,给出了多目标随机结盟对策的ZS-值的定义,并讨论了该值的性质及定理。
关键词 简单对策 截口对策 多目标的随机结盟对策 ZS-值
在线阅读 下载PDF
带有无界赔付函数的非零和随机对策折扣模型
12
作者 杨洁 郭先平 《中山大学学报(自然科学版)》 CAS CSCD 北大核心 2008年第5期23-27,36,共6页
讨论了赔付函数可能既无上界又无下界的离散时间可数状态非零和随机对策的折扣模型。在零和随机对策中常用的"漂移"和"连续-紧"性条件下,用Fan's不动点定理证明了Nash平衡点的存在性。
关键词 非零和随机对策 期望折扣赔付准则 NASH平衡点 可数状态空间
在线阅读 下载PDF
随机合作对策的核仁 被引量:2
13
作者 许敏 王清 +1 位作者 白红信 李英华 《科学技术与工程》 2008年第23期6196-6198,共3页
以随机合作对策的概念为基础,将合作对策的核仁推广,建立了随机合作对策的核仁概念,并讨论了随机合作对策的核仁的一些特征和性质。
关键词 随机合作对策 核心 字典序 核仁
在线阅读 下载PDF
凸随机合作对策的弱核心与弱稳定集
14
作者 宋莎莎 高作峰 +2 位作者 郭菊花 杨纱纱 王杰 《辽宁工程技术大学学报(自然科学版)》 CAS 北大核心 2013年第3期405-408,共4页
针对局中人在不确定支付条件下如何分配联盟赢得的问题.运用凸随机特征函数将凸随机对策的核心和稳定集加以推广,在分配弱优超基础上建立凸随机合作对策的弱核心与弱稳定集的概念,进一步研究它们之间的性质及关系.提出一种联盟收益分配... 针对局中人在不确定支付条件下如何分配联盟赢得的问题.运用凸随机特征函数将凸随机对策的核心和稳定集加以推广,在分配弱优超基础上建立凸随机合作对策的弱核心与弱稳定集的概念,进一步研究它们之间的性质及关系.提出一种联盟收益分配即弱核心,采用偏好关系具体化的方法证明了弱核心的存在性及唯一性,从而扩展了凸随机合作对策解的研究. 展开更多
关键词 不确定性 联盟 随机合作对策 核心 弱优超 弱核心 弱稳定集 偏好关系具体化
在线阅读 下载PDF
风险的动态度量和一个相关的随机对策问题(英文)
15
作者 嵇少林 《应用数学》 CSCD 北大核心 2001年第3期132-137,共6页
本文讨论不完全市场中股票收益率不确定时的动态风险度量问题和一个相关的随机对策问题 .该动态风险度量可表示为一个随机最优控制问题的值函数 .以倒向随机微分方程为工具我们给出了最优目标具有的形式 。
关键词 倒向随机微分方程 随机控制 动态风险度量 不完全市场 股票收益率 随机对策问题 鞍点
在线阅读 下载PDF
零售商竞争下纵向合作广告的微分对策模型 被引量:52
16
作者 熊中楷 聂佳佳 熊榆 《管理科学学报》 CSSCI 北大核心 2010年第6期11-22,32,共13页
利用随机微分对策理论研究了供应链中零售商竞争下的纵向合作广告问题,建立了一个随机微分对策模型.运用汉密尔顿-雅可比-贝尔曼方程分别求得了Stackelberg博弈和合作博弈下均衡的全国性广告投入、地方性广告投入、制造商商誉的期望值... 利用随机微分对策理论研究了供应链中零售商竞争下的纵向合作广告问题,建立了一个随机微分对策模型.运用汉密尔顿-雅可比-贝尔曼方程分别求得了Stackelberg博弈和合作博弈下均衡的全国性广告投入、地方性广告投入、制造商商誉的期望值和方差、商誉的概率分布函数以及Stackelberg博弈下的广告分担比例,并对此两种博弈进行了比较.研究发现,两种博弈下的零售商的地方性广告投入和制造商的商誉与零售商之间的广告竞争强度相关;在一定条件下,制造商具有一致渐进稳定的商誉概率分布函数.最后,运用效用理论对合作博弈下的增量利润进行了划分. 展开更多
关键词 供应链 合作广告 广告竞争 随机微分对策 Stackelberg博弈 合作博弈 汉密尔顿-雅可比-贝尔曼
在线阅读 下载PDF
微分对策研究进展
17
作者 刘三阳 张卓奎 《工程数学学报》 CSCD 北大核心 2000年第B05期41-46,82,共7页
本文对微分对策研究进展作了简要综述 ,介绍了若干研究结果 。
关键词 微分对策 随机微分对策 二人零和微分对策
在线阅读 下载PDF
半马尔可夫对策
18
作者 张道智 《应用数学》 CSCD 北大核心 1990年第3期80-87,共8页
本文考虑半马尔可夫随机对策.在一定条件下,我们证明随机对策有值函数,两个局中人相对于折扣报酬都有最优策略.
关键词 半马氏对策 随机对策 折扣 报酬
在线阅读 下载PDF
流域污染治理中政企合谋现象研究 被引量:13
19
作者 蒋丹璐 曹国华 《系统工程学报》 CSCD 北大核心 2015年第5期584-593,共10页
用随机微分对策方法研究流域生态补偿机制作用下地方政府减排政策的制定问题.通过分析上游地方政府和企业间的Stackelberg博弈和合作博弈的纳什均衡,发现政企合谋现象是一种纳什均衡.由于政企合谋现象会严重影响地方污染治理工作效率,... 用随机微分对策方法研究流域生态补偿机制作用下地方政府减排政策的制定问题.通过分析上游地方政府和企业间的Stackelberg博弈和合作博弈的纳什均衡,发现政企合谋现象是一种纳什均衡.由于政企合谋现象会严重影响地方污染治理工作效率,分析了地方政府具有选择政企合谋策略的内在动因是信息不对称和利益差别,最后,提出了避免政企合谋的政策建议. 展开更多
关键词 随机微分对策 STACKELBERG博弈 合作博弈 政企合谋 流域生态补偿
在线阅读 下载PDF
LINEAR QUADRATIC NONZERO-SUM DIFFERENTIAL GAMES WITH RANDOM JUMPS 被引量:3
20
作者 吴臻 于志勇 《应用数学和力学》 CSCD 北大核心 2005年第8期945-950,共6页
The existence and uniqueness of the solutions for one kind of forward-backward stochastic differential equations with Brownian motion and Poisson process as the noise source were given under the monotone conditions.Th... The existence and uniqueness of the solutions for one kind of forward-backward stochastic differential equations with Brownian motion and Poisson process as the noise source were given under the monotone conditions.Then these results were applied to nonzero-sum differential games with random jumps to get the explicit form of the open-loop Nash equilibrium point by the solution of the forward-backward stochastic differential equations. 展开更多
关键词 随机微分方程 泊松过程 随机微分对策
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部