期刊文献+
共找到25篇文章
< 1 2 >
每页显示 20 50 100
一种基于不完美信息博弈的多冲突域信道分配算法 被引量:2
1
作者 戴昊峰 何世彪 +2 位作者 谭冕 郑鹏宇 张晖 《电信科学》 北大核心 2014年第5期112-119,共8页
无线网络中信道分配的好坏将极大地影响网络整体性能,为了解决和优化此问题,提出了一种基于不完美信息博弈的信道分配算法。假设网络场景为多跳Ad Hoc网络,因此对其采用多冲突域建模更符合实际。算法通过不断循环改变各用户无线电的信... 无线网络中信道分配的好坏将极大地影响网络整体性能,为了解决和优化此问题,提出了一种基于不完美信息博弈的信道分配算法。假设网络场景为多跳Ad Hoc网络,因此对其采用多冲突域建模更符合实际。算法通过不断循环改变各用户无线电的信道试图接近纳什均衡点,仿真结果表明算法能够使信道分配策略接近纳什均衡信道分配,同时相比单冲突域情况在多冲突域中更能最大化信道使用率。 展开更多
关键词 无线AD HOC网络 信道分配 多冲突域 不完美信息博弈
在线阅读 下载PDF
药品市场中商业贿赂的经济学分析:一个不完美信息的博弈模型 被引量:3
2
作者 邹薇 赖玥 《武汉大学学报(哲学社会科学版)》 CSSCI 北大核心 2010年第5期761-769,共9页
我国药品和医疗市场的信息不对称和其他制度性特征,是该市场出现商业贿赂和药品价格虚高的重要原因。通过构造一个不完美信息的动态博弈模型,当药品市场存在医院的"双重垄断"以及销售商与医院之间的信息不对称时,患者自我保... 我国药品和医疗市场的信息不对称和其他制度性特征,是该市场出现商业贿赂和药品价格虚高的重要原因。通过构造一个不完美信息的动态博弈模型,当药品市场存在医院的"双重垄断"以及销售商与医院之间的信息不对称时,患者自我保护意识和知识水平的提高有助于降低市场上的均衡贿赂值。 展开更多
关键词 药品市场 商业贿赂 不完美信息 博弈
在线阅读 下载PDF
不完美信息条件下农村合作组织建设的博弈分析
3
作者 马成林 《商业时代》 北大核心 2010年第34期109-110,共2页
在不完美信息条件下,农民对建立农村合作组织抱有戒心和误解。他们担心加入合作组织后会失去收益的保障,甚至担心合作组织这种制度会剥夺他们的一些权利,这是农民在现有资源约束条件下和抗风险能力条件下的一种理性选择。因此,针对不完... 在不完美信息条件下,农民对建立农村合作组织抱有戒心和误解。他们担心加入合作组织后会失去收益的保障,甚至担心合作组织这种制度会剥夺他们的一些权利,这是农民在现有资源约束条件下和抗风险能力条件下的一种理性选择。因此,针对不完美信息条件下的农村合作组织建设存在的博弈问题,笔者尝试提出了相应的对策。 展开更多
关键词 农村合作组织 博弈 不完美信息
在线阅读 下载PDF
不完美信息扩展式博弈中在线虚拟遗憾最小化 被引量:9
4
作者 胡裕靖 高阳 安波 《计算机研究与发展》 EI CSCD 北大核心 2014年第10期2160-2170,共11页
研究在不完美信息扩展式博弈中对次优对手弱点的利用.针对该领域中一种常用方法——对手建模方法——的不足,提出了从遗憾最小化的角度来利用次优对手弱点的思想,并基于一种离线的均衡计算方法——虚拟遗憾最小化方法——将其扩展到在... 研究在不完美信息扩展式博弈中对次优对手弱点的利用.针对该领域中一种常用方法——对手建模方法——的不足,提出了从遗憾最小化的角度来利用次优对手弱点的思想,并基于一种离线的均衡计算方法——虚拟遗憾最小化方法——将其扩展到在线博弈的场景中,实现对次优对手弱点的利用.提出了从博弈结果中估计各个信息集的虚拟价值的方法,给出2种估计手段:静态估计法和动态估计法.静态估计法直接从博弈结果的分布中进行估计,并对每个结果给以相等的估计权重;而动态估计法则对新产生的博弈结果给以较高的估计权重,以便快速地适应对手的策略变化.基于2种估计方法,提出在线博弈中虚拟遗憾最小化的算法,并在基于单牌扑克的实验中,与4种在线学习算法(DBBR,MCCFR-os,Q-learning,Sarsa)进行了对比.实验结果显示所提出的算法不仅对较弱对手的利用效果最好,还能在与4种对比算法的比赛中取得最高的胜率. 展开更多
关键词 扩展式博弈 不完美信息 遗憾最小化 虚拟遗憾最小化 静态估计法 动态估计法
在线阅读 下载PDF
不完美信息博弈中对手模型的研究 被引量:2
5
作者 吴天栋 石英 《河南科技大学学报(自然科学版)》 CAS 北大核心 2019年第1期54-59,109,共7页
针对传统的显式建模方法依赖大量数据样本的问题,提出了策略自扩展算法,通过样本数据的自扩展来提高建模效率。同时,为了提高对手模型的准确度,结合隐式建模和隐式子策略建模的方法,提出了子策略发现算法。以勒杜克(Leduc)扑克博弈为实... 针对传统的显式建模方法依赖大量数据样本的问题,提出了策略自扩展算法,通过样本数据的自扩展来提高建模效率。同时,为了提高对手模型的准确度,结合隐式建模和隐式子策略建模的方法,提出了子策略发现算法。以勒杜克(Leduc)扑克博弈为实验对象,对比研究了2种传统方法和本文提出的2种算法。实验结果表明:策略自扩展算法提高了显式建模的效率和模型准确性。在利用对手弱点获取收益方面,策略自扩展算法比显式建模方法提升了84. 4%,子策略发现算法比隐式建模方法提升了128. 6%。 展开更多
关键词 不完美信息博弈 对手模型 策略自扩展 隐式建模
在线阅读 下载PDF
广义不完美信息概念下的战略决策问题探讨
6
作者 冯跃 王皓 《现代经济探讨》 2000年第2期38-40,共3页
关键词 广义不完美信息 企业 战略决策
在线阅读 下载PDF
基于不完美先验信息的随机系数回归模型剩余寿命预测方法 被引量:10
7
作者 万昌豪 刘志国 +2 位作者 唐圣金 孙晓艳 司小胜 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2021年第12期2542-2551,共10页
剩余寿命预测是设备预测与健康管理的核心问题,准确的剩余寿命预测可以在故障发生前进行有效的维护保养,以减小设备故障发生的概率。针对实际剩余寿命预测中先验信息不足或缺乏的问题,提出一种克服不完美先验信息影响的启发式剩余寿命... 剩余寿命预测是设备预测与健康管理的核心问题,准确的剩余寿命预测可以在故障发生前进行有效的维护保养,以减小设备故障发生的概率。针对实际剩余寿命预测中先验信息不足或缺乏的问题,提出一种克服不完美先验信息影响的启发式剩余寿命预测方法。首先,利用非线性随机系数回归模型进行退化建模。其次,证明了基于单个设备现场退化数据,期望最大化(EM)算法的参数估计结果收敛于极大似然估计(MLE)算法的参数估计结果,并提出一种合理融合先验信息和现场信息的启发式剩余寿命预测方法。最后,通过数值仿真数据和实际锂电池退化数据对提出的结论和方法进行了验证,结果表明:启发式剩余寿命预测方法相比传统贝叶斯方法能够较好地克服不完美先验信息的影响,更为准确的预测设备地实际剩余寿命。 展开更多
关键词 不完美先验信息 参数估计 期望最大化(EM) 启发式方法 非线性随机系数回归模型 剩余寿命预测
在线阅读 下载PDF
预测信息披露制度的有效性及其选择:基于博弈的视角 被引量:7
8
作者 谢仍明 唐跃军 《南开经济研究》 CSSCI 北大核心 2013年第4期42-58,共17页
预测信息所起的作用要远远大于历史信息,而对预测信息实行强制性披露还是自愿性披露决定着企业管理层的披露行为,从而决定了投资者所获预测信息的数量和质量,最终将影响证券市场的效率。本文在对博弈报酬进行严格论证的基础上,分别建立... 预测信息所起的作用要远远大于历史信息,而对预测信息实行强制性披露还是自愿性披露决定着企业管理层的披露行为,从而决定了投资者所获预测信息的数量和质量,最终将影响证券市场的效率。本文在对博弈报酬进行严格论证的基础上,分别建立并求解了强制性预测信息披露制度和自愿性预测信息披露制度下的不完美信息博弈模型,计算并比较了两种信息披露制度下的弱完美贝叶斯纳什均衡所对应的社会福利值,从而找出了较为有效的信息披露制度。研究结果表明,强制性预测信息披露制度能打破由信息不对称所导致的恶性循环,并能对管理者构成有效的威慑。因此,强制性预测信息披露制度比自愿性预测信息披露制度更能增进社会福利,因而更为可取。 展开更多
关键词 预测信息披露 不完美信息博弈 完美贝叶斯纳什均衡 社会福利
在线阅读 下载PDF
从信息不对称条件下的房地产市场博弈看政府的调控决策 被引量:2
9
作者 刘红军 贾玉福 陈峰云 《统计与决策》 CSSCI 北大核心 2008年第24期52-53,共2页
房地产市场的发展是一个动态变化的过程,国家政策的调控也随市场的变化而变化,文章针对房地产市场中的交易主体——开发商与购房者之间的博弈建立完全但不完美信息动态博弈模型,分析影响房地产市场健康发展的主要因素,洞悉房地产市场发... 房地产市场的发展是一个动态变化的过程,国家政策的调控也随市场的变化而变化,文章针对房地产市场中的交易主体——开发商与购房者之间的博弈建立完全但不完美信息动态博弈模型,分析影响房地产市场健康发展的主要因素,洞悉房地产市场发展的当前状态,从政府发挥调控职能的角度提出了对房地产市场健康发展的调控决策的一些建议。 展开更多
关键词 信息不对称 不完美信息动态博弈 贝叶斯均衡 调控决策
在线阅读 下载PDF
基于不完美CSI的异构NOMA网络能效优化算法 被引量:9
10
作者 徐勇军 谢豪 +2 位作者 陈前斌 林金朝 刘期烈 《通信学报》 EI CSCD 北大核心 2020年第7期131-140,共10页
为了提高异构网络的能量效率和参数摄动抑制能力,减小跨层干扰,提出了一种基于能量效率最大的异构非正交多址接入网络稳健资源分配算法。首先,考虑宏用户干扰功率约束、小蜂窝基站功率约束、资源块分配约束及小蜂窝用户服务质量约束,将... 为了提高异构网络的能量效率和参数摄动抑制能力,减小跨层干扰,提出了一种基于能量效率最大的异构非正交多址接入网络稳健资源分配算法。首先,考虑宏用户干扰功率约束、小蜂窝基站功率约束、资源块分配约束及小蜂窝用户服务质量约束,将资源优化问题建模为混合整数非线性分式规划问题。其次,考虑椭球有界信道不确定模型,利用凸松弛法、Dinkelbach法和连续凸近似法,将原问题转化为等价的凸优化形式,并利用拉格朗日对偶方法获得解析解。仿真结果表明,与完美CSI算法相比,所提算法具有较好的能效和稳健性。 展开更多
关键词 不完美信道状态信息 异构网络 非正交多址接入 稳健资源分配 能效最大化
在线阅读 下载PDF
基于不完美CSI的水声自适应功率分配算法 被引量:1
11
作者 金志刚 尹欢 苏毅珊 《系统工程与电子技术》 EI CSCD 北大核心 2023年第9期2941-2948,共8页
水声信道面临带宽资源有限、环境复杂的问题,为提高水下通信速率,基于水声传感器网络的海洋应用提出自适应通信的需求。传统基于简单信噪比指标的自适应资源分配算法无法准确表述衰落信道的统计特征,利用强化学习和卷积神经网络预测信... 水声信道面临带宽资源有限、环境复杂的问题,为提高水下通信速率,基于水声传感器网络的海洋应用提出自适应通信的需求。传统基于简单信噪比指标的自适应资源分配算法无法准确表述衰落信道的统计特征,利用强化学习和卷积神经网络预测信道的方法虽然可以提高一定信道状态信息(channel state information,CSI)的准确性,但这种方法需要长期的观测和大量的训练样本,不符合水声环境的实际情况。对比,构建了一种中继放大转发协作正交频分复用(orthogonal frequency division multiplexing,OFDM)通信的模型,解决了由于节点漂浮导致直接通信传输效率变低的问题,并提出一种在时延反馈CSI中基于OFDM的自适应功率比特分配算法,利用条件概率表征不完美的CSI,调整自适应通信参数,进行遍历容量最大化建模。仿真结果表明,该算法实现功率和比特的联合自适应分配,平均传输速率指标优于直接反馈CSI的功率分配算法,虽然略低于采用马尔可夫链预测信道的方法,但结合算法复杂度来看,所提算法更简单,更适合能量有限的水声传感器网络。 展开更多
关键词 水声传感器网络 中继协作正交频分复用通信系统 不完美信道状态信息 自适应功率比特分配
在线阅读 下载PDF
一种大众麻将计算机博弈的快速出牌方法 被引量:1
12
作者 张小川 严明珠 +2 位作者 涂飞 陈俊宇 魏乐天 《重庆理工大学学报(自然科学)》 CAS 北大核心 2024年第5期102-107,共6页
麻将是一种典型的不完美信息博弈的项目,目前对于麻将问题的解决方法大多朝着深度强化学习方向进行研究,也取得了非常好的效果。但是,此类麻将AI都是建立在有高质量数据集基础上的,而大众麻将缺少关键的大量有效标注的数据集,因此,如何... 麻将是一种典型的不完美信息博弈的项目,目前对于麻将问题的解决方法大多朝着深度强化学习方向进行研究,也取得了非常好的效果。但是,此类麻将AI都是建立在有高质量数据集基础上的,而大众麻将缺少关键的大量有效标注的数据集,因此,如何在对弈中快速出牌就成为主要问题。针对以上问题,对出牌动作进行研究,以启发式快速出牌为思路,提出了面向敌方胡牌牌张的蒙特卡洛评估法,将启发式快速出牌方法和蒙特卡洛评估法相结合,对每张手牌进行估值计算,通过估值分数决定每轮出牌牌张。以历史出牌次数为分界点,以此分界将博弈过程时序化为前后2个决策时段,前段采用启发式快速出牌方法,后段采用蒙特卡洛评估法。通过前后时段法分层递进决策处理过程,给出最佳出牌着法,能有效减少出牌的决策时间并降低点炮率。采用所提方法的程序在中国计算机博弈锦标赛中获得了一等奖,证明了该方法的有效性。 展开更多
关键词 计算机博弈 不完美信息博弈 麻将 启发式快速出牌 蒙特卡洛评估法
在线阅读 下载PDF
智能反射面辅助的多入单出共生无线电鲁棒安全资源分配算法 被引量:1
13
作者 吴翠先 周春宇 +1 位作者 徐勇军 陈前斌 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第4期1203-1211,共9页
针对信道不确定性影响、无线信息泄露和障碍物阻挡导致通信质量下降等问题,该文提出一种基于智能反射面(RIS)辅助的多输入单输出(MISO)共生无线电(SR)鲁棒安全资源分配算法。考虑主用户的安全速率约束、次用户的最小速率约束、RIS最小... 针对信道不确定性影响、无线信息泄露和障碍物阻挡导致通信质量下降等问题,该文提出一种基于智能反射面(RIS)辅助的多输入单输出(MISO)共生无线电(SR)鲁棒安全资源分配算法。考虑主用户的安全速率约束、次用户的最小速率约束、RIS最小能量收集约束,基于有界信道不确定性,建立了一个联合主被动波束赋形优化的资源分配问题。利用半正定松弛、S-procedure和变量替换法将含参数摄动的非凸问题转化为确定性的凸优化问题,并提出一种基于半正定松弛的鲁棒资源分配算法。仿真结果表明,与现有算法相比,该文算法具有较好的收敛性和鲁棒性。 展开更多
关键词 共生无线电 不完美信道状态信息 智能反射面 物理层安全
在线阅读 下载PDF
可重构智能表面辅助多用户NOMA网络鲁棒资源分配 被引量:1
14
作者 胡林 刘锡炎 +1 位作者 齐倩 陈前斌 《电子学报》 EI CAS CSCD 北大核心 2024年第10期3359-3367,共9页
在不完美信道状态信息(Channel State Information,CSI)和不完美串行干扰消除(Successive Interference Cancellation,SIC)的场景下,研究了可重构智能表面(Reconfigurable Intelligent Surface,RIS)辅助多用户非正交多址接入(Non-Orthog... 在不完美信道状态信息(Channel State Information,CSI)和不完美串行干扰消除(Successive Interference Cancellation,SIC)的场景下,研究了可重构智能表面(Reconfigurable Intelligent Surface,RIS)辅助多用户非正交多址接入(Non-Orthogonal Multiple Access,NOMA)网络的鲁棒资源分配问题.在考虑两类用户(信息用户和能量用户)服务质量(Quality of Service,QoS)和信息用户SIC约束下,建立了基站发射功率最小化的优化问题.该问题是一个多变量耦合的非凸优化问题.为了求解该问题,本文使用松弛变量、线性近似、S-程序、符号定性法转化该问题的非凸约束.然后将优化问题分解为两个子问题,最后使用交替优化方法迭代求解两个子问题,直到发送功率收敛.仿真结果表明:该文算法具有较好的收敛性,实现了资源的鲁棒分配,同时有效地降低基站发射功率. 展开更多
关键词 可重构智能表面 非正交多址接入 不完美信道状态信息 不完美串行干扰消除 传输功率优化 功率最小化
在线阅读 下载PDF
期货市场的简单博弈分析 被引量:3
15
作者 刘慧宏 糜仲春 赵亚彬 《运筹与管理》 CSCD 2003年第5期85-88,共4页
本文是对多空双方各存在一个大户的简单期货市场进行博弈分析,讨论了大户和散户的博弈行为,得出在完全信息、不完全信息和不完美信息条件下的博弈情况及其均衡结果,以此为基础推出期货市场投资者结成联盟,成立投资基金是一种趋向。
关键词 期货市场 博弈分析 博弈均衡 完全信息博弈 不完全信息博弈 不完美信息博弈 Harsanyi转换
在线阅读 下载PDF
资源型产业并购重组中的博弈分析 被引量:1
16
作者 李红 史春芬 《中南大学学报(社会科学版)》 CSSCI 2011年第3期21-25,共5页
在资源紧缺的背景下,通过兼并重组来提高产业集中度,提升产品附加值,对加强资源型产业的市场竞争力及地区可持续发展能力都具有重要意义。在市场经济环境中,兼并重组可以被看作是博弈过程。为了促进企业并购,建立了以大型集团企业为并... 在资源紧缺的背景下,通过兼并重组来提高产业集中度,提升产品附加值,对加强资源型产业的市场竞争力及地区可持续发展能力都具有重要意义。在市场经济环境中,兼并重组可以被看作是博弈过程。为了促进企业并购,建立了以大型集团企业为并购方和地方骨干企业为被并购方作为主要研究对象的不完美信息动态博弈模型,对并购双方的博弈过程进行了深入的分析。结合经验发现,虽然政府参与了资源型产业的重组整合过程,但是并购主体依然有必要详细搜集对方信息,慎重选择并购方案,或者判断是否接受并购方案。经过充分博弈过程的并购,将有利于并购后的企业发展和重组整合战略的全面推广。 展开更多
关键词 资源型产业 企业并购 不完美信息动态博弈 完美贝叶斯均衡 大型企业集团 地方骨干企业
在线阅读 下载PDF
城市封闭住宅小区何以开放?——一个“地方政府与业主博弈”的视角 被引量:1
17
作者 彭忠益 王艳 《党政研究》 2017年第2期99-109,共11页
在公共利益和私人利益冲突的情况下已建成的城市封闭住宅小区何以开放成为公众近期关注的热点。已有研究表明城市封闭住宅小区的开放宜采用征收路径,在具体的制度和程序设计上政府要保证民主、公平和正义;并有学者注意到政府与业主之间... 在公共利益和私人利益冲突的情况下已建成的城市封闭住宅小区何以开放成为公众近期关注的热点。已有研究表明城市封闭住宅小区的开放宜采用征收路径,在具体的制度和程序设计上政府要保证民主、公平和正义;并有学者注意到政府与业主之间的信息不畅通会影响其结果。从公共选择理论和业主组织发展的现状分析,可知地方政府与业主之间存在信息不对称的现实。运用不完美信息动态博弈探讨地方政府和业主的策略选择如何影响城市封闭住宅小区的开放,结论是:城市封闭住宅小区的开放与地方政府给予业主征收补偿的形式和数量没有直接关系,与政治型政府的不作为有很大关系;且地方政府的强制执行手段对城市封闭住宅小区的开放效果甚微。 展开更多
关键词 城市封闭住宅小区 地方政府 业主 信息不对称 不完美信息动态博弈
在线阅读 下载PDF
一种针对德州扑克AI的对手建模与策略集成框架 被引量:6
18
作者 张蒙 李凯 +3 位作者 吴哲 臧一凡 徐航 兴军亮 《自动化学报》 EI CAS CSCD 北大核心 2022年第4期1004-1017,共14页
以德州扑克游戏为代表的大规模不完美信息博弈是现实世界中常见的一种博弈类型.现有以求解纳什均衡策略为目标的主流德州扑克求解算法存在依赖博弈树模型、算力消耗大、策略过于保守等问题,导致智能体在面对不同对手时无法最大化自身收... 以德州扑克游戏为代表的大规模不完美信息博弈是现实世界中常见的一种博弈类型.现有以求解纳什均衡策略为目标的主流德州扑克求解算法存在依赖博弈树模型、算力消耗大、策略过于保守等问题,导致智能体在面对不同对手时无法最大化自身收益.为解决上述问题,提出一种轻量高效且能快速适应对手策略变化进而剥削对手的不完美信息博弈求解框架.本框架分为智能体离线训练和在线博弈两个阶段.第1阶段基于演化学习思想训练智能体,得到能够剥削不同博弈风格对手的策略神经网络.在第2博弈阶段中,智能体在线建模并适应未知风格对手,利用种群策略集成的方法最大化剥削对手.在两人无限注德州扑克环境中的实验结果表明,本框架在面对动态对手策略时,相比已有方法能够大幅提升博弈性能. 展开更多
关键词 不完美信息博弈 德州扑克 演化学习 在线对手建模 种群策略集成
在线阅读 下载PDF
基于重复博弈的Ad hoc网络合作转发模型 被引量:1
19
作者 张华鹏 张宏斌 《电子与信息学报》 EI CSCD 北大核心 2014年第3期703-707,共5页
针对噪音环境下的Ad hoc网络合作问题,运用不完美信息重复博弈模型分析节点之间的交互过程,使用贝尔曼方程构造满足序贯均衡的合作激励机制。对于该机制,节点间无需交换观察信息,节省了节点能量和网络负担。与已有的序贯均衡策略相比,... 针对噪音环境下的Ad hoc网络合作问题,运用不完美信息重复博弈模型分析节点之间的交互过程,使用贝尔曼方程构造满足序贯均衡的合作激励机制。对于该机制,节点间无需交换观察信息,节省了节点能量和网络负担。与已有的序贯均衡策略相比,该机制避免使用对观测误差敏感的触发策略,提高了不完美信息环境下网络的合作率和节点的平均收益。仿真结果表明,使用贝尔曼方程构造的序贯均衡策略既提高了网络的合作率,又有很好的适应性。 展开更多
关键词 AD HOC 不完美信息 重复博弈 序贯均衡 合作
在线阅读 下载PDF
面向分层异构网络的资源分配:一种稳健分层博弈学习方案 被引量:6
20
作者 邵鸿翔 赵杭生 +1 位作者 孙有铭 孙丰刚 《电子与信息学报》 EI CSCD 北大核心 2017年第1期38-44,共7页
该文研究了信道状态不确定条件下分层异构微蜂窝网络中的无线资源分配优化问题。首先引入信道不确定模型描述无线信道的随机动态性,并将该问题建模为考虑信道不确定度的双层鲁棒斯坦伯格博弈;然后给出了该博弈的均衡点分析;最后提出了... 该文研究了信道状态不确定条件下分层异构微蜂窝网络中的无线资源分配优化问题。首先引入信道不确定模型描述无线信道的随机动态性,并将该问题建模为考虑信道不确定度的双层鲁棒斯坦伯格博弈;然后给出了该博弈的均衡点分析;最后提出了一种分布式改进型分层Q学习方案以实现宏基站和微基站的均衡策略搜索。理论分析和仿真表明,所提出的分层博弈模型可以有效抑制由于信道状态不确定引起的收益下降。所采用的学习方案较传统Q学习方案收敛速度明显加快,更加适用于短时快变的通信环境。 展开更多
关键词 异构网络 斯坦伯格博弈 不完美信道信息 鲁棒决策 双层Q学习 离散策略
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部