期刊文献+
共找到37篇文章
< 1 2 >
每页显示 20 50 100
密文长度固定的策略部分隐藏多授权机构CP-ABE方案 被引量:1
1
作者 刘怡龙 许盛伟 岳梓岩 《通信学报》 EI CSCD 北大核心 2024年第8期20-36,共17页
针对现有访问策略隐藏的密文策略属性加密(CP-ABE)方案存在的安全性低、资源开销大的问题,提出了一种密文长度固定的策略部分隐藏多授权机构CP-ABE方案。首先,通过隐藏访问策略中的属性值,降低隐私数据泄露的风险;其次,通过固定密文长... 针对现有访问策略隐藏的密文策略属性加密(CP-ABE)方案存在的安全性低、资源开销大的问题,提出了一种密文长度固定的策略部分隐藏多授权机构CP-ABE方案。首先,通过隐藏访问策略中的属性值,降低隐私数据泄露的风险;其次,通过固定密文长度和使用外包解密技术,减少用户的资源开销;最后,采用多授权机构管理机制,避免部署单一授权机构易产生的密钥托管问题。通过安全分析证明了方案在标准模型中满足选择明文攻击下的密文不可区分性,以及方案隐藏的访问策略和产生的外包密钥能够抵抗属性值猜测攻击。通过与已有方案的性能对比,证明了所提方案的总体资源开销更小。 展开更多
关键词 密文策略属性加密 策略部分隐藏 密文长度固定 多授权机构 外包解密
在线阅读 下载PDF
基于近端策略优化算法和Mask-TIT网络的多功能雷达干扰决策方法
2
作者 娄雨璇 孙闽红 尹帅 《数据采集与处理》 CSCD 北大核心 2024年第6期1355-1369,共15页
为应对愈加智能的多功能雷达给对抗方带来的挑战,本文提出一种基于近端策略优化(Proximal policy optimization,PPO)算法和Mask?TIT(Mask?Transformer in Transformer)网络的干扰决策方法。首先,从一种现实场景出发,将干扰机与雷达的对... 为应对愈加智能的多功能雷达给对抗方带来的挑战,本文提出一种基于近端策略优化(Proximal policy optimization,PPO)算法和Mask?TIT(Mask?Transformer in Transformer)网络的干扰决策方法。首先,从一种现实场景出发,将干扰机与雷达的对抗场景建模为部分可观察马尔可夫决策过程(Partially observable Markov decision process,POMDP),根据雷达工作原理设计了新的状态转移函数和奖励函数,并根据多功能雷达层级模型设计了观测空间。其次,利用Transformer对序列数据的表征能力和雷达干扰样式的特点设计了一种Mask?TIT网络结构,用于构建更强大的Actor?Critic网络架构。最后,使用近端策略优化算法进行优化学习。实验结果表明,该算法较现有方法收敛所需交互数据平均减少25.6%,并且收敛后的方差显著降低。 展开更多
关键词 雷达干扰决策 部分可观察马尔可夫决策过程 强化学习 TRANSFORMER 近端策略优化
在线阅读 下载PDF
基于深度强化学习的车联网动态卸载成本优化
3
作者 赵珊 贾宗璞 +2 位作者 朱小丽 庞晓艳 谷坤源 《河南理工大学学报(自然科学版)》 北大核心 2025年第6期191-200,共10页
目的为解决不完美信道车联网中任务卸载与资源分配的关键问题,降低计算成本,方法结合不完美信道特征对基础的车联网任务卸载环境抽象化,联合优化任务卸载比、功率选择和服务器资源分配,建立所有用户的长期平均成本最小化问题模型。采用... 目的为解决不完美信道车联网中任务卸载与资源分配的关键问题,降低计算成本,方法结合不完美信道特征对基础的车联网任务卸载环境抽象化,联合优化任务卸载比、功率选择和服务器资源分配,建立所有用户的长期平均成本最小化问题模型。采用基于深度强化学习的动态卸载优化方案,同时考虑求解变量的连续性,提出优化的深度确定性策略梯度算法SP-DDPG(deep deterministic policy gradient with importance sampling and prioritized experience replay)求解问题模型。对比现有的一些深度强化学习方法,研究单一变量影响下SP-DDPG算法的运行表现,分别计算平均卸载成本和任务丢弃数2个重要指标。结果所提算法与所设置的完全任务卸载算法F-DDPG与DDQN算法相比,任务平均卸载成本分别降低了约36.13%和44.02%,任务丢弃数至少下降了4.38%和9.76%;与部分卸载算法DDPG相比,任务平均卸载成本和任务丢弃数分别下降13.34%和3.17%。实验结果取多次运行后的平均值(时延及能耗权衡因子ω=0.5,信道估计精度值ρ=0.95),具有较好可靠性。结论在复杂变化的不稳定车联网环境中,所提优化深度确定性策略梯度算法SP-DDPG,相较几种常规的深度强化学习算法任务计算成本更低,任务处理效果更好。 展开更多
关键词 车联网 部分卸载 资源分配 深度确定性策略梯度 不完美信道
在线阅读 下载PDF
基于MADDPG的多无人机协同攻击方法 被引量:1
4
作者 张波 刘满国 刘梦焱 《弹箭与制导学报》 北大核心 2025年第3期344-350,共7页
多无人机协同完成特定打击任务是未来无人机军事领域发展的重要方向。针对多无人机协同攻击问题,构建典型对抗场景。将多无人机协同攻击问题建模成分布式部分可观测马尔可夫决策过程(Dec-POMDP),设计独特奖励函数,采用多智能体深度确定... 多无人机协同完成特定打击任务是未来无人机军事领域发展的重要方向。针对多无人机协同攻击问题,构建典型对抗场景。将多无人机协同攻击问题建模成分布式部分可观测马尔可夫决策过程(Dec-POMDP),设计独特奖励函数,采用多智能体深度确定性策略梯度(MADDPG)算法训练攻击策略。使用蒙特卡洛法分析仿真实验,结果表明在该多智能体强化学习算法训练之后,特定对抗场景下多无人机协同攻击任务完成率达到82.9%。 展开更多
关键词 多智能体 深度强化学习 分布式部分可观测马尔可夫决策过程(Dec-POMDP) 多智能体深度确定性策略梯度算法(MADDPG) 无人机集群
在线阅读 下载PDF
N-策略带负顾客的M/M/c部分工作休假排队 被引量:4
5
作者 朱翼隽 徐鸿洋 《江苏大学学报(自然科学版)》 EI CAS CSCD 北大核心 2013年第3期367-372,共6页
在经典M/M/c排队模型的基础上考虑部分工作休假策略.在休假期,部分服务台并不完全停止服务而是以较正常服务率低的服务率服务新到顾客,其他服务台正常休假.考虑负顾客因素,并且引入N-策略作为休假终止策略.负顾客到达系统时,一对一地抵... 在经典M/M/c排队模型的基础上考虑部分工作休假策略.在休假期,部分服务台并不完全停止服务而是以较正常服务率低的服务率服务新到顾客,其他服务台正常休假.考虑负顾客因素,并且引入N-策略作为休假终止策略.负顾客到达系统时,一对一地抵消处于正常服务期正在接受服务的任意一个正顾客,若系统中无处于正常服务期的正顾客,到达的负顾客自动消失,负顾客不接受服务.1次休假结束时,系统中顾客数大于等于N时结束休假,否则继续休假.利用拟生灭过程和矩阵几何解方法,得到了系统稳态下的队长分布,并且建立了在服务台全忙条件下的随机分解结构. 展开更多
关键词 负顾客 N-策略 部分工作休假 矩阵几何解 条件随机分解
在线阅读 下载PDF
细胞代谢组学用于羽扇豆醇干预人乳腺癌细胞MCF-7的机理探究 被引量:19
6
作者 史栋栋 况媛媛 +3 位作者 王桂明 彭章晓 王彦 阎超 《色谱》 CAS CSCD 北大核心 2014年第3期278-283,共6页
应用基于气相色谱-质谱联用(GC-MS)的代谢组学方法结合细胞周期实验,研究羽扇豆醇体外抑制人乳腺癌细胞MCF-7增殖的作用机理。代谢组学的研究结果表明:通过正交偏最小方差判别分析(OPLS-DA)可以很好地区分羽扇豆醇作用的MCF-7细胞代谢... 应用基于气相色谱-质谱联用(GC-MS)的代谢组学方法结合细胞周期实验,研究羽扇豆醇体外抑制人乳腺癌细胞MCF-7增殖的作用机理。代谢组学的研究结果表明:通过正交偏最小方差判别分析(OPLS-DA)可以很好地区分羽扇豆醇作用的MCF-7细胞代谢谱与对照组细胞代谢谱,模型参数为:R2 Ycum=0.988,Q2 Ycum=0.964。VIP(variable importance in the projection)值大于1的差异代谢物进一步用t检验进行单位分析,选择t<0.05(VIP>1)的代谢物作为羽扇豆醇作用组的生物标志物,得到琥珀酸、磷酸、亮氨酸、异亮氨酸等11种代谢差异物。结合羽扇豆醇将细胞周期抑制在G1期这一现象,推测羽扇豆醇可能是主要抑制了三羧酸循环中的琥珀酰辅酶A的生成和底物磷酸化生成ATP的反应来抑制MCF-7细胞的增殖。本实验从代谢组学角度为乳腺癌抗肿瘤机制提供新的线索。 展开更多
关键词 气相色谱-质谱 羽扇豆醇 MCF-7 细胞 乳腺癌 抑制机理 正交偏最小方差判别分析 细胞代谢组学 细胞周期 gas chromatography-mass spectrometry( GC-MS) orthogonal partial least SQUARES DISCRIMINANT analysis( OPLS-DA)
在线阅读 下载PDF
流域尺度农业“水-土-经济”要素耦合机制与行为调控系统效应模拟 被引量:2
7
作者 刘桂君 刘宇 +1 位作者 张倩 吴锋 《农业资源与环境学报》 CAS CSCD 北大核心 2022年第3期631-642,共12页
农业系统的“水-土-经济”要素是刻画人类活动与生态-水文过程互馈效应耦合的关键界面之一。本研究以局部均衡理论为依据,基于栅格尺度的水、土、作物的空间分布数据与行政区尺度的粮食生产、消费与贸易数据嵌套,构建了行政区-栅格跨尺... 农业系统的“水-土-经济”要素是刻画人类活动与生态-水文过程互馈效应耦合的关键界面之一。本研究以局部均衡理论为依据,基于栅格尺度的水、土、作物的空间分布数据与行政区尺度的粮食生产、消费与贸易数据嵌套,构建了行政区-栅格跨尺度的农业部门局部均衡分析“水-土-经济”要素耦合模型(Water-Land-Economicnexus Model,WLEM)。研究以黑河流域“粮改饲”补贴政策为例,模拟种植与加工环节的农机设备补贴下水土资源消耗强度与空间布局的变化,刻画农业“水-土-经济”要素的耦合机制与政策干预下行为调控的资源消耗及经济产出的系统效应。模拟发现,对种植环节的大型农机补贴增加了非水土自然要素的投入,降低了生产成本,有助于增加青贮玉米种植面积。而对加工环节进行农机补贴,可通过提高青贮技术直接影响青贮玉米作为饲料的投入,与种植环节补贴相比,其对青贮玉米产量的拉动作用较大。种植与加工环节叠加补贴在鼓励青贮玉米生产的同时,一定程度减少了籽粒玉米种植面积,符合“粮改饲”政策目标。结果表明,在政策补贴过程中需重视加工环节的农业机械设备补贴,并完善种植补贴和加工补贴两种政策的优势互补机制。从生产和加工两个环节补贴的空间效益来看,青贮玉米与籽粒玉米在畜牧业投入上的竞争关系使作物种植过程中水土资源要素投入呈现出空间异质性特征,这与栅格尺度上水土资源要素作为农产品成本的占比以及要素供给和替代弹性差异直接相关。该研究为制定合理的水土资源配置方案与农业发展政策,实现流域水-生态-经济协同发展提供了科学依据。 展开更多
关键词 “水--经济”系统耦合 黑河流域 “粮改饲”政策 空间异质性 农业部门局部均衡分析模型
在线阅读 下载PDF
部分服务台同步多重休假的排队库存系统 被引量:2
8
作者 叶子钦 岳德权 《运筹学学报(中英文)》 CSCD 北大核心 2024年第1期40-56,共17页
本文研究了(s,S)库存策略的多服务台排队库存系统,其中库存为空时有部分服务台同步多重休假,休假时间服从指数分布。顾客到达为泊松过程,每个服务台的服务时间和补货时间均服从指数分布。利用拟生灭过程和矩阵几何解法,计算了系统稳态... 本文研究了(s,S)库存策略的多服务台排队库存系统,其中库存为空时有部分服务台同步多重休假,休假时间服从指数分布。顾客到达为泊松过程,每个服务台的服务时间和补货时间均服从指数分布。利用拟生灭过程和矩阵几何解法,计算了系统稳态概率和一些性能指标,并给出了系统单位时间的平均费用函数。最后,通过数值算例分析了参数对费用函数的影响,并得到最优库存策略和最优平均费用。 展开更多
关键词 排队库存系统 部分服务台休假 (s S)库存策略 拟生灭过程 矩阵几何解
在线阅读 下载PDF
部分可观测条件下的策略迁移强化学习方法
9
作者 王忠禹 徐晓鹏 王东 《现代防御技术》 北大核心 2024年第2期63-71,共9页
针对多智能体强化学习算法在部分可观测条件下难以形成有效协同策略的问题,基于集中式训练与分散式执行范式(CTDE)提出一种策略迁移强化学习方法。该方法在全局观测下训练可以探索到良好协同策略的教师模块,在部分可观测条件下,学生模... 针对多智能体强化学习算法在部分可观测条件下难以形成有效协同策略的问题,基于集中式训练与分散式执行范式(CTDE)提出一种策略迁移强化学习方法。该方法在全局观测下训练可以探索到良好协同策略的教师模块,在部分可观测条件下,学生模块依据最大化累计回报的期望为目标函数在线训练的同时,利用策略蒸馏技术从教师模块进行策略迁移,并自适应调整教师策略对学生策略的影响比重。在多个地图场景中对所提出的方法进行仿真验证,实验结果表明部分可观测条件下学生模块的胜率高于所对比的基线算法的胜率。研究成果可以应用于多智能体合作任务,提升智能体在分散式执行时的协同性能。 展开更多
关键词 多智能体 强化学习 部分观测 策略迁移 集中式训练与分散式执行
在线阅读 下载PDF
不确定需求条件下制造商的退货政策 被引量:19
10
作者 张福利 达庆利 《系统管理学报》 CSSCI 2013年第2期185-193,共9页
基于单一制造商和单一零售商构成的两级供应链和不确定需求,研究了制造商的退货政策。结果表明:当市场波动幅度较大且市场需求为高需求的可能性较大时,部分退货政策是制造商的最优退货政策;当市场波动幅度较大且市场需求为低需求的可能... 基于单一制造商和单一零售商构成的两级供应链和不确定需求,研究了制造商的退货政策。结果表明:当市场波动幅度较大且市场需求为高需求的可能性较大时,部分退货政策是制造商的最优退货政策;当市场波动幅度较大且市场需求为低需求的可能性较大,或市场波动幅度较小时,不接受退货和部分退货政策都是制造商的最优退货政策。 展开更多
关键词 需求不确定性 完全退货政策 部分退货政策 供应链
在线阅读 下载PDF
产业转移政策与企业迁移行为——基于广东产业转移的调查数据 被引量:25
11
作者 杨本建 毛艳华 《南方经济》 CSSCI 2014年第3期1-20,共20页
在区域协调发展的背景下,政府之间点对点合作来共建产业转移园区是我国产业转移政策的重要形式,但现有的文献很少对这种政策的作用机制和效果进行分析。不同于以往文献从产业的视角,本文考虑到同一行业内企业之间的差异,在新近发展起来... 在区域协调发展的背景下,政府之间点对点合作来共建产业转移园区是我国产业转移政策的重要形式,但现有的文献很少对这种政策的作用机制和效果进行分析。不同于以往文献从产业的视角,本文考虑到同一行业内企业之间的差异,在新近发展起来的异质性企业集聚理论的基础上,运用广东合作产业转移园的调查数据,通过直接观察政府政策如何影响企业迁移行为,来分析这种产业转移政策的效果。结果显示,这种产业转移政策对异质性的企业具有选择效应:即使在同一行业内,那些投资规模大或用地面积大的企业更容易受政策的影响;相对于部分迁移的企业,整体迁移的企业更容易受政策的影响;由于这种选择效应的存在,政策对珠三角地区大量中小企业的迁移影响有限。本文研究结果意味着,要达到政策的预期目标,在制定政策时必须充分考虑不同类型企业的迁移行为差异。 展开更多
关键词 产业转移政策 部分迁移 整体迁移 企业异质性
在线阅读 下载PDF
策略梯度强化学习中的最优回报基线 被引量:6
12
作者 王学宁 徐昕 +1 位作者 吴涛 贺汉根 《计算机学报》 EI CSCD 北大核心 2005年第6期1021-1026,共6页
尽管策略梯度强化学习算法有较好的收敛性,但是在梯度估计的过程中方差过大,却是该方法在理论和应用上的一个主要弱点.为减小梯度强化学习算法的方差,该文提出一种新的算法———Istate Grbp算法:在策略梯度算法Istate GPOMDP中加入回... 尽管策略梯度强化学习算法有较好的收敛性,但是在梯度估计的过程中方差过大,却是该方法在理论和应用上的一个主要弱点.为减小梯度强化学习算法的方差,该文提出一种新的算法———Istate Grbp算法:在策略梯度算法Istate GPOMDP中加入回报基线,以改进策略梯度算法的学习性能.文中证明了在Istate GPOMDP算法中引入回报基线,不会改变梯度估计的期望值,并且给出了使方差最小的最优回报基线.实验结果表明,和已有算法相比,该文提出的算法通过减小梯度估计的方差,提高了学习效率,加快了学习过程的收敛. 展开更多
关键词 强化学习 策略梯度 部分可观测马氏决策过程 回报基线
在线阅读 下载PDF
随机生产中拖后需求的变质产品最优生产策略 被引量:5
13
作者 林欣怡 文晓巍 达庆利 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2007年第4期731-736,共6页
针对部分短缺量拖后的变质产品,建立随机生产状态下的生产-库存模型.所谓随机生产状态,是指生产过程会随机地从一种可控状态向另一种不可控状态转移,当生产处于不可控状态时,会生产出一定比例的次品.其中,生产状态的转移服从均匀分布.... 针对部分短缺量拖后的变质产品,建立随机生产状态下的生产-库存模型.所谓随机生产状态,是指生产过程会随机地从一种可控状态向另一种不可控状态转移,当生产处于不可控状态时,会生产出一定比例的次品.其中,生产状态的转移服从均匀分布.通过生产-库存模型得到了随机生产状态下总成本函数,分析得到,该总成本函数是一个关于生产次数的凹函数,并由此提出了最优生产次数算法.最后给出了算例.算例结果表明,最优生产次数算法能够有效地将一个4n+1维的最优问题转化为一个一维问题,为变质商品的生产-库存决策提供了简便有效的方法. 展开更多
关键词 变质商品 随机生产 部分短缺量拖后 最优生产-库存策略
在线阅读 下载PDF
部分延迟订购的易变质品联合定价与生产策略 被引量:8
14
作者 霍佳震 李贵萍 段永瑞 《运筹与管理》 CSSCI CSCD 北大核心 2015年第1期255-262,共8页
构建了一个需求同时依赖于销售价格和库存水平,生产率和变质率均为常数,允许缺货且缺货量部分延迟订购的易变质品联合定价与生产控制模型。首先证明了在销售价格给定的情况下,系统的总利润函数是关于生产计划的严格凹函数,平均利润函数... 构建了一个需求同时依赖于销售价格和库存水平,生产率和变质率均为常数,允许缺货且缺货量部分延迟订购的易变质品联合定价与生产控制模型。首先证明了在销售价格给定的情况下,系统的总利润函数是关于生产计划的严格凹函数,平均利润函数是严格的伪凹函数,即存在唯一的最优解,并给出其充分条件。接着给出问题的一个数值求解算法。最后通过算例,展示了模型及相关算法的应用,并对相关参数进行了灵敏度分析,结果显示:当产品的生产成本、缺货成本和机会成本增加时,系统的平均利润将下降;生产成本和延迟订购阻力系数对最优定价和生产策略以及平均利润的影响较大。 展开更多
关键词 供应链管理 联合定价与生产策略 非线性规划 易变质品 部分延迟订购
在线阅读 下载PDF
基于部分可观察马尔可夫决策过程的机电装备动态可靠性评价方法 被引量:6
15
作者 张红旗 邵晓东 胡祥涛 《中国机械工程》 EI CAS CSCD 北大核心 2016年第18期2482-2486,2493,共6页
针对机电装备运行维护问题,提出了基于部分可观察马尔可夫决策过程(POMDP)理论的动态可靠性评价方法。该方法将可靠性动态演变看成POMDP问题,通过不完全观测到的设备运行信息(如噪声、温度、压力等),对可靠性状态进行估计,同时分析不同... 针对机电装备运行维护问题,提出了基于部分可观察马尔可夫决策过程(POMDP)理论的动态可靠性评价方法。该方法将可靠性动态演变看成POMDP问题,通过不完全观测到的设备运行信息(如噪声、温度、压力等),对可靠性状态进行估计,同时分析不同的维修行为对可靠性水平的影响规律,构建了基于状态转移的动态可靠性评价模型。然后,提出了以最小化维修成本费用和潜在故障危害为目标的维护策略制定方法,并通过案例分析验证了该方法的有效性,实现了机电装备动态可靠性的有效评价与维护策略的科学制订。 展开更多
关键词 可靠性评价 维护策略 POMDP 机电装备
在线阅读 下载PDF
基于预测的Web缓存替换策略 被引量:6
16
作者 石磊 孟彩霞 韩英杰 《计算机应用》 CSCD 北大核心 2007年第8期1842-1845,共4页
为提高Web缓存性能,在缓存替换算法的基础上加入预测机制,提出了基于预测的Web替换策略P-Re。预测算法采用PPM上下文模型,当缓存空间不够用来存放新的对象时,P-Re选择键值较小且未被预测到的对象进行替换。实验表明,基于预测的W eb缓存... 为提高Web缓存性能,在缓存替换算法的基础上加入预测机制,提出了基于预测的Web替换策略P-Re。预测算法采用PPM上下文模型,当缓存空间不够用来存放新的对象时,P-Re选择键值较小且未被预测到的对象进行替换。实验表明,基于预测的W eb缓存替换算法P-Re相对于传统替换算法而言具有较高的命中率和字节命中率。 展开更多
关键词 WEB缓存 替换算法 预测 PPM 命中率 字节命中率
在线阅读 下载PDF
状态不完全可观条件下设备检修策略研究 被引量:3
17
作者 刘繁茂 朱海平 +1 位作者 邵新宇 高贵兵 《计算机集成制造系统》 EI CSCD 北大核心 2009年第8期1628-1632,1663,共6页
为了诊断状态不完全可观条件下的设备状况,介绍了部分可观察的马尔可夫决策过程的基本原理和Perseus近似算法的基本流程。给出了基于设备加工次品率和某些核心组件振动信号诊断信息的设备状态评估方法。在基于设备状态的视情维修模式下... 为了诊断状态不完全可观条件下的设备状况,介绍了部分可观察的马尔可夫决策过程的基本原理和Perseus近似算法的基本流程。给出了基于设备加工次品率和某些核心组件振动信号诊断信息的设备状态评估方法。在基于设备状态的视情维修模式下,考虑了检测手段的局限性和检测结果的不确定性,并以某轿车发动机缸体生产线上的一台加工中心为例,建立了以最小化折扣费用为目标的设备检测维修的部分可观察马尔可夫决策过程模型。最后应用Perseus近似算法对模型进行了求解,得到了有限区间条件下的近似最优检测、维修策略和近似最优的折扣费用值。 展开更多
关键词 部分可观察马尔可夫决策过程模型 检测维修策略 视情维修 Perseus算法
在线阅读 下载PDF
基于多零售商和不确定需求的制造商退货政策研究 被引量:1
18
作者 张福利 施建军 徐小林 《预测》 CSSCI 北大核心 2013年第4期52-57,共6页
本文基于单一制造商和两个零售商构成的两级供应链和不确定需求,在单位退货价格是内生的情形下,研究了制造商的退货政策。结果表明,当市场波动幅度较大且市场需求为高需求的可能性较大时,部分退货政策是制造商的最优退货政策;当市场波... 本文基于单一制造商和两个零售商构成的两级供应链和不确定需求,在单位退货价格是内生的情形下,研究了制造商的退货政策。结果表明,当市场波动幅度较大且市场需求为高需求的可能性较大时,部分退货政策是制造商的最优退货政策;当市场波动幅度较大且市场需求为低需求的可能性较大,或者市场波动幅度较小时,不接受退货和部分退货政策都是制造商的最优退货政策,特别,当市场波动幅度不是太小且市场需求为低需求的可能性很大,或者市场波动幅度太小时,完全退货政策也是制造商的最优退货政策。 展开更多
关键词 完全退货政策 部分退货政策 需求不确定性 供应链
在线阅读 下载PDF
技术性贸易壁垒政策择优:一个局部均衡的分析框架 被引量:19
19
作者 鲍晓华 《财贸研究》 北大核心 2004年第5期23-30,共8页
技术性贸易壁垒由于其维护国家安全、保护人类和动植物安全和健康、保证产品质量以及保护环境等方面的正当理由 ,成为了贸易保护主义的庇护所。各进口国频繁使用技术性贸易壁垒来保护本国产业和市场 ,有时候保护的成本是很高的 ,甚至超... 技术性贸易壁垒由于其维护国家安全、保护人类和动植物安全和健康、保证产品质量以及保护环境等方面的正当理由 ,成为了贸易保护主义的庇护所。各进口国频繁使用技术性贸易壁垒来保护本国产业和市场 ,有时候保护的成本是很高的 ,甚至超过了保护的收益所得。本文用一个单一产品市场局部均衡的分析框架 ,演示利用成本收益分析对SPS措施进行政策择优的过程 ,该方法提供了分析不同收益和成本以及贸易限制、价格和福利关系的框架。结论是 ,进口国应该权衡成本和收益 ,技术性贸易壁垒政策的实施要考虑经济效率 ,经济学的分析可以为此提供理论依据。 展开更多
关键词 技术性贸易壁垒 局部均衡 收益 进口国 政策 成本 分析框架 择优 正当理由 行政
在线阅读 下载PDF
一种基于最优策略概率分布的POMDP值迭代算法 被引量:4
20
作者 刘峰 王崇骏 骆斌 《电子学报》 EI CAS CSCD 北大核心 2016年第5期1078-1084,共7页
随着应用中POMDP问题的规模不断扩大,基于最优策略可达区域的启发式方法成为了目前的研究热点.然而目前已有的算法虽然保证了全局最优,但选择最优动作还不够精确,影响了算法的效率.本文提出一种基于最优策略概率的值迭代方法 PBVIOP.该... 随着应用中POMDP问题的规模不断扩大,基于最优策略可达区域的启发式方法成为了目前的研究热点.然而目前已有的算法虽然保证了全局最优,但选择最优动作还不够精确,影响了算法的效率.本文提出一种基于最优策略概率的值迭代方法 PBVIOP.该方法在深度优先的启发式探索中,根据各个动作值函数在其上界和下界之间的分布,用蒙特卡罗法计算动作最优的概率,选择概率最大的动作作为最优探索策略.在4个基准问题上的实验结果表明PBVIOP算法能够收敛到全局最优解,并明显提高了收敛效率. 展开更多
关键词 部分可观测马尔科夫决策过程 基于最优策略概率的值迭代算法 蒙特卡罗法
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部