期刊文献+
共找到36篇文章
< 1 2 >
每页显示 20 50 100
基于优先采样模型的离线强化学习 被引量:4
1
作者 顾扬 程玉虎 王雪松 《自动化学报》 EI CAS CSCD 北大核心 2024年第1期143-153,共11页
离线强化学习通过减小分布偏移实现了习得策略向行为策略的逼近,但离线经验缓存的数据分布往往会直接影响习得策略的质量.通过优化采样模型来改善强化学习智能体的训练效果,提出两种离线优先采样模型:基于时序差分误差的采样模型和基于... 离线强化学习通过减小分布偏移实现了习得策略向行为策略的逼近,但离线经验缓存的数据分布往往会直接影响习得策略的质量.通过优化采样模型来改善强化学习智能体的训练效果,提出两种离线优先采样模型:基于时序差分误差的采样模型和基于鞅的采样模型.基于时序差分误差的采样模型可以使智能体更多地学习值估计不准确的经验数据,通过估计更准确的值函数来应对可能出现的分布外状态.基于鞅的采样模型可以使智能体更多地学习对策略优化有利的正样本,减少负样本对值函数迭代的影响.进一步,将所提离线优先采样模型分别与批约束深度Q学习(Batch-constrained deep Q-learning,BCQ)相结合,提出基于时序差分误差的优先BCQ和基于鞅的优先BCQ.D4RL和Torcs数据集上的实验结果表明:所提离线优先采样模型可以有针对性地选择有利于值函数估计或策略优化的经验数据,获得更高的回报. 展开更多
关键词 离线强化学习 优先采样模型 时序差分误差 批约束深度Q学习
在线阅读 下载PDF
不确定环境下编队协同信息交互优先权模型 被引量:3
2
作者 钟麟 佟明安 +1 位作者 张世清 李盛 《火力与指挥控制》 CSCD 北大核心 2020年第9期12-16,21,共6页
为了恰当管理编队协同空战中产生的大量数据,全面了解作战空域及态势,提出了不确定环境下编队信息交互的优先权模型。把信息交互的优先权看作动态队决策问题,利用决策分析的值函数对信息的重要度进行评估,提出了优先权评估模型,并把飞... 为了恰当管理编队协同空战中产生的大量数据,全面了解作战空域及态势,提出了不确定环境下编队信息交互的优先权模型。把信息交互的优先权看作动态队决策问题,利用决策分析的值函数对信息的重要度进行评估,提出了优先权评估模型,并把飞行员的偏好考虑到模型中。针对信息的不确定以及偏好知识的不完全情况,采用区间分析法,提出了区间型优先权模型,并且给出了求解算法。仿真结果表明该模型在不确定环境下能提高编队整体作战效能。 展开更多
关键词 优先模型 区间分析 协同空战 不确定性
在线阅读 下载PDF
贡嘎山暗针叶林生态系统基于KDW运动-弥散波模型的优先流研究 被引量:10
3
作者 牛健植 余新晓 张志强 《生态学报》 CAS CSCD 北大核心 2007年第9期3541-3555,共15页
利用自制的土柱装置,开展室内土柱实验,并与野外实地示踪影像分析相结合,针对研究区域土壤包气带根系层中水分快速运动的优先流展开研究,其目的在于系统分析优先流对径流过程的影响,为长江上游暗针叶林生态系统土壤水分运动规律研究及... 利用自制的土柱装置,开展室内土柱实验,并与野外实地示踪影像分析相结合,针对研究区域土壤包气带根系层中水分快速运动的优先流展开研究,其目的在于系统分析优先流对径流过程的影响,为长江上游暗针叶林生态系统土壤水分运动规律研究及有效流域管理提供理论支持。研究采用雷诺数计算及野外示踪映像分析方法,判定证明在所研究地区,有优先流现象发生,优先流是处于层流及紊流之间的过渡流。同时针对成熟林坡积物土壤的水分运移状况分析表明研究区域的壤中流过程主要表现为优先流,而土壤中的基质部分,则表现为不动区域。研究在以往优先流模型构建的基础上,综合考虑了研究区域的实地情况,应用融入弥散波的运动波模型(KDW优先流模型),利用交叉模拟方法和统计分析方法将此模型与实地实验检验分析,认定KDW优先流模型实用性强、可靠程度较高,可较好地模拟贡嘎山暗针叶林生态系统实地。 展开更多
关键词 贡嘎山暗针叶林生态系统 土壤水分运动 雷诺数 野外示踪映像分析 KDW优先模型
在线阅读 下载PDF
回归测试路径优先级模型 被引量:2
4
作者 杜庆峰 冯国尧 钱浩然 《同济大学学报(自然科学版)》 EI CAS CSCD 北大核心 2016年第12期1943-1948,共6页
为了提高回归测试的效率,根据组件间的调用图,找出可能的路径片段,通过测试用例的执行历史进而计算出路径片段的覆盖指数,最后对覆盖指数进行排序,提出了一种测试用例的优先级模型.用此模型可以高效地进行回归测试,及时发现程序中的错误.
关键词 回归测试 路径片段 优先模型 覆盖指标
在线阅读 下载PDF
长江三峡库区优先流模型修正及验证 被引量:1
5
作者 程金花 张洪江 +3 位作者 史玉虎 何凡 祁生林 程云 《山东农业大学学报(自然科学版)》 CSCD 北大核心 2007年第4期605-609,共5页
为模拟长江三峡库区优先流运动,以Macro模型为基础模型,依据长江三峡花岗岩区试验地特征及观测数据,对模型驱动变量、土壤物理特性参数进行了适当修正,得到了试验地区优先流运动模型。应用EF统计方法对实测结果和模拟结果进行了检验,检... 为模拟长江三峡库区优先流运动,以Macro模型为基础模型,依据长江三峡花岗岩区试验地特征及观测数据,对模型驱动变量、土壤物理特性参数进行了适当修正,得到了试验地区优先流运动模型。应用EF统计方法对实测结果和模拟结果进行了检验,检验结果表明不同层次土壤中优先流流量的EF统计值均大于0.89,说明所建立的优先流模拟模型能够较好地模拟优先流过程。 展开更多
关键词 长江三峡 Macro模型 优先模型
在线阅读 下载PDF
面向软件定义核心网的OpenFlow分组转发优先制排队模型研究 被引量:3
6
作者 熊兵 左明科 +1 位作者 黎维 王进 《电子学报》 EI CAS CSCD 北大核心 2019年第10期2040-2049,共10页
软件定义网络(Software-Defined Networking,SDN)作为一种数据转发与控制逻辑相解耦、并开放底层编程接口的创新网络架构,为降低核心网的部署运营成本、提升应用业务性能提供了全新的解决思路.然而,在SDN架构下,逻辑上集中的控制平面容... 软件定义网络(Software-Defined Networking,SDN)作为一种数据转发与控制逻辑相解耦、并开放底层编程接口的创新网络架构,为降低核心网的部署运营成本、提升应用业务性能提供了全新的解决思路.然而,在SDN架构下,逻辑上集中的控制平面容易出现性能瓶颈,进而加大分组转发时延,因此有必要理解其分组转发性能特性.为此,本文首先介绍了软件定义核心网的典型部署场景,分析了控制平面的Packet-in消息到达过程和数据平面的分组到达过程,进而应用M/M/n/m和M/M/1/m排队模型分别刻画控制器集群的Packet-in消息处理过程和OpenFlow交换机的分组处理过程.在此基础上,建立OpenFlow分组转发优先制排队模型,进而推导出不同优先级的分组转发时延及其累积分布函数CDF.最后,借助控制器性能测量工具OFsuite_Performance进行实验评估,结果表明:与现有模型相比,本文所提的M/M/n/m模型更能准确估计控制器集群的实际性能.同时,采用数值分析的方法对比了多种情况下不同优先级的分组转发时延及CDF曲线,为软件定义核心网的实际应用部署提供有效参考. 展开更多
关键词 软件定义核心网 分组转发性能 优先制排队模型 SDN控制器集群 OpenFlow交换机
在线阅读 下载PDF
企业多种产品优先淘汰模型研究
7
作者 傅贤治 冯新田 《运筹与管理》 CSCD 1994年第3期94-98,共5页
本文提出了一种适用于多品种企业优先淘汰不景气产品的经济模型,并对模型应用的条件、计算方法和实施中要注意的问题进行了系统地分析。
关键词 企业 多种产品 优先淘汰模型 淘汰决策
在线阅读 下载PDF
决策者偏好交互项目组合选择模型及算法优化研究 被引量:1
8
作者 罗淑娟 白思俊 郭云涛 《西北工业大学学报》 EI CAS CSCD 北大核心 2016年第4期724-730,共7页
项目组合选择是战略项目管理决策的重要环节,目前基于决策者偏好的交互项目组合选择的研究仍然在模型和算法上存在不足。首先提出级别优先模型细致划分了项目间的偏好关系,并引入了项目间的协同交互,使模型更加完备。进而结合该模型改... 项目组合选择是战略项目管理决策的重要环节,目前基于决策者偏好的交互项目组合选择的研究仍然在模型和算法上存在不足。首先提出级别优先模型细致划分了项目间的偏好关系,并引入了项目间的协同交互,使模型更加完备。进而结合该模型改进了多目标粒子群算法,加快其收敛速度,并拓展其非劣解的多样性。在考虑决策者偏好和项目间交互约束的条件下,分别对偏好模型和模型求解算法进行了仿真验证。仿真结果表明,采用级别优先模型所得的非劣解更加接近项目组合选择的最优解,改进粒子群算法的搜索速度更快。 展开更多
关键词 粒子群优化 项目组合选择 项目交互 决策者偏好 级别优先模型 改进粒子群优化
在线阅读 下载PDF
基于改进信息熵的空地多目标攻击优先权决策 被引量:7
9
作者 陈中起 周中良 +1 位作者 于雷 杜永伟 《系统工程与电子技术》 EI CSCD 北大核心 2011年第2期329-333,共5页
空地多目标攻击顺序的确定直接决定着攻击机自身的生存力及作战任务的完成,是对地作战任务规划的关键前提。分析了影响空地多目标攻击顺序决策的因素;采用优先权法,建立了空地多目标攻击优先权决策模型;对传统的基于信息熵的多属性决策... 空地多目标攻击顺序的确定直接决定着攻击机自身的生存力及作战任务的完成,是对地作战任务规划的关键前提。分析了影响空地多目标攻击顺序决策的因素;采用优先权法,建立了空地多目标攻击优先权决策模型;对传统的基于信息熵的多属性决策方法进行了改进,引入决策者偏好因素,综合了主客观对决策结果的影响;最后进行了实例仿真研究,仿真结果验证了所建优先权模型的正确性及所提决策方法的有效性。 展开更多
关键词 空地多目标攻击 优先权决策模型 多属性决策 攻击顺序
在线阅读 下载PDF
不确定环境下空地多目标攻击优先权决策 被引量:3
10
作者 杨啸天 刘小军 +1 位作者 冯金富 於东军 《南京理工大学学报》 EI CAS CSCD 北大核心 2012年第4期567-572,共6页
为提高空地多目标攻击的精确性,该文针对不确定环境下空地多目标攻击的决策模型展开研究。首先,深入分析了影响空对地多目标攻击决策的不确定因素,并提出使用区间形式表示各属性的不确定性范围;其次,采用多层值树对空地协同多目标攻击... 为提高空地多目标攻击的精确性,该文针对不确定环境下空地多目标攻击的决策模型展开研究。首先,深入分析了影响空对地多目标攻击决策的不确定因素,并提出使用区间形式表示各属性的不确定性范围;其次,采用多层值树对空地协同多目标攻击进行决策建模;最后,使用RICH(Rank inclusion in criteria hierarchies)方法对决策模型进行求解。2对4空地多目标攻击仿真实例结果表明,该文所提出的协同优先权方法是有效的,可为空地协同多目标攻击决策提供合理依据。 展开更多
关键词 空地多目标攻击 协同优先权决策模型 不确定性
在线阅读 下载PDF
农村公共产品供给优先次序研究 被引量:1
11
作者 孙钰 姚晓东 李泽涛 《商业时代》 北大核心 2010年第4期73-74,共2页
长期以来,农村公共产品供给与需求的矛盾突出,如明确供给的优先次序就可以有针对性的提供农村迫切需要的、最有利于农业发展和农村经济增长的公共产品。为实现提高农村生产率、增加农民收入、改善农民生活和提高农民素质的四大目标,本... 长期以来,农村公共产品供给与需求的矛盾突出,如明确供给的优先次序就可以有针对性的提供农村迫切需要的、最有利于农业发展和农村经济增长的公共产品。为实现提高农村生产率、增加农民收入、改善农民生活和提高农民素质的四大目标,本文使用灰色关联分析结合线性分配法,以1996年到2008年的统计年鉴数据为依据,通过对农村公共产品供给优先测度分析,给出了九类主要农村公共产品的供给优先次序,为有效供给公共产品提供积极的决策依据。 展开更多
关键词 农村公共产品 供给 优先次序 优先测度模型
在线阅读 下载PDF
虚拟手术中表面网格模型的力反馈算法与仿真 被引量:1
12
作者 潘家辉 朱玲利 《计算机应用与软件》 CSCD 2016年第6期260-263,333,共5页
提出一个带力反馈的虚拟腹部外科手术系统,并重点研究及实现了基于表面网格模型的力反馈算法。为了提高系统的稳定性,使用基于线段与表面三角网格的碰撞检测方法;基于四阶Runge-Kutta方法的表面网格mass-spring模型进行变形仿真;基于力... 提出一个带力反馈的虚拟腹部外科手术系统,并重点研究及实现了基于表面网格模型的力反馈算法。为了提高系统的稳定性,使用基于线段与表面三角网格的碰撞检测方法;基于四阶Runge-Kutta方法的表面网格mass-spring模型进行变形仿真;基于力的广度优先传播来解决变形仿真的局部性。通过仿真实验验证了该原型系统可以实现与可变形的三维模型的实时力觉交互。最后,把该方法应用到虚拟腹部外科手术系统中,并实现带力反馈的手术仿真操作。 展开更多
关键词 虚拟手术 表面网格 质点一弹簧模型 四阶Runge-Kutta算法 广度优先的力传播模型
在线阅读 下载PDF
基于优先排队论网络延迟云计算资源调度算法 被引量:19
13
作者 崔建明 刘佳祎 杨呈永 《桂林理工大学学报》 CAS 北大核心 2017年第2期360-365,共6页
针对虚拟机在实际应用环境中,对于不同数据在不同情况下需要不同优先级输出的问题,采用运筹学优先制M/M/1排队模型,对虚拟机请求作出网络延迟分析并对传统的顺序输出方法加以改进。结合数据资源在云计算环境下的Map-Reduce模型,提出新... 针对虚拟机在实际应用环境中,对于不同数据在不同情况下需要不同优先级输出的问题,采用运筹学优先制M/M/1排队模型,对虚拟机请求作出网络延迟分析并对传统的顺序输出方法加以改进。结合数据资源在云计算环境下的Map-Reduce模型,提出新的调度算法以及不同于传统算法的度量指标。经过Cloud Sim仿真软件进行模拟实验,结果表明,新的算法将网络延迟以及物理机和虚拟机的CPU、内存等资源综合考虑,在性能上要优于随机算法、转轮算法等传统算法,大大改善了负载均衡度,缩短任务调度总时间,并使总调度时间的负载效率得以提高。 展开更多
关键词 云计算 网络延迟 优先制M/M/1排队模型 资源调度
在线阅读 下载PDF
基于双层优先级的中继卫星系统任务调度算法 被引量:7
14
作者 郭超 熊伟 郝利云 《计算机应用研究》 CSCD 北大核心 2018年第5期1506-1510,共5页
中继卫星系统在天基信息网中起着桥梁的作用。为充分利用卫星资源以提供快速可靠的数据中继服务,需要对高价值、高紧迫性的任务开展调度方法研究。在分析中继卫星系统任务与资源的基础上,建立了多任务、多资源的调度模型;提出了任务调... 中继卫星系统在天基信息网中起着桥梁的作用。为充分利用卫星资源以提供快速可靠的数据中继服务,需要对高价值、高紧迫性的任务开展调度方法研究。在分析中继卫星系统任务与资源的基础上,建立了多任务、多资源的调度模型;提出了任务调度优先级和时间窗口选择优先级模型,并在此基础上提出了一种基于双层优先级的中继卫星系统调度算法。根据算法在仿真算例中的应用可见,相比对照算法,基于双层优先级的调度算法更有利于满足高价值、高紧迫性任务的执行条件,从而提高了任务成功率和调度综合收益。 展开更多
关键词 跟踪与数据中继卫星系统 任务调度 时间窗口选择 优先模型
在线阅读 下载PDF
基于匹配调节法则和梯度约束模型的图像修复算法 被引量:1
15
作者 吴银芳 朱森诚 《包装工程》 CAS 北大核心 2018年第13期239-244,共6页
目的针对当前较多图像修复算法难以根据不同纹理结构来自适应调整修复块的尺寸,导致修复结果中存在不连续效应和模糊效应等不足,提出一种结合匹配调节法则和梯度约束模型的图像修复算法。方法首先,利用平滑因子对置信度项进行约束,构造... 目的针对当前较多图像修复算法难以根据不同纹理结构来自适应调整修复块的尺寸,导致修复结果中存在不连续效应和模糊效应等不足,提出一种结合匹配调节法则和梯度约束模型的图像修复算法。方法首先,利用平滑因子对置信度项进行约束,构造优先级判定模型,对待修复块的优先级进行度量,确定优先修复块。随后,通过SSD模型度量样本块之间的匹配结果,并根据匹配结果制定匹配调节法则,使得样本块能根据匹配度自适应调节其大小,以提高修复质量。最后,将梯度模值块中像素点的均方距离度量结果与样本块中像素点相结合,构造梯度约束模型,用以获取最佳匹配块对待修复块进行填充修复。结果实验结果表明,与当前图像修复算法相比,该算法修复的图像具有更好的修复质量,在像素丢失率较高的情况下,仍然具有较高的相似度值。结论所提算法具备较好的修复视觉质量,可用于被大面积损坏图像的修复。 展开更多
关键词 图像修复 优先级判定模型 匹配调节法则 SSD 梯度约束模型 平滑因子
在线阅读 下载PDF
基于优先级的WMSN区分服务路由算法 被引量:1
16
作者 邓达 徐鹏 《电子科技大学学报》 EI CAS CSCD 北大核心 2016年第3期423-428,共6页
提出一种基于区分服务(Diffserv)的QoS路由算法。该算法利用两种方式保证传输的QoS需求:一是在转发数据包时,以不同的概率公式选择路径;二是使用强占性优先排队模型处理节点缓存中不同类型的数据包。仿真实验显示,该路由算法能保证不同... 提出一种基于区分服务(Diffserv)的QoS路由算法。该算法利用两种方式保证传输的QoS需求:一是在转发数据包时,以不同的概率公式选择路径;二是使用强占性优先排队模型处理节点缓存中不同类型的数据包。仿真实验显示,该路由算法能保证不同种类数据包的QoS需求,平衡网络的能量消耗,同时延长网络的生存周期。 展开更多
关键词 区分服务 优先级排队模型 服务质量 无线多媒体传感器网络
在线阅读 下载PDF
城市轨道交通列车开行方案的确定 被引量:34
17
作者 孙焰 施其洲 +1 位作者 赵源 孔庆瑜 《同济大学学报(自然科学版)》 EI CAS CSCD 北大核心 2004年第8期1005-1008,1014,共5页
研究了城市轨道交通多个循环区段线路上列车最优开行方案的计算机自动编制问题 ,给出各种循环方式下车底运用数下界的数学计算公式 .建立了使列车实载率达到最大的列车日班次运行计划的优化模型 ,并给出一个求该模型的计算机算法 .实现... 研究了城市轨道交通多个循环区段线路上列车最优开行方案的计算机自动编制问题 ,给出各种循环方式下车底运用数下界的数学计算公式 .建立了使列车实载率达到最大的列车日班次运行计划的优化模型 ,并给出一个求该模型的计算机算法 .实现了编制城轨列车班次计划的自动化 . 展开更多
关键词 城市轨道交通 班次计划 优先模型 算法
在线阅读 下载PDF
基于战损预测和排队论的技术保障装备数量需求分析
18
作者 张东 牛刚 +1 位作者 梁伟杰 刘强 《火力与指挥控制》 CSCD 北大核心 2024年第8期40-44,共5页
针对部队技术保障装备数量需求论证过程中定量分析困难的问题,根据战时技术保障装备运用特点,区分伴随保障和定点保障两种模式分别建立定量分析模型。给出基于战损预测的伴随保障装备数量确定模型;建立考虑维修优先级的装备定点保障排... 针对部队技术保障装备数量需求论证过程中定量分析困难的问题,根据战时技术保障装备运用特点,区分伴随保障和定点保障两种模式分别建立定量分析模型。给出基于战损预测的伴随保障装备数量确定模型;建立考虑维修优先级的装备定点保障排队系统解析模型,通过计算平均排队等待时间分析确定技术保障装备数量需求,并给出相关案例计算结果。为战时技术保障装备数量需求分析提供了方法支撑。 展开更多
关键词 战损预测 优先级排队模型 技术保障装备 数量需求
在线阅读 下载PDF
地基处理方案的模糊相似优选 被引量:1
19
作者 田微微 李洪涛 《科学技术与工程》 2009年第16期4698-4702,共5页
利用模糊数学的原理和方法,通过对可行方案与理想方案间各影响指标的比较,建立了可行方案与理想方案的模糊相似优先模型,最终找出与理想方案最为相似的可行方案。这种模型既能够决策出最佳方案,还可以给出备选方案的排序以供决策者选取... 利用模糊数学的原理和方法,通过对可行方案与理想方案间各影响指标的比较,建立了可行方案与理想方案的模糊相似优先模型,最终找出与理想方案最为相似的可行方案。这种模型既能够决策出最佳方案,还可以给出备选方案的排序以供决策者选取,是一种科学、有效的优选地基处理方案的方法。 展开更多
关键词 地基处理 方案优选 模糊相似优先模型
在线阅读 下载PDF
大型数据库中利用强化学习改进treap的关联规则挖掘算法 被引量:14
20
作者 辛春花 郭艳光 鲁晓波 《计算机应用研究》 CSCD 北大核心 2021年第1期88-92,共5页
信息的爆炸式增长使数据挖掘分析过程更加困难,针对普通关联规则挖掘算法很难在短运行时间和低关联度的前提下完成大型数据库中变量关系的评估和发现的问题,提出利用强化学习算法改进treap的大型数据库关联规则挖掘算法。提出的算法首... 信息的爆炸式增长使数据挖掘分析过程更加困难,针对普通关联规则挖掘算法很难在短运行时间和低关联度的前提下完成大型数据库中变量关系的评估和发现的问题,提出利用强化学习算法改进treap的大型数据库关联规则挖掘算法。提出的算法首先计算数据库中每个变量的优先级;然后,在优先级模型中利用强化学习算法改进的build-treap程序构建treap数据结构;最后,通过遍历程序和generateRule程序完成数据库中所需的关系查找。在对提出的算法进行稳定性分析后进行了仿真验证实验,实验结果表明,提出的算法在其最次和最佳案例分析中分别能够完成O(n log n)次和O(n 2)次挖掘,能够在较短时间内完成低关联度的大型数据库中变量关系挖掘任务,相对于改进型Apriori算法和改进型FP生长算法有较大提升。 展开更多
关键词 改进型treap算法 强化学习算法 大型数据库 优先模型 关联规则
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部