期刊文献+
共找到146篇文章
< 1 2 8 >
每页显示 20 50 100
Day-ahead scheduling based on reinforcement learning with hybrid action space
1
作者 CAO Jingyu DONG Lu SUN Changyin 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2022年第3期693-705,共13页
Driven by the improvement of the smart grid,the active distribution network(ADN)has attracted much attention due to its characteristic of active management.By making full use of electricity price signals for optimal s... Driven by the improvement of the smart grid,the active distribution network(ADN)has attracted much attention due to its characteristic of active management.By making full use of electricity price signals for optimal scheduling,the total cost of the ADN can be reduced.However,the optimal dayahead scheduling problem is challenging since the future electricity price is unknown.Moreover,in ADN,some schedulable variables are continuous while some schedulable variables are discrete,which increases the difficulty of determining the optimal scheduling scheme.In this paper,the day-ahead scheduling problem of the ADN is formulated as a Markov decision process(MDP)with continuous-discrete hybrid action space.Then,an algorithm based on multi-agent hybrid reinforcement learning(HRL)is proposed to obtain the optimal scheduling scheme.The proposed algorithm adopts the structure of centralized training and decentralized execution,and different methods are applied to determine the selection policy of continuous scheduling variables and discrete scheduling variables.The simulation experiment results demonstrate the effectiveness of the algorithm. 展开更多
关键词 day-ahead scheduling active distribution network(ADN) reinforcement learning hybrid action space
在线阅读 下载PDF
基于DR-DT的视觉SLAM参数自适应调整
2
作者 黄鑫 黄初华 +2 位作者 杨明旭 秦进 马旭博 《计算机应用研究》 北大核心 2025年第11期3512-3520,共9页
针对传统视觉SLAM系统依赖固定参数且需手动调整的问题,提出了一种基于离散化奖励Decision Transformer的自适应参数调整方法——DR-DT。该方法将参数自适应过程转换为序列建模任务,通过选择SLAM关键参数定义连续动作空间,基于位姿不确... 针对传统视觉SLAM系统依赖固定参数且需手动调整的问题,提出了一种基于离散化奖励Decision Transformer的自适应参数调整方法——DR-DT。该方法将参数自适应过程转换为序列建模任务,通过选择SLAM关键参数定义连续动作空间,基于位姿不确定性构建奖励函数,结合离散化奖励机制提升学习稳定性。以ORB-SLAM3为测试系统,在EuRoC MAV和TUM-VI数据集上的实验结果表明,所提方法能有效提升视觉SLAM系统在复杂场景中的位姿估计精度,同时简化了参数调整过程。该方法为视觉SLAM系统的参数自适应优化提供了新思路。 展开更多
关键词 视觉SLAM 参数自适应 Decision Transformer 连续动作空间 离散化奖励
在线阅读 下载PDF
混合动作表示强化学习下的城市交叉口智慧信控方法
3
作者 王庞伟 王思淼 +3 位作者 雷方舒 徐京辉 王子鹏 王力 《交通运输系统工程与信息》 北大核心 2025年第4期73-83,共11页
针对城市交叉口环境下单一离散或连续信号控制动作难以充分应对交通流量时空变化,以及现有强化学习方法无法同时解决混合动作空间中的可扩展性和动作依赖性问题,本文提出一种基于混合动作表示强化学习的城市交叉口智慧信控方法。首先,... 针对城市交叉口环境下单一离散或连续信号控制动作难以充分应对交通流量时空变化,以及现有强化学习方法无法同时解决混合动作空间中的可扩展性和动作依赖性问题,本文提出一种基于混合动作表示强化学习的城市交叉口智慧信控方法。首先,将交叉口智能体的动作空间设置为离散化信号相位选择及其相对应的连续性绿灯持续时间,并进行状态空间与奖励函数的一致性设计;其次,应用离散动作嵌入表和条件变分自编码器构建连续可解码的表示空间,将原始混合动作策略学习问题转化为隐式动作表示空间中的连续策略学习问题;再次,使用近端策略优化方法进行隐式动作表示空间策略训练,并通过解码器将输出动作解码为原始混合动作,与环境进行实时交互;最后,基于北京市高级别自动驾驶示范区实际数据开展测试验证。通过不同时段对比测试结果表明,本文所提方法相比于最优基准模型平均延误时间、平均排队长度和平均停车次数分别降低了2.57%~14.84%,4.00%~9.15%和7.25%~20.69%,达到了良好的城市交叉口信控优化效果。 展开更多
关键词 智能交通 交通信号控制 表示学习 混合动作空间 近端策略优化
在线阅读 下载PDF
面向参数化动作空间的多智能体中心化策略梯度分解及其应用 被引量:2
4
作者 田树聪 谢愈 +2 位作者 张远龙 周正春 高阳 《软件学报》 北大核心 2025年第2期590-607,共18页
近年来,多智能体强化学习方法凭借AlphaStar、AlphaDogFight、AlphaMosaic等成功案例展示出卓越的决策能力以及广泛的应用前景.在真实环境的多智能体决策系统中,其任务的决策空间往往是同时具有离散型动作变量和连续型动作变量的参数化... 近年来,多智能体强化学习方法凭借AlphaStar、AlphaDogFight、AlphaMosaic等成功案例展示出卓越的决策能力以及广泛的应用前景.在真实环境的多智能体决策系统中,其任务的决策空间往往是同时具有离散型动作变量和连续型动作变量的参数化动作空间.这类动作空间的复杂性结构使得传统单一针对离散型或连续型的多智能体强化学习算法不在适用,因此研究能用于参数化动作空间的多智能体强化学习算法具有重要的现实意义.提出一种面向参数化动作空间的多智能体中心化策略梯度分解算法,利用中心化策略梯度分解算法保证多智能体的有效协同,结合参数化深度确定性策略梯度算法中双头策略输出实现对参数化动作空间的有效耦合.通过在Hybrid Predator-Prey场景中不同参数设置下的实验结果表明该算法在经典的多智能体参数化动作空间协作任务上具有良好的性能.此外,在多巡航导弹协同突防场景中进行算法效能验证,实验结果表明该算法在多巡航导弹突防这类具有高动态、行为复杂化的协同任务中有效性和可行性. 展开更多
关键词 参数化动作空间 多智能体强化学习 中心化策略梯度分解 多巡航导弹突防
在线阅读 下载PDF
SDWN中基于多智能体图强化学习的多对多通信路由方法
5
作者 文鹏 叶苗 +2 位作者 王勇 何倩 仇洪冰 《电子学报》 北大核心 2025年第6期1885-1905,共21页
多对多通信路由问题是NP(Nondeterministic Polynomial time)难的组合优化问题,构建出高效的多对多通信路由路径还需及时获取全局网络状态信息以适应网络状态高度动态变化的特点.本文在软件定义无线网络(Software-Defined Wireless Netw... 多对多通信路由问题是NP(Nondeterministic Polynomial time)难的组合优化问题,构建出高效的多对多通信路由路径还需及时获取全局网络状态信息以适应网络状态高度动态变化的特点.本文在软件定义无线网络(Software-Defined Wireless Networks,SDWN)场景中针对现有数据驱动的多智能体深度强化学习方法存在计算和部署成本高、难以适应非欧结构特点的网络拓扑的问题,并且训练过程中无效动作过多会增加存储空间和时间开销以及收敛速度慢,本文设计了一种SDN控制平面和数据平面进行协同感知与智能决策的新框架,并针对多对多通信路由问题设计了一种两阶段的多智能体路由方法(基于智能节点部署策略的多智能体图强化学习方法:MAGDS-M2M).为了降低在每个节点上都部署智能体所带来的计算和部署成本,设计了一种基于Q-学习的智能节点部署算法来确定需要部署智能体的网络节点;在完成多智能体部署后,在Actor-Critic(AC)框架下设计了一种基于多智能体图强化学习的多对多路由决策方法,基于图卷积网络(Graph Convolutional Networks,GCN)和图神经网络(Graph Neural Networks,GNN)重新设计Actor和Critic网络,解决了现有多智能体强化学习方法中卷积神经网络(Convolutional Neural Networks,CNN)对拓扑结构数据适应能力比较弱的问题;此外,为解决Actor网络固定长度的动作空间在训练过程中产生大量无效动作的问题,设计了一种新的动作空间局部观测方法.实验结果表明所提出的方法相比于基准实验降低了29.33%任务完成时延,并且验证了可以通过调节参数使任务完成的时延和各节点累计能耗标准差之间达到平衡.本文所做工作源代码已提交至开源平台https://github.com/GuetYe/MAGDS-M2M. 展开更多
关键词 多对多通信 智能节点部署 多智能体图强化学习 动作空间局部观测方法 软件定义无线网络
在线阅读 下载PDF
社区自我解压的策略与空间——以浙北D社区为例 被引量:1
6
作者 陈国强 《天津行政学院学报》 北大核心 2025年第2期50-60,共11页
在我国全面推进治理体系与治理能力现代化的过程中,出现了更多事务向社区下沉的现象。这使得原来社区“负担”过重的问题进一步凸显。相较于多年来主张为社区减负而不得的状况,社区却在这种局面下依然维持着有序运行。针对这一“反常”... 在我国全面推进治理体系与治理能力现代化的过程中,出现了更多事务向社区下沉的现象。这使得原来社区“负担”过重的问题进一步凸显。相较于多年来主张为社区减负而不得的状况,社区却在这种局面下依然维持着有序运行。针对这一“反常”现象,有必要对“社区压力过大”这一问题进行重新审视。从对浙北D社区的案例分析中发现,社区掌握着一套诸如“统筹开展”“压力转移”“罚不责众”等策略,使其较好化解了任务压力;但同时,这些行为的运作空间正在逼近极限,甚至一些社区已出现非常规、非规范的解决方式。这是社区表面有序运行下所发出的警示信号,需要引起更大的重视。 展开更多
关键词 社区 自我解压 社区治理 行动策略 行动空间
在线阅读 下载PDF
基于强化学习的灾区应急无人机网络服务公平性最大化方案
7
作者 李槐城 彭舰 +2 位作者 黄文 沈群力 廖思睿 《计算机应用研究》 北大核心 2025年第8期2452-2459,共8页
现有研究无人机灾区应急通信服务的方法在全局环境信息下优化网络性能,存在组网效率低和资源分配不均衡的问题,在灾区环境下难以维持平衡的通信服务,导致部分用户无法被及时救援。针对上述不足,提出并解决了无人机通信质量最大化问题:... 现有研究无人机灾区应急通信服务的方法在全局环境信息下优化网络性能,存在组网效率低和资源分配不均衡的问题,在灾区环境下难以维持平衡的通信服务,导致部分用户无法被及时救援。针对上述不足,提出并解决了无人机通信质量最大化问题:将问题建模为部分观测马尔可夫决策过程(partially observable Markov decision process,POMDP),设计基于深度强化学习的路径规划和资源分配方法,建立以网络吞吐量为服务质量指标,Jain’s公平性指数为均衡性准则的评估体系。设计基于目标解耦的奖励函数机制,构建参数化深度图强化学习网络,实现无人机轨迹规划与资源分配的联合优化。在16种不同条件的仿真环境下进行对比实验,该方法的性能优于其他四种方法,在公平性指标上较现有方法提升9.6%,并在不同指标上均验证了方法的有效性。 展开更多
关键词 无人机通信控制 公平性指数 深度强化学习 混合动作空间
在线阅读 下载PDF
基于动作空间扩展与奖励塑造的强化学习知识推理
8
作者 李鸿鹏 赵刚 《计算机工程与设计》 北大核心 2025年第7期1898-1904,共7页
为缓解知识图谱中数据稀疏导致推理路径缺失的问题,提出一种基于动作空间扩展和奖励塑造的强化学习知识推理方法。在知识表示模块,将知识图谱中的实体和关系映射到含有三元组语义和结构信息的向量空间中,建立强化学习环境;在强化学习模... 为缓解知识图谱中数据稀疏导致推理路径缺失的问题,提出一种基于动作空间扩展和奖励塑造的强化学习知识推理方法。在知识表示模块,将知识图谱中的实体和关系映射到含有三元组语义和结构信息的向量空间中,建立强化学习环境;在强化学习模块,提出一种动作空间扩展方法,通过引入先验知识,考虑实体间语义信息,寻找关联度最高的关系-实体作为头实体的扩充动作空间,提高路径的连通性。提出奖励塑造方法,设计路径长度奖励和路径重复负向奖励,鼓励智能体选择更加可靠和多样化的关系路径,进一步提升模型效果。实验结果表明,该模型在知识推理的链接预测和事实预测任务中,性能优于大部分现有模型。 展开更多
关键词 知识图谱 知识图谱推理 强化学习 知识表示 动作空间扩展 奖励塑造 K近邻算法
在线阅读 下载PDF
一种信息作战行动空间概念建模方法
9
作者 肖野 潘毅佳 +2 位作者 何斌斌 郭恩泽 李德木 《火力与指挥控制》 北大核心 2025年第8期81-88,共8页
通过仿真实验设计具有战情复杂、策略多样和敌我博弈等特征的战术战法是一种常用手段。针对仿真实验建模存在作战域与仿真域界面不清晰、技术实现过程不精细等问题,提出一种信息作战行动空间概念建模方法。受博弈论行动空间分析思想的启... 通过仿真实验设计具有战情复杂、策略多样和敌我博弈等特征的战术战法是一种常用手段。针对仿真实验建模存在作战域与仿真域界面不清晰、技术实现过程不精细等问题,提出一种信息作战行动空间概念建模方法。受博弈论行动空间分析思想的启发,提出信息作战行动空间分析框架和建模基本流程,并且应用4种方法支撑概念建模过程工程化。所提方法对实战化和精细化开展战术战法设计具有较好的支撑作用。 展开更多
关键词 信息作战 行动空间 建模方法 作战仿真
在线阅读 下载PDF
基于强化学习的铁路列车运行图编制与优化研究综述
10
作者 陈昂扬 范家铭 +3 位作者 徐辉章 齐昕 李博 张新 《铁道运输与经济》 北大核心 2025年第11期36-51,共16页
列车运行图编制是铁路运输组织的核心决策问题,与强化学习中马尔可夫决策过程建模具有内在适配性。首先从理论层面论证强化学习应用于编图任务的可行性和优劣势,总结研究过程需要解决的组件设计、算法设计等关键问题;通过对既有文献进... 列车运行图编制是铁路运输组织的核心决策问题,与强化学习中马尔可夫决策过程建模具有内在适配性。首先从理论层面论证强化学习应用于编图任务的可行性和优劣势,总结研究过程需要解决的组件设计、算法设计等关键问题;通过对既有文献进行调研,认为目前研究仍处于探索阶段;在核心组件层面,归纳提出5类状态空间设计方式以及要素变更、过程控制、编图动作等动作空间设计方式,给出基于问题特性的神经网络模型和强化学习算法匹配推荐方案;在技术层面,分析目前面临的高维状态空间表征和多维组合空间探索等挑战和突破路径;最后从行业视角展望未来的技术趋势和发展方向,可为后续研究的建模方式、技术方案和行业落地提供系统性参考。 展开更多
关键词 列车运行图编制 强化学习 马尔可夫决策过程 状态空间 动作空间
在线阅读 下载PDF
基于深度强化学习的含储能船舶的海岛-海上渔排能源运输策略研究
11
作者 朱振山 陈豪 +1 位作者 陈炜龙 黄缨惠 《中国电机工程学报》 北大核心 2025年第7期2486-2499,I0004,共15页
针对海上渔排与风光资源富余岛屿能源交互问题,该文提出含全电力船舶(all-electricship,AES)的岛屿-海上渔排-海岸能源运输策略,利用能够很好处理海面风光不确定性问题以及适应较大规模能源转移模型的深度强化学习方法对上述能源运输模... 针对海上渔排与风光资源富余岛屿能源交互问题,该文提出含全电力船舶(all-electricship,AES)的岛屿-海上渔排-海岸能源运输策略,利用能够很好处理海面风光不确定性问题以及适应较大规模能源转移模型的深度强化学习方法对上述能源运输模型进行求解。首先,将移动式储能电池组细化为满充电池、空载电池以及不完全充电电池;其次,将上述能源运输问题建模为含混合动作空间的马尔可夫决策过程;考虑到针对混合动作空间问题,提出一种适用于混合动作空间的基于多批次前向传播的参数化双深度Q网络,该方法通过多步前向传递策略对不相关离散与连续动作进行解耦,减少了智能体训练过程中的波动性并能够收敛于更优的解;最后,通过算例仿真可知,所提策略能够有效实现各地点间能量转移,所提算法相较于传统适用于离散动作空间的深度强化学习方法更加灵活,在目标场景下能够实现更优运行。此外,在模型逐渐扩大的情况下,将该文方法与传统方法求解效果进行对比,验证所提方法在解决大规模能源运输问题的优势。 展开更多
关键词 深度强化学习 全电力船舶 移动式储能电池 混合动作空间
在线阅读 下载PDF
科学绿化、彩化与立体化——花园城市行动框架与营建路径探索
12
作者 李晓溪 李婷 郑曦 《风景园林》 北大核心 2025年第9期23-29,共7页
【目的】在高质量发展阶段,花园城市建设已成为实现人与自然和谐共生的重要抓手,但现阶段花园城市建设中仍存在空间权属不明确、治理主体碎片化、运营和维护机制不充分等现象。因此,探索以科学绿化、彩化与立体化(简称“三化”)为支撑... 【目的】在高质量发展阶段,花园城市建设已成为实现人与自然和谐共生的重要抓手,但现阶段花园城市建设中仍存在空间权属不明确、治理主体碎片化、运营和维护机制不充分等现象。因此,探索以科学绿化、彩化与立体化(简称“三化”)为支撑的花园城市行动框架与营建路径,对于推动花园城市建设落地见效意义重大。【方法/过程】系统梳理花园城市政策背景与实践需求,聚焦花园空间“在哪建、由谁建、怎么建”的核心问题,构建了花园城市“空间—主体—功能”行动框架,并围绕“三化”技术体系,从生态本底、城园共融、管理模式、共治机制4个方面提出了花园城市营建路径。【结果/结论】花园城市建设的关键在于转变工作思路、统筹空间改造与协调多元主体。花园城市建设应通过韧性宜居的生态本底筑牢、开放共享的城园融合推动、高效协同的管理模式完善、多元共建的共治机制创新等营建路径,推动多样化空间的花园化改造,为花园城市相关政策精准落地与高质量实施提供理论支撑和实践指导。 展开更多
关键词 风景园林 花园城市 绿色空间治理 科学绿化 行动框架 营建路径 北京
在线阅读 下载PDF
社会组织何以重塑基层社区集体行动——基于“文化场域”的个案分析
13
作者 邢磊 《求实》 北大核心 2025年第4期73-85,M0005,共14页
居民“原子化”及由此产生的社区集体行动困境是基层社区治理中亟待解决的问题,社会组织对基层社区集体行动的影响值得关注。然而,关于社会组织重塑社区集体行动的因果机制尚未被充分揭示。本研究运用个案研究法对四川省崇州市社会组织... 居民“原子化”及由此产生的社区集体行动困境是基层社区治理中亟待解决的问题,社会组织对基层社区集体行动的影响值得关注。然而,关于社会组织重塑社区集体行动的因果机制尚未被充分揭示。本研究运用个案研究法对四川省崇州市社会组织参与社区治理的过程展开长时段的纵向跟踪研究,并建构了以“附近”为文化场域的分析框架。研究发现:社会组织通过文化场域的建构,以文化为纽带,借助空间建构、情感培育、社会关系等三重要素实现了寓文于治的治理目标。社会组织通过三重要素的运用,形成空间联结机制、纽带凝聚机制、秩序整合机制,成为推进基层社区治理现代化的重要路径。 展开更多
关键词 社会治理 社区治理 社会组织 集体行动 文化场域 文化空间 情感培育 关系塑造
在线阅读 下载PDF
足球机器人决策系统推理模型 被引量:38
14
作者 吴丽娟 张春晖 徐心和 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2001年第6期597-599,共3页
介绍了足球机器人系统的组成及决策系统的六步推理模型和四层决策结构 ,并用人工智能的状态空间表示方法将比赛场上瞬息万变的态势 ,通过选择少量的有代表性的离散状态构成状态空间 ,根据系统完成的任务 ,为机器人确定有限的动作集合 ,... 介绍了足球机器人系统的组成及决策系统的六步推理模型和四层决策结构 ,并用人工智能的状态空间表示方法将比赛场上瞬息万变的态势 ,通过选择少量的有代表性的离散状态构成状态空间 ,根据系统完成的任务 ,为机器人确定有限的动作集合 ,使积累的知识程序化 ;通过决策系统的正向推理 ,使每个机器人选择合适的动作 ,以命令的形式输出机器人的左右轮速 ,实现对系统的实时控制· 展开更多
关键词 足球机器人 状态空间 动作空间 正向推理 决策系统 推理模型 人工智能
在线阅读 下载PDF
基于动作空间求解二维矩形Packing问题的高效算法 被引量:22
15
作者 何琨 黄文奇 金燕 《软件学报》 EI CSCD 北大核心 2012年第5期1037-1044,共8页
对于二维矩形Packing这一典型的NP难度问题,在黄文奇等人提出的拟人型穴度算法的基础上,通过定义动作空间来简化对不同放入动作的评价,使穴度的计算时间明显缩短,从而使算法能够快速地得到空间利用率较高的布局图案.实验测试了Hopper和T... 对于二维矩形Packing这一典型的NP难度问题,在黄文奇等人提出的拟人型穴度算法的基础上,通过定义动作空间来简化对不同放入动作的评价,使穴度的计算时间明显缩短,从而使算法能够快速地得到空间利用率较高的布局图案.实验测试了Hopper和Turton提出的21个著名的二维矩形Packing问题的实例.改进的算法对其中的每一个实例都得到了空间利用率为100%的最优布局,且在普通PC机上的平均计算时间未超过7分钟.实验结果表明,基于动作空间对拟人型穴度算法所进行的改进是明显而有效的. 展开更多
关键词 NP难度 矩形Packing 拟人 动作空间 穴度
在线阅读 下载PDF
基于活动分析法的人类空间行为研究 被引量:84
16
作者 柴彦威 沈洁 《地理科学》 CSCD 北大核心 2008年第5期594-600,共7页
居民日常活动空间和城市日常活动系统是人类空间行为研究中的重要内容,直接反映行为空间形成机制、分布特征及其与实体空间的相互关系,并为城市社会生活及其空间体系研究提供了重要的微观视角。通过行为空间研究中若干关键问题进行探讨... 居民日常活动空间和城市日常活动系统是人类空间行为研究中的重要内容,直接反映行为空间形成机制、分布特征及其与实体空间的相互关系,并为城市社会生活及其空间体系研究提供了重要的微观视角。通过行为空间研究中若干关键问题进行探讨,认为基于日常活动空间的活动分析法能够很好的整合和处理这些问题,在对活动分析法相关概念和几个重要方法介绍的基础上,尝试提出基于活动分析法的人类空间行为研究的思路与框架。 展开更多
关键词 行为空间 活动空间 活动分析法 人类空间行为
在线阅读 下载PDF
一种用于连续动作空间的最小二乘行动者-评论家方法 被引量:9
17
作者 朱斐 刘全 +1 位作者 傅启明 伏玉琛 《计算机研究与发展》 EI CSCD 北大核心 2014年第3期548-558,共11页
解决具有连续动作空间的问题是当前强化学习领域的一个研究热点和难点.在处理这类问题时,传统的强化学习算法通常利用先验信息对连续动作空间进行离散化处理,然后再求解最优策略.然而,在很多实际应用中,由于缺乏用于离散化处理的先验信... 解决具有连续动作空间的问题是当前强化学习领域的一个研究热点和难点.在处理这类问题时,传统的强化学习算法通常利用先验信息对连续动作空间进行离散化处理,然后再求解最优策略.然而,在很多实际应用中,由于缺乏用于离散化处理的先验信息,算法效果会变差甚至算法失效.针对这类问题,提出了一种最小二乘行动者-评论家方法(least square actor-critic algorithm,LSAC),使用函数逼近器近似表示值函数及策略,利用最小二乘法在线动态求解近似值函数参数及近似策略参数,以近似值函数作为评论家指导近似策略参数的求解.将LSAC算法用于解决经典的具有连续动作空间的小车平衡杆问题和mountain car问题,并与Cacla(continuous actor-critic learning automaton)算法和eNAC(episodic natural actor-critic)算法进行比较.结果表明,LSAC算法能有效地解决连续动作空间问题,并具有较优的执行性能. 展开更多
关键词 强化学习 行动者-评论家算法 连续动作空间 最小二乘法 小车平衡杆问题 MOUNTAIN car问题
在线阅读 下载PDF
基于动作空间的三维装箱问题的确定性高效率求解算法 被引量:23
18
作者 何琨 黄文奇 《计算机学报》 EI CSCD 北大核心 2014年第8期1786-1793,共8页
三维装箱问题要求将有限个三维矩形物体尽可能多地装入到一个三维矩形箱子中,使得箱子的填充率即体积利用率最大.在求解三维装箱问题的穴度算法的基础之上,进一步做了以下改进:(1)将当前剩余空间中可能放入的每个体积最大的三维矩形虚... 三维装箱问题要求将有限个三维矩形物体尽可能多地装入到一个三维矩形箱子中,使得箱子的填充率即体积利用率最大.在求解三维装箱问题的穴度算法的基础之上,进一步做了以下改进:(1)将当前剩余空间中可能放入的每个体积最大的三维矩形虚拟物体所对应的空间定义为动作空间,在动作空间内放入物体并使穴度的定义体现放入物体与动作空间的吻合程度;(2)在物体放入位置的选择上直接体现"金角银边草肚皮"的思想,每一步只选择最靠近箱子边缘的一个动作空间来装载物体;(3)结合捆绑策略,将形状大小相同的物体捆绑为一个较大的矩形块进行放入,对捆绑块形状大小的选择为在不超出动作空间的前提下尽量用物体填满该空间的两至三个维度.实验结果表明,改进后的穴度算法在付出很少的开销代价的情况下显著地提高了箱子的填充率. 展开更多
关键词 三维布局 装箱 启发式 动作空间 穴度
在线阅读 下载PDF
动作空间带平衡约束圆形Packing问题的拟物求解算法 被引量:7
19
作者 何琨 杨辰凯 +1 位作者 黄梦龙 黄文奇 《软件学报》 EI CSCD 北大核心 2016年第9期2218-2229,共12页
对于一个以卫星舱内设备布局为背景的具有NP难度的全局优化问题——带平衡约束的圆形Packing问题,提出了基于动作空间的拟物求解算法.在拟物下降遇到局部极小点的陷阱时,如何找到当前格局下的最空闲空间以使搜索过程跳到更有前景的区域... 对于一个以卫星舱内设备布局为背景的具有NP难度的全局优化问题——带平衡约束的圆形Packing问题,提出了基于动作空间的拟物求解算法.在拟物下降遇到局部极小点的陷阱时,如何找到当前格局下的最空闲空间以使搜索过程跳到更有前景的区域去是设计跳坑策略的一个关键难点.借鉴求解矩形Packing问题中动作空间的概念,通过化"圆"为"方",将不规则的空闲空间近似为一系列规则的矩形空间,从而有效地解决了此难点.另外,将拟物法与提前中止、粗精调和自适应步长这3个拟人辅助策略相结合,以提高势能下降的效率.对3组共13个代表性算例的计算结果及与国内外代表性算法的比较表明,所提格局的外包络圆半径多为最小或次小,且在部分算例上找到了有更小外包络圆半径的格局,总体计算结果较好,且静不平衡量的精度较高. 展开更多
关键词 NP难度 圆形Packing 拟物 动作空间 平衡约束
在线阅读 下载PDF
制度变迁中地方核心行动者的行动空间拓展与行为异化 被引量:21
20
作者 沈荣华 王扩建 《南京师大学报(社会科学版)》 CSSCI 北大核心 2011年第1期14-22,共9页
脱胎于西方高度结构化制度环境中的新制度主义与我国低制度化的现实环境存在明显的"错配",导致与常识性经验体认不符。而以地方核心行动者为视角来解析制度变迁中地方行动空间的拓展与行为异化则可以破解这一难题。我国制度... 脱胎于西方高度结构化制度环境中的新制度主义与我国低制度化的现实环境存在明显的"错配",导致与常识性经验体认不符。而以地方核心行动者为视角来解析制度变迁中地方行动空间的拓展与行为异化则可以破解这一难题。我国制度变迁的波动性、制度非耦合性及实施机制不健全都给地方核心行动者扩大了行动空间。这种空间的拓展也带来了追求短期政绩、职能错位及类苏丹化现象,需要我们不断加强制度供给。 展开更多
关键词 制度变迁 核心行动者 行动空间 行为异化
在线阅读 下载PDF
上一页 1 2 8 下一页 到第
使用帮助 返回顶部