期刊文献+
共找到39篇文章
< 1 2 >
每页显示 20 50 100
2219铝合金应力时效强度演变规律及其强化模型 被引量:6
1
作者 湛利华 张姣 贾树峰 《中南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2016年第7期2235-2241,共7页
在时效温度为175℃,时效时间为18 h时,开展不同应力水平(120~200 MPa)条件下的应力松弛时效与蠕变时效对比实验。建立应力松弛时效与蠕变时效强化模型,对强化模型进行验证与分析。研究结果表明:合金的屈服强度不仅受应力强化作用面... 在时效温度为175℃,时效时间为18 h时,开展不同应力水平(120~200 MPa)条件下的应力松弛时效与蠕变时效对比实验。建立应力松弛时效与蠕变时效强化模型,对强化模型进行验证与分析。研究结果表明:合金的屈服强度不仅受应力强化作用面积的影响,而且在时效初期阶段高应力作用对合金的屈服强度产生重要影响;在相同应力强化作用面积条件下,分别由应力松弛时效强化模型与蠕变时效强化模型计算的屈服强度增量差值与应力强化作用面积之间存在一定的线性关系,可以通过蠕变时效来预测应力松弛时效过程中合金强度的演变规律。 展开更多
关键词 应力松弛时效 蠕变时效 力学性能 强化模型 2219铝合金
在线阅读 下载PDF
组合强化模型及其在弹塑性有限元分析中的应用 被引量:2
2
作者 李亚智 《西北工业大学学报》 EI CAS CSCD 北大核心 1994年第4期528-532,共5页
提出了一种组合形式的强化模型,编制了用于平面问题的弹塑性有限元法的等参元分析程序.实例计算表明,本文所提出的组合强化模型是合理和有效的,使用很方便。文中还推荐了一种关于迭代过程中的卸载问题的处理方法,它能有效地提高迭... 提出了一种组合形式的强化模型,编制了用于平面问题的弹塑性有限元法的等参元分析程序.实例计算表明,本文所提出的组合强化模型是合理和有效的,使用很方便。文中还推荐了一种关于迭代过程中的卸载问题的处理方法,它能有效地提高迭代收敛性,从而对于一般的等向强化有限程序设计也有一定的参考价值. 展开更多
关键词 弹塑性 组合强化模型 有限元法 平面问题
在线阅读 下载PDF
碳纤维与工程车辆翻新轮胎复合强化模型及增强机理
3
作者 王强 齐晓杰 +1 位作者 王云龙 王国田 《重庆交通大学学报(自然科学版)》 CAS 北大核心 2016年第3期178-182,共5页
为了有效提高工程车辆翻新轮胎质量,以碳纤维作为增强体,工程翻新轮胎胎面作为基本体,通过设计复合材料的配方、黏合体系和混炼工艺,分析了经改性处理的碳纤维对胎面橡胶基体力学性能的影响。构建了碳纤维与胎面橡胶复合强化混合物理模... 为了有效提高工程车辆翻新轮胎质量,以碳纤维作为增强体,工程翻新轮胎胎面作为基本体,通过设计复合材料的配方、黏合体系和混炼工艺,分析了经改性处理的碳纤维对胎面橡胶基体力学性能的影响。构建了碳纤维与胎面橡胶复合强化混合物理模型和分散物理模型。分析了碳纤维与胎面橡胶黏结状态及黏结机理。为获得高性能的碳纤维增强工程翻新轮胎奠定理论基础。 展开更多
关键词 车辆工程 碳纤维 工程车辆翻新轮胎 复合强化模型 黏合状态 增强机理
在线阅读 下载PDF
基于有模型强化学习的飞行器制导技术研究
4
作者 滕庆骅 惠俊鹏 +1 位作者 李天任 杨奔 《宇航总体技术》 2025年第2期26-34,共9页
面向避障、绕飞等任务驱动的飞行器在线轨迹,为了提升制导性能,适应快速变化的复杂场景,聚焦于充分利用飞行器模型中的已知信息,基于iLQR这种有模型强化学习方法,设计了智能化的制导方式。与无模型强化学习相比,有模型强化学习的可解释... 面向避障、绕飞等任务驱动的飞行器在线轨迹,为了提升制导性能,适应快速变化的复杂场景,聚焦于充分利用飞行器模型中的已知信息,基于iLQR这种有模型强化学习方法,设计了智能化的制导方式。与无模型强化学习相比,有模型强化学习的可解释性好,训练难度低。在单飞行器制导仿真中,相比TD3算法,iLQR方法飞行过程平均制导误差增加了28.07%,中末交班点误差降低到12.35%,提升幅度巨大;在多飞行器编队保持问题上,相比TD3算法,iLQR方法跟踪效果提升巨大,平均误差不超过TD3算法的22.67%,最大误差不超过TD3算法的15.44%。 展开更多
关键词 iLQR算法 模型强化学习 标准轨迹制导 强化学习制导 编队保持
在线阅读 下载PDF
爆炸荷载线性强化抗力模型梁构件动力系数研究
5
作者 耿少波 韩晓丹 +2 位作者 牛艳伟 韩云山 马林林 《计算力学学报》 CAS CSCD 北大核心 2024年第5期886-893,共8页
目前梁构件抗爆设计动力系数计算常采用理想弹塑性抗力模型,制约着塑性强化抗力构件的精细化抗爆设计。为解决线性强化抗力类型梁构件的爆炸作用动力系数计算问题,由抗力强化系数和阻尼比数值大小关系,分三种情况推导了柔性和刚性两类... 目前梁构件抗爆设计动力系数计算常采用理想弹塑性抗力模型,制约着塑性强化抗力构件的精细化抗爆设计。为解决线性强化抗力类型梁构件的爆炸作用动力系数计算问题,由抗力强化系数和阻尼比数值大小关系,分三种情况推导了柔性和刚性两类构件关于延性比的动力系数解析解。有限元分析及规范对比算例表明,本文推导理论公式精度较高,与抗爆设计规范公式计算结果趋势相似;延性比为1时,抗力强化系数与动力系数无关;延性比大于1且抗力强化系数小于0.01时,可忽略抗力强化系数的影响;延性比大于2时,需考虑阻尼参数后完成抗爆设计分析;延性比大于3时且抗力强化系数大于0.1时,线性强化抗力模型具有较好经济效益。 展开更多
关键词 线性强化抗力模型 爆炸荷载 动力系数 延性比 梁构件
在线阅读 下载PDF
基于幂强化本构模型的轴对称圆巷弹塑性解 被引量:13
6
作者 侯公羽 李晶晶 +3 位作者 杨悦 王亚潇 梁永辉 李庆伟 《岩土力学》 EI CAS CSCD 北大核心 2014年第1期134-142,共9页
轴对称圆巷的弹塑性求解的关键是选择合适的屈服准则。已经有诸多学者选择Mohr-Coulomb准则、Drucker-Prager准则和Hoek-Brown准则等,进行了相应的求解。为了探讨更符合工程实际需要的准则和求解,在考虑岩石材料的应变强化效应的条件下... 轴对称圆巷的弹塑性求解的关键是选择合适的屈服准则。已经有诸多学者选择Mohr-Coulomb准则、Drucker-Prager准则和Hoek-Brown准则等,进行了相应的求解。为了探讨更符合工程实际需要的准则和求解,在考虑岩石材料的应变强化效应的条件下,建立了轴对称圆巷的幂强化本构模型和基于Drucker-Prager屈服准则的幂强化-理想塑性模型,并进行了弹塑性求解。以工程实例为计算条件,将幂强化-理想塑性模型的计算结果与基于Mohr-Coulomb准则、Drucker-Prager准则的理想塑性模型和幂强化模型的计算结果分别进行了对比,分析幂强化参数对围岩弹塑性解的影响。研究表明,应变强化效应对围岩稳定性有较大影响,对于应变强化效应较强的岩石材料,采用幂强化模型分析更接近工程实际。 展开更多
关键词 岩石力学 弹塑性解 围岩应变强化 强化模型
在线阅读 下载PDF
颗粒增强金属基复合材料强化理论模型研究与发展 被引量:4
7
作者 向兆兵 聂俊辉 樊建中 《材料导报》 EI CAS CSCD 北大核心 2014年第19期1-4,共4页
简要介绍了等效夹杂、平均应力场以及应变梯度塑性理论等几种常用颗粒增强金属基复合材料强化理论模型的发展情况,总结了国内外学者对各强化理论模型的修正情况,讨论了各强化理论模型的优缺点以及适用性,提出了颗粒增强金属基复合材料... 简要介绍了等效夹杂、平均应力场以及应变梯度塑性理论等几种常用颗粒增强金属基复合材料强化理论模型的发展情况,总结了国内外学者对各强化理论模型的修正情况,讨论了各强化理论模型的优缺点以及适用性,提出了颗粒增强金属基复合材料强化理论模型的发展方向。 展开更多
关键词 金属基复合材料 强化理论模型 颗粒强化 等效夹杂
在线阅读 下载PDF
考虑渗流影响的幂强化-理想塑性模型圆形隧洞围岩弹塑性新解 被引量:6
8
作者 于旭光 郑宏 《长江科学院院报》 CSCD 北大核心 2021年第7期102-108,114,共8页
合理的强度准则在幂强化-理想塑性模型圆形隧洞围岩弹塑性分析中十分重要。为了得到适合该模型的强度准则,首先对4种常用岩土材料强度准则进行归纳总结,进而得到平面应变统一线性方程;然后考虑渗流影响,推导了幂强化-理想塑性模型圆形... 合理的强度准则在幂强化-理想塑性模型圆形隧洞围岩弹塑性分析中十分重要。为了得到适合该模型的强度准则,首先对4种常用岩土材料强度准则进行归纳总结,进而得到平面应变统一线性方程;然后考虑渗流影响,推导了幂强化-理想塑性模型圆形隧洞围岩处于塑性区、幂强化区时的应力、位移及塑性区半径的统一解;最后探讨了强度理论效应、幂强化参数和孔隙水压力对圆形隧洞围岩弹塑性分析的影响。研究结果表明:圆形隧洞围岩强度理论效应显著,经与有限元分析对比,应推荐使用Mogi-Coulomb准则、统一强度理论(b=1/2,c=0)准则、统一强度理论(b=1,c=0)准则;其次可使用内接圆DP2准则、等面积圆DP4准则,不建议使用内切圆DP3准则、Mohr-Coulomb准则,谨慎使用外接圆DP1准则、统一强度理论(b=1,c=1)准则;幂强化参数中幂强化系数m值对塑性区半径无影响,而塑性区位移随m值减小而增大,围岩塑性区半径和位移均随幂强化指数n值增大而增大;塑性区半径、径向应力和切向应力峰值均随孔隙水压力增大而增大。研究结果可为应变强化效应较强的圆形隧洞围岩支护设计提供重要的理论依据。 展开更多
关键词 圆形隧洞围岩 强度准则 渗流 强化-理想塑性模型 强化参数
在线阅读 下载PDF
金属基复合材料的强化机制 被引量:44
9
作者 陈剑锋 武高辉 +1 位作者 孙东立 姜龙涛 《航空材料学报》 EI CAS CSCD 2002年第2期49-53,共5页
复合材料的强化机制和强度预报一直是材料学的研究热点 ,因为这涉及到材料的组织设计问题。以往的研究对于金属基复合材料的强化机理有很多种说法 ,而且提出了大量的模型 ,但迄今为止缺乏一个统一而完善的理论。本文总结分析了近年来有... 复合材料的强化机制和强度预报一直是材料学的研究热点 ,因为这涉及到材料的组织设计问题。以往的研究对于金属基复合材料的强化机理有很多种说法 ,而且提出了大量的模型 ,但迄今为止缺乏一个统一而完善的理论。本文总结分析了近年来有关金属基复合材料的强化机制和一些相关的模型 。 展开更多
关键词 金属基复合材料 强化机制 强化模型 材料设计
在线阅读 下载PDF
碳纳米管增强镁基复合材料强化机制的解析法研究 被引量:5
10
作者 李维学 祝杰 +1 位作者 戴剑锋 王青 《材料导报》 EI CAS CSCD 北大核心 2012年第4期131-135,146,共6页
采用剪切滞后模型理论分析了碳纳米管增强镁基复合材料受载时作用在复合材料上各组分的应力;考虑复合材料各种强化机制,建立碳纳米管增强镁基复合材料的屈服强度模型,研究了各组分性能参数对复合材料屈服强度的影响。结果表明,CNTs的长... 采用剪切滞后模型理论分析了碳纳米管增强镁基复合材料受载时作用在复合材料上各组分的应力;考虑复合材料各种强化机制,建立碳纳米管增强镁基复合材料的屈服强度模型,研究了各组分性能参数对复合材料屈服强度的影响。结果表明,CNTs的长度对CNTs/Mg复合材料屈服强度的影响有限;碳纳米管层数越多或分散越稀疏越不利于提高复合材料的屈服强度;在一定范围内屈服强度随着温度差的增加而增加;CNTs的体积分数对复合材料屈服强度的影响存在最佳值。这表明该模型预测的复合材料屈服强度与实验结果较吻合。 展开更多
关键词 碳纳米管 镁基复合材料 屈服强度 强化机制 强化模型
在线阅读 下载PDF
基于强化LSTM的网络高隐蔽性入侵轨迹预测研究
11
作者 徐李阳 王晨飞 +2 位作者 穆松鹤 杨自兴 马建勋 《电子设计工程》 2024年第21期104-107,112,共5页
网络高隐蔽性入侵信息的维度难以确定,导致入侵轨迹预测困难增加,因此研究基于强化LSTM的网络高隐蔽性入侵轨迹预测方法。设置强化LSTM预测模型基础架构,根据历史数据特征取值结果,求解标记参数,利用这些参数标记入侵数据轨迹节点。确... 网络高隐蔽性入侵信息的维度难以确定,导致入侵轨迹预测困难增加,因此研究基于强化LSTM的网络高隐蔽性入侵轨迹预测方法。设置强化LSTM预测模型基础架构,根据历史数据特征取值结果,求解标记参数,利用这些参数标记入侵数据轨迹节点。确定高隐蔽性入侵行为的表现强度从而确定入侵向量。结合入侵信息维度实现网络高隐蔽性入侵轨迹预测。实验结果表明,在强化LSTM模型的作用下,高隐蔽性入侵信息维度的预测结果完全属于该信息所处轨迹维度参数实际取值范围之内,说明该方法的预测结果更为精准。 展开更多
关键词 强化LSTM模型 网络入侵轨迹 历史数据 入侵行为 入侵向量 信息轨迹维度
在线阅读 下载PDF
工程材料弹塑性应力应变模型分析 被引量:6
12
作者 周家泽 《武汉科技学院学报》 2003年第6期42-45,共4页
研究工程材料的弹塑性应力应变简化模型,主要包括理想弹塑性模型、线性强化弹塑性模 型、幂次强化模型与Ramberg-Osgood模型,以及应变的表示法。
关键词 工程材料 理想弹塑性模型 线性强化弹塑性模型 幂次强化模型 Ramberg-Osgood模型 模型分析
在线阅读 下载PDF
循环加载强化作用对花岗岩细观破坏影响的离散元研究
13
作者 张霄 于昊 +4 位作者 李壮 刘衍顺 张紫东 籍鑫雨 李相辉 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2022年第11期2303-2312,共10页
基于室内单轴压缩试验结果,采用离散元方法建立等效晶质模型(GBM).根据室内循环加卸载试验结果改进GBM模型晶内、晶间接触模型,建立能够准确表征循环加载强化作用的GBM强化模型,借此GBM强化模型揭示循环加载强化作用对花岗岩单轴压缩过... 基于室内单轴压缩试验结果,采用离散元方法建立等效晶质模型(GBM).根据室内循环加卸载试验结果改进GBM模型晶内、晶间接触模型,建立能够准确表征循环加载强化作用的GBM强化模型,借此GBM强化模型揭示循环加载强化作用对花岗岩单轴压缩过程细观破坏的影响机制.结果表明,在峰前应力阶段,自锁效应造成的应力分布不同,导致晶内/晶间接触出现以张拉为主的裂纹,石英、长石依次成为承载主体;在峰后应力阶段,前期强化作用所积蓄的剪切能量得到释放,导致长石出现密集的晶内裂纹,是试块失稳的主要标志;长石周边矿物差异性失效引起长石矿物破坏路径改变,造成试块峰值应力随强化系数增大呈现波动性增长.构建的GBM强化模型为研究循环加载强化作用对脆性岩石不同加载路径细观破坏机制提供新方法. 展开更多
关键词 花岗岩 循环加载强化作用 离散元 GBM强化模型 微裂纹特征 细观破坏机理
在线阅读 下载PDF
顾及沉积岩应变强化与扩容效应的围岩弹塑性力学状态理论分析 被引量:4
14
作者 唐胜兰 俞缙 +1 位作者 张建智 周雨晴 《华侨大学学报(自然科学版)》 CAS 北大核心 2016年第6期691-697,共7页
根据非关联流动法则与中主应力表达式,顾及沉积岩应变强化和扩容效应,推导基于幂强化-理想塑性本构模型和Drucker-Prager屈服准则的应力、位移、塑性区半径的解析解.将文中解、幂强化解、幂强化-理想塑性解进行比较,分析幂强化指数与扩... 根据非关联流动法则与中主应力表达式,顾及沉积岩应变强化和扩容效应,推导基于幂强化-理想塑性本构模型和Drucker-Prager屈服准则的应力、位移、塑性区半径的解析解.将文中解、幂强化解、幂强化-理想塑性解进行比较,分析幂强化指数与扩容角对解析解的影响规律.结果表明:幂强化指数对围岩稳定性有较大的影响;扩容程度的变化对围岩应力和位移的影响随着扩容角及原岩应力的增加而增大;当隧洞围岩受到应变强化和扩容效应共同影响时,幂强化指数与扩容角越大,隧洞围岩位移越为敏感,对围岩稳定十分不利. 展开更多
关键词 隧道工程 弹塑性解 中主应力 扩容 强化模型
在线阅读 下载PDF
考虑围岩应变强化及扩容的深埋软岩隧洞时变位移解 被引量:4
15
作者 唐胜兰 王海 +2 位作者 俞缙 张建智 蔡燕燕 《隧道建设》 北大核心 2017年第A01期72-78,共7页
为描述深埋软岩隧洞围岩时变位移受岩石应变强化与扩容协同影响的复杂力学过程,假设岩体为符合Burgers体与Drucker-Prager屈服准则组合的黏弹塑性模型,在考虑应变强化及扩容效应影响的初始应力场下,推导得到深埋软岩隧洞的黏弹塑性时变... 为描述深埋软岩隧洞围岩时变位移受岩石应变强化与扩容协同影响的复杂力学过程,假设岩体为符合Burgers体与Drucker-Prager屈服准则组合的黏弹塑性模型,在考虑应变强化及扩容效应影响的初始应力场下,推导得到深埋软岩隧洞的黏弹塑性时变位移解析解并进行分析。结果表明:该解析解能较好地描述软岩隧洞蠕变位移受岩体应变强化和扩容的影响。随着幂强化指数或剪胀角的增大,隧洞围岩的时效变形逐渐增大,且发展变快。隧洞围岩在应变强化和扩容效应的共同影响下,幂强化指数与剪胀角越大,其位移越敏感,且幂强化指数对围岩位移的敏感性更高。为验证该解析解的实用价值,与工程实测数据进行对比,结果显示计算值与实测值吻合较好,表明该解析解对深埋软岩隧洞时变位移预测具有一定的借鉴意义。 展开更多
关键词 深埋软岩隧道 应变强化 扩容效应 强化模型 时变位移解 剪胀角 强化指数
在线阅读 下载PDF
基于模型的功能磁共振成像方法研究综述 被引量:1
16
作者 陈富琴 张俊然 杨冰 《中国生物医学工程学报》 CAS CSCD 北大核心 2016年第3期340-347,共8页
基于模型的功能磁共振成像(f MRI)方法是新世纪以来在神经影像领域兴起的极具发展潜力的研究方法。相比传统的影像学方法,它可以深入探究特定的认知过程是如何在一个特定的脑区以及脑区环路中实现的,而不仅仅是标识某个任务活动的最终... 基于模型的功能磁共振成像(f MRI)方法是新世纪以来在神经影像领域兴起的极具发展潜力的研究方法。相比传统的影像学方法,它可以深入探究特定的认知过程是如何在一个特定的脑区以及脑区环路中实现的,而不仅仅是标识某个任务活动的最终激活脑区,并能揭示模型内部变量与神经影像数据之间的关联,为有效探测大脑功能活动提供重要手段。重点综述基于模型的f MRI方法的两类常用计算模型框架(单脑区建模包括强化学习模型和主观价值模型,脑区交互作用建模采用心理-生理交互作用模型),简述近年来该方法的应用状况和最新进展,并讨论该方法的不足及未来发展趋势。 展开更多
关键词 基于模型的功能磁共振成像方法 计算模型 强化学习模型 主观价值模型 心理-生理交互作用模型
在线阅读 下载PDF
基于强化学习的机器人曲面恒力跟踪研究 被引量:8
17
作者 张铁 肖蒙 +1 位作者 邹焱飚 肖佳栋 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2019年第10期1865-1873,1882,共10页
针对机器人末端执行器和曲面工件接触时难以得到恒定接触力的问题,建立机器人末端执行器与曲面工件的接触模型.构建曲面接触力坐标系与机器人传感器测量坐标系之间的关系,利用基于概率动力学模型的强化学习(PILCO)算法对模型输出参数与... 针对机器人末端执行器和曲面工件接触时难以得到恒定接触力的问题,建立机器人末端执行器与曲面工件的接触模型.构建曲面接触力坐标系与机器人传感器测量坐标系之间的关系,利用基于概率动力学模型的强化学习(PILCO)算法对模型输出参数与接触状态的关系进行学习,对部分接触状态进行预测,强化学习根据预测的状态优化机器人位移输入参数,得到期望跟踪力信号.实验中,将强化学习的输入状态改为一段时间内的状态平均值以减少接触状态下信号的干扰.实验结果表明,利用PILCO算法在迭代8次后能够得到较稳定的力,相比于模糊迭代算法收敛速度较快,力误差绝对值的平均值减少了29%. 展开更多
关键词 机器人 曲面跟踪 力控制 基于概率动力学模型强化学习(PILCO) 强化学习
在线阅读 下载PDF
基于颗粒流模拟的硬岩CWFS模型等效塑性参数优化研究 被引量:3
18
作者 冀东 苗胜军 +2 位作者 任奋华 杨志军 彭超 《矿冶工程》 CAS CSCD 北大核心 2013年第4期16-21,共6页
针对目前粘结强度弱化-摩擦强度强化(CWFS)本构模型中两个关键参数εpc和εpf的确定问题,以杏山铁矿-45 m水平采场区域为例,基于颗粒流理论,建立了片麻岩颗粒非均质几何模型,对片麻岩的三轴压缩试验进行模拟;结合AE声发射与PFC内置Crac... 针对目前粘结强度弱化-摩擦强度强化(CWFS)本构模型中两个关键参数εpc和εpf的确定问题,以杏山铁矿-45 m水平采场区域为例,基于颗粒流理论,建立了片麻岩颗粒非均质几何模型,对片麻岩的三轴压缩试验进行模拟;结合AE声发射与PFC内置Crack数量记录程序的监测结果,对PFC模拟和室内试验的应力-应变曲线规律进行了深入分析,揭示了片麻岩破裂过程中的细观力学特性与强度参数的劣化规律。最后,借助FLAC2D有限差分软件,对εpc和εpf的取值进行了优化和验证,确定优化后的εpc和εpf取值分别为0.015和0.037。经参数优化后的CWFS模型模拟的岩石单轴压缩应力-应变曲线与室内刚性试验曲线比较吻合。研究成果对CWFS模型今后工程应用的推广有一定的参考价值。 展开更多
关键词 颗粒流 粘结力弱化-摩擦强度强化(CWFS)模型 等效塑性参数 声发射 硬岩破裂机制
在线阅读 下载PDF
基于强化布鲁塞尔反应的区域知识创新系统演化研究 被引量:5
19
作者 苏屹 刘宝鼎 姜雪松 《研究与发展管理》 CSSCI 北大核心 2021年第3期43-57,共15页
依据协同学理论,在构建基于强化布鲁塞尔反应的区域知识创新系统演化模型的基础上,运用2013—2017年统计数据,测度31个省市区域知识创新能力指数。对模型进行推导和求解,并利用Matlab软件进行仿真分析,详细研究区域知识创新系统的演化... 依据协同学理论,在构建基于强化布鲁塞尔反应的区域知识创新系统演化模型的基础上,运用2013—2017年统计数据,测度31个省市区域知识创新能力指数。对模型进行推导和求解,并利用Matlab软件进行仿真分析,详细研究区域知识创新系统的演化规律。研究表明:知识产权保护程度作为系统强化因子对区域知识创新系统的演化具有正向作用,政府管控程度作为系统外部控制变量对区域知识创新系统的演化具有负向作用。基于仿真研究的结果,提出了促进区域知识创新系统演化的对策。 展开更多
关键词 区域知识创新系统 强化布鲁塞尔反应模型 协同学 序参量方程 知识产权保护
在线阅读 下载PDF
基于平均场内生奖励的多智能体强化学习算法
20
作者 孙文绮 李大鹏 +1 位作者 田峰 丁良辉 《无线电通信技术》 2023年第3期556-565,共10页
针对复杂的多智能体应用场景中只依靠根据最终目标设计的简单奖励函数无法对智能体学习策略做出有效引导的问题,提出了一种基于平均场内生奖励的多智能体强化学习(Model-based Multi-agent Mean-field Intrinsic Reward Upper Confidenc... 针对复杂的多智能体应用场景中只依靠根据最终目标设计的简单奖励函数无法对智能体学习策略做出有效引导的问题,提出了一种基于平均场内生奖励的多智能体强化学习(Model-based Multi-agent Mean-field Intrinsic Reward Upper Confidence Reinforcement Learning, M3IR-UCRL)算法。该算法在奖励函数中增加了内生奖励模块,用生成的内生奖励与定义任务的外部奖励一起帮助代表智能体在用平均场控制(Mean-Field Control, MFC)化简的多智能体系统中学习策略。智能体学习时首先按照期望累积内外奖励加权和的梯度方向更新策略参数,然后按照期望累积外部奖励的梯度方向更新内生奖励参数。仿真结果表明,相比于只用简单外部奖励引导智能体学习的(Model-based Multi-agent Mean-field Intrinsic Reward Upper Confidence Reinforcement Learning, M3-UCRL)算法,所提算法可以有效提高智能体在复杂的多智能体场景中的任务完成率,降低与周围环境的碰撞率,从而使算法的整体性能得到提升。 展开更多
关键词 多智能体系统 平均场控制 基于模型强化学习 内生奖励
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部