期刊文献+
共找到32篇文章
< 1 2 >
每页显示 20 50 100
基于DDQN-D^(3)PG的无人机空战分层决策
1
作者 王昱 李远鹏 +2 位作者 郭中宇 李硕 任田君 《兵工学报》 北大核心 2025年第8期66-76,共11页
强化学习在无人机空战应用中面临僵化的奖励函数与单一模型难以处理高维连续状态空间中复杂任务的挑战,严重限制了算法在动态多变态势下的决策泛化能力。针对上述问题,融合分层式与分布式架构的精髓,提出一种集成深度双Q网络(Double Dee... 强化学习在无人机空战应用中面临僵化的奖励函数与单一模型难以处理高维连续状态空间中复杂任务的挑战,严重限制了算法在动态多变态势下的决策泛化能力。针对上述问题,融合分层式与分布式架构的精髓,提出一种集成深度双Q网络(Double Deep Q-Network,DDQN)与深度确定性策略梯度(Deep Deterministic Policy Gradient,DDPG)算法的自主决策框架。根据敌我双方在不同态势下的优势差异,设计一系列基于不同奖励函数权重组合的DDPG算法模型,并以此构建底层分布式深度确定性策略梯度(Distributed DDPG,D^(3)PG)决策网络。引入擅长处理离散动作空间的DDQN算法构建上层决策网络,根据实时态势变化自主地选择并切换至最合适的底层策略模型,实现决策的即时调整与优化。为进一步提升红蓝双方无人机近距离空战环境的真实性与挑战性,在DDPG算法的训练中引入自我博弈机制,构建具备高度智能化的敌方决策模型。实验结果表明,新算法在无人机与智能化对手的博弈对抗中胜率最高达96%,相较D^(3)PG等算法提升20%以上,且在多种初始态势下均能稳定战胜对手,充分验证了该方法的有效性和先进性。 展开更多
关键词 无人机空战 强化学习 分层决策 深度双q网络 分布式深度确定性策略梯度
在线阅读 下载PDF
基于修正型FR共轭梯度法的时间域粘声多参数全波形反演研究 被引量:1
2
作者 李振春 赵贤阳 +3 位作者 张春燕 张凯 徐夷鹏 孟繁琨 《石油物探》 北大核心 2025年第2期247-256,共10页
实际地下介质具有粘滞性,研究粘声介质下的全波形反演方法具有实际意义。针对全波形反演中Hessian矩阵计算复杂、共轭梯度法收敛速度慢等问题,将修正型FR共轭梯度法应用到全波形反演中。修正型FR共轭梯度法使用了更多的梯度信息,具有和... 实际地下介质具有粘滞性,研究粘声介质下的全波形反演方法具有实际意义。针对全波形反演中Hessian矩阵计算复杂、共轭梯度法收敛速度慢等问题,将修正型FR共轭梯度法应用到全波形反演中。修正型FR共轭梯度法使用了更多的梯度信息,具有和拟牛顿法相似的结构和性质,在加快收敛速度的同时可以提升反演效果,计算量仅有少量增加。采用该方法进行了标准线性固体(SLS)模型的时间域粘声多参数全波形反演的研究。模型测试结果表明相对于常规FR共轭梯度法,修正后的方法可以得到更精确的反演结果,加快收敛速度的同时深部反演效果更好,并通过两步法反演策略进一步提高了品质因子的反演效果。 展开更多
关键词 全波形反演 粘声波方程 速度 品质因子 修正型FR共轭梯度法
在线阅读 下载PDF
一种基于线性函数逼近的离策略Q(λ)算法 被引量:26
3
作者 傅启明 刘全 +3 位作者 王辉 肖飞 于俊 李娇 《计算机学报》 EI CSCD 北大核心 2014年第3期677-686,共10页
将函数逼近用于强化学习是目前机器学习领域的一个新的研究热点.针对传统的基于查询表及函数逼近的Q(λ)学习算法在大规模状态空间中收敛速度慢或者无法收敛的问题,提出一种基于线性函数逼近的离策略Q(λ)算法.该算法通过引入重要性关... 将函数逼近用于强化学习是目前机器学习领域的一个新的研究热点.针对传统的基于查询表及函数逼近的Q(λ)学习算法在大规模状态空间中收敛速度慢或者无法收敛的问题,提出一种基于线性函数逼近的离策略Q(λ)算法.该算法通过引入重要性关联因子,在迭代次数逐步增长的过程中,使得在策略与离策略相统一,确保算法的收敛性.同时在保证在策略与离策略的样本数据一致性的前提下,对算法的收敛性给予理论证明.将文中提出的算法用于Baird反例、Mountain-Car及Random Walk仿真平台,实验结果表明,该算法与传统的基于函数逼近的离策略算法相比,具有较好的收敛性;与传统的基于查询表的算法相比,具有更快的收敛速度,且对于状态空间的增长具有较强的鲁棒性. 展开更多
关键词 强化学习 函数逼近 离策略 q(A)算法 机器学习中图法
在线阅读 下载PDF
基于Q-RBF神经网络模型的国产大豆价格预测研究 被引量:4
4
作者 张冬青 刘欢 张云清 《大豆科学》 CAS CSCD 北大核心 2017年第1期143-149,共7页
大豆是重要的经济作物,同时也是我国市场化和国际化程度最高的大宗农产品,对其价格进行预测具有重要意义。采用Q-RBF神经网络模型对国产大豆价格进行预测,该模型具有如下两个特点:(1)通过分位数回归功能来描述大豆在不同价格水平下的分... 大豆是重要的经济作物,同时也是我国市场化和国际化程度最高的大宗农产品,对其价格进行预测具有重要意义。采用Q-RBF神经网络模型对国产大豆价格进行预测,该模型具有如下两个特点:(1)通过分位数回归功能来描述大豆在不同价格水平下的分布特征;(2)通过RBF神经网络结构来刻画大豆价格的非线性关系。在模型参数优化时,由于遗传算法是一种全局搜索优化方法,但是搜索速度慢、对初始值具有一定依赖性;而梯度下降法具有收敛快,对初始值没有特定要求等优点,所以本文提出遗传算法与梯度下降法相结合的混合改进算法,其基本思想是利用梯度下降法的局部寻优能力加快遗传算法的收敛速度。采用2010年1月-2015年12月的国产大豆月度价格数据进行预测研究,结果表明,算法收敛速度较快,模型预测精度较高,是可以泛化应用的预测模型。 展开更多
关键词 预测 q—RBF神经网络 梯度下降法 遗传算法 概率密度函数
在线阅读 下载PDF
迭代再权共轭梯度q范数正则化线性最小二乘–支持向量机分类算法 被引量:1
5
作者 刘建伟 黎海恩 +2 位作者 刘媛 付捷 罗雄麟 《控制理论与应用》 EI CAS CSCD 北大核心 2014年第3期334-342,共9页
L2范数罚最小二乘–支持向量机(least square support vector machine algorithm,LS–SVM)分类器是得到广泛研究和使用的机器学习算法,其算法中正则化阶次是事先给定的,预设q=2.本文提出q范数正则化LS–SVM分类器算法,0<q<∞,把q... L2范数罚最小二乘–支持向量机(least square support vector machine algorithm,LS–SVM)分类器是得到广泛研究和使用的机器学习算法,其算法中正则化阶次是事先给定的,预设q=2.本文提出q范数正则化LS–SVM分类器算法,0<q<∞,把q取值扩大到有理数范围.利用网格法改变正则化权衡参数c和正则化阶次q的值,在所选的c和q值上,使用迭代再权方法求解分类器目标函数,找出最小分类预测误差值,使预测误差和特征选择个数两个性能指标得到提高.通过对不同领域的实际数据进行实验,可以看到提出的分类算法分类预测更加准确同时可以实现特征选择,性能优于L2范数罚LS–SVM. 展开更多
关键词 q范数正则化 最小二乘-支持向量机(LS-SVM) 迭代再权共轭梯度法
在线阅读 下载PDF
航空混合动力系统能量管理策略研究综述 被引量:1
6
作者 张丁予 沈挺 《航空发动机》 北大核心 2025年第1期12-20,共9页
能量管理策略作为航空混合动力系统的顶层控制,用于对混合动力系统不同动力源进行能量分流,是保证系统高效运行的基础。详细论述了各类航空混合动力系统能量管理策略,系统总结了基于规则、优化和智能3类能量管理策略的特点和研究现状。... 能量管理策略作为航空混合动力系统的顶层控制,用于对混合动力系统不同动力源进行能量分流,是保证系统高效运行的基础。详细论述了各类航空混合动力系统能量管理策略,系统总结了基于规则、优化和智能3类能量管理策略的特点和研究现状。通过阐述强化学习原理,分析了深度Q网络算法和深度确定性策略梯度算法的奖励原理、神经网络更新原理、以及各自优缺点及适用场景,并提出基于规则类能量管理策略对于专家经验依赖性较高等缺陷,可以通过将其与基于智能算法内部创新融合进行缓解的措施。在此基础上,展望了能量管理策略的未来发展趋势为智能内部算法、智能与其他类型算法的融合创新等,可以为后续航空混动系统能量管理策略研究提供一定的参考。 展开更多
关键词 能量管理策略 深度q网络算法 深度确定性策略梯度算法 强化学习 航空混合动力系统
在线阅读 下载PDF
一类具有连续p(x)-增长条件的积分泛函的球面Q-极小的局部高阶可积性
7
作者 张子叶 王梅 《山东科技大学学报(自然科学版)》 CAS 2008年第4期78-81,共4页
给出了一类具有连续p(x)-增长条件的积分泛函,通过引理1、Sobolev-Poincaré不等式及反向H lder不等式证明了满足一定条件的此类积分泛函的球面Q-极小的局部高阶可积性。
关键词 积分泛函 球面q-极小 局部高阶可积性
在线阅读 下载PDF
基于二阶时序差分误差的双网络DQN算法 被引量:5
8
作者 陈建平 周鑫 +3 位作者 傅启明 高振 付保川 吴宏杰 《计算机工程》 CAS CSCD 北大核心 2020年第5期78-85,93,共9页
针对深度Q网络(DQN)算法因过估计导致收敛稳定性差的问题,在传统时序差分(TD)的基础上提出N阶TD误差的概念,设计基于二阶TD误差的双网络DQN算法。构造基于二阶TD误差的值函数更新公式,同时结合DQN算法建立双网络模型,得到两个同构的值... 针对深度Q网络(DQN)算法因过估计导致收敛稳定性差的问题,在传统时序差分(TD)的基础上提出N阶TD误差的概念,设计基于二阶TD误差的双网络DQN算法。构造基于二阶TD误差的值函数更新公式,同时结合DQN算法建立双网络模型,得到两个同构的值函数网络分别用于表示先后两轮的值函数,协同更新网络参数,以提高DQN算法中值函数估计的稳定性。基于Open AI Gym平台的实验结果表明,在解决Mountain Car和Cart Pole问题方面,该算法较经典DQN算法具有更好的收敛稳定性。 展开更多
关键词 深度强化学习 马尔科夫决策过程 深度q网络 二阶时序差分误差 梯度下降
在线阅读 下载PDF
基于模拟退火算法的I/Q不平衡校正 被引量:5
9
作者 黄家骏 腾来 +2 位作者 张朝杰 王春晖 朴成勇 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2018年第11期2218-2225,共8页
零中频发射机架构是目前集成度最高的发射机架构之一,直流偏置不平衡和I/Q不平衡的问题会大大降低其发射效率,并且会产生显著的镜像干扰信号、本振泄露信号和与有用信号同频的干扰信号.为了解决零中频发射机架构的I/Q不平衡问题,提出利... 零中频发射机架构是目前集成度最高的发射机架构之一,直流偏置不平衡和I/Q不平衡的问题会大大降低其发射效率,并且会产生显著的镜像干扰信号、本振泄露信号和与有用信号同频的干扰信号.为了解决零中频发射机架构的I/Q不平衡问题,提出利用发射机和接收机射频前端的反馈回路,在数字域使用模拟退火算法(SAA)对I/Q不平衡的补偿因子进行闭环搜索,提出I/Q不平衡校正的新方法.在Simulink软件中进行建模仿真,模拟结果表明,所提方法在不同强度的高斯白噪声条件下能够有效地对I/Q不平衡进行校正.在LMS7002M集成式收发芯片的基础上,搭建了所需要的零中频发射机校正实验平台.实验结果表明,所提方法具有良好的温度适应性和频率适应性,在-20~50℃的温度条件下,所提方法的平均镜像抑制度为-60.5 dBc;在1 600~2 400 MHz的频率条件下,平均镜像抑制度为-57.5 dBc. 展开更多
关键词 模拟退火算法 梯度下降法 I/q不平衡 零中频发射机 最优代理化
在线阅读 下载PDF
基于元Q学习与DDPG的机械臂接近技能学习方法 被引量:2
10
作者 李茂捷 徐国政 +1 位作者 高翔 谭彩铭 《南京邮电大学学报(自然科学版)》 北大核心 2023年第1期96-103,共8页
针对深度强化学习方法在机械臂的接近技能学习中普遍存在的样本效率低、泛化性差的问题,提出一种基于元Q学习的技能学习方法。首先利用结合后视经验回放(Hindsight Experience Replay, HER)的DDPG训练机械臂以指定姿态到达目标点,验证... 针对深度强化学习方法在机械臂的接近技能学习中普遍存在的样本效率低、泛化性差的问题,提出一种基于元Q学习的技能学习方法。首先利用结合后视经验回放(Hindsight Experience Replay, HER)的DDPG训练机械臂以指定姿态到达目标点,验证了算法在接近任务中的有效性;其次,在相关任务集上构造多任务目标作为优化对象,利用结合HER的DDPG训练模型,得到泛化性强的元训练模型和元训练数据,此外利用GRU获取轨迹上下文变量;最后,先在新任务上进行少量训练,再利用元训练数据训练模型进一步提升性能。仿真实验表明,在初始性能、学习速率和收敛性能三方面元Q学习均带来明显提升,其中达到期望性能所需样本量降低77%,平均成功率提高15%。 展开更多
关键词 机器人学习 元强化学习 深度确定性策略梯度 q学习 样本效率
在线阅读 下载PDF
基于残差梯度法的神经网络Q学习算法 被引量:3
11
作者 司彦娜 普杰信 臧绍飞 《计算机工程与应用》 CSCD 北大核心 2020年第18期137-142,共6页
针对连续状态空间的非线性系统控制问题,提出一种基于残差梯度法的神经网络Q学习算法。该算法采用多层前馈神经网络逼近Q值函数,同时利用残差梯度法更新神经网络参数以保证收敛性。引入经验回放机制实现神经网络参数的小批量梯度更新,... 针对连续状态空间的非线性系统控制问题,提出一种基于残差梯度法的神经网络Q学习算法。该算法采用多层前馈神经网络逼近Q值函数,同时利用残差梯度法更新神经网络参数以保证收敛性。引入经验回放机制实现神经网络参数的小批量梯度更新,有效减少迭代次数,加快学习速度。为了进一步提高训练过程的稳定性,引入动量优化。此外,采用Softplus函数代替一般的ReLU激活函数,避免了ReLU函数在负数区域值恒为零所导致的某些神经元可能永远无法被激活,相应的权重参数可能永远无法被更新的问题。通过CartPole控制任务的仿真实验,验证了所提算法的正确性和有效性。 展开更多
关键词 q学习 神经网络 值函数近似 残差梯度法 经验回放
在线阅读 下载PDF
基于近似梯度下降法的ℓ_(q)范数约束的压缩鬼成像
12
作者 尹陆媛 黄晓鸣 《科学技术与工程》 北大核心 2023年第12期5110-5117,共8页
由于鬼成像在图像重构领域的优异表现,因此一直是研究的热点之一。近年来,有学者也将鬼成像与压缩感知理论相结合,提出了压缩鬼成像技术。为了以最少的测量值获得最优的重建效果,学者们提出了很多图像重构算法,其中应用最为广泛的是基于... 由于鬼成像在图像重构领域的优异表现,因此一直是研究的热点之一。近年来,有学者也将鬼成像与压缩感知理论相结合,提出了压缩鬼成像技术。为了以最少的测量值获得最优的重建效果,学者们提出了很多图像重构算法,其中应用最为广泛的是基于ℓ_(1)范数或核范数的重构算法,因其凸性和光滑性在很多领域都有很好应用效果。非凸的ℓ_(q)(0<q<1)约束可能具有更好的效果。在满足相同限制等距性(restricted isometry property,RIP)的测量矩阵的条件下,ℓ_(q)约束实现重建所需要的测量值更少,并且相较于ℓ_(1)约束,ℓ_(q)范数的限制等距性条件更为宽松。为此,利用ℓ_(q)范数约束来进行压缩鬼成像,并介绍了ℓ_(q)范数的近似点算子和近似梯度下降算法,通过实验验证该算法对进行压缩鬼成像的可行性,对比分析各种不同算法在不同类型的图像之间的重建效果。 展开更多
关键词 压缩鬼成像 ℓ_(q)范数 非凸约束 近似点算子 梯度下降法
在线阅读 下载PDF
基于斜坡渐变扰动的新型电力系统等效惯量评估 被引量:4
13
作者 刘勃 陈中 +2 位作者 王毅 周涛 谭林林 《电力自动化设备》 EI CSCD 北大核心 2024年第3期49-56,共8页
基于阶跃扰动的惯量评估方式依赖难以准确测量的初始频率变化率(RoCoF)与稀少的频率事件,而基于类噪声扰动的惯量评估方法无法评估电流源型虚拟惯量且对数据要求高。对此,提出基于可再生能源机组主动输出斜坡渐变扰动功率的惯量评估方... 基于阶跃扰动的惯量评估方式依赖难以准确测量的初始频率变化率(RoCoF)与稀少的频率事件,而基于类噪声扰动的惯量评估方法无法评估电流源型虚拟惯量且对数据要求高。对此,提出基于可再生能源机组主动输出斜坡渐变扰动功率的惯量评估方法。建立含RoCoF与斜坡渐变扰动功率的等效惯量评估基础模型。考虑RoCoF噪声阶跃易导致等效惯量评估产生较大误差,推导双二阶广义积分锁相环中的q轴电压分量变化量与RoCoF的线性关系,并将其代入基础评估模型替代RoCoF。采用改进的非线性最小二乘拟合斜坡渐变扰动下q轴电压分量变化量与时间的非线性表达式,从拟合的表达式中提取系统等效惯量。在改进的EPRI-36中验证了所提评估方法相较于常规方法的优越性。 展开更多
关键词 新型电力系统 等效惯量 斜坡渐变扰动 惯量评估 q轴电压分量 频率变化率
在线阅读 下载PDF
基于贝叶斯深度强化学习的主动配电网电压控制 被引量:3
14
作者 张晓 吴志 +3 位作者 郑舒 顾伟 胡博 董吉超 《电力系统自动化》 EI CSCD 北大核心 2024年第20期81-90,共10页
多分布式源荷接入导致配电网电压波动性增强。同时,上级主网电压的不确定性波动也会对配电网电压特性造成影响。为有效应对主配电网电压波动,文中提出一种基于数据驱动与模型求解结合的主动配电网多时间尺度电压控制框架。在慢时间尺度... 多分布式源荷接入导致配电网电压波动性增强。同时,上级主网电压的不确定性波动也会对配电网电压特性造成影响。为有效应对主配电网电压波动,文中提出一种基于数据驱动与模型求解结合的主动配电网多时间尺度电压控制框架。在慢时间尺度下,考虑主网电压波动,构建了上级主网非无穷大系统多馈线环境,对该环境下的电压控制问题进行了对抗性马尔可夫过程建模。在训练过程中,以投影梯度下降算法使主网电压发生扰动。利用贝叶斯深度Q网络算法感知上级主网电压波动,实现有载调压变压器挡位快速控制。在快时间尺度下,基于传统二阶锥优化方法控制光伏逆变器无功输出。算例结果表明,该方法可准确感知上级主网电压波动,在极短时间实现配电网无模型电压控制,保证各节点电压维持在安全范围内。 展开更多
关键词 主动配电网 电压控制 多时间尺度 对抗性马尔可夫过程 投影梯度下降 贝叶斯深度q网络 深度强化学习
在线阅读 下载PDF
深度强化学习下连续和离散相位RIS毫米波通信
15
作者 胡浪涛 杨瑞 +3 位作者 刘全金 吴建岚 嵇文 吴磊 《电子科技大学学报》 EI CAS CSCD 北大核心 2024年第1期50-59,共10页
在分布式智能反射面(RIS)辅助多用户毫米波(mmWave)系统中,利用深度强化学习(DRL)理论学习并调整基站发射波束赋形矩阵和RIS相位偏转矩阵,联合优化发射波束赋形和相位偏转,实现加权和速率最大化。即在离散动作空间中,设计了功率码本与... 在分布式智能反射面(RIS)辅助多用户毫米波(mmWave)系统中,利用深度强化学习(DRL)理论学习并调整基站发射波束赋形矩阵和RIS相位偏转矩阵,联合优化发射波束赋形和相位偏转,实现加权和速率最大化。即在离散动作空间中,设计了功率码本与相位码本,提出了用深度Q网络(DQN)算法进行优化发射波束赋形与RIS相位偏转矩阵;在连续动作空间中,采用双延迟策略梯度(TD3)算法进行优化发射波束赋形与RIS相位偏转矩阵。仿真分析比较了在不同码本比特数下离散动作空间和连续动作空间下系统的加权和速率。与传统的凸优化算法以及迫零波束赋形随机相位偏转算法进行了对比,强化学习算法的和速率性能有明显提升,连续的TD3算法的和速率超过凸优化算法23.89%,在码本比特数目为4时,离散的DQN算法性能也优于传统的凸优化算法。 展开更多
关键词 深度q网络(DqN) 深度强化学习 双延迟策略梯度 毫米波 智能反射面
在线阅读 下载PDF
基于改进共轭梯度思想的滑动平均模型参数估计优化方法 被引量:5
16
作者 单锐 施苏桐 刘文 《兰州理工大学学报》 CAS 北大核心 2014年第1期144-147,共4页
为了提高滑动平均模型ARMA(p,q)的预测精度,将模型参数估计转化为无约束优化问题,结合非线性规划中的共轭方向思想,提出一种改进的共轭梯度法:即结合不同共轭梯度法的优势,提出新的参数标量和搜索方向迭代公式,并证明该方法的全局收敛性... 为了提高滑动平均模型ARMA(p,q)的预测精度,将模型参数估计转化为无约束优化问题,结合非线性规划中的共轭方向思想,提出一种改进的共轭梯度法:即结合不同共轭梯度法的优势,提出新的参数标量和搜索方向迭代公式,并证明该方法的全局收敛性.用此改进方法来修正原始ARMA(p,q)模型的参数估计值,给出数值算例,进一步验证所提方法的有效性. 展开更多
关键词 ARMA(p q)模型 共轭梯度法 全局收敛 参数估计 非线性规划
在线阅读 下载PDF
巴朗山川滇高山栎群落水平结构的海拔梯度特征 被引量:3
17
作者 刘兴良 刘向东 +4 位作者 何飞 周世强 杨启东 黄光忠 薛樵 《四川林业科技》 2009年第1期1-7,共7页
采用标准地法对卧龙自然保护区4个海拔梯度川滇高山栎群落水平结构进行了研究,结果表明:(1)在各个海拔梯度上物种以川滇高山栎为主,其相对密度分别为61.40、65.67、77.21和62.27;随海拔升高伴生木本植物种类逐渐减少,从11种减少到3种。... 采用标准地法对卧龙自然保护区4个海拔梯度川滇高山栎群落水平结构进行了研究,结果表明:(1)在各个海拔梯度上物种以川滇高山栎为主,其相对密度分别为61.40、65.67、77.21和62.27;随海拔升高伴生木本植物种类逐渐减少,从11种减少到3种。(2)有随海拔升高,川滇高山栎群落物种相对频度大于2.0以上的物种数量具有先升高后降低的趋势,川滇高山栎是各个梯度出现频度最大的物种。(3)川滇高山栎群落物种重要值大于5.0以上的物种数量具有随海拔升高先升高后降低的趋势,川滇高山栎在从低到高的4个海拔梯度上重要值分别为68.47、80.37、119.93和84.01。(4)林分平均树高和林分平均地径具有随海拔升高而降低的趋势,海拔每升高100 m树高和基径分别平均降低0.18 m和0.22 cm。(5)按株频度计算,在巴朗山阳坡各个海拔梯度的川滇高山栎种群多为聚集分布;而丛频度计算,在高海拔和低海拔地带川滇高山栎种群格局呈聚集分布,在中等海拔区域川滇高山栎种群格局呈随机分布或均匀分布。 展开更多
关键词 海拔梯度 群落 水平结构 川滇高山栎 卧龙自然保护区
在线阅读 下载PDF
HTI介质的P波衰减特征分析及应用研究 被引量:2
18
作者 汪勇 《科学技术与工程》 北大核心 2015年第1期144-148,共5页
本文依据Hudson模型假设,讨论了P波在HTI介质中的衰减特征,其大小可以用品质因子Q进行度量。通过分析得到了P波衰减与裂隙参数(裂隙密度、裂隙宽高比,等)、观测夹角及入射角之间的关系。从理论上分析了P波衰减与观测夹角之间的关系,认... 本文依据Hudson模型假设,讨论了P波在HTI介质中的衰减特征,其大小可以用品质因子Q进行度量。通过分析得到了P波衰减与裂隙参数(裂隙密度、裂隙宽高比,等)、观测夹角及入射角之间的关系。从理论上分析了P波衰减与观测夹角之间的关系,认为沿裂隙走向会产生最大的衰减,并且推导了利用两条正交的测线确定裂隙走向的计算方法,为利用QVOA方法分析裂缝发育方向奠定了理论依据。 展开更多
关键词 HTI介质 裂缝预测 品质因子 qVOA q值梯度
在线阅读 下载PDF
卧龙巴郎山川滇高山栎叶片营养元素的海拔梯度变化特征 被引量:6
19
作者 刘千里 徐雪梅 +2 位作者 刘兴良 文智猷 刘世荣 《四川林业科技》 2012年第3期1-6,共6页
本文通过对卧龙自然保护区不同海拔分布梯度上的川滇高山栎不同年龄叶片营养元素含量的研究表明:(1)当年生叶营养元素含量大小排序为N>K>Ca>P>Mg,分别为1.45%、0.75%、0.49%、0.17%和0.13%;N、P含量随海拔呈现先下降后升高... 本文通过对卧龙自然保护区不同海拔分布梯度上的川滇高山栎不同年龄叶片营养元素含量的研究表明:(1)当年生叶营养元素含量大小排序为N>K>Ca>P>Mg,分别为1.45%、0.75%、0.49%、0.17%和0.13%;N、P含量随海拔呈现先下降后升高的趋势,即在海拔2 400 m和2 800 m较低;K含量随海拔升高而升高;Ca、Mg含量随海拔升高而降低。(2)老叶营养元素含量大小排序为N>Ca>K>P>Mg,分别为1.08%、0.79%、0.40%、0.16%和0.11%;N含量随海拔升高而升高;P、K、Ca、Mg含量呈现先升高后下降的趋势,即在海拔2 400 m和2 800 m较高。(3)N、K、Mg含量呈现当年生叶比老叶高的趋势;P含量除2 600 m以外,老叶的含量比1年生叶低;Ca含量在海拔2 400 m以上出现老叶比1年生叶高,海拔2 000 m为1年生叶比老叶高;(4)N/P比值,当年生叶范围在7.83~9.50,随着海拔的升高而降低;老叶范围在5.25~9.00,具有随着海拔的升高先下降后升高的趋趋势。C/N比值,当年生叶范围在31.91~40.18,老叶范围在44.34~56.04,总趋势为随着海拔的升高而降低。P/K比值,当年生叶范围在0.20~0.28,老叶范围在0.31~0.48;当年生叶随着海拔升高呈现先降低后升高的趋势;老叶随着海拔升高呈现先升高后降低的趋势。K/Ca比值,当年生叶范围在0.83~3.91,老叶范围在0.39~0.65;当年生叶随着海拔的升高而增大,老叶随着海拔升高呈现先升高后降低的趋势。K/Mg比值,当年生叶范围在3.56~10.75,老叶范围在2.50~6.00,总趋势为随着海拔的升高而增大。 展开更多
关键词 川滇高山栎 营养元素含量 海拔梯度 卧龙自然保护区
在线阅读 下载PDF
深度强化学习算法在智能军事决策中的应用 被引量:8
20
作者 况立群 李思远 +2 位作者 冯利 韩燮 徐清宇 《计算机工程与应用》 CSCD 北大核心 2021年第20期271-278,共8页
深度强化学习算法能够很好地实现离散化的决策行为,但是难以运用于高度复杂且行为连续的现代战场环境,同时多智能体环境下算法难以收敛。针对这些问题,提出了一种改进的深度确定策略梯度(DDPG)算法,该算法引入了基于优先级的经验重放技... 深度强化学习算法能够很好地实现离散化的决策行为,但是难以运用于高度复杂且行为连续的现代战场环境,同时多智能体环境下算法难以收敛。针对这些问题,提出了一种改进的深度确定策略梯度(DDPG)算法,该算法引入了基于优先级的经验重放技术和单训练模式,以提高算法收敛速度;同时算法中还设计了一种混合双噪声的探索策略,从而实现复杂且连续的军事决策控制行为。采用Unity开发了基于改进DDPG算法的智能军事决策仿真平台,搭建了蓝军步兵进攻红军军事基地的仿真环境,模拟多智能体的作战训练。实验结果显示,该算法能够驱动多作战智能体完成战术机动,实现绕过障碍物抵达优势区域进行射击等战术行为,算法拥有更快的收敛速度和更好的稳定性,可得到更高的回合奖励,达到了提高智能军事决策效率的目的。 展开更多
关键词 深度强化学习 深度q网络 深度确定策略梯度 智能军事决策 多智能体
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部