期刊文献+
共找到69篇文章
< 1 2 4 >
每页显示 20 50 100
近邻中心迭代策略的单标注视频行人重识别 被引量:7
1
作者 张云鹏 王洪元 +4 位作者 张继 陈莉 吴琳钰 顾嘉晖 陈强 《软件学报》 EI CSCD 北大核心 2021年第12期4025-4035,共11页
为解决视频行人重识别数据集标注困难的问题,提出了基于单标注样本视频行人重识别的近邻中心迭代策略.该策略逐步利用伪标签视频片段迭代更新网络结构,以获得最佳的模型.针对预测无标签视频片段的伪标签准确率低的问题,提出了一种标签... 为解决视频行人重识别数据集标注困难的问题,提出了基于单标注样本视频行人重识别的近邻中心迭代策略.该策略逐步利用伪标签视频片段迭代更新网络结构,以获得最佳的模型.针对预测无标签视频片段的伪标签准确率低的问题,提出了一种标签评估方法:每次训练后,将所选取的伪标签视频片段和有标签视频片段特征中每个类的中心点作为下一次训练中预测伪标签的度量中心点;同时提出基于交叉熵损失和在线实例匹配损失的损失控制策略,使得训练过程更加稳定,无标签数据的伪标签预测准确率更高.在MARS,DukeMTMC-VideoReID这两个大型数据集上的实验验证了该方法相比于最新的先进方法,在性能上得到非常好的提升. 展开更多
关键词 视频行人重识别 近邻中心迭代策略 标签评估方法 单标注 损失控制策略
在线阅读 下载PDF
基于新迭代策略的IRA码改进译码算法
2
作者 包志祥 吕娜 陈柯帆 《科学技术与工程》 北大核心 2015年第21期159-163,共5页
IRA码的译码通常采用BP译码算法,然而BP译码算法复杂度高,硬件电路实现困难。最小和译码算法虽然降低了运算复杂度和硬件实现难度,但是其牺牲了部分译码性能。五线段近似算法对BP算了做了近似简化,然而其复杂度依然偏高。提出了一种基... IRA码的译码通常采用BP译码算法,然而BP译码算法复杂度高,硬件电路实现困难。最小和译码算法虽然降低了运算复杂度和硬件实现难度,但是其牺牲了部分译码性能。五线段近似算法对BP算了做了近似简化,然而其复杂度依然偏高。提出了一种基于五线段近似和最小和的改进译码算法,在降低系统译码复杂度的同时,保持较高的译码性能。仿真结果表明,改进的译码算法在降低了复杂度的情况下,仍能得到较高的译码性能。 展开更多
关键词 重复累计码 置信传播译码算法 五线段近似译码算法 最小和算法 迭代策略
在线阅读 下载PDF
窗口长度自适应调整的策略迭代最优控制 被引量:1
3
作者 方欣 栾小丽 刘飞 《控制理论与应用》 EI CAS CSCD 北大核心 2024年第4期745-750,共6页
在系统模型参数未知的最优控制问题中,策略迭代能否快速收敛到最优控制策略的关键在于值函数的估计.为了提升值函数的估计精度以及收敛速度,本文提出一种窗口长度自适应调整的策略迭代最优控制算法.充分利用一段时间内的历史样本数据,... 在系统模型参数未知的最优控制问题中,策略迭代能否快速收敛到最优控制策略的关键在于值函数的估计.为了提升值函数的估计精度以及收敛速度,本文提出一种窗口长度自适应调整的策略迭代最优控制算法.充分利用一段时间内的历史样本数据,通过影响力函数构建窗口长度与值函数估计性能之间的定量关系,根据数据窗口长度对估计性能影响力的不同,实现窗口长度的自适应调整.最后,将本文所提方法应用到连续发酵过程,结果表明,本文所提方法能够加快最优控制策略的收敛,克服参数变化或外部扰动对控制性能的影响,从而提升控制精度. 展开更多
关键词 最优控制 策略 窗口长度自适应调整 影响力函数
在线阅读 下载PDF
联合图像层级特征的压缩感知迭代重构
4
作者 刘玉红 杨恒 《光学精密工程》 EI CAS CSCD 北大核心 2024年第14期2311-2324,共14页
基于卷积神经网络(Convolutional Neural Networks,CNN)的图像压缩感知重构算法难以捕捉高分辨率图像的长距离依赖关系,采用Transformer虽能解决该问题,但网络参数量和图像重构时间成倍增长。基于此,本文提出了一种联合图像层级特征的... 基于卷积神经网络(Convolutional Neural Networks,CNN)的图像压缩感知重构算法难以捕捉高分辨率图像的长距离依赖关系,采用Transformer虽能解决该问题,但网络参数量和图像重构时间成倍增长。基于此,本文提出了一种联合图像层级特征的压缩感知迭代重构网络(Combining Image Hierarchical-Feature Network,CHFNet),在提高图像重构质量的同时减少重构时间。CHFNet由采样和重构两个子网络组成,采样子网络通过可学习的采样矩阵为重构过程提供更有效的测量值。在重构子网络中,设计了一种使用梯度下降操作和特征优化操作的迭代策略,同时提出一种轻量级CNN-Transformer混合架构,能够建模并优化高细粒度的图像层级特征,在增强网络感知能力的同时降低计算复杂度。此外,CHFNet通过联合优化学习采样重构,实现了完整的端到端训练。实验结果表明,所提算法在多个公共基准数据集上取得了良好的重构效果。在Urban100数据集上,相较于现有最优算法CSformer,平均PSNR,SSIM分别提升0.63 dB和0.0076;在0.10采样率下,相较CSformer在Set11,BSD68和Urban100数据集上的平均重构时间分别减少了2.7447 s,3.5510 s和4.7750 s。 展开更多
关键词 压缩感知 图像层级特征 TRANSFORMER 卷积神经网络 迭代策略 图像重构
在线阅读 下载PDF
自适应特征融合的迭代实体对齐方法
5
作者 李婷婷 邵斐 +1 位作者 温天晓 董飒 《吉林大学学报(理学版)》 CAS 北大核心 2024年第3期629-635,共7页
针对知识图谱实体对齐任务中缺乏训练数据以及长尾实体对齐准确率较低的问题,提出一种基于自适应特征融合策略的迭代实体对齐方法,并设计一种迭代策略自动扩充训练数据的规模.该方法使用知识图谱的结构信息,并利用关系、属性和实体名称... 针对知识图谱实体对齐任务中缺乏训练数据以及长尾实体对齐准确率较低的问题,提出一种基于自适应特征融合策略的迭代实体对齐方法,并设计一种迭代策略自动扩充训练数据的规模.该方法使用知识图谱的结构信息,并利用关系、属性和实体名称信息作为语义信息辅助对齐,从而提升对齐效果.在数据集上的实验结果表明,该模型在知识图谱实体对齐任务中效果良好. 展开更多
关键词 知识图谱 实体对齐 迭代策略 自适应特征融合
在线阅读 下载PDF
求解大规模机组组合问题的策略迭代近似动态规划 被引量:30
6
作者 韦化 龙丹丽 黎静华 《中国电机工程学报》 EI CSCD 北大核心 2014年第25期4420-4429,共10页
针对动态规划存在的“维数灾”问题,提出了一种求解大规模电力系统机组组合(unit commitment,UC)问题的策略迭代近似动态规划(policy iteration-approximate dynamicprogramming,PI.ADP)方法。采用策略迭代对动态规划过程中的... 针对动态规划存在的“维数灾”问题,提出了一种求解大规模电力系统机组组合(unit commitment,UC)问题的策略迭代近似动态规划(policy iteration-approximate dynamicprogramming,PI.ADP)方法。采用策略迭代对动态规划过程中的值函数进行近似,替代了从可行状态中精确计算值函数的过程,避免了“维数灾”的发生。在值函数的近似过程中,利用了实际系统的运行约束有效压缩状态空间,减少可选择的启停动作,进一步降低了计算量。10-1000机96时段系统的计算结果表明,所提方法能在较少时间内获得高质量的解,从而为求解大规模电力系统UC问题提供了参考。 展开更多
关键词 电力系统 机组组合 近似动态规划 策略 近似值函数
在线阅读 下载PDF
一种批量最小二乘策略迭代方法 被引量:9
7
作者 周鑫 刘全 +1 位作者 傅启明 肖飞 《计算机科学》 CSCD 北大核心 2014年第9期232-238,共7页
策略迭代是一种迭代地评估和改进控制策略的强化学习方法。采用最小二乘的策略评估方法可以从经验数据中提取出更多有用信息,提高数据有效性。针对在线的最小二乘策略迭代方法对样本数据的利用不充分、每个样本仅使用一次就被丢弃的问题... 策略迭代是一种迭代地评估和改进控制策略的强化学习方法。采用最小二乘的策略评估方法可以从经验数据中提取出更多有用信息,提高数据有效性。针对在线的最小二乘策略迭代方法对样本数据的利用不充分、每个样本仅使用一次就被丢弃的问题,提出一种批量最小二乘策略迭代算法(BLSPI),并从理论上证明其收敛性。BLSPI算法将批量更新方法与在线最小二乘策略迭代方法相结合,在线保存生成的样本数据,多次重复使用这些样本数据并结合最小二乘方法来更新控制策略。将BLSPI算法用于倒立摆实验平台,实验结果表明,该算法可以有效利用之前的经验知识,提高经验利用率,加快收敛速度。 展开更多
关键词 强化学习 批量更新 最小二乘 策略
在线阅读 下载PDF
一种高斯过程的带参近似策略迭代算法 被引量:4
8
作者 傅启明 刘全 +2 位作者 伏玉琛 周谊成 于俊 《软件学报》 EI CSCD 北大核心 2013年第11期2676-2686,共11页
在大规模状态空间或者连续状态空间中,将函数近似与强化学习相结合是当前机器学习领域的一个研究热点;同时,在学习过程中如何平衡探索和利用的问题更是强化学习领域的一个研究难点.针对大规模状态空间或者连续状态空间、确定环境问题中... 在大规模状态空间或者连续状态空间中,将函数近似与强化学习相结合是当前机器学习领域的一个研究热点;同时,在学习过程中如何平衡探索和利用的问题更是强化学习领域的一个研究难点.针对大规模状态空间或者连续状态空间、确定环境问题中的探索和利用的平衡问题,提出了一种基于高斯过程的近似策略迭代算法.该算法利用高斯过程对带参值函数进行建模,结合生成模型,根据贝叶斯推理,求解值函数的后验分布.在学习过程中,根据值函数的概率分布,求解动作的信息价值增益,结合值函数的期望值,选择相应的动作.在一定程度上,该算法可以解决探索和利用的平衡问题,加快算法收敛.将该算法用于经典的Mountain Car问题,实验结果表明,该算法收敛速度较快,收敛精度较好. 展开更多
关键词 强化学习 策略 高斯过程 贝叶斯推理 函数近似
在线阅读 下载PDF
基于策略迭代和值迭代的POMDP算法 被引量:7
9
作者 孙湧 仵博 冯延蓬 《计算机研究与发展》 EI CSCD 北大核心 2008年第10期1763-1768,共6页
部分可观察Markov决策过程是通过引入信念状态空间将非Markov链问题转化为Markov链问题来求解,其描述真实世界的特性使它成为研究随机决策过程的重要分支.介绍了部分可观察Markov决策过程的基本原理和决策过程,提出一种基于策略迭代和... 部分可观察Markov决策过程是通过引入信念状态空间将非Markov链问题转化为Markov链问题来求解,其描述真实世界的特性使它成为研究随机决策过程的重要分支.介绍了部分可观察Markov决策过程的基本原理和决策过程,提出一种基于策略迭代和值迭代的部分可观察Markov决策算法,该算法利用线性规划和动态规划的思想,解决当信念状态空间较大时出现的"维数灾"问题,得到Markov决策的逼近最优解.实验数据表明该算法是可行的和有效的. 展开更多
关键词 部分可观察Markov决策 决策算法 智能体 策略
在线阅读 下载PDF
基于状态-动作图测地高斯基的策略迭代强化学习 被引量:6
10
作者 程玉虎 冯涣婷 王雪松 《自动化学报》 EI CSCD 北大核心 2011年第1期44-51,共8页
在策略迭代强化学习中,基函数构造是影响动作值函数逼近精度的一个重要因素.为了给动作值函数逼近提供合适的基函数,提出一种基于状态-动作图测地高斯基的策略迭代强化学习方法.首先,根据离策略方法建立马尔可夫决策过程的状态-动作图... 在策略迭代强化学习中,基函数构造是影响动作值函数逼近精度的一个重要因素.为了给动作值函数逼近提供合适的基函数,提出一种基于状态-动作图测地高斯基的策略迭代强化学习方法.首先,根据离策略方法建立马尔可夫决策过程的状态-动作图论描述;然后,在状态-动作图上定义测地高斯核函数,利用基于近似线性相关的核稀疏方法自动选择测地高斯核的中心;最后,在策略评估阶段利用基于状态-动作图的测地高斯核逼近动作值函数,并基于估计的值函数进行策略改进.10×10格子世界的仿真结果表明,与基于状态图普通高斯基和测地高斯基的策略迭代强化学习方法相比,本文所提方法能以较少的基函数、高精度地逼近具有光滑且不连续特性的动作值函数,从而有效地获得最优策略. 展开更多
关键词 状态-动作图 测地高斯核 基函数 策略 强化学习
在线阅读 下载PDF
基于迭代Bargaining策略优化服务合成执行路径 被引量:1
11
作者 任开军 宋君强 +1 位作者 肖侬 张卫民 《国防科技大学学报》 EI CAS CSCD 北大核心 2009年第1期80-85,共6页
服务质量(QoS)是优化服务合成执行路径的关键研究内容,当前绝大多数存在的方法很少注意到商业环境下服务商之间存在的隐性竞争压力可能会迫使服务商动态改变他们的QoS值以至于合成优化执行路径发生改变。针对此问题,提出一个基于迭代Bar... 服务质量(QoS)是优化服务合成执行路径的关键研究内容,当前绝大多数存在的方法很少注意到商业环境下服务商之间存在的隐性竞争压力可能会迫使服务商动态改变他们的QoS值以至于合成优化执行路径发生改变。针对此问题,提出一个基于迭代Bargaining策略的约束违背纠正方法。该方法使用本地最优化策略,在没有考虑用户QoS约束的情况下建立一条最优执行路径。对此路径,全局QoS计算模型和全局约束违背检查模型能找出所有发生的约束违背。一个迭代的Bargaining策略被递归作用于关键路径执行节点,使得更好服务提供商被选出替换原有执行节点,从而一个优化的执行路径能被重新建立以满足用户综合的QoS约束需求。 展开更多
关键词 服务合成 QoS约束违背 Bargaining策略
在线阅读 下载PDF
一种电液伺服系统位置控制的模糊迭代控制策略 被引量:10
12
作者 张亮 李芝炳 李超 《机床与液压》 北大核心 2021年第10期156-159,共4页
控制电液伺服系统对期望位置进行准确的追踪,有利于提高工作安全性和工作效率。对此,提出了采用模糊迭代控制策略的电液伺服系统位置控制方法。通过分析电液伺服系统位置控制模型,得出液压伺服阀的动力学方程,计算液压缸中不同腔室内的... 控制电液伺服系统对期望位置进行准确的追踪,有利于提高工作安全性和工作效率。对此,提出了采用模糊迭代控制策略的电液伺服系统位置控制方法。通过分析电液伺服系统位置控制模型,得出液压伺服阀的动力学方程,计算液压缸中不同腔室内的压差值,求得活塞的动力学模型,获取液压缸对负载施加压力的动力学模型。利用T-S模型,采用If-Then规则,在模糊集合的基础上求得控制量方程。以位置误差为依据,构造参数因子的迭代控制率,以完成模糊迭代控制策略的设计。采用所提模糊迭代控制策略和干扰观测控制策略对阶跃和三角形期望位置进行追踪测试。测试结果显示:在对阶跃和三角形期望位置进行追踪时,所提方法比干扰观测控制策略在x方向上的最大追踪超调值分别减小了35.06%和39.45%,在y方向上的最大追踪超调值分别减小了32.55%和11.68%。所提方法具备较好的位置控制性能,可准确地追踪期望位置。 展开更多
关键词 电液伺服系统 位置控制 模糊控制策略 T-S模型
在线阅读 下载PDF
模型未知非零和博弈问题的策略迭代算法 被引量:3
13
作者 杨明 罗艳红 王义贺 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2015年第3期318-321,326,共5页
提出了一种在线积分策略迭代算法,用来求解内部非线性动力模型未知的双人非零和博弈问题.通过在控制策略和干扰策略中引入探测信号,从而避开了系统的模型信息,得到了一个求解非零和博弈的无模型的近似动态规划算法.该算法同步更新值函... 提出了一种在线积分策略迭代算法,用来求解内部非线性动力模型未知的双人非零和博弈问题.通过在控制策略和干扰策略中引入探测信号,从而避开了系统的模型信息,得到了一个求解非零和博弈的无模型的近似动态规划算法.该算法同步更新值函数、控制策略、扰动策略,并且最终得到收敛的策略权值.在算法实现过程中,使用4个神经网络分别近似两个值函数、控制策略和扰动策略,使用最小二乘法估计神经网络的未知参数.最后仿真结果验证了算法的有效性. 展开更多
关键词 自适应动态规划 非零和博弈 策略 神经网络 最优控制
在线阅读 下载PDF
基于Monte-Carlo迭代求解策略的局部社区发现算法 被引量:1
14
作者 李占利 李颖 +1 位作者 罗香玉 罗颖骁 《计算机应用》 CSCD 北大核心 2023年第1期104-110,共7页
针对现有的局部社区发现算法因采用贪心策略进行社区扩张而导致的过早收敛和查全率低的问题,提出一种基于Monte-Carlo迭代求解策略的局部社区发现算法。首先,在每轮迭代的社区扩张阶段,根据节点对社区紧密度增益的贡献比例为所有邻接候... 针对现有的局部社区发现算法因采用贪心策略进行社区扩张而导致的过早收敛和查全率低的问题,提出一种基于Monte-Carlo迭代求解策略的局部社区发现算法。首先,在每轮迭代的社区扩张阶段,根据节点对社区紧密度增益的贡献比例为所有邻接候选节点赋予选择概率,并结合此概率,再随机选择一个节点加入社区。然后,为避免随机选择导致扩张方向偏离目标社区,根据社区质量变化情况判断本轮迭代中是否触发节点淘汰机制。若触发,计算各个已加入社区节点与社区内其他节点的相似度和,根据相似度和的倒数赋予淘汰概率,并结合此概率,再随机淘汰一个节点。最后,在给定数量的最近迭代轮次中,根据社区规模是否增加判断是否继续迭代。在三个真实的网络数据集上进行实验,相较于局部紧密度扩展(LTE)算法、Clauset算法、加权共同邻居节点(CNWNN)算法和模糊相似关系(FSR)算法,所提算法的局部社区发现结果的F-score值分别提升了32.75、17.31、20.66和25.51个百分点,且能够有效避免查询节点在社区中所处位置对局部社区发现结果的影响。 展开更多
关键词 复杂网络 社区结构 局部社区发现 Monte-Carlo求解策略
在线阅读 下载PDF
基于策略迭代ADP的碳纤维角联织机张力控制 被引量:4
15
作者 刘薇 张黎 李想 《天津工业大学学报》 CAS 北大核心 2023年第1期72-80,共9页
针对碳纤维角联织机经纱张力控制问题,考虑开口等不确定因素对经纱张力的影响,建立了离散非线性送经系统张力控制模型,提出了策略迭代自适应动态规划(ADP),并对ADP中评价网络设计了自适应权值更新率;证明了策略迭代ADP在离散系统的收敛... 针对碳纤维角联织机经纱张力控制问题,考虑开口等不确定因素对经纱张力的影响,建立了离散非线性送经系统张力控制模型,提出了策略迭代自适应动态规划(ADP),并对ADP中评价网络设计了自适应权值更新率;证明了策略迭代ADP在离散系统的收敛性,削减了非线性及不确定因素对经纱张力的影响,实现了对经纱张力的稳定控制,提高了系统鲁棒性。仿真结果表明:相比传统ADP,策略迭代ADP可以使经纱张力在2 s内快速无波动的到达稳定状态,使系统性能指标函数收敛更优。 展开更多
关键词 碳纤维角联织机 送经系统 策略ADP 自适应权值更新率
在线阅读 下载PDF
一种基于最优策略概率分布的POMDP值迭代算法 被引量:4
16
作者 刘峰 王崇骏 骆斌 《电子学报》 EI CAS CSCD 北大核心 2016年第5期1078-1084,共7页
随着应用中POMDP问题的规模不断扩大,基于最优策略可达区域的启发式方法成为了目前的研究热点.然而目前已有的算法虽然保证了全局最优,但选择最优动作还不够精确,影响了算法的效率.本文提出一种基于最优策略概率的值迭代方法 PBVIOP.该... 随着应用中POMDP问题的规模不断扩大,基于最优策略可达区域的启发式方法成为了目前的研究热点.然而目前已有的算法虽然保证了全局最优,但选择最优动作还不够精确,影响了算法的效率.本文提出一种基于最优策略概率的值迭代方法 PBVIOP.该方法在深度优先的启发式探索中,根据各个动作值函数在其上界和下界之间的分布,用蒙特卡罗法计算动作最优的概率,选择概率最大的动作作为最优探索策略.在4个基准问题上的实验结果表明PBVIOP算法能够收敛到全局最优解,并明显提高了收敛效率. 展开更多
关键词 部分可观测马尔科夫决策过程 基于最优策略概率的值算法 蒙特卡罗法
在线阅读 下载PDF
考虑阻力约束的列车能量最优驾驶问题建模及分离迭代求解策略
17
作者 刘良杰 冯江华 +2 位作者 王斌 胡云卿 黎向宇 《铁道学报》 EI CAS CSCD 北大核心 2020年第11期36-44,共9页
根据列车的动力学模型,牵引、制动特性,阻力,限速等条件,建立列车能量最优驾驶问题的数学模型。由于坡道阻力和运行阻力的引入,约束条件中的微分方程组(ODEs)增广成为复杂的微分代数方程组(DAEs),使得问题难以求解。首先在时间域内将状... 根据列车的动力学模型,牵引、制动特性,阻力,限速等条件,建立列车能量最优驾驶问题的数学模型。由于坡道阻力和运行阻力的引入,约束条件中的微分方程组(ODEs)增广成为复杂的微分代数方程组(DAEs),使得问题难以求解。首先在时间域内将状态变量和控制变量离散化,将问题转化为一般非线性规划问题;针对该非线性规划问题,提出一种分离迭代策略将其转化为一系列凸二次规划问题,最后采用原-对偶预测校正内点算法求解。算例结果表明,所提出的分离迭代策略在满足列车约束条件下可以实现能量消耗最小。 展开更多
关键词 能量最优 一般非线性规划问题 凸二次规划问题 分离迭代策略 原-对偶预测校正内点算法
在线阅读 下载PDF
非参数化近似策略迭代并行强化学习算法 被引量:2
18
作者 季挺 张华 《计算机工程》 CAS CSCD 北大核心 2018年第11期313-320,共8页
针对在线近似策略迭代强化学习算法收敛速度较慢的问题,提出一种非参数化近似策略迭代并行强化学习算法。通过学习单元构建样本采集过程确定并行单元数量,基于径向基函数线性逼近结构设计强化学习单元,然后采用以样本空间完全覆盖为目... 针对在线近似策略迭代强化学习算法收敛速度较慢的问题,提出一种非参数化近似策略迭代并行强化学习算法。通过学习单元构建样本采集过程确定并行单元数量,基于径向基函数线性逼近结构设计强化学习单元,然后采用以样本空间完全覆盖为目标的估计方法实现单元自主构建,并基于近似策略迭代进行单元自主学习。其中,各单元通过平均加权法融合得到算法的整体策略。一级倒立摆仿真结果表明,与online LSPI算法和BLSPI算法相比,该算法在保持较高加速比的同时具有较高的效率,其控制参数更少,收敛速度更快。 展开更多
关键词 并行强化学习 非参数化 策略 K均值聚类 倒立摆
在线阅读 下载PDF
基于策略迭代算法的连续时间线性Markov跳变系统非零和微分反馈Nash控制 被引量:2
19
作者 朱国政 张茂光 何舒平 《控制理论与应用》 EI CAS CSCD 北大核心 2020年第8期1749-1756,共8页
针对一类连续时间线性Markov跳变系统,本文提出了一种新的策略迭代算法用于求解系统的非零和微分反馈Nash控制问题.通过求解耦合的数值迭代解,以获得具有线性动力学特性和无限时域二次成本的双层非零和微分策略的Nash均衡解.在每一个策... 针对一类连续时间线性Markov跳变系统,本文提出了一种新的策略迭代算法用于求解系统的非零和微分反馈Nash控制问题.通过求解耦合的数值迭代解,以获得具有线性动力学特性和无限时域二次成本的双层非零和微分策略的Nash均衡解.在每一个策略层,采用策略迭代算法来计算与每一组给定的反馈控制策略相关联的最小无限时域值函数.然后,通过子系统分解将Markov跳变系统分解为N个并行的子系统,并将该算法应用于跳变系统.本文提出的策略迭代算法可以很容易求解非零和微分策略所对应的耦合代数Riccati方程,且对高维系统有效.最后通过仿真示例证明了本文设计方法的有效性和可行性. 展开更多
关键词 策略 Markov跳变线性系统 非零和 微分反馈Nash策略
在线阅读 下载PDF
一种新的迭代渐进多序列比对算法 被引量:3
20
作者 张敏 方伟武 +1 位作者 张俊华 迟忠先 《计算机工程与应用》 CSCD 北大核心 2005年第2期72-74,共3页
该文提出一种新的迭代渐进多序列比对算法IPMSA。该算法先用渐进方法进行多序列比对,然后通过迭代策略,利用上一轮多序列比对结果修正指导树,产生新一轮比对。重复这一过程,直到指导树不再发生变化或满足事先设定的迭代次数为止。以比... 该文提出一种新的迭代渐进多序列比对算法IPMSA。该算法先用渐进方法进行多序列比对,然后通过迭代策略,利用上一轮多序列比对结果修正指导树,产生新一轮比对。重复这一过程,直到指导树不再发生变化或满足事先设定的迭代次数为止。以比对数据库BAliBASE中多蛋白质家族1idy为例,对IPMSA算法和ClustalW算法进行的比较研究表明,该算法能更有效地比对分歧较大的序列,并改进其系统发育树。 展开更多
关键词 多序列比对 渐进比对算法 迭代策略
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部