期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于蚁群算法和轮盘算法的多Agent Q学习 被引量:5
1
作者 孟祥萍 王圣镔 王欣欣 《计算机工程与应用》 CSCD 北大核心 2009年第16期60-62,共3页
提出了一种新颖的基于Q-学习、蚁群算法和轮盘赌算法的多Agent强化学习。在强化学习算法中,当Agent数量增加到足够大时,就会出现动作空间灾难性问题,即:其学习速度骤然下降。另外,Agent是利用Q值来选择下一步动作的,因此,在学习早期,动... 提出了一种新颖的基于Q-学习、蚁群算法和轮盘赌算法的多Agent强化学习。在强化学习算法中,当Agent数量增加到足够大时,就会出现动作空间灾难性问题,即:其学习速度骤然下降。另外,Agent是利用Q值来选择下一步动作的,因此,在学习早期,动作的选择严重束缚于高Q值。把蚁群算法、轮盘赌算法和强化学习三者结合起来,期望解决上述提出的问题。最后,对新算法的理论分析和实验结果都证明了改进的Q学习是可行的,并且可以有效地提高学习效率。 展开更多
关键词 多Agent强化学习算法 蚁群算法 轮盘赌算法
在线阅读 下载PDF
改进的遗传算法在钢铁企业污染物排放量预测的研究 被引量:3
2
作者 黄伟建 张一帆 黄远 《现代电子技术》 2021年第5期132-136,共5页
在钢铁企业的发展中,环境保护尤为重要,钢铁企业的污染物二氧化硫的排放量是环境保护建设的重要指标。使用遗传算法与动态三次指数平滑法相结合,采用遗传算法中的轮盘赌算法计算最优解区间,并用遗传算法计算最优值,导入指数平滑算法绘... 在钢铁企业的发展中,环境保护尤为重要,钢铁企业的污染物二氧化硫的排放量是环境保护建设的重要指标。使用遗传算法与动态三次指数平滑法相结合,采用遗传算法中的轮盘赌算法计算最优解区间,并用遗传算法计算最优值,导入指数平滑算法绘制数据走向曲线,并根据企业的生产日志配合使用预测干预法,对钢铁企业污染物排放量进行预测。通过该算法与传统的时间序列预测模型动态指数平滑法进行比较。证明基于遗传算法与动态三次指数平滑的预测模型具有优良的预测精度和准确的预测数据走势的能力,在钢铁企业污染物排放量预测中具有良好的适用性。 展开更多
关键词 污染物排放量 预测模型 遗传算法 轮盘赌算法 生产日志 动态三次指数平滑法 动态参数 预测干预法
在线阅读 下载PDF
多Agent Q学习几点问题的研究及改进 被引量:5
3
作者 孟祥萍 王圣镔 王欣欣 《计算机工程与设计》 CSCD 北大核心 2009年第9期2274-2276,共3页
提出了一种新颖的基于Q-学习,蚁群算法和轮盘赌算法的多Agent强化学习。在强化学习算法中,当Agent数量增加到足够大时,就会出现动作空间灾难性问题,即:其交互困难,学习速度骤然下降。另外,由于Agent是利用Q值来选择下一步动作的,因此,... 提出了一种新颖的基于Q-学习,蚁群算法和轮盘赌算法的多Agent强化学习。在强化学习算法中,当Agent数量增加到足够大时,就会出现动作空间灾难性问题,即:其交互困难,学习速度骤然下降。另外,由于Agent是利用Q值来选择下一步动作的,因此,在学习早期,动作的选择严重束缚于高Q值。在这里,把蚁群算法,轮盘赌算法和强化学习三者结合起来,期望解决上述提出的问题。最后,对新算法的理论分析和实验结果都证明了改进的Q学习是可行的,并且可以有效的提高学习效率。 展开更多
关键词 多Agent强化学习算法 蚁群算法 轮盘赌算法 Q值 动作空间灾难
在线阅读 下载PDF
Markov链使用模型的测试用例生成方法研究 被引量:3
4
作者 雷航 陈丽敏 《电子科技大学学报》 EI CAS CSCD 北大核心 2011年第5期732-736,共5页
采用基于马尔科夫链使用模型的软件测试,在状态与激励序列中,从"开始"状态到"结束"状态形成一个完整的测试案例。因此,输入和激励的选择对于产生高效的测试案例十分重要。提出一种激励选择——带概率约束的随机选... 采用基于马尔科夫链使用模型的软件测试,在状态与激励序列中,从"开始"状态到"结束"状态形成一个完整的测试案例。因此,输入和激励的选择对于产生高效的测试案例十分重要。提出一种激励选择——带概率约束的随机选择方法,以软件Markov链模型的状态迁移概率作为激励选择的约束条件,使用遗传算法中用于选择下一代种群的选择算子——轮盘赌选择算子对激励进行选择。通过与以往的激励选择方法对比,验证了所提出的方法能提高生成测试用例的有效性。 展开更多
关键词 MARKOV链 轮盘赌算法 测试用例 测试输入 使用模型
在线阅读 下载PDF
一种基于关联规则的Web应用统计测试方法 被引量:8
5
作者 王玉奇 高建华 《计算机工程》 CAS CSCD 北大核心 2020年第3期206-213,共8页
Web统计测试可以确保Web应用的质量,且测试用例是提高软件可靠性的关键因素。为此,提出一种基于关联规则的Web统计测试用例生成与系统可靠性度量方法。从Web服务器日志中提取信息,通过哈希表将信息保存在自定义的数据结构note中。采用... Web统计测试可以确保Web应用的质量,且测试用例是提高软件可靠性的关键因素。为此,提出一种基于关联规则的Web统计测试用例生成与系统可靠性度量方法。从Web服务器日志中提取信息,通过哈希表将信息保存在自定义的数据结构note中。采用关联规则对note进行挖掘得到用户的频繁访问序列,并通过马尔科夫模型对其进行建模,在此基础上,利用轮盘赌算法生成测试用例。依据生成的测试用例,采用Nelson模型进行系统可靠性评估,将MTBF作为系统可靠性评估指标,实验结果表明,该方法所生成测试用例的MTBF值与真实环境下的MTBF值接近,验证了该方法的有效性。 展开更多
关键词 Web统计测试 关联规则 马尔科夫模型 轮盘赌算法 测试用例
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部