检索结果-维普期刊中文期刊服务平台

基于蚁群算法和轮盘算法的多Agent Q学习被引量：5: 1; 作者孟祥萍王圣镔王欣欣《计算机工程与应用》 CSCD 北大核心 2009年第16期60-62,共3页; 提出了一种新颖的基于Q-学习、蚁群算法和轮盘赌算法的多Agent强化学习。在强化学习算法中,当Agent数量增加到足够大时,就会出现动作空间灾难性问题,即:其学习速度骤然下降。另外,Agent是利用Q值来选择下一步动作的,因此,在学习早期,动... 展开更多; 关键词多Agent强化学习算法蚁群算法轮盘赌算法; 在线阅读下载PDF 职称材料

改进的遗传算法在钢铁企业污染物排放量预测的研究被引量：3: 2; 作者黄伟建张一帆黄远《现代电子技术》 2021年第5期132-136,共5页; 在钢铁企业的发展中,环境保护尤为重要,钢铁企业的污染物二氧化硫的排放量是环境保护建设的重要指标。使用遗传算法与动态三次指数平滑法相结合,采用遗传算法中的轮盘赌算法计算最优解区间,并用遗传算法计算最优值,导入指数平滑算法绘... 展开更多; 关键词污染物排放量预测模型遗传算法轮盘赌算法生产日志动态三次指数平滑法动态参数预测干预法; 在线阅读下载PDF 职称材料

多Agent Q学习几点问题的研究及改进被引量：5: 3; 作者孟祥萍王圣镔王欣欣《计算机工程与设计》 CSCD 北大核心 2009年第9期2274-2276,共3页; 提出了一种新颖的基于Q-学习,蚁群算法和轮盘赌算法的多Agent强化学习。在强化学习算法中,当Agent数量增加到足够大时,就会出现动作空间灾难性问题,即:其交互困难,学习速度骤然下降。另外,由于Agent是利用Q值来选择下一步动作的,因此,... 展开更多; 关键词多Agent强化学习算法蚁群算法轮盘赌算法 Q值动作空间灾难; 在线阅读下载PDF 职称材料

Markov链使用模型的测试用例生成方法研究被引量：3: 4; 作者雷航陈丽敏《电子科技大学学报》 EI CAS CSCD 北大核心 2011年第5期732-736,共5页; 采用基于马尔科夫链使用模型的软件测试,在状态与激励序列中,从"开始"状态到"结束"状态形成一个完整的测试案例。因此,输入和激励的选择对于产生高效的测试案例十分重要。提出一种激励选择——带概率约束的随机选... 展开更多; 关键词 MARKOV链轮盘赌算法测试用例测试输入使用模型; 在线阅读下载PDF 职称材料

一种基于关联规则的Web应用统计测试方法被引量：8: 5; 作者王玉奇高建华《计算机工程》 CAS CSCD 北大核心 2020年第3期206-213,共8页; Web统计测试可以确保Web应用的质量,且测试用例是提高软件可靠性的关键因素。为此,提出一种基于关联规则的Web统计测试用例生成与系统可靠性度量方法。从Web服务器日志中提取信息,通过哈希表将信息保存在自定义的数据结构note中。采用... 展开更多; 关键词 Web统计测试关联规则马尔科夫模型轮盘赌算法测试用例; 在线阅读下载PDF 职称材料

题名基于蚁群算法和轮盘算法的多Agent Q学习被引量：5: 1; 作者孟祥萍王圣镔王欣欣; 机构长春工程学院电气与信息学院东北电力大学信息工程学院; 出处《计算机工程与应用》 CSCD 北大核心 2009年第16期60-62,共3页; 基金吉林省科技发展计划项目(No.20070530)~~; 文摘提出了一种新颖的基于Q-学习、蚁群算法和轮盘赌算法的多Agent强化学习。在强化学习算法中,当Agent数量增加到足够大时,就会出现动作空间灾难性问题,即:其学习速度骤然下降。另外,Agent是利用Q值来选择下一步动作的,因此,在学习早期,动作的选择严重束缚于高Q值。把蚁群算法、轮盘赌算法和强化学习三者结合起来,期望解决上述提出的问题。最后,对新算法的理论分析和实验结果都证明了改进的Q学习是可行的,并且可以有效地提高学习效率。; 关键词多Agent强化学习算法蚁群算法轮盘赌算法; Keywords muhiagent reinforcement learning algorithm ant colony algorithm roulette algorithm; 分类号 TP18 [自动化与计算机技术—控制理论与控制工程]; 在线阅读下载PDF 职称材料

题名改进的遗传算法在钢铁企业污染物排放量预测的研究被引量：3: 2; 作者黄伟建张一帆黄远; 机构河北工程大学信息与电气工程学院; 出处《现代电子技术》 2021年第5期132-136,共5页; 基金河北省高等学校科学技术研究项目:基于复杂网络的空气质量动态分析和预测方法研究(QN2018073) 河北省自然基金项目:云计算中分布式Jobtracker节点模型的建立与优化(F2015402077)。; 文摘在钢铁企业的发展中,环境保护尤为重要,钢铁企业的污染物二氧化硫的排放量是环境保护建设的重要指标。使用遗传算法与动态三次指数平滑法相结合,采用遗传算法中的轮盘赌算法计算最优解区间,并用遗传算法计算最优值,导入指数平滑算法绘制数据走向曲线,并根据企业的生产日志配合使用预测干预法,对钢铁企业污染物排放量进行预测。通过该算法与传统的时间序列预测模型动态指数平滑法进行比较。证明基于遗传算法与动态三次指数平滑的预测模型具有优良的预测精度和准确的预测数据走势的能力,在钢铁企业污染物排放量预测中具有良好的适用性。; 关键词污染物排放量预测模型遗传算法轮盘赌算法生产日志动态三次指数平滑法动态参数预测干预法; Keywords pollutant emission load prediction model genetic algorithm roulette algorithm daily record for production dynamic cubic exponential smoothing method dynamic parameter prediction intervention method; 分类号 TN911.1-34 [电子电信—通信与信息系统] TP39 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名多Agent Q学习几点问题的研究及改进被引量：5: 3; 作者孟祥萍王圣镔王欣欣; 机构长春工程学院电气与信息学院东北电力大学信息工程学院; 出处《计算机工程与设计》 CSCD 北大核心 2009年第9期2274-2276,共3页; 基金教育部科学技术研究基金项目(206035) 吉林省科技发展计划基金项目(20070530); 文摘提出了一种新颖的基于Q-学习,蚁群算法和轮盘赌算法的多Agent强化学习。在强化学习算法中,当Agent数量增加到足够大时,就会出现动作空间灾难性问题,即:其交互困难,学习速度骤然下降。另外,由于Agent是利用Q值来选择下一步动作的,因此,在学习早期,动作的选择严重束缚于高Q值。在这里,把蚁群算法,轮盘赌算法和强化学习三者结合起来,期望解决上述提出的问题。最后,对新算法的理论分析和实验结果都证明了改进的Q学习是可行的,并且可以有效的提高学习效率。; 关键词多Agent强化学习算法蚁群算法轮盘赌算法 Q值动作空间灾难; Keywords multi-agent reinforcement learning algorithm ant colony algorithm roulette algorithm Q value disaster of action room; 分类号 TP181 [自动化与计算机技术—控制理论与控制工程]; 在线阅读下载PDF 职称材料

题名Markov链使用模型的测试用例生成方法研究被引量：3: 4; 作者雷航陈丽敏; 机构电子科技大学信息与软件工程学院成都电子科技大学计算机科学与工程学院成都; 出处《电子科技大学学报》 EI CAS CSCD 北大核心 2011年第5期732-736,共5页; 基金国家自然科学基金(60973016); 文摘采用基于马尔科夫链使用模型的软件测试,在状态与激励序列中,从"开始"状态到"结束"状态形成一个完整的测试案例。因此,输入和激励的选择对于产生高效的测试案例十分重要。提出一种激励选择——带概率约束的随机选择方法,以软件Markov链模型的状态迁移概率作为激励选择的约束条件,使用遗传算法中用于选择下一代种群的选择算子——轮盘赌选择算子对激励进行选择。通过与以往的激励选择方法对比,验证了所提出的方法能提高生成测试用例的有效性。; 关键词 MARKOV链轮盘赌算法测试用例测试输入使用模型; Keywords Markov chain roulette algorithm test case test input usage model; 分类号 TP311.5 [自动化与计算机技术—计算机软件与理论]; 在线阅读下载PDF 职称材料

题名一种基于关联规则的Web应用统计测试方法被引量：8: 5; 作者王玉奇高建华; 机构上海师范大学信息与机电工程学院; 出处《计算机工程》 CAS CSCD 北大核心 2020年第3期206-213,共8页; 基金国家自然科学基金(61672355)。; 文摘 Web统计测试可以确保Web应用的质量,且测试用例是提高软件可靠性的关键因素。为此,提出一种基于关联规则的Web统计测试用例生成与系统可靠性度量方法。从Web服务器日志中提取信息,通过哈希表将信息保存在自定义的数据结构note中。采用关联规则对note进行挖掘得到用户的频繁访问序列,并通过马尔科夫模型对其进行建模,在此基础上,利用轮盘赌算法生成测试用例。依据生成的测试用例,采用Nelson模型进行系统可靠性评估,将MTBF作为系统可靠性评估指标,实验结果表明,该方法所生成测试用例的MTBF值与真实环境下的MTBF值接近,验证了该方法的有效性。; 关键词 Web统计测试关联规则马尔科夫模型轮盘赌算法测试用例; Keywords Web statistical testing association rules Markov model roulette algorithm testing cases; 分类号 TP311 [自动化与计算机技术—计算机软件与理论]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	基于蚁群算法和轮盘算法的多Agent Q学习	孟祥萍王圣镔王欣欣	《计算机工程与应用》 CSCD 北大核心	2009	5	在线阅读下载PDF 职称材料
2	改进的遗传算法在钢铁企业污染物排放量预测的研究	黄伟建张一帆黄远	《现代电子技术》	2021	3	在线阅读下载PDF 职称材料
3	多Agent Q学习几点问题的研究及改进	孟祥萍王圣镔王欣欣	《计算机工程与设计》 CSCD 北大核心	2009	5	在线阅读下载PDF 职称材料
4	Markov链使用模型的测试用例生成方法研究	雷航陈丽敏	《电子科技大学学报》 EI CAS CSCD 北大核心	2011	3	在线阅读下载PDF 职称材料
5	一种基于关联规则的Web应用统计测试方法	王玉奇高建华	《计算机工程》 CAS CSCD 北大核心	2020	8	在线阅读下载PDF 职称材料