期刊导航
期刊开放获取
上海教育软件发展有限公..
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
5
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于蚁群算法和轮盘算法的多Agent Q学习
被引量:
5
1
作者
孟祥萍
王圣镔
王欣欣
《计算机工程与应用》
CSCD
北大核心
2009年第16期60-62,共3页
提出了一种新颖的基于Q-学习、蚁群算法和轮盘赌算法的多Agent强化学习。在强化学习算法中,当Agent数量增加到足够大时,就会出现动作空间灾难性问题,即:其学习速度骤然下降。另外,Agent是利用Q值来选择下一步动作的,因此,在学习早期,动...
提出了一种新颖的基于Q-学习、蚁群算法和轮盘赌算法的多Agent强化学习。在强化学习算法中,当Agent数量增加到足够大时,就会出现动作空间灾难性问题,即:其学习速度骤然下降。另外,Agent是利用Q值来选择下一步动作的,因此,在学习早期,动作的选择严重束缚于高Q值。把蚁群算法、轮盘赌算法和强化学习三者结合起来,期望解决上述提出的问题。最后,对新算法的理论分析和实验结果都证明了改进的Q学习是可行的,并且可以有效地提高学习效率。
展开更多
关键词
多Agent强化学习
算法
蚁群
算法
轮盘赌算法
在线阅读
下载PDF
职称材料
改进的遗传算法在钢铁企业污染物排放量预测的研究
被引量:
3
2
作者
黄伟建
张一帆
黄远
《现代电子技术》
2021年第5期132-136,共5页
在钢铁企业的发展中,环境保护尤为重要,钢铁企业的污染物二氧化硫的排放量是环境保护建设的重要指标。使用遗传算法与动态三次指数平滑法相结合,采用遗传算法中的轮盘赌算法计算最优解区间,并用遗传算法计算最优值,导入指数平滑算法绘...
在钢铁企业的发展中,环境保护尤为重要,钢铁企业的污染物二氧化硫的排放量是环境保护建设的重要指标。使用遗传算法与动态三次指数平滑法相结合,采用遗传算法中的轮盘赌算法计算最优解区间,并用遗传算法计算最优值,导入指数平滑算法绘制数据走向曲线,并根据企业的生产日志配合使用预测干预法,对钢铁企业污染物排放量进行预测。通过该算法与传统的时间序列预测模型动态指数平滑法进行比较。证明基于遗传算法与动态三次指数平滑的预测模型具有优良的预测精度和准确的预测数据走势的能力,在钢铁企业污染物排放量预测中具有良好的适用性。
展开更多
关键词
污染物排放量
预测模型
遗传
算法
轮盘赌算法
生产日志
动态三次指数平滑法
动态参数
预测干预法
在线阅读
下载PDF
职称材料
多Agent Q学习几点问题的研究及改进
被引量:
5
3
作者
孟祥萍
王圣镔
王欣欣
《计算机工程与设计》
CSCD
北大核心
2009年第9期2274-2276,共3页
提出了一种新颖的基于Q-学习,蚁群算法和轮盘赌算法的多Agent强化学习。在强化学习算法中,当Agent数量增加到足够大时,就会出现动作空间灾难性问题,即:其交互困难,学习速度骤然下降。另外,由于Agent是利用Q值来选择下一步动作的,因此,...
提出了一种新颖的基于Q-学习,蚁群算法和轮盘赌算法的多Agent强化学习。在强化学习算法中,当Agent数量增加到足够大时,就会出现动作空间灾难性问题,即:其交互困难,学习速度骤然下降。另外,由于Agent是利用Q值来选择下一步动作的,因此,在学习早期,动作的选择严重束缚于高Q值。在这里,把蚁群算法,轮盘赌算法和强化学习三者结合起来,期望解决上述提出的问题。最后,对新算法的理论分析和实验结果都证明了改进的Q学习是可行的,并且可以有效的提高学习效率。
展开更多
关键词
多Agent强化学习
算法
蚁群
算法
轮盘赌算法
Q值
动作空间灾难
在线阅读
下载PDF
职称材料
Markov链使用模型的测试用例生成方法研究
被引量:
3
4
作者
雷航
陈丽敏
《电子科技大学学报》
EI
CAS
CSCD
北大核心
2011年第5期732-736,共5页
采用基于马尔科夫链使用模型的软件测试,在状态与激励序列中,从"开始"状态到"结束"状态形成一个完整的测试案例。因此,输入和激励的选择对于产生高效的测试案例十分重要。提出一种激励选择——带概率约束的随机选...
采用基于马尔科夫链使用模型的软件测试,在状态与激励序列中,从"开始"状态到"结束"状态形成一个完整的测试案例。因此,输入和激励的选择对于产生高效的测试案例十分重要。提出一种激励选择——带概率约束的随机选择方法,以软件Markov链模型的状态迁移概率作为激励选择的约束条件,使用遗传算法中用于选择下一代种群的选择算子——轮盘赌选择算子对激励进行选择。通过与以往的激励选择方法对比,验证了所提出的方法能提高生成测试用例的有效性。
展开更多
关键词
MARKOV链
轮盘赌算法
测试用例
测试输入
使用模型
在线阅读
下载PDF
职称材料
一种基于关联规则的Web应用统计测试方法
被引量:
8
5
作者
王玉奇
高建华
《计算机工程》
CAS
CSCD
北大核心
2020年第3期206-213,共8页
Web统计测试可以确保Web应用的质量,且测试用例是提高软件可靠性的关键因素。为此,提出一种基于关联规则的Web统计测试用例生成与系统可靠性度量方法。从Web服务器日志中提取信息,通过哈希表将信息保存在自定义的数据结构note中。采用...
Web统计测试可以确保Web应用的质量,且测试用例是提高软件可靠性的关键因素。为此,提出一种基于关联规则的Web统计测试用例生成与系统可靠性度量方法。从Web服务器日志中提取信息,通过哈希表将信息保存在自定义的数据结构note中。采用关联规则对note进行挖掘得到用户的频繁访问序列,并通过马尔科夫模型对其进行建模,在此基础上,利用轮盘赌算法生成测试用例。依据生成的测试用例,采用Nelson模型进行系统可靠性评估,将MTBF作为系统可靠性评估指标,实验结果表明,该方法所生成测试用例的MTBF值与真实环境下的MTBF值接近,验证了该方法的有效性。
展开更多
关键词
Web统计测试
关联规则
马尔科夫模型
轮盘赌算法
测试用例
在线阅读
下载PDF
职称材料
题名
基于蚁群算法和轮盘算法的多Agent Q学习
被引量:
5
1
作者
孟祥萍
王圣镔
王欣欣
机构
长春工程学院电气与信息学院
东北电力大学信息工程学院
出处
《计算机工程与应用》
CSCD
北大核心
2009年第16期60-62,共3页
基金
吉林省科技发展计划项目(No.20070530)~~
文摘
提出了一种新颖的基于Q-学习、蚁群算法和轮盘赌算法的多Agent强化学习。在强化学习算法中,当Agent数量增加到足够大时,就会出现动作空间灾难性问题,即:其学习速度骤然下降。另外,Agent是利用Q值来选择下一步动作的,因此,在学习早期,动作的选择严重束缚于高Q值。把蚁群算法、轮盘赌算法和强化学习三者结合起来,期望解决上述提出的问题。最后,对新算法的理论分析和实验结果都证明了改进的Q学习是可行的,并且可以有效地提高学习效率。
关键词
多Agent强化学习
算法
蚁群
算法
轮盘赌算法
Keywords
muhiagent reinforcement learning algorithm
ant colony algorithm
roulette algorithm
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
改进的遗传算法在钢铁企业污染物排放量预测的研究
被引量:
3
2
作者
黄伟建
张一帆
黄远
机构
河北工程大学信息与电气工程学院
出处
《现代电子技术》
2021年第5期132-136,共5页
基金
河北省高等学校科学技术研究项目:基于复杂网络的空气质量动态分析和预测方法研究(QN2018073)
河北省自然基金项目:云计算中分布式Jobtracker节点模型的建立与优化(F2015402077)。
文摘
在钢铁企业的发展中,环境保护尤为重要,钢铁企业的污染物二氧化硫的排放量是环境保护建设的重要指标。使用遗传算法与动态三次指数平滑法相结合,采用遗传算法中的轮盘赌算法计算最优解区间,并用遗传算法计算最优值,导入指数平滑算法绘制数据走向曲线,并根据企业的生产日志配合使用预测干预法,对钢铁企业污染物排放量进行预测。通过该算法与传统的时间序列预测模型动态指数平滑法进行比较。证明基于遗传算法与动态三次指数平滑的预测模型具有优良的预测精度和准确的预测数据走势的能力,在钢铁企业污染物排放量预测中具有良好的适用性。
关键词
污染物排放量
预测模型
遗传
算法
轮盘赌算法
生产日志
动态三次指数平滑法
动态参数
预测干预法
Keywords
pollutant emission load
prediction model
genetic algorithm
roulette algorithm
daily record for production
dynamic cubic exponential smoothing method
dynamic parameter
prediction intervention method
分类号
TN911.1-34 [电子电信—通信与信息系统]
TP39 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
多Agent Q学习几点问题的研究及改进
被引量:
5
3
作者
孟祥萍
王圣镔
王欣欣
机构
长春工程学院电气与信息学院
东北电力大学信息工程学院
出处
《计算机工程与设计》
CSCD
北大核心
2009年第9期2274-2276,共3页
基金
教育部科学技术研究基金项目(206035)
吉林省科技发展计划基金项目(20070530)
文摘
提出了一种新颖的基于Q-学习,蚁群算法和轮盘赌算法的多Agent强化学习。在强化学习算法中,当Agent数量增加到足够大时,就会出现动作空间灾难性问题,即:其交互困难,学习速度骤然下降。另外,由于Agent是利用Q值来选择下一步动作的,因此,在学习早期,动作的选择严重束缚于高Q值。在这里,把蚁群算法,轮盘赌算法和强化学习三者结合起来,期望解决上述提出的问题。最后,对新算法的理论分析和实验结果都证明了改进的Q学习是可行的,并且可以有效的提高学习效率。
关键词
多Agent强化学习
算法
蚁群
算法
轮盘赌算法
Q值
动作空间灾难
Keywords
multi-agent reinforcement learning algorithm
ant colony algorithm
roulette algorithm
Q value
disaster of action room
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
在线阅读
下载PDF
职称材料
题名
Markov链使用模型的测试用例生成方法研究
被引量:
3
4
作者
雷航
陈丽敏
机构
电子科技大学信息与软件工程学院成都
电子科技大学计算机科学与工程学院成都
出处
《电子科技大学学报》
EI
CAS
CSCD
北大核心
2011年第5期732-736,共5页
基金
国家自然科学基金(60973016)
文摘
采用基于马尔科夫链使用模型的软件测试,在状态与激励序列中,从"开始"状态到"结束"状态形成一个完整的测试案例。因此,输入和激励的选择对于产生高效的测试案例十分重要。提出一种激励选择——带概率约束的随机选择方法,以软件Markov链模型的状态迁移概率作为激励选择的约束条件,使用遗传算法中用于选择下一代种群的选择算子——轮盘赌选择算子对激励进行选择。通过与以往的激励选择方法对比,验证了所提出的方法能提高生成测试用例的有效性。
关键词
MARKOV链
轮盘赌算法
测试用例
测试输入
使用模型
Keywords
Markov chain
roulette algorithm
test case
test input
usage model
分类号
TP311.5 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
一种基于关联规则的Web应用统计测试方法
被引量:
8
5
作者
王玉奇
高建华
机构
上海师范大学信息与机电工程学院
出处
《计算机工程》
CAS
CSCD
北大核心
2020年第3期206-213,共8页
基金
国家自然科学基金(61672355)。
文摘
Web统计测试可以确保Web应用的质量,且测试用例是提高软件可靠性的关键因素。为此,提出一种基于关联规则的Web统计测试用例生成与系统可靠性度量方法。从Web服务器日志中提取信息,通过哈希表将信息保存在自定义的数据结构note中。采用关联规则对note进行挖掘得到用户的频繁访问序列,并通过马尔科夫模型对其进行建模,在此基础上,利用轮盘赌算法生成测试用例。依据生成的测试用例,采用Nelson模型进行系统可靠性评估,将MTBF作为系统可靠性评估指标,实验结果表明,该方法所生成测试用例的MTBF值与真实环境下的MTBF值接近,验证了该方法的有效性。
关键词
Web统计测试
关联规则
马尔科夫模型
轮盘赌算法
测试用例
Keywords
Web statistical testing
association rules
Markov model
roulette algorithm
testing cases
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于蚁群算法和轮盘算法的多Agent Q学习
孟祥萍
王圣镔
王欣欣
《计算机工程与应用》
CSCD
北大核心
2009
5
在线阅读
下载PDF
职称材料
2
改进的遗传算法在钢铁企业污染物排放量预测的研究
黄伟建
张一帆
黄远
《现代电子技术》
2021
3
在线阅读
下载PDF
职称材料
3
多Agent Q学习几点问题的研究及改进
孟祥萍
王圣镔
王欣欣
《计算机工程与设计》
CSCD
北大核心
2009
5
在线阅读
下载PDF
职称材料
4
Markov链使用模型的测试用例生成方法研究
雷航
陈丽敏
《电子科技大学学报》
EI
CAS
CSCD
北大核心
2011
3
在线阅读
下载PDF
职称材料
5
一种基于关联规则的Web应用统计测试方法
王玉奇
高建华
《计算机工程》
CAS
CSCD
北大核心
2020
8
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部