期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于汤普森采样的自适应安卓程序测试方法
1
作者 赵英男 冷重阳 +1 位作者 韩启龙 俞程 《计算机科学》 北大核心 2025年第11期330-338,共9页
近年来,安卓图形化界面测试方法的研究引起了学者的广泛关注。目前,大多数测试方法是基于强化学习开发的,然而,现有方法根据经验选择参数实现对应用程序的探索,无法根据界面变化情况自适应地改变参数设置。为此,提出了一种基于汤普森采... 近年来,安卓图形化界面测试方法的研究引起了学者的广泛关注。目前,大多数测试方法是基于强化学习开发的,然而,现有方法根据经验选择参数实现对应用程序的探索,无法根据界面变化情况自适应地改变参数设置。为此,提出了一种基于汤普森采样的自适应安卓测试方法,该方法将汤普森采样与Q-learning算法相结合,能够根据当前界面控件被探索的情况自适应地调整智能体下一步的探索动作,且能较好地平衡利用与探索的关系,实现更有效的测试。首先,对探索过程中界面的跳转这一事件进行Beta概率分布建模,得到一个概率分布矩阵,该矩阵与Q矩阵加权平均,可以兼顾事件的探索价值与利用价值。同时,对当前界面下的可操作事件的概率分布进行采样,最大采样值即为探索概率值,结合加权后的矩阵可以更全面地指导测试,以此实现对安卓应用界面的自适应探索。在13个安卓应用程序上进行了实验,通过与传统强化学习测试工具进行实验对比与分析,验证了所提方法的有效性。 展开更多
关键词 安卓GUI测试 强化学习 Q-LEARNING 汤普森采样
在线阅读 下载PDF
汤普森采样在线设计频率捷变雷达抗干扰策略
2
作者 吴振华 钱军 +3 位作者 张磊 陈莉丽 朱宁 杨利霞 《国防科技大学学报》 北大核心 2025年第5期206-215,共10页
在有源干扰动态对抗背景下,基于在线学习理论中多臂赌博机模型,将雷达和干扰机工作频率作为对抗动作空间建模,通过对干扰环境状态不确定性进行多轮脉冲波形发射探索,搭建基于卷积神经网络的频率通道干扰识别器以得到频率通道干扰信念状... 在有源干扰动态对抗背景下,基于在线学习理论中多臂赌博机模型,将雷达和干扰机工作频率作为对抗动作空间建模,通过对干扰环境状态不确定性进行多轮脉冲波形发射探索,搭建基于卷积神经网络的频率通道干扰识别器以得到频率通道干扰信念状态后验概率估计,利用汤普森采样求解算法高效求解多臂赌博机模型,实现探索与利用之间的平衡。仿真结果表明,相较于频率随机捷变及深度强化学习策略求解算法,该方法的对抗策略收敛性能更高,可适应动态快变干扰环境,充分发挥雷达波形发射主动方对抗优势。 展开更多
关键词 雷达频率捷变 在线学习 多臂赌博机 汤普森采样
在线阅读 下载PDF
基于探索-利用模型优化AFL变异的方法
3
作者 徐鹏 刘嘉勇 林波 《信息网络安全》 CSCD 北大核心 2019年第6期61-67,共7页
模糊测试是通过不断生成不同的输入来测试程序从而发现并识别安全漏洞,已经广泛应用于漏洞挖掘中。目前灰盒模糊测试是最流行的模糊测试策略,它将轻量级代码插桩与数据反馈驱动相结合,以生成新的程序输入。AFL(American Fuzzy Lop)是一... 模糊测试是通过不断生成不同的输入来测试程序从而发现并识别安全漏洞,已经广泛应用于漏洞挖掘中。目前灰盒模糊测试是最流行的模糊测试策略,它将轻量级代码插桩与数据反馈驱动相结合,以生成新的程序输入。AFL(American Fuzzy Lop)是一种卓越的灰盒模糊测试工具,其以高效的forkserver执行、可靠的遗传算法和多种的变异策略著称,但其变异策略主要采样随机变异,存在较大的盲目性。文章提出了一种运用强化学习的方法来优化变异的策略,以多摇臂赌博机问题为模型,记录不同变异方式产生的输入在目标程序中的执行效果,利用探索-利用算法自适应地学习变异操作结果的概率分布情况,智能地进行变异操作策略调整,提升AFL的模糊测试性能。文章选择汤普森采样为优化算法设计实现了AFL-EE模糊测试工具,并对5类常用的文件类程序进行了验证测试,实验表明该方法能自动调整变异操作策略,有效地产生覆盖率高的测试输入,方法可行、额外资源消耗较小,总体上优于AFL工具。 展开更多
关键词 AFL 多摇臂赌博机 探索-利用 汤普森采样
在线阅读 下载PDF
在线学习的主用户仿冒攻击策略
4
作者 盛响 王少尉 《国防科技大学学报》 EI CAS CSCD 北大核心 2020年第4期12-17,共6页
在认知无线网络中,次用户通过频谱感知来学习频谱环境,从而接入那些没有被主用户占用的频谱空隙。事实上,多种恶意攻击的存在会影响次用户频谱感知的可靠性。只有深入研究恶意攻击策略,才能确保认知无线网络的安全。基于此,研究了一种... 在认知无线网络中,次用户通过频谱感知来学习频谱环境,从而接入那些没有被主用户占用的频谱空隙。事实上,多种恶意攻击的存在会影响次用户频谱感知的可靠性。只有深入研究恶意攻击策略,才能确保认知无线网络的安全。基于此,研究了一种认知无线网络中的欺骗性干扰策略,即主用户仿冒攻击策略,该攻击策略通过在信道上传输伪造的主用户信号来降低次用户频谱感知的性能。具体来说,将攻击策略问题建模为在线学习问题,并提出基于汤普森采样的攻击策略以实现在探索不确定信道和利用高性能信道间的权衡。仿真结果表明,与现有的攻击策略相比,提出的攻击策略能更好地通过在线学习优化攻击决策以与作者互动适应非平稳的认知无线网络。 展开更多
关键词 认知无线电 在线学习 主用户仿冒攻击 频谱感知 汤普森采样
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部