摘要
对大量有害的URL进行过滤,是目前网络安全应用系统中所亟需的关键技术.使用经典的串匹配算法检测庞大的URL规则集,需要消耗大量的计算资源和存储资源,性能十分低下.该文设计了一种适合于大规模URL过滤的多模式串匹配算法——SOGOPT.该算法在经典的SOG算法基础上,针对URL规则的特点,提出了最优窗口选择、模式串分组规约这两种优化技术,大幅度提高了SOG算法的匹配速度,在大规模URL规则集上效果尤其显著.该文设计的算法非常适合于大规模(100万级)URL实时在线匹配的应用环境.
The filtering of large-scale hazardous URLs plays a fundamental role in many networksecurity applications.The classical multiple string matching algorithms perform poorly on large-scale URLs,due to the heavy consumption of CPU power and memory space.Here we propose amultiple string matching algorithm-SOGOPT for large-scale URL filtering.By exploiting the characteristics of URLs,the proposed algorithm devises two strategies,i.e.the optimal window selection strategy and the pattern set partitioning and reduction strategy,to speed up the classical SOG algorithm.The proposed algorithm improves the searching speed of SOG greatly,especiallyon large-scale URLs.It is very suitable for large-scale (up to 1 million URLs)and online URL filtering.
出处
《计算机学报》
EI
CSCD
北大核心
2014年第5期1159-1169,共11页
Chinese Journal of Computers
基金
中国科学院战略性先导科技专项课题"媒体内容安全监管技术"(XDA06030602)
国家自然科学基金青年基金项目"复杂规则实时检测的模型和算法研究"(61202477)资助~~
关键词
多模式串匹配
URL过滤
最优窗口选择
模式串分组规约
信息安全
网络安全
multiple string matching
URL filtering
optimal window selection
pattern set partitioning and reduction
information security
network security
作者简介
刘燕兵,男,1981年生,博士,副研究员,中国计算机学会会员,主要研究方向为文本算法、数据流处理、信息内容安全.E-mail:liuyanbing@iie.ac.cn.
邵妍,女,1987年生,硕士,主要研究方向为字符串匹配、信息内容安全.
王勇,男,1979年生,博士研究生,高级工程师,主要研究方向为网络与信息安全.
刘庆云,男,1980年生,博士研究生,高级工程师,主要研究方向为内容安全管理、网络安全.
郭莉,女,1969年生,正高级工程师,主要研究方向为网络与信息安全.