期刊文献+

一种面向大规模URL过滤的多模式串匹配算法 被引量:14

A Multiple String Matching Algorithm for Large-Scale URL Filtering
在线阅读 下载PDF
导出
摘要 对大量有害的URL进行过滤,是目前网络安全应用系统中所亟需的关键技术.使用经典的串匹配算法检测庞大的URL规则集,需要消耗大量的计算资源和存储资源,性能十分低下.该文设计了一种适合于大规模URL过滤的多模式串匹配算法——SOGOPT.该算法在经典的SOG算法基础上,针对URL规则的特点,提出了最优窗口选择、模式串分组规约这两种优化技术,大幅度提高了SOG算法的匹配速度,在大规模URL规则集上效果尤其显著.该文设计的算法非常适合于大规模(100万级)URL实时在线匹配的应用环境. The filtering of large-scale hazardous URLs plays a fundamental role in many networksecurity applications.The classical multiple string matching algorithms perform poorly on large-scale URLs,due to the heavy consumption of CPU power and memory space.Here we propose amultiple string matching algorithm-SOGOPT for large-scale URL filtering.By exploiting the characteristics of URLs,the proposed algorithm devises two strategies,i.e.the optimal window selection strategy and the pattern set partitioning and reduction strategy,to speed up the classical SOG algorithm.The proposed algorithm improves the searching speed of SOG greatly,especiallyon large-scale URLs.It is very suitable for large-scale (up to 1 million URLs)and online URL filtering.
出处 《计算机学报》 EI CSCD 北大核心 2014年第5期1159-1169,共11页 Chinese Journal of Computers
基金 中国科学院战略性先导科技专项课题"媒体内容安全监管技术"(XDA06030602) 国家自然科学基金青年基金项目"复杂规则实时检测的模型和算法研究"(61202477)资助~~
关键词 多模式串匹配 URL过滤 最优窗口选择 模式串分组规约 信息安全 网络安全 multiple string matching URL filtering optimal window selection pattern set partitioning and reduction information security network security
作者简介 刘燕兵,男,1981年生,博士,副研究员,中国计算机学会会员,主要研究方向为文本算法、数据流处理、信息内容安全.E-mail:liuyanbing@iie.ac.cn. 邵妍,女,1987年生,硕士,主要研究方向为字符串匹配、信息内容安全. 王勇,男,1979年生,博士研究生,高级工程师,主要研究方向为网络与信息安全. 刘庆云,男,1980年生,博士研究生,高级工程师,主要研究方向为内容安全管理、网络安全. 郭莉,女,1969年生,正高级工程师,主要研究方向为网络与信息安全.
  • 相关文献

参考文献7

二级参考文献68

  • 1贺龙涛,方滨兴,余翔湛.一种时间复杂度最优的精确串匹配算法[J].软件学报,2005,16(5):676-683. 被引量:25
  • 2Wu S, Manber U. A fast algorithm for multi-pattern searching, TR-94-17 [R]. Tucson, AZ: Department of Computer Science, University of Arizona, 1994.
  • 3Raffinot M. On the multi backward DAWG matching algorithm (MultiBDM)[C]//Proc of the 4th South American Workshop on String Processing. Valparaiso, Chile: Carleton University Press, 1997:149-165.
  • 4Allauzen C, Crochemore M, Raffinot M. Factor oracle: A new structure for pattern matching [C] //Proc of the 26th Conf on Current Trends in Theory and Practice of Informatics. Berlin: Springer, 1999:295-310.
  • 5Navarro G, Raffinot M. Fast and flexible string matching by combining bit-parallelism and suffix automata [OL]. (2000- 12-01) [2007-12-01]. http://www. jea. acre. org.
  • 6Tarjan R E, Yao A C. Storing a sparse table [J]. Communications of the ACM, 1979, 22(11) : 606-611.
  • 7Fredman M, Komlos J, Szemeredi E. Storing a sparse table with O(1) worst case access time[J]. Journal of the ACM, 1984, :31(3): 538-544.
  • 8Galli N, Seybold B, Simon K. Tetris-hashiog or optimal table compression [J]. Discrete Applied Mathematics, 2001, 110(1): 41-58.
  • 9Dencker P, Durre K, Hcuft J. Optimization of parser tables for portable compilers [J]. ACM Trans on Programming lLanguages and Systems, 1984, (64): 546-572.
  • 10Kiraz G A. Compressed storage of sparse finite state transducers[C]//{roc of the 4th Int Workshop on Implementing Automata. Berling: Springer, 1999:109-121.

共引文献189

同被引文献122

引证文献14

二级引证文献193

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部