期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于自动机理论的PDF文本内容抽取 被引量:8
1
作者 王晓娟 谭建龙 +1 位作者 刘燕兵 刘金刚 《计算机应用》 CSCD 北大核心 2012年第9期2491-2495,共5页
现有的从PDF文档抽取文本内容的方法(如PDFBox类库采用的方法)处理速度较低,无法满足高速网络中内容分析的需求,也不能对网络中部分到达的PDF数据包进行流式的处理。为此,提出了基于自动机理论的PDF文本内容抽取方法。该方法通过建立具... 现有的从PDF文档抽取文本内容的方法(如PDFBox类库采用的方法)处理速度较低,无法满足高速网络中内容分析的需求,也不能对网络中部分到达的PDF数据包进行流式的处理。为此,提出了基于自动机理论的PDF文本内容抽取方法。该方法通过建立具有层次的关键字自动机,可以快速地抽取完整PDF文档和不完整PDF文档中的文本内容。在中文和英文PDF文档数据集下的实验结果表明,基于自动机理论的PDF文本内容抽取方法耗时仅为PDFBox方法的17%~37%。 展开更多
关键词 文本内容抽取 自动机 确定的有穷自动机 不完整文档
在线阅读 下载PDF
信息安全审计技术在财政行业的应用 被引量:2
2
作者 胡品辉 凌捷 逯峰 《计算机工程与设计》 CSCD 北大核心 2007年第21期5314-5316,共3页
简述了我国现阶段的财政业务系统安全审计状况,提出了用计算机的审计技术和财政系统相结合的安全审计方案,采用基于日志的确定有穷自动机(DFA)的模型、按功能触发的形式,以及对数据库采用审计要素的方法进行审计,实现对操作系统和财政... 简述了我国现阶段的财政业务系统安全审计状况,提出了用计算机的审计技术和财政系统相结合的安全审计方案,采用基于日志的确定有穷自动机(DFA)的模型、按功能触发的形式,以及对数据库采用审计要素的方法进行审计,实现对操作系统和财政系统的审计。这不仅有利于提高财政系统的审计工作效率,而且提高了操作系统和财政系统的安全性。 展开更多
关键词 操作系统审计 数据操作审计 日志 数据库系统 触发器 确定的有穷自动机
在线阅读 下载PDF
深度包检测中一种高效的正则表达式压缩算法 被引量:29
3
作者 徐乾 鄂跃鹏 +1 位作者 葛敬国 钱华林 《软件学报》 EI CSCD 北大核心 2009年第8期2214-2226,共13页
提出一种基于确定的有穷状态自动机(deterministic finite automaton,简称DFA)的正则表达式压缩算法.首先,定义了膨胀率DR(distending rate)来描述正则表达式的膨胀特性.然后基于DR提出一种分片的算法RECCADR(regular expressions cut a... 提出一种基于确定的有穷状态自动机(deterministic finite automaton,简称DFA)的正则表达式压缩算法.首先,定义了膨胀率DR(distending rate)来描述正则表达式的膨胀特性.然后基于DR提出一种分片的算法RECCADR(regular expressions cut and combine algorithm based on DR),有效地选择出导致DFA状态膨胀的片段并隔离,降低了单个正则表达式存储需求.同时,基于正则表达式的组合关系提出一种选择性分群算法REGADR(regular expressions group algorithm based on DR),在可以接受的存储需求总量下,通过选择性分群大幅度减少了状态机的个数,有效地降低了匹配算法的复杂性. 展开更多
关键词 正则表达式 确定的有状态自动机(deterministic finite automaton 简称DFA) 深度包检测(deep packet inspection 简称DPI) 多模式匹配算法 入侵检测
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部