期刊文献+
共找到219篇文章
< 1 2 11 >
每页显示 20 50 100
基于变异的正则表达式反例测试串生成算法 被引量:1
1
作者 郑黎晓 余李林 +3 位作者 陈海明 陈祖希 骆翔宇 汪小勇 《软件学报》 EI CSCD 北大核心 2024年第7期3355-3376,共22页
正则表达式在计算机科学的许多领域具有广泛应用.然而,由于正则表达式语法比较复杂,并且允许使用大量元字符,导致开发人员在定义和使用时容易出错.测试是保证正则表达式语义正确性的实用和有效手段,常用的方法是根据被测表达式生成一些... 正则表达式在计算机科学的许多领域具有广泛应用.然而,由于正则表达式语法比较复杂,并且允许使用大量元字符,导致开发人员在定义和使用时容易出错.测试是保证正则表达式语义正确性的实用和有效手段,常用的方法是根据被测表达式生成一些字符串,并检查它们是否符合预期.现有的测试数据生成大多只关注正例串,而研究表明,实际开发中存在的错误大部分在于定义的语言比预期语言小,这类错误只能通过反例串才能发现.研究基于变异的正则表达式反例测试串生成.首先通过变异向被测表达式中注入缺陷得到一组变异体,然后在被测表达式所定义语言的补集中选取反例字符串揭示相应变异体所模拟的错误.为了能够模拟复杂缺陷类型,以及避免出现变异体特化而无法获得反例串的问题,引入二阶变异机制.同时采取冗余变异体消除、变异算子选择等优化技术对变异体进行约简,从而控制最终生成的测试集规模.实验结果表明,与已有工具相比,所提算法生成的反例测试串规模适中,并且具有较强的揭示错误能力. 展开更多
关键词 正则表达 正则语言 字符串生成 变异测试 变异体约简
在线阅读 下载PDF
基于自然语言句法信息的正则表达式生成 被引量:1
2
作者 王昊 吴军华 《计算机科学》 CSCD 北大核心 2024年第S02期92-97,共6页
正则表达式由一系列字符和元字符组成,定义了一种匹配规则,可以用来检查一个字符串是否与所需的模式匹配。在软件开发过程中,很多开发人员发现编写正则表达式较为困难。因此,根据自然语言需求描述生成正则表达式成为研究热点。近年来,... 正则表达式由一系列字符和元字符组成,定义了一种匹配规则,可以用来检查一个字符串是否与所需的模式匹配。在软件开发过程中,很多开发人员发现编写正则表达式较为困难。因此,根据自然语言需求描述生成正则表达式成为研究热点。近年来,将自然语言描述转化为正则表达式的系统取得了一些研究成果,但往往只针对简单的序列化文本。探讨了将自然语言查询转化为可以执行其功能的正则表达式的方法。鉴于自然语言处理中句法解析的成功应用,模型使用自然语言的结构信息,以分层聚合的方式对语法解析树进行嵌入,并使用适用于输入树结构的Tree-transformer架构对自然语言描述进行自注意编码。解码器使用交叉注意力来预测正则表达式。在两个公共数据集上对模型进行了验证。实验证明,所提模型有效地提高了生成的正则表达式的质量,并在DFA-Equal-Acc评估指标中优于现有模型。 展开更多
关键词 正则表达式生成 Tree-Transformer 句法解析
在线阅读 下载PDF
基于正则表达式的变电站集中监控信息解析方法 被引量:23
3
作者 鲁华永 袁越 +3 位作者 郭泓佐 袁良 王国栋 刘华伟 《电力系统自动化》 EI CSCD 北大核心 2017年第5期78-83,共6页
随着国家电网公司"大运行"体系建设的深入开展,海量、繁杂且存在不规则现象的集中监控信息的识别,已成为设备监控信息智能告警技术提升面临的主要问题。文中结合集中监控信息既定规则的特点,提出一种基于正则表达式描述的集... 随着国家电网公司"大运行"体系建设的深入开展,海量、繁杂且存在不规则现象的集中监控信息的识别,已成为设备监控信息智能告警技术提升面临的主要问题。文中结合集中监控信息既定规则的特点,提出一种基于正则表达式描述的集中监控信息解析方法。通过正则表达式规则提取信息关键要素进行信息解析,并采用最大分词匹配算法进行信息识别匹配,实现变电站集中监控信息实时解析及自动校验,为设备监控信息智能告警技术的进一步提升奠定了良好基础。实际工程应用验证了所提方法有效性和实用性。 展开更多
关键词 变电站集中监控 告警直传 信息解析 正则表达 最大匹配算法
在线阅读 下载PDF
基于正则表达式的专利信息提取方法研究 被引量:15
4
作者 邱清盈 郑国民 +1 位作者 冯培恩 武建伟 《中国机械工程》 EI CAS CSCD 北大核心 2007年第19期2326-2329,共4页
针对图像格式专利文献难以进行全文检索和深入分析利用的问题,根据专利文献的结构特点,通过集成光学字符识别工具和建立具有容错性的专利信息提取正则表达式,提出了专利文献的数字化和信息提取方法。开发了相应的软件系统,实现了专利信... 针对图像格式专利文献难以进行全文检索和深入分析利用的问题,根据专利文献的结构特点,通过集成光学字符识别工具和建立具有容错性的专利信息提取正则表达式,提出了专利文献的数字化和信息提取方法。开发了相应的软件系统,实现了专利信息的批量提取,为后续高效率地对专利文献进行自动分析和知识挖掘提供了数据基础。 展开更多
关键词 专利分析 信息提取 正则表达 设计知识
在线阅读 下载PDF
一种面向网络安全检测的高性能正则表达式匹配算法 被引量:27
5
作者 张树壮 罗浩 +1 位作者 方滨兴 云晓春 《计算机学报》 EI CSCD 北大核心 2010年第10期1976-1986,共11页
目前进行正则表达式匹配的典型工具DFA和NFA都存在匹配效率和内存需求之间不可调和的矛盾,无法胜任网络安全检测中大规模正则表达式的匹配.为了解决这个问题,文中从网络安全检测的行为特点出发,结合DFA、NFA模型各自的特性,提出了一种... 目前进行正则表达式匹配的典型工具DFA和NFA都存在匹配效率和内存需求之间不可调和的矛盾,无法胜任网络安全检测中大规模正则表达式的匹配.为了解决这个问题,文中从网络安全检测的行为特点出发,结合DFA、NFA模型各自的特性,提出了一种基于猜测-验证的匹配方法.首先使用DFA对正则表达式中的部分子特征进行搜索,完成特征存在性的猜测;当猜测到有可能匹配某个特征后,再使用NFA进行验证.文中方法既充分利用了DFA的高效性,减少了对相对较慢的验证过程的调用,又借助NFA避免了内存消耗过于巨大.结果表明,该方法可以在大大减少内存需求的情况下,实现正则表达式的高效匹配. 展开更多
关键词 特征匹配 正则表达 有穷自动机 子特征 猜测-验证
在线阅读 下载PDF
正则表达式在电子政务客户端校验中的应用 被引量:16
6
作者 王功明 吴华瑞 +1 位作者 赵春江 杨宝祝 《计算机工程》 CAS CSCD 北大核心 2007年第9期269-271,共3页
SQL注入技术通过输入带有SQL关键字的语句破坏后台数据库查询语句完整性,进而开展客户端攻击,危害性很强,此外,不合规范的输入数据,也加重系统负担,降低系统可靠性。所以电子政务系统安全性、可靠性亟待提高。正则表达式具有很强的模式... SQL注入技术通过输入带有SQL关键字的语句破坏后台数据库查询语句完整性,进而开展客户端攻击,危害性很强,此外,不合规范的输入数据,也加重系统负担,降低系统可靠性。所以电子政务系统安全性、可靠性亟待提高。正则表达式具有很强的模式匹配功能,可以用来校验各种类型数据。加入正则表达式校验层,扩充传统三层B/S架构至四层后,通过校验客户端输入数据,能够遏制某些客户端攻击,在一定程度上提高电子政务系统安全性、可靠性。在电子政务系统建设中应用该项技术,取得了优良的效果。 展开更多
关键词 电子政务 正则表达 数据校验 数据锁 SQL注入
在线阅读 下载PDF
面向网络安全的正则表达式匹配技术 被引量:31
7
作者 张树壮 罗浩 方滨兴 《软件学报》 EI CSCD 北大核心 2011年第8期1838-1854,共17页
分析了基于有穷状态自动机的正则表达式匹配方法的时间复杂度、空间复杂度以及二者之间的制约关系,深入讨论了在网络安全应用中遇到的特有问题与挑战.围绕这两个问题,对当前出现的多种优化技术和策略进行了全面的综述和评价,最后对未来... 分析了基于有穷状态自动机的正则表达式匹配方法的时间复杂度、空间复杂度以及二者之间的制约关系,深入讨论了在网络安全应用中遇到的特有问题与挑战.围绕这两个问题,对当前出现的多种优化技术和策略进行了全面的综述和评价,最后对未来的研究方向进行了总结和展望. 展开更多
关键词 特征匹配 深度包检测 正则表达 有穷自动机 内存缩减
在线阅读 下载PDF
基于正则表达式的图像目标特征提取方法研究 被引量:7
8
作者 芦兵 孙俊 许晓东 《计算机应用与软件》 北大核心 2018年第4期260-264,292,共6页
针对图像匹配过程中生成匹配模板复杂度高的问题,根据应用场景下被识别物轮廓、颜色和空间相对位置等物理特征不变的特性,通过建立基于颜色、线条、位置等信息的基础像元素库,并利用正则表达式的组织语法对这些基础元素进行先验知识的... 针对图像匹配过程中生成匹配模板复杂度高的问题,根据应用场景下被识别物轮廓、颜色和空间相对位置等物理特征不变的特性,通过建立基于颜色、线条、位置等信息的基础像元素库,并利用正则表达式的组织语法对这些基础元素进行先验知识的有序组织,赋予它们描述待匹配目标匹配特征的能力,从而能够快速构建出被识别物的匹配模板,缩短图像识别过程中模板生成时间,提高图像识别效率。实验结果表明:基于正则表达式特征提取的目标识别方法能够快速、准确对目标进行识别。在固定视角下其识别率为87.5%,平均识别时间为60.3 ms。相比较于尺度不变特征变换(SIFT)和加速鲁莽特征(SURF)算法,该算法在固定视角下的识别精度和识别效率均有所提高。 展开更多
关键词 正则表达 像元素 模型匹配 特征提取
在线阅读 下载PDF
正则表达式分组的1/(1-1/k)-近似算法 被引量:12
9
作者 柳厅文 孙永 +2 位作者 卜东波 郭莉 方滨兴 《软件学报》 EI CSCD 北大核心 2012年第9期2261-2272,共12页
对正则表达式集合进行分组是解决DFA状态膨胀问题的一种重要方法.已有的分组算法大都是启发式的或蛮力的,分组效果很差.分析了DFA状态膨胀的原因,总结了某些正则表达式间的冲突状况.证明了当冲突非负和冲突独立时,正则表达式集合的最优... 对正则表达式集合进行分组是解决DFA状态膨胀问题的一种重要方法.已有的分组算法大都是启发式的或蛮力的,分组效果很差.分析了DFA状态膨胀的原因,总结了某些正则表达式间的冲突状况.证明了当冲突非负和冲突独立时,正则表达式集合的最优k分组问题可归结为最大k割问题,从而说明该问题是NP-Hard的.基于局部搜索的思想,提出了一种分组算法GRELS来解决分组问题,并证明对最大k割问题,该算法的近似比是1/(1-1/k).与已有的分组算法相比,当分组数目相同时,GRELS算法分组结果的状态总数最少,并且集合发生变化时所需的更新时间最短. 展开更多
关键词 正则表达 深度包检测 分组算法 局部搜索 1/(1-1/k)近似
在线阅读 下载PDF
深度报文检测中基于GPU的正则表达式匹配引擎 被引量:10
10
作者 王磊 陈曙晖 +1 位作者 苏金树 许孟晋 《计算机应用研究》 CSCD 北大核心 2010年第11期4324-4327,共4页
提出了一种基于GPU的正则表达式匹配引擎来加速深度报文检测中的模式匹配过程。该引擎基于DFA模型,在匹配时每一个GPU线程处理一个报文,通过大量的并行线程来提高引擎的吞吐量。基于NVIDIA GeForce 9800GT GPU的实验表明,该引擎处理实... 提出了一种基于GPU的正则表达式匹配引擎来加速深度报文检测中的模式匹配过程。该引擎基于DFA模型,在匹配时每一个GPU线程处理一个报文,通过大量的并行线程来提高引擎的吞吐量。基于NVIDIA GeForce 9800GT GPU的实验表明,该引擎处理实际网络报文时的吞吐量达到了7.91 Gbps。 展开更多
关键词 深度报文检测 模式匹配 正则表达 图形处理单元
在线阅读 下载PDF
基于正则表达式的应用层协议识别加速 被引量:9
11
作者 范慧萍 宣蕾 +1 位作者 陈曙晖 黄高平 《计算机研究与发展》 EI CSCD 北大核心 2008年第z1期438-443,共6页
在当今网络中,传统的采用端口进行协议识别已越来越无法满足需求.采用了正则表达式进行协议识别,并对其匹配正确性和速度进行了优化.通过将NFA匹配引擎转换为DFA匹配引擎,不仅减少了其状态数,还提高了匹配的速度;在匹配方式上提出了3种... 在当今网络中,传统的采用端口进行协议识别已越来越无法满足需求.采用了正则表达式进行协议识别,并对其匹配正确性和速度进行了优化.通过将NFA匹配引擎转换为DFA匹配引擎,不仅减少了其状态数,还提高了匹配的速度;在匹配方式上提出了3种匹配方式,并加以测试比较,并与One-Pass扫描算法相结合.通过对DARPA数据集进行测试,验证加速后的匹配正确性比L7-filter高,匹配速度则可达到其6.5倍. 展开更多
关键词 正则表达 协议识别 有限状态机 One-Pass扫描算法
在线阅读 下载PDF
面向存储的正则表达式匹配算法综述 被引量:13
12
作者 姚远 刘鹏 +1 位作者 单征 田双鹏 《计算机应用》 CSCD 北大核心 2009年第12期3171-3173,3177,共4页
正则表达式匹配是当前深度包检测领域中的关键性技术。介绍了面向存储的正则表达式匹配算法的基本思想和设计方法,给出了算法分类并比较了典型压缩算法间的差异,分析了正则表达式语法对算法设计的影响,最后论述了目前研究中面临的技术... 正则表达式匹配是当前深度包检测领域中的关键性技术。介绍了面向存储的正则表达式匹配算法的基本思想和设计方法,给出了算法分类并比较了典型压缩算法间的差异,分析了正则表达式语法对算法设计的影响,最后论述了目前研究中面临的技术难点并对今后算法设计的发展趋势作了展望。 展开更多
关键词 确定的有限自动机 面向存储 正则表达 深度包检测 压缩算法
在线阅读 下载PDF
基于XML和正则表达式的气象数据处理系统 被引量:4
13
作者 田兰 金石声 +2 位作者 李波 卜英竹 李珏 《计算机科学》 CSCD 北大核心 2013年第11A期432-435,共4页
随着气象综合观测网建设的不断推进,气象实时数据信息传输种类和数据量急剧增加。同时,气象实时数据信息的传输处理呈现某一特定时段需并行处理多类实时数据信息的特点。为实现气象数据信息高效、可靠、完整、及时的收集、存储和共享,采... 随着气象综合观测网建设的不断推进,气象实时数据信息传输种类和数据量急剧增加。同时,气象实时数据信息的传输处理呈现某一特定时段需并行处理多类实时数据信息的特点。为实现气象数据信息高效、可靠、完整、及时的收集、存储和共享,采用XML标记语言对各类实时数据信息的报文内容进行标识和说明的方法,形成各数据业务类型定义,结合基于正则表达式的数据处理应用,使系统具备适应气象观测数据业务变化的能力。实现了对实时气象数据信息在省级中心的收集、处理、分发,改善了原有业务系统繁杂、功能单一、扩展性差、效率低等缺陷。 展开更多
关键词 气象数据 XML 正则表达 多线程
在线阅读 下载PDF
正则表达式的DFA压缩算法 被引量:6
14
作者 杨毅夫 刘燕兵 +2 位作者 刘萍 郭牧怡 郭莉 《通信学报》 EI CSCD 北大核心 2009年第S1期36-42,共7页
基于确定有限自动机(DFA)的正则表达式匹配技术通常用于网络流量实时处理、病毒检测等系统中。随着正则表达式的数量不断增加,DFA的存储空间急剧膨胀。为此,提出了一种有效的DFA压缩算法——簇分割算法,首先总结了DFA的一个结构特征;然... 基于确定有限自动机(DFA)的正则表达式匹配技术通常用于网络流量实时处理、病毒检测等系统中。随着正则表达式的数量不断增加,DFA的存储空间急剧膨胀。为此,提出了一种有效的DFA压缩算法——簇分割算法,首先总结了DFA的一个结构特征;然后依据此特征把DFA分割为3个部分分别存入3个矩阵中,由此构造出2个特征明显的矩阵和1个典型的稀疏矩阵;最后分别对3个矩阵进行压缩。实验表明,簇分割算法在各组数据中均达到了很好的压缩效果,空间压缩率比较稳定。 展开更多
关键词 字符串匹配 自动机压缩 正则表达 入侵检测
在线阅读 下载PDF
蠕虫正则表达式特征自动提取技术研究 被引量:5
15
作者 唐勇 诸葛建伟 +1 位作者 陈曙晖 卢锡城 《通信学报》 EI CSCD 北大核心 2013年第3期141-147,共7页
提出一种实用的蠕虫正则表达式特征自动提取方法,该方法由蠕虫传播网络流样本获取、特征树生成、高假阳性特征剔除、特征融合这4步组成。该方法的优点是可输出具有强描述能力的包含".*"、".{k}"、"|"、&q... 提出一种实用的蠕虫正则表达式特征自动提取方法,该方法由蠕虫传播网络流样本获取、特征树生成、高假阳性特征剔除、特征融合这4步组成。该方法的优点是可输出具有强描述能力的包含".*"、".{k}"、"|"、"(c){k}"等元字符的正则表达式特征。基于蜜罐系统(Honeybow)实现了该方法,并针对互联网上数种真实蠕虫进行了实验。实验结果表明,该方法可以准确地提取真实蠕虫的正则表达式特征,可以在蜜罐、蠕虫及恶意代码分析等系统中应用。 展开更多
关键词 蠕虫 恶意代码 特征提取 特征树 正则表达 蜜罐 入侵检测
在线阅读 下载PDF
基于正则表达式的测试数据自动生成技术 被引量:7
16
作者 董敏 毕盛 齐德昱 《计算机工程》 CAS CSCD 北大核心 2009年第16期29-31,共3页
软件测试是提高软件可靠性、保证软件质量的重要手段。数据自动生成是测试自动化的重要组成部分。提出一种基于正则表达式的测试数据自动生成技术,生成的数据应该具有随机性、可控制、可定义、有意义、无错误等特性,特别是对大字段/专... 软件测试是提高软件可靠性、保证软件质量的重要手段。数据自动生成是测试自动化的重要组成部分。提出一种基于正则表达式的测试数据自动生成技术,生成的数据应该具有随机性、可控制、可定义、有意义、无错误等特性,特别是对大字段/专有类型等特殊类型的支持,可以解决目前测试数据自动生成存在的问题,具有良好的扩展性。 展开更多
关键词 软件测试 正则表达 测试数据自动生成
在线阅读 下载PDF
一种基于Bloom Filter的正则表达式集合快速搜索算法 被引量:4
17
作者 徐克付 齐德昱 +1 位作者 郑伟平 钱正平 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2009年第4期37-41,共5页
正则表达式搜索算法的性能与从非确定性有限状态自动机(NFA)的初始状态到终止状态的最短路径Lmin成正比,与正则表达式所表达的语言的前缀集合Pref(RE)成反比,而一般情况下Pref(RE)较大,确定Pref(RE)中的元素在目标文本中的出现位置比较... 正则表达式搜索算法的性能与从非确定性有限状态自动机(NFA)的初始状态到终止状态的最短路径Lmin成正比,与正则表达式所表达的语言的前缀集合Pref(RE)成反比,而一般情况下Pref(RE)较大,确定Pref(RE)中的元素在目标文本中的出现位置比较困难.文中提出了一种基于Bloom Filter的正则表达式集合搜索算法,此算法利用BloomFilter集合查询时间与集合大小无关的特点,可以快速准备定位Pref(RE)的出现位置,使得搜索速度不受Pref(RE)的影响,如果采用多个Bloom Filter并行,还可以间接增大Lmin.分析与测试结果表明,该算法较大地加快了正则表达式的搜索速度,对于正则表达式集合,算法性能改善尤其明显,在Lmin较长、Pref(RE)较大时,搜索速度可以提高数倍至数十倍,适合大规模的多正则表达式的快速搜索. 展开更多
关键词 正则表达式匹配 BLOOM Filter 自动机 模式匹配
在线阅读 下载PDF
基于正则表达式的深度包检测算法 被引量:14
18
作者 丁晶 陈晓岚 吴萍 《计算机应用》 CSCD 北大核心 2007年第9期2184-2186,2193,共4页
在深入分析了DFA状态数对算法性能影响的基础上,提出了一种新的基于正则表达式的深度包检测算法,该算法保证在任意有限的系统资源下算法的时间复杂度空间复杂度最小。在Linux下实现了该算法,并对基于L7-filter模式集合的网络数据包进行... 在深入分析了DFA状态数对算法性能影响的基础上,提出了一种新的基于正则表达式的深度包检测算法,该算法保证在任意有限的系统资源下算法的时间复杂度空间复杂度最小。在Linux下实现了该算法,并对基于L7-filter模式集合的网络数据包进行了大量检测实验。结果表明,与已有的正则表达式算法比较,该算法的时间复杂度和空降复杂度最小。 展开更多
关键词 深度包检测 模式匹配 正则表达 确定性有限自动机
在线阅读 下载PDF
一种基于正则表达式匹配的协议分析异常检测方法 被引量:5
19
作者 陆虎 宋余庆 +1 位作者 薛万宇 徐景 《计算机应用与软件》 CSCD 北大核心 2008年第3期89-90,107,共3页
在分析了基于协议分析技术的IDS不足的基础上,引入了正则表达式的技术,提出了基于正则表达式匹配的协议分析技术,给出了相应实现算法,并在实际构建IDS规则库时进行了试验,通过实验结果表明,运用正则表达式改善了误用检测中检测特征单一... 在分析了基于协议分析技术的IDS不足的基础上,引入了正则表达式的技术,提出了基于正则表达式匹配的协议分析技术,给出了相应实现算法,并在实际构建IDS规则库时进行了试验,通过实验结果表明,运用正则表达式改善了误用检测中检测特征单一、无法检测新攻击的缺陷,扩展了检测变种攻击的能力,从而大大提高了检测的效率。 展开更多
关键词 入侵检测系统 协议分析 正则表达
在线阅读 下载PDF
基于正则表达式融合语义的农产品自动识别方法 被引量:2
20
作者 芦兵 孙俊 许晓东 《江苏大学学报(自然科学版)》 EI CAS CSCD 北大核心 2018年第4期414-419,共6页
针对同一条传送带上不同类别农产品自动分拣识别率低的问题,根据应用场景下轮廓、颜色和空间相对位置等物理特征不变,以及不同农产品会产生不同振动波的特征,通过建立基于颜色、线条、位置、振动等信息的特征元素库,利用正则表达式的语... 针对同一条传送带上不同类别农产品自动分拣识别率低的问题,根据应用场景下轮廓、颜色和空间相对位置等物理特征不变,以及不同农产品会产生不同振动波的特征,通过建立基于颜色、线条、位置、振动等信息的特征元素库,利用正则表达式的语义规则,对基础特征元素进行先验知识的有序组织,赋予它们描述不同农产品匹配特征的能力,从而快速构建出不同农产品的匹配模型,缩短分拣过程中农产品目标模型生成时间,同时由于融合了振动特征,使得外形相似农产品的识别准确率得到较大提升.试验结果表明:基于正则表达式融合语义特征提取的农产品识别方法能够快速、准确识别各类农产品,从而实现自动分拣的目的,在固定视角下其识别率为92.5%,平均识别时间为50.3 ms,相较传统的尺度不变特征变换(SIFT)和加速鲁莽特征(SURF)算法,本算法在固定视角下的分拣精度和分拣效率均有所提高. 展开更多
关键词 农产品 图像特征 正则表达 融合语义 自动识别 振动
在线阅读 下载PDF
上一页 1 2 11 下一页 到第
使用帮助 返回顶部