期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于正则表达式的结构化修复改进算法 被引量:1
1
作者 陈万志 宋剑 +1 位作者 王德建 王星 《电子测量与仪器学报》 CSCD 北大核心 2017年第12期2036-2041,共6页
针对结构化数据的清洗问题,以基于正则表达式的结构化修复(RSR)算法为基础,借鉴字符串之间编辑距离的计算思想,将违反偏序关系的边从自动机的边集中提取出来,仅对得到的边引入优先级队列来修正所对应的编辑距离,而其他边由于满足偏序关... 针对结构化数据的清洗问题,以基于正则表达式的结构化修复(RSR)算法为基础,借鉴字符串之间编辑距离的计算思想,将违反偏序关系的边从自动机的边集中提取出来,仅对得到的边引入优先级队列来修正所对应的编辑距离,而其他边由于满足偏序关系则可直接通过递推式来计算,从而提出一种改进RSR算法。算法测试与分析结果表明,改进RSR算法在时间复杂度方面有明显优势,相对原算法的提升显著且稳定。 展开更多
关键词 数据清洗 结构化修复 正则表达式 编辑距离
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部