-
题名基于有向单连通链的表格框线检测算法
被引量:24
- 1
-
-
作者
郑冶枫
刘长松
丁晓青
潘世言
-
机构
清华大学电子工程系
-
出处
《软件学报》
EI
CSCD
北大核心
2002年第4期790-796,共7页
-
基金
国家自然科学基金资助项目(69972024)
863高科技发展计划基金资助项目(863-306-ZT03-03-1)
-
文摘
表格框线检测是表格识别的基础.现有的表格框线检测算法或者速度慢,或者鲁棒性差,而且没有充分利用表格框线之间的约束信息提出了一种基于所定义的图像结构基元“有向单连通链”的自底向上表格框线检测算法.在此算法中,有向单连通链是一种黑像素游程序列,作为非常合适的矢量基元,在引入一定表格框线约束信息的条件下合并单连通链,有效地去除伪框线,补全断裂的框线,提高了算法的鲁棒性,可以准确而快速地提取表格框线.通过滤除噪声单连通链,加快单连通链的合并速度,算法速度提高了3~10倍,满足了实用要求、实验证明,该算法具有速度较快、鲁棒性高、抗任意角度的倾斜、抗断裂等优点.
-
关键词
表格识别
图像分析
光学字符识别
智能文档处理
表格框线检测算法
有向单连通链
-
Keywords
form recognition
image analysis
line detection
optical character recognition (OCR)
intelligent document processing
-
分类号
TP391.43
[自动化与计算机技术—计算机应用技术]
-