-
题名基于表格线游程的选票图像几何结构识别
被引量:8
- 1
-
-
作者
沈军强
肖刚
高飞
陈久军
-
机构
浙江工业大学信息工程学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2009年第17期187-189,192,共4页
-
基金
浙江省自然科学基金资助项目(Y106603)
-
文摘
选票表格几何结构识别是选票图像几何结构识别的关键。提出一种基于表格线游程的表格域提取方法,实现选票表格几何结构识别。该方法以表格线游程作为表格线检测的矢量基元,在一定的约束条件下合并表格线游程实现选票表格中表格线的提取,通过提取得到的表格线实现选票表格中表格域的提取。实验结果表明该方法能够快速有效地实现选票图像的几何结构识别。
-
关键词
选票表格
表格线游程
表格域
-
Keywords
ballot table
run-length of table line
table regional
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名基于游程聚类的表格框线检测算法
被引量:6
- 2
-
-
作者
白伟
崔喆
-
机构
中国科学院成都计算机应用研究所
中国科学院大学
-
出处
《计算机应用》
CSCD
北大核心
2018年第A01期179-182,共4页
-
基金
四川省科技支撑计划项目(2015GZ0088)
"西部之光"联合学者项目
-
文摘
现有的基于游程的表格框线检测算法检测速度快,但对于复杂表格框线检测质量不高,甚至出现大量错误。提出一种基于游程层次聚类的表格框线检测算法。首先,把可能属于同一条横线或纵线的游程划分到一个游程组,定义了两条框之间的相似度;然后以这组游程为初始原子类,通过层次聚类迭代地选择相似度最大的两条横线或纵线合并为一条框线。当相似度最大的两条框线相似度小于预先设定的一个阈值或仅剩下一条框线时迭代停止。针对图像中的标题和说明段等文字信息形成的线条,提出亲属表格线的概念,删除不包含两条亲属表格线的线段,最后对提取的框线进行二次提取。为了对算法加速,提出对各游程组并行聚类。实验结果表明,该算法相比现有算法对一些复杂表格的框线识别率提高了50%以上。
-
关键词
表格识别
框线检测
表格线游程
层次聚类
-
Keywords
table recognition
frame line detection
run-length of table line
hierarchical clustering
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名选票版面结构识别相关技术
- 3
-
-
作者
代威
官磊
韩啸
-
机构
中国科学院成都计算机应用研究所
中国科学院大学
-
出处
《计算机应用》
CSCD
北大核心
2019年第S02期242-246,共5页
-
文摘
针对目前选票处理过程选票物理结构识别和逻辑结构识别存在的问题。提出一种在改进的游程线框检测基础上进行逻辑符号识别的方法。首先对扫描图像进行二值化、倾斜矫正等预处理,接着利用同线游程遍历线框,再通过设定的线段重合度阈值合并相关度高的线段,最后根据定义的垂直连接线判定式找到对应线框。在此之后对线框内字符逻辑结构进行识别,利用双向游程原理设定符号游程,并对符号区域特征优化后,结合游程坐标约束集判定符号所属类别。通过实验对比标记块算法,在保证时间效率的同时,改进算法对符号的处理准确度达到99%,能满足实际选举需求。
-
关键词
电子选举
选票
符号识别
版面理解
表格游程
-
Keywords
electronic election
ballot
symbol recognition
layout understanding
table run
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-