期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
Web表格定位技术的研究与实现 被引量:9
1
作者 廖涛 刘宗田 孙荣 《计算机科学》 CSCD 北大核心 2009年第9期227-230,共4页
Web表格的定位作为Web表格抽取的一个重要研究内容,现在越来越得到更多人的重视。根据Web表格的结构标记和自定义的启发式规则,通过对〈TABLE〉嵌套问题的解决、数据表格完整性的判断、〈TABLE〉树的遍历来完成表格的定位。
关键词 DOM树 表格定位 启发式规则 〈TABLE〉嵌套 遍历
在线阅读 下载PDF
通用表格处理系统中定位方法的研究 被引量:1
2
作者 刘真 吴泉源 《软件学报》 EI CSCD 北大核心 1996年第7期409-414,共6页
本文讨论了通用表格处理系统的基本结构和流程,提出了一种全新的表格定位方法──四角定位法,并且阐明了该方法具体实现时应循循的基本原则.实验表明,四角定位法是一种通用、快速。
关键词 表格定位 图像处理 表格处理系统
在线阅读 下载PDF
版式电子文档表格自动检测与性能评估 被引量:3
3
作者 房婧 高良才 +1 位作者 仇睿恒 汤帜 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2013年第1期45-53,共9页
针对版式电子文档的特点,提出一种表格线分割符和表格文本的布局特征相结合的表格定位方法,并且对中英文档均有效。此外,针对缺少表格定位自动评估体系,构建了一个初具规模的公开数据集,由中英文版式页面等比例组成,对其标注基准结果,... 针对版式电子文档的特点,提出一种表格线分割符和表格文本的布局特征相结合的表格定位方法,并且对中英文档均有效。此外,针对缺少表格定位自动评估体系,构建了一个初具规模的公开数据集,由中英文版式页面等比例组成,对其标注基准结果,并针对移动阅读应用场景提出一套评估准则。通过与现有两个开源表格定位项目的比较,验证了新提出的表格定位方法的有效性和评估体系的实用性,特别是对中文数据集获得了较好的结果。 展开更多
关键词 版式文档 表格定位 表格检测 自动性能评估
在线阅读 下载PDF
非限定表格信息提取系统的研究 被引量:3
4
作者 刘真 吴泉源 《计算机学报》 EI CSCD 北大核心 1995年第11期808-813,共6页
本文概要讨论了非限定表格信息提取系统的结构和技术难点,提出了一种既有利于表格识别,又能进行表格定位的方法──四角定位点法,介绍了利用四角定位点法实现的非限定表格信息提取系统.实验结果表明,该系统具有通用、快速、准确的... 本文概要讨论了非限定表格信息提取系统的结构和技术难点,提出了一种既有利于表格识别,又能进行表格定位的方法──四角定位点法,介绍了利用四角定位点法实现的非限定表格信息提取系统.实验结果表明,该系统具有通用、快速、准确的特点. 展开更多
关键词 信息提取 表格识别 表格定位
在线阅读 下载PDF
表格数据自动识别技术研究 被引量:4
5
作者 张群会 《西安科技学院学报》 2000年第4期353-355,359,共4页
提出了表格数据自动识别算法 ,包括图像预处理、表格定位、偏歪校正、数据信息提取、BP神经网络识别等。较好地解决了表格数据的自动录入问题。
关键词 表格定位 自动识别 BP神经网络 表格数据 图像预处理 字识识别
在线阅读 下载PDF
PDF文件的表格抽取研究综述 被引量:9
6
作者 唐锐 邓建新 +1 位作者 叶志兴 张海平 《计算机应用与软件》 北大核心 2021年第7期1-7,22,共8页
针对PDF文件进行表格抽取研究是获取期刊文献中的表格数据并实现数据管理和共享的基础。通过分析近二十多年的有关PDF表格抽取技术的学术文献,总结出PDF表格抽取的三种思路。从算法构建的特征的角度对主要的表格抽取算法进行分类,并分... 针对PDF文件进行表格抽取研究是获取期刊文献中的表格数据并实现数据管理和共享的基础。通过分析近二十多年的有关PDF表格抽取技术的学术文献,总结出PDF表格抽取的三种思路。从算法构建的特征的角度对主要的表格抽取算法进行分类,并分析算法各自的特点和优劣;介绍表格抽取算法性能评估的研究现状,在此基础上总结和提出未来表格抽取技术的研究和发展方向。 展开更多
关键词 PDF文件 表格检测 表格定位 表格抽取 性能评估
在线阅读 下载PDF
从HTML表格自动构建局部本体方法的研究 被引量:1
7
作者 范莉娅 肖田元 《计算机集成制造系统》 EI CSCD 北大核心 2007年第9期1780-1786,共7页
通过对Web信息源中超文本标记语言表格特点的分析,提出了从超文本标记语言表格自动构建局部本体的方法。该方法包含四个步骤:采用过滤规则,区分定位表格和概念表格;以五元组序列形式化超文本标记语言表格;使用统计方法确定属性单元格;... 通过对Web信息源中超文本标记语言表格特点的分析,提出了从超文本标记语言表格自动构建局部本体的方法。该方法包含四个步骤:采用过滤规则,区分定位表格和概念表格;以五元组序列形式化超文本标记语言表格;使用统计方法确定属性单元格;依据属性单元格间和表格间的位置关系,确定属性间关系。实验结果证明,该方法具有较高的准确性。 展开更多
关键词 局部本体 定位表格 概念表格 属性单元格 值单元格
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部