期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于知识的多页文档逻辑结构的分析和理解
1
作者 王姝华 李佐 +1 位作者 蔡士杰 曹阳 《计算机应用与软件》 CSCD 北大核心 2002年第4期33-37,共5页
文档图像理解中最重要的部分是逻辑结构的提取。目前的研究主要集中在页面的布局分析上,少数对文档逻辑结构的研究只是针对单页文档或页面关系简单的多页文档。建筑标书的特殊性在于其层次式的逻辑组成结构没有明确的索引信息标识。本... 文档图像理解中最重要的部分是逻辑结构的提取。目前的研究主要集中在页面的布局分析上,少数对文档逻辑结构的研究只是针对单页文档或页面关系简单的多页文档。建筑标书的特殊性在于其层次式的逻辑组成结构没有明确的索引信息标识。本文提出了一种利用页面间引用关系获取文档逻辑结构的方法。该方法采用修正的树形结构表示文档的逻辑结构,逻辑树的创建过程就是逻辑结构的获取过程,而且有利于更高层的语义处理及还原输出。该方法已在标书自动处理系统中实现,保证了该系统的灵活和高效。 展开更多
关键词 文档理解 文档处理 物理结构 多页文档逻辑结构 知识库 办公自动化
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部