-
题名办公文档与固定版式文档格式关系探讨
被引量:12
- 1
-
-
作者
李宁
田英爱
侯霞
梁琦
-
机构
北京信息科技大学计算机学院
-
出处
《电子学报》
EI
CAS
CSCD
北大核心
2008年第B12期128-132,共5页
-
基金
北京市教委科技发展重点项目暨北京市自然科学基金(No.KZ200810772017)
-
文摘
从文档承载信息的抽象程度,提出了文档分层的思想,分析了以流式办公文档和固定版式文档为主的不同层次文档之间的关系.利用Tagged PDF,成功尝试了在固定版式文档中蕴含和提取办公文档信息,说明固定版式文档中容纳结构化办公文档格式的可行性,指出文档格式标准应贯通两种文档格式,形成完整的标准体系.
-
关键词
文档格式
文档处理
标文通
固定版式文档
TaggedPDF
-
Keywords
document format
document processing
UOF
non-revisable document
tagged PDF
-
分类号
TP317.1
[自动化与计算机技术—计算机软件与理论]
-
-
题名跨文档类型的语义元数据支持方法
被引量:1
- 2
-
-
作者
王詠萱
李宁
田英爱
-
机构
北京信息科技大学计算机学院
-
出处
《计算机工程与设计》
北大核心
2024年第11期3507-3513,共7页
-
基金
国家自然科学基金项目(61672105)。
-
文摘
针对当前可编辑的流式文档在语义元数据支持方面的不足,设计一种在流式文档中记录语义元数据的方法,允许语义元数据随文档内容的编辑而修改,并与文档内容保持同步。为从流式文档中导出独立的元数据内容,提出一种元数据到文本位置的定位方法,避免数据冗余。为实现元数据的共享,提出一种流式文档到版式文档的元数据支持方法,充分发挥元数据的作用。通过实际系统的构建验证了所述方法的可行性。研究成果对于文档的自动理解和智能化处理具有应用价值。
-
关键词
语义元数据
元数据转换
流式文档
固定版式文档
元数据定位
元数据嵌入
元数据提取
-
Keywords
semantic metadata
metadata conversion
re-flowable document
fixed-layout document
metadata location
metadata embedded
metadata extraction
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-