-
题名一种基于XML的非结构化数据转换方法
被引量:25
- 1
-
-
作者
杨晶
周双娥
-
机构
湖北大学计算机与信息工程学院
-
出处
《计算机科学》
CSCD
北大核心
2017年第B11期414-417,共4页
-
基金
湖北省统计科研计划重点项目(HB131-32)资助
-
文摘
XML作为半结构化的语言,因其能预先定义标记等优势被普遍应用于非结构化到结构化信息的转换中。利用POI技术把网络上繁杂的非结构化数据转化为XML半结构化数据,把半结构化数据转化为结构化数据,使用户能够简便地查询所需信息。通过实验对SAX,DOM的解析效率进行了对比,实验表明解析相同大小的XML文件,SAX比DOM效率更高,而且此种差距会随着XML文件的增大而逐渐增大。
-
关键词
大数据
非结构化数据
可扩展标记语言
文档解析技术
-
Keywords
Big data,Uns truc tured data,Extensible markup language,Document resolution technology
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-