期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
一种基于XML的非结构化数据转换方法 被引量:25
1
作者 杨晶 周双娥 《计算机科学》 CSCD 北大核心 2017年第B11期414-417,共4页
XML作为半结构化的语言,因其能预先定义标记等优势被普遍应用于非结构化到结构化信息的转换中。利用POI技术把网络上繁杂的非结构化数据转化为XML半结构化数据,把半结构化数据转化为结构化数据,使用户能够简便地查询所需信息。通过实验... XML作为半结构化的语言,因其能预先定义标记等优势被普遍应用于非结构化到结构化信息的转换中。利用POI技术把网络上繁杂的非结构化数据转化为XML半结构化数据,把半结构化数据转化为结构化数据,使用户能够简便地查询所需信息。通过实验对SAX,DOM的解析效率进行了对比,实验表明解析相同大小的XML文件,SAX比DOM效率更高,而且此种差距会随着XML文件的增大而逐渐增大。 展开更多
关键词 大数据 非结构化数据 可扩展标记语言 文档解析技术
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部