期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于DOM树与领域本体的Web抽取方法 被引量:6
1
作者 郭建兵 崔志明 +1 位作者 陈明 赵朋朋 《计算机工程》 CAS CSCD 2012年第5期56-58,共3页
为解决异构DeepWeb结果页面中数据区域及数据记录的自动抽取问题,提出一种基于DOM树与领域本体的Web抽取方法。利用数据内容特征以及领域本体库标记DOM树的节点,按照结果页面展示规律定位数据区域,根据改进的简单树匹配算法,定位数据区... 为解决异构DeepWeb结果页面中数据区域及数据记录的自动抽取问题,提出一种基于DOM树与领域本体的Web抽取方法。利用数据内容特征以及领域本体库标记DOM树的节点,按照结果页面展示规律定位数据区域,根据改进的简单树匹配算法,定位数据区域及数据记录。实验结果表明,该方法定位数据区域及数据记录的F-measure值比传统的抽取方法高2.93%~6.67%。 展开更多
关键词 自动抽取 DOM树 领域本体 数据区域定位 简单树匹配
在线阅读 下载PDF
一种基于范围型属性的Deep Web数据提取方法 被引量:2
2
作者 郭建兵 崔志明 +1 位作者 陈明 赵朋朋 《计算机应用与软件》 CSCD 北大核心 2013年第2期54-57,共4页
针对在Deep Web数据库查询结果存在上限k的情况下,对于如何提取数据记录的问题,提出一种基于范围型属性的数据提取方法。利用范围型属性的值域特征,将其值域按照目标数据库的分布样本划分为多个子区间。实验结果表明,按照该方法划分的... 针对在Deep Web数据库查询结果存在上限k的情况下,对于如何提取数据记录的问题,提出一种基于范围型属性的数据提取方法。利用范围型属性的值域特征,将其值域按照目标数据库的分布样本划分为多个子区间。实验结果表明,按照该方法划分的子区间,使得查询收益,查询饱和度和已提取数据的覆盖程度等指标均达到98.50%以上。 展开更多
关键词 数据提取 DEEP WEB 区间划 Top-k元组 范围型属性
在线阅读 下载PDF
一种基于语义词典的本体对齐框架 被引量:1
3
作者 杨舟 岳亮 崔志明 《计算机应用与软件》 CSCD 北大核心 2012年第8期49-51,130,共4页
提出一种基于语义词典的本体对齐框架。首先抽取出代表本体元素的字符串,这些字符串包括本体中的概念、实例、关系等,并利用现有的词典和语义资源将字符串变为词的集合;然后将本体对齐转换为单词集合间的映射,通过多相似度的匹配算法来... 提出一种基于语义词典的本体对齐框架。首先抽取出代表本体元素的字符串,这些字符串包括本体中的概念、实例、关系等,并利用现有的词典和语义资源将字符串变为词的集合;然后将本体对齐转换为单词集合间的映射,通过多相似度的匹配算法来进行相似度计算,从而实现本体对齐。实验结果表明,所提出的方法是有效的且较之以前的对齐方法有一定的提高。 展开更多
关键词 本体 本体对齐 语义WEB
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部