期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
一种基于未知结构网页抽取本体的方法 被引量:3
1
作者 强宇 胡运发 《计算机科学》 CSCD 北大核心 2009年第2期186-189,共4页
在Web上数据大多是结构化的,但事先并不熟知数据的结构,因此不能有效地查询感兴趣的数据。提出了一种独立于文本抽取本体的方法,其过程包括表的理解、数据集成和本体生成,其中表理解是搜寻定位兴趣表、识别及匹配属性和值,并形成记录;... 在Web上数据大多是结构化的,但事先并不熟知数据的结构,因此不能有效地查询感兴趣的数据。提出了一种独立于文本抽取本体的方法,其过程包括表的理解、数据集成和本体生成,其中表理解是搜寻定位兴趣表、识别及匹配属性和值,并形成记录;数据集成是匹配源记录和目标模式;本体卷积是将源记录的数据抽取到目标模式。结果表明这种方法可以通过已知的目标模式有效地抽取未知结构的数据。 展开更多
关键词 异质数据集成 语义对应 表理解 本体抽取
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部