期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
半结构化文档集的结构模式提取的研究与实现 被引量:5
1
作者 杨建武 陈晓鸥 《计算机工程》 CAS CSCD 北大核心 2001年第10期19-21,113,共4页
提出了通过结构模式提取,在信息源对缺失信息进行恢复与重构的思想,给出了结构模式提取模型,并讨论了实现该模型的关键步骤与算法,最后结合基于该模型实现的系统对半结构化文档集的结构模式提取及其应用进行了总结。该研究成果已成功应... 提出了通过结构模式提取,在信息源对缺失信息进行恢复与重构的思想,给出了结构模式提取模型,并讨论了实现该模型的关键步骤与算法,最后结合基于该模型实现的系统对半结构化文档集的结构模式提取及其应用进行了总结。该研究成果已成功应用于实际系统中。 展开更多
关键词 结构文档 结构模式提取 WEB INTERNET
在线阅读 下载PDF
XML文档语义检索方法研究 被引量:4
2
作者 莫正波 宋玲 +1 位作者 吕强 邓薇 《计算机工程与应用》 CSCD 2013年第11期121-125,共5页
由于半结构文档如XML越来越广泛的应用,在数据库和信息检索领域,对半结构XML数据相似度的研究也变得尤为重要。给定XML文档集D和用户查询q,XML检索即是从D中查找出符合q的XML文档。为了有效地进行XML信息检索,提出了一种新的计算用户查... 由于半结构文档如XML越来越广泛的应用,在数据库和信息检索领域,对半结构XML数据相似度的研究也变得尤为重要。给定XML文档集D和用户查询q,XML检索即是从D中查找出符合q的XML文档。为了有效地进行XML信息检索,提出了一种新的计算用户查询与XML文档之间相似度的算法。该算法分为三步:基于WordNet对用户查询q进行同义词扩展得到q';将q'和D中的每一篇XML文档都进行数字签名,并通过签名之间的匹配对D进行有效过滤,除去大量不符合用户查询的文档,得到一个文档子集D',D'í D;对q'与D'中的文档进行精确匹配得到检索结果。 展开更多
关键词 可扩展标示语言(XML) 半结构文档 相似度
在线阅读 下载PDF
采用树自动机推理技术的信息抽取方法 被引量:2
3
作者 谭鹏许 张来顺 《计算机工程与应用》 CSCD 北大核心 2010年第16期153-156,共4页
提出了一种利用改进的k-contextual树自动机推理算法的信息抽取技术。其核心思想是将结构化(半结构化)文档转换成树,然后利用一种改进的k-contextual树(KLH树)来构造出能够接受样本的无秩树自动机,依据该自动机接收和拒绝状态来确定是... 提出了一种利用改进的k-contextual树自动机推理算法的信息抽取技术。其核心思想是将结构化(半结构化)文档转换成树,然后利用一种改进的k-contextual树(KLH树)来构造出能够接受样本的无秩树自动机,依据该自动机接收和拒绝状态来确定是否抽取网页信息。该方法充分利用了网页文档的树状结构,依托树自动机将传统的以单一结构途径的信息抽取方法与文法推理原则相结合,得到信息抽取规则。实验证明,该方法与同类抽取方法相比,样本学习时间以及抽取所需时间上均有所缩短。 展开更多
关键词 树自动机推理算法 结构化(结构化)文档 无秩树自动机 信息抽取 KLH树
在线阅读 下载PDF
基于无秩树自动机的信息抽取技术研究 被引量:1
4
作者 谭鹏许 谭晓贞 张来顺 《计算机工程与设计》 CSCD 北大核心 2009年第23期5506-5509,共4页
针对目前基于网页结构的信息抽取方法的缺陷,提出了一种基于无秩树自动机的信息抽取技术,其核心思想是通过将结构化(半结构化)文档转换成无秩树,然后利用(k,l)-contextual树构造样本自动机,依据树自动机接收和拒绝状态来对网页进行数据... 针对目前基于网页结构的信息抽取方法的缺陷,提出了一种基于无秩树自动机的信息抽取技术,其核心思想是通过将结构化(半结构化)文档转换成无秩树,然后利用(k,l)-contextual树构造样本自动机,依据树自动机接收和拒绝状态来对网页进行数据的抽取。该方法充分利用结构,依托树自动机将传统的以单一结构途径的信息抽取方法与文法推理原则相结合,得到信息抽取规则。实验结果表明,该方法与同类抽取方法相比在准确率、召回率以及抽取所需时间上均有所提高。 展开更多
关键词 无秩树自动机 信息抽取 结构(结构)化文档 (k l)-contextual树 文法推理
在线阅读 下载PDF
XML数据库的并行RPE查询 被引量:1
5
作者 胡军安 于亚新 +1 位作者 王国仁 于戈 《计算机科学》 CSCD 北大核心 2003年第3期120-122,共3页
Existing query methods on XML documents are usually designed for centralized environments. As theamount of documents in Web applications is increasing very quickly, the existing query methods can not meet theneeds of ... Existing query methods on XML documents are usually designed for centralized environments. As theamount of documents in Web applications is increasing very quickly, the existing query methods can not meet theneeds of new Web applications. By extending the query processing strategy for centralized environments, we designand implement a parallel query processing method based on RPE. The experimental results show that the method hasgood speedup and scaleup performance in the case of heavy workload. 展开更多
关键词 XML 数据库 并行RPE查询 数据查询 数据模型 结构文档
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部