期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
半结构化文档集的结构模式提取的研究与实现 被引量:5
1
作者 杨建武 陈晓鸥 《计算机工程》 CAS CSCD 北大核心 2001年第10期19-21,113,共4页
提出了通过结构模式提取,在信息源对缺失信息进行恢复与重构的思想,给出了结构模式提取模型,并讨论了实现该模型的关键步骤与算法,最后结合基于该模型实现的系统对半结构化文档集的结构模式提取及其应用进行了总结。该研究成果已成功应... 提出了通过结构模式提取,在信息源对缺失信息进行恢复与重构的思想,给出了结构模式提取模型,并讨论了实现该模型的关键步骤与算法,最后结合基于该模型实现的系统对半结构化文档集的结构模式提取及其应用进行了总结。该研究成果已成功应用于实际系统中。 展开更多
关键词 半结构化文档 结构模式提取 WEB INTERNET
在线阅读 下载PDF
XML数据库的并行RPE查询 被引量:1
2
作者 胡军安 于亚新 +1 位作者 王国仁 于戈 《计算机科学》 CSCD 北大核心 2003年第3期120-122,共3页
Existing query methods on XML documents are usually designed for centralized environments. As theamount of documents in Web applications is increasing very quickly, the existing query methods can not meet theneeds of ... Existing query methods on XML documents are usually designed for centralized environments. As theamount of documents in Web applications is increasing very quickly, the existing query methods can not meet theneeds of new Web applications. By extending the query processing strategy for centralized environments, we designand implement a parallel query processing method based on RPE. The experimental results show that the method hasgood speedup and scaleup performance in the case of heavy workload. 展开更多
关键词 XML 数据库 并行RPE查询 数据查询 数据模型 半结构化文档
在线阅读 下载PDF
采用树自动机推理技术的信息抽取方法 被引量:2
3
作者 谭鹏许 张来顺 《计算机工程与应用》 CSCD 北大核心 2010年第16期153-156,共4页
提出了一种利用改进的k-contextual树自动机推理算法的信息抽取技术。其核心思想是将结构化(半结构化)文档转换成树,然后利用一种改进的k-contextual树(KLH树)来构造出能够接受样本的无秩树自动机,依据该自动机接收和拒绝状态来确定是... 提出了一种利用改进的k-contextual树自动机推理算法的信息抽取技术。其核心思想是将结构化(半结构化)文档转换成树,然后利用一种改进的k-contextual树(KLH树)来构造出能够接受样本的无秩树自动机,依据该自动机接收和拒绝状态来确定是否抽取网页信息。该方法充分利用了网页文档的树状结构,依托树自动机将传统的以单一结构途径的信息抽取方法与文法推理原则相结合,得到信息抽取规则。实验证明,该方法与同类抽取方法相比,样本学习时间以及抽取所需时间上均有所缩短。 展开更多
关键词 树自动机推理算法 结构化(结构化)文档 无秩树自动机 信息抽取 KLH树
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部