检索结果-维普期刊中文期刊服务平台

半结构化文档集的结构模式提取的研究与实现被引量：5: 1; 作者杨建武陈晓鸥《计算机工程》 CAS CSCD 北大核心 2001年第10期19-21,113,共4页; 提出了通过结构模式提取,在信息源对缺失信息进行恢复与重构的思想,给出了结构模式提取模型,并讨论了实现该模型的关键步骤与算法,最后结合基于该模型实现的系统对半结构化文档集的结构模式提取及其应用进行了总结。该研究成果已成功应... 展开更多; 关键词半结构化文档集结构模式提取 WEB INTERNET; 在线阅读下载PDF 职称材料

XML文档语义检索方法研究被引量：4: 2; 作者莫正波宋玲 +1 位作者吕强邓薇《计算机工程与应用》 CSCD 2013年第11期121-125,共5页; 由于半结构文档如XML越来越广泛的应用,在数据库和信息检索领域,对半结构XML数据相似度的研究也变得尤为重要。给定XML文档集D和用户查询q,XML检索即是从D中查找出符合q的XML文档。为了有效地进行XML信息检索,提出了一种新的计算用户查... 展开更多; 关键词可扩展标示语言(XML) 半结构文档相似度; 在线阅读下载PDF 职称材料

采用树自动机推理技术的信息抽取方法被引量：2: 3; 作者谭鹏许张来顺《计算机工程与应用》 CSCD 北大核心 2010年第16期153-156,共4页; 提出了一种利用改进的k-contextual树自动机推理算法的信息抽取技术。其核心思想是将结构化(半结构化)文档转换成树,然后利用一种改进的k-contextual树(KLH树)来构造出能够接受样本的无秩树自动机,依据该自动机接收和拒绝状态来确定是... 展开更多; 关键词树自动机推理算法结构化(半结构化)文档无秩树自动机信息抽取 KLH树; 在线阅读下载PDF 职称材料

基于无秩树自动机的信息抽取技术研究被引量：1: 4; 作者谭鹏许谭晓贞张来顺《计算机工程与设计》 CSCD 北大核心 2009年第23期5506-5509,共4页; 针对目前基于网页结构的信息抽取方法的缺陷,提出了一种基于无秩树自动机的信息抽取技术,其核心思想是通过将结构化(半结构化)文档转换成无秩树,然后利用(k,l)-contextual树构造样本自动机,依据树自动机接收和拒绝状态来对网页进行数据... 展开更多; 关键词无秩树自动机信息抽取结构(半结构)化文档 (k l)-contextual树文法推理; 在线阅读下载PDF 职称材料

XML数据库的并行RPE查询被引量：1: 5; 作者胡军安于亚新 +1 位作者王国仁于戈《计算机科学》 CSCD 北大核心 2003年第3期120-122,共3页; Existing query methods on XML documents are usually designed for centralized environments. As theamount of documents in Web applications is increasing very quickly, the existing query methods can not meet theneeds of ... 展开更多; 关键词 XML 数据库并行RPE查询数据查询数据模型半结构化文档; 在线阅读下载PDF 职称材料

题名半结构化文档集的结构模式提取的研究与实现被引量：5: 1; 作者杨建武陈晓鸥; 机构北京大学计算机研究所文字信息处理技术国家重点实验室; 出处《计算机工程》 CAS CSCD 北大核心 2001年第10期19-21,113,共4页; 基金国家重点工程中国百科术语数据库工程新闻出版署--(上报国家计委的重点工程); 文摘提出了通过结构模式提取,在信息源对缺失信息进行恢复与重构的思想,给出了结构模式提取模型,并讨论了实现该模型的关键步骤与算法,最后结合基于该模型实现的系统对半结构化文档集的结构模式提取及其应用进行了总结。该研究成果已成功应用于实际系统中。; 关键词半结构化文档集结构模式提取 WEB INTERNET; Keywords Structure extraction Semi-structure XML Markup language Web publishing; 分类号 TP393.4 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名XML文档语义检索方法研究被引量：4: 2; 作者莫正波宋玲吕强邓薇; 机构青岛理工大学理学院山东建筑大学计算机科学与技术学院国网技术学院电网检修培训部山东科技大学基础课部; 出处《计算机工程与应用》 CSCD 2013年第11期121-125,共5页; 基金国家自然科学基金(No.61170052) 山东省高等教育学会"十二五"高等教育科学研究课题(No.YBKT2011063) 济南科技发展计划(No.200906004); 文摘由于半结构文档如XML越来越广泛的应用,在数据库和信息检索领域,对半结构XML数据相似度的研究也变得尤为重要。给定XML文档集D和用户查询q,XML检索即是从D中查找出符合q的XML文档。为了有效地进行XML信息检索,提出了一种新的计算用户查询与XML文档之间相似度的算法。该算法分为三步:基于WordNet对用户查询q进行同义词扩展得到q';将q'和D中的每一篇XML文档都进行数字签名,并通过签名之间的匹配对D进行有效过滤,除去大量不符合用户查询的文档,得到一个文档子集D',D'í D;对q'与D'中的文档进行精确匹配得到检索结果。; 关键词可扩展标示语言(XML) 半结构文档相似度; Keywords Extensive Makeup Language （XML） semi-structure data similarity; 分类号 TP39 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名采用树自动机推理技术的信息抽取方法被引量：2: 3; 作者谭鹏许张来顺; 机构解放军信息工程大学电子技术学院; 出处《计算机工程与应用》 CSCD 北大核心 2010年第16期153-156,共4页; 文摘提出了一种利用改进的k-contextual树自动机推理算法的信息抽取技术。其核心思想是将结构化(半结构化)文档转换成树,然后利用一种改进的k-contextual树(KLH树)来构造出能够接受样本的无秩树自动机,依据该自动机接收和拒绝状态来确定是否抽取网页信息。该方法充分利用了网页文档的树状结构,依托树自动机将传统的以单一结构途径的信息抽取方法与文法推理原则相结合,得到信息抽取规则。实验证明,该方法与同类抽取方法相比,样本学习时间以及抽取所需时间上均有所缩短。; 关键词树自动机推理算法结构化(半结构化)文档无秩树自动机信息抽取 KLH树; Keywords tree automata inference algorithm （semi-）structured documents unranked tree automata information extraction KLH tree language; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名基于无秩树自动机的信息抽取技术研究被引量：1: 4; 作者谭鹏许谭晓贞张来顺; 机构解放军信息工程大学电子技术学院海军司令部航空管制处; 出处《计算机工程与设计》 CSCD 北大核心 2009年第23期5506-5509,共4页; 文摘针对目前基于网页结构的信息抽取方法的缺陷,提出了一种基于无秩树自动机的信息抽取技术,其核心思想是通过将结构化(半结构化)文档转换成无秩树,然后利用(k,l)-contextual树构造样本自动机,依据树自动机接收和拒绝状态来对网页进行数据的抽取。该方法充分利用结构,依托树自动机将传统的以单一结构途径的信息抽取方法与文法推理原则相结合,得到信息抽取规则。实验结果表明,该方法与同类抽取方法相比在准确率、召回率以及抽取所需时间上均有所提高。; 关键词无秩树自动机信息抽取结构(半结构)化文档 (k l)-contextual树文法推理; Keywords unranked tree automata information extraction （semi-） structured documents （k l）-contextual tree language grammar inference; 分类号 TP391 [自动化与计算机技术—计算机应用技术]; 在线阅读下载PDF 职称材料

题名XML数据库的并行RPE查询被引量：1: 5; 作者胡军安于亚新王国仁于戈; 机构东北大学信息科学与工程学院; 出处《计算机科学》 CSCD 北大核心 2003年第3期120-122,共3页; 基金高等学校优秀青年教师教学科研奖励计划国家自然科学基金(60173051); 文摘 Existing query methods on XML documents are usually designed for centralized environments. As theamount of documents in Web applications is increasing very quickly, the existing query methods can not meet theneeds of new Web applications. By extending the query processing strategy for centralized environments, we designand implement a parallel query processing method based on RPE. The experimental results show that the method hasgood speedup and scaleup performance in the case of heavy workload.; 关键词 XML 数据库并行RPE查询数据查询数据模型半结构化文档; Keywords XML documents, Parallel query. Index. Orient-object databases; 分类号 TP311.13 [自动化与计算机技术—计算机软件与理论]; 在线阅读下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	半结构化文档集的结构模式提取的研究与实现	杨建武陈晓鸥	《计算机工程》 CAS CSCD 北大核心	2001	5	在线阅读下载PDF 职称材料
2	XML文档语义检索方法研究	莫正波宋玲吕强邓薇	《计算机工程与应用》 CSCD	2013	4	在线阅读下载PDF 职称材料
3	采用树自动机推理技术的信息抽取方法	谭鹏许张来顺	《计算机工程与应用》 CSCD 北大核心	2010	2	在线阅读下载PDF 职称材料
4	基于无秩树自动机的信息抽取技术研究	谭鹏许谭晓贞张来顺	《计算机工程与设计》 CSCD 北大核心	2009	1	在线阅读下载PDF 职称材料
5	XML数据库的并行RPE查询	胡军安于亚新王国仁于戈	《计算机科学》 CSCD 北大核心	2003	1	在线阅读下载PDF 职称材料