期刊文献+

基于关键词的深度万维网数据库查询 被引量:1

Keyword-based Deep Web Database Query
在线阅读 下载PDF
导出
摘要 深度万维网蕴藏着海量的信息,现有的搜索引擎很难搜索到其中的内容。如何充分地获取深度万维网中的有价值的信息成为一个难题。论文提出了基于关键词的深度万维网的数据库的查询方法,该方法采用朴素贝叶斯算法对关键词进行分类,并采用日志挖掘对采样的数据库进行统计,最终生成查询的SQL语句。该方法不仅解决了深度万维网多领域的数据库查询,而且能够与现有的搜索引擎进行整合,帮助用户快速有效的查询。 Deep Web contain vast amounts of information, existing search engines are difficult to search the contents. How to make the access to valuable information in Deep Web becomes a problem. This paper proposes a keyword based Deep Web database query method, the method using the Naive Bayes algorithm to classify the keywords and log mining statistics of the sample database, eventually generate the SQL statement for the query. This method not only solves Deep Web in various fields of the database query, but also can be integrated with the existing search engine to help users to query quickly and efficiently.
出处 《计算机与数字工程》 2013年第4期616-618,630,共4页 Computer & Digital Engineering
基金 上海师范大学科研基金(编号:SK201041)资助
关键词 深度万维网 关键词查询 领域 deep Web, keyword query, domain
作者简介 丁传羽,男,硕士研究生,研究方向:数据库与信息系统。 陈军华,男,硕士,副教授,研究方向:数据库技术与信息系统。 夏海峰,男,硕士研究生,研究方向:数据库与信息系统。
  • 相关文献

参考文献11

  • 1Umara Noor, Zahid Rashid, Azhar Rauf. A survey of automat- ic Deep Web classification techniques[J]. International Journalo{ Computer Applications,2011,19(6) :43-50.
  • 2赵志宏,黄蕾,刘峰,陈振宇.Deep Web搜索技术进展综述[J].山东大学学报(工学版),2009,39(2):15-20. 被引量:5
  • 3刘伟,孟小峰,孟卫一.Deep Web数据集成研究综述[J].计算机学报,2007,30(9):1475-1489. 被引量:136
  • 4范举,周立柱.基于关键词的深度万维网数据库选择[J].计算机学报,2011,34(10):1797-1804. 被引量:11
  • 5Jiawei Han,Micheline Kamber.数据挖掘:概念与技术[M].范明,孟小峰,译.北京:机械工业出版社,2007.
  • 6刘玉奎,周立柱,范举.中文深度万维网数据库的现状研究[J].计算机学报,2011,34(2):360-370. 被引量:7
  • 7LI Guoliang, WU Hao, FENG Jianhua, et al. DBease: Mak- ing databases user-friendly and easily accessible[C]//Proceed- ings of the 5th Biennial Conference on Innovative Data System Research, 2011 : 45-56.
  • 8Bin He, Zhen Zhang, Kevin Chen-Chuan Chang. MetaQueri er: Querying Structured Web Sources on-the-fly[C]//Proceed ings of the 2005 ACM SIGMOD international conference on Management of data, 2005 : 927-929.
  • 9George A. Miller, WordNet: a Lexical Database for English [M]. Communications of the ACM, 1995,38(11) : 39-41.
  • 10徐欣,阮幼林.最大频繁模式的挖掘算法[J].舰船电子工程,2009,29(3):102-106. 被引量:6

二级参考文献128

  • 1黄晓冬.Invisible Web研究综述[J].情报科学,2004,22(9):1144-1148. 被引量:19
  • 2宋峻峰,张维明,肖卫东,唐九阳.基于本体的信息检索模型研究[J].南京大学学报(自然科学版),2005,41(2):189-197. 被引量:44
  • 3赵朋朋,高岭,崔志明.基于查询接口特征的Deep Web数据源自动分类[J].微电子学与计算机,2006,23(10):47-50. 被引量:11
  • 4高岭,赵朋朋,崔志明.Deep Web查询接口的自动判定[J].计算机技术与发展,2007,17(5):148-151. 被引量:13
  • 5BRIN S, PAGE L. The anatomy of a large-scale hypertextual Web search engine[ J]. Computer Networks and ISDN Systems, 1998, 30(1-7) : 107-117.
  • 6BERGMAN M K. The Deep Web: surfacing hidden value[ J]. The Journal of Electronic Publishing, 2001, 7( 1 ):8912-8914.
  • 7CHO J, CARCIA-MOLINA H, PAGE L. Efficient crawling through URL ordering[ J]. Computer Networks and ISDN Systerm, 1998, 30(7) :161-172.
  • 8PEDLEY P. The Invisible Web: searching the hidden parts of the internet[M]. London: Europa Publications Ltd, 2001.
  • 9SHERMAN C, PRICE G. The Invisible Web: uncovering sources search engines can't see [ J]. Library Trends, 2003, 52(2) : 282-298.
  • 10CHANG K C C, HE B, LI C, et al. Structured databases on the Web: observations and implications[ J]. ACM SIGMOD Record, 2004, 33(3):61-67.

共引文献154

同被引文献7

引证文献1

二级引证文献2

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部