摘要
深度万维网蕴藏着海量的信息,现有的搜索引擎很难搜索到其中的内容。如何充分地获取深度万维网中的有价值的信息成为一个难题。论文提出了基于关键词的深度万维网的数据库的查询方法,该方法采用朴素贝叶斯算法对关键词进行分类,并采用日志挖掘对采样的数据库进行统计,最终生成查询的SQL语句。该方法不仅解决了深度万维网多领域的数据库查询,而且能够与现有的搜索引擎进行整合,帮助用户快速有效的查询。
Deep Web contain vast amounts of information, existing search engines are difficult to search the contents. How to make the access to valuable information in Deep Web becomes a problem. This paper proposes a keyword based Deep Web database query method, the method using the Naive Bayes algorithm to classify the keywords and log mining statistics of the sample database, eventually generate the SQL statement for the query. This method not only solves Deep Web in various fields of the database query, but also can be integrated with the existing search engine to help users to query quickly and efficiently.
出处
《计算机与数字工程》
2013年第4期616-618,630,共4页
Computer & Digital Engineering
基金
上海师范大学科研基金(编号:SK201041)资助
作者简介
丁传羽,男,硕士研究生,研究方向:数据库与信息系统。
陈军华,男,硕士,副教授,研究方向:数据库技术与信息系统。
夏海峰,男,硕士研究生,研究方向:数据库与信息系统。