-
题名中文交互式网络搜索引擎及其自学习能力
被引量:14
- 1
-
-
作者
杜阿宁
方滨兴
胡铭曾
云晓春
-
机构
哈尔滨工业大学国家计算机信息内容安全重点实验室
-
出处
《计算机工程与应用》
CSCD
北大核心
2003年第10期148-150,212,共4页
-
基金
国家863高科技研究发展计划资助项目(编号:863-104-02-01)
-
文摘
论文介绍了一种具有自学习能力的中文交互式网络搜索引擎INSE(aninteractivenetsearchengineforChi-nesetext),向量空间模型、基于自动机思想的中文分词技术和神经网络BP算法的应用是INSE的主要特点,重点讨论了INSE的自学习能力。基于自动机思想分词是INSE提出的新概念,应用于中文分词可以满足最大匹配且速度较快。INSE自学习能力的实现依靠神经网络的BP算法。该算法应用于交互式网络搜索引擎可以提供更加精确的查询结果。
-
关键词
中文交互式网络搜索引擎
自学习能力
Internet
WWW
计算机网络
向量空间模型
自动机
分词
神经网络
BP算法
信息库
信息检索
信息资源
-
Keywords
Vector Space Model,word segmentation,BP network,automata,neural networks
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
G354.4
[文化科学—情报学]
-
-
题名基于中文搜索引擎网络信息用户行为研究
被引量:12
- 2
-
-
作者
王浩
姚长利
郭琳
艾国庆
-
机构
中国地质大学地下信息探测技术与仪器教育部重点实验室
西门子工厂自动化工程有限公司服务部
-
出处
《计算机应用研究》
CSCD
北大核心
2009年第12期4665-4668,共4页
-
基金
国家"863"计划资助项目(2007AA06Z134)
高等学校学科创新引智计划资助项目(B07011)
-
文摘
为了更好地理解中文搜索用户的检索行为,首先建立一个搜索引擎选择平台,主要是用来生成研究中所需的日志文件;然后从中英文用户的搜索行为差异的角度出发,对日志文件进行深入研究,包括各中文搜索引擎使用率比较以及中文用户输入查询行为的一些规律等。研究结果表明,对准确地评测搜索引擎检索的效果以及未来中文搜索引擎设计的改进都有较好的指导意义。
-
关键词
中文搜索引擎
搜索日志
用户搜索行为
网络用户
-
Keywords
Chinese search engine
search log
user search behavior
Web user
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名中文元搜索引擎万纬搜索探讨
被引量:5
- 3
-
-
作者
葛驰
-
机构
中南大学医学图书馆
-
出处
《情报杂志》
CSSCI
北大核心
2005年第4期110-112,共3页
-
文摘
在分析元搜索引擎发展现状的基础上,对中文元搜索引擎万纬搜索的特点、检索功能与不足等进行探讨,指出中文元搜索引擎发展的基本走向。
-
关键词
中文检索
元搜索引擎
网络信息检索
“万纬”搜索
-
分类号
G354.2
[文化科学—情报学]
-
-
题名中文搜索引擎的现状与发展
被引量:5
- 4
-
-
作者
吴娱
-
机构
南开大学国际商学院
-
出处
《现代情报》
2003年第3期40-42,44,共4页
-
文摘
随着我国互联网络的发展 ,网上的中文信息资源和上网的中文用户大量增加 ,迫切需要一种能提供中文界面 ,能搜索网上中文站点资源的搜索引擎 ,以满足广大用户对中文信息的查询需求。在这样的形势下 ,中文搜索引擎便应运而生了。本文对几种常用的中文搜索引擎作了分析评价 ,指出了中文搜索引擎现存的问题 。
-
关键词
中文搜索引擎
信息检索
网络信息资源
检索性能
中文信息处理技术
-
Keywords
Searching engine
Information retrieval
-
分类号
G250.73
[文化科学—图书馆学]
TP393.092
[自动化与计算机技术—计算机应用技术]
-
-
题名中文搜索引擎探析
- 5
-
-
作者
张玉珍
-
机构
宁夏大学
-
出处
《现代情报》
2003年第11期89-90,94,共3页
-
文摘
本文对网络搜索引擎的工作过程、类别及中文搜索引擎的现状作了简要分析 ,指出中文搜索引擎目前存在的具体问题 ,论述了可以提高中文搜索引擎质量的几种途径 。
-
关键词
中文搜索引擎
网络搜索引擎
智能化搜索
信息过滤
检索语言
-
Keywords
searching engine
information retrieval
information filtering
intelligentized search
-
分类号
TP393.4
[自动化与计算机技术—计算机应用技术]
G354.2
[文化科学—情报学]
-
-
题名大规模中文搜索引擎的架构和设计技术
被引量:5
- 6
-
-
作者
王剑
邵志清
-
机构
华东理工大学计算机科学与工程系
-
出处
《计算机科学》
CSCD
北大核心
2002年第1期26-29,共4页
-
文摘
信息检索技术已经发展了多年.然而,随着WWw的发展,网络信息空前膨胀.据2000年2月份统计,可索引的网页己达到10亿,而且每天以几百万速度递增.2000年6月份,索引的网页达到20亿[1].
-
关键词
计算机网络
中文搜索引擎
设计
网页
信息检索
-
Keywords
Information retrieval, Search engine, Ranking of Web pages , Index, Chinese segmentation
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
G354.4
[文化科学—情报学]
-
-
题名中文综合性搜索引擎自编分类体系的现状、问题与设想
被引量:1
- 7
-
-
作者
殷丽
-
机构
河南工业大学
-
出处
《现代情报》
2004年第9期38-41,共4页
-
文摘
通过对目前几大中文综合性搜索引擎网络信息分类体系的现状和存在的问题进行分析,提出了对构建中文综合性搜索引擎分类体系的建议与设想。认为,试图强行“统一”不是万全之策,惟有吸收RDF和XML的思想,构建出一个规则框架,强化其可扩展性。
-
关键词
中文综合性搜索引擎
网络信息
分类体系
-
Keywords
Chinese comprehensive search engine
network information
classification system
-
分类号
C356.8
[社会学]
-
-
题名基于日志挖掘的搜索引擎用户行为分析
被引量:32
- 8
-
-
作者
岑荣伟
刘奕群
张敏
茹立云
马少平
-
机构
智能技术与系统国家重点实验室清华信息科学与技术国家实验室(筹)清华大学计算机科学与技术系
-
出处
《中文信息学报》
CSCD
北大核心
2010年第3期49-54,共6页
-
基金
国家自然科学基金项目资助(60736044
60903107)
高等学校博士学科点专项科研基金资助(20090002120005)
-
文摘
随着网络搜索用户的大规模增加,网络用户行为分析已成为网络信息检索系统进行架构分析、性能优化和系统维护的重要基石,是网络信息检索和知识挖掘的重要研究领域之一。为更好理解网络用户的搜索行为,该文基于7.56亿条真实网络用户行为日志,对用户行为进行分析和研究。我们主要考察了用户搜索行为中的查询长度、查询修改率、相关搜索点击率、首次/最后一次点击位置分布以及查询内点击数分布等信息。该文还基于不同类型的查询集合,考察用户在不同查询需求下的行为差异性。相关分析结果对搜索引擎算法优化和系统改进等都具有一定的参考意义。
-
关键词
计算机应用
中文信息处理
用户行为分析
搜索引擎
网络信息检索
-
Keywords
computer application
Chinese information processing
user behavior analysis
search engine
web information retrieval
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于大规模日志分析的搜索引擎用户行为分析
被引量:119
- 9
-
-
作者
余慧佳
刘奕群
张敏
茹立云
马少平
-
机构
清华大学智能技术与系统国家重点实验室
搜狗公司研发中心
-
出处
《中文信息学报》
CSCD
北大核心
2007年第1期109-114,共6页
-
基金
国家重点基础研究(973)资助项目(2004CB318108)
国家自然科学基金资助项目(60223004
+3 种基金
60321002
60303005
60503064)
教育部科学技术研究重点资助项目(104236)
-
文摘
用户行为分析是网络信息检索技术得以前进的重要基石,也是能够在商用搜索引擎中发挥重要作用的各种算法的基本出发点之一。为了更好的理解中文搜索用户的检索行为,本文对搜狗搜索引擎在一个月内的近5 000万条查询日志进行了分析。我们从独立查询词分布、同一session内的用户查询习惯及用户是否使用高级检索功能等方面对用户行为进行了分析。分析结论对于改进中文搜索引擎的检索算法和更准确的评测检索效果都有较好的指导意义。
-
关键词
计算机应用
中文信息处理
网络信息检索
搜索引擎
用户行为分析
点击信息分析
-
Keywords
computer application
Chinese information processing
web information retrieval
search engine
user behavior analysis
click through data analysis
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名搜索引擎技术与服务的研究及其启示
被引量:30
- 10
-
-
作者
符绍宏
黄崑
-
机构
北京师范大学信息技术与管理学系
-
出处
《情报学报》
CSSCI
北大核心
2000年第6期628-636,共9页
-
文摘
本文从宏观上对国外主要的英文搜索引擎的技术与服务特色进行了一些理论上的探讨 ,同时联系我国中文搜索引擎的现状 ,分析了目前中文搜索引擎存在的不足 ,展望了未来发展趋势 ,最后提出了几点建议。
-
关键词
搜索引擎
网络信息服务
中文搜索引擎
-
Keywords
search engine
information service on Internet
develepment
Chinese search engine
-
分类号
G354
[文化科学—情报学]
-
-
题名搜索引擎Baidu(百度)研究
被引量:9
- 11
-
-
作者
费志勇
褚润贞
-
机构
常熟高等专科学校
-
出处
《现代情报》
2003年第9期95-96,共2页
-
文摘
Baidu (百度 )搜索引擎是目前全球最优秀的中文信息检索与传递的网上搜索引擎 ,其强大的中文搜索服务已经成为大多数中文用户使用的首选 ,本文着力探讨其强大的功能和特点 。
-
关键词
搜索引擎
BAIDU
“百度”
中文信息检索
网络检索工具
-
Keywords
search engine
baidu
Chinese search
-
分类号
TP393.4
[自动化与计算机技术—计算机应用技术]
-
-
题名基于Web的信息资源检索工具—“搜索引擎”
被引量:12
- 12
-
-
作者
张彦民
-
机构
佛山科学技术学院图书馆
-
出处
《图书馆论坛》
CSSCI
北大核心
2001年第4期34-36,共3页
-
文摘
介绍了搜索引擎的基本概念 ,阐述了搜索引擎的主要功能和使用技巧 ,并对几种常用的中文搜索引擎工具进行了介绍和比较。
-
关键词
搜索引擎
信息资源检索
WEB
检索功能
使用技巧
网络指南针
雅虎中文
搜狐
-
Keywords
search engine
retrieve
-
分类号
G354
[文化科学—情报学]
-
-
题名国内医学搜索引擎的现状及发展对策
被引量:3
- 13
-
-
作者
朱晓丽
-
机构
北京市结核病胸部肿瘤研究所
-
出处
《现代情报》
北大核心
2007年第2期32-34,38,共4页
-
文摘
通用搜索引擎没有对医学专业信息进行优化处理,不适合检索专业化的医学信息。因此,为了适应用户需要,加强对医学专业搜索引擎的研究是十分必要的。本文指出了国内医学搜索引擎存在的问题,提出了中文医学搜索引擎改变现状、快速发展的几点对策。
-
关键词
医学搜索引擎
网络医学信息资源
网络中文医学信息开发
-
Keywords
medical search engine
Intemet medical information resources
Intemet Chinese medical information development
-
分类号
G354.4
[文化科学—情报学]
-
-
题名面向主题的元搜索引擎
被引量:1
- 14
-
-
作者
王继生
王一莉
-
机构
南京工业大学信息科学与工程学院
-
出处
《计算机工程与设计》
CSCD
北大核心
2009年第4期909-911,共3页
-
文摘
介绍了一种基于神经网络的面向主题的元搜索引擎。它使用神经网络对检索结果进行优化排序,它先对返回结果进行中文分词,在充分挖掘其语义信息的基础上,利用CC4神经网络对网页的相关性进行判断,对返回结果重新排序,很好地解决了综合性搜索引擎中普遍存在搜索结果不准确、信息滞后等问题。实验结果表明,该方法对结果进行了最优化排序,实际执行性能较好。
-
关键词
面向主题
元搜索引擎
神经网络
相关性
中文分词
-
Keywords
topic-oriented
meta search engine
neural network
correlation
Chinese participle
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于自适应互动式的元搜索引擎
- 15
-
-
作者
王继生
王一莉
-
机构
南京工业大学信息科学与工程学院
-
出处
《计算机工程与设计》
CSCD
北大核心
2009年第7期1656-1659,1663,共5页
-
文摘
搜索引擎用户个性化的研究是搜索引擎优化的一个研究热点。一些检索系统不能满足用户的需求,提出了一种基于自适应互动式的元搜索引擎,系统借助于用户在和元搜索引擎交互的过程中用户的行为记录为用户动态的生成其偏好的查询接口,用户与元搜索引擎交互的过程中动态更新用户行为模型,自适应的满足不同检索动机的用户的信息需求,利用CC4神经网络在对网页的相关行进行判断对返回结果重新排序。
-
关键词
元搜索引擎
神经网络
相关性
中文分词
自适应
-
Keywords
meta search engine
neural network
correlation
Chinese participle
adaptive
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名一种基于概念的交互式Web搜索模型
被引量:2
- 16
-
-
作者
徐勋明
薛永生
王劲波
吕晓华
-
机构
厦门大学计算机科学系
-
出处
《计算机应用与软件》
CSCD
北大核心
2004年第12期9-10,27,共3页
-
基金
福建省自然科学基金项目资助(A0 31 0 0 0 8)
-
文摘
当前基于关键字查询的大多数搜索引擎都没有提供个性化的用户服务 ,搜索结果主要根据关键字与文档的相似度来排序 ,这很难满足用户对日益膨胀的信息资源的需求。面对用户越来越难以迅速精确地检索到所需信息的现状 ,本文提出一种应用于LAN中的基于概念的三层搜索引擎模型 :通过用户交互的方式 ,使得搜索具有个性化、智能化的特点。
-
关键词
搜索引擎
网络资源
信息资源
计算机网络
JDBC
交互式Web搜索模型
-
Keywords
Search engine Keywords Concept Interactivity
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名学会搜索网络教育资源
- 17
-
-
作者
尹承华
-
机构
山东省宁阳实验高中
-
出处
《地理教学》
2006年第11期30-30,共1页
-
文摘
一、合理选择中文搜索引擎
在获取一般性、大众化的信息时,我们可以充分利用国内三大门户网站的搜索引擎。即搜狐搜索、网易搜索和新浪搜索,它们可针对网站、新闻、软件等信息做出快速、高容量的查询。
-
关键词
中文搜索引擎
教育资源
网络
门户网站
大众化
高容量
信息
-
分类号
G633.55
[文化科学—教育学]
-
-
题名网络信息的分类及对策
被引量:29
- 18
-
-
作者
邱燕燕
-
机构
广东工业大学图书馆
-
出处
《图书馆论坛》
CSSCI
北大核心
2001年第2期74-76,共3页
-
文摘
从网络信息的特点及搜索引擎对网络信息的分类和传统文献分类法在网络信息分类中的应用等方面 。
-
关键词
网络信息
分类
自动分类
搜索引擎
传统分类法
中文网络信息分类法
-
Keywords
Network information
classify
auto classify
-
分类号
G254
[文化科学—图书馆学]
-
-
题名开发利用网络信息资源的对策研究
被引量:44
- 19
-
-
作者
李家清
-
机构
重庆商学院图书馆
-
出处
《图书情报知识》
CSSCI
北大核心
2001年第1期25-27,共3页
-
文摘
从五个方面 。
-
关键词
网络信息资源
开发利用
中文信息资源建设
国家扶持
技术研究
元搜索引擎
推送技术
-
分类号
G250.73
[文化科学—图书馆学]
-
-
题名图书情报人员在网络信息组织中的任务
被引量:9
- 20
-
-
作者
柳丽花
-
机构
中山大学信息管理系
-
出处
《图书与情报》
CSSCI
北大核心
2002年第1期65-68,共4页
-
文摘
文章提出了图书馆员在网络信息组织中的六大任务 :对网络信息资源进行编目 ;完善搜索引擎的功能 ;建立网上贮存图书馆 ;加快中文信息上网的建设 ;完善网上各学科信息的平衡性 ;自觉采用“合理使用”与“获取许可”的双重作品利用形式。
-
关键词
中文信息上网
图书情报人员
网络信息组织
网络信息资源编目
网上图书馆
搜索引擎
信息服务
-
分类号
G250.73
[文化科学—图书馆学]
G251.6
[文化科学—图书馆学]
-