-
题名企业搜索引擎个性化表示与结果排序算法研究
被引量:7
- 1
-
-
作者
李贵林
杨禹琪
高星
廖明宏
-
机构
厦门大学软件学院
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2014年第1期206-214,共9页
-
基金
国家自然科学基金项目(61100032)
中央高校基本科研业务费专项基金项目(2010121072
2010121070)
-
文摘
针对企业搜索引擎提出一种基于本地文档库的个性化表示与结果排序算法,以帮助用户找到真正感兴趣的结果.首先,采用聚类分析对用户浏览的历史文档聚类;其次,采用模糊推理技术对所形成的分类进行分析,发现用户对各分类的喜好程度;再次,按用户对各分类喜好程度的不同,为各分类分配抽样文档数;最后,采用多种抽样技术,从各分类中抽取典型文档.来自不同分类的典型文档构成了表示用户个性的本地文档库.结果排序算法通过计算通用企业搜索引擎的搜索结果与本地文档库中各文档的相似性,对结果集重新排序,从而体现出用户个性.实验结果表明,与传统的基于关键词的个性化表示与结果排序算法相比,基于本地文档集的个性化表示与结果排序算法可以给出更能反映用户个性的查询结果,且可以对用户偏好的变化作出更迅速的反映。
-
关键词
本地文档集
个性化
结果排序
模糊推理
抽样
企业搜索引擎
-
Keywords
local document set
personalization
rank
fuzzy inference
sampling
enterprise searchengine
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于元数据的企业搜索引擎研究
被引量:3
- 2
-
-
作者
文必龙
李智新
王英艳
-
机构
大庆石油学院计算机与信息技术学院
中国石油吉林省吉林市销售分公司
-
出处
《郑州轻工业学院学报(自然科学版)》
CAS
2008年第6期4-6,共3页
-
基金
国家863课题计划项目(2006AA09A102-15)
-
文摘
为解决企业数据针对性较强而普通搜索引擎无法对异构数据进行检索等问题,设计了基于元数据的企业搜索引擎.通过定义和描述异构数据源中的有关信息,可以有效地将异构数据源集成,从而实现对信息资源的选择和定位,提高企业搜索引擎的查全率和查准率.
-
关键词
企业搜索引擎
元数据
异构数据
-
Keywords
enterprises search engine
metadata
isomerism data
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名企业级搜索引擎技术在博客网站中的应用
被引量:1
- 3
-
-
作者
张雪燕
杨晟刚
黄文
冯姚震
-
机构
宁波广播电视大学信息技术系
燕山大学工业计算机控制工程河北省重点实验室
-
出处
《计算机工程与设计》
CSCD
北大核心
2008年第18期4856-4858,4861,共4页
-
基金
宁波社科院网络研究所基金项目(WL06-02)
宁波市教育科学规划基金项目(YGH-111)
-
文摘
随着网络技术的发展和广泛应用,安全的监控网站内容已成为研究的热点之一。根据博客网站体系结构的特点,提出采用企业级搜索引擎技术监控其内容的方法,将索引词库中的词条与非法关键字表进行比较,及时发现非法数据,然后通过审查程序发送信息给管理人员,从而能及时处理问题网页,达到实时和有效的个性化监控,极大地减轻了管理人员的工作负荷。测试实验结果表明,该系统在保证查全率和查准率的基础上,提高了搜索效率并满足了对网站内容的监控要求。
-
关键词
企业级搜索引擎
网页等级
网络爬虫
查全率
博客
-
Keywords
enterprise search engine
PageRank
net crawler
recall ratio
blog
-
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]
-