期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
大规模中文搜索引擎的用户日志分析 被引量:25
1
作者 王继民 陈翀 彭波 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2004年第z1期1-5,共5页
北大"天网"是一个大规模分布式搜索引擎系统.文中对其用户日志进行了分析和研究.结果显示:用户对系统的访问时间并不均等,一天中早晨、下午和晚上各出现一个波峰;通常用户在一天内只进行1-2次内容不同的查询,多于2/3的用户... 北大"天网"是一个大规模分布式搜索引擎系统.文中对其用户日志进行了分析和研究.结果显示:用户对系统的访问时间并不均等,一天中早晨、下午和晚上各出现一个波峰;通常用户在一天内只进行1-2次内容不同的查询,多于2/3的用户点击了结果页面中的某些网址(URL);多数用户输入的查询串中只含有一个词项并且包含中文字符,其中以2-4个汉字居多;用户查看结果页面的时间大约是2-3min;只有少数用户查看历史网页(或称网页快照).用户日志中不同查询串、不同用户和点击不同URL的数量满足Heaps定律. 展开更多
关键词 搜索引擎 用户日志 用户行为 Heaps 定律
在线阅读 下载PDF
基于用户日志双向聚类的查询扩展方法 被引量:1
2
作者 胡炜 徐青翠 樊中奎 《数字技术与应用》 2011年第12期233-234,共2页
文章对基于用户查询日志的查询扩展模型进行了优化,提出了一种新的基于用户日志双向聚类的查询扩展模型。该模型对用户日志中的用户查询和点击文档进行双向聚类,挑选出更符合查询主题的查询扩展词,将其加入到搜索系统中,以达到为用户提... 文章对基于用户查询日志的查询扩展模型进行了优化,提出了一种新的基于用户日志双向聚类的查询扩展模型。该模型对用户日志中的用户查询和点击文档进行双向聚类,挑选出更符合查询主题的查询扩展词,将其加入到搜索系统中,以达到为用户提供高质量检索结果的目的。实验证明,该方法能够有效提高检索的质量。 展开更多
关键词 信息检索 查询扩展 双向聚类 用户日志
在线阅读 下载PDF
基于用户日志双向聚类的跨语言信息检索系统设计 被引量:4
3
作者 张秀云 《现代电子技术》 2021年第24期158-162,共5页
为了解决用户信息检索偏好不清晰导致的传统跨语言信息检索系统存在检索查全率和查准率低的问题,文中提出基于用户日志双向聚类的跨语言信息检索系统设计,从硬件和软件两个方面,利用用户日志双向聚类技术实现对跨语言信息检索系统的优... 为了解决用户信息检索偏好不清晰导致的传统跨语言信息检索系统存在检索查全率和查准率低的问题,文中提出基于用户日志双向聚类的跨语言信息检索系统设计,从硬件和软件两个方面,利用用户日志双向聚类技术实现对跨语言信息检索系统的优化设计。在硬件方面主要对处理器以及存储器等设备进行改装,从硬件角度提升系统的运行性能。在硬件设备的支持下,设计跨语言信息检索系统的软件功能,采集用户日志信息和跨语言检索信息,通过日志双向聚类处理确定用户的检索偏好,并以此为基础计算系统中与关键检索词相似的信息,按照相似度的大小顺序显示相关结果,得出跨语言信息的检索输出结果。系统测试结果表明,与传统系统相比,设计系统的查全率和查准率分别提高了4.6%和6.9%,有效提升了信息检索系统的运行速度与检索效果。 展开更多
关键词 用户日志 双向聚类 跨语言信息 信息检索 系统设计 扩展查询
在线阅读 下载PDF
基于用户日志的相关搜索模型研究
4
作者 史杰 施恒利 杨辉 《信息技术》 2015年第2期134-137,共4页
搜索技术的组成部分发展至今已经呈现多样化,在不同的使用环境它们各有特色,但都致力于为使用者提供更优质的使用体验。现代搜索技术希望从使用者的自然语言出发,为使用者发掘到最理想的目标答案。相关搜索是查询推荐技术在搜索引擎中... 搜索技术的组成部分发展至今已经呈现多样化,在不同的使用环境它们各有特色,但都致力于为使用者提供更优质的使用体验。现代搜索技术希望从使用者的自然语言出发,为使用者发掘到最理想的目标答案。相关搜索是查询推荐技术在搜索引擎中最常见和成功的实现,传统相关搜索基于日志建立的模型是为了应付基于内容分析或初次检索模型的局限性。文中重新划分粒度,更加精确计算用户日志数据的相关性,为使用者提供更好的相关推荐。实验表明,文章结果在应用中有了较好的提高。 展开更多
关键词 相关搜索 用户查询日志 碎片化 可扩展集合
在线阅读 下载PDF
一种基于Web日志用户浏览模式的数据挖掘 被引量:2
5
作者 徐红 张建喜 +1 位作者 朱旭刚 张永军 《信息技术与信息化》 2009年第1期40-42,共3页
Web日志中包含了大量的用户浏览信息,如何有效地从其中挖掘出用户浏览兴趣模式是一个重要的研究课题。本文研究了Web日志挖掘的机理,在分析挖掘频繁遍历路径的问题特征和对其进行形式化描述的基础上,进一步提出了一种在Web日志中挖掘频... Web日志中包含了大量的用户浏览信息,如何有效地从其中挖掘出用户浏览兴趣模式是一个重要的研究课题。本文研究了Web日志挖掘的机理,在分析挖掘频繁遍历路径的问题特征和对其进行形式化描述的基础上,进一步提出了一种在Web日志中挖掘频繁遍历路径算法,该算法能够正确、快速地从Web日志中抽取频繁遍历路径。 展开更多
关键词 WEB 日志用户 数据挖掘 数据库系统 计算机网络
在线阅读 下载PDF
利用支持向量回归确定相关Web查询 被引量:1
6
作者 王继民 彭波 孟涛 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2006年第6期74-78,94,共6页
对用户输入的查询请求,如果搜索引擎系统能给出一个相关查询列表,将有助于用户进行查询修正,进而检索到用户所需要的信息.文中提出了一种利用支持向量回归确定相关W eb查询的新方法.对一个给定的W eb查询,首先从用户的使用记录中抽取候... 对用户输入的查询请求,如果搜索引擎系统能给出一个相关查询列表,将有助于用户进行查询修正,进而检索到用户所需要的信息.文中提出了一种利用支持向量回归确定相关W eb查询的新方法.对一个给定的W eb查询,首先从用户的使用记录中抽取候选查询的5个量化指标:被查询的次数、被查询的用户量、用户在反馈结果中的点击次数、与给定查询间的共有词项个数和点击相同网址(URL)的个数;然后用手工标记部分训练数据,进而建立支持向量回归模型,根据相关度的大小确定相关W eb查询.实验结果表明该方法具有较高的准确度. 展开更多
关键词 搜索引擎 用户日志 相关Web查询 支持向量回归
在线阅读 下载PDF
一种基于偏好的查询扩展方法 被引量:1
7
作者 梅翔 陈俊亮 徐萌 《高技术通讯》 CAS CSCD 北大核心 2007年第11期1142-1146,共5页
为克服语言歧义性和用户使用简短查询语句的习惯对搜索引擎查询准确率造成的影响,提出了一种基于偏好的查询扩展方法。该方法将用户对网页的偏好转化为对知识库中概念的偏好,建立用户兴趣模型,在该模型基础上对原始查询结果进行分析,挑... 为克服语言歧义性和用户使用简短查询语句的习惯对搜索引擎查询准确率造成的影响,提出了一种基于偏好的查询扩展方法。该方法将用户对网页的偏好转化为对知识库中概念的偏好,建立用户兴趣模型,在该模型基础上对原始查询结果进行分析,挑选出与用户偏好关联最紧密的关键词加入原查询,解决了基于局部分析的查询扩展方法在初次检索质量不高时性能恶化的问题。实验表明,本文提出的方法相对于传统的查询扩展算法可以大幅度提高查询精度。 展开更多
关键词 信息检索 个性化 查询扩展 用户日志 偏好 搜索引擎
在线阅读 下载PDF
基于查询与内容的文档表示模型 被引量:1
8
作者 阳小华 周座 《南华大学学报(自然科学版)》 2010年第1期39-42,共4页
在信息检索中,文档表示模型的优劣是影响检索性能的重要因素之一.根据全信息理论,认识论信息是语法信息、语义信息和语用信息的三位一体.当前主流的文档表示模型主要利用语法和语义信息,造成语用信息的缺失,成为改善检索性能的瓶颈.该... 在信息检索中,文档表示模型的优劣是影响检索性能的重要因素之一.根据全信息理论,认识论信息是语法信息、语义信息和语用信息的三位一体.当前主流的文档表示模型主要利用语法和语义信息,造成语用信息的缺失,成为改善检索性能的瓶颈.该文提出了一种整合用户查询行为与文档内容的文档表示模型,将用户隐性反馈的语用信息和文档自身的语义、语法信息相结合,动态调整索引库关键词权重,从而提高信息检索的查全率和查准率. 展开更多
关键词 文档表示模型 用户查询日志 隐性反馈
在线阅读 下载PDF
GMFS:一种新的基于社会网和地理信息的兴趣点推荐方法
9
作者 全紫薇 金虎 +1 位作者 王楠 刘勇 《黑龙江大学工程学报》 2019年第1期72-79,共8页
基于地理位置的社会网(LBSNs)吸引了大量用户通过签到来分享他们的社会关系和地理信息。通过签到信息可了解用户对地点的偏好,从而给用户提供更好的推荐,因此在基于地理位置的社会网上进行兴趣点(POI,Point-of-Interest)推荐逐渐成为了... 基于地理位置的社会网(LBSNs)吸引了大量用户通过签到来分享他们的社会关系和地理信息。通过签到信息可了解用户对地点的偏好,从而给用户提供更好的推荐,因此在基于地理位置的社会网上进行兴趣点(POI,Point-of-Interest)推荐逐渐成为了热点研究问题。以往的研究没有将社会关系和地理信息联合融入到基于矩阵分解的POI推荐方法中。基于社会网和用户签到活动日志,提出了用加权的方法计算用户之间的相似性,在此基础上提出了一个联合社会网和地理信息的加权矩阵分解模型GMFS,并给出了高效的求解方法。多个真实数据集上的实验结果表明:GMFS方法能有效地进行POI推荐。 展开更多
关键词 基于地理位置的社会网 矩阵分解 用户签到活动日志 POI推荐 相似性
在线阅读 下载PDF
海量数据采集技术在IDC不良信息监测系统中的应用研究 被引量:5
10
作者 朱壮军 王彬 《电信工程技术与标准化》 2020年第11期82-87,共6页
本文阐述了某电信企业在建设IDC不良信息监测系统过程中,为高效处理每天的海量数据,选取了多种数据采集技术,进行反复方案论证和实验对比,最终选择了“Hadoop脚本+FTP”方式,极大提高了数据采集效率,实现了海量数据高效采集和处理,保证... 本文阐述了某电信企业在建设IDC不良信息监测系统过程中,为高效处理每天的海量数据,选取了多种数据采集技术,进行反复方案论证和实验对比,最终选择了“Hadoop脚本+FTP”方式,极大提高了数据采集效率,实现了海量数据高效采集和处理,保证IDC不良信息监测系统能够及时发现和处理IDC中包含的不良信息,助力IDC业务健康发展,避免给国家和社会带来负面影响。 展开更多
关键词 IDC 不良信息监测系统 HADOOP 用户上网日志
在线阅读 下载PDF
大数据实时性能挖掘研究与应用 被引量:3
11
作者 金浩 《通信世界》 2022年第19期47-48,共2页
随着移动互联网、物联网、云计算的兴起,以及移动智能终端的快速普及,数据将成为企业战略资产,对内可服务于市场精确营销、网络保障优化、企业经营决策,对外可提供数据服务。目前,大数据运维存在短板:一方面,数据时效性难以满足企业对... 随着移动互联网、物联网、云计算的兴起,以及移动智能终端的快速普及,数据将成为企业战略资产,对内可服务于市场精确营销、网络保障优化、企业经营决策,对外可提供数据服务。目前,大数据运维存在短板:一方面,数据时效性难以满足企业对业务实时监控的需求,多厂家产品制式不统一,难以统一运维;另一方面,查询和分析用户访问日志、定位故障原因主要依赖于节点服务器,效率偏低。 展开更多
关键词 精确营销 云计算 数据实时性 物联网 移动智能终端 用户访问日志 实时监控 企业经营决策
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部