期刊文献+
共找到32篇文章
< 1 2 >
每页显示 20 50 100
基于CNN-LSTM算法的内部威胁检测方法
1
作者 杨梦华 易军凯 朱贺军 《信息网络安全》 北大核心 2025年第2期327-336,共10页
企业或组织面临的信息安全风险主要来自内部威胁,特别是内部人员的恶意行为,这类风险相较于外部攻击更具隐蔽性和难以检测性。为了更加准确地检测出企业或组织内部人员的恶意行为,文章基于用户行为日志分析,提出一种基于CNNLSTM算法的... 企业或组织面临的信息安全风险主要来自内部威胁,特别是内部人员的恶意行为,这类风险相较于外部攻击更具隐蔽性和难以检测性。为了更加准确地检测出企业或组织内部人员的恶意行为,文章基于用户行为日志分析,提出一种基于CNNLSTM算法的内部威胁检测方法。该方法使用CMU CERT R4.2公开的内部威胁数据集构建用户行为特征序列,首先通过CNN层对用户行为进行重要特征提取,然后使用LSTM层进行用户行为预测,最后通过全连接层识别用户的行为是否为威胁行为。将文章所提出的模型与CNN、LSTM、LSTM-CNN等经典内部威胁检测模型进行了对比实验。实验结果验证了所提模型的可实现性,并且展现出其在内部威胁行为检测方面的优势。在评估指标中,该模型的AUC得分达到0.99。具体而言,实验表明采用CNNLSTM算法进行内部威胁检测的方法能够显著降低误报率,准确率达到98%,能够有效识别企业内部潜藏的威胁行为。 展开更多
关键词 内部威胁检测 用户行为日志 CNN LSTM
在线阅读 下载PDF
水经济运行系统用户异常行为检测模型研究
2
作者 唐茂林 刘刚 +3 位作者 何振邦 于永成 周青山 孟雯锦 《水利水电技术(中英文)》 北大核心 2025年第S1期553-559,共7页
水经济运行系统是水资源管理的重要工具,能够极大地提升电站的运行效率,系统的用户行为直接影响到水经济运行系统的运行状态和数据的准确性。通过系统日志对用户行为的实时监测和分析,可以及时发现潜在的安全威胁。研究从系统日志中挖... 水经济运行系统是水资源管理的重要工具,能够极大地提升电站的运行效率,系统的用户行为直接影响到水经济运行系统的运行状态和数据的准确性。通过系统日志对用户行为的实时监测和分析,可以及时发现潜在的安全威胁。研究从系统日志中挖掘用户异常行为发生的共性,提出了基于Transformer的水经济运行系统用户异常行为检测模型(T-UABI-WEOS)。在不牺牲数据原有信息的前提下,采用特征融合预处理方法优化了数据的表达形式,使得特征之间的相互作用得到了有效的体现,而不是单纯地被独立对待。考虑到用户行为数据的不平衡问题,引入变分自编码器模型(Variational Auto-Encoder, VAE),对异常序列数据进行学习,进而由已训练的VAE模型生成的模拟异常序列数据平衡数据集,以此来增强模型的训练效果。试验结果显示,相较于传统数据预处理方法,该方法能提高模型的预测精度达6%左右。试验对比了不同的深度学习模型,模型T-UABI-WEOS表现出了更高的准确率和较低的误报率。研究成果为电力行业提供了科学的决策支持,通过实时检测出某些用户的行为存在异常,从而及时发现潜在的安全威胁,并采取相应的防范措施,可以更好地应对网络安全事件,确保电力系统的稳定运行和国家的安全稳定。 展开更多
关键词 用户行为日志 特征融合 异常检测 水经济运行系统
在线阅读 下载PDF
融合学术用户多类行为序列特征的文献下载行为预测研究
3
作者 张晓娟 郭佳润 +1 位作者 杨诗涵 桂思思 《情报学报》 北大核心 2025年第4期482-494,共13页
在学术搜索系统中,根据某学术用户历史搜索行为对该用户在下一时间段中所需文献的数量和时间进行预测,有助于提升用户对学术文献推荐结果的满意度。本文通过挖掘学术用户各类行为序列特征提高学术用户下载行为(下一下载session中的下载... 在学术搜索系统中,根据某学术用户历史搜索行为对该用户在下一时间段中所需文献的数量和时间进行预测,有助于提升用户对学术文献推荐结果的满意度。本文通过挖掘学术用户各类行为序列特征提高学术用户下载行为(下一下载session中的下载次数以及距下一下载session的时间间隔)预测的准确度。首先,本文将学术用户下载行为预测问题转化为时间序列预测问题;其次,分别从学术用户查询重构行为、查询表达式与下载行为三个角度抽取特征,并在此基础上利用LSTM(long short-term memory)模型将学术用户历史session建模为时间序列,从而实现对下载行为的预测;最后,对比分析本文提出特征与已有研究提出特征的预测性能,分别探讨不同特征集合以及单个特征的预测效果。本文提出的特征能提高预测任务的准确度,基于对不同学术用户的聚类,在不同类簇上训练得到的LSTM模型具有最佳的整体预测性能。其中,查询表达式相关特征对下一下载session中的下载次数预测效果最佳,下载行为相关特征对距下一下载session的时间间隔预测效果最佳。 展开更多
关键词 学术用户 文献下载行为预测 日志会话 学术搜索 特征挖掘
在线阅读 下载PDF
基于贝叶斯网络和行为日志挖掘的行为信任控制 被引量:9
4
作者 赵洁 肖南峰 钟军锐 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2009年第5期94-100,共7页
目前评估网络用户行为的方法成本高且缺乏可操作性,为了便捷有效地对用户行为信任进行预测与评价,文中首先提出了基于贝叶斯网络的用户行为信任预测和控制算法,算法利用聚类和分布密度函数设置算法参数,建立可量化的证据与信任等级之间... 目前评估网络用户行为的方法成本高且缺乏可操作性,为了便捷有效地对用户行为信任进行预测与评价,文中首先提出了基于贝叶斯网络的用户行为信任预测和控制算法,算法利用聚类和分布密度函数设置算法参数,建立可量化的证据与信任等级之间的对应关系.接着实现基于IIS和.Net底层架构的可配置式信任管理插件,形成用户行为日志,为预测和控制算法提供证据,免除了一般W eb日志的清洗工作.实验结果表明,文中算法可预测多属性下的行为信任等级,提高服务器的安全性和可靠性,并约束了用户的商业行为. 展开更多
关键词 信任管理 行为信任 贝叶斯网络 用户行为 日志挖掘
在线阅读 下载PDF
大规模中文搜索引擎的用户日志分析 被引量:25
5
作者 王继民 陈翀 彭波 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2004年第z1期1-5,共5页
北大"天网"是一个大规模分布式搜索引擎系统.文中对其用户日志进行了分析和研究.结果显示:用户对系统的访问时间并不均等,一天中早晨、下午和晚上各出现一个波峰;通常用户在一天内只进行1-2次内容不同的查询,多于2/3的用户... 北大"天网"是一个大规模分布式搜索引擎系统.文中对其用户日志进行了分析和研究.结果显示:用户对系统的访问时间并不均等,一天中早晨、下午和晚上各出现一个波峰;通常用户在一天内只进行1-2次内容不同的查询,多于2/3的用户点击了结果页面中的某些网址(URL);多数用户输入的查询串中只含有一个词项并且包含中文字符,其中以2-4个汉字居多;用户查看结果页面的时间大约是2-3min;只有少数用户查看历史网页(或称网页快照).用户日志中不同查询串、不同用户和点击不同URL的数量满足Heaps定律. 展开更多
关键词 搜索引擎 用户日志 用户行为 Heaps 定律
在线阅读 下载PDF
基于移动互联网日志的搜索引擎用户行为研究 被引量:15
6
作者 万飞 赵溪 +2 位作者 梁循 潘登 倪志豪 《中文信息学报》 CSCD 北大核心 2014年第2期144-150,共7页
随着移动互联网的迅速发展,移动搜索用户大规模增加,移动搜索引擎用户行为分析对改进搜索引擎性能,提高用户体验具有重要意义。该文选取某移动搜索引擎2011年6月第一周的日志,对移动互联网用户搜索行为进行分析和研究。我们从查询词分... 随着移动互联网的迅速发展,移动搜索用户大规模增加,移动搜索引擎用户行为分析对改进搜索引擎性能,提高用户体验具有重要意义。该文选取某移动搜索引擎2011年6月第一周的日志,对移动互联网用户搜索行为进行分析和研究。我们从查询词分析、会话分析以及用户点击分析3个角度出发,对查询词长度和频度、问题式查询和网址查询比例、会话内查询个数、查询词修改方式以及用户点击位置进行研究,并与互联网搜索引擎相应指标进行对比。相关分析结论对于移动搜索引擎算法改进与系统优化具有一定参考意义。 展开更多
关键词 移动搜索引擎 搜索引擎日志 用户行为分析
在线阅读 下载PDF
基于网页浏览日志的用户行为分析 被引量:13
7
作者 郭俊霞 高城 +1 位作者 许南山 卢罡 《计算机科学》 CSCD 北大核心 2014年第3期110-115,共6页
随着问答社区信息的长期积累,越来越多的过时信息充斥在其中并被搜索引擎检索,给信息需求者带来不便。用户的网页浏览日志中隐性地包含用户的行为习惯,通过分析得到这些信息对判断网页信息时效性有着重要意义。文中提出针对网页浏览日... 随着问答社区信息的长期积累,越来越多的过时信息充斥在其中并被搜索引擎检索,给信息需求者带来不便。用户的网页浏览日志中隐性地包含用户的行为习惯,通过分析得到这些信息对判断网页信息时效性有着重要意义。文中提出针对网页浏览日志的查询过程划分方法,并在划分的基础之上对大量真实用户的浏览行为习惯做了统计分析。结果显示,用户查询一次信息平均浏览8.05个页面,用时6.28分钟,有将近1/3的查询在交替并发中进行,另外用户对于网站站内搜索的依赖较高。从浏览日志数据集中选取了一个社区网站的浏览记录来进行初步的网页信息时效性分析,结果表明造成用户不满意的原因主要是查询相关度不高,而过时信息只是其中一小部分。 展开更多
关键词 网页浏览日志 用户行为分析 网页时效性 问答社区
在线阅读 下载PDF
基于日志分析的中文输入法用户行为研究 被引量:2
8
作者 许丹青 刘奕群 +3 位作者 岑荣伟 马少平 茹立云 杨磊 《中文信息学报》 CSCD 北大核心 2011年第2期44-48,71,共6页
与拼音文字不同,用户在进行中文输入时需要借助输入法软件完成从拼音串到汉字串的转换过程,输入法因此成为中文用户进行人机交互的基础性工具,而输入法的相关技术研发也一直是学术界与产业界的关注热点。在中文输入法技术的研究中,用户... 与拼音文字不同,用户在进行中文输入时需要借助输入法软件完成从拼音串到汉字串的转换过程,输入法因此成为中文用户进行人机交互的基础性工具,而输入法的相关技术研发也一直是学术界与产业界的关注热点。在中文输入法技术的研究中,用户的行为特点对输入法软件的词库建立、算法设计、交互方式设计与性能评价等多方面都有着至关重要的作用,但由于数据获取与分析的困难,这方面的相关研究尚不多见。该文利用某中文输入法在用户许可下收集的超过4.1亿条用户输入行为记录,进行了中文输入法用户行为的分析研究,针对不同类别应用程序的输入词频差异,不同用户在同类应用程序中的不同候选词条的选择等行为特点进行了挖掘分析,研究结果会对深入了解中文输入法用户行为,进而改进输入法软件性能具有一定的指导意义。 展开更多
关键词 中文输入法 用户行为 日志分析
在线阅读 下载PDF
网络搜索引擎的用户查询分析 被引量:20
9
作者 杨文峰 李星 《计算机工程》 CAS CSCD 北大核心 2001年第6期20-21,97,共3页
利用教科网搜索引擎"网络指南针"的查询记录,就其中102439个用户的810396次查询,在用户查询方式、查询表达以及查询词3个层次上,对用户查询行为进行了分析,得到了搜索引擎用户查询的一般规律。根据上述结论对搜索引擎的... 利用教科网搜索引擎"网络指南针"的查询记录,就其中102439个用户的810396次查询,在用户查询方式、查询表达以及查询词3个层次上,对用户查询行为进行了分析,得到了搜索引擎用户查询的一般规律。根据上述结论对搜索引擎的进一步发展进行了讨论。 展开更多
关键词 搜索引擎 日志分析 用户查询 Internet 信息检索
在线阅读 下载PDF
搜索引擎用户点击行为分析 被引量:45
10
作者 王继民 彭波 《情报学报》 CSSCI 北大核心 2006年第2期154-162,共9页
基于大规模分布式搜索引擎系统——北大“天网”的用户点击记录,本文研究发现:用户点击不同URL的数量遵从Heaps定律,点击URL的频度频级服从类Zipf分布,点击URL与页面大小相关,点击URL具有时间局部性,其顺序具有自相似性特征等一... 基于大规模分布式搜索引擎系统——北大“天网”的用户点击记录,本文研究发现:用户点击不同URL的数量遵从Heaps定律,点击URL的频度频级服从类Zipf分布,点击URL与页面大小相关,点击URL具有时间局部性,其顺序具有自相似性特征等一些具有普适性的规律。提出了利用点击日志确定相近查询词的一个新的有效算法。这些研究结果对于掌握用户的搜索行为,完善搜索引擎系统的设计,提高检索服务的效率和质量具有重要的意义。 展开更多
关键词 搜索引擎 点击日志 用户行为 分布特征 相似查询
在线阅读 下载PDF
面向用户互联网访问日志的异常点击分析 被引量:5
11
作者 王倩 刘奕群 +1 位作者 马少平 茹立云 《中文信息学报》 CSCD 北大核心 2010年第3期44-48,61,共6页
随着互联网用户人数的日益增长,用户行为分析已经成为互联网技术领域重要的研究方法之一。在日志中去除异常点击,对于准确挖掘用户行为的意图和习惯十分重要。该文采用某公司提供的真实用户互联网访问日志,对日志中的连续点击,单IP多用... 随着互联网用户人数的日益增长,用户行为分析已经成为互联网技术领域重要的研究方法之一。在日志中去除异常点击,对于准确挖掘用户行为的意图和习惯十分重要。该文采用某公司提供的真实用户互联网访问日志,对日志中的连续点击,单IP多用户以及单用户多IP等可能的异常点击,从访问集中度,用户平均访问量等方面进行了分析。我们认为对于连续点击,用户行为分析研究人员可以分情况滤去多余点击或该用户所有点击,而对于单IP多用户和单用户多IP的点击,我们建议不做处理。 展开更多
关键词 计算机应用 中文信息处理 用户行为分析 互联网访问日志 异常点击
在线阅读 下载PDF
基于Web数据挖掘的用户浏览兴趣路径研究 被引量:5
12
作者 何跃 陈大勇 腾格尔 《计算机工程与应用》 CSCD 2012年第7期106-108,114,共4页
使用Web日志与用户浏览行为相结合的方式对用户浏览兴趣模式进行挖掘。分别建立以访问次数、平均到网页中字符数的访问时间和拉动滑动条次数为元素值的矩阵,通过对矩阵进行路径兴趣度的计算得到兴趣子路径,进行合并生成用户兴趣路径集... 使用Web日志与用户浏览行为相结合的方式对用户浏览兴趣模式进行挖掘。分别建立以访问次数、平均到网页中字符数的访问时间和拉动滑动条次数为元素值的矩阵,通过对矩阵进行路径兴趣度的计算得到兴趣子路径,进行合并生成用户兴趣路径集。实例分析表明该算法是可行和有效的,对于电子商务网站的优化和实施个性化服务具有意义。 展开更多
关键词 浏览兴趣路径 WEB使用挖掘 用户浏览行为 WEB日志
在线阅读 下载PDF
基于中文搜索引擎网络信息用户行为研究 被引量:12
13
作者 王浩 姚长利 +1 位作者 郭琳 艾国庆 《计算机应用研究》 CSCD 北大核心 2009年第12期4665-4668,共4页
为了更好地理解中文搜索用户的检索行为,首先建立一个搜索引擎选择平台,主要是用来生成研究中所需的日志文件;然后从中英文用户的搜索行为差异的角度出发,对日志文件进行深入研究,包括各中文搜索引擎使用率比较以及中文用户输入查询行... 为了更好地理解中文搜索用户的检索行为,首先建立一个搜索引擎选择平台,主要是用来生成研究中所需的日志文件;然后从中英文用户的搜索行为差异的角度出发,对日志文件进行深入研究,包括各中文搜索引擎使用率比较以及中文用户输入查询行为的一些规律等。研究结果表明,对准确地评测搜索引擎检索的效果以及未来中文搜索引擎设计的改进都有较好的指导意义。 展开更多
关键词 中文搜索引擎 搜索日志 用户搜索行为 网络用户
在线阅读 下载PDF
基于粗糙集的Web用户行为预测研究 被引量:5
14
作者 李学俊 李龙澍 徐怡 《计算机工程与应用》 CSCD 北大核心 2008年第13期134-136,共3页
随着互联网的飞速发展和Web应用系统的广泛应用,Web挖掘得到了人们越来越多的研究。从Web日志中发现和分析出用户的有用信息的Web日志挖掘已成为研究热点。很多基于关联规则的方法已经被应用于Web挖掘中。运用基于差别矩阵的粗糙集提取... 随着互联网的飞速发展和Web应用系统的广泛应用,Web挖掘得到了人们越来越多的研究。从Web日志中发现和分析出用户的有用信息的Web日志挖掘已成为研究热点。很多基于关联规则的方法已经被应用于Web挖掘中。运用基于差别矩阵的粗糙集提取Web日志中的关联规则,并将生成的关联规则集用于用户行为的预测。实验结果说明该方法的有效性和实用性。 展开更多
关键词 粗糙集 用户行为预测 WEB日志挖掘 关联规则 差别矩阵
在线阅读 下载PDF
Web日志与浏览行为结合下的用户浏览兴趣数据挖掘分析 被引量:8
15
作者 李珊 刘继超 邵芬红 《现代电子技术》 北大核心 2017年第5期22-25,共4页
针对用户浏览兴趣模式数据的收敛性和准确度不高的问题,提出一种基于Web日志与用户浏览行为结合的用户浏览兴趣模式数据挖掘模型。首先设计Web日志与用户浏览行为结合的用户浏览兴趣模式数据信息流模型,进行用户浏览兴趣模式的频繁项特... 针对用户浏览兴趣模式数据的收敛性和准确度不高的问题,提出一种基于Web日志与用户浏览行为结合的用户浏览兴趣模式数据挖掘模型。首先设计Web日志与用户浏览行为结合的用户浏览兴趣模式数据信息流模型,进行用户浏览兴趣模式的频繁项特征提取和Qo S预测;然后采用Web日志与用户浏览行为结合的行为调度模式自适应检索用户浏览网页的兴趣特征点,实现语义特征匹配,达到用户浏览兴趣模式数据挖掘的目的;最后通过仿真实验实现性能验证。结果表明,该方法的用户浏览兴趣特征点的匹配度高,数据挖掘精度得到提升,展示了优越性能。 展开更多
关键词 WEB日志 用户浏览行为 兴趣模式 数据挖掘
在线阅读 下载PDF
基于用户行为分析的校园网搜索引擎排序方法 被引量:2
16
作者 杨岳湘 苏国荣 邓劲生 《计算机工程》 CAS CSCD 北大核心 2010年第24期275-277,共3页
为提高校园网搜索引擎的查准率,提出一种新的校园网搜索引擎排序方法。该方法基于用户查询主题、用户浏览时间和页面点击等用户行为特征,计算新的页面相关度得分,改进搜索引擎的排序结果,为用户提供更准确的查询服务。实验结果表明,在... 为提高校园网搜索引擎的查准率,提出一种新的校园网搜索引擎排序方法。该方法基于用户查询主题、用户浏览时间和页面点击等用户行为特征,计算新的页面相关度得分,改进搜索引擎的排序结果,为用户提供更准确的查询服务。实验结果表明,在不降低查全率的情况下,应用该排序方法的查准率有明显提高。 展开更多
关键词 校园网 搜索引擎日志 用户行为
在线阅读 下载PDF
基于网络特征的用户图书借阅行为分析——以北京大学图书馆为例 被引量:17
17
作者 燕飞 张铭 +1 位作者 孙韬 肖珑 《情报学报》 CSSCI 北大核心 2011年第8期875-882,共8页
图书借阅是图书馆提供的重要服务之一。研究用户的图书借阅行为模式,有助于图书馆提供面向用户的个性化服务,从而提升服务质最。以北京大学图书馆为例,几乎所有的学生都有图书借阅记录。这种图书借阅行为形成了一个用户到图书的"图书... 图书借阅是图书馆提供的重要服务之一。研究用户的图书借阅行为模式,有助于图书馆提供面向用户的个性化服务,从而提升服务质最。以北京大学图书馆为例,几乎所有的学生都有图书借阅记录。这种图书借阅行为形成了一个用户到图书的"图书借阅网络"。另一方面,相同的图书可以被不同的用户所借阅,图书作为知识的载体,通过这种共同借阅关系将不同背景的用户联系在一起,形成了一种用户到用户的知识分享社会网络,称作"共同借阅网络"。基于这两种网络,本文对用户的借阅行为模式进行了深入的分析,发现了影响用户借阅行为的因素,并从用户借阅行为中挖掘出了新的知识,构造了个性化图书借阅推荐系统。本文的研究成果有利于推进图书馆服务向Library 2.0时代迈进。 展开更多
关键词 用户行为分析 社会网络分析 数字图书馆 日志挖掘
在线阅读 下载PDF
查询会话中的用户行为分析 被引量:3
18
作者 王晓春 李生 +1 位作者 杨沐昀 赵铁军 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2011年第5期76-78,105,共4页
为了更好的理解搜索用户的检索行为,在查询会话基础上分析了用户修改查询的行为规律及用户、查询和点击三者之间的关系.从查询会话的角度,综合考虑了会话中修改的次序、用户、查询和点击等多方面因素,发现了用户修改查询的规律,证明了... 为了更好的理解搜索用户的检索行为,在查询会话基础上分析了用户修改查询的行为规律及用户、查询和点击三者之间的关系.从查询会话的角度,综合考虑了会话中修改的次序、用户、查询和点击等多方面因素,发现了用户修改查询的规律,证明了查询推荐的必要性.统计结果显示:用户修改查询的方式和修改次数有关,而对应的点击数量相对稳定;最终查询一般要比初始查询长,通常是部分替换了初始查询;用户使用搜索引擎的频率越高,修改查询的可能性就越大. 展开更多
关键词 Sogou搜索引擎 日志 查询会话分析 用户行为分析 查询
在线阅读 下载PDF
基于Hive的海量搜索日志分析系统研究 被引量:15
19
作者 赵龙 江荣安 《计算机应用研究》 CSCD 北大核心 2013年第11期3343-3345,共3页
针对传统分布式模型在海量日志并行处理时的可扩展性和并行程序编写困难的问题,提出了基于Hive的Web海量搜索日志分析机制。利用HQL语言以及Hadoop分布式文件系统(HDFS)和MapReduce编程模式对海量搜索日志进行分析处理,对用户搜索行为... 针对传统分布式模型在海量日志并行处理时的可扩展性和并行程序编写困难的问题,提出了基于Hive的Web海量搜索日志分析机制。利用HQL语言以及Hadoop分布式文件系统(HDFS)和MapReduce编程模式对海量搜索日志进行分析处理,对用户搜索行为进行了分析研究。对用户搜索行为中的查询热点主题、用户点击数和URL排名、查询会话的分析结果对于搜索引擎的排序算法和系统优化都有一定的指导意义。 展开更多
关键词 HADOOP MAPREDUCE HQL语言 WEB日志 搜索引擎 用户行为分析
在线阅读 下载PDF
基于社区Web日志挖掘的用户行为实证研究 被引量:5
20
作者 王仁武 袁毅 《图书馆论坛》 CSSCI 北大核心 2011年第4期100-102,共3页
用户访问行为信息记录在Web日志中,通过对海量Web日志进行清洗、抽取和加载来构建用户行为数据仓库,并结合文章所提出的用户访问路径概率矩阵模型进行数据挖掘,可以实现智能化的用户行为监控,可以为用户提供及时优质的信息服务。
关键词 WEB 日志 WEB挖掘 用户行为 访问路径
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部