期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
细菌觅食算法与K-means结合的Web用户会话聚类 被引量:2
1
作者 凌海峰 王浩 《计算机工程与应用》 CSCD 2012年第36期121-124,176,共5页
Web用户会话聚类是电子商务领域的NP-难问题,目的是发现相似的用户访问行为模式。该问题难度在于对大规模的Web会话进行聚类,且每个会话都表示为高维向量。提出一种细菌觅食算法和K-means相结合的优化算法,用知名的数据集测试其有效性。... Web用户会话聚类是电子商务领域的NP-难问题,目的是发现相似的用户访问行为模式。该问题难度在于对大规模的Web会话进行聚类,且每个会话都表示为高维向量。提出一种细菌觅食算法和K-means相结合的优化算法,用知名的数据集测试其有效性。对Web会话进行聚类,与流行的聚类算法进行比较,实验结果显示该算法高效且性能更优。 展开更多
关键词 WEB使用挖掘 细菌觅食优化 K-MEANS算法 会话聚类 电子商务
在线阅读 下载PDF
基于混合蚁群算法的Web用户会话聚类 被引量:2
2
作者 凌海峰 曹荣涛 《计算机工程与应用》 CSCD 2013年第22期136-138,218,共4页
会话聚类是一种重要的Web使用挖掘技术,旨在发现相似的用户行为,这是目前电子商务中的热点问题之一。该问题的难度在于要对大规模的会话进行聚类,这些会话被表示成高维向量,加大了对算法高效性的要求。提出了一种ACO和PSO相结合的算法... 会话聚类是一种重要的Web使用挖掘技术,旨在发现相似的用户行为,这是目前电子商务中的热点问题之一。该问题的难度在于要对大规模的会话进行聚类,这些会话被表示成高维向量,加大了对算法高效性的要求。提出了一种ACO和PSO相结合的算法进行会话聚类分析。实验结果表明该算法与ACO算法、PSO算法、K-means算法相比,具有更好的性能。 展开更多
关键词 WEB使用挖掘 蚁群优化 粒子群优化 会话聚类 电子商务
在线阅读 下载PDF
微信会话文本关键词提取的算法研究
3
作者 王宝会 许卜仁 +1 位作者 李长傲 叶子豪 《计算机科学》 北大核心 2025年第S1期239-246,共8页
微信群组中存在大量会话文本数据,对其进行关键词提取有助于理解群组动态和主题演变。由于微信会话文本存在长度短、主题交叉、语言不规范等特点,传统提取方法效果欠佳。为此,提出了一个基于会话主题聚类的多阶段关键词提取算法。首先,... 微信群组中存在大量会话文本数据,对其进行关键词提取有助于理解群组动态和主题演变。由于微信会话文本存在长度短、主题交叉、语言不规范等特点,传统提取方法效果欠佳。为此,提出了一个基于会话主题聚类的多阶段关键词提取算法。首先,提出了一种结合预训练知识的会话主题聚类算法(Single Pass Using Thread Segmentation and Pre-training Knowledge,SP_(TSPK)),综合考虑语义相关性、消息活跃度和用户亲密度,有效解决了会话主题交叉和信息量不足的问题。其次,设计了一种多阶段关键词提取算法(Multi-Stage Keyword Extraction,MSKE),将任务分解为无监督关键词抽取和有监督关键词生成,有效提取原文中存在和缺失的关键词,减少了候选词规模和语义冗余;最终,组合SP_(TSPK)算法与MSKE算法实现微信会话文本关键词提取。在WeChat数据集上相比AutoKeyGen算法,F_(1)@5和F_(1)@O平均提升了12.8%与10.8%,R@10平均达到其2.59倍。实验结果表明,该算法能有效地提取微信会话文本关键词。 展开更多
关键词 文本 文本生成 会话主题 关键词提取
在线阅读 下载PDF
基于Web日志的高精度聚类算法 被引量:4
4
作者 金松河 钱慎一 张素智 《河南科技大学学报(自然科学版)》 CAS 2006年第2期49-51,共3页
提出一种Web日志挖掘算法,该算法首先以Web站点的URL为行、以用户的UserID为列,建立URL- UserID关联矩阵,元素值为用户的访问次数;然后,对行向量进行相似性度量获得用户会话粗聚类,最后,利用层次结构对比聚类算法,对用户会话粗聚类进行... 提出一种Web日志挖掘算法,该算法首先以Web站点的URL为行、以用户的UserID为列,建立URL- UserID关联矩阵,元素值为用户的访问次数;然后,对行向量进行相似性度量获得用户会话粗聚类,最后,利用层次结构对比聚类算法,对用户会话粗聚类进行进一步地处理得到更高精度的聚类,实验表明该算法在提高聚类精度方面卓有成效。 展开更多
关键词 网络 WEB日志挖掘 会话聚类 结构层次
在线阅读 下载PDF
基于超图聚类的用户行为模式挖掘 被引量:5
5
作者 杨明花 古志民 《广西师范大学学报(自然科学版)》 CAS 北大核心 2006年第4期163-166,共4页
为解决代理服务器端用户行为日志的高维特征,提出一种基于超图模型的Web会话聚类方法。该方法利用页面归约和隐含在会话中的时间等统计信息描述会话,并在此基础上利用基于关联规则的超图对用户会话进行聚类,可以在较高层次上发现代理服... 为解决代理服务器端用户行为日志的高维特征,提出一种基于超图模型的Web会话聚类方法。该方法利用页面归约和隐含在会话中的时间等统计信息描述会话,并在此基础上利用基于关联规则的超图对用户会话进行聚类,可以在较高层次上发现代理服务器端的用户行为模式。实验结果表明,该方法可以在大型的代理日志文件集中挖掘出有意义的用户行为模式,有效揭示用户的行为规律。 展开更多
关键词 网络挖掘 行为模式 超图 会话聚类
在线阅读 下载PDF
基于兴趣点的会话相似性测量研究 被引量:2
6
作者 杨明花 古志民 《北京理工大学学报》 EI CAS CSCD 北大核心 2006年第4期330-333,共4页
为提高用户会话聚类的准确性,充分利用页面路径的相似性,提出了基于兴趣点的会话相似性测量方法IPB(interest-point based).该方法充分利用页面路径包含的网站层次结构所体现的分类信息,将同一目录中的页面定义为一个兴趣点.在计算会话... 为提高用户会话聚类的准确性,充分利用页面路径的相似性,提出了基于兴趣点的会话相似性测量方法IPB(interest-point based).该方法充分利用页面路径包含的网站层次结构所体现的分类信息,将同一目录中的页面定义为一个兴趣点.在计算会话相似性时,首先获取用户会话中的兴趣点,根据页面路径的相似性计算兴趣点的相似性,然后根据兴趣点求出会话之间的相似度.实验结果表明,该方法能够更准确地计算Web会话的相似性. 展开更多
关键词 WEB挖掘 会话聚类 兴趣点 会话相似性
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部