期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
基于Web日志的高精度聚类算法 被引量:4
1
作者 金松河 钱慎一 张素智 《河南科技大学学报(自然科学版)》 CAS 2006年第2期49-51,共3页
提出一种Web日志挖掘算法,该算法首先以Web站点的URL为行、以用户的UserID为列,建立URL- UserID关联矩阵,元素值为用户的访问次数;然后,对行向量进行相似性度量获得用户会话粗聚类,最后,利用层次结构对比聚类算法,对用户会话粗聚类进行... 提出一种Web日志挖掘算法,该算法首先以Web站点的URL为行、以用户的UserID为列,建立URL- UserID关联矩阵,元素值为用户的访问次数;然后,对行向量进行相似性度量获得用户会话粗聚类,最后,利用层次结构对比聚类算法,对用户会话粗聚类进行进一步地处理得到更高精度的聚类,实验表明该算法在提高聚类精度方面卓有成效。 展开更多
关键词 网络 web日志挖掘 会话聚类 结构层次
在线阅读 下载PDF
自组织映射在Web结构挖掘中的应用 被引量:1
2
作者 周晓峥 刘勘 +1 位作者 孟波 周洞汝 《计算机工程与应用》 CSCD 北大核心 2003年第3期31-33,共3页
该文讨论了用自组织映射进行Web结构挖掘的基本方法。用SOM可直观地表示数据的相似性和进行分类,还可方便地进行数据聚簇分析,并可在Web挖掘中找到权威页面等有用信息。
关键词 自组织映射 web结构挖掘 聚簇 数据挖掘 数据库 INTERNET
在线阅读 下载PDF
Web站点层次结构抽取算法的分析和实现 被引量:3
3
作者 冯雁 王申康 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2005年第10期1507-1511,共5页
为了提高搜索引擎、网站管理及推荐系统的运行效率,提出了一种重构网站层次结构的方法,该方法以人工智能及图论为基础,通过对标记信息、网站的目录信息以及链接信息等的分析,定义和建立了网站的数据模型:结构标记图,并采用最短路径算法(... 为了提高搜索引擎、网站管理及推荐系统的运行效率,提出了一种重构网站层次结构的方法,该方法以人工智能及图论为基础,通过对标记信息、网站的目录信息以及链接信息等的分析,定义和建立了网站的数据模型:结构标记图,并采用最短路径算法(Dijkstral),完成Web站点的层次结构抽取.算法体系由5层构成:显示层、网站层、页面分析层、预处理层和连接层.实验结果证明该方法能正确地建立网站的层次结构,并具有较快的运行时间. 展开更多
关键词 web 结构挖掘 标记图 目录信息
在线阅读 下载PDF
基于Web页面结构和主色调的聚类算法 被引量:1
4
作者 赵涓涓 陈俊杰 李元俊 《计算机工程》 CAS CSCD 北大核心 2010年第3期1-3,共3页
针对目前Web聚类准确率不高的问题,提出一种基于Web页面链接结构和页面中图片主色调特征的聚类算法。通过分析Web页面中的链接结构和Web页面中所显示图片的主色调来比较页面之间的相似度,对Web站点中的Web页面进行聚类。聚类过程兼顾We... 针对目前Web聚类准确率不高的问题,提出一种基于Web页面链接结构和页面中图片主色调特征的聚类算法。通过分析Web页面中的链接结构和Web页面中所显示图片的主色调来比较页面之间的相似度,对Web站点中的Web页面进行聚类。聚类过程兼顾Web页面结构和页面的主要色彩特征。系统实验结果表明,该算法能有效提高聚类的准确性。 展开更多
关键词 聚类 web挖掘 链接结构 主色调
在线阅读 下载PDF
Web文本聚类算法WTCA的研究与实现 被引量:1
5
作者 郑煜 钱榕 《计算机工程与应用》 CSCD 北大核心 2007年第4期170-172,共3页
提出了一种新的Web文本聚类算法WTCA——基于自组织特征映射神经网络(SOM)的聚类算法。该算法分为训练SOM网络及聚类分析两个阶段,具有自稳定性,无须外界给出评价函数;能够识别概念空间中最有意义的特征,抗噪音能力强。该算法应用到现... 提出了一种新的Web文本聚类算法WTCA——基于自组织特征映射神经网络(SOM)的聚类算法。该算法分为训练SOM网络及聚类分析两个阶段,具有自稳定性,无须外界给出评价函数;能够识别概念空间中最有意义的特征,抗噪音能力强。该算法应用到现代远程教育网,可以对各类远程教育站点上收集的文本资料信息自动进行聚类分析;从海量Web文本信息源中快速有效地获取重要的知识。 展开更多
关键词 web文本挖掘 文本聚类 非结构化数据挖掘结构模型 自组织特征映射
在线阅读 下载PDF
基于Web页面链接和标签的聚类方法 被引量:2
6
作者 李元俊 陈俊杰 赵涓涓 《计算机工程与设计》 CSCD 北大核心 2009年第18期4266-4268,4271,共4页
针对目前Web聚类效率和准确率不高的问题,提出一种基于Web页面链接结构和标签信息的聚类方法CWPBLT(clustering web pages based on their links and tags),它是通过分析Web页面中的链接结构和重要标签信息来比较页面之间的相似度,从而... 针对目前Web聚类效率和准确率不高的问题,提出一种基于Web页面链接结构和标签信息的聚类方法CWPBLT(clustering web pages based on their links and tags),它是通过分析Web页面中的链接结构和重要标签信息来比较页面之间的相似度,从而对Web站点中的Web页面进行聚类,聚类过程同时兼顾了Web页面结构和页面标签提供的内容信息。实验结果表明,该方法有效地提高了聚类的时间效率和准确性,是对以往仅基于页面主题内容或页面结构聚类方法的改进。 展开更多
关键词 聚类 web挖掘 分装器 最小描述长度 链接结构
在线阅读 下载PDF
一种基于自组织映射神经网络的Web页面个性化推荐模型 被引量:2
7
作者 宋庆伟 向阳 《计算机应用与软件》 CSCD 北大核心 2007年第2期19-22,共4页
人工神经网络(ANN)为Web挖掘技术提供了一种新思路。针对传统聚类方法面对大量动态增长的Web日志数据健壮性和灵活性不够的缺点,提出了一种基于自组织映射神经网络的用户信息聚类模型,最后给出的实例证明在此基础上的Web页面的个性化推... 人工神经网络(ANN)为Web挖掘技术提供了一种新思路。针对传统聚类方法面对大量动态增长的Web日志数据健壮性和灵活性不够的缺点,提出了一种基于自组织映射神经网络的用户信息聚类模型,最后给出的实例证明在此基础上的Web页面的个性化推荐算法能够有效地进行Web页面个性化推荐。 展开更多
关键词 人工神经网络 自组织神经网络 web挖掘 聚类
在线阅读 下载PDF
基于网站结构的网络使用挖掘树化模型 被引量:1
8
作者 白锦士 张有仁 《华东理工大学学报(自然科学版)》 CAS CSCD 北大核心 2005年第2期193-197,共5页
根据网站的树形结构特点,提出了一种统一的树化模型对用户访问路径进行建模,解决了因使用原始访问路径产生的"过度比较问题",并通过采用适合该模型的网页相对位置的概念,大大减轻了原来由于使用网页绝对访问位置导致的误差。... 根据网站的树形结构特点,提出了一种统一的树化模型对用户访问路径进行建模,解决了因使用原始访问路径产生的"过度比较问题",并通过采用适合该模型的网页相对位置的概念,大大减轻了原来由于使用网页绝对访问位置导致的误差。结果表明:树化模型能够提高用户访问行为的相似度识别率。 展开更多
关键词 网络使用挖掘 访问路径 相似度 聚类 网站结构 预聚类
在线阅读 下载PDF
探索关联规则可视化的结构化关联映射图 被引量:5
9
作者 易黎 胡雅萌 彭艳兵 《计算机应用与软件》 2017年第12期68-70,157,共4页
对于大量的高维度的交易数据,利用关联规则进行数据挖掘,用户难以进行解释和利用。主要两个原因:常规关联规则挖掘算法可产生大量关联规则;一些关联规则可部分重叠。若用户能自主选择,在关联规则挖掘中所使用的相关项集,则可解决该问题... 对于大量的高维度的交易数据,利用关联规则进行数据挖掘,用户难以进行解释和利用。主要两个原因:常规关联规则挖掘算法可产生大量关联规则;一些关联规则可部分重叠。若用户能自主选择,在关联规则挖掘中所使用的相关项集,则可解决该问题。提出一种新的视觉探索工具,结构化关联映射图,使用户能够以视觉方式找到相关项集的组。该方法使用健康检查结果数据集进行验证,并且实验结果表明具有最高2×2规则贡献的和值的结构化关联映射图有助于显著减少关联分析的复杂性,并且能够集中于搜索空间的特定区域关联规则挖掘,同时避免不相关的关联规则。 展开更多
关键词 可视化 关联规则挖掘 分层聚类 结构化关联映射图
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部