期刊文献+
共找到883篇文章
< 1 2 45 >
每页显示 20 50 100
基于Web Mining的智能化、个性化的远程教育模型研究 被引量:30
1
作者 汪启军 申瑞民 《计算机工程》 CAS CSCD 北大核心 2000年第12期157-159,共3页
该文提出了一个新的基于Web Mining的远程教育模型,它能够充分利用站点上积累下来的信息,更好地用于远程教学。
关键词 远程教育 智能化 个性化 web INTERNET网
在线阅读 下载PDF
基于Web Mining的推荐系统 被引量:2
2
作者 唐哲 丁二玉 +1 位作者 骆斌 陈世福 《计算机科学》 CSCD 北大核心 2005年第12期193-196,共4页
推荐系统(Recommender System)被电子商务站点用来向顾客提供信息以帮助顾客选择产品,其基本思想是以统计结果或者顾客以前的行为记录为依据,推测顾客未来可能的行为并给出相应的推荐。本文对基于传统技术和Web mining技术的推荐系统进... 推荐系统(Recommender System)被电子商务站点用来向顾客提供信息以帮助顾客选择产品,其基本思想是以统计结果或者顾客以前的行为记录为依据,推测顾客未来可能的行为并给出相应的推荐。本文对基于传统技术和Web mining技术的推荐系统进行了简要综述,同时描述了基于Web mining技术的推荐系统的工作流程,重点分析了应用于推荐系统的各种具体Web mining技术及其算法比较。 展开更多
关键词 推荐系统 web mining
在线阅读 下载PDF
基于FLAAT模糊的WEB挖掘算法 被引量:2
3
作者 吴瑞 《武汉科技大学学报》 CAS 2005年第3期270-272,共3页
为了挖掘出较完全的兴趣模式,提出一种新的结构类型———FLAAT,它可发现那些被忽略的用户浏览偏爱路径。同时引进模糊集来处理停留在网页上的时间,以形成语义术语使挖掘出的用户浏览偏爱路径更自然、更易理解。实验表明,该算法能准确... 为了挖掘出较完全的兴趣模式,提出一种新的结构类型———FLAAT,它可发现那些被忽略的用户浏览偏爱路径。同时引进模糊集来处理停留在网页上的时间,以形成语义术语使挖掘出的用户浏览偏爱路径更自然、更易理解。实验表明,该算法能准确地反映用户的浏览兴趣,且系统的可扩展性较好。 展开更多
关键词 web日志 web挖掘 用户浏览偏爱路径 模糊集
在线阅读 下载PDF
基于Web-Log Mining的Web文档聚类 被引量:29
4
作者 苏中 马少平 +1 位作者 杨强 张宏江 《软件学报》 EI CSCD 北大核心 2002年第1期99-104,共6页
速度和效果是聚类算法面临的两大问题.DBSCAN(density based spatial clustering of applications with noise)是典型的基于密度的一种聚类方法,对于大型数据库的聚类实验显示了它在速度上的优越性.提出了一种基于密度的递归聚类算法(re... 速度和效果是聚类算法面临的两大问题.DBSCAN(density based spatial clustering of applications with noise)是典型的基于密度的一种聚类方法,对于大型数据库的聚类实验显示了它在速度上的优越性.提出了一种基于密度的递归聚类算法(recursive density based clustering algorithm,简称RDBC),此算法可以智能地、动态地修改其密度参数.RDBC是基于DBSCAN的一种改进算法,其运算复杂度和DBSCAN相同.通过在Web文档上的聚类实验,结果表明,RDBC不但保留了DBSCAN高速度的优点,而且聚类效果大大优于DBSCAN. 展开更多
关键词 数据库 聚类 数据挖掘 web 文档 web-Logmining
在线阅读 下载PDF
基于Web-Log Mining的N元预测模型 被引量:14
5
作者 苏中 马少平 +1 位作者 杨强 张宏江 《软件学报》 EI CSCD 北大核心 2002年第1期136-141,共6页
随着Web上用户访问信息的不断增加,特别是Web服务器可提供大量的日志文件,使得有可能对这些大数据集进行知识挖掘,例如,对用户未来的访问进行预测.提出了一种利用服务器日志文件,运用N元(N-gram)预测模型对用户未来可能进行的Web访问请... 随着Web上用户访问信息的不断增加,特别是Web服务器可提供大量的日志文件,使得有可能对这些大数据集进行知识挖掘,例如,对用户未来的访问进行预测.提出了一种利用服务器日志文件,运用N元(N-gram)预测模型对用户未来可能进行的Web访问请求进行预测.这种模型会选择性地对用户可预测的请求进行预测,从而大大提高了预测精度.实验证明,在自然语言中普遍适用的N元预测模型同样适用于网页预测.同时,采用了一种有效的简化手段,大大压缩了模型的大小,使得5元模型和传统的2元模型大小基本相同,而预测精度提高了1倍.该结果可以广泛地运用到Web上,包括网页的预发送、预取、推荐以及Web上的caching机制.试验是建立在真实的Web日志上的,该算法无论在预测精度上还是在可适用度上都优于以往的算法. 展开更多
关键词 数据挖掘 INTERNET web-Logmining N元预测模型 网页
在线阅读 下载PDF
基于Web-LogMining寻找目标网页最优期望定位 被引量:1
6
作者 丛蓉 王秀坤 +1 位作者 吴军 周岩 《计算机工程与应用》 CSCD 北大核心 2004年第34期151-153,178,共4页
为了优化网站的访问效能,实现网站实际结构与用户的使用行为相吻合,该文主要应用Web挖掘技术,以网站的服务器Web日志作为数据源,使用算法FEL和算法CRLL从用户访问事务序列中寻找目标网页的期望定位,并以最少“后退”次数为原则生成推荐... 为了优化网站的访问效能,实现网站实际结构与用户的使用行为相吻合,该文主要应用Web挖掘技术,以网站的服务器Web日志作为数据源,使用算法FEL和算法CRLL从用户访问事务序列中寻找目标网页的期望定位,并以最少“后退”次数为原则生成推荐链接列表。网站设计者可根据该列表,修改网页之间的链接关系,达到减少对目标网页搜索时间的目的。 展开更多
关键词 web挖掘 web文件 目标网页 期望定位
在线阅读 下载PDF
基于FLaAT的模糊用户偏爱浏览模式的增量挖掘
7
作者 宁玉富 吴瑞 郭长友 《计算机应用与软件》 CSCD 2009年第10期30-32,71,共4页
挖掘用户偏爱的浏览模式就是从Web日志中发现多数用户偏爱的浏览路径。网页上的浏览时间被转换成一个模糊语言变量来体现网页上浏览时间的特征,最后从建立的包含所有用户浏览信息的FLaAT(Frequent Link and Access Tree)中挖掘增量式带... 挖掘用户偏爱的浏览模式就是从Web日志中发现多数用户偏爱的浏览路径。网页上的浏览时间被转换成一个模糊语言变量来体现网页上浏览时间的特征,最后从建立的包含所有用户浏览信息的FLaAT(Frequent Link and Access Tree)中挖掘增量式带有模糊语言变量的用户偏爱浏览模式。 展开更多
关键词 web挖掘 web使用挖掘 用户浏览模式 模糊语言变量
在线阅读 下载PDF
多维深度导向的Java Web模糊测试方法 被引量:3
8
作者 王鹃 龚家新 +1 位作者 蔺子卿 张晓娟 《信息网络安全》 CSCD 北大核心 2024年第2期282-292,共11页
随着Java Web的广泛应用,其安全问题日益突出。模糊测试作为一种有效的漏洞挖掘方法,目前已经被用于Java漏洞的检测。然而,由于Java Web应用代码规模庞大、业务逻辑复杂,现有的漏洞挖掘工具在模糊测试中存在随机性高、代码检测深度低的... 随着Java Web的广泛应用,其安全问题日益突出。模糊测试作为一种有效的漏洞挖掘方法,目前已经被用于Java漏洞的检测。然而,由于Java Web应用代码规模庞大、业务逻辑复杂,现有的漏洞挖掘工具在模糊测试中存在随机性高、代码检测深度低的问题,导致漏洞挖掘的准确率较低。因此,文章提出基于多维深度导向的Java Web模糊测试方法。该方法使用Jimple作为待测Java Web应用字节码的三地址码中间表示,并生成代码对应的函数间调用图和函数内控制流图,在此基础上分析每个基本块的多维深度。同时,根据多维深度和模糊测试执行时间优化模糊测试指导策略,设计相应的输入结构解析策略、能量分配策略和变异算法调度策略,提升模糊测试的准确性。实验结果表明,相较于现有的模糊测试工具Peach和Kelinci,该方法能够在性能消耗较低的情况下取得更好的漏洞检测效果。 展开更多
关键词 模糊测试 Java web 漏洞挖掘
在线阅读 下载PDF
一种灵活高效的增量式Web平行语料抽取方法
9
作者 刘小峰 郑禹铖 李东阳 《计算机科学》 CSCD 北大核心 2024年第11期248-254,共7页
从Web中抽取平行语料对于机器翻译和其他多语语言处理任务来说非常重要,由此提出了一种从Web中灵活高效地增量抽取平行语料的方法,通过持续地对Common Crawl的Web抓取存档进行下载、扫描和分析统计,增量更新域名下的语言文本长度统计数... 从Web中抽取平行语料对于机器翻译和其他多语语言处理任务来说非常重要,由此提出了一种从Web中灵活高效地增量抽取平行语料的方法,通过持续地对Common Crawl的Web抓取存档进行下载、扫描和分析统计,增量更新域名下的语言文本长度统计数据。对于任意给定的感兴趣目标语言对,抽取方法基于域名下的语言文本长度统计数据确定抓取网站入口,并根据目标语言进行定向抓取,忽略多语域名和目标语言外的链接。此外还提出了一种在多语域名内基于语义相似性进行全局对齐的新的句子对齐方法。实验表明,增量抽取能够持续不断地获得新的平行语料,根据指定的语言对进行抽取,可以灵活地获得感兴趣的目标语言对平行语料;新的对齐方法在对齐效率上明显优于全局方法,且能完成局部方法无法完成的对齐;在6个语言方向中,抽取到的平行语料在4个中低资源语言方向的质量优于现有Web开源平行语料,在2个高资源语言方向的质量接近现有最好的Web开源平行语料。 展开更多
关键词 平行语料抽取 句子对齐 语料库构建 机器翻译 web挖掘
在线阅读 下载PDF
一个基于Web的金融多层聚类系统 被引量:2
10
作者 梅永国 杨杰 陈文中 《上海交通大学学报》 EI CAS CSCD 北大核心 2002年第12期1816-1820,共5页
介绍了一个基于 Web的用于金融数据挖掘的多层聚类系统的设计与实现 .该系统基于金融比率对香港、大陆股市中的上市公司进行了聚类分析 .它采用 3层的体系结构 ,即用户层、应用层和数据库层 .应用层使用了 Java Servlet、Java Script和 ... 介绍了一个基于 Web的用于金融数据挖掘的多层聚类系统的设计与实现 .该系统基于金融比率对香港、大陆股市中的上市公司进行了聚类分析 .它采用 3层的体系结构 ,即用户层、应用层和数据库层 .应用层使用了 Java Servlet、Java Script和 JDBC等编程技术 .系统数据库中存储了大量的金融数据 ,并实现了 2 4个金融比率的计算和存储 ,用户还可以自己定义新的金融比率和众多金融比率之间构成层次关系 .用户可以在不同的比率层次上对公司聚类 ,显然 ,采用多层次的聚类比单层次聚类有明显的优越性 .测试结果表明 ,该系统灵活、快速、扩展性好、结果易理解 ,有助于金融专家和有经验的投资者进行正确分析和合理投资 . 展开更多
关键词 金融多层聚类系统 数据挖掘 聚类分析 金融比率 web JAVASERVLET JDBC dataBASE
在线阅读 下载PDF
Web使用模式研究中的数据挖掘 被引量:55
11
作者 张娥 冯秋红 +1 位作者 宣慧玉 田增瑞 《计算机应用研究》 CSCD 北大核心 2001年第3期80-83,共4页
Web使用模式挖掘是利用Web使用数据的高级手段,是对Web使用数据的深层次分析,从而挖掘出有效的、新颖的、潜在的、有用的及最终可以理解的知识,以帮助管理决策。综述了Web使用模式的数据挖掘研究技术的内容、现状和研究的方向。
关键词 数据挖掘 事务数据库 web 用户访问模式 INTERNET
在线阅读 下载PDF
Web挖掘研究综述 被引量:49
12
作者 涂承胜 鲁明羽 陆玉昌 《计算机工程与应用》 CSCD 北大核心 2003年第10期90-93,共4页
论文介绍了Web挖掘的概念,指出了Web挖掘中存在的问题,给出了Web挖掘研究的三种分类:Web内容挖掘、Web结构挖掘、Web使用挖掘,针对每一种分类介绍了各自的研究对象、表示方法、处理方法、应用领域及最近的研究情况,同时展望了Web挖掘的... 论文介绍了Web挖掘的概念,指出了Web挖掘中存在的问题,给出了Web挖掘研究的三种分类:Web内容挖掘、Web结构挖掘、Web使用挖掘,针对每一种分类介绍了各自的研究对象、表示方法、处理方法、应用领域及最近的研究情况,同时展望了Web挖掘的未来研究方向。 展开更多
关键词 web INTERNET 搜索引擎 信息检索 数据库 数据处理 数据挖掘
在线阅读 下载PDF
Web使用信息挖掘综述 被引量:50
13
作者 郭岩 白硕 于满泉 《计算机科学》 CSCD 北大核心 2005年第1期1-7,共7页
Web使用信息挖掘可以帮助我们更好地理解Web和Web用户访问模式,这对于开发Web的最大经济潜力是非常关键的。一般来说,Web使用信息挖掘包含三个阶段:数据预处理,模式发现和模式分析。文章以这三个阶段为框架,分别介绍了数据预处理的技术... Web使用信息挖掘可以帮助我们更好地理解Web和Web用户访问模式,这对于开发Web的最大经济潜力是非常关键的。一般来说,Web使用信息挖掘包含三个阶段:数据预处理,模式发现和模式分析。文章以这三个阶段为框架,分别介绍了数据预处理的技术与困难,Web使用信息挖掘中常用的方法和算法,以及主要应用。 展开更多
关键词 数据挖掘 web挖掘 web使用信息挖掘 web用户访问模式 数据预处理 模式发现
在线阅读 下载PDF
路径聚类:在Web站点中的知识发现 被引量:59
14
作者 王实 高文 +1 位作者 李锦涛 谢辉 《计算机研究与发展》 EI CSCD 北大核心 2001年第4期482-486,共5页
用户对 Web站点的访问代表了用户对 Web站点上页面的访问兴趣 .这种兴趣程度可以通过用户对 Web站点上页面的浏览顺序表现出来 .在对 Web站点的访问日志进行事务识别后 ,可以根据群体用户对 Web站点的访问顺序进行聚类 ,即路径聚类 ,那... 用户对 Web站点的访问代表了用户对 Web站点上页面的访问兴趣 .这种兴趣程度可以通过用户对 Web站点上页面的浏览顺序表现出来 .在对 Web站点的访问日志进行事务识别后 ,可以根据群体用户对 Web站点的访问顺序进行聚类 ,即路径聚类 ,那么最终每一个聚类集就反映出该聚类集中的全体用户具有相似的访问兴趣 .为了得到这种根据用户访问兴趣而对用户集的划分 ,提出了 K- paths路径聚类方法 .在这种方法中 ,根据用户的访问兴趣定义了新的相似性测量手段和聚类中心 。 展开更多
关键词 数据挖掘 web站点 知识发现 路径聚类 WWW INTERNET
在线阅读 下载PDF
Web挖掘研究 被引量:34
15
作者 陈新中 李岩 +1 位作者 谢永红 杨炳儒 《计算机工程与应用》 CSCD 北大核心 2002年第13期42-44,共3页
Internet的迅速发展,使得worldwideweb已经成为一个巨大的、蕴涵着具有潜在价值知识的分布式信息空间,为数据挖掘研究提供了丰富的资源的同时也提出了新的挑战。该文首先概述了数据挖掘的概念、挖掘算法及其主要应用领域,然后结合Web数... Internet的迅速发展,使得worldwideweb已经成为一个巨大的、蕴涵着具有潜在价值知识的分布式信息空间,为数据挖掘研究提供了丰富的资源的同时也提出了新的挑战。该文首先概述了数据挖掘的概念、挖掘算法及其主要应用领域,然后结合Web数据的多样性、丰富和动态的超链接信息以及Web用户访问信息,详细阐述了Web内容挖掘、Web结构挖掘和Web用户访问信息挖掘的概念、定义、主要的挖掘算法及最新研究进展,文章最后介绍了Web挖掘的研究方向和发展趋势。 展开更多
关键词 数据挖掘 web 数据库 INTERNET 信息服务
在线阅读 下载PDF
Web日志挖掘中的数据预处理的研究 被引量:57
16
作者 陆丽娜 杨怡玲 +1 位作者 管旭东 魏恒义 《计算机工程》 EI CAS CSCD 北大核心 2000年第4期66-67,72,共3页
为了更加合理地组织Web服务器的结构,需要通过Web日志挖掘分析用户的浏览模式,而Web日志挖掘中的数据预处理工作关系到挖掘的质量。文章就此进行了深入的研究,提出一个包括数据净化、用户识别、会话识别和路径补充等过程的... 为了更加合理地组织Web服务器的结构,需要通过Web日志挖掘分析用户的浏览模式,而Web日志挖掘中的数据预处理工作关系到挖掘的质量。文章就此进行了深入的研究,提出一个包括数据净化、用户识别、会话识别和路径补充等过程的数据预处理模型,并通过一个实例具体介绍了各过程的主要任务。 展开更多
关键词 数据挖掘 web 日志挖掘 数据预处理 数据库
在线阅读 下载PDF
Web日志挖掘中的数据预处理技术研究 被引量:62
17
作者 赵伟 何丕廉 +1 位作者 陈霞 谢振亮 《计算机应用》 CSCD 北大核心 2003年第5期62-64,67,共4页
在Web数据挖掘研究领域中,Web日志挖掘是Web数据挖掘研究领域中一个最重要的应用方面。而数据预处理在Web日志挖掘过程中起着至关重要的作用。文中深入探讨了数据预处理环节的主要任务,并介绍这个过程中一些特殊情况的处理方法。
关键词 数据挖掘 web日志挖掘 数据预处理
在线阅读 下载PDF
Web数据挖掘 被引量:120
18
作者 王实 高文 李锦涛 《计算机科学》 CSCD 北大核心 2000年第4期28-31,41,共5页
1 引言当前WWW正在深度和广度方面飞速地发展着,Internet也正在前所未有地改变我们的生活。WWW上的一些主要工作,例如Web站点设计、Web服务设计、Web站点的导航设计、电子商务等工作正变得越来越复杂和越来越繁重。从站点经营方来说,他... 1 引言当前WWW正在深度和广度方面飞速地发展着,Internet也正在前所未有地改变我们的生活。WWW上的一些主要工作,例如Web站点设计、Web服务设计、Web站点的导航设计、电子商务等工作正变得越来越复杂和越来越繁重。从站点经营方来说,他们需要好的自动辅助设计工具,可以根据用户的访问兴趣、访问频度、访问时间动态地调整页面结构,改进服务,开展有针对性的电子商务以更好地满足访问者的需求。从访问者来说,他们希望看到的是个性化的页面。 展开更多
关键词 电子商务 数据挖掘 数据库 web
在线阅读 下载PDF
Web大数据环境下的不一致跨源数据发现 被引量:24
19
作者 余伟 李石君 +4 位作者 杨莎 胡亚慧 刘晶 丁永刚 王骞 《计算机研究与发展》 EI CSCD 北大核心 2015年第2期295-308,共14页
Web中不同数据源之间的数据不一致是一个普遍存在的问题,严重影响了互联网的可信度和质量.目前数据不一致的研究主要集中在传统数据库应用中,对于种类多样、结构复杂、快速变化、数量庞大的跨源Web大数据的一致性研究还很少.针对跨源We... Web中不同数据源之间的数据不一致是一个普遍存在的问题,严重影响了互联网的可信度和质量.目前数据不一致的研究主要集中在传统数据库应用中,对于种类多样、结构复杂、快速变化、数量庞大的跨源Web大数据的一致性研究还很少.针对跨源Web数据的多源异构特性和Web大数据的5V特征,将从站点结构、特征数据和知识规则3个方面建立统一数据抽取算法和Web对象数据模型;研究不同类型的Web数据不一致特征,建立不一致分类模型、一致性约束机制和不一致推理代数运算系统;从而在跨源Web数据一致性理论体系的基础上,实现通过约束规则检测、统计偏移分析的Web不一致数据自动发现方法,并结合这两种方法的特点,基于Hadoop MapReduce架构提出了基于层次概率判定的Web不一致数据的自动发现算法.该框架在Hadoop平台上对多个B2C电子商务大数据进行实验,并与传统架构和其他方法进行了比较,实验结果证明该方法具有良好的精确性和高效性. 展开更多
关键词 web大数据 web数据挖掘 数据一致性 web数据管理 数据质量评估 跨源数据分析
在线阅读 下载PDF
基于Web挖掘的个性化技术研究 被引量:35
20
作者 冯是聪 单松巍 +2 位作者 张志刚 龚笔宏 李晓明 《计算机工程与设计》 CSCD 2004年第1期4-6,共3页
针对用户特性向用户提供个性化服务已经成为Web技术的研究热点。Web挖掘是实现Web个性化服务的关键技术之一。研究了Web挖掘技术,阐述了Web挖掘技术存在的不足,并对应用Web挖掘技术实现个性化服务的发展前景进行了分析。
关键词 web挖掘 个性化服务 用户建模 代理 人工智能 数据库
在线阅读 下载PDF
上一页 1 2 45 下一页 到第
使用帮助 返回顶部