期刊文献+
共找到19篇文章
< 1 >
每页显示 20 50 100
基于二分图匹配的语义Web服务发现方法 被引量:50
1
作者 邓水光 尹建伟 +2 位作者 李莹 吴健 吴朝晖 《计算机学报》 EI CSCD 北大核心 2008年第8期1364-1375,共12页
如何从大规模服务集合中快速而准确的发现目标服务是应用Web服务技术的关键.现有基于语义的Web服务发现方法应用实施难度大且效果存在较大提升空间.文中首先提出了Web服务注册的信息模型,该模型不受限于具体的Web服务模型和表达语言,支... 如何从大规模服务集合中快速而准确的发现目标服务是应用Web服务技术的关键.现有基于语义的Web服务发现方法应用实施难度大且效果存在较大提升空间.文中首先提出了Web服务注册的信息模型,该模型不受限于具体的Web服务模型和表达语言,支持接口语义标注和接口依赖关系的申明.进而提出了基于二分图匹配的语义Web服务发现方法,通过对二分图最佳匹配进行扩展,将服务匹配问题转化成二分图的扩展最佳匹配的求解问题,支持服务接口之间的依赖关系,从而提高服务发现的效果.一系列仿真实验表明文中方法不仅能较大提高服务发现的召回率和准确率,而且还能以线性时间复杂度满足用户请求. 展开更多
关键词 面向服务的计算 web服务 服务发现 二分图匹配
在线阅读 下载PDF
基于链接分析的Web社区发现技术的研究 被引量:17
2
作者 高琰 谷士文 唐琎 《计算机应用研究》 CSCD 北大核心 2006年第7期183-185,共3页
如何发现Web上根据“主题”聚集在一起的多个社区,使我们能快速地从互联网上提取知识,是Web挖掘的一个研究方向。详细介绍了基于链接结构的四种社区发现的算法,同时也指出了这些算法的缺陷和改进方向。
关键词 web社区 PAGERANK HITS 二分图核 最大流
在线阅读 下载PDF
基于语义相似性的Web服务匹配算法 被引量:3
3
作者 欧伟杰 曾承 +4 位作者 韩栋 彭智勇 刘洋 马景燕 刘波 《计算机科学》 CSCD 北大核心 2012年第1期92-95,129,共5页
随着互联网应用的不断丰富,如何高效而准确地发现用户所需的Web服务已成为重要的挑战。传统基于关键字和语义匹配的方法存在查全率低和效率低下的问题,无法满足实际应用。提出基于语义相似性的服务匹配算法,实现了基于层次本体的概念相... 随着互联网应用的不断丰富,如何高效而准确地发现用户所需的Web服务已成为重要的挑战。传统基于关键字和语义匹配的方法存在查全率低和效率低下的问题,无法满足实际应用。提出基于语义相似性的服务匹配算法,实现了基于层次本体的概念相似性计算,并改进了原有二分图最优匹配算法的不足。根据该算法实现了一个Web服务发现原型系统。经实验证明,该方法不仅具有较高的查全率,且算法效率是满足目前服务发现需要的。 展开更多
关键词 web服务 语义相似性 二分图匹配
在线阅读 下载PDF
一种新的WEB社群挖掘方法 被引量:3
4
作者 王勇 李战怀 张阳 《计算机工程与应用》 CSCD 北大核心 2005年第23期159-161,共3页
随着互联网信息的增长,WEB挖掘已经成为数据挖掘研究的热点之一。论文关注于WEB社群挖掘。WEB社群是由对于同一主题感兴趣的人或组织创作的WEB页的集合。传统的挖掘方法由于只利用超链信息,所得出的社群或者太小、或者太大而没有意义。... 随着互联网信息的增长,WEB挖掘已经成为数据挖掘研究的热点之一。论文关注于WEB社群挖掘。WEB社群是由对于同一主题感兴趣的人或组织创作的WEB页的集合。传统的挖掘方法由于只利用超链信息,所得出的社群或者太小、或者太大而没有意义。论文结合WEB页的内容信息和超链信息给出了一种基于分类方法的WEB社群挖掘算法。在包含8282个网页的WEBKB数据集上进行了实验,实验结果表明,该文算法可以挖掘出较大而且有意义的社群。 展开更多
关键词 web挖掘 web社群 二部图
在线阅读 下载PDF
基于领域本体的Web服务发现 被引量:3
5
作者 艾未华 宋自林 +1 位作者 魏磊 吴量 《电子科技大学学报》 EI CAS CSCD 北大核心 2007年第3期506-509,共4页
Web服务应用的一个关键问题是如何发现需要的服务。传统的基于关键字的服务发现机制UDDI缺乏语义支持,搜索效率低。据此该文研究基于领域本体的Web服务发现技术,对发布服务和请求服务都采用OWL-S描述以支持基于语义的服务搜索能力,并且... Web服务应用的一个关键问题是如何发现需要的服务。传统的基于关键字的服务发现机制UDDI缺乏语义支持,搜索效率低。据此该文研究基于领域本体的Web服务发现技术,对发布服务和请求服务都采用OWL-S描述以支持基于语义的服务搜索能力,并且提出了一种基于图匹配的Web服务发现算法。试验结果表明服务发现方法在查准率和查全率方面都要优于UDDI。 展开更多
关键词 二部图匹配 领域本体 服务发现 web服务
在线阅读 下载PDF
基于Web of Science的PageRank人才挖掘算法 被引量:5
6
作者 李翀 王宇宸 +4 位作者 杜伟静 何晓涛 刘学敏 张士波 李树仁 《计算机应用》 CSCD 北大核心 2021年第5期1356-1360,共5页
高水平论文是优秀科技人才的标志性成果之一。聚焦"Web Of Science(WOS)"热点研究学科,在构建学术论文语义Neo4j网络图和挖掘出活跃科研社区基础上,利用PageRank人才挖掘算法实现对科研社区中优秀科研人才的挖掘。首先,对现... 高水平论文是优秀科技人才的标志性成果之一。聚焦"Web Of Science(WOS)"热点研究学科,在构建学术论文语义Neo4j网络图和挖掘出活跃科研社区基础上,利用PageRank人才挖掘算法实现对科研社区中优秀科研人才的挖掘。首先,对现有的人才挖掘算法进行详细研究和分析;其次,结合WOS论文数据对PageRank人才挖掘算法进行了优化设计和实现,加入了论文发表的时间因子、作者署名排序递减模型、周围作者节点对当前节点的影响、论文被引用量等多维度考量因素。最后,基于热点学科计算机科学某社区近五年的论文数据进行了实验和验证。结果表明,基于社区的挖掘更具有针对性,能够快速定位各学科代表性优秀和潜在人才,且改进后的算法对人才的发现更加客观有效。 展开更多
关键词 web Of Science Neo4j图数据库 PAGERANK算法 人才挖掘
在线阅读 下载PDF
基于索引表和二分图的Web服务操作发现 被引量:4
7
作者 李季辉 贾永伟 《计算机工程》 CAS CSCD 2012年第13期37-39,43,共4页
在通用的Web服务描述语言基础上,提出一种基于倒排序索引表和二分图匹配的两阶段服务操作发现方法。第1个阶段利用倒排序索引表得到相关服务,获取服务操作的输入和输出参数,用户根据需要选取期望的输出参数作为服务请求。第2个阶段采用... 在通用的Web服务描述语言基础上,提出一种基于倒排序索引表和二分图匹配的两阶段服务操作发现方法。第1个阶段利用倒排序索引表得到相关服务,获取服务操作的输入和输出参数,用户根据需要选取期望的输出参数作为服务请求。第2个阶段采用二分图匹配方法对服务请求进行服务操作匹配,发现所需的Web服务操作。实验结果表明,该方法能提高服务发现的准确性和灵活性,并提供功能相同的备选服务操作。 展开更多
关键词 倒排序索引 二分图 最佳匹配 服务操作发现 web服务 服务请求
在线阅读 下载PDF
Web用户行为预测的一种新模型及算法 被引量:8
8
作者 高卫华 谢康林 《计算机应用与软件》 CSCD 北大核心 2007年第3期142-144,162,共4页
有效地预测互联网用户在浏览过程中的行为方向,尽可能有针对性的提供其感兴趣的信息,有助于提高网站的服务质量,最大限度地留住客户。马尔科夫模型是解决这一问题的一种有效建模方式。但是该模型,尤其是高阶马尔科夫模型的指数级复杂度... 有效地预测互联网用户在浏览过程中的行为方向,尽可能有针对性的提供其感兴趣的信息,有助于提高网站的服务质量,最大限度地留住客户。马尔科夫模型是解决这一问题的一种有效建模方式。但是该模型,尤其是高阶马尔科夫模型的指数级复杂度大大影响了其实际的应用。建立新的模型需要权衡自身的预测准确度与复杂度,尽可能保持前者,同时降低后者。结合马尔科夫模型和有向图特点,提出了一种新的建模方式。新模型具有与马尔科夫模型相同的预测准确度,但是各种时间、空间复杂度相对较低,综合性能良好。 展开更多
关键词 马尔科夫 有向图 互联网使用挖掘 互联网用户行为预测
在线阅读 下载PDF
WLML在Web使用挖掘中的应用
9
作者 吴萍 宋瀚涛 +1 位作者 姜峰 郑志蕴 《计算机工程》 CAS CSCD 北大核心 2006年第6期47-49,共3页
提出了一种新的用于Web日志描述的XML应用——WLML语言。实际使用中,首先从Web日志文件和Web结构图中生成指定WLML格式的Web日志记录,通过对处理后的记录进行数据挖掘,达到为用户提供个性化服务的目的。
关键词 web使用挖掘 WLML web日志 web结构图 个性化服务
在线阅读 下载PDF
Web新闻流的增量演进分析
10
作者 邱江涛 唐常杰 +1 位作者 乔少杰 李太勇 《计算机科学》 CSCD 北大核心 2009年第3期193-195,231,共4页
将互联网上的新闻事件按照时间顺序和事件依赖关系组织起来呈现给用户,可以帮助用户方便快捷地了解新闻事件演进过程。定义了Web新闻流增量演进任务(IEA)来实现这一需求。与一些类似的工作比较,IEA具有以下特点:适合Web新闻事件的流特征... 将互联网上的新闻事件按照时间顺序和事件依赖关系组织起来呈现给用户,可以帮助用户方便快捷地了解新闻事件演进过程。定义了Web新闻流增量演进任务(IEA)来实现这一需求。与一些类似的工作比较,IEA具有以下特点:适合Web新闻事件的流特征,以图的方式在时间线上增量更新新闻话题的事件演化过程。为了完成IEA任务,定义了一个事件进展图(EEG)数据结构,并相应地提出了EEG构造和整理算法。实验证明,该方法可以有效地实现新闻事件时间线分析的任务。 展开更多
关键词 web挖掘 事件时间线分析 事件进展图
在线阅读 下载PDF
基于Web使用挖掘技术的聚类算法改进 被引量:5
11
作者 李诗诗 方寿海 《计算机工程与设计》 CSCD 北大核心 2009年第22期5182-5184,共3页
Web使用挖掘中的聚类算法可以聚集相似特性的用户和页面,以便从中提取有用的感兴趣的信息。通过深入分析基于Hamming距离的聚类算法,指出其中存在的不合理性和低效性,然后根据这些不足引入了加权的bipartite图来表示整个数据集,修改了Ha... Web使用挖掘中的聚类算法可以聚集相似特性的用户和页面,以便从中提取有用的感兴趣的信息。通过深入分析基于Hamming距离的聚类算法,指出其中存在的不合理性和低效性,然后根据这些不足引入了加权的bipartite图来表示整个数据集,修改了Hamming距离计算公式以便更准确地描述两对象间的相似度,并对算法进行了改进。实验结果表明,改进的算法是准确且高效的。 展开更多
关键词 web使用挖掘 聚类 HAMMING距离 bipartite 关联矩阵
在线阅读 下载PDF
Web of Science科研社区挖掘算法研究 被引量:6
12
作者 杜伟静 李翀 +1 位作者 王宇宸 刘学敏 《小型微型计算机系统》 CSCD 北大核心 2020年第12期2465-2469,共5页
本文以1900-2019年"Web of Science(WOS)"核心合集中的中国科学院(中科院)部分论文数据为面板数据对热点学科、科研社区及相关权威专家进行了分析研究.首先对艺术与人文、生命科学与生物医学、自然科学、社会科学、应用科学... 本文以1900-2019年"Web of Science(WOS)"核心合集中的中国科学院(中科院)部分论文数据为面板数据对热点学科、科研社区及相关权威专家进行了分析研究.首先对艺术与人文、生命科学与生物医学、自然科学、社会科学、应用科学五大学科数据进行分析,发现应用科学(Technology)发表论文年增速最快,且研究热点为计算机科学(Computer Science);其次针对研究热点应用Neo4j图数据库构建论文语义网络图,对实体关系进行优化,提升了社区内部关联度;并基于Louvain社区发现算法进行了相关优化和数据挖掘,分析了其背后的优秀科研团队;最后针对挖掘出的社区,利用PageRank算法筛选出高产出的权威科研人员,为科研合作和人才发现甚至国家学科布局提供参考.实验表明,通过Neo4j图数据库中实体数据索引设计,查询性能提升高达16倍;通过对Louvain算法关系属性weight添加机构影响维度,社区模块度提升了84%. 展开更多
关键词 web of Science Neo4j图数据库 Louvain算法 算法优化 社区发现 人才挖掘
在线阅读 下载PDF
基于图模型的Web表格中视觉并列关系的研究
13
作者 李雯琴 谢志鹏 《小型微型计算机系统》 CSCD 北大核心 2014年第7期1567-1572,共6页
Web不仅包含海量文本信息,还包含大量表格数据.与自由格式的文本信息相比,Web表格所包含的信息更为精练并且结构化,便于数据挖掘.Web表格挖掘已成为一个热点研究问题.为挖掘Web表格的行列结构、背景、颜色、文本字体、字号等视觉信息所... Web不仅包含海量文本信息,还包含大量表格数据.与自由格式的文本信息相比,Web表格所包含的信息更为精练并且结构化,便于数据挖掘.Web表格挖掘已成为一个热点研究问题.为挖掘Web表格的行列结构、背景、颜色、文本字体、字号等视觉信息所蕴含的语义,一种图结构模型以及构造方法被提出.基于图模型,Web表格的视觉并列关系被形式化定义.一种自动抽取Web表格的视觉并列关系的算法被提出.实验表明所提取的视觉并列关系与语义相似度之间存在着显著的正相关性,Web表格视觉并列关系的提取将有助于其他语义分析工作. 展开更多
关键词 web表格挖掘 视觉要素 图模型 视觉并列关系
在线阅读 下载PDF
全球城市矿产研究的热点与前沿趋势:基于CiteSpace软件的可视化分析 被引量:2
14
作者 左绿水 何朋蔚 《中国矿业》 北大核心 2024年第10期23-31,共9页
为明确城市矿产领域的研究热点与前沿趋势,采用知识图谱可视化和文献计量的方法,运用Web of Science文献数据和CiteSpace软件定量分析全球城市矿产研究的发文时间、期刊、作者、研究机构,以及高被引文献等特征,从关键词共现、关键词聚... 为明确城市矿产领域的研究热点与前沿趋势,采用知识图谱可视化和文献计量的方法,运用Web of Science文献数据和CiteSpace软件定量分析全球城市矿产研究的发文时间、期刊、作者、研究机构,以及高被引文献等特征,从关键词共现、关键词聚类、突现词提取和时区图谱分析,揭示城市矿产研究热点和前沿趋势。研究结果表明:全球城市矿产研究年度发文量总体呈不断上升的趋势;形成了以陈伟强、刘刚、GRAEDEL等学者为核心的作者群和以中国科学院、清华大学、耶鲁大学为核心的研究机构群,合作紧密;“城市矿产”“在用存量”“物质流分析”“循环经济”等关键词频繁出现且中心性高,反映出资源存量研究、循环经济理念和经济可行性研究是当前的核心主题;未来城市矿产研究将在资源回收技术的创新与优化、动态监测与数据分析、循环经济模式的系统性研究,以及政策与社会因素的综合研究等议题发力。本文的研究能够帮助科研工作者和决策者快速了解和掌握城市矿产领域的研究状况和趋势方向,为推进城市矿产的深入研究和科学决策提供重要参考。 展开更多
关键词 城市矿产 web of Science CiteSpace软件 知识图谱 可视化
在线阅读 下载PDF
基于匈牙利匹配算法的钓鱼网页检测方法 被引量:15
15
作者 张卫丰 周毓明 +1 位作者 许蕾 徐宝文 《计算机学报》 EI CSCD 北大核心 2010年第10期1963-1975,共13页
如何快速有效地计算网页的相似性是发现钓鱼网页的关键.现有的钓鱼网页检测方法在检测效果上依然存在较大的提升空间.文中提出基于匈牙利匹配的钓鱼网页检测模型,该模型首先提取渲染后网页的文本特征签名、图像特征签名以及网页整体特... 如何快速有效地计算网页的相似性是发现钓鱼网页的关键.现有的钓鱼网页检测方法在检测效果上依然存在较大的提升空间.文中提出基于匈牙利匹配的钓鱼网页检测模型,该模型首先提取渲染后网页的文本特征签名、图像特征签名以及网页整体特征签名,比较全面地刻画了网页访问后的特征;然后通过匈牙利算法计算二分图的最佳匹配来寻找不同网页签名之间匹配的特征对,在此基础上能够更加客观地度量网页之间的相似性,从而提高钓鱼网页的检测效果.一系列的仿真实验表明文中方法可行,并具有较高的准确率和召回率. 展开更多
关键词 钓鱼网页 网页特征 匈牙利匹配算法 相似性 网页签名
在线阅读 下载PDF
一种基于ExLF日志文件的用户会话识别启发式算法 被引量:4
16
作者 冯林 何明瑞 罗芬 《计算机应用》 CSCD 北大核心 2005年第2期314-316,共3页
在详细介绍ExLF日志文件格式的基础上,定义了会话表;阐述了用户会话识别图的概念;给出了生成此会话识别图的一种启发式算法。最后,用一个例子验证了算法的有效性。
关键词 EXLF日志文件格式 web挖掘 用户会话识别图
在线阅读 下载PDF
基于网页日志的频繁模式挖掘 被引量:1
17
作者 沈明 邓玉芬 张博 《现代电子技术》 2010年第9期180-183,186,共5页
频繁模式挖掘应用广泛,是数据挖掘中的一个重点研究领域,频繁模式挖掘应用的其中一个领域就是基于网页日志的数据挖掘。在网页日志中发现频繁模式的目的是获得用户的网络浏览行为模式,这些信息可以为广告设计以及创建动态用户日志提供... 频繁模式挖掘应用广泛,是数据挖掘中的一个重点研究领域,频繁模式挖掘应用的其中一个领域就是基于网页日志的数据挖掘。在网页日志中发现频繁模式的目的是获得用户的网络浏览行为模式,这些信息可以为广告设计以及创建动态用户日志提供参考。从网页数据挖掘的角度研究了三种频繁模式挖掘方式,这三种方式分别是:网页设置、网页序列以及网页图片挖掘。 展开更多
关键词 模式挖掘 序列挖掘 图形挖掘 网页日志挖掘
在线阅读 下载PDF
基于松弛函数扩展的二分图匹配服务发现算法 被引量:1
18
作者 刘冰月 张永 《计算机工程与设计》 北大核心 2015年第9期2427-2431,共5页
为解决早期研究提出的基于二分图匹配的语义Web服务发现算法存在的一些问题,如该算法在寻找增广路径时使用最佳二分图匹配算法,难以找到匹配度阈值内的所有服务,影响了Web服务匹配算法的查全率和查准率,针对以上问题进行研究和分析,提... 为解决早期研究提出的基于二分图匹配的语义Web服务发现算法存在的一些问题,如该算法在寻找增广路径时使用最佳二分图匹配算法,难以找到匹配度阈值内的所有服务,影响了Web服务匹配算法的查全率和查准率,针对以上问题进行研究和分析,提出一种扩展的二分图匹配的Web服务自动发现算法,利用松弛函数值扩展等价子图来寻找新的增广路径。实验结果表明,在参数集合离差增加的情况下,该算法返回的服务匹配数量及匹配准确度基本不受影响。 展开更多
关键词 语义web服务 扩展的二分图匹配 松弛函数 等价子图 增广路径
在线阅读 下载PDF
一种高效的网页聚类方法 被引量:7
19
作者 谢艳玲 何丕廉 +1 位作者 于鷃 孙越恒 《计算机工程与设计》 CSCD 北大核心 2007年第17期4229-4232,共4页
当前主流的搜索引擎主要是以与用户查询的相关度来顺序返回搜索结果的,用户往往需要花费较长的时间从结果列表中进行选择。为了解决这个问题,针对搜索引擎返回的标题和摘要信息,构造有向图表示,并在此基础上实现了一种高效的网页聚类原... 当前主流的搜索引擎主要是以与用户查询的相关度来顺序返回搜索结果的,用户往往需要花费较长的时间从结果列表中进行选择。为了解决这个问题,针对搜索引擎返回的标题和摘要信息,构造有向图表示,并在此基础上实现了一种高效的网页聚类原型系统(efficient web clustering system,EWCS)。该系统将搜索引擎返回的结果按照一定的标准分类呈现给用户,用户选择感兴趣的类别进行浏览,从而较好地满足了用户对查询速度和准确度的需求。试验结果表明该算法具有一定的可行性和较高的准确率。 展开更多
关键词 网页聚类 网络挖掘 有向图 高频词语 短语扩展
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部