融合K-Means与Agnes的Mashup服务聚类方法被引量：8

MSCA: Mashup Service Clustering Approach Integrating K-Means and Agnes Algorithms

在线阅读下载PDF

导出

摘要如何从海量的Mashup服务集中快速、准确的找到满足用户需求的Mashup服务,成为一个具有挑战性的问题.在M ashup服务发现中,预先对M ashup服务进行聚类,将大大缩小服务搜索的空间与范围,提高M ashup服务发现的效率与精度.本文提出一种新颖的融合K-Means与Agnes的Mashup服务聚类方法(MSCA).该方法,首先对Mashup服务中的Tag标签进行扩充和排序;其次,计算Mashup服务的集成相似性;接着,应用K-Means算法对Mashup服务相似度矩阵进行聚类,找到相似度较高的Mashup服务将其划分到N个原子簇中,再利用Agnes算法对N个原子簇进行层次聚类.最后,从Programmable Web上爬取了13082个Mashup服务作为实验对象,实验结果表明:相比传统的基于K-Means算法的Mashup服务聚类方法,MSCA方法的平均查准率和查全率分别提高了5.18%、5.84%,切实提高了服务聚类及发现的精度. Howto rapidly and accurately select the users’ expected Mashup service has become a challenge problem. For Mashup service discovery,it will greatly reduce the space and scope of services searching to perform service clustering technology in advance,resulting in improving the efficiency and precision of Mashup service discovery. This paper proposes a novel Mashup Service Clustering Approach integrating K-Means and Agnes algorithms（ MSCA）. MSCA,first of all,will expand and rank the tag label of Mashup service. Secondly,it will calculate the Mashup service integration similarity. Thirdly,K-Means algorithm will be applied to clustering the Mashup service similarity matrix,and those Mashup services with the higher similarity will be found and divided them to N atom-clusters,and then Agnes algorithm will be used to performing hierarchical clustering to the N atom-clusters. Finally,13082 Mashup services are crawled from Programmable Web site and regarded as experimental dataset,and the experimental results showthat the average precision rate and recall rate of MSCA increased by 5. 18% and 5. 84% respectively,compared to the traditional Mashup Service Clustering Approach based on K-Means algorithm.

作者黄兴刘小青曹步清唐明董刘建勋

机构地区湖南科技大学计算机科学与工程学院&知识处理与网络化制造湖南省普通高校重点实验室密苏里科技大学计算机科学系

出处《小型微型计算机系统》 CSCD 北大核心 2015年第11期2492-2497,共6页 Journal of Chinese Computer Systems

基金国家自然科学基金项目(61402168 61402167 61272063)资助软件工程国家重点实验室开放基金项目(SKLSE2014-10-10)资助

关键词 K-MEANS Agens Mashup服务服务聚类服务发现 K-Means Agens Mashup services service clustering service discovery

分类号 TP393 [自动化与计算机技术—计算机应用技术]

作者简介黄兴，男，1988年生，硕士研究生，CCF会员，研究方向为服务计算；E-mail：jay1988528@163．com 刘小青，男，1962年生，博士，教授，博士生导师，研究方向为软件协同设计、服务计算等；曹步清，男，1979年生，博士，副教授，研究方向为软件工程、服务计算与云计算；唐明董，男，1978年生，博士，副教授，研究方向为网络科学，服务计算与云计算；刘建勋，男，1970年生，博士，教授，博士生导师，研究方向为服务计算与云计算、工作流管理的理论与应用、大数据与商业智能等

引文网络
相关文献

参考文献3

1黄媛,李兵,何鹏,熊伟.基于标签推荐的Mashup服务聚类[J].计算机科学,2013,40(2):167-171. 被引量：11
2李鹏,王斌,晋薇.Improving Web Document Clustering through Employing User-Related Tag Expansion Techniques[J].Journal of Computer Science & Technology,2012,27(3):554-566. 被引量：5
3孙萍,蒋昌俊.利用服务聚类优化面向过程模型的语义Web服务发现[J].计算机学报,2008,31(8):1340-1353. 被引量：63

二级参考文献62

1吴健,吴朝晖,李莹,邓水光.基于本体论和词汇语义相似度的Web服务发现[J].计算机学报,2005,28(4):595-602. 被引量：218
2邝砾,邓水光,李莹,吴健,吴朝晖.使用倒排索引优化面向组合的语义服务发现[J].软件学报,2007,18(8):1911-1921. 被引量：24
3Hotho A, Staab S, Stumme G. Wordnet improves text docu- ment clustering. In Proc. SIGIR 2003 Semantic Web Work- shop, Toronto, Canada, Aug. 1, 2003.
4Hu J, Fang L, Cao Y, Zeng H J, Li H, Yang Q, Chen Z. En- hancing text clustering by leveraging Wikipedia semantics. In Proc. SIGIR 2008, Singapore, Jul. 20-24, 2008, pp.179-186.
5Heymann P, Koutrika G, Garcia-Molina H. Can social book- marking improve web search? In Proc. WSDM2008, PaloAlto, USA, Feb. 11-12, 2008, pp.195-206.
6Ramage D, Heymann P, Manning C D, Garcia-Molina H. Clustering the tagged web. In Proc. WSDM2009, Barcelona, Spain, Feb. 9-12, 2009, pp.54-63.
7http: / /www.dai-labor.de/en/ competence_centers/ irml/ data- sets/, April 2010.
8Li X, Guo L, Zhao Y E. Tag-based social interest discovery. In Proc. WWW2008, Beijing, China, Apr. 21-25, 2008, pp.675- 684.
9Wetzker R, Zimmermann C, Bauckhage C. Analyzing so- cial bookmaxking systems: A del.icio.us cookbook. In Proc. ECAI 2008 Mining Social Data Workshop, Patras, Greece, Jul. 21-25, 2008, pp.26-30.
10Griffiths T L, Steyvers M. Finding scientific topics. In Proc. National Academy of Sciences, 2004, 101(Suppl.1): 5228- 5235.

共引文献76

1刘建晓,王健,张秀伟,刘峰,李小霞.一种基于RDB中自身连接的Web服务聚类方法[J].计算机研究与发展,2013,50(S1):205-210. 被引量：4
2赵娟.基于Petri网的语义Web服务过程模型匹配算法研究[J].河南科学,2009,27(2):193-196.
3赵娟.基于Petri网的语义Web服务发现方法研究[J].现代电子技术,2009,32(11):119-121. 被引量：4
4赵娟.基于petri网的语义Web服务过程模型匹配算法研究[J].微型电脑应用,2009(6):4-6.
5付文静,彭志平,杨社堂.语义web服务发现技术研究进展[J].茂名学院学报,2009,19(3):56-58.
6罗晓丽,郭绍忠,陈新.采用服务聚类的语义服务发现[J].信息工程大学学报,2009,10(3):401-405. 被引量：3
7贺超波,陈启买.快速语义Web服务发现方法[J].计算机工程与设计,2010,31(12):2936-2938. 被引量：1
8徐德智,陈稀伟,陈建二.带Cache的语义Web服务发现研究[J].计算机科学,2010,37(8):129-132. 被引量：3
9刘建晓,何克清,宁达.一种面向Web服务的语义匹配方法[J].武汉大学学报（理学版）,2010,56(4):467-472.
10王喜凤,王广正,金玲玲.基于本体的Web服务可靠性模型[J].计算机科学,2010,37(10):148-151. 被引量：1

同被引文献72

1张敏,于剑.基于划分的模糊聚类算法[J].软件学报,2004,15(6):858-868. 被引量：176
2耿焕同,蔡庆生,于琨,赵鹏.一种基于词共现图的文档主题词自动抽取方法[J].南京大学学报（自然科学版）,2006,42(2):156-162. 被引量：30
3童一飞,李东波.基于属性的网格资源动态聚类研究[J].计算机集成制造系统,2008,14(4):813-820. 被引量：5
4张险全,王亮,陈未如.网格环境中相似资源的模糊聚类研究[J].计算机系统应用,2008,17(6):27-32. 被引量：2
5薄华,马缚龙,焦李成.基于免疫K-means聚类的无监督SAR图像分割[J].模式识别与人工智能,2008,21(3):376-380. 被引量：2
6孙萍,蒋昌俊.利用服务聚类优化面向过程模型的语义Web服务发现[J].计算机学报,2008,31(8):1340-1353. 被引量：63
7李伯虎,张霖,王时龙,陶飞,曹军威,姜晓丹,宋晓,柴旭东.云制造——面向服务的网络化制造新模式[J].计算机集成制造系统,2010,16(1):1-7. 被引量：881
8蔡文.可拓论及其应用[J].科学通报,1999,44(7):673-682. 被引量：307
9刘振鹿,王大玲,冯时,张一飞,方东昊.一种基于LDA的潜在语义区划分及Web文档聚类算法[J].中文信息学报,2011,25(1):60-65. 被引量：19
10黄大富,任竞争,江寒梅,谭世语,董立春,周志明,何思然.用可拓聚类模型预测天然气的需求[J].计算机与应用化学,2011,28(5):617-619. 被引量：5

引证文献8

1公冶小燕,林培光,任威隆,张晨,张春云.基于改进的TF-IDF算法及共现词的主题词抽取算法[J].南京大学学报（自然科学版）,2017,53(6):1072-1080. 被引量：18
2肖巧翔,曹步清,张祥平,刘建勋,李晏新闻.基于Word2Vec和LDA主题模型的Web服务聚类方法[J].中南大学学报（自然科学版）,2018,49(12):2979-2985. 被引量：12
3张祥平,刘建勋,肖巧翔,石敏,曹步清.基于LDA和模糊C均值的Web服务多功能聚类[J].中南大学学报（自然科学版）,2018,49(12):2986-2992. 被引量：4
4王万良,吴菲,吕闯.自动确定聚类中心的快速搜索和发现密度峰值的聚类算法[J].模式识别与人工智能,2019,32(11):1032-1041. 被引量：15
5陈彦萍,高宇坤,张恒山,夏虹,王忠民,王鑫,高慧.一种基于群体智慧的智能服务聚类方法[J].郑州大学学报（理学版）,2019,51(4):88-94. 被引量：1
6张苑蕾,邵清,李刘静,鲁建斌,张程斌.融合遗传聚类的可靠Web服务组合优化方法[J].小型微型计算机系统,2020,41(5):1030-1035. 被引量：7
7郑禾丹,马菲菲,李林霞,刘志中.MEC环境下多维属性感知的边缘服务二次聚类方法研究[J].计算机应用研究,2022,39(11):3263-3269.
8高新勤,荆彦臻,王雪萍,原欣.云制造模式下面向加工设备的服务聚类与初选方法[J].计算机集成制造系统,2019,25(3):703-713. 被引量：11

二级引证文献66

1吴运明,王令村,魏子栋,郭顺利.基于Canopy-Kmeans的移动商务用户需求聚合挖掘及分析研究[J].情报科学,2022,40(10):97-106. 被引量：5
2刘一宁,郭功举,林木棵,王琳.基于位置描述的地理实体信息融合方法[J].测绘通报,2021(S01):65-69. 被引量：8
3尤垂桔,罗媛云,何月娟.Web大数据环境下P-信息聚合体生成及智能推送[J].宜春学院学报,2018,40(6):30-34.
4刘家成,王艺憬,孙燕红.基于TF-IDF算法和K-means聚类的商品评论与价格波动相关性研究——以ThinkPad电脑为例[J].科技创业月刊,2018,31(7):45-49. 被引量：2
5贾君枝,赵宇飞.Wikidata与名称规范档数据聚合实现[J].情报科学,2018,36(11):72-77. 被引量：7
6朱明,何永宁,吴博.广西农业信息地理匹配引擎设计与实现[J].南方农业学报,2019,50(1):201-207.
7张根宇.基于TF-IDF和余弦相似度的文本相似度算法研究和优化策略[J].中国科技成果,2019,20(16):25-26. 被引量：2
8赵金楼,朱辉,刘馨.基于改进TFIDF的图书馆知识群体特征提取研究[J].系统科学与数学,2019,39(9):1450-1461. 被引量：5
9周友武,童超,桂良明,陈田,王文彬.物资质量监督应用场景的设计及其应用[J].江西电力,2019,0(12):22-24. 被引量：2
10李晋源,康雁,杨其越,王沛尧,崔国荣.面向方面记忆网络的IT产品细粒度情感分析[J].计算机工程与应用,2020,56(3):159-164. 被引量：5

1刘畅,戴勃,石红艳,杨红果.基于AGNES算法的网格资源分析[J].辽宁工业大学学报（自然科学版）,2009,29(1):24-26. 被引量：1
2周爱武,潘勇,崔丹丹,肖云.AGNES算法在K-means算法中的应用[J].微型机与应用,2011,30(23):79-81. 被引量：2
3曾佳军.改进的AGNES算法在羽毛球技战术分析中的应用[J].电脑知识与技术,2009,5(11X):9343-9345. 被引量：5
4贺超波,陈启买.快速语义Web服务发现方法[J].计算机工程与设计,2010,31(12):2936-2938. 被引量：1
5李新良.基于层次聚类算法的改进研究[J].软件导刊,2007,0(10):141-142. 被引量：5
6阿朗收购Programmable Web[J].世界电信,2010(8):77-77.
7张怡文,李倩,吴正,袁翠霞.一种基于Interest-Model的用户推荐算法[J].江苏师范大学学报（自然科学版）,2013,31(2):38-41.
8蒋劲松.应用数据库建立完善的上位机报表[J].制造业自动化,2002,24(9):67-69.
9Agnes B当时间不再属于你时间盗贼开始流行[J].大观周刊,2011(4):28-29.
10李征,牛阿茜,鲁璐,王弯弯.一种基于Wiki和WordNet的Web服务目标知识扩充方法[J].小型微型计算机系统,2017,38(2):314-318.

小型微型计算机系统

2015年第11期

浏览历史

内容加载中请稍等...

融合K-Means与Agnes的Mashup服务聚类方法被引量：8

参考文献3

二级参考文献62

共引文献76

同被引文献72

引证文献8

二级引证文献66

相关作者

相关机构

相关主题

浏览历史

融合K-Means与Agnes的Mashup服务聚类方法 被引量：8

参考文献3

二级参考文献62

共引文献76

同被引文献72

引证文献8

二级引证文献66

相关作者

相关机构

相关主题

浏览历史

融合K-Means与Agnes的Mashup服务聚类方法被引量：8