期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
大规模分布式系统中的多属性查询处理 被引量:11
1
作者 周傲英 周敏奇 +1 位作者 钱卫宁 张蓉 《计算机学报》 EI CSCD 北大核心 2008年第9期1563-1572,共10页
大规模分布式系统中的复杂查询处理是将对等计算技术运用于关键应用中的重要问题,是学术界与工业界所共同关注的研究问题.文中介绍了一种高效、可伸缩的通用的基于类Chord协议的多属性查询处理技术GChord.它既支持匹配查询也支持范围查... 大规模分布式系统中的复杂查询处理是将对等计算技术运用于关键应用中的重要问题,是学术界与工业界所共同关注的研究问题.文中介绍了一种高效、可伸缩的通用的基于类Chord协议的多属性查询处理技术GChord.它既支持匹配查询也支持范围查询.和现有其它技术相比,对于任何数据元组,GChord只需要对其编码和索引一次,且能将查询处理的代价限制在一个很小的范围内.因此,它能在索引维护代价和查询效率之间达到平衡.GChord还提供优化技术以进一步提升性能.实验证实了GChord具有较高的查询处理效率以及较低的索引维护代价. 展开更多
关键词 多属性查询处理 重叠网络 分布式系统
在线阅读 下载PDF
基于KL距离的非平衡数据半监督学习算法 被引量:11
2
作者 许震 沙朝锋 +1 位作者 王晓玲 周傲英 《计算机研究与发展》 EI CSCD 北大核心 2010年第1期81-87,共7页
在实际应用中,由于各种原因时常无法直接获得已标识反例,导致传统分类方法暂时失灵,因此,基于正例和未标识集的半监督学习顿时成了理论界研究的热点.研究者们提出了不同的解决方法,然而,这些方法都不能有效处理非平衡的分类问题,尤其当... 在实际应用中,由于各种原因时常无法直接获得已标识反例,导致传统分类方法暂时失灵,因此,基于正例和未标识集的半监督学习顿时成了理论界研究的热点.研究者们提出了不同的解决方法,然而,这些方法都不能有效处理非平衡的分类问题,尤其当隐匿反例非常少或训练集中的实例分布不均匀时.因此,提出了一种基于KL距离的半监督分类算法——LiKL:依次挖掘出未标识集中的最可靠正例和反例,接着使用训练好的增强型分类器来分类.与其他方法相比,不仅提高了分类的查准率和查全率,而且具有鲁棒性. 展开更多
关键词 半监督学习 非平衡 KL距离 朴素贝叶斯 LOGISTIC回归
在线阅读 下载PDF
数据流处理技术在电信网管系统中的应用 被引量:6
3
作者 宫学庆 闫莺 +2 位作者 常建龙 张晨 周傲英 《计算机科学与探索》 CSCD 2008年第2期180-191,共12页
网络流量监测技术是电信运营商所关注的重点之一。随着网络传输带宽的不断增加,传统的基于磁盘的处理技术已经不能够满足运营管理的需要,数据流处理技术的出现为网络流量监测应用提供了一种新的解决方案。SMART[1,2]和RealMon[3]是将数... 网络流量监测技术是电信运营商所关注的重点之一。随着网络传输带宽的不断增加,传统的基于磁盘的处理技术已经不能够满足运营管理的需要,数据流处理技术的出现为网络流量监测应用提供了一种新的解决方案。SMART[1,2]和RealMon[3]是将数据流处理技术应用于网络流量监测的两个应用系统。文中结合上海电信在骨干网流量监测上的应用需求,对这两个系统的设计与应用进行了介绍。SMART系统以数据流上的频繁项挖掘算法为基础,支持NetFlow数据流上长时间滑动窗口内的Top-K查询,实现了对网络流量分布的实时监测。RealMon系统采用数据流上的降维分析算法对SNMP数据流进行分析,通过监测网络链路上不同流量数据的相关性变化来发现异常流量。实验和在真实环境中的应用表明,SMART和RealMon系统能够满足骨干网流量监测应用的需要,并且极大地提高了监测系统的性能。 展开更多
关键词 数据流 网络流量监测 TOP-K查询 异常检测
在线阅读 下载PDF
基于用户相似度度量的有效社区Leader选举方法 被引量:2
4
作者 田秀霞 宋羊力 +1 位作者 朱涛 王晓玲 《燕山大学学报》 CAS 2014年第6期516-522,共7页
社交网络社区Leader选举,即识别社区内影响力最大用户,是社交网络结构分析重要任务之一,在识别意见领袖、增进社区融合等方面具有重要的理论和应用研究价值。传统的社区Leader选举技术如User Rank和People Rank,主要基于社交网络链接分... 社交网络社区Leader选举,即识别社区内影响力最大用户,是社交网络结构分析重要任务之一,在识别意见领袖、增进社区融合等方面具有重要的理论和应用研究价值。传统的社区Leader选举技术如User Rank和People Rank,主要基于社交网络链接分析实现,忽略了用户本身属性的相似度度量。因此得到的社区Leader不能有效保证其社区代表性。本文提出了一种新的用户关系建模方法,将传统的链接分析和用户属性相似度度量融合,有效识别具有代表性的高影响力用户。实验结果表明,提出的方法不仅可以选举出社区内部具有代表性的高影响力Leader用户,还可以通过社区Leader选举使得社区内其他用户的查询效率得到有效提高。 展开更多
关键词 区域Leader选举 社交网络 相似度度量 影响力 代表性
在线阅读 下载PDF
TLGM-QL:基于图模型的Web数据分析性查询语言 被引量:1
5
作者 马强 陶导 +1 位作者 钱卫宁 周傲英 《广西师范大学学报(自然科学版)》 CAS 北大核心 2009年第1期121-124,共4页
随着万维网规模和应用的飞速发展,如何有效存储和利用Web数据已成为计算机科学诸多研究领域的巨大挑战。针对这些迫切的需要,介绍一种新的Web分析工具TLGM-QL(tagged and labeled graph modelquery language),用户只需要编写描述性的类... 随着万维网规模和应用的飞速发展,如何有效存储和利用Web数据已成为计算机科学诸多研究领域的巨大挑战。针对这些迫切的需要,介绍一种新的Web分析工具TLGM-QL(tagged and labeled graph modelquery language),用户只需要编写描述性的类SQL分析性查询语句,即可获得对于以图形式组织的Web数据分析结果。用户不需要关心底层的实现,系统可将TLGM-QL查询语句生成物理执行计划分配给集群高度并行执行,最终返回查询结果。 展开更多
关键词 TLGM-QL 查询语言 分布式计算
在线阅读 下载PDF
一种支持高效XML路径查询的自适应结构索引 被引量:9
6
作者 张博 耿志华 周傲英 《软件学报》 EI CSCD 北大核心 2009年第7期1812-1824,共13页
提出了一种新的自适应结构索引:AS-Index(adaptive structural index),能够克服现有静态索引和自适应索引的缺陷,具备高效的查询和调整性能.AS-Index建立在F&B-Index的基础之上,其索引结构包括F&B-Index,Query-Table和Part-Tabl... 提出了一种新的自适应结构索引:AS-Index(adaptive structural index),能够克服现有静态索引和自适应索引的缺陷,具备高效的查询和调整性能.AS-Index建立在F&B-Index的基础之上,其索引结构包括F&B-Index,Query-Table和Part-Table.Query-Table能够记录频繁查询,避免了查询过程中的冗余操作.并且,在Query-Table的基础上提出了自底向上的查询处理过程,能够充分利用现有的频繁查询高效地回答非频繁查询.Part-Table用于优化包含祖先后裔边的查询,进一步提高了查询性能.现有的自适应结构索引的调整粒度是XML元素节点,调整过程往往需要遍历整个文档.而AS-Index是基于F&B-Index节点的增量调整,其过程是局部的,高效的,并且能够支持复杂分支查询的调整.实验结果表明,AS-Index在查询和调整性能上优于现有的XML结构索引.同时,相比于现有的自适应结构索引,AS-Index针对大规模文档具有更加优良的可扩展性. 展开更多
关键词 XML 自适应索引 结构索引 查询处理
在线阅读 下载PDF
CWI中的分布式图数据存储与查询
7
作者 陶导 马强 +2 位作者 杨譞 钱卫宁 周傲英 《广西师范大学学报(自然科学版)》 CAS 北大核心 2009年第1期125-128,共4页
现存的Web分析技术大多基于数据的文本内容,而忽视了数据本身的结构信息。为此,介绍CWI——一种新的海量数据分析和查询工具。作为CWI的一部分,TLGM和TLGM-Ql实现了对于Web数据内容和结构的查询分析,并且在分布式环境下实现了TLGM的图... 现存的Web分析技术大多基于数据的文本内容,而忽视了数据本身的结构信息。为此,介绍CWI——一种新的海量数据分析和查询工具。作为CWI的一部分,TLGM和TLGM-Ql实现了对于Web数据内容和结构的查询分析,并且在分布式环境下实现了TLGM的图数据存储,实现了TLGM-QL的4个基本算子,实验证明该结构具有良好的平衡性和可扩展性。 展开更多
关键词 分布式存储 图数据 索引 负载均衡
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部