题名 基于P2P的Wleb搜索技术
被引量:13
1
作者
方启明
杨广文
武永卫
郑纬民
机构
清华大学 计算机 科学与 技术 系 清华 信息科学 与技术 国家 实验室 (筹)
出处
《软件学报》
EI
CSCD
北大核心
2008年第10期2706-2719,共14页
基金
国家自然科学基金
国家重点基础研究发展计划(973)
国家高技术研究发展计划(863)~~
文摘
Web搜索引擎已经成为人们从海量Web信息中快速找到所需信息的重要工具,随着Web数据量的爆炸性增长,传统的集中式搜索引擎已经越来越不能满足人们不断增长的信息获取需求.随着对等网络(peer-to-peer,简称P2P)技术的快速发展,人们提出了基于P2P的Web搜索技术并迅速成为研究热点.研究的目的是对现有的基于P2P的Web搜索技术进行总结,以期为进一步研究指明方向.首先分析了基于P2P的Web搜索面临的诸多挑战;然后重点总结分析了基于P2P的Web搜索的各项关键技术的研究现状,包括系统拓扑结构、数据存放策略、查询路由机制、索引切分策略、数据集选择、相关性排序、网页收集方法等;最后对已有的3个较有特色的基于P2P的Web搜索原型系统进行了介绍.
关键词
WEB搜索
对等网络
查询路由
索引切分
相关性排序
Keywords
Web search
peer-to-peer
query routing
index partitioning
relevance ranking
分类号
TP393
[自动化与计算机技术—计算机应用技术]
题名 基于轻量级虚拟机的透明计算系统
被引量:4
2
作者
陈成才
张尧学
周悦芝
高原
机构
清华大学 计算机 科学与 技术 系 清华 信息科学 与技术 国家 实验室
出处
《计算机工程》
CAS
CSCD
北大核心
2010年第11期39-41,44,共4页
基金
国家"863"计划基金资助项目(2009AA01Z151)
文摘
基于虚拟机的透明计算系统MMNC-VX实现了未经修改的操作系统在透明计算环境中可按需加载,但其性能与同配置PC相比有较大差距。针对该问题,提出一种基于轻量级虚拟机的透明计算系统,仅虚拟网络设备,减少了由全虚拟化带来的开销,利用设备模型将用户操作系统的存储I/O请求重定向到服务器上处理,实现透明计算。经测试,原型系统性能与同配置PC基本相当,与MMNC-VX相比有较大提高。
关键词
轻量级虚拟机
透明计算
虚拟化
Keywords
lightweight virtual machine
transparent computing
virtuatization
分类号
TP311.52
[自动化与计算机技术—计算机软件与理论]
题名 面向服务和信息的网络体系结构——SIONA
被引量:4
3
作者
夏春梅
徐明伟
机构
清华大学 计算机 科学与 技术 系 清华 信息科学 与技术 国家 实验室 (筹)
出处
《计算机学报》
EI
CSCD
北大核心
2014年第2期289-300,共12页
基金
国家自然科学基金(61073166
61133015
+3 种基金
61161140454)
国家"九七三"重点基础研究发展规划项目基金(2009CB320502
2012CB315803)
国家"八六三"高技术研究发展计划项目基金(2011AA01A101)资助~~
文摘
随着网络需求的改变,信息中心网络ICN(Information Centric Networking)被提出,目前提出的ICN方案基本存在可扩展和部署难的问题.文中提出了一种新的面向服务和信息的网络体系结构SIONA.采用了IP地址加信息内容的Hash值作为信息名字,支持缓存加多源组播的路由模式,阐述了路由器反馈接收端驱动的多窗口的拥塞控制协议.IP地址作为信息名字的前缀,不仅支持IP地址的路由,而且解决了ICN的可扩展和部署难问题,保证了SIONA仍具有IP网络的可扩展能力.而多源组播路由协议和拥塞控制协议的提出保证了SIONA更高效、更稳定和更公平的传输.文中模拟了多源分块路由算法和拥塞控制算法.通过分析和模拟,SIONA不仅具有良好的可扩展性,而且更具高效性、安全性和易部署性.
关键词
SIONA
网络体系结构
面向服务和信息
路由转发
信息中心网络(ICN)中图法
Keywords
forwarding
SIONA
network archit information centric networ ecture
service and information oriented
routing and king (ICN)
分类号
TP393
[自动化与计算机技术—计算机应用技术]
题名 藏文字自动生成技术研究
被引量:1
4
作者
才智杰
孙茂松
才让卓玛
机构
青海师范大学 计算机 学院藏文信息 处理教育部重点实验室
清华大学 计算机 科学与 技术 系 清华 信息科学 与技术 国家 实验室
出处
《高原科学研究》
2017年第1期98-103,共6页
基金
国家自然科学基金项目(61163018
61262051
+11 种基金
61662061)
国家哲学社会科学基金项目(13BYY141
16BYY167)
教育部"春晖计划"合作科研项目(Z2012093
Z2016077)
青海省基础研究项目(2017-ZJ-767
2015-SF-520)
"长江学者和创新团队发展计划"创新团队资助项目(IRT1068)
青海省重点实验室项目(2013-Z-Y17
2014-Z-Y32
2015-Z-Y03)
藏文信息处理与机器翻译重点实验室(2013-Y-17)
文摘
字是语言文字的基本组成单位,文字自动生成是自然语言处理的基础,为自然语言处理中字属性分析、输入法设计、排序、语音处理和藏文字符信息熵研究等提供理论数据。文章在分析藏文字结构的基础上归纳了藏文构字规则,并以藏文字的核心字符基字的竖直方向上所含成分将藏文字分成了8个大类,对不同类型藏文字分析了其生成模型及生成算法,经测试可自动生成符合现代藏文文法的所有现代藏文字。
关键词
中文信息处理
藏文字
自动生成
Keywords
Chinese information processing
Tibetan Character
automatic generation
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
题名 下一代互联网体系结构基础研究及探索
被引量:71
5
作者
吴建平
吴茜
徐恪
机构
清华大学 计算机 科学与 技术 系 清华 信息科学 与技术 国家 实验室 (筹)
出处
《计算机学报》
EI
CSCD
北大核心
2008年第9期1536-1548,共13页
基金
国家"九七三"重点基础研究发展规划项目基金(2003CB314800)
国家自然科学基金(90704001)资助~~
文摘
随着人们对互联网的规模、功能和性能等方面的需求越来越高,以IPv4协议为核心技术的互联网面临着越来越严重的技术挑战.近年来,下一代互联网及其应用的研究引起了许多国家的特别关注,发达国家相继启动了下一代互联网研究计划,意图掌握未来互联网核心技术.国家"九七三"计划项目"新一代互联网体系结构理论研究",经过近5年的研究,在探索新一代互联网体系结构所面临的基础问题上,取得了初步的研究结果:提炼出新一代互联网体系结构研究的4个基本科学问题;初步提出了一种多维可扩展的新一代互联网体系结构及其基本要素;从基于IPv6的规模可扩展、基于可扩展交换节点的性能可扩展、基于真实IPv6地址的安全可扩展、基于4over6机制的功能可扩展和基于端到端无连接服务质量控制的服务可扩展等5个方面对新一代互联网多维可扩展体系结构进行了深入研究.这5项基本要素将构成未来新一代互联网的基础.
关键词
下一代互联网
IPV6
互联网体系结构
多维可扩展
真实IPv6地址
4over6
Keywords
next-generation Internet
IPv6
Internet architecture
multi-dimension scalability
authentic IPv6 addressing
4over6
分类号
TP393
[自动化与计算机技术—计算机应用技术]
题名 分布式文件系统存储介质评测与分析
被引量:9
6
作者
许春聪
黄小猛
吴诺
孙宁伟
杨广文
机构
清华大学计算机科学与技术系信息科学与技术国家实验室
出处
《计算机学报》
EI
CSCD
北大核心
2010年第10期1873-1880,共8页
基金
国家自然科学基金(60803121
60773145
+2 种基金
90812001
60963005)
国家"八六三"高技术研究发展计划项目基金(2010AA012401)资助~~
文摘
文中分析了磁盘、SSD和DRAM的价格和能耗,测试了分布式文件系统HDFS、MooseFS和CarrierFS部署在不同存储介质上的数据吞吐率,接着提出了一种存储介质的性价比理论模型,并分析了当前、2015年和2020年不同存储介质的性价比和变化趋势.通过性价比分析可得,DRAM具有较大的性价比优势,适合于高并发随机访问应用.随着DRAM容量的快速提升,未来DRAM有可能成为可选的数据存储介质.当前,SSD虽然具有较好的访问性能,但其价格高、容量小、性价比低于磁盘.2015年SSD的性价比将超过磁盘,有可能替代磁盘成为大规模存储系统的基本存储设备.
关键词
分布式文件系统
吞吐率
存储介质
Keywords
distributed file system
throughput
storage medium
分类号
TP301
[自动化与计算机技术—计算机系统结构]
题名 一种面向大规模副本存储系统的可靠性模型
被引量:7
7
作者
穆飞
薛巍
舒继武
郑纬民
机构
清华大学 计算机 科学与 技术 系 清华 信息科学 与技术 国家 实验室 (筹)
出处
《计算机研究与发展》
EI
CSCD
北大核心
2009年第5期756-761,共6页
基金
国家自然科学基金项目(90612018)
科技部"十一五"国家科技支撑计划重大项目(2006BAA02A17)
国家"九七三"重点基础研究发展计划基金项目(2004CB318205)~~
文摘
可靠性对大规模存储系统至关重要,在大规模存储系统中设备失效日趋频繁,副本技术成为提高系统可靠性的主流技术之一.基于Markov模型,针对多副本存储系统建立了度量系统可靠性的理论模型.该模型能够反应失效检测延迟对系统可靠性的影响.通过该模型还可以度量存储系统关键参数如系统规模、副本阶数、单节点容量、单节点平均失效时间、数据对象平均大小、平均修复带宽等对系统可靠性的影响,从而为存储系统的设计提供理论基础.
关键词
存储系统
可靠性
多副本
MARKOV模型
失效检测
Keywords
storage system
reliability
replica
Markov model
failure detection
分类号
TP302.1
[自动化与计算机技术—计算机系统结构]
题名 普适计算中面向最优质量的服务复用方法
被引量:2
8
作者
田鹏伟
方存好
钟鸣
机构
清华大学计算机科学与技术系信息科学与技术国家实验室
出处
《计算机工程》
CAS
CSCD
北大核心
2010年第14期13-15,共3页
基金
国家自然科学基金资助项目(90604027)
文摘
针对普适计算模式下的服务复用及服务质量问题,提出一种面向最优质量的服务复用方法。通过建立服务功能倒排索引完成已有服务的功能匹配,采用多属性决策理论进行服务质量的量化和评价,并利用分枝定界法搜索最优质量的服务组合,生成满足用户需求的服务。实验结果验证了该方法在提高生成服务质量方面的有效性。
关键词
普适计算
服务质量
服务复用
Keywords
pervasive computing
Quality of Service(QoS)
service reuse
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
题名 从资源共享到服务共享:透明计算的机遇与挑战
被引量:3
9
作者
张尧学
周悦芝
机构
清华大学 计算机 科学与 技术 系 清华 信息科学 与技术 国家 实验室
出处
《中国工程科学》
2009年第8期10-17,F0002,共9页
基金
国家"八六三"资助项目(2004AA114062
2005AA114160)
文摘
随着计算机和网络技术以及应用的不断快速发展,计算模式从最初的以主机计算为主,发展到以桌面(PC)计算为主,再发展到现在的以网络计算为主,乃至普适计算。然而,迄今为止的计算模式还是遵循以单机或单机联合为基础的单机思维模式,因此,目前的计算模式还是一种以"资源共享"为主要特征的计算。在网络和普适计算的新时代,用户关心的主要是服务和服务共享,计算机也将从以"资源共享"为特征的计算过渡到以"服务共享"为特征的计算。笔者提出一种适应于"服务共享"的计算模式——透明计算,并对其概念、体系结构及相关关键技术进行介绍。此外,还对透明计算的未来发展及影响进行展望。
关键词
普适计算
资源共享
服务共享
透明计算
Keywords
pervasive computing
resource sharing
service sharing
transparent computing
分类号
TP202
[自动化与计算机技术—检测技术与自动化装置]
题名 基于空间缩放和吸引子的粒子群优化算法
被引量:43
10
作者
迟玉红
孙富春
王维军
喻春明
机构
清华大学 计算机 科学与 技术 系 清华 信息科学 与技术 国家 实验室
中国人民解放军
出处
《计算机学报》
EI
CSCD
北大核心
2011年第1期115-130,共16页
基金
国家'九七三'重点基础研究发展规划项目基金(G2007CB311003
G2009CB724002)
国家杰出青年基金(60625304)资助
文摘
为解决粒子群优化(Particle Swarm Optimization,PSO)算法中粒子越界、算法进化后期收敛速度慢和早熟收敛的问题,通过分析PSO算法中粒子运动行为和算法稳定性,提出了一种基于空间缩放和吸引子的粒子群优化(PSO with search space zoomed factor and attractor,SzAPSO)算法.该算法利用对搜索空间进行缩放的边界变异策略有效控制了粒子搜索范围,保证了算法全局探测能力;算法中吸引子的引入增加了感兴趣区域的粒子密度,提高了算法局部开发能力.实验结果表明,SzAPSO算法收敛速度快、精度高,且具有较好的鲁棒性.
关键词
群体智能
粒子群优化
搜索空间
边界变异策略
吸引子
Keywords
swarm intelligence
particle swarm optimization
search space
boundary conditionl at-tractor
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
题名 云虚拟机资源分配的效用最大化模型
被引量:78
11
作者
师雪霖
徐恪
机构
清华大学 计算机 科学与 技术 系 清华 信息科学 与技术 国家 实验室 (筹)
出处
《计算机学报》
EI
CSCD
北大核心
2013年第2期252-262,共11页
基金
国家科技支撑计划(2011BAK08B05-02)
国家“九七三”重点基础研究发展规划项目基金(2009CB320501,2012CB315803)
+1 种基金
国家自然科学基金(61170292,60970104)
国家科技重大专项基金(2012ZX03005001001)资助~~
文摘
随着云计算和虚拟化技术的发展,为云资源管理提供了一种更高层次的调度选择:一个作业不再只能分配到一台物理机上,而是可将一台或多台物理机的计算资源虚拟化成一台虚拟机来运行该作业.根据作业需要,高效分配定量的物理资源放置虚拟机,是决定云系统性能的关键因素,即云资源调度问题实质就是一个虚拟机和物理机之间的映射问题.文中借鉴网络效用最大化模型,提出了一种云资源调度模型——云效用最大化(Cloud UtilityMaximization,CUM)模型,与传统调度模型相比,目标函数不再是最小化最大完工时间,而是以达到效用最大为调度目标,可以充分提高用户的满意程度.通过求解CUM优化问题得到最优的虚拟机和物理机映射关系.设计了针对该模型的分解优化算法——简化次梯度算法求解拉格朗日对偶问题,证明了该算法可以获得原始模型问题的最优解.仿真实验表明算法可行且具有良好的收敛特性,并给出了CUM模型在真实云环境下的应用场景.
关键词
云计算
资源调度
虚拟机放置
拉格朗日松弛
次梯度算法
Keywords
cloud computing
scheduling
virtual machine placement
Lagrange relaxation
subgradient algorithm
分类号
TP312
[自动化与计算机技术—计算机软件与理论]
题名 汉语词同现网络的小世界效应和无标度特性
被引量:41
12
作者
刘知远
孙茂松
机构
清华大学 计算机 科学与 技术 系 清华 信息科学 与技术 国家 实验室
出处
《中文信息学报》
CSCD
北大核心
2007年第6期52-58,共7页
基金
国家自然科学基金资助项目(60573187
60621062
60520130299)
文摘
人类语言的某些重要方面可以通过复杂网络来刻画。本文基于不同规模和类型的语料库,建立了汉语词同现网络,并从复杂网络的角度对这些网络进行了系统的实验考察。实验结果表明汉语词同现网络具有复杂网络的两个基本性质:(1)网络的平均最短路径为2.63-2.75,聚合系数远大于相同参数下的随机网络,这揭示了汉语同现网络的小世界效应;(2)网络中词的度大体上呈幂律分布,表明汉语同现网络具有无标度特性。本文还对实验中所得到的汉语核心词典进行了定量分析。
关键词
计算机应用
中文信息处理
词的同现
复杂网络
小世界
无标度
核心词典
Keywords
computer application
Chinese information processing
word eo occurrence
complex networks
small world
scale-free
kernel lexicon
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 一种基于向量模型的藏文字拼写检查方法
被引量:14
13
作者
才智杰
孙茂松
才让卓玛
机构
青海师范大学 计算机 学院藏文信息 处理教育部重点实验室
清华大学 计算机 科学与 技术 系 清华 信息科学 与技术 国家 实验室
出处
《中文信息学报》
CSCD
北大核心
2018年第9期47-55,共9页
基金
国家自然科学基金(61163018
61262051
+14 种基金
61363055
61866032)
国家社会科学基金(13BYY141
16BYY167
15BYY167)
教育部"春晖计划"合作科研项目(Z2012093
Z2016077)
青海省基础研究项目(2017-ZJ-767
2014-SF-129
2015-SF-520)
"长江学者和创新团队发展计划"创新团队资助项目(IRT1068)
青海省重点实验室项目(2013-Z-Y32
2014-Z-Y32
2015-Z-Y03)
藏文信息处理与机器翻译重点实验室项目(2013-Y-17)
文摘
自动拼写检查是自然语言处理领域一项极具挑战性的研究课题,在语料库建设、文本编辑、语音和文字识别等诸多方面具有广阔的应用前景。藏文字是一种表音拼音文字,由1~7个基本构件横向和纵向拼接而成。藏文文本中非真字出现的频率很高,是藏文字拼写检查的基础和重点。该文通过分析藏文文法中的构字规则,利用藏文字向量模型将藏文字用计算机易于操作的数字(向量)表示,建立基于规则约束的藏文字向量模型,进而设计该模型下的藏文字拼写检查模型及算法。算法简单易实现,经测试算法拼写检查的平均准确率达99.995%,平均每秒检查1 060个字。
关键词
自然语言处理
向量模型
藏文字
拼写检查
非真字
Keywords
NLP
vector model
Tibetan characters
spelling chezking
non-real characters
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 基于贝叶斯方法的网络攻击定位和追踪模型
被引量:3
14
作者
胡振宇
张瑞玲
孙富春
机构
清华大学计算机科学与技术系信息科学与技术国家实验室
洛阳师范学院信息 技术 学院
出处
《郑州大学学报(理学版)》
CAS
2008年第3期44-47,共4页
基金
国家重点基础研究专项基金资助项目,编号G2002cb312205
文摘
在网络节点之间存在安全依赖关系的前提下,提出了一个基于贝叶斯方法的网络攻击定位和追踪模型.该模型根据网络节点间的安全依赖关系构造安全依赖树,进而采用贝叶斯方法计算各个节点的攻击因子,并据此确定攻击源和攻击路径.
关键词
贝叶斯方法
网络入侵
安全依赖
网络安全
Keywords
Bayesian method
network attack
security dependence
security of network
分类号
TP393.08
[自动化与计算机技术—计算机应用技术]
题名 一种卷级连续数据保护一致点插入方法
被引量:2
15
作者
生拥宏
汪东升
鞠大鹏
武健
机构
清华大学 计算机 科学与 技术 系 清华 信息科学 与技术 国家 实验室
出处
《高技术通讯》
EI
CAS
CSCD
北大核心
2010年第11期1101-1107,共7页
基金
863计划(2009AA01Z104)资助项目
文摘
形式化描述了应用层语义事件与卷级连续数据保护一致点插入的关系,提出了借助文件系统特定IO操作在正常IO流中插入一致点的算法。该方法提供的三种一致点插入技术分别能满足单个文件、目录和逻辑卷不同粒度的一致性恢复需要,同时也可以根据用户的定义弱化为传统的基于固定周期的快照备份方法。论文给出了系统的实现方法,评估了方法的有效性。实验表明,该方法提供了准确率较高的一致性恢复手段。
关键词
连续数据保护(CDP)
一致性
备份
Keywords
continuous data protection (CDP), consistency, backup
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
题名 藏文字同现网络的小世界效应和无标度特性
被引量:3
16
作者
才智杰
孙茂松
才让卓玛
机构
青海师范大学 计算机 学院藏文信息 处理教育部重点实验室
清华大学 计算机 科学与 技术 系 清华 信息科学 与技术 国家 实验室
出处
《中文信息学报》
CSCD
北大核心
2018年第10期45-52,共8页
基金
国家自然科学基金(61866032
61163018
+15 种基金
61262051
61363055
61662061)
国家社会科学基金(13BYY141
16BYY167
15BYY167)
教育部"春晖计划"合作科研项目(Z2012093
Z2016077)
青海省基础研究项目(2017-ZJ-767
2019-SF-129
2015-SF-520)
"长江学者和创新团队发展计划"创新团队资助项目(IRT1068)
青海省重点实验室项目(2013-Z-Y17
2014-Z-Y32
2015-Z-Y03)
藏文信息处理与机器翻译重点实验室项目(2013-Y-17)
文摘
复杂网络具有自组织、自相似、吸引子、小世界、无标度中部分或全部性质,而语言文字作为人类智慧和文明的结晶,是经过漫长演化形成的复杂网络。该文对藏语诗歌、散文、政治、佛教、教材和口语等六类具有代表性的体裁语料,每类各取15篇共90篇文章构建了97个藏文字同现网络,分析了藏文字同现网络的最短路径长度、聚类系数和度分布,实验数据显示97个藏文字同现网络都具有小世界效应和无标度特性,表明藏文字同现网络都具有小世界效应和无标度特性。
关键词
藏文字
同现网络
小世界效应
无标度特性
Keywords
Tibetan characters
co-occurrence network
small world effect
scale-free property
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 一种基于动态贝叶斯网的视觉注意力识别方法
被引量:3
17
作者
董力赓
邸慧军
陶霖密
徐光祐
机构
清华大学 计算机 科学与 技术 系 清华 信息科学 与技术 国家 实验室 (筹)
出处
《电子学报》
EI
CAS
CSCD
北大核心
2011年第A03期140-146,共7页
基金
国家自然科学基金(No.60673189
No.60873266
No.90820304)
文摘
头部姿态估计是识别用户视觉注意力目标的主要依据.但在实际应用场合下,大范围头部姿态、低分辨率图像以及光照变化等因素使得可靠、准确的头部姿态估计难以实现.针对这些困难,提出一种基于动态贝叶斯网模型的视觉注意力目标识别方法.通过人脸图像与多个人脸姿态类别的相似度向量对头部姿态进行度量而不是显式的计算具体姿态值.模型融合多注意力目标、多用户位置、多摄像机图像等因素间的概率依赖关系并进行联合推理.智能厨房原型环境下的实验结果表明提出的模型是有效的.
关键词
视觉注意力目标识别
动态贝叶斯网
智能厨房
Keywords
visual focus of attention recognition
dynamic Bayesian network
the ambient kitchen
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
题名 GUA:一种通用网格用户代理模型
18
作者
陶江
杨广文
机构
清华大学 计算机 科学与 技术 系 清华 信息科学 与技术 国家 实验室
出处
《计算机工程与应用》
CSCD
北大核心
2006年第24期141-144,共4页
基金
国家自然科学基金资助项目(编号:60373004
60373005
+5 种基金
90412006
90412011
60573110
90612016)
国家973重点基础研究发展规划资助项目(编号:2004CB318000
2003CB316907)
文摘
为了便于将网格系统中与用户体验密切相关的功能独立出来研究,文章提出了一种通用的网格用户代理(GUA)模型,它改进了对中间件接口的调用方式,利用线程池实现资源分配和命令缓冲,并以此为基础扩展其他功能模块,达到对整个交互过程的精细控制。文章首先剖析了GUA存在的必要性,然后描述如何组成一个完备GUA系统,并将模型中的实体形式化。最后,使用原型系统在国家网格环境下完成了测试,结果表明符合GUA设计的近客户端显著提高了系统的可伸缩性和实时性。
关键词
网格
用户代理
响应时间
协议并行
模型
Keywords
grid,user agent,response time,parallel protocols,model
分类号
TP302.1
[自动化与计算机技术—计算机系统结构]