-
题名多核处理器Cache一致性协议关键技术研究
被引量:5
- 1
-
-
作者
黄安文
张民选
-
机构
国防科技大学计算机学院并行与分布处理国防科技重点实验室
-
出处
《计算机工程与科学》
CSCD
北大核心
2009年第A01期104-108,共5页
-
基金
国家863计划基金资助项目(2009AA01Z124)
教育部"高性能微处理器设计创新团队"资助项目
-
文摘
多核处理器规模的不断扩大和核间通信机制的日益复杂,使得Cache一致性维护变得更加困难。本文从多核处理器Cache一致性问题的产生背景出发,分析监听协议、目录协议、Token协议和Hammer协议的实现机制以及在多核环境中的优缺点,分别从一致性协议与片上互连结构协同设计、面向低功耗应用的协议优化策略、Cache一致性协议验证及容错机制等角度考虑,对未来多核处理器Cache一致性协议设计的发展趋势和技术挑战进行详细分析与讨论。
-
关键词
CACHE一致性
片上互连
低功耗
验证
容错
-
Keywords
cache coherence
on-chip interconnect
low power consumption
verification
fault tolerant
-
分类号
TP302.1
[自动化与计算机技术—计算机系统结构]
-
-
题名分布式深度学习通信架构的性能分析
被引量:4
- 2
-
-
作者
张立志
冉浙江
赖志权
刘锋
-
机构
国防科技大学计算机学院并行与分布处理国防科技重点实验室
-
出处
《计算机工程与科学》
CSCD
北大核心
2021年第3期416-425,共10页
-
基金
国家重点研发计划(2018YFB0204301)
国家自然科学基金(61702533)。
-
文摘
近年来,深度学习技术的进步推动人工智能进入了一个新的发展时期。但是,海量的训练数据、超大规模的模型给深度学习带来了日益严峻的挑战,分布式深度学习应运而生,逐渐成为应对这一挑战的有效手段,而高效的参数通信架构是保证分布式深度学习性能的关键。针对传统分布式深度学习模型同步架构在大规模节点上并行训练的问题,首先,分析了集中式的Parameter Server和去中心化的Ring Allreduce这2种主流的参数通信架构的原理和性能。然后,在天河高性能GPU集群上基于TensorFlow构建了2种分布式训练架构的对比测试环境。最后,以Parameter Server架构为基准线,测试了Ring Allreduce架构在GPU集群环境下训练AlexNet和ResNet-50的对比性能。实验结果表明,在使用32个GPU的情况下,Ring Allreduce架构扩展效率可达97%,相比Parameter Server架构,其分布式计算性能可提升30%,验证了Ring Allreduce架构具有更好的可扩展性。
-
关键词
Ring
Allreduce
参数服务器
分布式训练
深度学习
深度神经网络
-
Keywords
Ring Allreduce
parameter server
distributed training
deep learning
deep neural network
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-
-
题名移动群体感知技术研究
被引量:8
- 3
-
-
作者
熊英
史殿习
丁博
邓璐
-
机构
国防科技大学计算机学院并行与分布处理国防科技重点实验室
-
出处
《计算机科学》
CSCD
北大核心
2014年第4期1-8,共8页
-
基金
国家新一代宽带无线移动通信网专项课题(2011ZX03002-004-01)资助
-
文摘
移动互联网的不断成熟以及搭载各种传感器的智能终端的广泛应用和普及催生了全新的研究领域,即移动群体感知技术领域。移动群体感知是以人为中心的感知,人在感知过程中扮演着重要的角色,发挥着重要的作用。移动群体感知概念自提出以来,受到了学术界和工业界的广泛关注,移动群体感知技术广泛应用于交通、医疗健康等各个领域以及人们日常生活中的各个方面。首先从移动群体感知概念、感知模式、感知规模及其特性的角度阐述了移动群体感知的内涵;在此基础上,对群体感知技术的应用进行了分类,并且对现有典型的移动群体感知研究项目进行了分析、总结和比较;进而描述了移动群体感知技术向规模化、系统化发展的趋势及面向服务的"端+云"的移动群体感知体系架构;最后重点阐述了移动群体感知在大规模环境下所面临的全新挑战及应对策略。
-
关键词
移动群体感知
感知模式
上下文感知
大数据融合
-
Keywords
Mobile sensing
Sensing paradigms
Terminal context-aware sensing
Big data fusion
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名多维数据特征融合的用户情绪识别
被引量:3
- 4
-
-
作者
陈茜
史殿习
杨若松
-
机构
国防科技大学计算机学院并行与分布处理国防科技重点实验室
-
出处
《计算机科学与探索》
CSCD
北大核心
2016年第6期751-760,共10页
-
基金
国家自然科学基金No.61202117~~
-
文摘
针对目前基于智能手机的情绪识别研究中所用数据较为单一,不能全面反应用户行为模式,进而不能真实反应用户情绪这一问题展开研究,基于智能手机从多个维度全面收集反应用户日常行为的细粒度感知数据,采用多维数据特征融合方法,利用支持向量机(support vector machine,SVM)、随机森林(random forest)等6种分类方法,基于离散情绪模型和环状情绪模型两种情绪分类模型,对12名志愿者的混合数据和个人数据分别进行情绪识别,并进行了对比实验。实验结果表明,该全面反应用户行为的多维数据特征融合方法能够很好地对用户的情绪进行识别,其中使用个人数据进行情绪识别的准确率最高可达到79.78%,而且环状情感模型分类结果明显优于离散分类模型。
-
关键词
情绪识别
情绪模型
机器学习
智能手机
-
Keywords
emotion recognition
emotion model
machine learning
smartphone
-
分类号
TP399
[自动化与计算机技术—计算机应用技术]
-
-
题名发布订阅系统中的拒绝服务攻击
- 5
-
-
作者
张圣栋
沈锐
-
机构
国防科技大学计算机学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2011年第25期26-29,共4页
-
基金
国家重点基础研究发展规划(973)(No.2011CB302603)
国家自然科学基金(No.60725206)~~
-
文摘
针对发布订阅系统中的拒绝服务攻击,提出一种有效的订阅合并方法。不同于现有订阅合并方法,该方法要求合并的订阅具有一定的相似性,因而可以减少合并后事件转发带宽开销。订阅相似性判断根据它在每个属性上约束范围的大小和位置,采用两阶段的归组算法把相似订阅归组,把处于同一组的订阅合并。理论分析表明,该方法时间复杂度低,可以根据节点负载情况动态控制合并粒度,因而可以有效解决拒绝服务攻击的问题。实验结果表明,该方法只增加少量的事件转发带宽开销。
-
关键词
发布订阅系统
拒绝服务攻击
订阅合并
时间复杂度
带宽开销
-
Keywords
publish/subscribe systems
Denial Of Service(DOS)attack
subscription merging
time complexity
bandwidth cost
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-