-
题名基于消息传递并行进程迁移技术的研究与实现
被引量:5
- 1
-
-
作者
刘天田
杨升春
欧中红
袁由光
-
机构
武汉数字工程研究所
-
出处
《计算机科学》
CSCD
北大核心
2009年第4期166-168,共3页
-
基金
"十一五"国防预研项目(513160201)资助
-
文摘
高可用在并行计算环境中的地位日益突出。实现LAM/Migration扩展了LAM/MPI的进程迁移功能,可实现MPI整体任务在节点之间的自由迁移,其迁移功能对应用程序透明、智能化程度高,并可应用于集群节点容错与负载均衡,有效提高集群的可用性。
-
关键词
MPI
高可用
检查点
卷回
进程迁移
-
Keywords
MPI, High availability,Checkpoint, Rollback, Process migration
-
分类号
TP338.8
[自动化与计算机技术—计算机系统结构]
-
-
题名2D Mesh片上网络分区容错路由算法
被引量:2
- 2
-
-
作者
胡哲琨
杨升春
陈杰
-
机构
武汉数字工程研究所研发部
中国科学院微电子研究所通信与多媒体技术研究室
-
出处
《计算机应用》
CSCD
北大核心
2016年第5期1201-1205,共5页
-
文摘
为了减小路由表的规模且避免使用较多虚通道(VC),从而降低硬件资源用量,针对虫孔交换的2D Mesh片上网络提出了一种分区容错路由(RFTR)算法。该算法根据故障节点和链路的位置将2D Mesh网络划分为若干个相连的矩形区域,数据包在矩形区域内可使用确定性或自适应路由算法进行路由,而在区域间则按照up*/down*算法确定路由路径。此外,利用通道依赖图(CDG)模型,证明了该算法仅需两个虚通道就能避免死锁。在6×6 Mesh网络中,RFTR算法能减少25%的路由表资源用量。仿真结果表明,在队列缓存资源相同的情况下,RFTR算法能实现与up*/down*算法和segment算法相当甚至更优的性能。
-
关键词
片上网络
容错路由
死锁避免
路由表
通道依赖图
-
Keywords
Network on Chip(NoC)
fault tolerant routing
deadlock avoidance
routing table
Channel Dependency Graph(CDG)
-
分类号
TP302
[自动化与计算机技术—计算机系统结构]
-
-
题名一种网络进程故障恢复机制的设计与实现
- 3
-
-
作者
李海山
代征
杨升春
袁由光
-
机构
哈尔滨工程大学计算机科学与技术学院
中国船舶重工集团公司第七九研究所
-
出处
《计算机应用》
CSCD
北大核心
2007年第1期242-245,共4页
-
文摘
以商用PC/Linux为平台,设计并实现了一种在C/S工作模式下服务器网络进程故障时基于检查点的卷回恢复技术,利用该技术可以保证网络通信连接在恢复前后的一致性和连续性,从而保证网络通信的不间断、不停顿,能广泛应用于永久故障恢复、集群系统、负载均衡等领域。
-
关键词
检查点
卷回恢复
网络进程
-
Keywords
checkpeinting
roll-back recovery
network processes
-
分类号
TP302.8
[自动化与计算机技术—计算机系统结构]
TP306
[自动化与计算机技术—计算机系统结构]
-
-
题名基于COTS的容错服务器及其故障恢复技术
被引量:2
- 4
-
-
作者
李海山
欧中红
杨升春
袁由光
-
机构
哈尔滨工程大学计算机科学与技术学院
武汉
-
出处
《计算机工程》
CAS
CSCD
北大核心
2007年第8期253-255,共3页
-
基金
国防预研重点基金资助项目
-
文摘
通过融合COTS技术和传统容错技术设计实现了一种高性能、高可靠的容错服务器,该服务器基于成熟的软硬件,开放性好,容错对用户透明,成本低,扩展能力强。该文详细介绍了服务器的体系结构、工作模型、容错机制及其前向故障恢复技术。
-
关键词
容错服务器
COTS
可靠性
前向恢复
-
Keywords
Fault-tolerant server
COTS
Reliability
Roll-forward fault recovery
-
分类号
TP302.8
[自动化与计算机技术—计算机系统结构]
-