期刊文献+
共找到738篇文章
< 1 2 37 >
每页显示 20 50 100
基于双条带编码结构的低修复成本分组修复码
1
作者 余洪州 杨洋 +3 位作者 唐金华 黄鹃 唐聃 蔡红亮 《计算机应用研究》 北大核心 2025年第9期2772-2778,共7页
针对分布式存储系统中纠删码容错技术因修复成本过高制约其实际应用的问题,提出一种具有分组修复性质的双条带分组修复码模型(DSGRC)。该模型创新性地设计了基于双条带编码结构的分组修复架构,通过双条带混合编码策略构建全局与局部校... 针对分布式存储系统中纠删码容错技术因修复成本过高制约其实际应用的问题,提出一种具有分组修复性质的双条带分组修复码模型(DSGRC)。该模型创新性地设计了基于双条带编码结构的分组修复架构,通过双条带混合编码策略构建全局与局部校验块的多级冗余结构,在确保数据可靠性的前提下优化故障修复过程。实验结果表明,相较于传统RS码、RGRC、TLRC、SLRC以及CSLRC等编码方案,DSGRC仅需增加少量的存储开销,即可实现将单节点故障修复时间降低10.4%~67.7%、多节点故障修复时间缩减5.4%~51.1%。 展开更多
关键词 分布式存储系统 低修复成本 分组修复码 数据修复
在线阅读 下载PDF
一种针对固定故障的忆阻神经网络容错方案
2
作者 程其宏 刘鹏 +2 位作者 姚廉 尤志强 武继刚 《计算机工程与科学》 北大核心 2025年第9期1691-1699,共9页
电阻式随机存取存储器RRAM以其非易失性、低延时等特性,在高效实现向量矩阵乘法运算的同时避免了大量的数据传输,因此在加速神经网络计算方面表现出巨大的潜力。然而,固定故障SAF会导致基于RRAM的神经网络的推理精度严重下降。提出了一... 电阻式随机存取存储器RRAM以其非易失性、低延时等特性,在高效实现向量矩阵乘法运算的同时避免了大量的数据传输,因此在加速神经网络计算方面表现出巨大的潜力。然而,固定故障SAF会导致基于RRAM的神经网络的推理精度严重下降。提出了一种针对SAF的容错方案,包括权重映射变化、权重范围变化和损失函数正则化等方法,以尽可能减小由SAF引入的权重偏差。通过在不同神经网络上应用图像识别任务进行综合评估,实验结果表明,所提出的容错方案能够有效恢复由SAF造成的精度损失,即使在10%SAF的条件下,平均精度损失不超过1.5%。 展开更多
关键词 忆阻器 神经网络 固定故障 容错计算
在线阅读 下载PDF
面向多样计算场景的检查点技术综述
3
作者 陈筱琳 张亚强 史宏志 《计算机应用》 北大核心 2025年第6期1922-1933,共12页
检查点技术是一种在计算系统中保存当前计算任务和系统状态的方法,可应用于系统故障恢复、作业迁移和作业抢占等诸多场景。随着技术的发展,计算场景更多元,计算规模更大,计算系统的结构层次更复杂,且计算环境更多变,这些会导致故障发生... 检查点技术是一种在计算系统中保存当前计算任务和系统状态的方法,可应用于系统故障恢复、作业迁移和作业抢占等诸多场景。随着技术的发展,计算场景更多元,计算规模更大,计算系统的结构层次更复杂,且计算环境更多变,这些会导致故障发生的概率增加。同时,平均故障间隔时间(MTBT)从[6.50 h,40.00 h]缩短至1.25 h。因此,作为典型容错手段的检查点技术显得越来越重要。首先,介绍多样计算场景的检查点技术近年来的发展概况,并基于现有技术的特点对它们进行分类;其次,回顾包括增量检查点、多级异步检查点、最优检查点间隔和基于故障感知的检查点这4个方向在内的最新研究进展,并总结检查点技术在面向多样计算场景时的发展趋势——动态化、智能化和主动化,以及该技术面临的挑战;最后,通过梳理优化检查点策略的主要思路和最新方法,帮助研究人员快速掌握检查点技术的现状和未来发展趋势。 展开更多
关键词 增量检查点 多级异步检查点 最优检查点间隔 动态检查点 基于故障感知的检查点
在线阅读 下载PDF
服务器故障注入技术综述:实现、优化与评估
4
作者 李逍 张亚强 史宏志 《计算机应用》 北大核心 2025年第S1期144-153,共10页
服务器故障注入技术通过人为引入故障,观察分析服务器组件和系统在不同故障场景下的表现,评估服务器受故障影响的具体表现,通常针对不同硬件组件的种类选择可实现、高效、准确的故障注入技术。首先,介绍故障注入技术的相关概念、实现框... 服务器故障注入技术通过人为引入故障,观察分析服务器组件和系统在不同故障场景下的表现,评估服务器受故障影响的具体表现,通常针对不同硬件组件的种类选择可实现、高效、准确的故障注入技术。首先,介绍故障注入技术的相关概念、实现框架和分类特征;其次,从3个方面对近年来服务器硬件故障注入领域的研究进行综述,包括面向计算单元和存储单元等服务器关键器部件的故障注入技术和工具,针对不同类型故障注入技术的优化方法,以及对故障注入理论的准确性研究;最后,展望服务器故障注入和可靠性评估的未来研究和发展中的挑战和机遇。 展开更多
关键词 故障注入 服务器 容错 可靠性 失效率
在线阅读 下载PDF
基于去中心化秘密分享机制的公证组跨链协议
5
作者 程澳 张抗抗 潘璇 《应用科学学报》 北大核心 2025年第5期877-892,共16页
区块链技术利用分布式账本与密码学手段为数据隐私与交易安全提供了新的解决思路,其中的公证组跨链模型应用广泛,已成为不同领域中数据交易的解决方案之一。然而中心化的公证组模型具有固有的风险,且容易受到网络波动的影响。为此,提出... 区块链技术利用分布式账本与密码学手段为数据隐私与交易安全提供了新的解决思路,其中的公证组跨链模型应用广泛,已成为不同领域中数据交易的解决方案之一。然而中心化的公证组模型具有固有的风险,且容易受到网络波动的影响。为此,提出了一种由公证人共同设计秘密的交易协议。首先改进PageRank算法,削弱公证人选择过程中的中心化程度,然后提出子秘密段表方案来优化阈值签名算法,在保持交易去中心化的同时增强了协议在网络环境波动中的鲁棒性。实验结果表明,在参与交易的公证人个数为50时,优化的节点选择算法对节点整体信誉值的均衡效果相较传统方案提升了47.3%,优化的阈值签名算法相较于标准阈值签名算法,在网络丢包率达70%的情况下,鲁棒性提升了约3倍,且其增加的时间开销和Gas成本可以忽略不计。本文提出的协议在几乎不增加交易成本的情况下,提升了交易的去中心化程度和鲁棒性,具有一定的可行性。 展开更多
关键词 跨链 公证组 去中心化 交易 抗风险
在线阅读 下载PDF
Hybrid fault tolerance in distributed in-memory storage systems
6
作者 Zheng Gong Si Wu Yinlong Xu 《中国科学技术大学学报》 北大核心 2025年第1期59-68,58,I0002,共12页
An in-memory storage system provides submillisecond latency and improves the concurrency of user applications by caching data into memory from external storage.Fault tolerance of in-memory storage systems is essential... An in-memory storage system provides submillisecond latency and improves the concurrency of user applications by caching data into memory from external storage.Fault tolerance of in-memory storage systems is essential,as the loss of cached data requires access to data from external storage,which evidently increases the response latency.Typically,replication and erasure code(EC)are two fault-tolerant schemes that pose different trade-offs between access performance and storage usage.To help make the best performance and space trade-off,we design ElasticMem,a hybrid fault-tolerant distributed in-memory storage system that supports elastic redundancy transition to dynamically change the fault-tolerant scheme.ElasticMem exploits a novel EC-oriented replication(EOR)that carefully designs the data placement of replication according to the future data layout of EC to enhance the I/O efficiency of redundancy transition.ElasticMem solves the consistency problem caused by concurrent data accesses via a lightweight table-based scheme combined with data bypassing.It detects correlated read and write requests and serves subsequent read requests with local data.We implement a prototype that realizes ElasticMem based on Memcached.Experiments show that ElasticMem remarkably reduces the time of redundancy transition,the overall latency of correlated concurrent data accesses,and the latency of single data access among them. 展开更多
关键词 in-memory storage system hybrid fault tolerance replication erasure code
在线阅读 下载PDF
基于强化学习的航天器姿态预设性能容错控制 被引量:2
7
作者 金磊 杨绍龙 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2024年第8期2404-2412,共9页
针对惯量不确定性和执行机构故障的航天器姿态控制问题,提出了一种基于强化学习的预设性能容错控制方法。采用预设性能方法设计航天器的姿态控制器,以保证控制过程的暂态响应。为在线补偿惯量不确定,在预设性能控制器的基础上引入强化... 针对惯量不确定性和执行机构故障的航天器姿态控制问题,提出了一种基于强化学习的预设性能容错控制方法。采用预设性能方法设计航天器的姿态控制器,以保证控制过程的暂态响应。为在线补偿惯量不确定,在预设性能控制器的基础上引入强化学习算法,使用评判网络近似代价函数,用于评估系统性能,同时使用动作网络产生前馈补偿控制,用于处理惯量不确定;设计自适应补偿控制,补偿执行机构故障和外扰动对航天器姿态的影响。基于Lyapunov稳定性理论证明整个闭环系统的稳定性。仿真结果表明:所提容错控制方法能够实现航天器执行机构故障情况下的稳定控制。 展开更多
关键词 强化学习 容错控制 预设性能 航天器 姿态控制
在线阅读 下载PDF
定比值系统传感器单一故障诊断与容错控制
8
作者 那文波 王伽豪 +3 位作者 高雁凤 刘志威 昝琪 王铮 《传感技术学报》 北大核心 2025年第2期256-262,共7页
针对定比值系统传感器故障信息难以提取和故障重构实时性问题,提出了基于时空特征的传感器故障诊断与容错控制方法。该方法首先通过滑动窗口思想预处理离线数据,使其在固定窗口内呈现阶段性特征;其次通过融合自注意力机制和长短期记忆网... 针对定比值系统传感器故障信息难以提取和故障重构实时性问题,提出了基于时空特征的传感器故障诊断与容错控制方法。该方法首先通过滑动窗口思想预处理离线数据,使其在固定窗口内呈现阶段性特征;其次通过融合自注意力机制和长短期记忆网络(LSTM)分别构建故障定性与定位网络、故障估计网络,以此获取传感器的故障类型、强度、位置和时间信息;最后基于故障补偿思想搭建容错控制模型,实现定比值系统传感器故障信号在线重构。实验结果表明,所提方法的诊断准确率达到97.53%,相较于传统的CNN-LSTM方法准确率提高了6.65%,验证了所提方法的有效性和准确性。 展开更多
关键词 故障诊断与容错控制 时空特征 自注意力机制 长短期记忆网络
在线阅读 下载PDF
基于非正交离散变换的物理不可克隆函数可靠性提升算法
9
作者 李诗扬 倪少杰 +2 位作者 邓丁 陈雷 林红磊 《计算机应用》 CSCD 北大核心 2024年第7期2116-2122,共7页
为了解决物理不可克隆函数(PUF)受外部环境和自身老化因素影响存在响应不稳定的问题,提出基于非正交离散(NOD)变换的PUF可靠性提升算法。首先,设计了一种重排序混淆器,将随机种子向量及PUF响应经重排序混淆器迭代处理后得到非正交混淆... 为了解决物理不可克隆函数(PUF)受外部环境和自身老化因素影响存在响应不稳定的问题,提出基于非正交离散(NOD)变换的PUF可靠性提升算法。首先,设计了一种重排序混淆器,将随机种子向量及PUF响应经重排序混淆器迭代处理后得到非正交混淆矩阵与混淆响应矩阵的内积,据此建立NOD谱,有效缓解了因PUF本身均匀性不足而产生偏向性密钥的问题;随后,通过分区编解码策略,赋予NOD谱一定的波动容错能力,将不稳定响应的影响限制在有限的范围,从而显著提高最终响应的可靠性。所提算法相较于传统基于纠错码的方法,需要的帮助数据更少。基于SRAM-XMC数据集进行实验,所提算法在对2949120组64位响应进行101次重复实验过程中平均可靠性达到99.97%,唯一性达到49.92%,均匀性达到50.61%。实验结果表明,所提算法能够在保证PUF响应均匀性与唯一性的同时有效提高可靠性。 展开更多
关键词 非正交离散变换 物理不可克隆函数 可靠性 分区编解码 唯一性 布尔函数
在线阅读 下载PDF
基于FPGA的软硬件协同纠删码编码加速方案
10
作者 杨思捷 陈俊奇 +1 位作者 王勇 李树林 《计算机工程》 CAS CSCD 北大核心 2024年第2期224-231,共8页
纠删码容错技术已广泛应用于分布式存储系统,相较于多副本容错技术能显著降低数据存储成本,并且具有更高的数据通信可靠性和安全性,但在数据存储过程中不可避免地会引入额外的计算开销并增加编码时延,导致数据写入吞吐量降低。针对该问... 纠删码容错技术已广泛应用于分布式存储系统,相较于多副本容错技术能显著降低数据存储成本,并且具有更高的数据通信可靠性和安全性,但在数据存储过程中不可避免地会引入额外的计算开销并增加编码时延,导致数据写入吞吐量降低。针对该问题,提出一种基于现场可编程门列阵(FPGA)的纠删码编码加速方案。首先,利用FPGA的高速并行计算优势对纠删码算法进行硬件加速,并实现并行处理和时序优化。然后,针对上位机与FPGA之间因传输速率和处理速率不一致造成内存中的数据溢出问题,在FPGA上拓展了片外DDR3接口用于数据缓存,提高了通信可靠性,并利用DDR3的随机存取特点实现对数据块的分片。最后,设计基于FPGA的纠删码编码硬件加速架构进行实验验证。实验结果表明,与主流Jerasure 2.0开源纠删码库相比,该方案的数据写入吞吐量提升了2.7~93.0倍,尤其对于小文件的编码写入性能提升更为显著。 展开更多
关键词 纠删码 现场可编程门阵列 硬件加速 分布式存储 模块化设计
在线阅读 下载PDF
基于LT码的分布式矩阵计算研究
11
作者 刘怡 张磊 《计算机工程》 CAS CSCD 北大核心 2024年第8期328-335,共8页
在如今大数据和机器学习应用范围不断扩大的背景下,分布式计算系统成为处理庞大数据的必要工具。对于具有一定规模的计算集群,其性能会不可避免地受到系统噪声的影响,应考虑在分布式计算系统中借助编码技术来增强系统的鲁棒性。现有应... 在如今大数据和机器学习应用范围不断扩大的背景下,分布式计算系统成为处理庞大数据的必要工具。对于具有一定规模的计算集群,其性能会不可避免地受到系统噪声的影响,应考虑在分布式计算系统中借助编码技术来增强系统的鲁棒性。现有应用于分布式矩阵计算的编码方案多为固定速率编码,无法适应节点数量动态变化的实际情况。同时,由于部分任务有截止期限制,应在保证任务顺利完成的前提下尽可能地减少平均开销从而降低时延。针对上述问题,提出将LT码应用于雾计算场景下的分布式矩阵计算,设计Remo2算法。依托LT码的无速率特性自适应信道状态变化,通过合适的度分布函数设计以及双向切割、因子化度数的方法达到降低时延、增强分布式计算系统鲁棒性的预期效果。令k_(1)为A矩阵被切分后的子矩阵行值,k_(2)为B矩阵被切分后的子矩阵列值,实验结果表明,在k_(1)值固定的前置条件下,与FLT码及BDC-LT算法相比,Remo2算法的平均开销相对于前者稳定降低了33.3%,相对于后者减少了7.7%的冗余。此外,当k_(1)k_(2)大小的码长固定时,k_(1)、k_(2)的离散化程度越低,即limk_(1)-k_(2)→0,会带来更小的平均开销。 展开更多
关键词 LT码 分布式矩阵计算 双向切割 因式化 平均开销
在线阅读 下载PDF
可重构硬件芯片级故障定位与自主修复方法 被引量:26
12
作者 郝国锋 王友仁 +2 位作者 张砦 袁鹏 孔德明 《电子学报》 EI CAS CSCD 北大核心 2012年第2期384-388,共5页
外部集中控制的可重构硬件容错系统,其重构控制算法复杂、重构时间开销大,且存在单点失效问题.本文研究芯片级分布式在线自主容错技术,提出了能够实现芯片级自修复的新型可重构硬件细胞阵列结构,阐述了互连资源的在线故障定位和自主修... 外部集中控制的可重构硬件容错系统,其重构控制算法复杂、重构时间开销大,且存在单点失效问题.本文研究芯片级分布式在线自主容错技术,提出了能够实现芯片级自修复的新型可重构硬件细胞阵列结构,阐述了互连资源的在线故障定位和自主修复方法.设计了功能细胞电路和容错开关块电路,采用分段定位法检测互连资源中多路器故障和连线开路故障,通过重配置布线和线移位操作分别实现多路器与连线故障自修复.以4位串并乘法器电路为例进行实验验证,分析了容错设计的硬件开销与时间开销,实验结果表明新方案的容错时间短、资源利用率高. 展开更多
关键词 可重构硬件 芯片级容错 分布式控制 故障定位 自主修复
在线阅读 下载PDF
“二乘二取二”冗余系统的可靠性和安全性分析 被引量:32
13
作者 张本宏 陆阳 +1 位作者 韩江洪 魏臻 《系统仿真学报》 CAS CSCD 北大核心 2009年第1期256-261,共6页
提出了"二乘二取二"冗余系统两种不同工作策略,利用马尔柯夫过程研究了不同策略的可靠度和安全度,通过MATLAB的仿真计算,分析了故障检测覆盖率和修复率对可靠度和安全度的影响。与三模冗余和双机热备系统的对比研究表明,策略... 提出了"二乘二取二"冗余系统两种不同工作策略,利用马尔柯夫过程研究了不同策略的可靠度和安全度,通过MATLAB的仿真计算,分析了故障检测覆盖率和修复率对可靠度和安全度的影响。与三模冗余和双机热备系统的对比研究表明,策略1的安全度最大,可靠度最小;策略2的可靠度最大,安全度在修复率为0.9时大于三模冗余和双机热备系统,在修复率为0时略低于三模冗余系统,而高于双机热备系统。 展开更多
关键词 表决系统 可靠性 安全性 故障安全 马尔可夫模型
在线阅读 下载PDF
故障注入方法与工具的研究现状 被引量:52
14
作者 孙峻朝 王建莹 杨孝宗 《宇航学报》 EI CAS CSCD 北大核心 2001年第1期99-104,共6页
本文将故障注入技术分为基于模拟的故障注入和基于物理的故障注入两类 ,并从应用方法和工具结构两方面介绍了该项技术的研究现状。
关键词 故障注入 故障模型 客错计算机系统 可信性评价 应用方法 工具结构
在线阅读 下载PDF
可重构硬件内建自测试与容错机制研究 被引量:20
15
作者 郝国锋 王友仁 +1 位作者 张砦 孙川 《仪器仪表学报》 EI CAS CSCD 北大核心 2011年第4期856-862,共7页
传统可重构硬件自测试方法复杂,容错时资源利用率低,且往往需要额外的软件配合处理器来实现。为此,设计了一种具有自测试与自主容错能力的新型可重构硬件结构。对于故障自测试,提出了能在线执行的自主循环测试方法;对于硬件容错,提出了... 传统可重构硬件自测试方法复杂,容错时资源利用率低,且往往需要额外的软件配合处理器来实现。为此,设计了一种具有自测试与自主容错能力的新型可重构硬件结构。对于故障自测试,提出了能在线执行的自主循环测试方法;对于硬件容错,提出了分层自主容错机制:在功能细胞单元内测试到逻辑故障时,先用功能细胞单元内部的空闲基本逻辑单元替代故障基本逻辑单元;当没有空闲基本逻辑单元时,则将整个故障功能细胞单元的功能重配置到距其最近的空闲功能细胞单元中,实现两层容错。以6×6并行乘法器为例,验证了新型可重构阵列能够降低容错时间复杂度并提高冗余资源利用率。 展开更多
关键词 数字电子系统 可重构硬件 细胞单元阵列 自主容错 内建自测试 并行乘法器
在线阅读 下载PDF
区块链共识机制综述 被引量:47
16
作者 谭敏生 杨杰 +2 位作者 丁琳 李行健 夏石莹 《计算机工程》 CAS CSCD 北大核心 2020年第12期1-11,共11页
区块链能够有效融合物联网、5G、大数据和人工智能等技术,在新型基础设施建设中具有重要作用。共识机制作为区块链的核心技术,能够保障区块链数据库的一致性和正确性,从而决定区块链的安全性、扩展性、吞吐量等相关性能。根据区块链共... 区块链能够有效融合物联网、5G、大数据和人工智能等技术,在新型基础设施建设中具有重要作用。共识机制作为区块链的核心技术,能够保障区块链数据库的一致性和正确性,从而决定区块链的安全性、扩展性、吞吐量等相关性能。根据区块链共识机制的技术路线,将其细分为3类单一共识机制和6类混合共识机制。从原理实现角度,系统描述共识机制的理论技术,归纳节点达成一致所需的运算操作并评价共识机制的优缺点。从工程应用角度,具体分析共识机制的应用情况,介绍区块链项目并对比共识机制的关键性能。针对现有共识机制研究中存在的能耗与效率问题给出相应的解决方案,并对其奖惩制度、网络分片与存储分片技术等下一步研究方向进行展望。 展开更多
关键词 区块链 共识机制 拜占庭容错 分布式系统 一致性
在线阅读 下载PDF
高可靠三余度数字式作动器控制器设计与实现 被引量:15
17
作者 靳红涛 焦宗夏 +1 位作者 王少萍 韩鹏霄 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2006年第5期548-552,共5页
对作动器控制器进行了三余度配置,介绍了冗余作动器控制器的结构、余度配置以及余度管理.结合数字式伺服作动系统的结构特点,提出了一种借助通道内控制器互监测实现通道内自监测的方法.借助比较监控、传感器自监控、通道内自监控等其它... 对作动器控制器进行了三余度配置,介绍了冗余作动器控制器的结构、余度配置以及余度管理.结合数字式伺服作动系统的结构特点,提出了一种借助通道内控制器互监测实现通道内自监测的方法.借助比较监控、传感器自监控、通道内自监控等其它监控方法,对三余度数字式系统有效地实现了二次故障工作、三次故障安全.和其他冗余方案相比结构更简单、基本可靠性更高.基于高速数字处理器和CAN(ControllerAreaNetwork)总线开发了三余度数字式伺服作动器控制器.基于马尔可夫模型,考虑系统一次故障覆盖率、二次故障覆盖率对控制器可靠性进行了分析,该三余度控制器具有很高的可靠性. 展开更多
关键词 余度 可靠性 数字控制系统 CCDL 马尔可夫模型
在线阅读 下载PDF
基于大规模严格机理模型的数据校正 被引量:8
18
作者 张正江 祝铃钰 +2 位作者 邵之江 陈曦 钱积新 《高校化学工程学报》 EI CAS CSCD 北大核心 2008年第5期877-882,共6页
实时优化要求准确的过程模型与过程数据,然而通过仪表测量获取过程数据不仅存在随机误差而且有时还存在过失误差,直接影响实时优化的准确性。根据流程工业过程系统的特点,提出了基于大规模严格机理模型的数据校正,构造了随机误差与过失... 实时优化要求准确的过程模型与过程数据,然而通过仪表测量获取过程数据不仅存在随机误差而且有时还存在过失误差,直接影响实时优化的准确性。根据流程工业过程系统的特点,提出了基于大规模严格机理模型的数据校正,构造了随机误差与过失误差的隶属函数并根据它们的隶属度大小来诊断过失误差。当测量信息丰富时,可同时对进料的流量、组分及压力等多种测量数据同时进行数据校正。将基于大规模严格机理模型的数据校正应用于大规模乙烯分离系统进行仿真模拟,测量值仅存在随机误差时,经过数据校正后,满足严格机理模型。测量值引入过失误差时,可准确地诊断出过失误差。模拟计算结果证实了基于大规模严格机理模型的数据校正与过失误差诊断方法的有效性。 展开更多
关键词 严格机理模型 开放式方程 数据校正 过失误差诊断 隶属函数
在线阅读 下载PDF
高可用双机容错服务器的研究与设计 被引量:15
19
作者 于斌 刘宏伟 +1 位作者 崔刚 杨孝宗 《计算机工程与设计》 CSCD 北大核心 2006年第9期1524-1525,1570,共3页
为了保证服务器对外服务的持续性,提高服务器的可靠性,双机容错服务器是一种较好的解决方案。通过引入集群技术设计了高可用双机容错服务器的硬件容错体系,使用自检和心跳等多种软件容错技术实现了运行于该容错服务器之上的容错管理系统... 为了保证服务器对外服务的持续性,提高服务器的可靠性,双机容错服务器是一种较好的解决方案。通过引入集群技术设计了高可用双机容错服务器的硬件容错体系,使用自检和心跳等多种软件容错技术实现了运行于该容错服务器之上的容错管理系统,最后对该容错系统给出了可用性分析。 展开更多
关键词 双机容错 可用性 心跳 集群 MARKOV模型
在线阅读 下载PDF
龙芯1号处理器的故障注入方法与软错误敏感性分析 被引量:31
20
作者 黄海林 唐志敏 许彤 《计算机研究与发展》 EI CSCD 北大核心 2006年第10期1820-1827,共8页
在纳米级制造工艺下以及在航天等特殊应用场合中,可靠性将是处理器设计中的一个重要考虑因素.以龙芯1号处理器为研究对象,探讨了处理器可靠性设计中的故障注入方法,并提出了一种同时运行两个处理器RTL模型的故障注入与分析方法,可以实... 在纳米级制造工艺下以及在航天等特殊应用场合中,可靠性将是处理器设计中的一个重要考虑因素.以龙芯1号处理器为研究对象,探讨了处理器可靠性设计中的故障注入方法,并提出了一种同时运行两个处理器RTL模型的故障注入与分析方法,可以实现连续快速的处理器仿真故障注入.在此基础上,进一步分析了龙芯1号处理器的软错误敏感性,通过快速注入大约30万个软错误,保证了分析结果具有较好的统计意义,可以有效指导后续的容错与可靠性设计. 展开更多
关键词 容错处理器 可靠性设计 故障注入 软错误
在线阅读 下载PDF
上一页 1 2 37 下一页 到第
使用帮助 返回顶部