bingoohuang/blog

3个9,年停机时间8小时

Opened this issue · 0 comments

X个9表示在系统1年时间的使用过程中,系统可以正常使用时间与总时间(1年)之比,我们通过下面的计算来感受下X个9在不同级别的可靠性差异。

可用度A 9的个数 年停机时间 适用产品
0.9 1个9 36.5天 可靠性无意义
0.99 2个9 3.65天 可靠性无意义
0.999 3个9 500分钟 电脑或服务器
0.9999 4个9 50 分钟 企业级设备
0.99999 5个9 5 分钟 一般电信级设备
0.999999 6个9 0.5分钟 更高要求电信级设备

计算方法:

  • 3个9:(1-99.9%)*365*24=8.76小时,表示该系统在连续运行1年时间里最多可能的业务中断时间是8.76小时。
  • 4个9:(1-99.99%)*365*24=0.876小时=52.6分钟,表示该系统在连续运行1年时间里最多可能的业务中断时间是52.6分钟。
  • 5个9:(1-99.999%)*365*24*60=5.26分钟,表示该系统在连续运行1年时间里最多可能的业务中断时间是5.26分钟。

说明:

  • 1个9和、2个9分别表示一年时间内业务可能中断的时间是36.5天、3.65天,这种级别的可靠性或许还不配使用“可靠性”这个词
  • 6个9则表示一年内业务中断时间最多是31秒,那么这个级别的可靠性并非实现不了,而是要做到从“5个9” 到“6个9”的可靠性提升的话,后者需要付出比前者几倍的成本

MTBF/MTTR/MTTF

  • MTBF(Mean Time Between Failures)即平均失效时间。 计算公式:MTBF=总运行时间/总故障次数。MTBF越长表示可靠性越高 正确工作能力越强。
  • 失效率 λ=1/MTBF,单位1FITs=10-9(1/h)
  • MTTR (Mean Time To Repair)即平均恢复时间。计算公式:MTTR=总修复时间/总故障次数。MTTR越短表示易恢复性越好。
  • MTTF(Mean Time To Failure)即平均无故障时间。计算公式:MTBF=MTTR+MTTF。可靠性越高,平均无故障时间越长。
  • 修复率(μ) repair rate 产品维修性的一种基本参数。修理时间已达到某个时刻但尚未修复的产品,在该时刻后的单位时间内完成修理的概率。

image