“一切都失败了,所有的时间。”谦卑的计算机科学家曾经有人说。所有我们今天所拥有的资源,这是我们更容易实现容错比它在几十年前,当电脑开始在关键的系统,如医疗保健,空中交通管制和金融市场体系中发挥作用。在早期的日子里,想法是使用硬件方式来实现容错。但直到九十年代中期,软件容错变得更容易接受。

串联的电脑是在建设这些容错,关键任务系统的先驱之一。他们用一种无共享多CPU的方法。这是其中每个CPU有它自己的内存和IO总线,并全部通过复制共享总线连接,在其上独立OS实例可以通信并在锁定步骤中运行。在七十年代末和八十年代初,这是本领域的容错深思熟虑的状态。

吉姆·格雷,概念的爸爸喜欢交易,曾为串联软件容错。为了能够建立更好的系统,他在解构的那种失败串联客户正在经历深刻。他在“为什么计算机停止”报告中写到了他的发现。对于一个非常长期的,这将是唯一可用的研究在生产计算机系统的可靠性。

作为重要的研究,本文还涵盖了“用什么办法来完成。”吉姆,首次,介绍类似于进程对和交易作为软件容错的基础概念。这是容错分布式系统中的基本文件之一,我要去享受阅读本周末。我希望你们也会。

为什么计算机停止,并可以做什么呢?”吉姆·格雷,1985年6月,串联技术报告85.7

评论

博客评论由Disqus