10 10年的教训亚马逊网络服务

| | 评论( )

AWS的时代是Amazon S3的发射3月14日,2006年,现在几乎十年前。回顾过去的十年中,有成百上千的教训我们已经学习过的建造和运营服务,需要安全、可靠的、可伸缩的、可预测的性能以尽可能低的成本。鉴于AWS的先驱建造和运营这些服务全球,这些经验是至关重要的我们的业务。正如我们以前说过很多次,”没有压缩算法经验。”每月超过一百万活跃用户,他反过来可能数亿服务自己的客户,没有缺少机会能获得更多的经验,或许没有更好的环境持续改进我们服务客户的方式。.

我有了一些经验与大家分享,希望他们也可能对你的使用。.

1。构建可发展的系统

几乎从第一天开始,我们知道我们构建的软件不会一年后将运行的软件。期望是每个订单或两级的,我们需要重新审视和修改架构,以确保我们可以解决的问题的规模。.

但是我们不能采用老式的方法通过维护停机升级系统,在世界各地的许多企业依靠我们的平台为24/7的可用性。我们需要建立这样一个体系结构,我们可以引入新的软件组件没有服务。马文Theimer,亚马逊杰出工程师,曾经开玩笑地说,Amazon S3的进化最好被描述为开始作为一个单独的塞斯纳飞机引擎,但随着时间的推移,飞机被升级到737,然后一群747年代,一直到大舰队的空客380年代现在。同时,我们在空中加油和移动客户从平面到平面甚至没有意识到这一点。.

2。期待意想不到的

失败是给定的,一切都将随着时间的推移最终失败:从路由器到硬盘,从操作系统内存单元损坏TCP数据包,从瞬态错误到永久的失败。这是一个给定的,不管你是使用高质量的硬件或最低成本组件。.

大规模这就变成了一个更加重要的一课:例如,当S3处理数万亿和数万亿存储事务,任何即使是最轻微的误差概率将成为现实。许多失败的场景可以事先预期,但更多的在设计和建造时是未知的。.

我们需要拥抱失败的构建系统自然发生,即使我们不知道失败的可能。系统需要保持运行,即使“房子着火。“重要的是能够管理,影响而不需要把整个系统。我们必威体育精装版应用官网教育管理的基本技能失败发生的爆炸半径,这样可以保持系统的整体健康。.

3.原语不是框架

很快,我们开始意识到客户想使用我们的服务的方式是一项正在进行中的工作。当顾客离开了约束,旧世界的硬件和数据中心,他们开始必威体育精装版应用官网系统与新的和有趣的使用模式,没有人曾经见过的。因此,我们需要ultra-agile确保迎合客户的需求。.

我们提供的是最重要的一个机制为客户提供原语和工具的集合,在那里他们可以选择他们喜欢的方式参与到AWS云,而不是只提供一个框架,他们被迫使用,其中包括一切,厨房的水槽。这种方法使我们的客户成为如此成功,甚至后世AWS服务使用完全相同的原始服务我们的客户已经习惯了。.

同样重要的是意识到很难预测特定的优先级是什么为你的客户,直到他们的服务在他们的手中,实际上开始构建。这就是为什么我们提供新的服务通常最小功能集,允许我们的客户帮助推动路线图扩展服务的新特性。.

4所示。自动化是关键

必威体育精装版应用官网ing软件服务需要从构建软件操作是完全不同的,需要运往客户。管理系统需要一个非常不同的心态来确保满足可靠性、性能和可伸缩性的期望我们的客户。.

实现这一目标的关键机制是自动化管理尽可能消除容易出错,手动操作。要做到这一点,我们需要构建管理api,控制操作的关键功能。AWS帮助其客户也这样做。通过将您的应用程序分解为基本构建块,每个都有一个管理API,您可以应用自动化大规模规则保持可靠的和可预测的性能。一个好的试金石,如果你需要SSH服务器或一个实例,你还有更多的自动化。.

5。api是永远

这是一个教训,我们已经从我们的经验与亚马逊的零售,但它对AWS中脱颖而出的业务变得更加重要。一旦客户开始构建自己的应用程序和系统使用我们的api,改变这些api变得不可能,因为我们会影响我们客户的业务操作,如果我们将这样做。我们知道设计api是一个非常重要的任务,我们只有一个机会。.

6。知道你的资源使用情况

当建立一个金融服务模型来确定适当的充电模式,一定要有良好的数据服务和运营的成本,尤其是对运行一个高容量,低利润的业务。AWS需要对我们的成本非常有意识的作为服务提供者,这样我们可以提供我们的服务客户和识别领域我们可以进一步提高业务运营效率,以降低成本,然后提供这些储蓄的形式回到我们的客户更低的价格。.

一个例子在早期,我们不知道某些服务所需的资源使用模式是与S3:我们假设存储和带宽资源我们应该收费;运行一段时间后,我们意识到请求的数量是一个同等重要的资源。如果客户有很多的小文件,存储和带宽金额不多,即使他们正在数以百万计的请求。我们不得不调整我们的模型考虑到资源使用的所有维度,AWS可能是一个可持续的业务。.

7所示。构建安全的

保护你的客户应该是你的首要任务,当然,它也一直在AWS……从操作的角度以及工具和机制;它将永远是我们的第一个投资区域。.

我们学到了迅速的一个方法是建立安全服务,需要集成安全的服务设计的开始。的安全团队不是一群验证后建造的东西。他们必须合作伙伴在第一天来确保安全基本上是坚如磐石的。没有妥协时安全。.

8。加密是一等公民

加密是一个关键机制为客户,以确保他们完全控制谁有权访问他们的数据。十年前,加密的工具和服务是难以使用,直到几年操作,我们学习了如何最好的加密集成到我们的服务。.

它开始通过提供服务器端加密在S3中合规的用例。如果您将检查任何磁盘在我们的数据中心中,所有的数据访问。但是亚马逊推出CloudHSM(硬件安全模型),后来亚马逊密钥管理服务,客户可以使用自己的密钥进行加密,这消除了AWS需要管理自己的钥匙。.

有一段时间了,支持加密集成设计阶段的每一个新的服务。例如,在亚马逊的红移,每个数据块的默认加密的随机密钥和收集这些随机密钥加密主密钥。主键可以由客户提供,确保他们是唯一可以解密并获得他们的关键业务数据或个人可识别信息。.

加密继续为我们的业务是一个高优先级。我们将继续使它更容易为客户使用加密,这样他们就可以更好的保护自己和他们的客户。.

9。网络的重要性

AWS来支持许多不同的工作负载;从大量事务处理到大规模视频转码,从高性能并行计算大型网站流量。每一个工作负载时,网络具有独特的要求。.

AWS已经必威体育精装版应用官网ed独特技能创新数据中心布局和操作,这样我们可以灵活的网络基础设施,可以适应满足我们客户的工作负载,不管他们可能。我们学会了随着时间的推移,我们不应该害怕必威体育精装版应用官网自己的硬件解决方案,以确保我们的客户能够实现他们的目标。这使我们能够满足我们的非常具体的要求,比如互相孤立AWS用户在网络上实现安全的最高水平。.

另一个成功的例子AWS-designed网络硬件和软件使我们能够进一步提高性能为我们的客户在解决虚拟化税从虚拟机网络访问。因为网络访问共享资源,客户之前网络上可能经历严重抖动。必威体育精装版应用官网ing网卡支持单一根IO虚拟化允许我们给每个VM自己的硬件虚拟网卡。这降低了延迟超过2 x和交付超过10 x改善延迟网络上的可变性。.

10。没有守门

AWS的开发团队已经完成了许多服务和功能来创建一个非常广泛而深入的平台为我们的客户。但AWS远超过我们内部构建的服务:一个非常丰富的服务由我们的合作伙伴生态系统存在,扩展了平台成许多新的方向。.

例如,我们喜欢条纹有合作伙伴提供支付服务为什么Twilio使电话可编程在AWS上。我们的许多客户也在建立平台本身的AWS服务特定垂直需求:飞利浦正在建设他们Healthsuite数字医疗数据管理平台,Ohpen建造了一个零售银行业务平台在AWS,鹰基因组学已经建立了基因组学处理平台,和许多更多。至关重要的是,没有门卫AWS平台,告诉我们的合作伙伴,他们能做什么和不能做什么。“没有守门”释放许多意想不到的创新过程和开门发明,这肯定会跟进。.

我期待我们学习-和AWS客户完成在接下来的10年。记住,它仍然是第一天。...

评论

博客评论的Disqus