机会在建模复杂的分布式系统

| | 评论( )

建模系统一直是computerscientist的工具包的一部分。我们经常尝试恢复系统通过简单的排队模型从而吞吐量和延迟问题,然后使用这些结果predictresource使用和分配。可以是自信thatsuch一个简单的模型可以准确反映现实?与增加complexityof基于大规模分布式系统自主服务模型thesetechniques变得更不可靠。。

我想使用建模技术不仅仅关注achievingsimple sla。我想了解使用特定算法的成本影响于特定的节点和网络配置,尤其是undercertain失败场景。我会用这样一个经济模型在designphase服务或应用程序,评估不同的算法forachieving基于成本的一致性和可用性的影响。例如,如果一个服务需要达到一种持久性的状态能够生存completedatacenter故障和服务需要访问客户tendatacenters与一定的SLA,有一系列的算法andconfiguration选择。。

在这些情况下,系统设计往往集中在试图achievethe性能和可用性sla第一,这本身就是difficultenough。不同的算法和配置选择的经济通常会被认为是次要的。然而,当您aredetermining系统的成本,你必须考虑的选择运算符复制单位结合存储节点的密度,存储系统的可靠性,阶跃函数成本ofinter-datacenter网络、数据缓存的位置和可靠性。成一个基本成本加在aquorum-based每存储操作成本是不同的系统相比,概率系统。持有当访客要待好几天时更是如此的成本包括在这个建模从cachenode恢复,存储节点或数据中心故障。。

很多人认为,把大量的廉价的硬件问题是这些问题的答案,但我们的经验是,当takingcomplex multi-datacenter配置考虑,答案是lessobvious。作为我们建立新的服务,我们需要更好的模型,可以处理thesevery复杂、多变量情况以确保我们建立正确的servicesat正确的成本。在亚马逊,我们很幸运,有很多数据,允许我们在这些问题上取得进展。。

我有职位开放经验丰富的工程师和科学家们想被复杂的分布式系统建模的问题。资格退运工作这些事情我将寻找:

  • 你有一个非常可靠的分布式系统andnetworking的理解
  • 你知道如何做数据分析,真正understandstatistics
  • 你了解大规模collectionarchitectures监测和数据
  • 你熟悉的当前状态的艺术在分布式系统建模
  • 你是一个经验丰富的工程师buildingcomplex系统的记录
  • 如果你没有经验,你可能有一个先进的degreewith证明专长建模复杂的分布式系统和与大型软件项目(demonstratedinvolvement e。g。开源)。。
  • 你有能力有效地沟通resultsof数据分析和建模
  • 你住在或愿意搬到大西雅图地区

如果你对这个工作感兴趣,觉得你有资格,将意味着电子邮件与你的简历。。

评论

博客评论的Disqus