开车的成本大数据分析

| | 评论( )

Amazon Elastic MapReduce(EMR)团队今天宣布无缝地使用的能力Amazon EC2现货实例与他们的服务,大大降低云中的数据分析的成本。我们的许多大数据客户已经看到他们的AWS比尔上个月大幅下降时的带宽成本美元降至0。00。现在,鉴于历史客户使用现场实例看到成本节约超过66%需实例价格,亚马逊EMR客户将实现更大的节约成本。。

分析大量的数据是至关重要的为公司将客户洞察他们的业务,包括建筑推荐引擎或优化客户的目标。。Hadoop正迅速成为首选的这种类型的大规模数据分析的工具。但是,Hadoop用户经常浪费重要知识的带宽管理和运行Hadoop集群工作而不是专注于创造价值通过分析。。Amazon Elastic MapReduce带走了许多这样的垃圾通过提供托管Hadoop框架,使企业、研究人员、数据分析师,必威体育精装版应用官网人轻松高效地旋转起来可调整大小的集群的分布式处理大型数据集。。

一个有趣的观察是,数据分析不再是大型企业的范围。每一个年轻的业务今天推出知道他们必须从一开始就集成了数据收集和分析。为了在当今的市场竞争,这些公司必须有一个深刻的理解顾客的行为,使他们不断提高他们如何为他们服务。启动一个业务与最小可行产品然后快速迭代方向,客户引导他们成为成功的标准方法。然而,这不能没有高效、可扩展的数据分析。许多这样的初创公司正在使用Hadoop数据处理和Amazon Elastic MapReduce的理想环境:它提供了即时可伸缩性和让他们专注于分析而EMR运行各种Hadoop组件处理的麻烦。考虑到这些新公司的最初预算紧缩的情况下,降低整体成本的分析使用现货实例是一个巨大的好处。。

有三个类别的实例在一个Amazon EMR集群:1)主实例组其中包含的Hadoop Master节点安排的各种任务,2)核心实例组它包含实例存储数据进行分析和运行map和reduce任务,和3)任务实例组只有运行map和reduce任务。对于每个实例组,您可以决定使用随需应变的实例(可能从你保留实例池)或现货实例。如果你选择使用现货实例提供投标价格你愿意支付每个实例组。如果当前的现货价格低于投标价格,实例组将会启动。现货实例的实例组织适当的依赖于用例。例如,对于关键数据工作负载可以决定只运行任务组现场实例,按需核心小组,而如果你是执行应用程序测试你可以决定使用现货实例运行所有实例组。。

如果你想要一个简单介绍如何开始使用混合现货实例与按需实例在亚马逊EMR集群中,看这个开始视频。可以发现更多细节现货实例部分Amazon Elastic MapReduce必威体育精装版应用官网er指南。上的帖子AWS必威体育精装版应用官网博客也有一些更多的背景。。

评论

博客评论的Disqus