Amazon推出基于Hadoop的MapReduce

对于如何将流行的Apache HadoopMapReduce框架运行于AmazonEC2之上，老早之前就已经有教程了。今天Amazon通过Amazon Elastic MapReduce对其提供了官方支持，不断改善自身。从其产品页面可看到：

Amazon Elastic MapReduce自动地在Amazon EC2实例上驱动一个MapReduce框架的Hadoop实现，将任务流中的数据分解为更小的块以用于并行处理(“map”函数)，并最终将处理后的数据重新组合在一起成为最后结果(“reduce”函数)。Amazon S3作为被分析的数据源，并作为最终结果输出的目的地。

Amazon Elastic MapReduce的价格是在现有EC2的收费之上的15%比率。其FAQ上有一个关于价格和使用的完整列表。AWS的官方博客也提供了报道：

...Elastic MapReduce的处理是围绕着任务流这一概念为中心来开展的。每个任务流包含一步或者多步。第一步从Amazon S3输入一定的数据，再将其分配给指定数量的运行Hadoop的EC2实例(如果需要的话，驱动这一实例)，完成所有的工作，再将结果写回S3。每个步骤必须参考应用特定的“mapper”和/或“reducer”代码(Java JARS或是通过流模型使用的脚本代码)。我们同时还包含进了集合包，对一系列诸如和，最小，最大，历史图以及计数等等的公共操作提供了内置的支持。在你开始写代码之前就已经有很多事情搞定了！

我们提供了三种不同的访问Elaastc MapReduce的途径。你可以通过Elastic MapReduce API获取完全的控制，你也可以使用Elastic MapRedue命令行工具，或者在AWS管理控制台的Elastic MapReduce标签页通过点击进行操作！让我们分别来看每一个...

ZDNet的Dana Gardner 推测这暗示了Amazone将在商业智能市场推出新的产品。

时间： 2024-09-20 16:51:04

Amazon推出基于Hadoop的MapReduce

Amazon推出基于Hadoop的MapReduce的相关文章

使用python构建基于hadoop的mapreduce日志分析平台

基于Hadoop MapReduce的分布式数据流聚类算法研究

基于Hadoop系统的MapReduce数据流优化

Hadoop新MapReduce框架Yarn详解

基于hadoop的hmm模型实现

基于Hadoop大数据分析应用场景与实战

基于Hadoop版本Tachyon：吞吐量要比HDFS高300多倍

基于Hadoop数据仓库Hive1.2部署及使用

基于Hadoop的数据仓库Hive基础知识