为什么选择ali-E-MapReduce

介绍

E-MapReduce是构建于阿里云ECS弹性虚拟机之上，利用开源大数据生态系统，包括但不限于Hadoop、Spark、Hbase，为用户提供集群、作业、数据等管理的一站式大数据处理分析服务。我们提供的软件基本都是开源的软件，会有一些性能的优化，但是绝对不引入任何不兼容的改动。具体实施可以参考：https://www.aliyun.com/product/emapreduce

Hadoop可以处理哪些场景

Hadoop as a service的概念提出由来已久，当前99.9%的公司都在使用Hadoop。目前可以处理几乎所有的场景，如：ETL、实时流式处理、实时查询、机器学习等场景。当前，在阿里云E-MapReduce中，每个场景都有一些用户在使用，后续我们也会提供一些典型的场景给您作为参考。

为什么需要上云

针对这个问题可能业界已经有了一些共识，目前大部分担心数据安全的问题。阿里云是一家云计算、大数据的提供商，我们保证不碰用户的任何数据，保证您的数据不会丢失、不泄漏。
从成本上，我们从几个方面考虑

线下运维成本高，主要涉及到硬件的维护，包括磁盘的损坏维修等，软件版本的更新，一些漏洞补丁的更新等。在云端，您不需要考虑这些事情。
线下机器跟业务之间的不匹配，如果业务发展太快，采购一般很难跟上，跟上了机器基本很长时间处于空闲状态。特别是游戏、互联网之类的公司，往往业务都有波峰、波谷，自建很难满足此类的需求，最后肯定会有大量的机器被闲置或者利用率底下。在云端，资源基本可以动态伸缩，可以跟着业务的压力申请特定的机器，极大节约成本。
线下需要培养每个专业软件的人才，对一些公司很难有大的专业团队支撑大数据专业软件。在云端一般会有专业的技术团队支持的。用户遇到一些棘手的问题，可以第一时间找我们的专家团队解决。我们也会开发出一些诊断的工具，帮您诊断集群、job的性能。

您也会节约大量的精力，把精力投入在您的业务上。从社会发展来看，社会分工会不断精细化，专业人的人干专业的事情。

虚拟机的性能、稳定性

目前在Aliyun已经有数以万计的用户在运行任务，很多公司一开始就在Aliyun上创业的。Aliyun的ECS都有性能、稳定性保障的。业界也有很多的评测报告，可以看下。如果实在担心，您可以亲自测试下。

不建议用户购买ECS搭建Hadoop，应该直接使用E-MapReduce

我们从几个方面考虑，

E-MapReduce有一套管控平台，目前页面有启动集群、增加节点、任务编排、任务失败报警等功能。后续会有更多的功能呈现。
帮助您运维Hadoop集群，出现任何问题，我们都可以帮助您解决。
有灵活的计费方案，例如：按照小时计划，也可以包年包月。
跟Aliyun其它的产品高度集成起来，我们提供lib，EMR可以处理OSS(分布式对象存储)、RDS(数据库)中的数据，消费LogService、ONS等消息中间件的消息。
针对大数据场景有特别的优化，如：带宽等。
阿里HADOOP发行版，有众多性能上的优化。
输出阿里的技术能力，专家团队支持，如：HADOOP技术团队、JVM技术团队、Hbase技术团队、JStorm技术团队等，您遇到的几乎任何问题，我们应该已经遇到过了。
有现成的一些解决方案，知识库，会提供给您参考及学习。

我的业务比较复杂，上云很麻烦

一些客户先前在线下有Hadoop集群，上云看起来不是那么简单。比如：数据怎么上云，怎么做到无缝迁移不影响业务。您可以联系我们，我们会有专业的同学与您一起做解决方案，直到您的业务上云、稳定运行为止。

如果您有任何的问题，您可以联系我们。

时间： 2024-11-08 17:26:34

为什么选择ali-E-MapReduce

介绍

Hadoop可以处理哪些场景

为什么需要上云

虚拟机的性能、稳定性

不建议用户购买ECS搭建Hadoop，应该直接使用E-MapReduce

我的业务比较复杂，上云很麻烦

为什么选择ali-E-MapReduce的相关文章

快速理解MapReduce

客户端MapReduce提交到YARN过程（上）

如何利用mapreduce访问hbase数据

如何利用mapreduce批量读写hbase数据

用于简化MapReduce编程的Java库Apache Crunch简介

C#中实现MapReduce方法

Mapreduce实现矩阵乘法的算法思路

MapReduce实现矩阵乘法：实现代码

MapReduce实现排序功能

MapReduce job在JobTracker初始化的源码级分析