Cloudera Hadoop:CCAH、CCA、CCP

关于CCAH、CCA、CCP
CCAH Administrator Hadoop管理员认证
认证准备建议:Hadoop管理员培训
考试形式:90分钟;70%通过;60道多项选择题(会提示是单选or多选)

CCA Spark and Hadoop Developer开发者认证
认证准备建议:Spark and Hadoop开发者培训
考试形式:120分钟;70%通过;解决10~12基于CDH5机群上需通过实际操作的问题

CCP Data Engineer数据工程师认证
认证准备建议:Spark and Hadoop开发者培训;设计及构建大数据应用;考生需对Hadoop有深入了解、具有实际使用大数据工具的经验、以及具备解决实际数据工程问题的专家级水平
考试形式:4小时;提供一个大数据集供使用、7个高性能节点组成的CDH5机群;解决大数据用户可能碰到的5-8个实际问题

CCP Data Scientist数据科学家认证
数据科学家认证是Cloudera所提供的技术认证里的最高级别,需要考生在365天内通过DS700、DS701、DS702这三门考试,不规定顺序
认证准备建议:Spark and Hadoop开发者培训;数据科学家培训;数据科学家问题挑战工具箱;考生需熟悉使用大数据工具,深入了解数据科学,并具备解决实际数据科学问题的专家级水平
考试形式:8小时;提供数据集、提供机群;解决实际数据科学挑战问题(对大数据的描述及推理统计能力;对大数据的高级分析能力;大规模数据集上的机器学习能力)

CCDH(开发者认证)&CCSHB(Hbase)已经退出认证体系了,目前这两门课与数据分析一样,只有课程没有考试。
目前中国区数据工程师与数据科学家没有讲师,想参加这两门课程的学员只能通过网络的方式参加由Cloudera总部进行的在线培训(有时差)。附上管理员与开发者上海开课时间:管理员5月23-26日;开发者6月27-30日。

时间: 2024-10-27 23:54:31

Cloudera Hadoop:CCAH、CCA、CCP的相关文章

大数据框架对比:Hadoop、Storm、Samza、Spark和Flink

简介 大数据是收集.整理.处理大容量数据集,并从中获得见解所需的非传统战略和技术的总称.虽然处理数据所需的计算能力或存储容量早已超过一台计算机的上限,但这种计算类型的普遍性.规模,以及价值在最近几年才经历了大规模扩展. 在之前的文章中,我们曾经介绍过有关大数据系统的常规概念.处理过程,以及各种专门术语,本文将介绍大数据系统一个最基本的组件:处理框架.处理框架负责对系统中的数据进行计算,例如处理从非易失存储中读取的数据,或处理刚刚摄入到系统中的数据.数据的计算则是指从大量单一数据点中提取信息和见解

Hadoop:稳定、高效、灵活的大数据处理平台

如果你和别人谈论大数据,那么你们很快就会把话题转到那只黄色的大象身上--Hadoop(它的标志是一只黄色大象).这个开源的软件平台是由Apache基金会发起的,它的价值在于能够简便且高效地处理超大型数据. 但是,究竟什么是 Hadoop呢?简单地说, Hadoop是一个能够对大量数据进行分布式处理的软件框架.首先,它将大量的数据集保存在分布式服务器集群中,之后它将在每个服务器集群里运行"分布式"数据分析应用. 那Hadoop又有什么特殊之处呢?首先,它很可靠,即使某一个或某一组服务器宕

开源八预言:桌面linux必亡、Hadoop要火

  近两年,在IT圈中开源这个词已经变得越来越常见,人人开口闭口谈云计算OpenStack.大数据Hadoop.手机Android,开源Linux.开发者.运维人员和IT媒体们也开始关注Eucalyptus.OpenStack.Hadoop.Ubuntu这些开源项目.   近两年,在IT圈中开源这个词已经变得越来越常见,人人开口闭口谈云计算OpenStack.大数据Hadoop.手机Android,开源Linux.开发者.运维人员和IT媒体们也开始关注Eucalyptus.OpenStack.H

Cloudera Impala:基于Hadoop的实时查询开源项目

正在纽约进行的大数据技术会议Strata Conference + Hadoop World传来消息,Cloudera发布了实时查询开源项目Impala 1.0 beta版,称比原来基于MapReduce的Hive SQL查询速度提升3-90倍(详情可以参考此文中的"How much faster are Impala queries than Hive ones, really?"部分),而且更加灵活易用.Impala是高角羚的意思,这种羚羊主要分布在东非. 同时,这个项目也将以Cl

阿里巴巴、Facebook、Cloudera等巨头的数据收集框架全攻略

互联网的发展,带来了日新月异的业务种类,随着业务的增长,随之而来的,是业务日志指数的递增.一些公司每条业务线, 提供服务的线上服务器就达几百台之多, 每天的日志量超百亿.如何能够将散落在各服务器上的日志数据高效的收集汇总起来, 成了在数据分析处理之前必须解决的问题. 一个优秀的数据收集框架,需要具备三点特性,一是低延迟,二是可扩展,三是容错性. 低延迟:从Log数据产生到能够对其做分析,希望尽可能快的完成数据的收集.在批处理或者离线分析中,对数据的实时性要求并不高,但是随着大数据的发展,实时计算

Google后Hadoop时代的新“三驾马车”——Caffeine、Pregel、Drem

Mike Olson是Hadoop运动背后的主要推动者,但这还远远不够,目前Google内部使用的大数据软件Dremel使大数据处理起来更加智能. Mike Olson目前任职于世界上最热的软件专业公司--Cloudera(硅谷的创业企业),并担任Cloudera的首席执行官.Cloudera围绕开源软件平台Hadoop发展自身的业务,开源软件平台Hadoop已经使得Google变身网络上最主导的力量. 预计到2016年Hadoop将会推动软件市场,并创造8.13亿美元的价值.不过Mike Ol

BDTC PPT集萃(三):BAT、IBM、Intel等分享的大数据技术

从2008年60人规模的"Hadoop in China"技术沙龙,到当下数千人规模的行业技术盛宴,七届BDTC(大数据技术大会)完整地见证了中国大数据技术与应用的变革,忠实地描绘了大数据领域内的技术热点,沉淀了无数极具价值的行业实战经验.同时,2014年12月12至14日,第八届中国大数据技术盛会将一如既往的引领当前领域内的技术热点,分享行业实战经验. 为了更好地洞悉行业发展趋势,了解企业技术挑战,在BDTC 2014召开前夕,我们将带大家一起对历届大会沉淀的知识进行挖掘,分享各IT

BDTC PPT集萃(一):BAT、华为、网易等分享的大数据架构

从2008年60人规模的"Hadoop in China"技术沙龙,到当下数千人规模的行业技术盛宴,七届BDTC(大数据技术大会)完整地见证了中国大数据技术与应用的变革,忠实地描绘了大数据领域内的技术热点,沉淀了无数极具价值的行业实战经验.同时,2014年12月12至14日,第八届中国大数据技术盛会将一如既往的引领当前领域内的技术热点,分享行业实战经验. 为了更好地洞悉行业发展趋势,了解企业技术挑战,在BDTC 2014召开前夕,我们将带大家一起对历届大会沉淀的知识进行挖掘,分享各IT

专访阿里云资深总监李津:论开源战略、安全服务和运维行业的变化

这是一场业内的对话,阿里云资深总监李津.Linux中国创始人王兴宇.运维帮创始人窦喆深入讨论了开源战略.安全服务和运维行业的变化. 话题是先从 HTTPS 云加速引开的 王兴宇:在之前已有消息说阿里云在开发 HTTPS 云加速的服务,而业界,包括国内已经有云加速服务商提供了 HTTPS 云加速服务.不知道阿里云这方面的进展如何? 李津:阿里云的 HTTPS 的云加速其实从技术上已经完成了,目前还在调测一些用户体验的部分,技术上并不是障碍,关键是易用性.HTTPS 云加速事实上是基于 CDN 做的