10个Hadoop的应用场景

谁在用Hadoop这是个问题。在大数据背景下,Apache Hadoop已经逐渐成为一种标签性,业界对于这一开源分布式技术的了解也在不断加深。但谁才是Hadoop的最大用户呢?首先想到的当然是它的“发源地”,像Google这样的大型互联网搜索引擎,以及Yahoo专门的广告分析系统。也许你会认为,Hadoop平台发挥作用的领域是互联网行业,用来改善分析性能并提高扩展性。其实Hadoop的应用场景远不止这一点,深入挖掘的话你会发现Hadoop能够在许多地方发挥巨大的作用。

美国着名科技博客GigaOM的专栏作家Derrick Harris跟踪云计算和Hadoop技术已有多年时间,他也在最近的一篇文章中总结了10个Hadoop的应用场景,下面分享给大家:

在线旅游:你知道吗,目前全球范围内80%的在线旅游网站都是在使用Cloudera公司提供的Hadoop发行版,其中SearchBI网站曾经报道过的Expedia也在其中。

移动数据:Cloudera运营总监称,美国有70%的智能手机数据服务背后都是由Hadoop来支撑的,也就是说,包括数据的存储以及无线运营商的数据处理等,都是在利用Hadoop技术。

电子商务:这一场景应该是非常确定的,eBay就是最大的实践者之一。国内的电商在Hadoop技术上也是储备颇为雄厚的。

能源开采:美国Chevron公司是全美第二大石油公司,他们的IT部门主管介绍了Chevron使用Hadoop的经验,他们利用Hadoop进行数据的收集和处理,其中这些数据是海洋的地震数据,以便于他们找到油矿的位置。

节能:另外一家能源服务商Opower也在使用Hadoop,为消费者提供节约电费的服务,其中对用户电费单进行了预测分析。

基础架构管理:这是一个非常基础的应用场景,用户可以用Hadoop从服务器、交换机以及其他的设备中收集并分析数据。

图像处理:创业公司Skybox Imaging 使用Hadoop来存储并处理图片数据,从卫星中拍摄的高清图像中探测地理变化。

诈骗检测:这个场景用户接触的比较少,一般金融服务或者政府机构会用到。利用Hadoop来存储所有的客户交易数据,包括一些非结构化的数据,能够帮助机构发现客户的异常活动,预防欺诈行为。

IT安全:除企业IT基础机构的管理之外,Hadoop还可以用来处理机器生成数据以便甄别来自恶意软件或者网络中的攻击。

医疗保健:医疗行业也会用到Hadoop,像IBM的Watson就会使用Hadoop集群作为其服务的基础,包括语义分析等高级分析技术等。医疗机构可以利用语义分析为患者提供医护人员,并协助医生更好地为患者进行诊断。

(责任编辑:蒙遗善)

时间: 2024-09-19 09:29:51

10个Hadoop的应用场景的相关文章

总结10个Hadoop的应用场景

谁在用Hadoop?这是个问题.在大数据背景下,Apache Hadoop已经逐渐成为 一种标签性,业界对于这一开源分布式技术的了解也在不断加深.但谁才是 Hadoop的最大用户呢?首先想到的当然是它的"发源地",像Google这样的大型 互联网搜索引擎,以及Yahoo专门的广告分析系统.也许你会认为,Hadoop平台发 挥作用的领域是互联网行业,用来改善分析性能并提高扩展性.其实Hadoop的应 用场景远不止这一点,深入挖掘的话你会发现Hadoop能够在许多地方发挥巨大的 作用. 美

一步一步学习大数据:Hadoop生态系统与场景

Hadoop概要 到底是业务推动了技术的发展,还是技术推动了业务的发展,这个话题放在什么时候都会惹来一些争议. 随着互联网以及物联网的蓬勃发展,我们进入了大数据时代.IDC预测,到2020年,全球会有44ZB的数据量.传统存储和技术架构无法满足需求.在2013年出版的<大数据时代>一书中,定义了大数据的5V特点:Volume(大量).Velocity(高速).Variety(多样).Value(低价值密度).Veracity(真实性). 当我们把时间往回看10年,来到了2003年,这一年Goo

大数据利器:Hadoop的十大应用场景

本文讲的是大数据利器:Hadoop的十大应用场景,谁在用Hadoop?这是个问题.在大数据背景下,Apache Hadoop已经逐渐成为一种标签性,业界对于这一开源分布式技术的了解也在不断加深.但谁才是Hadoop的最大用户呢?首先想到的当然是它的"发源地",像Google这样的大型互联网搜索引擎,以及Yahoo专门的广告分析系统.也许你会认为,Hadoop平台发挥作用的领域是互联网行业,用来改善分析性能并提高扩展性.其实Hadoop的应用场景远不止这一点,深入挖掘的话你会发现Hado

独家 | 一文读懂Hadoop(一):综述

随着全球经济的不断发展,大数据时代早已悄悄到来,而Hadoop又是大数据环境的基础,想入门大数据行业首先需要了解Hadoop的知识.2017年年初apache发行了Hadoop3.0,也意味着一直有一群人在对Hadoop不断的做优化,不仅如此,各个Hadoop的商业版本也有好多公司正在使用,这也印证了它的商业价值. 读者可以通过阅读"一文读懂Hadoop"系列文章,对Hadoop技术有个全面的了解,它涵盖了Hadoop官网的所有知识点,并且通俗易懂,英文不好的读者完全可以通过阅读此篇文

Hadoop就业面试题

----------------------------------------------------------------------------- [申明:资料来源于互联网] 本文链接:http://blog.csdn.net/sdksdk0/article/details/51695341 编辑:朱培   ID:sdksdk0 ----------------------------------------------------------------- 以下资料来源于互联网,很多都

Cloudera CTO: Hadoop与Spark是合作不是取代

在开源领域,Hadoop算得上是最成功的项目之一.这个诞生于2006年的开源项目,如今几乎成了大数据的代名词,越来越多的企业正在将Hadoop应用到他们的业务中.Hadoop已成为各类企业解决海量数据的通用处理平台,被广泛运用到医疗.教育.交通等多个行业,用来对数据进行分析处理.对未来进行预测.尽管如此,作为一个开源项目,Hadoop也面临着架构复杂.技术门槛高等诸多挑战,特别是随着人工智能热的出现以及Spark等新一代大数据处理框架的崛起,企业对Hadoop出现了很多需求.在这种情况下,Had

高可用Hadoop平台-Oozie工作流

1.概述 在开发Hadoop的相关应用使用,在业务不复杂,任务不多的情况下,我们可以直接使用Crontab去完成相关应用的调度.今天给大家介绍的是统一管理各种调度任务的系统,下面为今天分享的内容目录: 内容介绍 Oozie Server 截图预览 下面开始今天的内容分享. 2.内容介绍 今天的内容不涉及Oozie的具体细节操作,它的工作流程在下一篇博客为大家详细介绍.今天主要给大家分享Oozie的作用,它的集成步骤等内容. 2.1 作用 Oozie它是一个开源的工作流调度系统,它可以管理逻辑复杂

不会这些,你成不了Hadoop高手!

第一堂课:大数据集群搭建葵花宝典 由浅入深,四步成"狮" 1)快速搞定伪分布Hadoop集群搭建 2)高可用的5节点Hadoop分布式集群搭建(Hadoop 2.6.0) 3)生产环境:CDH5高可用集群环境搭建 4)彩蛋:顺便搞定Storm 和 Spark集群环境 课程大纲 (一)搭建Hadoop伪分布集群,让WordCount飞起来 1.Vmware虚拟机的介绍 2.Vmware虚拟机的安装 3.Vmware虚拟机的配置 4.搭建Linux 虚拟机 5.Linux虚拟机的系统配置

2014的12个大数据趋势:Hadoop继续升温,R将进入主流

当下,"大数据"已成为2013年最火的技术词汇之一:而在过去一年,这个市场的增速和改变也不可谓不大.同时,我们还看到了Hadoop及其生态系统的使用门槛从顶尖技术人才到数据科学家的改变.越来越多的企业拥抱大数据技术,并将其运用到生产环境中.那么,在2014年大数据的发展趋势又会如何,这里不妨看一下来自CIO的12项预测: 1. 人们不再止步于大数据的谈论 2014年,大数据止于说的情况将发生改变,人们将致力于从中获益,所有大数据的炒作也将"烟消云散".从Gainsi