Hadoop生态系统中的容器和微服务 玩出哪些新花样?

最近大多数大数据应用都部署在裸设备上,这意味着Hadoop大多数部署在非虚拟化服务器上。随着容器和微服务对应用开发圈产生影响,这种情况在发生改变。

容器和微服务都把整个应用程序的代码细分成更小粒度的片段。这样不仅简化了开发,而且更容易测试,这也是设计更灵活应用程序部署方案和代码复用的关键。

早期的时候,这种技术就应用于大数据领域,但是现在看起来在数据流处理、微服务这类领域应用也很有前途。欧洲某顶级电子商务公司的一位技术经理认为,微服务方法简化了开发工作,增强了代码复用能力。

Otto GmbH公司是一家多渠道零售商(产品包括高级铸件以及熔铸设备和半成品工业设备),总部位于德国汉堡。Rupert Steffner是该公司商业智能系统首席平台架构师,他说:“使用微服务方法是非常经济的做法。对于有些类型的应用,忽略微服务的方式是不明智的。你会一遍又一遍地开发相同的功能。”

Steffner谈到的这种类型应用是许多人工智能机器人在公司在线零售网站上运行着各种实时分析任务。Otto使用了微服务整合Docker容器和流处理技术来增强这些AI机器人的功能。

容器和微服务
云计算是推动Hadoop、Spark和其它大数据技术走向虚拟化的主要力量。不过仍然有很多基础设施在云之外构建,各公司都在努力用技术缓解这种演变。

Tom Phelan是BluData软件公司联合创始人和首席架构师,该公司设计的平台可以自动配置Hadoop或Spark集群。他说:“Hadoop大多数运行在裸设备上,不过它也可以运行在虚拟机上。例如,Amazon云和Azure云都使用了OpenStack。现在Hadoop要转向容器了。”

他说:“以前认为Hadoop集群部署在裸设备上性能更优,但现在看来不一定了。”容器需要变得更成熟,而且Hadoop本身设计并不是针对微服务风格的架构。BlueData公司最近更新软件提升了对容器的支持,推出了自动Kerberos配置Hadoop集群和Linux特权访问管理工具。

Hadoop发行版供应商MapR技术公司一位经理表示,敏捷性和流处理也是微服务获益的驱动力。Jack Norris是MapR公司数据和应用高级副总裁,他说客户构建机器人需要有快速适应数据的能力并具备机器学习模型。

他表示,在“事件驱动”架构的应用程序中这一点尤为明显。这种架构越来越多的包含了数据流处理组件。

Norris说,Hadoop和Spark应用流变得越来越复杂,他们变得更难升级了。但是,他认为微服务只是关注数据管道中的事件,这会给这种开发带来更多灵活性。这是与原始Hadoop开发风格相比最根本的变化。

Norris说:“我们看到了开放更宽泛应用程序集的需求。”与此同时,他承诺MapR公司将继续支持现有整块应用程序的风格。

上个月,MapR公司对于大数据应用微服务做了深入实践,为应用程序版本控制提供微服务专用卷,为机器学习模型AB测试设计专用微服务。另外,Norris表示,他们设计了新的参考架构用来指导开发人员利用微服务聚合流数据和实时分析应用。

AI机器人监视“只逛不买”的购物车
随着大数据处理任务变得更复杂,加上相关组件都支持精确的数据流,微系统方法的应用越来越广泛了。Otto公司的Steffner认为,微系统提供了典型的“各个击破”手段来满足架构需求。

上个月在纽约举办的Strata+Hadoop 2016年世界大会上,Steffner表示,Otto公司数据架构中的每个AI机器人都处理特定任务。例如,一个AI机器人查找欺诈交易;另一个针对实时广告位分析建模;还有一个检查空的在线购物车,并对未购买任何商品就打算离开的客户推送最后一轮促销产品。

该公司通过基于Docker的微系统架构实现以上功能,该架构是2015年四月上线的,那时候该公司已经部署传统大数据平台两年了,不过并没有满足全部需求。

Docker容器也非常适合机器人软件。Otto公司在后台安装了混合开源流处理引擎,包括Storm、Spark流处理、Flink和Ignite。不过Steffner说,Ignite是内存数据组织技术,最初是由GridGain系统公司开发的,用来处理当前环境中的批量实时处理工作。

本文转自d1net(转载)

时间: 2024-12-31 12:42:08

Hadoop生态系统中的容器和微服务 玩出哪些新花样?的相关文章

(祈福九寨)网易蜂巢基于容器和微服务加快迭代速度实践

题图:Afterquake by Angelo Giordano@pixabay 编辑:冷锋 文章转自网易云(微信公众号Netease_cloud) 刘超 网易云首席解决方案架构师,代码级略懂OpenStack.Hadoop.Docker.Lucene.Mesos等开源软件,10多年的云计 算架构与开发经历,积累了丰富的企业级应用的微服务化,容器化实战经验,曾出版<Lucene应用开发揭秘>,个 人博客可搜索popsuper1982. 刘超在分享了题为"网易蜂巢基于容器和微服务加快迭

CoScale为容器和微服务提供全栈监控方案

本文讲的是CoScale为容器和微服务提供全栈监控方案[编者的话]本文介绍了CoSacle为容器和微服务提供的的全栈监控解决方案,包括目前业内对于监控的痛点以及CoScale引入机器学习及人工智能算法解决这些问题的思路. "显而易见的在很多方面容器对于开发人员是一个确实很酷的技术,但是对于运维工程师,为了在他们的基础设施或者在云端支持和管理这些容器,引入了额外的有关容器管理.编排.安全.可用性和监控等方面的问题."CoScale的产品和市场经理Peter Arijs如此说到:"

《Hive编程指南》一1.2 Hadoop生态系统中的Hive

1.2 Hadoop生态系统中的Hive WordCount算法,和基于Hadoop实现的大多数算法一样,有那么点复杂.当用户真正使用Hadoop的API来实现这种算法时,甚至有更多的底层细节需要用户自己来控制.这是一个只适用于有经验的Java开发人员的工作,因此也就将Hadoop潜在地放在了一个非程序员用户无法触及的位置,即使这些用户了解他们想使用的算法. 事实上,许多这些底层细节实际上进行的是从一个任务(job)到下一个任务(job)的重复性工作,例如,将Mapper和Reducer一同写入

Kontena 1.0开源容器与微服务平台释出

对于大多数人而言,容器与docker这样的字眼可能还略有耳闻,但是Kontena这样的名词,可能略有陌生,其实大可不必. Kontena是采用Ruby开发的应用容器,是一个开源的容器化业务流程工具,提供云基础设施上容器化应用的部署.管理.测量和监控工具.从构成与应用场景来看,Kontena包括:Server,Client和CLI三个部分,支持任意的云平台,比如Docker和CoreOS Rocket. Kontena架构图 而根据最新外媒报道,Kontena刚刚释出了自己最新的1.0产品.该款产

比较Apache Hadoop 生态系统中不同的文件格式和存储引擎的性能

主题 这篇文章提出了在Apache Hadoop 生态系统中对比一些当前流行的数据格式和可用的存储引擎的性能:Apache Avro, Apache Parquet, Apache HBase 和 Apache Kudu 空间效率, 提取性能, 分析扫描以及随机数据查找等领域.这有助于理解它们中的每一个如何(何时)改善你的大数据工作负载的处理能力. 引言 最初把hadoop文件格式和存储引擎做比较的想法是在初始系统修订版之一的驱动下完成的 –这个系统是在CERN中大规模调节Hadoop-ATLA

品高公开课 | 基于Docker容器的微服务架构实践

小编的话 "品高公开课"系列文章意在分享技术牛人的知识干货,每期主题都不一样哟!期待各位读者在文后发表留言,来一场技术上的交流和思想上的碰撞! 微服务以一种全新的架构设计模式,牵动了互联网应用从设计到运维整个流程方法论的变革. 而以Docker为代表的容器技术则为微服务理念提供了匹配的实现机制.本周五,将由品高软件工程师陈洪杰带讲述微服务架构的故事. 分享嘉宾 陈洪杰,目前就任品高广州云架构产品部--BingoCloud平台的软件开发工程师,拥有Docker,LXC等多个容器平台的项目

学霸君基于Docker的微服务架构设计

以下内容根据演讲PPT以及现场分享整理而成. 今天主要分享的是我们在实践微服务架构或者容器架构过程中踩过的坑,对于致力在容器技术方面进行探索的同学会有很大帮助.本次将站在整体的角度,分享如何去运维整个线上系统,如何看待整个微服务的架构.微服务能带来什么帮助以及微服务又有哪些缺点,还有重要的一点就是微服务架构如何去落地实施.虽然阿里云这样的服务商为我们做了大量的工作,但是将微服务架构真正地落地实施还需要做很多的工作.而对于任何技术而言,都是存在优缺点的,微服务架构也不是救世的良药. 一.学霸君的发

从Docker的转变,谈容器生态与微服务的发展

更多深度文章,请关注:https://yq.aliyun.com/cloud 编者按:容器技术目前已经成为技术圈内的"常识",但是容器生态能否健康发展仍然任重道远.在收获最初的赞扬之后,领军者Docker如今身陷非议:今年执意壮大发展Swarm进军编排领域,似乎Docker公司一方面惹毛了很多强劲的编排领域玩家,另一方面也并没有收获预料之中的成果.12月14日,Docker计划将其关键容器运行模块之一Containerd贡献给开源社区.在周晖先生看来,这意味着Docker的重心将回归到

基于微服务和Docker容器技术的PaaS云平台架构设计

本文讲的是基于微服务和Docker容器技术的PaaS云平台架构设计[编者的话]在系统架构上,PaaS云平台主要分为微服务架构.Docker容器技术.DveOps三部分,这篇文章重点介绍微服务架构的实施. [3 天烧脑式容器存储网络训练营 | 深圳站]本次培训以容器存储和网络为主题,包括:Docker Plugin.Docker storage driver.Docker Volume Pulgin.Kubernetes Storage机制.容器网络实现原理和模型.Docker网络实现.网络插件.