拥抱开源 DevOps引领大数据生态系统

为了开展开源战略，基于大数据生态系统组件的应用程序必须加强，才能在生产中运行。 DevOps可能是其中的重要组成部分。

用户一直希望减少对供应商的依赖。但是，当他们了解当今大数据生态系统的复杂环境时，他们至少在某种程度上将承担一定的责任。

新风格的数据工程要求对DevOps进行整体的调整，这就是敏捷性方法的扩展，需要开发人员对创新应用在生产中的表现承担更多的责任。同时，工程师需要以更快的速度学习新的软件。

许多早期采用者不得不创建基于MapReduce的Hadoop应用程序，只能使用Spark处理引擎重新启动它们。

如今有各种开源产品用于分析，包括Hadoop SQL查询工具、机器学习和其他功能。开源数据流媒体空间就有一些例子，随着一系列新的实时系统不断进行批处理，这些数据流空间正在不断发展。

在流媒体中，分析工具层出不穷。先是早期的竞争者Apache Storm，接着又出现Apache Spark和Apache Flink，而且这一切都发生在短短的几年之内。

Hadoop联合创始人、Cloudera首席架构师Doug Cutting表示，这是现代数据工程的本质，今天人们必须做好试用软件组件的准备。

事实上，很难找到与多个流媒体架构合作的商店，而且其中涉及到很多在职学习。随着Spark通过最近宣布的Drizzle插件在时间流式中添加记录，就需要更多的学习。

数据工程师正在研究组件如何以不同的组合形式工作，这个过程是从概念验证转向生产的重要环节。最终用户和供应商都属于这个环节的一部分。

搞清楚你想要什么

回想一下：当供应商们作为唯一创新来源的日子里，用户往往处于被动地位。供应商仍然可能在大数据应用实施方面发挥很大的作用，但被动的用户就要承受更大的风险。

事实上，产品发布时间中至少有一些滞后时间与准备软件的供应商有关。开源大数据应用程序从概念验证到生产投入的艰难过程并非巧合。

但是，随着数据商店开始对新的开源应用程序进行变革，需要大量的创新。

为了继续推进大数据工程，团队需要非常认真地追求DevOps的信条，或者称之为DataOps，尤其是要求数据工程师和IT架构师负责将创新思想运用到生产过程中。

本文转自d1net（转载）

时间： 2024-10-09 15:09:05

拥抱开源 DevOps引领大数据生态系统的相关文章

拥抱Hadoop领跑大数据实现价值回报

本文讲的是拥抱Hadoop领跑大数据实现价值回报,当大数据风暴来临的时候,你是否已经做好准备?2012年对于企业来讲最为企业CIO所关心的话题之一必然要属于大数据.我们看到无论是个人还是企业,随着互联网.3G技术的普及以及企业自身数据的积累,大量的数据被产生,而这些大数据最终在存储.安全以及价值转换将成为企业关注的焦点. 相关数据调查显示,到2020年,电子数据存储量将在2009年的基础上增加44倍,达到35万亿GB.根据IDC数据显示,截止到2010年,这个数字已经达到了120万PB,或1.

程学旗:关于中国大数据生态系统的基础问题思考

"中关村大数据产业联盟"推出"大数据100分"论坛,晚上9点开始,于"中关村大数据产业联盟"微信群进行时长100分钟的交流.探讨. 白硕:担任今天主讲的是中科院计算所程学旗研究员,大家欢迎! 白硕:现任中国科学院计算技术研究所副总工.研究员.博士生导师.网络科学与技术重点实验室主任. 作为中科院计算所互联网高性能软件与算法理论.网络搜索.网络信息安全方向的团队负责人和学科带头人,带领团队从事国家网络空间安全保障.互联网高性能软件以及网络搜索与挖掘

LSI：面向渠道转型全面引领大数据洪流

文章讲的是LSI:面向渠道转型全面引领大数据洪流,当前,全球数据爆涨.根据IDC最新数字宇宙研究报告,近两年全球的数字信息翻了一番.7年之后,总量将达到40 ZB,相当于地球上所有沙粒数量的57倍.也有人计算出,就在我们阅读本文的3分钟时间内,有18万小时的音乐下载,6亿Email产生,6000万照片被查看,14万个应用下载,390万视频被观看--若干数据在互联网传输,更多的数据被保存,等等.这就是今天大家都面临的大数据问题,LSI则称之为数据洪流(Data Deluge). ▲LSI全球渠道

引领大数据技术创新加快大数据产业聚集

在近日公布的全市2015年度绩效目标考核中,高新区斩获开发区类一等奖,在各大开发区中排名第一. "这得益于近年来市委.市政府坚持围绕创新做文章,确立大数据这一主导产业,先人一步.棋高一筹,帮我们摆脱了'路径依赖',找准了发展方向.发展路子."高新区党工委副书记.管委会主任黄昌祥说,高新区将以此为新的起点,抓住大数据这个核心,引领大数据技术创新,加快大数据产业聚集,全力打造创新型中心城市示范区. 走好"先手棋"发展新业态前不久,朗玛信息技术股份有限公司披露,从201

英特尔助力大数据生态系统构建

英特尔助力大数据生态系统构建程从超英特尔中国云计算创新中心 --云计算与大数据的理解 --大数据建议方案 --英特尔助力云数据中心建设英特尔助力大数据生态系统构建

引领“大数据技术风暴” 机器学习正当下

Ovum(咨询顾问公司)的分析师Tony Baer分享了他对于云端机器学习工具,物联网驱动流分析和Hadoop的一些观点.这些技术在2016年备受人们关注,2017年这种趋势将会延续. 技术的实际应用前景才是推动技术进步的根本,特别是今年的一些主流技术.Ovum分析师Tony Baer深知这一点,当他在2017年的Ovum report预测大数据发展趋势时,主要依据就是今年的技术应用情况. Baer得出了如下结论,机器学习项目,物联网(IoT)和实时流媒体分析,这些技术在2016获得了广泛关注,

开源社区为大数据创新开辟新途径

Talend公司是一家提供大数据产品和服务的供应商.去年,该公司宣布由于其一些产品非常成功,该公司的业务同比增长了136%.Talend公司将会继续推进更多的创新理念. Talend公司上8月末宣布,为大数据开发者推出了一个新的开源社区(Talend公司称之为大数据创新).据了解,这个新的社区将成为Talend所有利益相关者的交流平台. "Talend社区应该是任何公司或开发商解决下一代云计算或大数据集成项目的第一站,"Talend公司介绍说."这个新的论坛提供了一个让现有客

【IDCC2017】拥抱AI，引领智慧数据中心新发展

作为第四次科技革命的技术代表,人工智能取代了云计算和大数据的原有位置,成为数据中心的市场热点.如果说云计算.大数据为人工智能提供了现实的技术基础,大爆发的数据则为人工智能提供了充足的养分,AI扎根数据中心也成为必然之势. 2016年,谷歌AlphaGo大战韩国围棋名将李世石,以机器人胜利告终.经此一战,沉寂60多年的人工智能一下子火了起来.在医疗.教育.互联网金融.风险投资和客服等行业,AI+传统应用纷纷落地,改变着我们原有的工作模式,加速提升生产效率.同时,人工智能也不断走进人们的生活,开始扮

美媒：中国贵州省“异军”突起引领大数据潮流

中国国务院总理李克强在贵阳市同国内外知名企业家代表及业界知名人士举行对话会.此次对话会中,李克强就大数据发展趋势.大数据与传统产业的融合.大数据产业发展目标等内容展开深入的探讨. 李克强指出:"我国西部地区一直处于欠发达水平,但是高新技术产业将在这里大放光彩.我希望海内外精英人士可以一起携手合作,促进大数据行业新的发展". 同时,李克强也出席了5月25日在贵阳召开的2016中国大数据产业峰会暨中国电子商务创新发展峰会.此次峰会旨在大力提高内陆城市的高新技术产业,推动大数据产业在内陆地区