重磅!2017大数据十大趋势

2017年大数据将不再是Hadoop一家独大,也不再是编程者们的自娱自乐,企业和终端用户的不断涌入,海量数据“堆积如山”,随之而来的储存、分析、处理成为从业者的下一挑战。

随着对不同类型、不同体量数据的结构化存储、批量处理以及价值挖掘需求的增多,2016年注定是大数据里程碑式的一年。

2017年,支持大量结构化和非结构化数据的系统将继续增长。市场需要数据平台来帮助数据管理人员管理和保护大数据,同时允许最终用户进行数据分析。这些系统将逐步成熟,在企业内部的IT系统中更好地运行。

1、数据处理变得更加快速,数据也变得更加易于使用

选项扩展将加速Hadoop

当然,你可以在Hadoop上执行机器学习和情绪分析,但人们常常会问的第一个问题是:交互式SQL(结构化查询语言,一种数据库查询和程序设计语言,用于存取数据以及查询、更新和管理关系数据库系统)究竟有多快?毕竟,SQL相当于企业用户的“导管”——他们希望使用Hadoop数据来更快的获得可复用的BI仪表盘(一种向企业展示度量信息和关键业务指标即KPI现状的数据虚拟化工具),或者是进行一些探索性分析。

这种对速度的需求促使用户采用访问速度更快和执行效率更高的数据库,如Exasol、MemSQL,或者是类似于Kudu这种基于Hadoop的商店,当然还需要能够更快查询数据的技术。诸如SQL-on-Hadoop引擎(Apache Impala,Hive LLAP,Presto,Phoenix和Drill)和OLAP-on-Hadoop技术(AtScale,Jethro Data和Kyvos Insights)这样的数据查询加速器将进一步模糊传统数据库与大数据世界的边界。

2、大数据不再只是Hadoop

专门基于Hadoop开发的工具已过时

在过去的几年中,随着大数据浪潮来袭,数种为了满足Hadoop分析需求的技术兴起。但是,身处复杂,异构环境中的企业不再希望仅为一个数据源(Hadoop)采用孤立的BI访问点。他们需要的答案被埋没在一大堆数据源中,从记录系统到云端,再到来自Hadoop和非Hadoop源的结构化和非结构化数据。(顺便说一句,甚至连关系型数据库也正在为大数据趋势做准备。例如,SQL Server2016于近日添加了JSON支持)。

在2017年,客户将会需要对所有数据都进行分析。不依赖于数据源的平台将会茁壮成长,而专为Hadoop而设计的平台和未能跨应用部署的平台将被弃用。Platfora的退出便是这一趋势的预示。

3、相关组织将利用数据湖(DataLake)来实现价值

数据湖就像一个人造水库

数据湖就像一个人造水库。首先你要建造一个水坝(构建一个集群),然后填满水(数据)。一旦建立了湖泊,你将开始因为各种目的而使用这些水资源(数据),如发电,饮用以及各种消遣(预测分析,机器学习,网络安全等)。

而今,保有数据湖里的数据已经变成了一种为了保留而保留的行为。在2017年,这将随着Hadoop业务的收紧而改变。各个组织要求可重复的并且敏捷地使用数据湖,以便更快地获得响应。在确定对人事、数据和基础设施的相应投资之前,企业会更加慎重的考虑业务成果。这将促进业务和IT之间的强力耦合。而自助服务平台作为分析大数据资产的工具将获得更深入的认可。

另外,公司还将关注业务驱动型应用,避免数据湖陷入困境。在2017年,企业机构将从“构建未来”的数据湖应用转向业务驱动型数据应用。当今世界需要分析和操作能力去触及客户、处理索赔并且连接到个体的不同设备。

举例而言,任何商业网站需要提供实时的个性化推荐和价格查询。医疗健康型企业必须处理有效的索赔并且运用分析运营系统来防止索赔欺诈。媒体公司需要通过机顶盒提供个性化的内容。汽车制造商和汽车共享公司则要交互运营其车辆和司机。这些案例的实施交付均需要由一个敏捷平台来实现,同时提供分析和运营的处理,跨越后台分析和前台运营进行整合,提升了商业价值。

4、成熟的架构拒绝通用型框架

Hadoop不再只是一个用于数据科学用例的批处理平台

Hadoop不再只是一个用于数据科学用例的批处理平台。它已经成为一种专为特殊分析而架设的多用途分析引擎,甚至被用于日常工作负载的操作报告——传统上这项任务是由数据仓库(大量数据提取和分析的工具)来处理的。

本文作者:佚名

来源:51CTO

时间: 2024-10-18 14:28:35

重磅!2017大数据十大趋势的相关文章

贵阳综保区将实施大数据十大工程

记者近日从贵阳综保区获悉,该区出台文件明确,将实施智慧城市设计工程等十大工程,推动大数据政用.民用.商用创新应用,保障建设发展环境,推动大数据产业发展,力争到2020年,全区大数据核心产业规模超100亿元. 据了解,贵阳综保区抢抓全省加快建设跨境数据自由港的机遇,狠抓标志性基础设施建设,努力打造一批行业引领性平台,推动离岸数据中心.离岸服务外包中心.大数据交易中心.人工智能产业集聚区建设:聚焦核心产业聚集一批行业龙头企业,依托贵州国际金贸云基地等,大力发展离岸服务外包与呼叫业务.大数据采集和存储

大数据十大核心问题

大数据来了,受益于便宜的硬件存储.强大的计算机技术和云计算技术,企业手中获取了越来越多的数据.对大多数企业来说,数据分析不是可有可无,而是一个生存问题.但是面对大数据,我们有什么问题呢?本文作者赛仕软件研究开发(北京)有限公司总经理@刘政-SAS,在微博上分享的大数据的10个核心问题,中国统计网做个整理汇总,希望大家一起来交流讨论. 大数据十大核心问题: 1.大数据的分析模式 大数据分析与传统分析的区别,特点是什么? 2.分析速度 分析速度是否能够跟上数据量和数据格式变化的速度,是否能达到实时分

星环科技陈祖峰:2017年金融行业大数据十大应用的趋势展望

过去的2016年可称之为"智能金融"元年.相比过去五年,以云计算.大数据.区块链为首的新兴技术创新全面渗透至金融业的方方面面,用科技手段解决供需矛盾.用机器解放人力资源,以数据驱动的决策实务出现了前所未有的爆发式增长.  作者 | 陈祖峰 本文长度为4500字,建议阅读9分钟 回顾2016,中国金融业经历了不平凡的一年.金融市场环境瞬息万变: 银行业不良率攀升.净利润收窄.公司营业收入规模下降; 证券行业资管与投行业务增长.经纪业务占比下滑.A股市场整体处于震荡形式; 保险业万能险.另

2017年物联网和大数据十大新趋势

还有33天2016年就要过去了,回顾过去一年物联网和大数据有了很大的发展,明年又有哪些新趋势我们需要跟进呢? 1.物联网架构师的崛起 物联网架构师将代替数据科学家成为HR部门最珍惜的人才,物联网的浪潮将带来边缘计算和物联网运行设计的激增. Teradata的物联网技术市场专家Dan Graham认为,一夜之间,成千上万的简历将被更新,此外, 少于10%的公司意识到他们需要一个物联网分析架构师,一种特殊的物联网系统架构职务.未来可以设计分布式和物联网中心的软件设计师会升值. 2.向混合架构的迁移会

大数据十大发展方向:Scale-out将成为主流

1大数据分析领域快速发展 大数据无疑是目前IT领域的最受关注的热词之一.几乎凡事都要挂上点大数据,否则就显得你OUT了.相信大多数人都能顺口说出大数据的四个特点:容量大,多样化,速度快以及高价值.但随着人们对于大数据的逐渐了解,人们开始讨论大数据究竟能够给人们带来什么样的价值?大数据的未来服务方向在哪里? 今天我就跟大家谈一下未来大数据的十大发展方向: 方向一:大数据分析领域快速发展 数据蕴藏价值,但是数据的价值需要用IT技术去发现.去探索,数据的积累并不能够代表其价值的多少.而如何发现数据中的

大数据十大发展方向:中国成为大数据最重要的市场

大数据无疑是目前IT领域的最受关注的热词之一.几乎凡事都要挂上点大数据,否则就显得你OUT了.相信大多数人都能顺口说出大数据的四个特点:容量大,多样化,速度快以及高价值.但随着人们对于大数据的逐渐了解,人们开始讨论大数据究竟能够给人们带来什么样的价值?大数据的未来服务方向在哪里? 今天我就跟大家谈一下未来大数据的十大发展方向: 方向一:大数据分析领域快速发展 数据蕴藏价值,但是数据的价值需要用IT技术去发现.去探索,数据的积累并不能够代表其价值的多少.而如何发现数据中的价值已经成为企业用户密切关

盘点本周大数据十大重要事件

本周关于大数据的新闻层出不穷,有的是业界大事,有的是业界趣事,有的是两者兼而有之.今天,小编这这里为大家整理了一下这周与大数据相关的不能错过的新闻事件. 1. EMC发布名为"Pivotal HD"的Hadoop发行版 EMC于2月27日发布了自身的Apache Hadoop发行版-Pivotal HD,同时发布的还有一个名为HAWQ的技术,通过HAWQ能够将Greenplum分析型数据库与Hadoop分布式架构进行紧密地融合. Pivotal HD对Apache Hadoop进行了全

“数据南明”瞄准大数据十大应用

记者日前从南明区获悉,今年,该区坚持以大数据为引领,在政用.商用.民用上大胆探索,将重点推进"数据南明"十个试点应用,实现成熟一个.应用一个.展示一个.推广一个.引领一片,逐步形成大数据思维方式和工作习惯,为打造创新型中心城市核心区提供试点经验和基础支撑. 着重推进大数据+楼宇经济.以花果园城市综合体为试点区域,以"一平台六中心"为组织构架,建设花果园城市综合体大数据监测调度平台,将大数据运用到楼宇经济运行.产业发展.税务征收.城市建管.智慧社区建设等管理与服务中,

从大数据向大信息升华,亟待统计科学与数据科学的革新

大科学工程,是以工程方式.计划手段.汇聚科技资源与力量整体推进重大科技计划的最新范式,是科学研究由传统的"手工小作坊"向现代大规模"工场"演进的一次革命.大科学范式的"兵团作战",将以空域和领域维度上的大规模,甚至超越时域维度上的长尺度,实现今朝一日.史上数年的突破. 大科学是大数据的摇篮,大数据是大科学的产物 大科学的王者之道始于大数据的产生.人类历史上的大数据,源于科技领域,确切地说源于大科学研究.曼哈顿计划打开了微观世界,并开创了借用人造的