企业拥抱大数据,Hadoop 和Spark渐受欢迎

虽然国内大数据相较国外起步较晚,但增长态势却一路上扬,完美诠释了典型的“中国速度”,不仅是企业和政府用户对于大数据的认知在提升,而且在搭建平台和提供数据服务方面,企业用户也开始了更为深入的探索。

来自中国信通院的数据显示:2016年中国大数据市场规模将达到16.8亿元人民币,增速为45%,预计未来3年(2017~2020年),增速将稳步保持在30%以上。

市场风生水起,离不开政府层面的扶持。国家“十三五”规划纲要明确表示:实施国家大数据战略是“十三五”时期的重点。去年国家力挺大数据应用,批复了京津冀等7个国家级大数据综合试验区和超过10个大数据国家工程实验室。

紧接着,今年1月国家印发的《大数据产业发展规划(2016-2020年)》(以下简称《规划》)无疑又为火热的大数据又添了一把柴。按照《规划》预计,在2020年,我国技术先进、应用繁荣、保障有力的大数据产业体系将基本形成,大数据相关产品和服务业务收入将突破1万亿元人民币。

实体产业的落地速度也是快马加鞭,就在本月,坐落于廊坊的京津冀大数据创新应用中心主体工程竣工,并于5月18日正式投入运营。该中心包含体验中心、研发中心、双创中心、应用中心、感知中心5大核心功能区,打造以大数据为核心的特色产业体系。

“利用大数据改造传统动能、培育新动能,对实现创新驱动发展,意义重大、前景广阔”,工业和信息化部副部长陈肇雄表示,一方面引导地方结合自身条件,科学谋划发展重点,在大数据产业特色优势明显的地区建设一批产业集聚区;另一方面,支持地方大数据应用试点,开展系统性探索试验,形成有效经验和模式,加快推广普及。

政府数据开放“三不”写成了难

虽然有国家政策保驾护航,但摆在产业界面前的难题也不少,想要真正实现商业化,形成良性的产业生态道阻且长。诸如在时下高度受关注的大数据共享和开放方面,产业界还未找到行之有效的方法。

中国工程院院士邬贺铨对此表示:缺乏公共平台、共享不通畅、开放总量偏低、结构化程度低,民众参与反馈不准等,这些都是摆在数据共享开放前面的最直接难题。

大数据的价值在于融合和挖掘,作为拥有最大数据源基础的政府一方,本该在数据共享方面起到表率作用,促进数据的融合挖掘,但现实却是政府数据开放呈现三个“不”字。

不敢于、不愿意、不容易,这三个关键词正好反映出目前政务云建设过程中,政府对于数据开放共享的真实态度。

中国信息通信研究院院长刘多表示,由于国家层面目前在数据安全方面还缺乏具有指导性的规定和细则,这就导致政府在共享数据方面不敢于也不愿意迈出大步;另一方面,政府IT系统多为封闭的“烟囱式”IT构建,即便想要数据共享,也需要接口的标准化和统一的顶层设计。

“开放共享对于政务透明、全社会信用体系建设和创新都非常重要,我们需要共同努力!”刘多如是说。

产业动起来,Hadoop 和Spark渐受欢迎

监管未细,但产业界早已行动。来自中国信通院一份国内1465 用户的大数据问卷调查显示:近六成企业已成立数据分析相关部门,27.3% 的企业计划成立数据部门。更重要的是,绝大部分企业均已意识到数据分析对企业发展的重要性,在用户看来,大数据能够为企业带来最直观的效果就是:智能决策和提升运营效率。

更有趣的是,市场对于搭建大数据平台的方式也在发生微妙的变化,相较于前两年直接购买集成一体机的方式,在2016年,倾向于本地自建大数据平台(48.6%)和采购云服务商的大数据服务(33.1%)的比例占到了总体受访者的80%。

这似乎已经传递出一个非常明确的趋势:企业拥抱大数据,更青睐以开源平台来构建大数据,这也就解释了业界为何如此看重Hadoop 和Spark这两项大数据平台技术架构的原因。

不过开源之路并不像看上去那么美好,除了自身具备一定的技术实力之外,如何融入从国外舶来的开源社区文化,兼顾数据服务的安全性、稳定性和可扩展性都将成为企业用户即将面对的重要课题。

本文转自d1net(转载)

时间: 2024-09-29 13:23:47

企业拥抱大数据,Hadoop 和Spark渐受欢迎的相关文章

大数据漫谈:Spark如何引燃机器学习?

文章讲的是大数据漫谈:Spark如何引燃机器学习,如今,再讨论大数据,无论是互联网行业还是传统行业似乎都有话说.大数据改变了很多,也带来了很多.人工智能作为大数据的一个重要分支,也纷纷被各大企业划入未来的规划之内.不久前,李开复就曾说过,未来的人工智能市场将比如今大火的移动互联市场要大10倍. 本文将讨论Spark的开源机器学习库Spark ML.从Spark 1.6开始,Spark ML软件包中基于DataFrame的API推荐明显多于基于RDD的API,但是还未完全取代.从Spark 2.0

大数据计算新贵Spark在腾讯雅虎优酷成功应用解析

Spark作为Apache顶级的开源项目,项目主页见http://spark.apache.org.在迭代计算,交互式查询计算以及批量流计算方面都有相关的子项目,如Shark.Spark Streaming.MLbase.GraphX.SparkR等.从13年起Spark开始举行了自已的Spark Summit会议,会议网址见http://spark-summit.org.Amplab实验室单独成立了独立公司Databricks来支持Spark的研发. 为了满足挖掘分析与交互式实时查询的计算需求

拥抱“大数据时代” 共享发展新成果

近现代历史上的数次技术产业革命,中国均以学习者和模仿者的姿态出现.而在云计算和大数据所带来的新变革中,中国与世界的距离最小,在很多领域甚至还有着创新与领先的可能.以开放的心态.创新的勇气拥抱"大数据时代",就一定会抓住历史赋予中国的这一伟大创新机会. 习近平在中共中央政治局第三十六次集体学习时强调,我们要深刻认识互联网在国家管理和社会治理中的作用,以推行电子政务.建设新型智慧城市等为抓手,以数据集中和共享为途径,建设全国一体化的国家大数据中心,推进技术融合.业务融合.数据融合,实现跨层

通信行业未来发展的“丝绸之路”:拥抱大数据时代 共享发展新成果

拥抱"大数据时代" 共享发展新成果 近现代历史上的数次技术产业革命,中国均以学习者和模仿者的姿态出现.而在云计算和大数据所带来的新变革中,中国与世界的距离最小,在很多领域甚至还有着创新与领先的可能.以开放的心态.创新的勇气拥抱"大数据时代",就一定会抓住历史赋予中国的这一伟大创新机会. 习近平在中共中央政治局第三十六次集体学习时强调,我们要深刻认识互联网在国家管理和社会治理中的作用,以推行电子政务.建设新型智慧城市等为抓手,以数据集中和共享为途径,建设全国一体化的国

探讨:数据驱动型企业与大数据商业模式

本文讲的是探讨:数据驱动型企业与大数据商业模式,2012年7月13日消息,2012第二届大数据世界论坛今天在北京开幕.本次论坛邀请了Forrester Research资深分析师曹宇钦 .IDC中国高级分析师周林等权威第三方咨询机构;微软亚太研发集团首席技术官孙博凯.赛仕软件中国总经理刘政.甲骨文大中华区技术总经理喻思成.Splunk亚太及日本区域副总裁刘文熙等业界主流厂商高层;以及支付宝首席商业智能官车品觉等来自金融.电信.电子商务.制造业等重点应用行业的用户嘉宾等都将与会于业内专业人士面对面

企业部署大数据准则:安全问题应未雨绸缪

"安全与隐私"自大数据概念诞生以来便一直伴随其左右. 在这个数据大爆炸的时代,企业通过大数据可以更加高效的洞察和预见消费者行为以及行业趋势,但同时也伴随着安全性的困扰.能否保护自己的隐私安全.信息安全,成为了企业部署大数据之前摆在面前的首道难题. Hadoop作为大数据的首选平台,从开发之初也一直被笼罩着安全性问题. 曾有开发者指出,"当Hadoop在2004年开始开发的时候,对如何创建一个安全的分布式计算式环境上没有考虑,Hadoop框架对用户及服务的验证和授权严重不足,用

重磅,企业实施大数据的路径

企业实施大数据主要有四个方面的内容: 第一,企业要建立数据文化,企业作决策应该用数据来说话. 第二,企业要建立数据的战略. 第三,企业在数据战略之下组织数据管理团队的能力. 第四,企业实施大数据的技术能力. 企业实施大数据的具体的建设路径有两个方面,一方面是自下而上,另一方面是自上而下. 自上而下 自上而下的路径,首先是有序地在管理层建立数据的决策文化,在企业文化层面建设起数据的使用意识,然后建立对应的组织架构.对应的部门和团队,确定需要招聘什么样的人进来.需要多少人.具体职责怎么划分,最后建立

河南获批建国家级大数据综合试验区 拥抱大数据畅想“云生活”

河南省成为第二批获批建设国家级大数据综合试验区的省份之一后,"云计算.大数据"成为近日河南各界热议的话题.11月9日,河南省第三届互联网大会在郑州开幕,本次大会聚集了一大批互联网学术界.企业界有重要影响力的知名学者和优秀企业家,大家就云计算.大数据.网络经济.网络安全等热点话题进行了深入交流研讨. 河南将迎来大数据时代,面对"一切皆有可能"的未来,我们如何更新观念,适应变化?河南又该如何把握机遇,奋勇向前?对此,网友众说纷纭,分享观点. 记者连线 什么是大数据云计算

拥抱大数据营销时代

众所周知的,以和媒体打交道著称的的公关行业在互联网时代迎来的全新的挑战,越来越多的他要为企业提供直接面向千万消费者的网络服务. 这个行业中的每一个人,无论是主动还是被动,都被这股数据的洪流裹挟着朝着"大数据"时代一路狂奔,拥抱大数据时代就是营销人的唯一"宿命". 以上文字为放狠话,仅代表个人情绪和观点. 这年头,做营销做公关的,对于层出不穷的互联网应用和由此诞生的新名词儿都必须要知道了解熟悉并且迅速转化在给客户的提案中,所以不管我们是不是真的弄明白什么是云计算什么是