大数据底层平台公司能做多大?

大数据是企业服务市场中的新兴领域,短短几年时间,大数据概念从兴起到落地,开始在各行各业发挥作用,行业政策频出,技术飞速发展,受到资本追捧。

整个大数据行业可大致分为三层,底层基础平台,中间层通用技术,上层行业应用。接下来,爱分析将按照上述分类,逐步介绍各细分领域的行业现状、未来前景。今天是大数据系列的第一篇——底层基础平台。

底层基础平台主要解决的是数据存储、计算的问题,是整个大数据生态的基石。采集到的数据,首先要能高效、快捷地存起来,才能进行数据分析和数据挖掘。

这一层非常重要,同时也是技术含量最高的一层。以底层技术中明星Hadoop为例,用Hadoop的公司很多,能做Hadoop发行版的公司凤毛麟角。

底层基础平台主要解决的是数据存储、计算的问题,是整个大数据生态的基石。采集到的数据,首先要能高效、快捷地存起来,才能进行数据分析和数据挖掘。这一层非常重要,同时也是技术含量最高的一层。以底层技术中明星Hadoop为例,用Hadoop的公司很多,能做Hadoop发行版的公司凤毛麟角。

Hadoop兴起的原因:便宜才是硬道理

进入新世纪的第一个十年,各大企业都在大力投入IT设备,建设自己的机房,上线各套办公系统。第二个十年,经济下行,传统企业的盈利下降,对IT设备的投入已经不像上个十年那般狂热,大型企业采购IT设备的经费受到控制,开始核算成本,意图在满足需求的情况下,降低投入。

以Hadoop为代表的新底层技术能够兴起,抛开技术原因,最主要的原因是便宜、扩展性强。利用分布式架构,将一些性能一般的机器串联起来,达到与高性能单机同样的效果。随着公司发展,数据量增大,不需要更换全套设备,只需要再增加机器就可以达到目的,省时省力。

分布式架构的技术很多,为什么Hadoop最后胜出?还是因为便宜,用的人多。以微软的Cosmos为例,这套系统本身优于Hadoop,主要是针对大型机房,设计理念很好,上万台机器的机房,拿出几十台做别的事情,来提升系统运营效率。但如果是几十台机器,仍然需要拿出很大一部分来做别的事情,机器使用效率就很低。

实际应用时,用上万台机器的公司少,用几十台机器的公司多,因此Hadoop的应用面更广。用的人多,自然帮助优化架构的人多,社区贡献的人多,技术发展快,渐渐成为主流。

国外Hadoop三驾马车,商业模式各有差异

提到Hadoop,必然要提到国外三家围绕Hadoop技术的公司:Cloudera、Hortonworks和MapR。三家公司都成立时间不长,Cloudera和MapR都是2009年成立,而Hortonworks是2011年从雅虎独立出来。三家公司都在资本市场上受到追捧。Hortonworks在2014年上市,IPO当天市值接近11亿美金;Cloudera获得英特尔7.4亿美金的投资,估值近50亿美金;MapR最近刚刚获得5000万美金融资,估值也超过10亿美金。

尽管三家公司都是提供Hadoop相关服务,但是商业模式区别不小。Cloudera和MapR都研发自己的Hadoop发行版,只不过MapR的技术完全闭源,不会对外开放,而Cloudera的产品分为免费版和企业版,只有企业版的核心组件不对外开放,其他技术均提供给社区。Hortonworks将自己的技术完全贡献给社区,不靠产品获利,靠派驻技术人员到客户现场提供服务盈利。

国内市场处于跑马圈地阶段,新兴大数据公司刚刚起步尽管近年大数据行业风起云涌,创业公司如雨后春笋般冒出,却少有专注底层基础平台的公司。当前,银行等大型企业纷纷喊出“去IOE”(IBM小型机、Oracle数据库、EMC存储设备),尽管国产企业的产品尚不能满足大型企业核心系统的要求,但是必然会有大量新业务的IT系统采用国产品牌,旧有业务面临更新换代也会优先选择国内厂商。

数据库等底层设施不同于上层应用,更换成本较高,客户黏性很大,非万不得已不会进行替换,同时Hadoop这类新技术迭代速度快,需要后期维护。因此,各家公司都在大力开拓市场,跑马圈地。新兴公司服务客户的方式类似,前期以产品为内核,用项目制的形式帮助企业搭建系统,后期每年收取20%的维护费。各家企业都在降低初装费,意图占据市场,靠后期维护费用收回成本。

巨头环伺的市场,大数据初创公司突围不易在去IOE的趋势下,中国大型企业都在面临IT设备的更新换代,整个底层基础平台市场潜力巨大。新兴大数据公司利用其技术优势和初创公司的高效决策机制,迅速抢占一些市场份额,占据一席之地不成问题。这类公司主要服务金融、电信、交通、电力等领域的大型企业,这些领域原本是传统集成商的地盘,因此新兴大数据公司不可避免地将与集成商正面竞争。

笔者认为,未来几年在底层基础平台领域诞生一家估值10亿美金的独角兽公司是可以预见的,但是这些大数据公司中出现类似Oracle这样的巨头公司可能性不大,基于以下几点:

第一, 产品同质化严重,市场竞争激烈底层基础平台不同于上层应用,客户需求类似,产品很难体现出差异化优势。各家公司主要比拼产品性能的优劣,这种技术上的差异,新兴公司最初会占据一定优势,随着开源技术的普及,华为等传统技术大牛公司会逐步赶上,技术的差距会逐步缩小。

第二, 技术迭代更新快,长期保持技术领先不易Hadoop诞生于2006年,Spark于2009年出现,2013年Hadoop已经发布2.0稳定版本,两种技术从诞生到成熟时间之短,令人震惊。在当今这个技术快速发展的时代,新兴大数据公司一方面要应对市场竞争,另一方面还要保持技术的领先地位,难度不小。

第三, 产品销售能力逊于传统巨头公司企业级市场,产品销售能力将成为影响公司发展的重要因素。以Oracle为例,早年与Oracle竞争的Sybase和Informix,其技术实力不逊于Oracle,Informix的技术甚至领先于Oracle。这两家公司最后在竞争中出局,落得被收购的下场,主要是输在市场推广上,市场推广的失利直接影响到公司的技术革新,最后导致衰落。

什么样的公司有机会突围成功那么,什么样的公司有机会突围成功,成为中国的Oracle,笔者认为具备以下几点的公司机会最大。

第一, 开源心态有助于保持技术领先地位以Hadoop为代表的开源技术正在改变世界,但开源和可持续盈利模式总是存在着一些矛盾。公司要不要保持开源的心态,开放自己的技术给更多人使用?对大数据公司而言,技术是核心竞争力之一,特别是对于这些做基础平台的公司,开放技术无疑是削弱自身竞争优势,降低产品的附加值,减少公司的毛利,短期来看,开放技术会对公司的营收造成不良影响。

但是,从公司长远发展来看,完全闭源会增大公司风险,其严重后果远远大于开放技术的影响。大数据公司最担心的是路线图出现偏差,自身技术与时代发展相左,丧失技术上的优势。一旦发生公司的技术发展方向背离整个行业发展方向,需要停止已研发的项目,掉头追赶行业脚步,这对创业公司来说是非常致命的。

第二, 商业拓展与技术研发同等重要企业服务市场是销售驱动型市场,而非技术驱动型,大数据这个细分领域同样如此。技术实力再强,产品功能再多样,也需要有客户买单才行。有些创业公司只重视研发上的投入,轻视市场推广,公司每年订单少,营收自然不高,团队规模上不去,融资困难,公司发展缓慢。单纯技术上的优势,在企业级市场并不是绝对影响因素。

很多公司在POC阶段都曾遇到过技术标第一,却因为商业谈判阶段不理想而错失订单的事情。特别是现在市场处于跑马圈地阶段,抢占位置比什么都重要,更是需要大力进行商业拓展。一旦市场格局稳定下来,到时候再切入市场难度很大。

第三, 效仿Oracle,建立适合公司的小生态建立生态这一点并不是适合初创公司,是公司发展到一定程度后需要考虑的。扩大自己合作伙伴的队伍,与其他公司共同开发产品,让其他公司承担一定销售任务,有些时候要比单打独斗更适合企业级市场。Oracle这样的巨头公司,刚进入中国市场时也遇到不小的阻力。当时采取的做法是与中国本土公司合作,建立围绕Oracle的小生态,借助本土公司的力量敲开中国市场的大门。做底层基础平台的公司,作为连接硬件和应用的中间层,更需要与其他公司合作。平台上对接的应用越多,越有助于平台产品的推广,开辟新的市场。

本文作者:佚名

来源:51CTO

时间: 2024-08-31 16:28:16

大数据底层平台公司能做多大?的相关文章

大数据物流平台公司“菜鸟网络”获得超百亿元首轮融资

3月14日消息,阿里巴巴旗下大数据物流平台公司菜鸟网络宣布已经完成首轮超百亿元融资,估值近500亿人民币.菜鸟网络宣布引入新的战略投资者,新的投资方包括新加坡政府投资公司.淡马锡控股公司.马来西亚国库控股公司.春华资本等多家国内外著名投资机构. 据创投时报资料库显示,菜鸟网络自2013年5月28日成立以来,即成为行业广泛关注的焦点,也是津津乐道的话.2013年,阿里巴巴集团.银泰集团联合复星集团.富春集团.三通一达,以及相关金融机构共同出资组建菜鸟,目标是建成"中国智能物流骨干网".当

“大数据”误区:有的公司不需要大数据

2012年"大数据"的发展如火如荼,然而本文的作者,数据分析公司SiSense副总裁Bruno Aziza却认为并不是每个人都需要大数据. "大数据"无处不在.从社交媒体初创公司到纽约的中央公园,每个公司似乎都在部署大数据分析. 著名数据分析公司Gartner的数据似乎也在证明这一点:最近的一份报告显示,大数据将带动2012年全球280亿美元的IT支出,到2016年这个数字将超过2300亿美元.2300亿美元几乎是葡萄牙全年的http://www.aliyun.c

大数据行业图谱之一:底层基础平台公司能做多大?

底层基础平台主要解决的是数据存储.计算的问题,是整个大数据生态的基石.采集到的数据,首先要能高效.快捷地存起来,才能进行数据分析和数据挖掘. 这一层非常重要,同时也是技术含量最高的一层.以底层技术中明星Hadoop为例,用Hadoop的公司很多,能做Hadoop发行版的公司凤毛麟角. 底层基础平台细分领域里的大数据公司众多,有专注Hadoop发行版的星环科技.红象云腾和天云大数据,有传统数据库厂商人大金仓和南大通用,有研发新型分布式数据库的巨杉数据库,还有唯一来自中国的Apache社区顶级项目K

大数据行业图谱之(1):底层基础平台公司能做多大?

大数据是企业服务市场中的新兴领域,短短几年时间,大数据概念从兴起到落地,开始在各行各业发挥作用,行业政策频出,技术飞速发展,受到资本追捧. 整个大数据行业可大致分为三层,底层基础平台,中间层通用技术,上层行业应用.接下来,爱分析将按照上述分类,逐步介绍各细分领域的行业现状.未来前景.今天是大数据系列的第一篇--底层基础平台. 底层基础平台主要解决的是数据存储.计算的问题,是整个大数据生态的基石.采集到的数据,首先要能高效.快捷地存起来,才能进行数据分析和数据挖掘. 这一层非常重要,同时也是技术含

搭建“智慧芭田”大数据综合平台

站在农资产业转型升级的"风口",芭田股份构建的"生态芭田.智慧芭田"格局已基本形成,公司正在以信息化.互联网化.物联网化,搭建线上线下一体化平台,拓宽芭田生态农业链延伸产业,公司正在向着"种植服务商"稳步前行."智慧芭田"大数据综合平台 "智慧芭田"大数据综合平台,主要是通过对高品质农作物生长环境.生长阶段所需的土壤.天气等因素通过大数据建模分析形成标准化的解决方案数据库. 根据各地农户种植种类.生长环境的

高可用的大数据计算平台如何持续发布和演进

2016年11月18-20日SDCC 2016中国软件开发者大会,阿里巴巴大数据计算平台首席架构师林伟给我们带来了"高可用的大数据计算平台如何持续发布和演进"的演讲.本文主要谈及大数据系统如何做系统迭代,以及大规模系统因为其大规模没有可能搭建对等的测试环境,需要进行在线测试方面的内容,更有在线测试需要的必要条件等等. 阿里巴巴大数据计算平台需要每天不间断的跑在上万台机器集群上,上面承担阿里核心分析计算任务,有着很高的可靠性和SLA的要求,但是我们同时需要持续不断提高系统的性能,降低成本

坐看大数据之道:51CTO专访大数据专家郑玮

大数据已经渗透进人们生活的方方面面,比如商店促销决策.政治活动指引等等.究竟大数据目前发展状况如何?51CTO专访大数据专家郑玮将为您讲述大数据之道. 专访视频专题,请访问<坐看大数据之道> NoSQL与大数据 NoSQL最早出现时,主要是Twitter这些社交媒体网站在用.因为他们需要处理每时每刻用户上传的海量图片.视频等非结构化数据.大数据概念提出之后,由于其在非结构化数据方面的优势,迅速融入大数据整体平台. HBase在大数据平台发展较快 为什么之前XML数据库没有成功?NoSQL的数据

【先锋】思明软件大数据技术平台打造历程和Impala实战分享

在采访思明数据刘诚忠的过程中,他表示当下大数据领域企业级市场靠技术垄断获取高额利润的玩法已经过时了,技术的成本会不断降低,这是大势所趋,这个市场的巨头会出现在技术很好,但服务更好的公司里.而站在用户的角度,用户们首先关心的是如何让数据发挥价值,然后才是这套解决方案依赖何种技术,是否能快速应用,是否能适应后面可能的扩展,相对技术来说第一点是更难的. 事实上今天的企业客户,特别在大数据技术领域,更需要的是长期的合作伙伴.他们不只需要购买技术密集的产品,还需要和大数据的技术专家一起研究如何让数据发挥出

大数据时代 每家公司都要有大数据部门吗?

在大数据时代 每家公司都要有大数据部门吗?如果这个问题换做是:在电气时代,每家公司都要有个发电厂吗?是不是会更好回答一些? 事实上每一种重大技术的出现,都会对产业产生大的变化.在蒸汽时代,采矿机采用蒸汽机后,会带来生产效率的极大提升,而轮船加上蒸汽机,再也不需要靠风才能航海了.在电气时代,电灯代替了蜡烛,电报代替了快马送信,而报纸也被广播和电视所侵蚀. 可以说是现有产业加上新技术,形成了新产业. 我们回过头来看这两次工业革命,生产蒸汽机的企业只有少量几家,而发电的企业在美国也只有通用电气和西屋电