企业大数据的选择题:BAT,还是老牌厂商?

  当前最性感的IT技术无疑是大数据。时至今日,大数据甚至已成白发垂髫的谈资,至少小编遇到的一些出租车司机都能侃上半天,所以也可以顺理成章地认为,一切不用大数据思维考虑业务发展的企业都是耍流氓,你可以还没有大数据项目,但你应该在准备做大数据的路上。

  但是且慢,即便企业不想耍流氓,大数据也不是说想上就上的——它往往意味着新的IT支出,因为传统的系统搞不定它。只是企业丰满的理想,就是利润的最大化,投资的永恒追求就是回报,如果没有足够的把握实现远大于投入的产出,如果不是逼不得已,我为什么要冒险投资大数据?

  两种选择

  我们的BAT出场了,亲切地呼唤:“大家快到碗里来。我们开放有成熟的经过验证的大数据能力,便宜好用。”百度重拳出击,在不同场合宣布开放其由开放云、数据工厂、百度大脑组成的大数据引擎,阿里云不甘示弱开放了ODPS开放数据处理服务和基于ODPS的简易BI解决方案采云间,腾讯亦在其开放云平台上开放腾讯Open Data、腾讯云分析、腾讯云推送等三项大数据处理能力,免费提供给企业和开发者。

  我们这里说BAT,但其实可以延伸至其他依赖数据处理能力生存的互联网企业,譬如京东,也有类似的打算。其余的,如博雅立方、易传媒、缔元信等原本靠数据吃饭的网络营销公司,更是不会放过这个市场机会了。甚至湘鄂情这种非互联网企业来横插一脚,铁了心剥离餐饮做互联网和大数据,甚至不惜定增失败就变卖资产补充现金流加强转型。(不过,若您执意在现阶段对这样的供应商青眼有加,亲,您的勇气实在可嘉,小编只有祝福,在涨姿势之前,没有什么可以建议了。)

  当然,在BAT之前,我们的老牌IT厂商,不管做基础芯片的,硬件设备的,基础软件的,应用软件的,也都已经在谈大数据了,IBM、微软、Oracle、 SAP、Teradata、Intel、EMC、浪潮、曙光、华为……基本上是个IT企业都有大数据方案,甚至都有大数据一体机,只是老厂商毕竟不像互联网企业那么妇孺皆知,也没有互联网厂商那么会玩营销——这不是贬义,毕竟现在市场竞争这么激烈,当然非要像小米那样造假数据搞饥饿营销,那就另作别论了。

  BAT 往往基于开源技术和自己的云平台提供大数据处理能力,可以做到很廉价。但传统厂商也在不断吸收开源技术的优点与自身既有方案结合,并且为用户解除了开源维护难的后顾之忧,而且一些企业已经采用了他们的一些系统,部署可能更加平滑。这就给企业出了一道:选择BAT出品的廉价解决方案,还是老牌厂商的高大上产品?

  雄心勃勃的BAT

  每一个IT巨头都有一颗膨胀的心。看看IBM、HP、EMC、Oracle、SAP、思科等,每个巨头的成长史都是一部并购扩展史。同样,高处不胜寒的 BAT也不断地给自己找新鲜事,甚至已经不局限于互联网领域,阿里巴巴疯狂地投资物流、文化、娱乐、体育、互联网金融领域,百度也勾搭万科、做外卖,不跨界都不正常了,何况大有前途的企业市场。百度CEO李彦宏对企业软件和大数据展望,让我们依稀看到百度征战企业领域的雄心,腾讯的优质资产微信也摩拳擦掌要做企业号,而在这之前,阿里云早已在政企领域公关多时,并在云计算和大数据领域斩获颇多。

  其实BAT搞物流也好,做O2O也罢,数据都是核心。马云表示,阿里未来要做的是数据公司。这基础当然就是IT。

  与传统巨头不同的是,互联网巨头在技术方面的扩张往往是借助开源社区自己动手丰衣足食,他们的业务规模和系统诉求,包括基础设施和应用,传统IT厂商通常没有见过,因而无法满足他们。国内某电商公司的一位大数据挖掘经理回忆说,当初寻求提升销量的方法,向其推销CRM的顾问不仅没有方案,反而对电商平台已经实现的一些客户挖掘功能感到惊奇,以至于他认为是顾问过来和企业学东西的,而不是来给建议的。所以,该平台的个性化推荐系统也只能自己摸索,做到有模有样。

  所以说,BAT同时也是用户,相对于传统厂商,他们的大数据解决方案更懂用户的心。

  用户出身的另一个好处是有高质量的数据。如果阿里没有数据基础,让银行坐立不安的互联网金融业务就不会做起来,汽车金融产品也难以威胁汽车金融公司。这些数据以不同的方式在其云平台上开放,客户将受益匪浅。

  以医疗行业为例,一位传统数据挖掘大厂的高管认为,与国外相比,国内很多医院的数据积累、数据整合基础薄弱,还很难做大数据挖掘。这个时候,BAT的优势就出来了。百度的智能硬件(如手环)将个人健康数据收集至百度云,通过百度大数据引擎输出,可以直接让医疗行业受益。上述老牌厂商高管也表示,未来有可能考虑收集一些公共数据,作为客户分析内部数据的辅助。而前面说过,BAT的盘子越来越大,这意味着他们收集的数据将越来越丰富,能够覆盖的行业和应用场景会越来越多。

  目前盛行的互联网思维,被认为是颠覆传统行业的动力,而大数据思维,只是互联网思维的一部分,由此看来,选择BAT,似乎更能帮助企业去颠覆别人或者避免被别人颠覆。

  不过我们需要了解,也因为BAT是用户,需求的个性较为鲜明,因而他们开放的是支持自身业务的能力,其大数据解决方案的应用往往有一些局限。譬如阿里巴巴由电商起家,ODPS就非常擅长结构化数据,比较擅长半结构化数据(开放的SQL功能主要用于数据仓库和日志分析),而不擅长非结构化数据——这些数据虽然价值密度低,但毕竟是大数据的重要组成部分。阿里云说,他们会在后续的版本中加入更多的功能,支持更多的数据类型、技术和应用场景(将开放UDF和Map Reduce,支持交互式BI分析,实时计算等),但他们也承认在文本分析方面不太可能超越百度,因为那是百度的看家本领,如同百度在交易数据很难超越他们一样。而腾讯在社交和游戏领域的实力,同样是其他两家同行难以企及的。

  与时俱进的老牌厂商

  今天的老牌厂商也非昔日的吴下阿蒙。在震撼于Hadoop、NoSQL的巨大能量的同时,他们也积极把来源技术纳入自己的解决方案中。说Intel、 EMC、Teradata玩Hadoop似乎没什么可惊讶的,但Oracle支持Hadoop和R语言,微软把Hadoop搬入Azure公有云平台中,IBM让大型机更好地支持Hadoop分析,让我们清晰看到老牌厂商的决心和反应能力。

  这些老牌厂商服务过多个行业,其解决方案的通用性更强。此外,为了让客户相信他们帮助客户保护现有投资,他们往往倾向于将开源技术与现有技术更好地融合,并弥补开源技术的一些缺憾。以Teradata为例,该公司近期推出了Teradata Aster R,允许通过Aster MPP架构并行执行R语言分析,并放宽内存和处理能力限制条件,扩展了开源R语言的分析能力,能够支持大规模并发。

  老牌厂商希望老产品在大数据时代焕发新春,BAT则往往强调通过公有云提供产品,这也是一个很大的不同点,并且他们对云的观点也有所区别。

  我们知道,很长一段日子,阿里云计算总裁王文彬反复强调,私有云的概念只是在迎合用户杞人忧天的安全顾虑,阿里认为云计算应当是水电一样的公共服务。在微软、VMware、IBM、EMC等一众大佬言必称混合云的世界里,阿里俨然在为真理与不彻底的革命者孤军奋战。

  其实,公有云的规模效应,这原是亚马逊阿里云们的拿手好戏,在私有云领域,他们是没有老牌厂商那样的。小编也承认,公有云更符合云计算的初衷,因而其未来的发展势不可挡。但如同浪潮副总裁张海涛说的,美国的信用卡体系那么发达,现金交易也没有消失。VMware说它的软件定义存储产品VSAN很先进,但也不认为传统存储立马会因此消失。

  小编认为,阿里云是不外乎想增强企业对公有云的信心,进而增加其公有云的规模优势,其实他们内心里也未必认为自己能够彻底消灭私有云。就算不是为了安全,企业也不可能把已有的内部IT平台(很可能与云服务商的技术架构大不相同)扔掉,立马迁移到云上。而且法律也还没允许所有行业的所有数据都能上到云端呢。

  所以,未来很长的一段日子,比VMware预计VSAN在2027年埋葬外部存储阵列的时间还要长,企业还是离不开内部IT。所以,VMware们会把混合云作为当前的一个重心工作,他们能够在云端提供大数据处理的能力,但他们也在支持企业内部部署,同时往往也会提供一个统一管理平台。

  当然,我们也不能否认BAT大数据的技术实力及其业务价值。不论如何,人家的看家本领,连金融行业都改变了,不是闹着玩的。

  小结

  综上所述,互联网厂商和传统厂商,都有技术有应用价值有不同的优势。那么究竟选择谁?“看企业业务和应用场景需求”这样的废话就不说了。小编以为,如果您想走公有云路线,只需考虑您数据价值密度最高的数据类型是否是供应商所擅长的(当然还有服务价格),如果具有强烈的保持内部IT平台的愿望,还是在现有的内部IT基础上加以考虑吧。

时间: 2024-10-22 10:58:15

企业大数据的选择题:BAT,还是老牌厂商?的相关文章

《企业大数据系统构建实战:技术、架构、实施与应用》——第2章 企业大数据职能规划 2.1 大数据组织架构体系

第2章 企业大数据职能规划 第1章我们介绍了企业大数据在宏观和微观层面的定位,立足于解答企业大数据的商业模式.市场机会.延伸价值.内部功能定义等问题.当企业已经确定要实施大数据战略时,应该如何针对性地建立职能架构体系以保证企业大数据的有效实施和落地?各个职能部门的职责范畴如何定义?不同体系和部门间如何协同和流程化工作? 本章将详细讲解企业大数据职能规划体系,包括如何定义大数据部门在企业中的角色,常见的大数据职能及职责分工,不同职位的职责划分以及大数据制度和流程建设等问题. 2.1 大数据组织架构

【阿里在线技术峰会】李金波:企业大数据平台仓库架构建设思路

本文根据阿里云高级技术专家李金波在首届阿里巴巴在线峰会的<企业大数据平台仓库架构建设思路>的分享整理而成.随着互联网规模不断的扩大,数据也在爆炸式地增长,各种结构化.半结构化.非结构化数据的产生,越来越多的企业开始在大数据平台下进行数据处理.分享中,李金波主要从总体思路.模型设计.数加架构.数据治理四个方面介绍了如何利用大数据平台的特性,构建更贴合大数据应用的数据仓库. 直播视频: (点击图片查看视频) 幻灯片下载:点此进入 以下为整理内容. 总体思路 随着互联网规模不断的扩大,数据也在爆炸式

企业大数据战略规划高级培训课程

一.课程对象 本课程是大数据高级培训课程,主要面向企业中层及以上管理人员,IT战略规划部门.理论联系实际,就大数据的应用方向,演进路线和企业大数据战略规划进行探讨,结合完整的大数据项目实施案例,进行讲解.旨在帮助企业IT战略决策部门解决大数据时代,企业大数据战略面临的各种问题:是否需要大数据?为何要上大数据?大数据能够给企业带来什么样的价值和意义?大数据平台如何和企业现有业务系统进行整合? 二.课程大纲 日程 课程模块 课程内容 第一天 技术篇 分布式文件系统-HDFS 并行计算框架-Map/R

《机器人操作系统ROS原理与应用》——3.1 企业大数据解决方案实现方式

3.1 企业大数据解决方案实现方式 工欲善其事必先利其器,企业大数据解决方案既包括大数据产品和工具层面,又包括服务层面.企业大数据解决方案根据实现方式的不同可分为完全独立研发.直接购买第三方解决方案和借助第三方的力量进行联合开发三种. 3.1.1 独立研发 独立研发指的是企业内部通过组建大数据中心或部门,独立进行大数据项目的研发.企业独立研发大数据平台,在数据安全.技术可控.后期扩展等方面具有重要意义. 数据安全:独立研发过程中的所有数据从输入端到输出端的整个流通都在企业内部进行,数据不会因为平

企业图谱强势来袭,玩转企业大数据

2016年的大数据浪潮是一波又一波,"大数据"."云计算"."人工智能"开始频繁出现在人们的视线中.阿里云率先以大数据+云计算来赋能各行各业,阿里云并不只是自己在做大数据,而是通过打造公共.开放的大数据服务平台来开放自己的技术能力,服务更多的企业. 企业图谱作为阿里云2017年推出的首款数据服务产品,将会为企业提供一站式的企业数据服务.提供企业多维度信息查询,深度挖掘企业与企业.企业与个人关系链路,方便企业构建基于企业画像及企业关系网络的风险控制

中国企业大数据联盟成立 易车任理事长单位

11月4日,中国企业大数据联盟(Big Data Union 简称BDU)正式宣布成立,国内最大汽车互联网企业易车为创始会员之一,并出任BDU理事长单位.BDU成立的目的在于汇聚各行业的力量,推动跨界大数据标准制定与合作,提升参与各方的大数据应用水平,建立中国大数据产业生态,为我国大数据产业健康发展做出贡献. BDU由易车.中国电信.工信部电信研究院等八家业界龙头单位发起,首批艾瑞.携程.智联招聘.新东方等45家成员单位涵盖了当前中国主流消费人群在网购.通信.婚恋.就业.教育.注意力等多方面的数

7月21日 企业大数据平台仓库架构建设思路直播视频

7月21日 企业大数据平台仓库架构建设思路--李金波(阿里云高级技术专家) 采访:我们该如何做好一个数据仓库? 演讲视频:https://yq.aliyun.com/edu/lesson/119 演讲整理文章:https://yq.aliyun.com/articles/57901 PDF下载:点此进入 现场问答整理:https://yq.aliyun.com/ask/36706/ 更多技术峰会视频资料详见:https://yq.aliyun.com/articles/57826

《机器人操作系统ROS原理与应用》——第1章 企业大数据战略定位

第1章 企业大数据战略定位企业大数据的战略定位,决定了企业大数据发展的可行性.持续性.稳定性和高效性,但如果要明确大数据战略定位,我们首先要了解什么是大数据,大数据平台技术与传统数据库的区别是什么?为什么要做大数据,大数据可以解决什么问题?本章将从宏观和微观两个层面介绍企业大数据的战略定位,试图剖析如何将大数据摆在企业发展的正确位置上,以及如何统筹不同资源协同大数据的工作关系并最大化大数据价值.

如何让云计算与企业大数据强强联手?

本文讲的是如何让云计算与企业大数据强强联手,大数据是高性能计算领域最热门的趋势.大数据往往是非结构化的大规模数据,这些庞大的数据集中蕴含着对企业极具价值的情报信息.而云计算在过去几年一直是IT世界的宠儿,因为云计算开创了计算作为服务的新时代,尽管人们对于云计算的安全.可用性和成本仍然存在疑虑. 大数据的规模似乎能够成为云计算有趣的合作伙伴.大规模数据的管理存在很高的复杂性,正因为如此,大数据分析通常在本地服务器集群中进行.而云计算的优势在于尽可能有效地优化现有资源.如果部署得当,你没有理由不结合