当前最性感的IT技术无疑是大数据。时至今日,大数据甚至已成白发垂髫的谈资,至少小编遇到的一些出租车司机都能侃上半天,所以也可以顺理成章地认为,一切不用大数据思维考虑业务发展的企业都是耍流氓,你可以还没有大数据项目,但你应该在准备做大数据的路上。
但是且慢,即便企业不想耍流氓,大数据也不是说想上就上的——它往往意味着新的IT支出,因为传统的系统搞不定它。只是企业丰满的理想,就是利润的最大化,投资的永恒追求就是回报,如果没有足够的把握实现远大于投入的产出,如果不是逼不得已,我为什么要冒险投资大数据?
两种选择
我们的BAT出场了,亲切地呼唤:“大家快到碗里来。我们开放有成熟的经过验证的大数据能力,便宜好用。”百度重拳出击,在不同场合宣布开放其由开放云、数据工厂、百度大脑组成的大数据引擎,阿里云不甘示弱开放了ODPS开放数据处理服务和基于ODPS的简易BI解决方案采云间,腾讯亦在其开放云平台上开放腾讯Open Data、腾讯云分析、腾讯云推送等三项大数据处理能力,免费提供给企业和开发者。
我们这里说BAT,但其实可以延伸至其他依赖数据处理能力生存的互联网企业,譬如京东,也有类似的打算。其余的,如博雅立方、易传媒、缔元信等原本靠数据吃饭的网络营销公司,更是不会放过这个市场机会了。甚至湘鄂情这种非互联网企业来横插一脚,铁了心剥离餐饮做互联网和大数据,甚至不惜定增失败就变卖资产补充现金流加强转型。(不过,若您执意在现阶段对这样的供应商青眼有加,亲,您的勇气实在可嘉,小编只有祝福,在涨姿势之前,没有什么可以建议了。)
当然,在BAT之前,我们的老牌IT厂商,不管做基础芯片的,硬件设备的,基础软件的,应用软件的,也都已经在谈大数据了,IBM、微软、Oracle、 SAP、Teradata、Intel、EMC、浪潮、曙光、华为……基本上是个IT企业都有大数据方案,甚至都有大数据一体机,只是老厂商毕竟不像互联网企业那么妇孺皆知,也没有互联网厂商那么会玩营销——这不是贬义,毕竟现在市场竞争这么激烈,当然非要像小米那样造假数据搞饥饿营销,那就另作别论了。
BAT 往往基于开源技术和自己的云平台提供大数据处理能力,可以做到很廉价。但传统厂商也在不断吸收开源技术的优点与自身既有方案结合,并且为用户解除了开源维护难的后顾之忧,而且一些企业已经采用了他们的一些系统,部署可能更加平滑。这就给企业出了一道:选择BAT出品的廉价解决方案,还是老牌厂商的高大上产品?
雄心勃勃的BAT
每一个IT巨头都有一颗膨胀的心。看看IBM、HP、EMC、Oracle、SAP、思科等,每个巨头的成长史都是一部并购扩展史。同样,高处不胜寒的 BAT也不断地给自己找新鲜事,甚至已经不局限于互联网领域,阿里巴巴疯狂地投资物流、文化、娱乐、体育、互联网金融领域,百度也勾搭万科、做外卖,不跨界都不正常了,何况大有前途的企业市场。百度CEO李彦宏对企业软件和大数据展望,让我们依稀看到百度征战企业领域的雄心,腾讯的优质资产微信也摩拳擦掌要做企业号,而在这之前,阿里云早已在政企领域公关多时,并在云计算和大数据领域斩获颇多。
其实BAT搞物流也好,做O2O也罢,数据都是核心。马云表示,阿里未来要做的是数据公司。这基础当然就是IT。
与传统巨头不同的是,互联网巨头在技术方面的扩张往往是借助开源社区自己动手丰衣足食,他们的业务规模和系统诉求,包括基础设施和应用,传统IT厂商通常没有见过,因而无法满足他们。国内某电商公司的一位大数据挖掘经理回忆说,当初寻求提升销量的方法,向其推销CRM的顾问不仅没有方案,反而对电商平台已经实现的一些客户挖掘功能感到惊奇,以至于他认为是顾问过来和企业学东西的,而不是来给建议的。所以,该平台的个性化推荐系统也只能自己摸索,做到有模有样。
所以说,BAT同时也是用户,相对于传统厂商,他们的大数据解决方案更懂用户的心。
用户出身的另一个好处是有高质量的数据。如果阿里没有数据基础,让银行坐立不安的互联网金融业务就不会做起来,汽车金融产品也难以威胁汽车金融公司。这些数据以不同的方式在其云平台上开放,客户将受益匪浅。
以医疗行业为例,一位传统数据挖掘大厂的高管认为,与国外相比,国内很多医院的数据积累、数据整合基础薄弱,还很难做大数据挖掘。这个时候,BAT的优势就出来了。百度的智能硬件(如手环)将个人健康数据收集至百度云,通过百度大数据引擎输出,可以直接让医疗行业受益。上述老牌厂商高管也表示,未来有可能考虑收集一些公共数据,作为客户分析内部数据的辅助。而前面说过,BAT的盘子越来越大,这意味着他们收集的数据将越来越丰富,能够覆盖的行业和应用场景会越来越多。
目前盛行的互联网思维,被认为是颠覆传统行业的动力,而大数据思维,只是互联网思维的一部分,由此看来,选择BAT,似乎更能帮助企业去颠覆别人或者避免被别人颠覆。
不过我们需要了解,也因为BAT是用户,需求的个性较为鲜明,因而他们开放的是支持自身业务的能力,其大数据解决方案的应用往往有一些局限。譬如阿里巴巴由电商起家,ODPS就非常擅长结构化数据,比较擅长半结构化数据(开放的SQL功能主要用于数据仓库和日志分析),而不擅长非结构化数据——这些数据虽然价值密度低,但毕竟是大数据的重要组成部分。阿里云说,他们会在后续的版本中加入更多的功能,支持更多的数据类型、技术和应用场景(将开放UDF和Map Reduce,支持交互式BI分析,实时计算等),但他们也承认在文本分析方面不太可能超越百度,因为那是百度的看家本领,如同百度在交易数据很难超越他们一样。而腾讯在社交和游戏领域的实力,同样是其他两家同行难以企及的。
与时俱进的老牌厂商
今天的老牌厂商也非昔日的吴下阿蒙。在震撼于Hadoop、NoSQL的巨大能量的同时,他们也积极把来源技术纳入自己的解决方案中。说Intel、 EMC、Teradata玩Hadoop似乎没什么可惊讶的,但Oracle支持Hadoop和R语言,微软把Hadoop搬入Azure公有云平台中,IBM让大型机更好地支持Hadoop分析,让我们清晰看到老牌厂商的决心和反应能力。
这些老牌厂商服务过多个行业,其解决方案的通用性更强。此外,为了让客户相信他们帮助客户保护现有投资,他们往往倾向于将开源技术与现有技术更好地融合,并弥补开源技术的一些缺憾。以Teradata为例,该公司近期推出了Teradata Aster R,允许通过Aster MPP架构并行执行R语言分析,并放宽内存和处理能力限制条件,扩展了开源R语言的分析能力,能够支持大规模并发。
老牌厂商希望老产品在大数据时代焕发新春,BAT则往往强调通过公有云提供产品,这也是一个很大的不同点,并且他们对云的观点也有所区别。
我们知道,很长一段日子,阿里云计算总裁王文彬反复强调,私有云的概念只是在迎合用户杞人忧天的安全顾虑,阿里认为云计算应当是水电一样的公共服务。在微软、VMware、IBM、EMC等一众大佬言必称混合云的世界里,阿里俨然在为真理与不彻底的革命者孤军奋战。
其实,公有云的规模效应,这原是亚马逊阿里云们的拿手好戏,在私有云领域,他们是没有老牌厂商那样的。小编也承认,公有云更符合云计算的初衷,因而其未来的发展势不可挡。但如同浪潮副总裁张海涛说的,美国的信用卡体系那么发达,现金交易也没有消失。VMware说它的软件定义存储产品VSAN很先进,但也不认为传统存储立马会因此消失。
小编认为,阿里云是不外乎想增强企业对公有云的信心,进而增加其公有云的规模优势,其实他们内心里也未必认为自己能够彻底消灭私有云。就算不是为了安全,企业也不可能把已有的内部IT平台(很可能与云服务商的技术架构大不相同)扔掉,立马迁移到云上。而且法律也还没允许所有行业的所有数据都能上到云端呢。
所以,未来很长的一段日子,比VMware预计VSAN在2027年埋葬外部存储阵列的时间还要长,企业还是离不开内部IT。所以,VMware们会把混合云作为当前的一个重心工作,他们能够在云端提供大数据处理的能力,但他们也在支持企业内部部署,同时往往也会提供一个统一管理平台。
当然,我们也不能否认BAT大数据的技术实力及其业务价值。不论如何,人家的看家本领,连金融行业都改变了,不是闹着玩的。
小结
综上所述,互联网厂商和传统厂商,都有技术有应用价值有不同的优势。那么究竟选择谁?“看企业业务和应用场景需求”这样的废话就不说了。小编以为,如果您想走公有云路线,只需考虑您数据价值密度最高的数据类型是否是供应商所擅长的(当然还有服务价格),如果具有强烈的保持内部IT平台的愿望,还是在现有的内部IT基础上加以考虑吧。