说起大数据就不得不提Hadoop(也就是我们经常看见的大象的标志,注意不是飞猪是飞象),Hadoop是一个由Apache基金会所开发的分布式系统基础架构,专门针对海量非结构化数据处理的需求(Hadoop是以Apache首席设计师儿子一个大象玩具的名字命名)。
以IOE体系(Oracle,IBM和EMC)为核心的传统数据计算存储和读写方式越来越不能满足目前互联网和物联网发展带来海量数据分析的需求,而Hadoop被认为是适应未来大数据应用的全新架构体系,同时Hadoop也成为大数据的代名词(今年开始已经能在A股公司的年报和调研纪要中找到它了)。
Hadoop是个开源体系,任何开发者都可以依托它的基础架构开发新的大数据工具和应用,使用Hadoop体系对传统IT架构替代就是IT界传说的“去IOE”(在国内就变成了国产替代了“囧”)。企业网基础体系的替换是一个漫长的过程,IOE体系经过30-40年的积累才有了目前一统江湖的地位,Hadoop最早始于2005年到目前为止也有十年的开发时间,其开源的属性可能使得在普及过程中会更大激发开发者的热情并推进产业的快速变革(参考andriod的快速崛起),几家比较典型的Hadoop公司近两年收入开始步入爆发期,不少公司也逐步开始IPO进入普通投资者的视野,也许在未来十年时间就有可能出现几个市值媲美IOE(Oracle市值1800亿美元,IBM市值1537亿美元,EMC+Vmware市值920亿美元)的Hadoop公司。
目前美股市场上也有不少贴上大数据标签的公司,比如Splunk(SPLK,市值67亿美元),Tabuleau(DATA,市值55亿美元), Qlik(QLIK,市值26亿美元),Tibco(TIBX,市值39亿美元)(公司市值以2014年12月12日收盘价为参考),此外目前大数据的参与者还有Oracle,IBM,SAS,Teradata这类偏向于BI(商业智能化的公司,简单来讲就是快速生成报表和各种数据分析的软件),已经上市的这一批公司中虽然被冠以大数据的名义但是更多是基于传统基础架构开发的大数据应用的公司,比如Tabuleau,Qlik,Tibco主要是做数据可视化(可以理解为一个智能化的excel,点点鼠标就可以画各种高大上的图表,战略部门和领导的需求,技术壁垒相对有限),而Splunk则主要是做服务器日志文件分析的工具,在集群式服务器管理和服务器日志文件的批量检索分析中都能用到,技术壁垒较高,也是这类公司中估值最高的公司,市销率接近20倍。
而刚刚IPO的Hortonworks以及未上市的Cloudera和MapR则是Hadoop全新计算架构的三家马车,从概念上讲他们是更加纯粹的新型基础架构的大数据公司,当然像Tabuleau这样的公司也在积极的向新基础机构方向转型。
Hortonworks与Cloudera和MapR三家被看做是大数据技术市场的领头羊,三家都围绕Hadoop框架进行产品开发,从业务模式来看,Hortonworks采取开源产品服务模式,收入端更加依赖于产品支持和服务(因为Hadoop是开源的,基础工具免费,Hortonworks主要教你怎么使用工具),而Cloudera和MapR走的是工具产品路线(他们依托于Hadoop的基础开发更加专业的应用工具),收入依赖软件授权费用。Hortonworks于上周五IPO,该公司以每股16美元的价格发行625万股股票,募集1亿美元资金,开盘首日上涨幅度达到60%,市值接近11亿美元(估值大概在15倍PS)。大数据投资向来受到资本市场的关注,虽然Hortonworks在IPO方面先声夺人,但是其主要竞争对手也不“省油”,Cloudera迄今已经融资12亿美元(包括今年年初以18%的股份换取英特尔7.4亿美元投资),MapR和从EMC分离出来的Pivotal也都有巨额融资支持。
Hortonworks于2011年从雅虎剥离,2014年前9个月,Hortonworks的收入比去年同期翻了一倍多,从1590万美元增长至3340万美元,但是公司额运营成本也几乎翻倍,从4840万美元飙升至8790万美元,公司目前还处于亏算状态。Hortonworks的大多数收入都来自与其他科技厂商的技术合作和分销协议,最大的三家客户占到Hortonworks年时候入的37.4%,其中微软一家客户的收入虽然呈下滑趋势,但依然占到Hortonworks2014年迄今收入的22.4%(与微软的合同2015年7月到期)。
由于基础数据库和操作系统等基础IT工具市场的缺失,国内计算机公司一直无法摆脱IOE体系的束缚,工作内容大都属于IT外包的工作,地位比较屌丝,这也是国内没有大市值计算机公司的主要原因,没有基础软件的支撑,企业网客户的竞争就集中到关系层的竞争,计算机公司很难突破地域上的限制,区域化和行业属性比较突出。在今年估值大幅提升的情况下,恒生电子,东华软件和用友软件市值终于突破300亿人民币的大关,相比于美国高达千亿美元的计算机公司还是相去甚远。“去IOE”计算机基础架构的变革对国内计算机公司是一个历史性的重大机遇,能否借助产业变革改变无基础软件的尴尬局面是关键。国内互联网经济的快速发展使得互联网公司对适应新一代海量数据处理IT系统的需求比海外更加迫切,互联网公司也在基础IT方面有巨大的投入,而应对像双十一这样爆发性需求的场景则成为IT架构的天然练兵场,国内计算机公司应该积极寻求和互联网公司的合作将互联网公司应对海量数据的经验快速和国内企业网客户的需求对接开发国产属性的基础软件产品,而不是陷入到国产化去“IOE”的陷阱中无法自拔。我们期待着国内软件公司摆脱“集成”,“外包”和“实施”等IT界屌丝的代名词,成为拥有市场定价权的IT领航者,为投资者带来丰厚的回报。
2013年大数据公司收入排行榜
介绍几个有意思的大数据应用的公司
Palantir:反恐秘密武器
Palantir创立于2004年,由数位前支付巨头PayPal的员工创办,早期只是一家帮助非技术人员解决问题之间复杂联系、识别网络欺诈的软件公司。如今,Palantir一跃成为政府和金融公司的“宠儿”,其客户包括美国国家安全局(NSA),美国中情局(CIA)和联邦调查局(FBI)等,主要提供人物关系图谱的分析报告。2013年公司收入超过1亿美元,估值超过60亿美元。Datasift:社交网络数据的掘金者
DataSift源自Twitter信息过滤平台Tweetmeme,主要是筛选、挖掘和分析Twitter、Facebook、轻博客Tumblr和YouTube的数据并进行整合(目前只有Gnip获得了同样的授权),然后再把数据出售给分析社交媒体的商业公司。DataSift的客户包括了戴尔等公司。消息人士透露,DataSift 2014年营收将超过2500万美元。迄今为止,DataSift已通过数轮融资募集到超过7000万美元。
Inrix:交通数据大玩家
Inrix实际上是以规模取胜的。Inrix有近一亿台车辆和设备来收集实时数据资源,而这一亿的用户实际上也充当了Inrix传感器的角色。通过规模的出租车、运输车、卡车等资源,Inrix收集每个用户的实时信息。提供实时交通信息还不是Inrix的核心价值,利用大数据预判未来交通信息与路况才是它的核心价值所在。
(责任编辑:mengyishan)