以Hortonworks上市为由头,说说大数据美股那些事儿

说起大数据就不得不提Hadoop(也就是我们经常看见的大象的标志,注意不是飞猪是飞象),Hadoop是一个由Apache基金会所开发的分布式系统基础架构,专门针对海量非结构化数据处理的需求(Hadoop是以Apache首席设计师儿子一个大象玩具的名字命名)。

以IOE体系(Oracle,IBM和EMC)为核心的传统数据计算存储和读写方式越来越不能满足目前互联网和物联网发展带来海量数据分析的需求,而Hadoop被认为是适应未来大数据应用的全新架构体系,同时Hadoop也成为大数据的代名词(今年开始已经能在A股公司的年报和调研纪要中找到它了)。

Hadoop是个开源体系,任何开发者都可以依托它的基础架构开发新的大数据工具和应用,使用Hadoop体系对传统IT架构替代就是IT界传说的“去IOE”(在国内就变成了国产替代了“囧”)。企业网基础体系的替换是一个漫长的过程,IOE体系经过30-40年的积累才有了目前一统江湖的地位,Hadoop最早始于2005年到目前为止也有十年的开发时间,其开源的属性可能使得在普及过程中会更大激发开发者的热情并推进产业的快速变革(参考andriod的快速崛起),几家比较典型的Hadoop公司近两年收入开始步入爆发期,不少公司也逐步开始IPO进入普通投资者的视野,也许在未来十年时间就有可能出现几个市值媲美IOE(Oracle市值1800亿美元,IBM市值1537亿美元,EMC+Vmware市值920亿美元)的Hadoop公司。

目前美股市场上也有不少贴上大数据标签的公司,比如Splunk(SPLK,市值67亿美元),Tabuleau(DATA,市值55亿美元), Qlik(QLIK,市值26亿美元),Tibco(TIBX,市值39亿美元)(公司市值以2014年12月12日收盘价为参考),此外目前大数据的参与者还有Oracle,IBM,SAS,Teradata这类偏向于BI(商业智能化的公司,简单来讲就是快速生成报表和各种数据分析的软件),已经上市的这一批公司中虽然被冠以大数据的名义但是更多是基于传统基础架构开发的大数据应用的公司,比如Tabuleau,Qlik,Tibco主要是做数据可视化(可以理解为一个智能化的excel,点点鼠标就可以画各种高大上的图表,战略部门和领导的需求,技术壁垒相对有限),而Splunk则主要是做服务器日志文件分析的工具,在集群式服务器管理和服务器日志文件的批量检索分析中都能用到,技术壁垒较高,也是这类公司中估值最高的公司,市销率接近20倍。

而刚刚IPO的Hortonworks以及未上市的Cloudera和MapR则是Hadoop全新计算架构的三家马车,从概念上讲他们是更加纯粹的新型基础架构的大数据公司,当然像Tabuleau这样的公司也在积极的向新基础机构方向转型。

Hortonworks与Cloudera和MapR三家被看做是大数据技术市场的领头羊,三家都围绕Hadoop框架进行产品开发,从业务模式来看,Hortonworks采取开源产品服务模式,收入端更加依赖于产品支持和服务(因为Hadoop是开源的,基础工具免费,Hortonworks主要教你怎么使用工具),而Cloudera和MapR走的是工具产品路线(他们依托于Hadoop的基础开发更加专业的应用工具),收入依赖软件授权费用。Hortonworks于上周五IPO,该公司以每股16美元的价格发行625万股股票,募集1亿美元资金,开盘首日上涨幅度达到60%,市值接近11亿美元(估值大概在15倍PS)。大数据投资向来受到资本市场的关注,虽然Hortonworks在IPO方面先声夺人,但是其主要竞争对手也不“省油”,Cloudera迄今已经融资12亿美元(包括今年年初以18%的股份换取英特尔7.4亿美元投资),MapR和从EMC分离出来的Pivotal也都有巨额融资支持。

Hortonworks于2011年从雅虎剥离,2014年前9个月,Hortonworks的收入比去年同期翻了一倍多,从1590万美元增长至3340万美元,但是公司额运营成本也几乎翻倍,从4840万美元飙升至8790万美元,公司目前还处于亏算状态。Hortonworks的大多数收入都来自与其他科技厂商的技术合作和分销协议,最大的三家客户占到Hortonworks年时候入的37.4%,其中微软一家客户的收入虽然呈下滑趋势,但依然占到Hortonworks2014年迄今收入的22.4%(与微软的合同2015年7月到期)。

由于基础数据库和操作系统等基础IT工具市场的缺失,国内计算机公司一直无法摆脱IOE体系的束缚,工作内容大都属于IT外包的工作,地位比较屌丝,这也是国内没有大市值计算机公司的主要原因,没有基础软件的支撑,企业网客户的竞争就集中到关系层的竞争,计算机公司很难突破地域上的限制,区域化和行业属性比较突出。在今年估值大幅提升的情况下,恒生电子,东华软件和用友软件市值终于突破300亿人民币的大关,相比于美国高达千亿美元的计算机公司还是相去甚远。“去IOE”计算机基础架构的变革对国内计算机公司是一个历史性的重大机遇,能否借助产业变革改变无基础软件的尴尬局面是关键。国内互联网经济的快速发展使得互联网公司对适应新一代海量数据处理IT系统的需求比海外更加迫切,互联网公司也在基础IT方面有巨大的投入,而应对像双十一这样爆发性需求的场景则成为IT架构的天然练兵场,国内计算机公司应该积极寻求和互联网公司的合作将互联网公司应对海量数据的经验快速和国内企业网客户的需求对接开发国产属性的基础软件产品,而不是陷入到国产化去“IOE”的陷阱中无法自拔。我们期待着国内软件公司摆脱“集成”,“外包”和“实施”等IT界屌丝的代名词,成为拥有市场定价权的IT领航者,为投资者带来丰厚的回报。

2013年大数据公司收入排行榜

  介绍几个有意思的大数据应用的公司

Palantir:反恐秘密武器

Palantir创立于2004年,由数位前支付巨头PayPal的员工创办,早期只是一家帮助非技术人员解决问题之间复杂联系、识别网络欺诈的软件公司。如今,Palantir一跃成为政府和金融公司的“宠儿”,其客户包括美国国家安全局(NSA),美国中情局(CIA)和联邦调查局(FBI)等,主要提供人物关系图谱的分析报告。2013年公司收入超过1亿美元,估值超过60亿美元。Datasift:社交网络数据的掘金者

DataSift源自Twitter信息过滤平台Tweetmeme,主要是筛选、挖掘和分析Twitter、Facebook、轻博客Tumblr和YouTube的数据并进行整合(目前只有Gnip获得了同样的授权),然后再把数据出售给分析社交媒体的商业公司。DataSift的客户包括了戴尔等公司。消息人士透露,DataSift 2014年营收将超过2500万美元。迄今为止,DataSift已通过数轮融资募集到超过7000万美元。

  Inrix:交通数据大玩家

Inrix实际上是以规模取胜的。Inrix有近一亿台车辆和设备来收集实时数据资源,而这一亿的用户实际上也充当了Inrix传感器的角色。通过规模的出租车、运输车、卡车等资源,Inrix收集每个用户的实时信息。提供实时交通信息还不是Inrix的核心价值,利用大数据预判未来交通信息与路况才是它的核心价值所在。

(责任编辑:mengyishan)

时间: 2024-10-28 12:09:16

以Hortonworks上市为由头,说说大数据美股那些事儿的相关文章

Hortonworks的IPO是否意味着大数据黄金时代的来临?

Hortonworks为首次公开募股递交了书面资料,但分析师表示,大数据狂热者现在尚无需开香槟庆祝. Hortonworks公司是在大数据领域使用Apache Hadoop的一个主要技术公司,Apache Hadoop是一种开源分布式计算框架.该公司在上周公布其即将上市,此时距离该公司从雅虎分拆出来仅仅三年.分析师认为,如果没有意外,这对Hortonworks来说是一个雄心勃勃的举动.这可能会刺激更多实力相当的竞争对手进行首次公开募股,例如MAPR和Cloudera,但这对于大数据(领域)的现状

大数据的那些事儿

资源列表:   关系数据库管理系统(RDBMS)   框架   分布式编程   分布式文件系统   文件数据模型   Key -Map 数据模型   键-值数据模型   图形数据模型   NewSQL数据库   列式数据库   时间序列数据库   类SQL处理   数据摄取   服务编程   调度   机器学习   基准测试   安全性   系统部署   应用程序   搜索引擎与框架   MySQL的分支和演化   PostgreSQL的分支和演化   Memcached的分支和演化   嵌入式

大数据背后的事儿

窥 探人隐私的不是数据,是人.但是这样简单的事实,人们往往很难接受.就像NSA(国家安全局)发生的丑闻,经常性的数据泄露事件和频发的电视台窃听私人通 话事件,难怪人们会越来越不信任数据.91%的美国人认为,消费者已经无法阻止个人信息被其他企业收集和利用,并有61%的人希望能采取措施保护他们在网 上的个人信息.无论数据是被社交媒体故意披露的,或是通过人们在网站和智能手机上留下的痕迹无意中收集的,恐怖的是,个人隐私和信息自由,甚至是民主意识 都受到了威胁. 从法院受理的官司和媒体讨论的骇人设想可以轻

兰亭集势郭去疾:上市就像高考 大数据以及云计算的机遇

在http://www.aliyun.com/zixun/aggregation/23800.html">兰亭集势位于北京798艺术区附近的办公楼里,墙上贴着各个国家业务的情况,不少外籍员工依然在忙碌.IPO两个多月的兰亭集市股价一直表现不错,但郭去疾一如既往的低调,在接受新浪科技采访时,郭去疾心情不错,主动说了一句,"我给你描述一下未来的电商吧". 未来 这个场景假设在未来的智能化生活,比如家里有一台冰箱,它能够通过用户往里存放的食物品类.用食进度,加上用户一些基本信

上市之后这两年:大数据公司Splunk采访手记

犹记得两年前,一家名叫Splunk的美国公司在纳斯达克上市,之所以令人印象深刻,是因为这是第一家主打"大数据"牌上市的公司.上市首日,其发行股价大涨109%,估值达到32.8亿美元. Splunk的高调上市,在当时引发了投资者对"大数据(Big Data)"板块的热切关注.时隔两年,如今的Splunk怎么样了?在那之后,大数据领域的投资状况经历了怎样的变化?现在,Splunk已经正式进入中国,前不久,记者对Splunk亚太及日本地区副总裁刘文熙进行了一番深入采访.

业内视角:Hortonworks眼中的大数据

文章讲的是业内视角:Hortonworks眼中的大数据,目前到处扩散的朦胧定义还不足以清晰表达大数据所带来的收益,Hortonworks公司的一位高管如是说.今天我们要从业内人士的视角出发,看看他们眼中的大数据到底是怎么一回事. 那么,大数据到底是什么?这一般技术人员会用经典的3V模型来解释--容量.速度以及数据多样性--这种说法几乎成为行业惯例.不过这种流行定义太过含糊不清,并没能真正解释大数据平台给使用者带来的切实利益. Hortonworks公司营销副总裁David McJannet认为,

时间轴:大数据时代的“生死簿”

时间轴能真实呈现用户更加个性化.隐私化.立体化.互动化的数据和信息,各类相关形式的创新产品和应用,被认为将蕴含巨大的商业价值. 一年前,Facebook.Path等诸多国外的互联网公司都开始运用了时间轴(Timeline)功能.简单说,Timeline是用户自我编辑的个人时间轴,用来记录用户的行为轨迹,并可以控制个人信息只给想展示的人.时间轴应用让Facebook用户可以与朋友分享他们的各类活动,创建一个动态的时间轴主页.时间轴赋予用户一个载体,将其在互联网上的零散时光串联起来,用全新的方式诠释

破解大数据应用难题 人工智能如何落地银行业

在科技金融借助"互联网+"迅速覆盖各行各业的当下,我国银行业金融科技化转型成效惊人.相关统计数据显示,目前国内大型商业银行的电子渠道交易占比已超过80%.大数据应用代替传统人工为银行业带来成本骤降的同时,大量沉淀数据也成为了各家银行的宝贵资源,如何释放数据的最大价值,数据如何为银行提供精准营销.风险管控.客户画像等服务,成为了每个银行技术团队亟待解决的核心问题. 业内人士认为,人工智能进入高速发展时期,语音识别.图像识别.机器学习等不少细分领域涌现了大量突破性研究成果.而作为数据量庞大

甲骨文推出Oracle大数据SQL(Oracle Big Data SQL)

北京, 2014年7月22日--企业正在寻求以创新方式管理尽可能多的数据及数据源.尽管Hadoop.NoSQL等技术提供了应对大数据问题的具体方法, 但是这些技术却可能引入数据孤岛,导致形成关键洞察力所需的数据访问及数据分析 复杂化.为了最大化信息价值,更好的处理大数据,企业需要逐步改变数据管理架构,使之变 成大数据管理系统,以无缝整合各种来源.所有类型的数据,包括Hadoop.关系数据库以及NoSQL.大数据管理系统在简化所有数据访问的同时,还应该帮助企业 利用人员的现有技能,保持企业级数据安