数据解读领域先行者WibiData

 

产品简介

在大数据市场,Hadoop的三巨头Cloudera、Hortonworks以及MapReduce已经占据了大部分份额。不过它们目前做的事情主要集中在将非结构化数据转换为结构化数据,为目标客户提供数据提取、分析的服务,让客户明白“为什么”。而Wibidata做的事情更加超前,它不是给客户呈递出大数据分析得出来的结论,而是直接根据大数据的结论,为客户提供如何应对的解决方案。它直接跳过了“为什么”,而告诉客户“怎么做”。

Wibidata的核心技术是将后端的Hadoop环境与面向客户的预测性应用连接到一起,包括一组HBase、数据格式化工具以及机器学习算法。此外,Wibidata还在总结其为同一领域内的客户所开发的应用之相似性,以便找出可重用的东西。

拿能源管理初创企业Opower来说,虽然这家公司已经是Cloudera的招牌客户,但是当它想让自己的SaaS工具做批量分析和做数据析取ETL处理以外的事时,还是得找Wibidata。Wibidata的新应用就可以让Opower从对用户的能源使用进行数据比较分析直接提升到向用户动态推荐相关产品了。

简而言之,wibidata瞄准的是用户自行开发定制应用这样一个利基市场,通过做专业的大数据软件包,成为基于Hadoop的商用套件提供商中的佼佼者。

发展历程

2010年Wibidata成立,不过这个时候Wibidata只是Christophe新项目公司Odiago的一项大数据产品。2011年11月,Wibidata的自有博客开始正式启用,并对外发布有关Wibidata的相关报告。同月,Wibidata参加在纽约举办的Hadoop World大会,并在会议上发言。大会上Odiago第一次公开地向世人介绍Wibidata系统和工作原理。2011年12月,Wibidata向外界开放其相关三个Java项目的源代码,分别是Hbase-maven-plugin、odiago-avro、odiago-common-flags。

2012年1月,Wibidata正式宣布从之前的Odiago更名为Wibidata。2012年2月,Wibidata发布其可用于在线推荐服务的平台介绍,其基于此理念的产品“生产者和收集者”的工作原理也随之公之于众。同时,Wibidata成功从NEA融资到500万美金,来自NEA的Jon Sakoda加入董事会,维基百科和Atlassian都成为Wibidata的合作客户。2012年4月,Wibidata推出新型图书馆业务——Wibi on Whales。2012年6月,Wibidata将整整8tb的维基百科的修正历史相关的文章下到系统内,来分析编辑的行为模式,并据此得出了非常详尽的报告,彰显了Wibidata在数据处理上的强大能力。2013年5月,Wibidata获得1500万美金的融资,此次融资来自Canaan Partners、NEA以及Eric Schmidt。其中,Canaan Partners合伙人Ross Fubini加入了WIbidata的董事会。

盈利模式

目前Wibidata的产品主要是帮助零售商和金融业用户建立自己大数据软件的工具,包括移动APP和 SaaS(软件即服务)软件。Wibidata通过出售允许客户构建自身大数据应用的工具来盈利。

在为客户提供结构化的“路标”来使用大数据的同时,Wibidata也为客户提供一些学习这些核心技术的培训课程如Boot Camp。在这项服务中,客户将与Wibidata的工程师相处四个星期的时间,为他们自己的公司开发出数据应用原型。Wbidata的工程师会为客户制定好项目规划,来帮助参与者更好的实施原型应用的开发。

总的来说,Wibidata是一家典型的为企业提供大数据服务的高科技企业。它的服务偏向于定制化,针对不同客户的大数据需求,为客户量身打造一套大数据的应用。Wibidata利用自身的技术优势,能够极大的提升客户公司接触客户端的效率。简单的说,Wibidata是大数据服务提供商,这个服务既可以是针对企业大数据需求开发的软件终端,也可能仅仅是提供一些咨询方面的框架。在这个过程中,Wibidata从中收取一笔不菲的费用。

竞争对手

随着近几年大数据概念的兴起,各式各样大数据创业公司如雨后春笋般冒了出来,其中Hadoop处于这个大数据革命的暴风眼。自从Hadoop在2008年作为Apache开源项目发布以来,其成本低、可扩展性以及灵活性让许多人对Hadoop寄予厚望。2011年开始,Hadoop正式成为主流,得到了包括EMC、IBM、Informatica、微软和甲骨文等主要数据库和数据管理厂商的积极接受。

不过数据处理是一回事,大多数的Hadoop用户最终需要的还是数据分析。这个时候,Wibidata、Datameer、Hadapt等专门针对Hadoop的数据访问、商业智能和分析工具厂商应运而生了。Wibidata这个弄潮儿必然要经受许多来自于同业的竞争,下面列举的是同Wibidata一样在大数据分析领域耕耘的四家初创公司的基本情况,它们有的在几年前就完成融资,只到最近发展才开始加速,有的目前还处在隐身模式,忙于为公司即将推出的或将改变游戏规则的科学技术做收尾工作。

融资状况

Wibidata在成立初期并没有宏大的战略规划和目标,仅仅就是想成为第一个基于Hadoop贸易应用套件的软件供给商。虽然目标不大,但是通过Wibidata的融资情况来看,其所做事情被看好程度还是很高的,也正如Cloudera公司的CEO Mike Olson说的那样:“谁若有大志来解决Hadoop与应用之间的链接难题,我们可以很快给予资金支持,而且这笔资金就随时放在那边。”

从以上融资情况来看,Wibidata已经共计解决了2000多万美金的融资。而且Cloudera也确没有食言,在A轮融资时就给予了支持。Wibidata的最新融资将用来扩充自己的技术团队,并开设更多的办公点。相信这也是Wibidata想要继续壮大发展必须要去做的两个方面:一是继续深化自己的核心技术,提供产品竞争力;二是提升推广力度,建立更广泛的合作网络。

管理层

按照Wibidata官方所称,他们目前取得的成就和杰出的产品解决方案要归功于他们拥有世界顶级的投资商和富有创造力的团队。

Wibidata目前的团队总共有25位员工。在新到融资的支持下,wibidata也在积极的扩充人员数量,不断开发新产品。预计2014年初团队人数将加倍。

发展前景

当前所有企业的商业数据每隔 1.2 年就递增一倍,数据信息的大爆炸不断提醒着我们,未来将会因大数据技术而改变。IDC 的研究显示,到 2015 年,大数据将带来 169 亿美金的市场。另据预测,2016年Hadoop将创造出 8.13亿美元的价值,极大推动软件市场的发展。Wibidata作为和企业级数据仓库体系结构核心技术Hadoop紧密相关的初创企业,一直呈现出非常好的发展前景。

Wibidata重点针对金融和零售业推进应用开发。预期的成型产品将会包括数据格式化的预定义模式、预置预测模型等。此外,软件还将根据用户角色的不同(数据科学家、系统工程师、业务用户)而展现不同的界面,根据用户需要来提供与数据的交互方式。

Wibidata作为数据解读领域的佼佼者正在蓬勃发展,同时它也面临许多挑战。比如,从数据分析的层面上揭示的各个变量之间的关联如何具体到行业实践中?这要求执行者不但能够解读大数据,同时还深入了解行业,此类人才的稀缺性可能会制约Wibidata的发展。


原文发布时间为:2013-09-03


时间: 2024-07-31 09:05:00

数据解读领域先行者WibiData的相关文章

你看一场电影 大数据解读了这些"秘密"

文章讲的是你看一场电影 大数据解读了这些"秘密",电影票在线销售已超过了线下的影院销售,对应的,越来越多的用户数据也被收集分析.结果是,你买了一张电影票,跟着就会知道你看完电影可能会吃顿火锅,或者去附近的如家住一晚. 网络购票数据对电影的线上宣发有一定的指导作用,主要体现在为感性决策"纠错",指导相对精准的营销,助力票房"增量".但大数据的实质"疗效"如何仍是见仁见智的. 电影"消费数据"或许能相对客观地反

大数据人工智能领域从菜鸟到高手晋级指南

我们身处一个"技术爆炸"和"共享.开源"的时代,先进技术的更新迭代速率超过了历史上任何一个时期,而且这些技术也不再闭塞,人人都可以接触并学习.终身学习已经是我们每个人不得不面对的问题,这一点在大数据/人工智能领域体现的尤为明显:层出不穷的新技术,一方面为我们带来了便利,但同时也使我们面临难以高效学习和选择的窘境.因此,在这样的时代背景下学习大数据知识,需要有相适应的逻辑和方法. 本文试图帮助各位读者用好各类"共享.开源"的学习工具以及学习渠道,躲

大数据存储领域的八位明星

正如存储技术分析师Greg Schulz所言,"大数据无与伦比,它拥有承载一切的能力."也就是说目前市场上已经存在多款独立存储工具,旨在帮助存储管理员打理规模日益膨胀的大数据海洋.同样在意料之中的是,其中大部分与Hadoop关系密切. SGI InfiniteStorage SGI InfiniteStorage通过虚拟化技术让存储转化为一整套混合体系,其中既包含性能超群的闪存机制.又拥有成本低廉的磁带方案.而这一切都建立在数据始终在线的基础之上,也就是实现数据对用户的透明化. &qu

100G以太网将在数据中心领域强势增长

近几年,随着互联网.云计算和大数据等产业的加速发展,诸多行业的竞争明显加剧,IT基础设施已经成为应对这些新趋势,提升企业竞争力的关键,因此各行业的数据中心建设步伐也在不断加快.而在数据中心内部,新一轮的以太网升级也在进行之中,根据调研机构Crehan Research的最新调查报告显示,未来几年,100G以太网将在数据中心领域强势增长. Crehan Research的总裁指出,云计算.大数据的蓬勃发展,使得数据中心开始向云数据中心.超大型数据中心演进,而在这一过程之中,100G以太网交换机将开

图解数据科学领域的职位划分以及职责技能

随着数据科学领域的招聘信息越来越多,范围也越来越广.Datacamp根据最新的数据科学相关招聘信息,全面的了解各个行业之间数据科学领域每个职位角色之间的差异,以及所赋予的工作职责. 最主要分为以下几个职位:数据科学家.数据分析师.数据架构师.数据工程师.统计学家.数据库管理员.业务数据分析师.数据产品经理.下面通过信息图区分每个职位的角色介绍.必备语言技能. 1. 数据科学家  角色/任务 清洗,管理和组织(大)数据 必备语言 R,SAS,Python,Matlab,SQL,HivePig,Sp

陈凯:用数据解读爸爸去哪儿第二季

这个时代学习能力是最重要的能力,而能够在周末的时间进行学习的人就更有竞争力.同时选择大数据这一方向来学习的人则是当今大数据时代最具有竞争力的人. 今天之所以选择用大数据解读爸爸去哪儿第二季这个话题是因为娱乐性的话题比较容易理解.大数据的概念起码要包含数据.技术和应用三个方面.因为有了越来越多的数据才有了大数据这一概念,才能够运用数据能够做很多的事情.这其中,最重要的就是互联网的发展.因为数量非常大而且有很多非结构化数据(文本.视音频等),这样的数据就必须用智能化的分析方法才能解决,因此这方面的大

上市公司“掘金”大数据 多领域大数据应用受热捧

<关于促进大数据发展的行动纲要>(简称"<纲要>")有着"大数据国家战略"之称,其下发点燃了上市公司掘金大数据产业的热情.据上证报记者最新统计,至今已有近百家上市公司公告涉足该业务,或借力BAT挖掘数据价值与再造,或在定增项目中将大数据作为核心业务. 究竟什么样的数据才是有价值的数据?嫁接BAT.兼并收购是否是大数据变现的有效手段?去伪存真,哪些领域的大数据应用有望率先爆发?记者从多方调研专业人士,以寻求上市公司掘金大数据背后的价值所在. 掘

2015年推动数据中心领域变革的十大趋势

近日召开的加特纳集团IT运营战略和解决方案峰会上,分析师DavidJ.Cappuccio概述了有望在明年及之后影响数据中心的十大IT趋势. 数据中心技术正以惊人的速度不断涌现和不断变化.只要想想像虚拟化这样的新兴概念如何在短短几年内变成一项必不可少的基础设施技术,或者想想固态硬盘在高性能存储缓存和虚拟存储区域网(SAN)部署环境中扮演越来越广泛的角色. IT专业人员需要密切关注新动向,并考虑那些产品或项目给数据中心以及公司业务可能带来的影响.在近日召开的加特纳集团IT运营战略和解决方案峰会上,分

大数据解读2014年中国裁判文书公开之(一)

法律大数据专题文章计划: <大数据解读2014年中国裁判文书公开>为本次系列文章的主题,本文通过业界成熟大数据技术,希望对公开裁判文书分析.统计,从而对裁判文书公开情况量化评估.本系列文章具有尝试研究性质,文章的数据全部来自互联网全网公开数据,所得结论仅用于研究讨论目的,本文的评价依据均来自数据,不代表本文作者及作者所在机构立场. 本文为之(一),主要内容是对2014年全国及关注热点地区的裁判文书总体公开效果进行量化分析:专题之(二)通过大数据分析2014年全国民事案件的公开情况:专题之(三)