自“大数据”词汇诞生,“大数据是什么”、“大数据的核心价值是什么?”、“又怎样才能充分利用好大数据?”成为被问及最多的问题。经过短短数年发展,传统IT厂商各自加快了向大数据转型的脚步,也分别有了对于大数据的诠释。那么,对于IBM这家百年老店来说,在全新的大数据时代又有了哪些转变?
我们会在科幻电影中看到这样的桥段:hi,麦克(智能电脑的名字),告诉我去A大厦最短的路程该怎么走…hi,告诉我应该并购哪家公司?…hi,告诉我这种病症应该如何治疗…只需对着计算机说出几句话,就能获得最佳的结果。多年来,这是人们对人工智能的一种设想,如今,这也是大数据及分析的一种终极目标。
目前来看这种目标还很遥远,但IBM所从事的在大数据及分析方面的研究将这个目标拉近了许多,这就是“沃森”,或者叫做“认知计算”。
大数据和“认知计算”
如今对大数据的普遍看法是,数据就像自然资源,比如矿石或者石油;自然资源需要挖掘和提炼才能产生价值,比如从石油中提炼出汽油,数据也是如此。世界每天在产生着大量的数据,过去三年中产生的数据比之前人类历史上的总和还要多,如果不经过处理和分析,这些浩瀚的数据也如同未提炼过的矿藏,毫无价值可言。
经过分析的数据才具有价值,故而对企业而言,大数据及分析最大的魅力就在于能够为企业带来分析洞察力,依托数据更加科学的来进行决策,进一步推动企业生产力。那么,又该如何有效的进行大数据分析?如今很多厂商已经给出了不同的思路和解决方案,IBM采用的是一种“人工智能”+“大数据”的方式来提供大数据分析和服务,即“Watson Foundations”。
熟悉IBM的人们应当听闻过“沃森”,这台以IBM创始人命名的人工智能计算机曾经在《危险边缘》电视节目中战胜人类而一举成名。沃森能够战胜人类的“秘技”主要有以下几个: 能够识别自然语言,可以和人类交互;能够像人脑那样分析问题,从知识库中搜索证据来支持假设的答案,从而得出最可信的结果;具有学习能力,它会吸收人们给予它的新信息,对它所作的决定或者答复加以改进。
“沃森”的能力刚好适合如今的大数据分析:过去的数据分析都是静态的,是基于现有手头数据一次性的建模分析;但现在是个瞬息万变的大数据时代,每天都会产生大量的数据,比如微博和微信,这些都是有价值的信息。IBM认为,随着信息的增加,以学习的、交互的方式,随着数据的进一步增长逐步提高认知的分析行为,就是“认知计算”。
在IBM内部,“沃森”所代表的就是“认知计算”,IBM已经将认知计算作为未来大数据及分析的战略方向。
茁壮成长的“沃森”
当初在《危险边缘》节目中战胜人类的超级计算机“沃森”基于IBM Power硬件平台,实际上“沃森”的认知计算能力并不仅限于Power,而是能移植到其他IBM系统上。“沃森”所具备的的人工智能和机器学习等能力对应着各自的功能模块,这些模块可以软硬件剥离开,从而移植到其他平台。也就是说,IBM的Watson Foundations是一个开放式平台,这也让传统的大数据解决方案用户也能获得认知计算带来的好处。
IBM认为“沃森”代表了大数据及分析的发展方向,为此不惜投入重金,以建立“沃森”生态圈。
去年11月,IBM沃森开始向合作伙伴提供技术、工具和API编程接口,希望借助云服务和访问工具,利用沃森帮助合作伙伴开发他们的认知计算软件及系统。首批合作伙伴包括零售业的Fluid、医疗保健领域的MD Buyline以及健康管理领域的Welltok。另外,IBM还建立了一个沃森内容库,供应商可以为沃森提供内容,包括通用和专用的信息,如医疗保健数据资料等。
除了积极的构建生态系统,IBM在今年初宣布将为沃森组建一个独立的业务集团,致力于开发和商业化可支持运交付模式的、认知计算技术创新。IBM为新的沃森业务集团投入了10亿美元,其中1亿美元将用于风险投资,以支持IBM新构建的生态圈。新的业务集团的建立有助于IBM将新的基于沃森的软件、服务和应用更快的推向市场,有助于沃森的生态圈建立和商业化。
如今,IBM已经创建了三大类认知计算系统:新一代的对话系统,适用于保险业,帮助提高客户呼叫的效率;新一代的探索系统,可以帮助电信公司建立自我修复设备的人机交互的智能系统,给电信客户提供预警;新一代的决策系统,这是认知计算的最高应用境界,能帮助客户提供最佳的决策,比如根据客户过往购物情况和实时购物情况,预测接下来客户要买什么。
“沃森”如今也开始了商业化道路,IBM与许多医疗机构合作,来改变医学实践、支付和教学的方式。这包括与纪念斯隆-凯特琳癌症中心、 WellPoint、德克萨斯大学MD安德森癌症中心以及与克利夫兰凯斯西储大学勒纳医学院的合作。除了医疗保健行业,星展银行(DBS Bank)和尼尔森(Nielsen)在内的领先品牌都在探索如何利用沃森来更好地接触客户。
“沃森”正变得越来越受欢迎,因为它所代表的“认知计算”让大数据及分析变得更加简单,这正是大数据用户所需要的。