作者: Andrew Nusca,Robert Hackett,Shalene Gupta
译者:朴成奎
摘自:财富中文网
大数据不只是要处理很多的数字,还得要通过这些数字建立模型、深入挖掘,并且寻找那些有可能改变企业运营方式的信息。以下谨为大家介绍20位大数据领域的顶尖人才。
Pinterest数据科学家安德莉亚·伯班克
Pinterest是一家以图片为主的社交网络,数据科学家安德莉亚?伯班克主要负责该公司的A/B测试,评估公司网站、APP的外观或功能变化会对它的6000万全球用户产生哪些影响。如果Pinterest网站上的某个小模块让你想邀请朋友也来玩一玩,或是某一封它发来的推荐邮件让你关注了更多话题,那么这很可能就是伯班克团队的那只“看不见的手”起了作用。她在今年三月的一次行业会议上表示:“为了今后能为几十亿用户提供服务,我们已经针对几百万用户做了数百次试验。”试验还拓展到了Pinterest自身的运营上。伯班克最大的成就之一,就是给Pinterest的其他员工赋权,让他们也能开展试验。她表示:“以前只有一个故障点,但也只有一个知识点,现在不同了。”——Andrew Nusca
0xdata公司物理学家、黑客阿诺·康代尔
阿诺·康代尔从小就生长在一个科研氛围浓厚的环境中。他出生于瑞士一个叫做下锡根塔尔的小村子,这个村子恰好位于拥有欧洲顶级粒子加速实验室的保罗谢尔学院(Paul Scherrer Institute)和欧洲大陆最著名的科技院校苏黎士联邦理工学院(ETH Zürich)之间。在学习粒子物理学和超级计算机学期间,康代尔曾经在电脑上建立过宇宙的模型。后来他搬到美国加利福尼亚州,在斯坦福大学直线加速器中心的全国加速实验室中工作(SLAC National Accelerator Laboratory),后来又开始创业,成为Skytree公司的创始工程师,并且设计了几套高性能的机器学习算法。现在他是Oxdata公司h2o数据分析平台的核心开发者,他开发的这个h2o平台,被编程社区GitHub的成员誉为最优秀的开源Java机器学习项目,而且它还可以兼容流行的统计编程语言——R语言。他在Oxdata公司的头衔是“物理学家兼黑客”。——Robert Hackett
Hortonworks联合创始人阿兰·默西
阿兰·默西最早在雅虎公司(Yahoo)工作,现在已然用途极广的开源存储和处理软件Hadoop在那时尚处于早期原型阶段。默西的团队的任务就是扩展Hadoop的功能,让它用于雅虎的网页搜索。于是默西研发了一个名叫YARN的资源负载管理系统,它的作用大致相当于Hadoop的一个操作系统。默西表示:“第一版的Hadoop看起来就像还在用Notepad的Windows,但是我们真正想要的是能用Powerpoint、Word和Excel的Windows。”这正是YARN的魅力所在:它允许用户向Hadoop中插入多种应用以存储各类信息。默西表示:“我家里有两个孩子,但YARN就像是我的第三个孩子。”——Robert Hackett
NuoDB首席执行官巴里·莫里斯
很多科技公司都想发起一场技术革命,但是很少能获得上一波技术革命领导者的支持。马萨诸塞州剑桥市的NuoDB公司却一举网罗了上一波数据库革命“四大天王”的其中之三——Ingres公司前CEO加理?摩根泰勒、Sybase公司前CEO米切尔?克兹曼、Informix公司前CEO罗杰·斯普尔。只有最后一名“天王”,也就是甲骨文(Oracle)的CEO弃权了,但他也身在投资人之列。这么一家名不见经传的公司何以有这么大的号召力?因为NuoDB的技术解决了一个多年来被行业视为“圣杯”的问题:如何让一个数据库在多个服务器上运行。“关键在于用更多的机器,而不是更大的机器。”该公司CEO巴里?莫里斯表示:“那个问题听起来虽然简单,但一直没得到解决。”DuoDB公司成立于2010年,现在这家公司已经签下了一个大客户——欧洲第二大软件厂商达索系统公司(Dassault Systèmes)。另外莫里斯认为,公司正在飞速朝着一个“新的聚焦点”迈进。他认为DuoDB将走上舞台的中央。“它的意义不在于数据的规模或运行速度,而在于形成一种数据导向型模式。持续改进的能力才是它的革命性所在。”——Andrew Nusca
Beats Music 公司大数据工程总监布莱恩·罗格斯基
要想让布莱恩·罗格斯基谈谈他在Beats Music公司的工作细节真是不容易,不过Beats Music刚被苹果(Apple)收购,考虑到苹果一向神神秘秘的作风,倒也没什么可奇怪的。(这笔交易于今年五月宣布,上周五完成。)不过罗格斯基依然是三句话不离本行。他表示,现在企业都有兴趣更深入地进行实时数据分析,而且也有兴趣在企业内部加大数据的分享力度。另外很多公司也想利用大数据提高APP的个性化体验。那么罗格斯基打算如何在Beats公司跟上这股潮流呢?他表示:“你必须自己理解其中的奥妙。由于我目前的角色,我对这个问题不能说太多,现在还是说说大趋势吧。”——Robert Hackett
雅虎实验室研究员达尼埃尔·凯西亚
小时候,达尼埃尔·凯西亚最想当一名警察,为此他还买了一辆玩具摩托车。不过现在在雅虎实验室(Yahoo Labs),他对城市的了解绝对细致入微——尽管只是在数码层面上。凯西亚拥有计算机科学博士学位和麻省理工学院(MIT)城市研究专业的博士后学位。目前他主要进行广域的城市研究。比如他构建了一款游戏,问人们喜欢哪种城市景观,然后把评分放在Facebook上进行病毒式传播。凯西亚会对结果进行研究,以确定人们喜欢或不喜欢哪种城市景观,以便最终设计出更好、更漂亮的城市。他认为:“计算机科学就是一门构建工具的学问。我想做一些新的事情,一些能对现实造成影响的事。而全球有超过一半的人口都住在城市里。”——Shalene Gupta
微软研究院计算生态与环境科学小组负责人德鲁·帕维斯
微软(Microsoft)内部有一个叫做“比尔评论”(Bill Reviews)的保留节目,也就是员工们可以在创始人兼董事长比尔·盖茨面前提出自己的创意。当微软研究院剑桥实验室(Microsoft Research’s Cambridge Labs)的计算机学负责人史蒂夫?艾默特在一次“比尔评论”中提出,要由剑桥实验室出资,在公司内部建立一个生态学研究小组时,“那真是一次糟糕得出名的会议。”——时任普林斯顿大学(Princeton University)生态学家的德鲁?帕维斯如是说。但是最后比尔·盖茨改变了主意,很快微软聘请了帕维斯作为这个小组的领头人,负责建立地球生态系统的预测模型。自从微软的“蓝天”研究部门成立后,帕维斯已经带领科研团队开发了一个模拟地球所有生命的“马丁利模型”。这个项目可谓雄心勃勃,虽然有些“唐吉诃德”色彩,但它的部分成果说不定最终也能应用于实际。帕维斯表示:“国民经济中发生的每一件事,都可以放在一定的环境因素中考量。”他随口道出全世界面临的几大最严重的挑战,包括人口老龄化、癌症、食品安全、气候变化和替代能源等问题。对于生态学和生物学,帕维斯补充道:“这些东西将成为21世纪经济的核心驱动力。”
IBM沃森与认知烹饪小组高级软件工程师弗罗里安·皮内尔
自从IBM的“智能”电脑系统沃森(Watson)在电视智力节目Jeopardy中战胜了人类对手之后,IBM还想试试它到底能把智能计算的边界推到多远。最近IBM决定让沃森进军烹饪界。作为一名受过专业训练的厨师,弗罗里安·皮内尔也是IBM的“认知烹饪”团队的一员。皮内尔表示:“我们之所以把重点放在美食上,是因为美食是大家都关心的东西,而且我们可以很容易地创造出原型产品。现在我能把对食物和计算机科学的热情融合在一起,这令我大喜过望。”这个团队首先从各种食材和调料着手,但是他们研发的各种食物的组合呈指数级增长,催生出了大量潜在的美食食谱。比如在今年德州奥斯汀的SxSW大会上,沃森系统就在IBM的美食卡车上发明了一种澳洲巧克力卷饼,食材包括巧克力、牛肉糜、青豆和大豆。听起来虽然是一道很难吃的菜,不过皮内尔却表示:“它大获成功,非常好吃。所以我们的目的就是要启发用户,帮助他们开发他们自己永远想不到的美食配方。”——Robert Hackett
Cloudera公司首席科学家,西奈山医院基因与基因组学助理教授汉默巴切
身为西奈山医院(Mount Sinai Hospital)基因与基因组学的助理教授,杰夫?汉默巴切虽然没有这个专业的博士学位,但丰富的经验让他绝对称职。他曾是Facebook最优秀的数据学家之一,后来他放弃了被广告渗透到各个角落的社交媒体业,成了Cloudera公司的首席科学家。Cloudera是一家基于Apache Hadoop平台的企业软件供应商。现在汉默巴切又与西奈山医院的基因与基因组学负责人埃里克?沙特合作,试图把大数据分析带入到医疗保健领域。沙特指出:“他正在定义一个新的领域,以后这个领域将成为一门会发放博士学位的学问。现在没有任何一门学科在教授他所做的事。”汉默巴切正在构建管理和运算人体健康数据所需要的基础架构,以建立更好的医学预测模型。沙特表示:“对于医疗业和医疗机构来说,现在正是他们开始启用大数据分析引擎的时机。我们和杰夫这样的人才合作,充分说明了医学将来的走向。”——Robert Hackett
CloudFlare联合创始人米歇尔·扎特琳
如果说互联网也有它自己的中央情报局,那么这块招牌可能要落到CloudFlare公司身上。这家旧金山的公司监控着全球5%的网络流量。公司创始人之一米歇尔·扎特琳2009年在哈佛大学(Harvard University)遇到了另外两个合作伙伴——马休·普林斯和李?霍洛维,并于同年创办了这家公司。CloudFlare扮演了一个网站与恶意用户之间的缓冲区的角色。如果CloudFlare判定一名用户为友好用户,它就会加快他所享受的服务的速度。如果它判定一名用户为垃圾邮件发送者或者机器人程序,它就会降低他的服务速度,或者是要求对方输入验证码。扎特琳表示:“十年以前,我知道我想成为一个大而重要的团队的一份子,但当时我并不确切地知道这意味着什么。但是现在我感到很幸运,因为我找到了CloudFlare。我想象不出还有比帮助客户更好地经营他们的业务更好的事了。”——Shalene Gupta
Jawbone数据副总裁莫妮卡·罗加蒂
在Jawbone公司,莫妮卡·罗加蒂有两个职责。首先是弄清楚该公司的Up智能腕表收集的数据都代表了什么。其次,构建以智能方式使用这些数据的新产品。罗加蒂表示:“我们发现了关于我们如何睡觉、活动和进食的许多新的信息,它们都是之前无法发现的。以前我们只能对100个人进行睡眠研究,但是现在我们可以研究10万个人的睡眠信息。”也就是说,罗加蒂和她的团队能够了解人们为什么会失眠。比如华盛顿的居民可能会因为一次总统就职典礼而兴奋难眠;伊斯坦布尔的居民可能会因为中东爆发的抗议而睡不着觉;笃信天主教的罗德岛居民可能因为教皇的辞职而失眠——然后,该公司可以把这些信息反馈到Up智能腕表上,并调整他们的行为。罗加蒂指出:“我们充分地利用了这些数据反映出的见解,并且利用它们来鼓励人们保持最佳水平。”——Andrew Nusca
施乐欧洲研究中心高级研究员欧诺·佐伊特
孩提时代,欧诺·佐伊特梦想着成为一名乐高积木的设计师。8岁时,他拥有了人生中的第一台电脑,它点燃了一个男孩对人工智能的兴趣。如今佐伊特已经进入施乐欧洲实验室(Xerox Labs Europe)工作,他研究的重点是如何缓解洛杉矶的交通拥堵。佐伊特表示:“我们对停车问题了解的不多,因为它需要大量时间来观察。”为此,佐伊特的团队在全市各处的停车场安装了大量传感器。传感器收集的信息会反馈到一款智能手机应用上,这样司机就可以随时了解哪些停车场已经停满了,哪些停车场的车位还空着。更妙的是,城市可以根据这些数据调节这些停车场的停车费,以降低高度拥堵地区的车流量。自从这个项目在2012年问世以来,洛杉矶的交通拥堵已经缓解了10%。——Shalene Gupta
Eventbrite公司工程副总裁帕特里克·普尔斯
帕特里克·普尔斯曾经告别科技业整整五年,这期间他转行做了一名职业扑克玩家。不过职业扑克市场在2010年萎缩得非常厉害,于是他决定重返科技行业。他并不为他的选择后悔,他说:“分析数据跟玩扑克很像。你玩了几千手牌,你也了解了人,你也处理了数据,而且你会留心寻找一些显眼的东西。这些都是共通的。”在Eventbrite网络售票公司里,普尔斯和他的团队开了一个推荐系统,能够根据用户已经浏览的内容,向他们推荐他们可能感兴趣的大型活动。这个系统的反响很不错,现在每周大约有100万人在Eventbrite上购票,其中近半数都是回头客。普尔斯的下个项目,是要想出怎样才能最好地卖掉需要预订座位的活动的门票。
Dropbox首席科学家西尔瓦诺斯·李
有“神童”之称的西尔瓦诺斯·李只花了短短两年时间,就从斯坦福大学获得了计算机科学与数学的双学位。他在毕业后直接进入了金融行业,但是科技业的诱惑还是太强了,于是他在2012年加盟Dropbox。凭借其商业背景和科技知识,他成立了一支团队,专门从事数据学研究。他曾经负责过一个叫做Project Harmony的通讯软件,它使Dropbox的用户可以实时查看其他用户对共享文档的修改,并可与其进行讨论。另一个跟销售有关的项目是查看是否有来自同一家公司的员工在同时使用Dropbox,如果有就为他们提供超值套餐。西尔瓦诺斯?李的老板王晨立(音译)表示:“他的背景横跨科技、数学和商业实务,非常难得。这使他的数据科学研究鹤立鸡群。”——Shalene Gupta
Airbnb软件工程师苏拉比·古普塔
苏拉比·古普塔非常喜欢旅行,经常替亲朋好友规划旅行线路。作为斯坦福大学(Stanford University)计算机科学专业毕业的研究生,她对摘要的艺术非常着迷——仅仅短短数语就能尽得其要,而无需阅读整篇文字。早先古普塔在谷歌(Google)工作期间就曾研究过租房服务公司Airbnb。她对Airbnb的数据所能提供的可能性很感兴趣,于是她主动联系了Airbnb跳槽到这家公司。短短四个月后,她就显著改进了Airbnb的搜索引擎。现在古普塔正在试图压缩Airbnb的所有列表,创建摘要,以便用户可以迅速了解不同城市的风情。她表示:“总的目标就是,当人们旅行时,我们怎样把他们吸引到Airbnb来?当他们想去旅行的时候,我们怎样让他们获得我们的信息?”——Shalene Gupta
美国运通GMS IM平台与大数据项目副总裁斯瓦蒂·辛格
斯瓦蒂·辛格的技术背景几乎无懈可击,其中包括从杜克大学(Duke University)获得的机器学习博士学位。但她的性格却热衷经商。她是美国运通(American Express)MyOffers服务背后的主要智囊,这项服务旨在让美国运通的会员在需要的时候获得他们想要的东西。比如现在是中午,你又恰好想吃墨西哥菜,美国运通就会送你一张附近墨西哥餐厅的优惠券。她负责的另一个工具可以让商家比较自己的年度表现。她的老板塞斯特里?杜尔瓦苏拉表示:“她有很强的技术背景,但是她也可以像一个领导者一样,和其他领导谈事情。每次我们讨论数据的时候,她都在场。”——Shalene Gupta
Adobe Digital Index首席分析师塔玛拉·加夫尼
塔玛拉·加夫尼利用数据来预测未来。在Adobe数字系统公司,她的团队负责从使用Adobe云服务的用户那里反馈的数据来预测各种问题,比如哪部片子会获得奥斯卡奖,哪部大片会卖座,在冬季购物季有多少人会在网上购物等等。她的预测也的确非常了不起,在去年的圣诞购物季,加夫尼团队的预测只比实际情况低了1个百分点。她的经理朱莉?麦肯蒂表示:“她对科技的理解再加上她对人的行为的兴趣,使她非常与众不同。她好奇心很强,喜欢对数据划分模式、追踪线索,对事情的演变提出假设。”加夫尼的下一个项目,是对各种移动购物应用进行预测。——Shalene Gupta
Rent the Runway首席分析官维贾伊·苏伯拉马尼安
第一眼看去,在这样一家经营时尚业务的公司里,维贾?苏伯拉马尼安的工作貌似并不光鲜。不过作为时装租赁服务Rent the Runway的首席分析官,恐怕很少有人对女性时尚潮流的理解比他更深了。2010年,他加入公司不久后,便构建了一个评估模型,能够估算漏掉的需求、产品寿命以及库存服饰的使用场合。由于公司每个季度都要从时装设计师那里购入成卡车的时装首饰租给顾客,因此维贾的模型可以说给公司省了一大笔钱。他表示:“如果你把三个数据来源放在一起,你就可以建立一个体现购物习惯的模型框架。它告诉我们应该去找哪种风格的衣服,才最有可能让我们穿出明星范。”——当然还有尽量要避免哪种搭配。维贾的下一个项目是整合Unlimited反馈的新型数据——Unlimited是该公司为了进军日常便服领域而推出的一个项目。维贾表示:“我们的经典模型都围绕着你要去的重大场合。你可能穿衣比较前卫,但如果你出席正式场合,你自己的穿衣风格就不重要了,重要的是适应场合。而Unlimited则是理解用户穿衣风格的开始。”——Andrew Nusca
ShareThis数据科学副总裁曲艳
很多人可能很难相信,曲艳(音译)的工作影响了95%的美国读者。曲艳在社交网站公司ShareThis开发了一个叫做“社交质量指数”(Social Quality Index)的指标,可以衡量围绕一定网络内容的社交活动,并帮助广告主和出版商锁定目标群体。曲艳表示:“技术方面并不难,难的是怎样发现一个商业问题,然后把技术应用上去。”曲艳在卡耐基梅隆大学(Carnegie Mellon University)获得了自然语言处理专业博士学位。在进入ShareThis工作前,她还曾领导过美国在线(AOL)的Advertising.com的Advance Research研究团队。现在,她很喜欢迎接移动电话带来的挑战,而且手机也不允许网站植入cookies来确认重复访客。这些都需要曲艳收集更多的数据。——Shalene Gupta
Data Collective公司管理合伙人扎卡里·博格
早在2011年的时候,扎卡里·博格与马特·奥克多就在旧金山湾区成立了一家风投公司,专门关注大数据领域的创业,这种眼光在当时无疑是非同一般的。从那时起,这家公司的业务也随着大数据的浪潮而水涨船高。博格表示:“成本曲线很快就被越过了。急速下降的成本使这些新方法得以冲击那些旧的行业。”今年,该公司又推出了自己的第三支基金,使它的总融资额达到将近2.5亿美元。该公司把赌注押在了短期借贷创业公司LendUp,以及内存数据库服务MemSQL等新锐公司上。据说MemSQL要比市面上现有的内存数据库便宜得多也快得多。博格表示:“科技为广大的市场和行业开放了前所未有的投资机会。我们的一个观点是,每个部门和行业都会被科技彻底扰乱,真是令人兴奋。”——Andrew Nusca(财富中文网)
(责任编辑:mengyishan)