LinkedIn张溪梦的分析哲学:大数据要做小做快

在很多人的印象里,职业社交网站LinkedIn是一家很另类而神秘的社交网站,但它的价值逐渐让世人侧目。在日前举办的2013 Teradata大数据峰会上, LinkedIn商业分析部总监张溪梦(Simon Zhang)在接受IT专家网记者的专访,介绍了LinkedIn如何通过对数据分析技术的利用创造企业的价值。

LinkedIn的目标,是联结世界上所有的专业人士,让他们能够更有效率,更成功。目前,LinkedIn在世界范围内的用户已增长到2亿多,86%的财富100强企业正在使用LinkedIn的付费解决方案。在LinkedIn上一季度的1.61亿美元营收中,“人才解决方案”的贡献超过了一半。

这样的成绩背后,是张溪梦以不足60人的商业分析团队,通过集成数据架构、BI、数据挖掘和分析,支持70%现有的4000名LinkedIn内部员工,涵盖了研发、产品、市场、销售和运营等五个主要商业职能部门,包括公司的三大业务分支。

有人力资源专家甚至声称,LinkedIn Recruiter付费招聘服务(LinkedIn的旗舰产品, “人才解决方案”业务的核心)是“一枚核弹”,将凭借庞大的数据库,在今后的招聘市场获得无可企及的地位。

LinkedIn如何做到这一点?张溪梦抽丝剥茧,深入介绍了LinkedIn的分析哲学及其背后的技术支撑。

LinkedIn Corp商业分析部总监张溪梦(Simon Zhang)

从金字塔到菱形的分析哲学

分析工作的任务,张溪梦认为是“谋断”。李世民痛失魏征那段“以铜为镜”的名言不再赘述,在张溪梦看来,谋断就在于根据过去和现在定制未来,对象当然就是数据。

LinkedIn的三种主要的数据类别,是用户行为数据,用户身份特征数据,以及职业网络数据。如果说2亿用户的数据已经不足以让现在的存储硬件和数据库感到压力,那么相互关联的职业网络数据,绝对是当之无愧的大数据量。

“兵在乎精,不在乎多”,“兵贵速,不贵久!”古中华的兵家圭臬,是张溪梦的大数据智慧所在。他提出了两个准则,大数据要做小,做快,因为速度决定价值与成败。

数据分析的传统金字塔结构,从数据及数据质量管理,先生成商业智能和报表,再进行专门的分析,以及深度分析,最后形成商业洞察,但张溪梦表示,正如伟大的画家不会借他人之手描绘心中的美景,分析师不需要借助现成的报表来创造未来,也就是说,在LinkedIn,商业智能报表要放在分析层之上。

但改造之后的金字塔结构,仍然存在两大问题,首先是功能层之间脱节,更可怕的是,底层占用了90%的资源。张溪梦的做法,对底层“动手术”,让金字塔结构“进化”成菱形结构,当金字塔底座实现了小,整个分析流程的面积减少一半,资源的效率获得100%的提高,而很大的数据变成很小的数据,处理速度也得到质的飞跃。

LinkedIn并没有就此满足,再次把菱形做为新的金字塔“进化”,如此反复,至到不能再“小”,进入第二阶段的进化,进行球形的应用滚雪球的球形,会形成更大的价值环。

张溪梦对这套哲学的功效十分欣喜:“我刚开始加入LinkedIn,每天从早晨8:30工作到半夜两三点,一年却只不过出500个报告,支持不到200人;但现在,我的团队每人每天就能帮助别人10次。”

然而,问题来了:今天没有价值的数据,谁能保证在明天没有价值呢?信息的不对称造成的后果,很多企业都深有体会,因此,尽可能地搜集数据,是很多专家的忠告,这也是大数据之所以“大”的原因之一。

“情报永远是不够的。”张溪梦回答说,数据量在增加,也意味着存储和分析成本的增加,分析的速度的下降,随之而来的,往往是价值(ROI)在下降。

为何选择Teradata

LinkedIn的分析哲学得以贯彻实施,IT的力量当然功不可没。张溪梦表示,科技是LinkedIn拓展分析规模的基石。在LinkedIn,Hadoop、Aster Data和Teradata是商业分析部赖以运作的三大平台。

LinkedIn与Teradata的合作,其实是从Aster Data开始,后者现在已被Teradata收购。张溪梦介绍,在LinkedIn的基于社交网络的分析模型中,基于传统的关系型数据库进行分析,多级关系网络的计算,一次就需要好几天甚至一个星期才能完成,后来采用了Aster Data,分析效率获得极大的提升,目前的分析时间已经缩短至几个小时。

在尽管LinkedIn在开源技术上花费了很多精力,并自主研发出了多种开源技术,但在数据分析层面,张溪梦更钟情于采用稳定的商业软件。他表示,开源技术更新快、功能多,也意味着不稳定;闭源反应慢,但同时也是稳定的代名词。

张溪梦说,LinkedIn不是一家数据库公司,采用现有的成熟的技术更有利于公司的商业推进速度,而Teradata是最成熟的企业数据仓库供应商,其解决方案的优越性已经得到市场的验证。相比之下,采用Hadoop平台的LinkedIn,还需要在中间增加了一个安全层,以保护会员的隐私和利益。

张溪梦的理由,可以概括为专业,权威。事实上,更深层次的是二者对专业的理解不谋而合。张溪梦希望把大数据做小做快,Teradata大中华区总裁辛儿伦恰恰不断地强调无须贪多,而是要学会舍弃数据,只分析有用的数据。Teradata的数据分析方法是I(整合)、D(探索)、A(行动)。Aster Data就是Teradata的数据探索平台,其设计的理念,就是要让不同层次需求的人都能进行各种分析,轻松探索大数据的价值,提供了SQL、MapReduce、统计、图形、路径、时间和地理查询等工具,正适合LinkedIn的需求。Teradata平台则主要用于支持BI。

忠告“准数据科学家”

在这个被称为“大数据时代”的时代,一个叫做数据科学家(Data Scientist)的新职业被认为即将抢手,包括EMC、微软、Teradata等公司都在谈数据科学家,认为是大数据时代的数据分析的必然需要,甚至有评论称,数据科学家是二十一世纪“最性感”的职业。

而在LinkedIn的模式中,数据科学家的精准判断尤为重要确认哪些是最有价值的数据,不是单靠软件平台就可以实现的。张溪梦表示,最好的分析师要比PM更了解产品,要比Marketing更了解市场,要深刻理解软硬件之间的关系……

毫不夸张地说,成为LinkedIn的分析师也是一种挑战。所以,张溪梦的“兵在乎精,不在乎多”的另一种含义,也是分析团队的“精”。

那么,要如何应对未来的挑战进入这个“性感”的职业?张溪梦的忠告是,不要因为Data Scientist是当前的热门职业而选择这个行当,你的长远目标更重要。他最强调的一点就是兴趣,认为兴趣会驱动你找到变得专业的方法。

翻开张溪梦的履历,我们会发现一件有趣的事情:他曾经是一名神经外科医生。“我是一名称职的医生,但我更享受数字,更享受逻辑。”张溪梦说。

作者:雷霆

(责任编辑:蒙遗善)

时间: 2024-07-28 17:50:22

LinkedIn张溪梦的分析哲学:大数据要做小做快的相关文章

GrowingIO创始人兼CEO张溪梦:互联网下半场,数据如何驱动企业突破增长重围?

最近十来年,国内互联网企业取得了飞速的发展,除了自身实力以外,很大程度上是时代红利推波助澜的作用.人口红利.流量红利和资本红利,这三大红利催生了中国独有的增长模式,『买』 的模式:买流量.买用户. 回国创办 GrowingIO 之前,我一直在美国从事与数据有关的分析.运营和变现工作.在美国,『数据驱动增长』已深入人心,各类工具也非常丰富,然而在中国,很多互联网公司还停留在只看 PV.UV.访问时长.跳出率等最基础的数据上. 海外数据分析已经很成熟,中国仍有空间和市场,这正是 GrowingIO

前 LinkedIn 高级总监张溪梦:6 个步骤,学会数据驱动产品的秘诀

3月10日,起点学院特邀 GrowingIO 创始人 ,前 LinkedIn 美国商业分析部高级总监 @ 张溪梦做客免费在线讲座「起点学院公开课」栏目,分享通过 6 个步骤,教大家学会数据驱动产品优化的秘诀 .本文由人人都是产品经理团队@ 张婷依据嘉宾现场分享内容整理,编辑有修改. 一.什么是数据? 数据有四个属性:时间.地点.人物和事件:举个例子,在电子商务这个环境里,假设分析一个交易数据.这个交易数据在时间上,它必须有一个时间戳,这个数据必然会在某一个地点发生,还有对应的交易者,在事件的级别

TIC大咖说| GrowingIO张溪梦:探索数据分析如何驱动企业精益增长

由于业务具有高度互补性,GrowingIO在创立之初就与UCloud建立了合作伙伴关系,经过几年的发展,这种互动的协同效应带来了双赢的良好局面. 3月29日,Think In Cloud 2017大会将在北京国贸三期拉开帷幕,在这场云计算行业盛会上,GrowingIO创始人兼CEO张溪梦将就"数据分析如何驱动企业精益增长"这个主题与大家进行交流和分享. GrowingIO创始人张溪梦 张溪梦是硅谷大数据分析和数据科学的著名专家,他曾任职于世界知名社交网络LinkedIn公司,并亲自建立

前LinkedIn高管张溪梦:数据化运营如何创造商业价值

WOT2015"互联网+"时代大数据技术峰会于2015年11月28日于深圳前海华侨城JW万豪酒店盛大揭幕,42位业内重量级嘉宾汇聚,重磅解析大数据技术的点睛应用.秉承专注技术.服务技术人员的理念. 本次峰会涵盖九大技术主题,分别是:互联网金融.O2O电商架构.医疗应用.商业创新.移动大数据.技术创业.社交网络.数据安全.广告数据技术.DBA+社群作为本次大会合作方,将通过图文直播为大家全程跟踪报道这场技术盛宴. 下面是GrowingIO创始人.前LinkedIn分析部高级总监张溪梦带来

张溪梦:庙算者多胜-大数据发展战略

感谢大家听我做汇报,我希望把我的演讲尽量变的更简短一些.我名字叫张溪梦,在美国大约做工作做了不到十年.主要目的就是做大数据分析,我以前是脑外科医生,做分析和做医生没有本质性区别,就是通过不同的症状来诊断事物本身的基本的比如说疾病.然后采用不同的方法治愈病人,让病人身体更健康. Linkedln在世界范围内有3亿用户,中国有500万用户左右,90%的世界前100强公司都在用Linkedln提供的服务. 讲讲大数据就讲Linkedln的业务模型,商务模型非常简单,主要是三个环节链在一起形成一个很健康

GrowingIO张溪梦:把硅谷流行的“增长黑客”带进中国

他曾是一位医生,而他的创业想法,也曾被圈内同行认为"不可能做成". 近日,数据分析公司GrowingIO获得了经纬中国领投的2000万美元A轮融资,这家成立刚一年的公司创下SaaS行业融资额新高. GrowingIO创始人张溪梦此前曾担任LinkedIn商业分析高级总监,也是LinkedIn大数据平台的搭建者.他创办的GrowingIO,是运用无埋点技术,实现数据采集,迅速生成数据分析结果,以提高不同企业的运营效率. 在美国时,张溪梦曾经被 Data Science Central 评

专访 GrowingIO 创始人张溪梦,数据分析可以发现哪些“惊天秘密”

张溪梦,GrowingIO 创始人兼 CEO,曾是一位脑肿瘤外科医生,随后"弃医从文",选择投身互联网大潮.在美国,他曾担任 LinkedIn(领英)美国商业分析部高级总监,曾被评为"世界前十位前沿数据科学家". 2015年,他回国创业,建立 GrowingIO. 作为"增长黑客"理论在中国的实践者,他试图通过对用户行为的精细分析,对互联网产品进行针对性的快速迭代,从而使客户出现指数型的增长. [GrowingIO 创始人&CEO 张溪梦

达梦战略扩展:大数据平台应运而生

文章讲的是达梦战略扩展:大数据平台应运而生,大数据是一场革命,它将改变我们的生活.工作和思维方式.继移动互联网.云计算后,大数据逐渐成为对于ICT 产业具有深远影响的技术变革,越来越多的企业纷纷加入到了大数据的掘金浪潮中.在互联网+的风口上,各种结构化.半结构化.非结构化的海量数据应运而生,如何快速建立起一套完善而高效的大数据管理与分析平台系统,如何帮助企业用户实现大数据的有效管理和资产开发已成为时下业界的关注热点. 2015年6月25日,由达梦数据库主办的"大数据挑战与对策"主题研讨

百分点首席经济学家张忠解读《美国白宫大数据白皮书》

大数据已经进入到2.0时代,在"拥挤"的大数据市场如何更好地竞争生存?在美国白宫发布的最新的"大数据"白皮书通过研究分析给出了答案.日前,沃顿商学院终身教授.百分点首席经济学家张忠对白皮书进行了解读,他认为:白皮书主要针对大数据应用推广价值进行研究,掀起了大数据应用热潮,国内企业也借鉴其中的研究结论调整自己的发展方向. 其中,白皮书重点探讨了大数据技术与营销的紧密联系,其中对大数据"区别定价"进行了重点阐述.作为国际顶级的营销模型专家与经济学家,