LinkedIn首席数据科学家谈数据分析

本文讲的是LinkedIn首席数据科学家谈数据分析,在互联网企业中,LinkedIn是一家出了名的“慢公司”,但LinkedIn也是最成功的社交网络,用户品质、广告价值都是行业翘楚,秘密在于LinkedIn有一个高效的数据科学家团队。

  作为社交网络,LinkedIn并不是最大的,也不是生长最快的。成立于2003年的LinkedIn, 花了500天, 才达到了100万用户。然而,作为全球最大的职业社交网络,LinkedIn的后劲十足。今天,LinkedIn每6天就新增100万用户。平均每秒有两个新增用户。每年,LinkedIn的用户搜索量达到了42亿。LinkedIn的数据分析团队每天要分析200TB的数据来更好地了解用户。

  为什么人们现在如此的关心统计和数据,为什么数据科学家成了最性感的工作,最近,在TiE的峰会上, LinkedIn的首席数据科学家Manu Sharma 接受了采访,揭秘了LinkedIn的数据分析的工作:

  问: 能介绍一下LinkedIn的数据科学吗?

  答:LinkedIn就是用户的职业社交网络,在这个网络上,如果人们想找你却找不到那么你就可能失去一个机会。 因此,对用户来说,保持状态和资料的时时更新非常重要。LinkedIn的业务, 就是建立在对这些数据进行分析的基础上的。为了达到对数据实时快速处理的目的,我们开发了自己独特的算法,叫Metropolis。它可以每天实时处理10亿条数据。具备开源的解决方案 Voldemort, Kafka,和Zoie 那样的功能。

  数据科学家需要具备好奇心和直觉。他们需要想的问题是:我能用这些数据来做什么呢? 我需要问什么样的问题?这些数据能告诉我什么? 他们还需要足够的直觉来了解他们所采用方法的局限性。数据科学家的工作包括,采集数据,整理数据,建立正确的模型,测试模型,还要有一定的编程能力。一个数据科学家需要具备这些技能,而这些技能也是一个初创企业在建立它的数据科学家团队所需要的技能。

  问: LinkedIn数据应用的重点是那几个方面?

  答:LinkedIn的数据应用主要在三个方面:

  1. 开发创新的数据产品

  2. 从内部数据发现趋势和机会

  3. 推动业务成长

  比如”推理算法”被用来根据用户的数据进行一些信息的推测。 这一点对于将来的产品设计尤其重要。比如说, LinkedIn就采用了“推理算法”推出了“你可能知道的人”这个功能。 这对增加用户粘性和提高用户口碑传播有极大的帮助。LinkedIn是最早推出这一功能的。现在,这个功能已经成为了社交网络的必备功能了。

  此外,通过用户在资料里关于技能的描述文本,我们通过文本提取和文本分析,建立起一套技能的关键子字典。通过聚类算法,可以产生很多很有意思的发现来帮助我们提高服务或者推出产品。

  此外, 通过对各个行业的用户数据分析,还可以对行业或者整个经济进行一些预测。(编者: 比如说某个行业进行了裁员,或者某些行业的招聘计划增加等等) 这样做的一个优点是,这些数据不是来自与问卷调查,这些是用户实实在在的行为数据。 所以,在美国总统经济政策报告里,这些数据也会被采用。这些数据同样的对企业的发展也很重要。

  问:数据分析最佳实践的原则是什么?

  答:

  1. 数据量越大越好

  2. 原始数据比加工数据好

  3. 数据标准和数据质量非常重要

  4. 简单模型比复杂模型要好

  5. 建模就是要不断进行试错。

作者: 王玉圆

来源: IT168

原文标题:LinkedIn首席数据科学家谈数据分析

时间: 2024-07-28 15:02:32

LinkedIn首席数据科学家谈数据分析的相关文章

福特首席数据科学家谈三点大数据经验

Photo: Ford 数据已经成了福特公司的"燃油",从产品设计到商业智能,从汽车部件到社交网络上的用户,福特公司每天需要处理海量且快速增长的数据. 今日福特公司首席数据官Michael Cavaetta做客Structure Show,介绍了福特公司的大数据处理经验,归结为三点: 一.数据可以影响设计 数周前福特公司在北美国际汽车展上亮相的F-150皮卡车型采用了轻型铝材取代钢材提高燃油经济性.鲜为人知的是,这项设计改动离不开 Cavaetta领导的数据部门的贡献.Cavarett

AWS首席数据科学家谈云价格战和大数据

亚马逊Web服务近年来频繁变动,从价格削减到紧密整合私有数据中心,再到调整企业市场,而且不断扩展其原来的开发者和创业公司客户. 在众多执行者中一马当先的就是Matt Wood,他是亚马逊Web服务(AWS)的数据科学总经理.SearchCloudComputing本周在AWS峰会上和他探讨了企业客户的热点问题.这里我们将谈谈云价格.云联盟.法规以及数据定位. TechTarget云计算:云价格是当下的热点话题,谷歌和亚马逊都在本周大幅降价.在每个人都可以免费得到一切之前价格究竟会有多低? Mat

银行金融领域的20位首席数据科学家

1.KwangmooKoh,贝莱德集团 Koh是贝莱德集团的数据科学总监.Koh拥有一个非常成熟的数据科学和机器学习团队,在2015年,随着谷歌的高级研究科学家BillMacCartney加盟,该团队的实力得到了进一步的加强.MacCartney于2016年4月离开,现在在为苹果Siri项目的"主动智能"平台工作. Koh在斯坦福大学获得电气工程博士学位,并于2009年加入贝莱德集团成为合伙人. 2.Pierre Demartines,贝莱德集团 Demartines也是贝莱德数据科学

Facebook数据科学家解密数据分析驱动用户增长

本文内容来源于作者在知乎的一场直播,内容关于如何通过数据分析驱动用户增长.由于 Facebook 有严格的保密要求,所以这次直播内容不会透露属于内部消息的数据.产品或者策略.直播里提到的例子如果涉及到 Facebook ,都会是已经公开的信息(一般是 Facebook F8 大会提到过的或者 Engineer blog 上的内容).  先简单介绍一下我自己.我是清华生物系本科和硕士毕业,之后去北卡大学念药物药理学的博士,中间发现自己不适合走生物科研的路,所以在博士开始两年多的时候决定转硕士走人.

深度|普惠大数据中心首席数据科学家李文哲:知识图谱的应用

导读:知识图谱 (KnowledgeGraph) 是当前的研究热点.自从2012年Google推出自己第一版知识图谱以来,它在学术界和工业界掀起了一股热潮.各大互联网企业在之后的短短一年内纷纷推出了自己的知识图谱产品以作为回应.比如在国内,互联网巨头百度和搜狗分别推出"知心"和"知立方"来改进其搜索质量.那么与这些传统的互联网公司相比,对处于当今风口浪尖上的行业 - 互联网金融,知识图谱可以有哪方面的应用呢? 目录: 1. 什么是知识图谱? 2. 知识图谱的表示 3

重磅:如何不花钱就成为数据科学家?

从白宫雇佣DJ Patil作为第一位首席数据科学家到联合国运用预测分析来预报可能发生在学校中的爆炸事件,无论何时何地,大数据.数据科学和预测分析都是最热门的话题. 每个月都有很多家创业公司如雨后春笋般出现,让我们即使耗尽想象力也难以完全理解当下的技术会如何改善我们的生活以及我们所做的一切.数据科学的市场需求巨大,增长态势也如同被打了鸡血一样极为迅猛. 根据领英(Linkedin)的数据,"统计分析"和"数据挖掘"是今年求职者能被雇佣的头两个技能.高德纳咨询公司表示,

大数据科学家可不是那么好当的,五项专业特质你有吗?

大数据科学家有多牛?让我们从有史以来市值最高的科技公司苹果看起.为抢大数据科学家,苹果开出美金16万到20万(约合台币400万到600万)的年薪,以及任何你想得到的好福利:美味员工餐.健身中心.教育津贴甚至冻卵补助,但苹果不是唯一一个需要数据科学家的公司,打开领英(LinkedIn).上面至少有5万3千个数据科学家的职缺,而这还只是美国的统计数字. 美国专业招聘公司罗致恒富(Robert Halt)公布的<2015薪资指南>把大数据工程师列为今年薪资涨幅最大的六大行业之一,预计薪资年成长率9.

如何成为一名数据科学家?

作者Alec Smith是数据科学领域中资深HR,之所以写这篇文章是因为经常被问到一个问题:"如何才能获得一份数据科学家的职位?" 不仅这个问题经常被问引起了注意,另外问这个问题的人不同的背景也非常很令人感兴趣.作者曾经和以下这些职业的人有过类似对话:软件工程师.数据库开发者.数据架构师.保险精算师.数学家.学术界人士(不同领域).生物学家.天文学家.理论物理学家-我还能接着往下数.通过和他们的这些谈话,作者发现在这之中有很大的误解存在,很多人都非常困惑--为了闯入这个领域的话,他们需

如何成为一名数据科学家?(二)

联合编译:Blake.高斐 编者注:作者Alec Smith是数据科学领域中资深HR,之所以写这篇文章是因为经常被问到一个问题:"如何才能获得一份数据科学家的职位?" 不仅这个问题经常被问引起了注意,另外问这个问题的人不同的背景也非常很令人感兴趣.作者曾经和以下这些职业的人有过类似对话:软件工程师.数据库开发者.数据架构师.保险精算师.数学家.学术界人士(不同领域).生物学家.天文学家.理论物理学家-我还能接着往下数.通过和他们的这些谈话,作者发现在这之中有很大的误解存在,很多人都非常