不能成为数据科学家?没关系,你还可以拥有数据思维

数据科学家日益突显的影响力令人惊叹——每次读到这种论调的文章我都感到好笑。虽然不是所有文章都像《哈佛商业评论》一样宣称数据科学家将是“21世纪最热门的职业”,但是,几乎都是千篇一律的“我们预见了未来”的语气。我认为这种观点并没有错,但是在这种趋势中,我没有发现什么是值得惊奇或者是新鲜的。如果《洋葱报》(The Onion, 美国最受欢迎的幽默讽刺杂志)要报道,我想标题应该是:

“最新研究表明,精通数学和编程的人被大量地雇佣”。

这有什么新鲜的呢?自从上世纪70年代以来,擅长数学和编程的人们就在华尔街发家致富了。随着越来越多的公司产生海量的数据,对于数学和编程技能的需求已经延伸到了新兴的行业,更不必说技术部门了。但是,数学和编程只是价值正在迅速上升的量化分析能力中的一部分。去年8月纽约时报的一篇文章是一个极好的例子,能够说明新闻媒体对此的热切关注度:一位在旧金山工作的服务生Paul Minton,在决心成为一名数据科学家后,经过3个月的编程和数据分析课程,年薪就从2万变成了六位数。看呐,一个数据科学的奇迹!

补充一点细节(这篇文章指出了此点非常值得赞扬,虽然只是略带而过):Minton拥有数学专业的本科学位。换句话说,他是一位非常聪明的服务生。我不了解Minton,也不想妄加评论他本人或者纽约时报或者服务生。但是,大多数人是没有天资在如此短的时间内实现同样的转变的。我在以前的博客和书中曾经说过,我是编程学校和非传统学习平台的忠实拥护者。但是不能只注意到Minton“仅仅3个月”就完成了他的非凡转变,却忽略了他之前数年的教育中包含了微积分,统计学,概率论和其他这些除了编程技术以外的高深课程,这些都是取得数学本科学位所必须的。我猜Minton至少对MATLAB有一点印象。对于大多数人而言,他们不仅没有数年的相关训练,而且即使接受免费培训他们也不一定能够掌握编程能力。我就是其中之一。

相比于我大学时期,现在的就业市场需要数学和统计学能力已经不再是秘密,但是这并不意味着它们更容易学习。在我大学的朋友中,我的量化分析能力至多是略高于平均水平。虽然我的微积分和统计学学得非常好,但是良好的数学基础使我能够应付我的经济学专业的同时,也让我发现擅长数学不再是我的长期优势。我清楚地认识到,我的职业生涯无法仅仅建立在我比其他人数学更好的基础上。对于数学,我想大多数人有这样的意识后都会比周围人更加困扰。

我之所以提出这些是希望当你为自己的数学学位感到害羞,听到数据科学家的需求量巨大就如听到国家橄榄球联盟的四分卫收入很高一样时,能够清醒地说,“是的,当然如此。”

好消息是,即使不能成为一位数据科学家,通过培养自己的数据思维,你仍然能够提升自身价值,使工作更出色。

 

◆ ◆ ◆

当今职场秘密武器:用数据说话

  

这些年有一件让事情让我震惊:大多数人对自己公司的数据的了解少之又少。我接触过的大多数公司里根本没有几个人有能力用最基本的方法分析他们的数据,更别提有足够的数据科学家人手了。最近有个大型酒店集团的营销经理向我吐槽:公司里“也就2-3个人”可以分析原始的销售数据,只有他们对业务和内部信息系统都有足够的了解。我接触的另一个商用品分销公司有几万名员工,但是只有5、6个人可以快速地回答公司高层提出的问题,其他的人要么不够了解数据库要么不够了解公司业务。还有一个大型零售连锁集团里只有很小一撮人可以很快地分析他们的原始数据。很多公司甚至专门设立了”客户洞察”部门。他们的使命是专门帮助其他部门解决跟那些该死的数据有关的问题。

 

是什么造成了这种现象呢?

 

这些公司的信息系统应该负一部分责任。现在有很多企业因为时间的积累或者是多次并购,继承了很多个不同类型的信息系统。这些系统对于没有技术背景的人来说非常难以使用。仅仅这一条就可以让大多数的人对于公司的原始数据望而却步。但是更大的障碍其实是人的惰性。就算公司有还不错的分析数据的工具(比如一个关系型数据库),也只有少数的人有耐心和好学心去了解。其他大多数人只是想等待数据出现在一个Excel表格里或者一个展示板上供他们使用。这不简单是需要学习一门新的查询语言(SQL)的问题。要想要明白公司的数据模型是怎样的,数据是怎么样存储的这些都需要反复实验,这会消耗很多耐心和精力。现实世界中的数据和在商学院中用的数据是完全不一样的,手里的数据永远没有书里的那么整洁可靠。这就是为什么绝大部分人都直接使用他们的IT部门整合好的数据。这些数据比较靠谱,不需要考虑太多跟数据本身无关的事情。

 

但是仅仅使用这些别人写好的数据报告和展示板有一个问题,就是你很难在职场中脱颖而出。因为大家的信息都是对称的,这些数据的一丝一毫所有人都看的清清楚楚。虽然数据的质量很重要,但这会大大限制你创新的能力。当你手中别人给你做好的数据并不能帮助你解答你想知道的问题时怎么办?举个例子,假设你想测试一下那些全家自驾游的客人在酒店的消费特征。这时你需要自己筛选分析那些只来过酒店一次,点了儿童菜单的东西到房间里而且还加了一张折叠床的客户。这种分析可以让你的老板认真听取你报告的内容。这种问题如果可以自己解决比要要别人帮助好十倍。

  

解决这些问题并不难,不需要高中毕业就可以搞定。你只需要合适的数据加上一颗好学心。

  

◆ ◆ ◆

提出简单的问题可以事半功倍

 

有人说聪明的人喜欢问复杂的问题,但是绝顶聪明的人往往会问简单的问题。的确,最重要的业务问题往往也是最简单的问题。比如:为什么客户没有选择竞争对手的产品而是选择了我们的产品?为什么曾经选择了我们产品的人却最终放弃了这个产品?我们应该为了增加销售量而降价吗?当你是职场新人的时候你往往在埋头做一些细节的工作,没人会问你这种问题。但随着你经验增多,真正可以搞定这些问题的时候你可以开始为解决公司最根本最重要的问题做贡献,升职加薪走向人生巅峰!

 

回顾我的职业生涯,我学到最有用的业务技能就是SQL,用这个语言我可以直接查询一个公司的原始运营数据,直接了解关于这个公司业务的基本特点。我渐渐发现自己很擅长提出不错的问题,需要的只是一些能帮我解决这些问题的工具。更重要的是,当一个人用过内部的数据库查询过公司的信息后你就会发现,使用数据库的经验可以教你提出更好的问题。说白了就是,用过数据库之后就知道怎样可以提出一个在数据库中可以精确回答的问题。这让人没有以前那么懒惰,因为计算机和人不一样,它并不懂得怎样揣摩你真正的意图。这样在不知不觉中就学会了如何更加系统地思考。

原文发布时间为:2016-03-18

时间: 2024-09-12 15:57:56

不能成为数据科学家?没关系,你还可以拥有数据思维的相关文章

找不到完美数据科学家?你还可以组建一支数据科学梦之队

提供洞察和分析的公司都在尽力为自己组建完美的数据科学团队,这通常有两条路可以走. 大部分公司都在挣扎中选择了第一条路:寻找这些工资非常贵又很少见的独角兽人才,即同时具备这多种技能的独立个体. 完美的数据科学家完美地掌握了数学.统计学.编程以及沟通技术.这些人不光具备完成复杂工作的专业技术能力,还能够向非技术人员解释这些技术工作可能会带来的影响. 除了这些数据科学家会很昂贵的事实之外,这些天才科学家一周7天,每天24小时连轴工作也是不太可能的. 当然这不是唯一的一条路. 人类史上最早的科学家之一亚

帮数据科学家干脏累活,大数据初创企业Paxata获3350万美元D轮融资

  经过前几年的炒作之后,大数据已经逐渐远离了媒体的焦点.这并不是说大数据已经失去势头,相反正是由于大数据应用之广泛已经到了几乎任何应用都离不开的地步,司空见惯了的东西所以就无人提及.但是大数据的应用普及仍然存在一些问题,主要的问题之一就是许多环节仍然离不开人工处理.比如最开始的数据抽取.处理与整合就需要大量人力--21世纪最性感的职业很大一部分精力都用在这些脏累活上面可一点都不吸引人.所以不少创业公司都把焦点放在解放数据科学家的事情上面,Paxata就是其中之一,在Intel Capital

5万余首圣诞歌词数据包+Kaggle数据科学家的脑洞=?(附数据包+代码)

昨天在python给你的圣诞帽上意犹未尽的动手党(点击查看相关文章),今天的话题依然和圣诞节有关. 前几天,文摘菌发现了一个Kaggle上的圣诞歌曲数据礼包.这里有你能想到所有的圣诞歌曲,总计超过5万首.而Kaggle上的数据科学家用各种方式要把它们玩儿坏了,一起看看有哪些有趣的结论! 又是圣诞节,有没有被大街小巷的圣诞歌曲洗耳朵?有没有想过这些圣诞歌曲到底有什么魔力?他们的歌词又有什么共同点? 我们把所有跟圣诞有关的歌曲都打包起来,总计超过5万首歌曲.在这篇文章里,文摘菌将首先用朴素贝叶斯对这

AWS首席数据科学家谈云价格战和大数据

亚马逊Web服务近年来频繁变动,从价格削减到紧密整合私有数据中心,再到调整企业市场,而且不断扩展其原来的开发者和创业公司客户. 在众多执行者中一马当先的就是Matt Wood,他是亚马逊Web服务(AWS)的数据科学总经理.SearchCloudComputing本周在AWS峰会上和他探讨了企业客户的热点问题.这里我们将谈谈云价格.云联盟.法规以及数据定位. TechTarget云计算:云价格是当下的热点话题,谷歌和亚马逊都在本周大幅降价.在每个人都可以免费得到一切之前价格究竟会有多低? Mat

这个网站做数据科学家的FB 但除了社交还做实事

 7月13日讯,如果说早期到中期的社交网络注重广度,目标是建设一个能覆盖所有人的网站,那么现在则是为特定人群或行业开发一整套平台的细分市场阶段了.明眼人可能说,这难道不是互联网早期的网络聊天室和留言板吗?没错,但这些更有针对性的社交网络将提供Web2.0加强后的"聊天室",来自世界各个地方的极客和爱好者们不仅可以在网站上发帖交流自己的看法,还可以合作开发项目. 已经有不少网站开始尝试细分社交的思路了.医生和医学院的学生一直希望有平台能让他们分享.学习病患的医疗图像.另一些针对特定爱好人

LinkedIn首席数据科学家谈数据分析

本文讲的是LinkedIn首席数据科学家谈数据分析,在互联网企业中,LinkedIn是一家出了名的"慢公司",但LinkedIn也是最成功的社交网络,用户品质.广告价值都是行业翘楚,秘密在于LinkedIn有一个高效的数据科学家团队. 作为社交网络,LinkedIn并不是最大的,也不是生长最快的.成立于2003年的LinkedIn, 花了500天, 才达到了100万用户.然而,作为全球最大的职业社交网络,LinkedIn的后劲十足.今天,LinkedIn每6天就新增100万用户.平均每

大数据科学家可不是那么好当的,五项专业特质你有吗?

大数据科学家有多牛?让我们从有史以来市值最高的科技公司苹果看起.为抢大数据科学家,苹果开出美金16万到20万(约合台币400万到600万)的年薪,以及任何你想得到的好福利:美味员工餐.健身中心.教育津贴甚至冻卵补助,但苹果不是唯一一个需要数据科学家的公司,打开领英(LinkedIn).上面至少有5万3千个数据科学家的职缺,而这还只是美国的统计数字. 美国专业招聘公司罗致恒富(Robert Halt)公布的<2015薪资指南>把大数据工程师列为今年薪资涨幅最大的六大行业之一,预计薪资年成长率9.

涨姿势!2016最热最好工作之数据科学家

文章讲的是涨姿势,2016最热最好工作之数据科学家,据外媒报道,数据科学家已被誉为2016年最好的工作!这股热风还未彻底的在国内吹起什么风吹草动,不过在各大论坛已经看到网友热议-目前,国内的数据只有清华大学计算机工程硕士,美国德克萨斯理工大学教授林漳希说道过"未来五年,这方面人才缺口高达19万."这一岗位的定义和要求的技能到底是怎样的,且看小编整理部分网上经验分享及网友亲身经历,为国内开发者们揭开数据科学家这层面纱. 关于数据科学家Datician/Daticist/Data scie

数据科学家需要的技能组合

在2016年的美国,数据科学家已经被冠以"最佳工作"的头衔,数据科学家的定义以及成为一名出色数据科学家所需的技能一直处于不断的变化之中.科技和商业需求方面的进步驱使着数据科学家随着行业的不断变化而不停的进化.在这片文章中,我们将会近距离的看一看在2016年当中,作为一名数据科学家应该扮演何种角色. Dave Holtz写道,小小的"数据科学家"这样的岗位头衔,经常被充当一个空白头衔来用,其作用就是说明数据科学家这样的岗位所涉及到一系列工作,其实与其他工作有着天壤之别