蹩脚数据科学家的10种现象

优秀的数学家可以成为顶尖的数据科学家,但光是会在笔记本上写公式可不行,他们还必须熟练地运用计算机来处理数据。

如果他们的所有经验都来自学术机构,当他们面对现实问题时,可能会束手无策。寻找有实践经验的人,不要在这方面妥协。

对数据科学的热情以及掌握一定的技能,这是成功的关键。如果你只是假装有兴趣,或者并不具备重要的技能,总有一天,你会原形毕露。

如今,数据科学家已是炙手可热,那些曾经对其毫无所知的企业,眼下也开始在全世界搜寻最好的数据科学家。问题在于,优秀数据科学家的标准是什么?和其他东西一样,数据科学家也是良莠不齐,招聘他们是一项重要的投资,如果选了个“次品”,你会付出沉重的代价。凭借一批出色的数据科学家,Facebook为自己的社交媒体平台注入了富有创造力的新功能,令用户为之兴奋。

过去10年里,数据呈现爆炸式增长。大数据扑面而来,普通人很难弄懂它的含意,更别提加以利用了。但数据科学家能从中提取出有价值的信息。对一家公司来说,数据科学家的雇用成本很高,由于这方面的人才供不应求,他们的薪水会迅速上涨。

在当今这个时代,解雇员工同样代价不菲,错误的招聘会使你的公司倒退几个月。所以,在寻找优秀的数据科学家时,你也应该警惕蹩脚数据科学家的迹象。如果发现以下10个迹象中的任何一个,你都应该迅速远离。

1. 糟糕的数学背景

许多计算机专家和程序员都会把自己说成是数据科学家,但实际上,真正出色的数据科学家通常拥有数学背景。优秀的数学家可以成为最好的数据科学家,但数学不好的程序员不行。蹩脚的数学家无法有效地分析数据,而这恰恰是数据科学家的首要任务。

2. 计算机知识贫乏

没错,优秀的数学家可以成为顶尖的数据科学家,但光是会在笔记本上写公式可不行,他们还必须熟练地运用计算机来处理数据,要熟悉Spark和其他系统。如果你的数据科学家坚持要求配一名助手,因为他用不来电脑,那么你应该继续寻找,去雇用其他人。

3. 没有全能型人才

一个人集统计学家、开发员、数学家和其他身份于一身,并不意味着他能成为一名数据科学家。几乎可以肯定的是,他拥有跨领域知识,能够根据不同的职位需求来推销自己。他也许什么都会,但可能什么都不精。

4. 纯粹的学术派

你需要有实践经验的人。如果他们的所有经验都来自学术机构,当他们面对现实问题时,可能会束手无策。寻找有实践经验的人,不要在这方面妥协。

5. 缺乏团队精神

数据科学家将和其他人共事,所以你不会想要一个不合群的人,即便他再怎么聪颖过人。数据科学家应该真正地融入团队,了解整体情况,做出全面改进。而如果他们不能和其他人融洽相处,就做不到这一点。

6. 缺乏商业知识

数据科学家不能只会运用理论。他们还要重视经过验证的技巧,运用可靠的传统方法。这些都来自于实践经验。

数据科学家需要参加商务会议,通过演示向高级管理层阐述分析结果。因此,在雇用一名数据科学家之前,要确保他拥有一定的商业知识,这一点非常重要。

7. 不熟悉工具

你面前的那个人拥有丰富的技术知识,但他们能否运用这些知识?如果他们没有实际运用过SAS、R、Scala、Python或其他计算机语言,他们可能只会像一个“绣花枕头”,中看不中用。

他们必须能够利用工具来阐释和转化信息流。

8. SAS成瘾者

有些SAS开发人员会把自己包装成数据科学家,但他们不是。数据科学家应该掌握多项技能,对于某个具体的问题,他们可以运用多种不同的系统。而蹩脚的数据科学家在遇到任何问题时,都只会采用同一种技能,他们希望用一种语言就能解决所有问题,这是不切实际的。

9. 没有理科学位

这是个不好的迹象,因为数据科学属于理科范畴。你也可能自学成才,但如果有人能秉持科学原则,并且掌握了分析学的一般性应用,还毕业于名牌大学,此人更有可能给企业带来价值。最好能拥有硕士学位。如果在其他领域还拥有一技之长,此人将是一只潜力股。

10. 不会用通俗语言来解释

数据科学家应该能用通俗易懂的日常用语来解释最复杂的问题,不能与现实世界脱节,这会导致你的解决方案无法被人理解,而且你需要花费一定的时间和精力来克服语言障碍。

虽然有很多重要的数据科学技能可以后天习得,但有些却是天生的。那些妨碍你进入数据科学领域的因素常常无法改变或纠正。对数据科学的热情以及掌握一定的技能,这是成功的关键。如果你只是假装有兴趣,或者并不具备重要的技能,总有一天,你会原形毕露。

本文作者:车品觉

来源:51CTO

时间: 2024-10-05 08:44:11

蹩脚数据科学家的10种现象的相关文章

提升数据建模的10种技术措施

随着企业有了能够轻松访问和分析数据以提高性能的新机会,数据建模也是变形的.数据建模不仅仅是任意组织数据结构和关系,还必须与最终用户的需求和问题联系起来,并提供指导,帮助确保正确的数据正确使用正确的方法获得正确的结果.以下描述的十种技术将帮助人们提高数据建模水平及其对业务的价值. 1.了解所需的业务需求和成果 数据建模的目的是帮助组织更好地运作.作为数据建模者,收集,组织和存储用于分析的数据,用户只能通过了解其企业需求来实现这一目标.正确地捕获这些业务需求,以了解哪些数据优先,收集,存储,转换,并

用Python进行数据可视化的10种方法

引言 艺术之美根植于其所传达的信息.有时候,现实并非我们所看到或感知到的.达芬奇(Da Vinci)和毕加索(Picasso)等艺术家都通过其具有特定主题的非凡艺术品,试图让人们更加接近现实. 数据科学家并不逊色于艺术家.他们用数据可视化的方式绘画,试图展现数据内隐藏的模式或表达对数据的见解.更有趣的是,一旦接触到任何可视化的内容.数据时,人类会有更强烈的知觉.认知和交流. 在数据科学中,有多种工具可以进行可视化.在本文中,我展示了使用Python来实现的各种可视化图表. 怎样才能在Python

惠普:应把大数据科学家作为一种共享资源

大数据目前已经成为每一家企业级技术供应商摆在战略优先仪表板上的重要对象,但对于很多负责渠道销售工作的公司来说,召集拥有此类知识储备并能够处理复杂项目的人才在成本上太过高昂.甚至根本无法实现. 这类由具体实践领域所带来的投资难题早在过去就一直存在,惠普公司企业部门全球间接销售事务高级副总裁Sue Barsamian表示,她正努力帮助那些对分析有兴趣的用户找到适合自己的实现途径. "在某些时候,"她在接受采访时指出,"合作伙伴们确实需要一位数据科学家为其提出指导性意见.数据科学家

数据分析师的基本素养——论如何成为一名数据科学家 Part 2

更多深度文章,请关注: https://yq.aliyun.com/cloud 本文为<数据分析师的基本素养--论如何成为一名数据科学家>文章的第二部分,第一部分请点击这里. Pronojit Saha,数据发烧友 数据科学入门的自学之路 对于那些想要入门数据科学的新手,这里有一份大纲,或许能够为大家提供一些思路.(其内容摘自我的一篇博客:如何获得"基本技能集"-自主学习的方式).我的建议是从下面每项建议中逐一挑选一到两个资料或链接,掌握其中介绍的内容. 基本的先决条件:

如何成为一名数据科学家?

作者Alec Smith是数据科学领域中资深HR,之所以写这篇文章是因为经常被问到一个问题:"如何才能获得一份数据科学家的职位?" 不仅这个问题经常被问引起了注意,另外问这个问题的人不同的背景也非常很令人感兴趣.作者曾经和以下这些职业的人有过类似对话:软件工程师.数据库开发者.数据架构师.保险精算师.数学家.学术界人士(不同领域).生物学家.天文学家.理论物理学家-我还能接着往下数.通过和他们的这些谈话,作者发现在这之中有很大的误解存在,很多人都非常困惑--为了闯入这个领域的话,他们需

如何成为一名数据科学家?(二)

联合编译:Blake.高斐 编者注:作者Alec Smith是数据科学领域中资深HR,之所以写这篇文章是因为经常被问到一个问题:"如何才能获得一份数据科学家的职位?" 不仅这个问题经常被问引起了注意,另外问这个问题的人不同的背景也非常很令人感兴趣.作者曾经和以下这些职业的人有过类似对话:软件工程师.数据库开发者.数据架构师.保险精算师.数学家.学术界人士(不同领域).生物学家.天文学家.理论物理学家-我还能接着往下数.通过和他们的这些谈话,作者发现在这之中有很大的误解存在,很多人都非常

如何成为一名数据科学家?

编者注:作者Alec Smith是数据科学领域中资深HR,之所以写这篇文章是因为经常被问到一个问题:"如何才能获得一份数据科学家的职位?" 不仅这个问题经常被问引起了注意,另外问这个问题的人不同的背景也非常很令人感兴趣.作者曾经和以下这些职业的人有过类似对话:软件工程师.数据库开发者.数据架构师.保险精算师.数学家.学术界人士(不同领域).生物学家.天文学家.理论物理学家-我还能接着往下数.通过和他们的这些谈话,作者发现在这之中有很大的误解存在,很多人都非常困惑--为了闯入这个领域的话

大数据工具,在数据科学家眼中是怎样的存在?

随着大数据工具数量的增长和计算能力的飞跃,数据科学家越来越多地发现,如果他们想从自己的模型中获得最佳性能,那就必须考虑所使用的数据管道. 数据科学工具的功能通常围绕着预测建模,机器学习和数据可视化.但这些工具还应该包括后端数据管道技术,因为这有助于加快分析的速度. 更强的计算能力 数据科学家们通常喜欢把后端技术扔给工程师来处理.当你的主要关注点是提高模型的预测精度或发现一个数据集中的未知相关性时,文件系统和资源管理工具通常情况下并不十分友好. 但随着大数据工具数量的增长和计算能力的飞跃,数据科学

KDnuggets调查|数据科学家最常用的10种算法

最新的KDnuggets调查统计了数据科学家们实际工作中最常使用的算法,在大多数学术和产业界,都有惊人发现哦! 根据Gregory Piatetsky, KDnuggets,最新的调查问题是:在最近的12个月中,你在实际数据科学相关应用中用到了那些模型/算法? 于是就有了以下基于844份答卷的结果. ◆ ◆ ◆ 排名前十的算法和它们在投票者中所占比例 图1:数据科学家最常用的10大算法,所有算法见文末表格   每个受访者平均用到了8.1种算法,这相比于 2011 的相似调查显示的结果有了巨大的增