数据科学行业的8个关键角色:职责与技能

前言

第二届世界互联网大会的召开,将大数据战略推向了又一高潮,许多与数据相关的职位如雨后春笋般涌现,数据科学家、数据分析师、数据架构师、统计学家、数据库管理员、商业分析师和数据分析经理等。但是,许多业界人士表示分不清这些职位的区别,企业在招聘人员时,进行职位描述与岗位职责编写时略显混乱,应聘者在应聘这些职位时也不清楚这些这位的进入门槛。今天,大数据文摘将向大家推出8张数据科学相关职位信息图以及1张跟这些职位有关的薪酬信息图,带你了解数据科学行业的进入门槛与岗位职责。

引子

一天晚上,我和一位朋友喝酒,这里就叫他乔恩吧。几杯小酒过后,他开始向我吐露真言,他说他想成为一名数据科学家,并已经开始在规划他的职业生涯。

我对他的职业定位表示很好奇,便问了他一个问题:数据科学家的日常工作内容是什么?他模糊的回答让我感觉到他并没有真正了解数据科学家这个职位。于是我又跟他玩了一个小游戏:

现在有4个人A、B、C和D,每个人都有对应的职位:数据科学家,数据工程师,数据分析师,数据架构师。我把这四个人的日常工作描述给乔恩听,然后他必须根据这4个人的描述判断出他们对应的职位。

作为惩罚,他每次回答错误都得来个一口闷。你们能猜到那天晚上他喝了多少杯酒吗?如果换做你来回答,你可能需要喝多少杯酒才能回答正确呢?

下面是关于这些职位的具体介绍,一起来看看?

数据科学家 The Data Scientist

数据科学家很有可能是如今你能得到的最热门的头衔之一,并且年薪平均为11万8709美元,他们是数据科学行业收入最高的人之一。数据科学家需要会利用最新的科技手段处理原始数据,进行必要的分析,并以一种信息化的方式将获得的知识展示给他的同事。

数据分析师 The Data Analyst

如R、Python和SQL这样的编程语言是数据分析师基本知识的一部分。和数据科学家的职位有点类似,对数据分析师来说,需要掌握广泛的技能,同时具有技术和独创性的分析知识。这个职位经常为类似HP和IBM这样的公司所需要。

数据架构师 The Data Architect

数据无处不在(正在被收集着),其结果是,越来越多的企业需要数据架构师。像银行和快速消费品这样的行业需要数据架构师来整合、集中、保护和维护它们的数据源。这些数据架构师通常用最新的技术,如Spark来工作,同时经常需要处在相关业务的最高层。

统计学家 The Statistician

统计学家的头衔是经常被忽视的,或者会被听上去更时髦的头衔所代替。这是令人遗憾的,因为统计学家具有坚实的统计理论和方法基础,他们应该被看成数据科学领域的先驱。通常,他们是从数据中收获信息,然后把信息转化为可操作的见解。尽管这个头衔和今天所提到的其它头衔相比并不那么响亮,现代统计学家们却总是能够快速赶上科技前进的步伐,并将其应用于他们的研究。

数据库管理员The Database Administrator

数据库管理员要确保组织内的每个利益相关人员能够访问数据库,实施正当和必要的安全措施保证数据存储的安全。数据库管理员需要掌握不同的技术,从SQL和XML到更普遍的编程语言,如Java。

商业分析师 The Business Analyst

这也许是今天提到的最没有技术含量的头衔了。然而,商业分析师用他们对业务流程的深刻理解弥补了技术知识的缺乏。因此,商业分析师经常在业务员和技术专家之间扮演中间人的角色。需要这样角色的公司有Uber、Dell和甲骨文。

数据和分析经理Data and Analytics Manager

数据和分析经理负责掌握数据业务小组的工作方向。这个职位需要将SQL、R、SAS等等各种强大技能的各种组合与处理团体工作所需的天生社交能力进行完美整合。这是个难度很大的职位,如果你准备好了挑战,一定要看看来自Coursera、Slack这样公司的招聘信息。幸运的是,这个职位的平均年薪有11万6千美元,对于这么高的职位要求来说,这个经济补偿还是符合实际情况的。

Data Engineer

最后来看看收入吧!

角色 年薪($)
数据分析师 62,379
商业分析师 65,991
数据库管理员 67,672
统计科学家 75,069
数据工程师 95,936
数据架构师 100,118
数据和分析经理 116,725
数据科学家 118,709

这下该清楚了!你想做哪个呢?

原文发布时间为:2015-12-21

时间: 2024-09-20 04:09:48

数据科学行业的8个关键角色:职责与技能的相关文章

开启数据科学职业生涯的8个基本技巧

更多深度文章,请关注:https://yq.aliyun.com/cloud Nick Bostrom(译者注:Nick Bostrom是牛津大学哲学系的教授,是人类未来研究院的创始人和主任.他的新书< Superintelligence>(超级智能) 在出版后,包括伊隆·马斯克.史蒂芬·霍金以及比尔·盖茨等杰出的科技人士纷纷对其表示了支持,另外Google也成立伦理委员会来监督AI技术的发展)曾经说过:机器学习是人类最后的发明.我是一名刚刚进入数据科学这个"未来科技"行业

2017数据科学与机器学习行业现状调查 Python是最受欢迎的语言

今年,Kaggle有史以来第一次对人工智能领域进行了深度调查,旨在全面了解数据科学和机器学习的概况.本次调查收到了 16000 多份答卷,庞大的调查数据为我们提供了有关从业者.业界最新动态以及如何进入该行业的数据支撑.以下报告包括本次调查的几个主要结果,其中包括: 尽管Python很可能是机器学习最常用的编程语言,但统计学家使用最多的是 R 语言. 数据科学家的平均年龄在 30 岁左右,但是这个数字在不同的国家有所不同.例如,印度受访者的平均年龄要比澳大利亚的小 9 岁. 被调查者教育程度最多是

《Spark与Hadoop大数据分析》一一1.2 大数据科学以及Hadoop和Spark在其中承担的角色

1.2 大数据科学以及Hadoop和Spark在其中承担的角色 数据科学的工作体现在以下这两个方面:从数据中提取其深层次的规律性创建数据产品要从数据中提取其深层次的规律性,意味着要使用统计算法提炼出有价值的信息.数据产品则是一种软件系统,其核心功能取决于对数据的统计分析和机器学习的应用.Google AdWords或Facebook里的"你可能认识的人"就是数据产品的两个例子.1.2.1 从数据分析到数据科学的根本性转变 从数据分析到数据科学的根本转变的根源,是对更准确的预测和创建更好

《Spark与Hadoop大数据分析》——1.2 大数据科学以及Hadoop和Spark在其中承担的角色

1.2 大数据科学以及Hadoop和Spark在其中承担的角色 数据科学的工作体现在以下这两个方面: 要从数据中提取其深层次的规律性,意味着要使用统计算法提炼出有价值的信息.数据产品则是一种软件系统,其核心功能取决于对数据的统计分析和机器学习的应用.Google AdWords或Facebook里的"你可能认识的人"就是数据产品的两个例子. 1.2.1 从数据分析到数据科学的根本性转变 从数据分析到数据科学的根本转变的根源,是对更准确的预测和创建更好的数据产品需求的不断增长. 让我们来

在twitter搞数据科学是怎样一种体验?

2015年6月17日是我在Twitter工作两周年的纪念日.回想起来,两年间,数据科学在Twitter的应用方式和范围发生了很大变化: · 工具的智能化上,Pig已经过时了,现在的数据流水线都是用Scalding(建立在串联之上的Scala领域特定语言,便于详细描述Hadoop MapReduce任务--译者注)编译的. · 组织结构上,数据科学家和产品经理.工程师的工作环环相嵌,合作之密切史无前例. 以上只是众多改变中的一小部分.拿我来说,我的研究领域最近从Growth延伸到PIE (Prod

在Twitter“玩”数据科学是怎样一种体验

◆ ◆ ◆ 引子  2015年6月17日是我在Twitter工作两周年的纪念日.回想起来,两年间,数据科学在Twitter的应用方式和范围发生了很大变化: 许多Twitter的非机器学习主导的核心产品中,机器学习的比重正在不断增加(例如"While you were away" 功能--Twitter把你下线时可能错过的头条推文推送到你的个人首页). 工具的智能化上,Pig已经过时了,现在的数据流水线都是用Scalding(建立在串联之上的Scala领域特定语言,便于详细描述Hadoo

2017年最流行的15个数据科学Python库

Python 近几年在数据科学行业获得了人们的极大青睐,各种资源也层出不穷.数据科学解决方案公司 ActiveWizards 近日根据他们自己的应用开发经验,总结了数据科学家和工程师将在 2017 年最常使用的 Python 库. 核心库 1)NumPy 地址:http://www.numpy.org 当使用 Python 开始处理科学任务时,不可避免地需要求助 Python 的 SciPy Stack,它是专门为 Python 中的科学计算而设计的软件的集合(不要与 SciPy 混淆,它只是这

数据科学在明年呈现哪四大趋势?物联网和未来医疗是香饽饽

雷锋网(公众号:雷锋网)按:数据科学.大数据和物联网正在以令人炫目的速度发展和演进,而商业界正以缓慢的速度将更多来自不同渠道的数据整合起来,并能从中洞察更多信息.本文是 Andrew Dipper 对数据科学行业2017年的展望,并列举了四大重要趋势,雷锋网编译,未经许可不得转载. 大数据技术的崛起 在过去一年,我们已经见证了大数据技术惊人的成长,但随着大数据技术在企业界中被广泛接受,下一年留给大数据技术的预算会快速增加.大多数企业已经确认需要在业务的数据方向上进行改进,这转而会需要更多的数据科

哥伦比亚大学数据科学课程笔记

第一周:什么是数据科学? 课程大纲 Rachel Schutt教授以梳理课程大纲开始,下面是她主要的摘要: 1. 课程需要的基础知识有:线性代数,基础统计学,以及一些编程课程. 2. 课程目标:学习数据科学家都做些什么,并学会做其中的一些事儿. 3. Rachel主讲几个礼拜的课,然后会有客席讲座. 4. 客座教授的简历跨度非常大,他们的背景也是如此.但他们都是数据科学家. 5. 我们将有丰富的阅读材料:做一名数据科学家的一种能力就是认识到许多还未记录下来的东西. 6. 差不多每两周一次家庭作业