什么是数据分析师(Data Analyst)?
数据分析师指的是不同行业中,专门从事行业数据搜集、整理、分析,并依据数据做出行业研究、评估和预测的专业人员。
他们知道如何提出正确的问题,善于数据分析,数据可视化和数据呈现;辅助公司商业决策,帮助降低成本,提高收益,改进产品,留住客户,发现新的商业机会等。总的来说,根据数据分析师的级别,他们主要的工作内容可能包括以下:
- 与IT部门,管理部门,数据科学家(Data Scientist)合作,决定整个公司的团队目标
- 从primary research和secondary research中收集提取数据
- 清理和选取数据,去除无关信息
- 熟悉使用统计软件和其他技术分析和解读数据
- 总结数据里的趋势或相关性
- 为过程改进发现潜在机会并提出可行建议
- 提供准确的数据分析和可视化报告
- 创建并管理维持数据库
- 修改代码相关的问题
数据分析师的就业前景怎样?
随着科技的发展,人类社会产生的数据规模呈指数级增长。每时每刻都有大量数据被产生存储下来,尤其在电子商务、网络游戏、社交网站、旅游、在线教育等领域。现在,全世界每天产生的新数据超过400万TB。数据分析师则成为当前炙手可热的职业之一。
必备技能
要成为一名成功的数据分析师,需要的技能主要有两大块:硬技能(包括掌握一些数据分析的软件等)和软技能(良好的沟通技能,PPT技能)。
硬技能(Hard Skills)
知识体系
统计学的基本知识和对machine learning的了解:大部分对消费者的分析都离不开描述统计方法(平均数,中位数,显著性等等)
计算机软件
对于数据分析师来说,可能每个项目的70%到80%的时间都是在收集和处理数据,他们需要首先想好需要什么样的数据,比如timeframe是一年还是十年。选定好需要的数据后要进入一个或多个数据库去收集数据,最后需要对数据进行一些处理,看看是不是有missing value或者outliers等等。
这个过程之后得到了可靠的数据,然后便进入到核心的数据分析。为了能更好的从数据里提取到需要的信息,以下这些软件就是数据分析师们常用的。Querying language和statistical language主要是用来做一些初步的数据分析,例如可以出一些图表,看一下数据的分布,从而对数据有个了解。而scripting language则可以用于建模或者测试一下hypothesis。因此总的来说,这些软件对于数据分析师来说就像厨师的刀,是必不可少的工具。
- 查询语言(Querying Language):SQL; Hive; Pig
- 脚本编程语言(Scripting Language):Python; Matlab
- 统计语言(Statistical Language):R; SAS; SPSS
- 数据表(Spreadsheet):Excel
软技能(Soft Skills)
明确问题(Defining the Problem)
将分析范围缩小是很重要的技能。如何将复杂的问题去掉细枝末节,抓住重点需要良好的沟通能力和对商业需求的充分理解能力。注意:避免向客户递交太多对解决核心问题无用的信息。另外,对公司和行业的了解也会使得这个过程更加得心应手。
了解听众(Knowing the Audience)
通常来说一个数据分析师需要面对PM和CEO。因此,在准备presentation时,要注意回答这两方关心的不同的问题。对于PM来说,需要的是简单无修饰,多干货介绍在各种情况下如何进行协作交互。而面对CEO,需要展示的是稍加修饰的PPT和最重要提供具体的建议。
另外很需要注意的一点是communication。很有可能数据分析师们面对的听众并不是有technical的背景,如何将很专业的术语转化为商业语言是十分重要的。而掌握一定的data visualization的技能便会在此时让展示更为有效。
强调结果(Delivery)
一定要有研究成果的展示,如果只是分析内容的步骤,而缺乏最后对成果的总结,将很有可能延滞项目的推进。对于公司或项目的管理者来说,分析的过程并不是他们最看重的,而分析的结果和针对这个结果有什么合理的建议或解决方法才是最让他们关注的,因此为了更为有效地推进项目,重点强调结果是十分必要的。
本文作者:Ray Cao
来源:51CTO