数据分析师的必读书单

有不少人留言希望我推荐数据分析的书单,刚好即将春节,无论是假日学习还是年后,都值得充电。读书最好的时候是学生时期,其次是现在。内容按照 《如何七周成为数据分析师 》 的顺序。

数据分析是一门专业且跨越多个领域的学科,虽然我每篇公众号都足够篇幅(乃至我自己觉得啰嗦),可我还是得承认存在缺漏。如果有好书作为参考,对数据分析能力的成长更有帮助。

这份书单权作入门级推荐,如果大家有更好的欢迎留言说明。我不能保证全部看过,毕竟基础书没必要看几本,但我尽量做到客观。建议大家根据自己基础挑选,不要贪多。

大家多支持正版。

Excel

《谁说菜鸟不会数据分析》

知名度比较高的一套书,适合新手,优点是它和数据分析结合,而不是单纯地学习函数。学会函数适用的场景和过程比它本身更重要。

是否需要学习VBA是仁者见仁的答案。我个人不建议。Excel VBA的最大优势是适用性广,哪怕去其他行业其他职位,都离不开Excel,这时候它就是一个工作加分的亮点。但是在互联网行业,对数据分析师,VBA的性价比就不高了。

这里只推荐一本,因为我就翻过上面这本,还没全看…

数据可视化

数据可视化的书不多。市面上多以编程为主,面向新手和设计的教程寥寥无几。 如果只是了解图表,看Excel的书籍也管用。

内容很丰富,涉及可视化的方方面面,也囊括更类编程语言和设计软件:Python+JS+R+Excel。作者还有另外一本书《数据之美》。

可视化是一门侧重灵感的学科,有一种入门技巧是从他人设计中学习,从模仿开始,了解他人是如何设计的,这个网络上有大量的信息图可以参考。当然数据分析师更需要的是如何发现,别只学习展示。

英文足够好,可以看Edward Tufte的著作:《The Visual Display of Quantitative Information》、《Envisioning Information》、《Beautiful Evidence》。他是数据可视化的领军人物,他的理念是反对为艺术效果而混淆或者简化数据。暂时没有中文版。

分析思维

《金字塔原理》

分析思维首推《金字塔原理》,金字塔原理有些人说它晦涩难懂,我认为是芭芭拉这个老太有骗稿费之嫌,本书包含了报告、写文、演讲等诸多内容。可以细看可以快看。另外还有一本同名案例集,有兴趣可以买。

另外麦肯锡相关的书籍还有《麦肯锡意识》《麦肯锡工具》《麦肯锡方法》等。

《深入浅出数据分析》

深入浅出系列是对新手非常友好的丛书,用生动但啰嗦的语言讲解案例。厚厚的一本书翻起来很快。本书涉及的基础概念比较广,包含一点统计学知识,学下来对数据分析思维会有一个大概了解。

《精益数据分析》

国外的精益系列一直以互联网创业作内容导向,本书也属于此类。如果是互联网行业相关,可以看看。它介绍了不同领域的指标,以及产品不同时期的侧重点。案例都是欧美,这部分做参考用。

接下来的几本,是兴趣向读物。《黑天鹅》能拓展思维,讲叙了不确定性。《思考的技术》,大前研一的著作,也是咨询类经典。如果对咨询向的分析感兴趣,还可以看BCG系列,或者刷CaseBook。《批判性思维》,则是教你如何形成理性思维。

SQL

数据库有很多种,常见有Oracle,MySQL,SQL Server等。我推荐学习MySQL,这是互联网公司的主流数据库。以后学习Hadoop生态时,MySQL也是最接近Hive语法的语言。

MySQL不需要专门看书学习,因为数据分析师以查询为主,不需要考虑数据性能、数据安全和架构的问题。使用搜索引擎能解决90%的问题,我就是w3cschool学的。

《MySQL必知必会》

如果真想买书看,可以看这本,适合新手向的学习,看基础概念和查询相关的章节即可。网络上大部分MySQL都是偏DBA的。

如果想深入,可以看《高性能MySQL》,对分析师没啥用。至于另外一个方向NoSQL,对入门者还是小众了些。

如果有余力,就学习正则表达式吧,清洗数据的工作就靠它了。

统计学

统计学是比较大的范围,分析师往后还需要学线性代数和矩阵、关系代数等。初学者不需要掌握所有公式定理的数学推导,懂得如何应用就行用。

《深入浅出统计学》

大概是最啰嗦的深入浅出系列,从卖橡皮鸭到赌博机的案例,囊括了常用的统计分析如假设检验、概率分布、描述统计、贝叶斯等。书本注重应用和趣味性,数学推理一般。

《商务与经济统计》

国外的经典教材,已经出到第十二版了。国外教材都有丰富有趣的案例,所以读起来会比国内的轻松不少。如果你还在读书,不妨买这本看一看。

名字既然有商务与经济,所以书中辅以了大量的相关案例。书内容很多,看起来不会快,适合细读。

《The Elements of Statistical Learning》

稍微有一些难度的英文书籍,属于进阶版统计学,国外很推崇。如果要往机器学习发展,这本书可以打下很好的基础。

以上书籍的难度是逐步递增的。统计学是机器学习的基础,是概率、矩阵等实际应用。现在已经有很多统计工具,Excel的分析工具库、传统行业的SPSS、SAS以及R、Python等,使用过程都不用计算推导,大学考试才会考,现在都是计算机解决,轻松不少。

业务知识

不同领域的业务知识都不一样,这里以互联网举例。

《增长黑客》

增长黑客的概念就是随着这本书的畅销传播开来。增长黑客在国内即是数据分析+运营/产品的复合型人才。这本书好的地方在于拓展思路,告诉我们数据能够做什么,尤其是连AB测试都不清楚的新人。

实际涉及的业务知识不多,我推荐,是希望新人能够了解数据驱动的概念,这本算是我走上数据化运营的启蒙读物了。

《从零开始做运营》

知乎亮哥的书籍,互联网所有的数据都是和运营相关的,如果是新手,就以此学习业务知识。如果已经工作很多,就略过吧。

《网站分析实战》

互联网不再是网站的天下,但是移动端依旧有Web,我们在朋友圈看到的所有H5活动、第三方内容等,都是依托网页实现。网站的数据分析依旧有存在空间,网站的数据指标还是能够指导我们运营。

《数据挖掘与数据化运营实战》

这本书涉及了数据挖掘,但是比较浅,可以作为数据分析师视野的承上启下,了解数据化运营的高级应用。特点是以阿里的实际工作相结合,可又因为保密原则不够详尽。

《数据实践之美》

是各领域专家众筹完成的书本,比起传统的书籍,囊括范围更广。虽然没有深度讲解技术,但是各领域的案例都是一手资料,对业务的触类旁通理解有帮助。

业务知识我不再多推荐,以后我会通过公众号文章的形式讲解。因为从我看来,市面上也没有详尽介绍数据角度下的用户行为、产品运营的书籍,都是点到为止。这一块内容,尽量从工作中去学,收获才是最大的。

Python/R

欢迎来到数据分析的最后殿堂,Python和R都是大分支,基本是前面所有内容的实现。Python的学习以PY3为前提,毕竟2017年了,我实在想不出不用Python3的理由。

除了书籍,Python/R更多依靠博客和文档学习。Python的学习路径不陡峭,新手水平取决于查询能力,所以也请学会如何高效搜索。

《深入浅出Python》

还是深入浅出系列,完全适合零基础的新人。需要注意的是,编程学习不同于其他知识,如果计算机基础不稳固,在使用中会遇到各类问题。知其然不知其所以然,这是本书缺点:能掌握,但是Bug比较多。

《Python学习手册》

对于拥有编程基础的人,这本书系无巨细的有些啰嗦,不过对新人,可以避免不必要的坑。把它当作一本工具文档吧,当遇到不理解的内容随时翻阅。这是纸质书比电子书好的优势之一。

《利用Python进行数据分析》

非新手向的书籍,成书较早,部分内容比较老旧。虽然学习中不会有问题,但很多Pandas函数已经有更优雅的写法了,例如df.query。每段代码都敲打一遍,千万行的数据清洗基本不会有大问题了。

《Python Cookbook》

Python的进阶书,如果想要掌握更好的编程能力,这是一本经典,值得时时翻阅。注意,它更偏向程序员。

《R语言实战》

R语言的入门书籍,从数据读取到各类统计函数的使用。虽然没有涉及机器学习,依靠这本书入门R是绰绰有余了。

《统计学:从数据到结论》

这本书是将R语言和统计学结合的教材,可以利用这本书再复习一遍统计知识。缺点是书本后面的内容质量不如前部分。

到这里,入门书籍推荐完毕,当然好书不嫌多,例如《数学之美》、《集体智慧编程》、《统计学习方法》等,有兴趣不妨阅读。

上面的内容都吃透,不论是成为一名数据分析师,还是往后向机器学习、数据科学家、数据产品发展、都有了良好的基础。

希望你能沉下心阅读。

本文作者:秦路

来源:51CTO

时间: 2024-08-03 22:14:37

数据分析师的必读书单的相关文章

程序员必读书单

关于 本文把程序员所需掌握的关键知识总结为三大类19个关键概念,然后给出了掌握每个关键概念所需的入门书籍,必读书籍,以及延伸阅读.旨在成为最好最全面的程序员必读书单. 前言 Reading makes a full man; conference a ready man; and writing an exact man. Francis Bacon 优秀的程序员应该具备两方面能力: 良好的程序设计能力: 掌握常用的数据结构和算法(例如链表,栈,堆,队列,排序和散列): 理解计算机科学的核心概念

阅览5分钟 教你快速成为数据分析师

文章讲的是阅览5分钟 教你快速成为数据分析师,2016年可以说是大数据市场热火朝天的一年,无论是大型企业.中小型企业纷纷伸长了脖子想要和大数据这个互联网因素浓郁的技术挂钩.许多的企业也走在开始尝试用大数据技术进行转型的路上- 然而"大数据切实利用起来"还是需要落实落地,与几年前我们刚开始接触的Hadoop相比,数据分析变得更重要. 先来看2017大数据行业的五大趋势 物联网(IoT)和大数据是同一枚硬币的两面;数十亿与互联网连接的"物件"将生产大量数据;深度学习是一

浅谈数据分析师的级别

1.数据跟踪员 虽然这个工作的人还不能称作数据分析师,但是往往作 这样工作的人还都自称是数据分析师,这样的人,只能通过×××系统看到有限 的数据,并且很少去处理数据,甚至不理解数据的由来和含义,只是机械的把自 己看到的数据拷贝出来,转发给相应的人. 这类人发出来的数据,是否有 意义,怎么解读,他自己是不知道的,只能期望收到数据的人了. 2.数 据查询员/处理员 这些人可以称为分析师了,他们已经对数据有一定的理 解了,对于大部分数据,他们也知道数据的定义,并且可以通过监控系统或者原 始的数据,处理

一位资深数据分析师的分享

一位资深数据分析师的分享 发表于 2012-05-08 01:10 来源:中国统计网 一.掌握基础.更新知识.      基本技术怎么强调都不过分.这里的术更多是(计算机.统计知识), 多年做数据分析.数据挖掘的经历来看.以及业界朋友的交流来看,这点大家深有感触的.    数据库查询-SQL 数据分析师在计算机的层面的技能要求较低,主要是会SQL,因为这里解决一个数据提取的问题.有机会可以去逛逛一些专业的数据论坛,学习一些SQL技巧.新的函数,对你工作效率的提高是很有帮助的.  统计知识与数据挖

只有数据分析师才懂的冷笑话…

数据分析是大数据价值实现的关键环节,也是因其不可替代的地位,导致数据分析师成为大数据时代的热门职业,然而,数据分析师可不是那么好当的,数据海洋里泡久了也不是滋味.一起感受这些冷笑话里的辛酸! 我家上次搬家后设了无线网,搬完家我第一次回家时,发现无线路由器上贴着"无线密码:1234567″,然后就问我妈说这密码这么简单让邻居搜到后猜到怎么办,我妈一脸不屑地说"猜?让他们猜,累死他们也猜不到,我前面那冒号也是. 社会化忧郁 某人骂微博推荐系统:什么烂推荐系统,把我前女友推荐给我老婆,说她们

中国数据分析师行业峰会:数据分析 一门技术与艺术结合的学问

CNET科技资讯网 9月23日 北京消息(文/齐丰润): 在大数据盛行的今天,数据的分析以及应用对于各个企业都可以说是至关重要的,而在这背后就显示出了当今的大环境下对于优秀的数据分析人才的重视与需求.近日,由经管之家(原人大经济论坛)主办的2015中国数据分析师行业峰会在北京召开,主办方经管之家邀请了众多专家和名企来到现场,共同探讨中国数据分析师行业的发展之道,同时也吸引了许多数据分析人才到场.   非结构化大数据才是主流 处在当今这个时代里,对于任何企业来说,数据都绝对算的上是非常重要的一环,

裁员风暴来袭 数据分析师如何面对公司裁员?

据内部人员今日透露,暴风科技目前正在展开裁员工作,涉及客户端.技术.开发和测试等部门.据悉,此轮裁员比例为30%.看到这样的消息,难免感慨今年真是个多事之秋,特别是互联网科技公司的裁员风波是一波接着一波.8月中旬HTC为了降低成本,裁减约2300名员工,约占员工总数的15%.而且前段时间,HTC在台湾的两家公司有再裁减600名员工的计划. 微软今年的整体营收相比较去年同期也有5%的下滑,因为手机业务的重创,7月份宣布将裁员7800人,约占员工总数7%. 为了让整体业务重新回到正常轨道,联想集团今

《R语言游戏数据分析与挖掘》一1.3 数据分析师的能力要求

1.3 数据分析师的能力要求 因为在数据化运营中,数据分析师要深入业务背景,倾听和发现业务需求,走到业务第一线,与业务团队并肩作战,所以要求数据分析师具备很强的组织协调能力,具有项目大局观,懂得在不同阶段调用不同的资源.从这点来看,业务理解力和沟通能力的重要性甚至要超过技术层面的能力(数据处理能力.数据统计分析能力.数据挖掘能力.数据应用能力).图1-2是游戏数据分析师需要具备的关键能力. 首先数据分析师要具备组织能力.这体现在项目前期调研.方案制定.项目开发和项目落地的职责和能力要求. 调研:

别被数据分析师骗了!用数据说谎的三种办法

雷锋网按:日前,亚马逊欧洲商业智能部门负责人.资深数据科学家 Karolis Urbonas,在发表了题为<用数据说谎>的博文.文章总结了用数据误导人最常见的三种方法.这三种做法,或许大家在潜意识里都知道,但未必会把它们与"用数据说谎"联系起来. 当然,作者的目的,是希望数据科学.机器学习从业者引以为戒.全文由雷锋网编译,做了不改变原意的删改. Karolis Urbonas "用数据说话",这句话常被大家挂在口边. 自大学起,那些希望我们养成批判.逻辑