抛砖引玉:像数据科学家那样思考

这个题目在素材库中已经放了很久了,久久不敢动笔去写。每次打好腹稿,列好提纲,却不知该不该写。之所以犹豫,原因是知道这个话题未来肯定会火。所以现在写起来,需要谨慎,免得贻笑后人。

像经济学家那样思考,是常常被人提起的。究其原因,是因为经济学在社会科学领域有一统天下的趋势,其研究范式被社会学,心理学,甚至历史性借鉴,经济学的思维方式,也可用到日常生活中,从而使得人们想变得想经济学家那样思考问题。类似的,数据科学这几年也是火的不能再火了,过不了几年,每家公司都会考虑增设Cheif AI office,那么如何像个数据科学家那样思考,也会成为热门话题的。

不愿意写这个题目的第二个原因,是在于这个题木下可以写的思维方式真的很多,如果无法分清楚主次,那么会变成名词的罗列。然而“少则得,多则惑”,少年时看倚天小说的第一章,写小郭襄炫技式的展示十种不同的武功,但每一种都没有精通,只觉得过瘾。如今看来,金庸在用暗笔预示着未来峨嵋武功终究不及武当少林。思考方式不过是方法论,不追求掌握的多,但追求收发自如。因此我也释怀了,这里的总结也不必追求全面了。本文中任何的一种思维方式,虽然只是一招一式,不成体系,但任何一招用好,都可以提升自己的思维的敏锐性。

所以这篇文章我更希望是一个抛砖引玉的起点,吸引更多的人来思考该如何让数据科学的思维方式民主化,希望能开启相关的讨论。

下面开始正文。先放几张图,让各位猜猜每张图所代表的思维方法,算热身。

第一个图对应的是抽象。相比于汇编语言,C算是一种抽象;相比于C,python则更是一种抽象。每一种抽象,都提供了一种更快更易上手的高级工具。掌握抽象思维,意味着你能直接就站在巨人的肩膀上,直接站在前人的基础上进行自己的创造。学会使用新出现的高级工具,还意味着你能赶上时代进步带来的红利,不必思考已经被科技进步的红利已解决的问题。

抽象的思维方式,意味着你能摆脱细节,整合不同维度和场景的观察。然而数据思维不等于统计,还需要找出规律,给出解释。对数据的解读,需要你具有要提到的第二种思维方式,即取舍。

有明处就有暗处,有得就有失。而数据能让我们更清楚的看到这些暗处的得失,正是因为这些得失,我们才需要数据,这个不会被我们的情感和主观好恶影响的参谋来帮我们做决策。然而只有意识到任何数据在解读时都会包含取舍,我们才能更全面的解读数据。也只有记住在面临不同质事物的抉择时记得需要搬出数据,才能避免只看到明处的当下的得,而没有看到未来的失。而在需要说服别人去做出取舍时,也需用可视化的数据来量化损益。

第三幅图说的是随机。数据思维不试图追根究底问出具体的因果,而是承认随机的力量,然后试图通过重新类似的现象来预测未来。蒙特卡罗就是这样一种计算方式,而有一类算法,则是基于随机数的。随机性的思维意味着接受不确定性,这方面有很多文章可以参考。例如 随机生存的智慧无常世界的生存圣经 (上)无常世界的生存圣经 (下)。

最后一张图说的你可能会觉得是网络。但这里的关键词是结构。不同的网络有着相同的结构,这是可以在不同领域跨界的基础。结构的改变往往关联着物理上说的相变。识别不同的结构,在数据科学里是找到“隐变量”,是通过调节网络的连接方式来在进行深度学习。而了解一个网络的最好方式,也是按结构对其分类。上图的6种网络结构,每一种会对应不同的行为规律,看清楚了网络的结构的变化,就能找到变化的拐点何时到来。

最后再说一遍,一个抛砖引玉的起点,欢迎大家在留言区讨论。而在铁哥的书中,会对这个话题给出进一步的探讨。

本文作者:佚名

来源:51CTO

时间: 2024-09-20 19:38:01

抛砖引玉:像数据科学家那样思考的相关文章

12个思维导图工具,像数据科学家一样结构化地思考

◆ ◆ ◆ 引言 每个人都能进行全方位的思考,但是,用结构化的方式思考与酝酿使得数据科学家与众不同.在本文中,我们列出了一些对数据科学家来说是很棒的思维导图工具.这些工具提供了用创造性方式产生想法的很好的方法. 让我们从一个数据科学家经常面对的简单小练习开始: 你已经被指定为我们表现最差的店铺的店长,你会在店里做哪些可能的改变? 花几分钟时间仔细想一想.一旦你写下至少几个因素,我们就可以继续下去了. 那么,这个小练习怎么样?容易还是困难?你有多确定你在这个思维捕捉的过程中写下了所有可能的因素?

行业资深专家切身经验——给数据科学家新手的建议

更多深度文章,请关注云计算频道:https://yq.aliyun.com/cloud 本博主关于数据科学的文章有许多篇,系列总结在此博客中: <关于数据科学的那些事> 未来是大数据的时代,成为一名数据科学家是从事这方面研究者梦寐以求的职业,本文是一份给数据科学家新手的建议,关于作者学习数据科学的一些亲身体会. 动力 两年前,我在行业分享了个人从事数据科学的经历.本文原本是为了庆祝自己两年的推特纪念日而写的个人反思,但最终发表在Medium上,这是因为我相信它对许多有抱负的数据科学家是非常有用

数据分析师的基本素养——论如何成为一名数据科学家 Part 2

更多深度文章,请关注: https://yq.aliyun.com/cloud 本文为<数据分析师的基本素养--论如何成为一名数据科学家>文章的第二部分,第一部分请点击这里. Pronojit Saha,数据发烧友 数据科学入门的自学之路 对于那些想要入门数据科学的新手,这里有一份大纲,或许能够为大家提供一些思路.(其内容摘自我的一篇博客:如何获得"基本技能集"-自主学习的方式).我的建议是从下面每项建议中逐一挑选一到两个资料或链接,掌握其中介绍的内容. 基本的先决条件:

数据科学家需要掌握的10项统计技术,快来测一测吧

更多深度文章,请关注云计算频道:https://yq.aliyun.com/cloud 无论你是不是一名数据科学家,都不能忽视数据的重要性.数据科学家的职责就是分析.组织并利用这些数据.随着机器学习技术的广泛应用,深度学习吸引着大量的研究人员和工程师,数据科学家也将继续站在技术革命的浪潮之巅. 虽然编程能力对于数据科学家而言非常重要,但是数据科学家不完全是软件工程师,他应该是编程.统计和批判性思维三者的结合体.而许多软件工程师通过机器学习框架转型为数据科学家时,没有深刻地思考并理解这些框架背后的

每一位数据科学家都应掌握的理论是什么?

[导语]Jean-Nicholas Hould是就职于英特尔的数据科学家.针对热门议题--<检测真假数据科学家之二十问>,他认为,还有一问亦不可少,那就是:"什么是中心极限定理?它为什么重要?"你可能会心中暗喜:中心极限定理,我学过啊?可它为什么如此重要,你了然吗?善于考究的,请阅读原文,不爱折腾的,请看编译文章(80%+内容为译者独立编写) 真假数据科学家检验之二十问 早在2009年,Google首席经济学家Hal Varian就给出了一个非常著名的论断:"在未

大数据科学家可不是那么好当的,五项专业特质你有吗?

大数据科学家有多牛?让我们从有史以来市值最高的科技公司苹果看起.为抢大数据科学家,苹果开出美金16万到20万(约合台币400万到600万)的年薪,以及任何你想得到的好福利:美味员工餐.健身中心.教育津贴甚至冻卵补助,但苹果不是唯一一个需要数据科学家的公司,打开领英(LinkedIn).上面至少有5万3千个数据科学家的职缺,而这还只是美国的统计数字. 美国专业招聘公司罗致恒富(Robert Halt)公布的<2015薪资指南>把大数据工程师列为今年薪资涨幅最大的六大行业之一,预计薪资年成长率9.

想去机器学习初创公司做数据科学家?这里有最常问的40道面试题

导读   想去机器学习初创公司做数据科学家?这些问题值得你三思! 机器学习和数据科学被看作是下一次工业革命的驱动器.这也意味着有许许多多令人激动的初创公司正在起步成长.寻找专业人士和数据科学家.它们可能是未来的特斯拉.谷歌. 对于有职业抱负的你来说,看好一家好的创业公司团队后,如何能够脱颖而出,进入一家靠谱的创业团队呢? 想得到这样的工作并不容易.首先你要强烈认同那个公司的理念.团队和愿景.同时你可能会遇到一些很难的技术问题.而这些问题则取决于公司的业务.他们是咨询公司?他们是做机器学习产品的?

不能成为数据科学家?没关系,你还可以拥有数据思维

数据科学家日益突显的影响力令人惊叹--每次读到这种论调的文章我都感到好笑.虽然不是所有文章都像<哈佛商业评论>一样宣称数据科学家将是"21世纪最热门的职业",但是,几乎都是千篇一律的"我们预见了未来"的语气.我认为这种观点并没有错,但是在这种趋势中,我没有发现什么是值得惊奇或者是新鲜的.如果<洋葱报>(The Onion, 美国最受欢迎的幽默讽刺杂志)要报道,我想标题应该是: "最新研究表明,精通数学和编程的人被大量地雇佣"

数据科学家公司生存指南TOP30秘诀

文章讲的是 数据科学家公司生存指南TOP30秘诀,数据科学家老司机的30个经验之谈,教你如何在公司内获得认同,带你绕过他们曾经踩过的坑.作为一名数据科学家,即便你技术再牛逼,不懂职场社交也会成为你晋升之路上的天花板. 为此,我们创建了一份能够确保数据科学团队获得成功的秘诀top 30榜单.不管你的数据科学团队是新组建的,还是经验丰富的,这份榜单都很适用.作为数据科学家,我们希望把更多的时间用在分析问题上,而花更少的时间处理公司政治的问题. 在管理层与数据科学团队之间常有不和的情况下,我们该如何处