二十一世纪最性感的职业:数据科学家

 

性感事物方面的权威《哈佛商业评论》宣布,“数据科学家”是二十一世纪最性感的职业。所谓性感,既代表着难以名状的诱惑,又说明了大家都不知道它干的是什么。

不管老板懂不懂数据科学家是干什么的,反正最近几年这个岗位的需求数正在快速攀升,Indeed.com的数据可以为证

但是其性感在什么地方?什么是数据科学家?他们是科学家吗?还是工程师?程序员?抑或是一个商业决策与创新者的新血统?

Indeed.com的数据没有反应出来的一个事实是,尽管这个职业对应的学科在学术界经过长期的酝酿,但终究没有成立为一个新的学科。而这段时间很长的学术孵化期,也许跟今天的数据科学实践有着很大的关系。

我 们首先来简要回顾一下这段历史。早在上世纪六十年代,Peter Naur就首次提议要用“数据科学(data science、Datalogy)”来替代“计算机科学(computer science)”,后来在上世纪九十年代中期为国际分类社团联盟所用。2001年,William S. Cleveland提议将其设立为一个新的学科,吸收“计算在数据方面取得的进展”作为统计学的延伸。《数据科学(Data Science Journal )》及《The
Journal of Data Science》分别于2002年与2003年发行.2005年,国家科学委员会发表了《数字数据收集万岁:促进二十一世纪的研究与教育》,文中将数据科学家定义为“信息与计算机科学家,数据库与软件工程师及程序员,学科专家,成功管理数字数据收集的关键人物。”

到 了本世纪头十年的中期,数据科学不再屈尊于仅列为其他学科的细目清单,开始走出学术殿堂。从学术迈向新职业走出的这半步是Troy Sadkowsky于2009年完成的。他在澳大利亚的一个学术性岗位工作,但却有一个“科学性程序员”的头衔,其职责是开发支撑大规模、“大数据”科学 性研究的应用。2009年一月,数字化数据跨机构工作组发表了一份名为《驾驭科学与社会数字化数据之力》的报告,Sadkowsky从中了解到“数据科学 家”这个词,认为该词是自己所从事工作的最好描述。2009年6月,他在LinkedIn建立了一个数据科学家小组作为其
datasceintists.com网站的辅佐。

但是数据科学从学术向行业的大规模迁移此前早就在美国发生 了,那时候Web公司正在开发大数据技术,需要定量分析员对其收集得海量数据进行挖掘利用。那些不愿呆在象牙塔里的数量分析专家都会跑到华尔街。不过 2008年的时候这个地方的诱惑力下降了。Greylock Partners的数据科学家D.J. Patil跟Jeff Hammerbacher一起在Facebook和LikedIn上建立了数据与分析小组,这一举动被视为是数据科学走向职业化的标志,小组的职能是致力 于对业务能够产生即时的、大规模影响的数据应用。所谓数据科学家就是运用数据和科学创造新东西的人。

而数据科学家这个职位的头衔则是2009年由Natahn Yau首次提及的,他认为数据科学家就是能够从大型数据集中析取出数据,并提供某些可供非数据专家使用的东西的人。

数据科学家、创业家Mike Driscoll则认为数据极客有三个性感之处:建模、转换、可视化。而一种比较有诗意的表述方式是:数据科学家好比是哥伦布遇上科伦坡,目光如炬的探险家与怀疑一切的大侦探的合体。

而 在《数据科学家:二十一世纪最性感的职业》一文中,设计LinkedIn的“你可能认识的人”功能的数据科学家Jonathan Goldman的工作也许是对数据科学家工作方式的最好诠释:首先构建理论、印证预感,然后寻找出模式,对应该推出某人的哪一个网络做出预测。文章最后对 数据科学家的工作进行如下概括:

数据科学家做的,就是在数据中遨游的同时进行探索,其 显著特点是强烈的好奇—他们渴望寻找问题核心,追究问题实质,并把这些东西提炼为一组非常清晰、可以验证的假设。这往往会让人联想到这些都是任何一个领域 最有创意的科学家所具备的特质,很显然,科学家这个头衔适合于这一新兴角色。他们实现价值提升并不是靠做报表或者PPT给高管,而是靠在面向客户的产品与 流程方面所做出的创新。

不过,这一大段的阐述仍然不够简洁明了,在上述观察的基础上我们来给出一个数据科学家的简明版定义:

数据科学家就是采用科学方法、运用数据挖掘工具寻找新的数据洞察的工程师。

科 学办法就是构思假设、测试想法、精心设计实验、经由他人验证,这些是他们从统计身上掌握的知识,经科学训练出来的经验。而工具的运用则是来自其工程经验, 或者更确切地说来自于其计算机科学与编程背景。最好的数据科学家是产品与流程的创新者,有时候还是新的数据挖掘工具的开发者。

何谓性感,这就是。

时间: 2024-08-31 04:26:56

二十一世纪最性感的职业:数据科学家的相关文章

数据科学家:二十一世纪最性感的职业

2006年Jonathan Goldman到商业社交网站LinkedIn工作,那时的LinkedIn还只是刚创业不久,网站注册人数不到8百万,但是很多成员会邀请自己的朋友和同学加入,因此注册人数迅速增加.但是用户要找到已经在网站注册的用户不太容易,比例达不到管理人员的期望值.很明显,有些社交体验缺失了.如同一位LinkedIn管理者说的,这就好像,你到了会议接待处,结果发现一个人都不 认识,你只好站到一边,一个人小酌很可能你早早地离开了. Goldman是斯坦福物理学博士毕业,他非常着迷于越来越

二十一世纪商业评论

二十一世纪商业评论封面 北京东南五环外,沿地铁亦庄线,出经海路站不远处,可以看到一块已经平整完毕的空地.这个总面积4.5 万平方米的地块,绕行一周大约需15 分钟.不过,虽然空地四周已经围起了绿色铁架,但却看不到任何破土动工的迹象.4 月中旬,本刊记者在现场看到,空荡荡的地面上没有任何告示,只是垒着几垛红砖,一个工人正躺在上面,享受着春日的阳光. 在北京国土资源部门的网站上, 这片空地被标记为"北京经济技术开发区路东区E16C1-1.E16C1-2 地块".2012 年1 月10 日,

二十一世纪的计算 | 微软亚洲研究院洪小文54页PPT讲述人工智能和人类智能的 “共进化”

雷锋网(公众号:雷锋网)按:本文根据洪小文在"二十一世纪的计算"学术研讨会所做的报告<Co-Evolution of Artificial Intelligence and Human Intelligence>编辑整理而来,在未改变原意的基础上略有删减. 近日,"二十一世纪的计算"学术研讨会在韩国首尔举行.它是微软亚洲研究院自成立之初便开始举办的年度学术盛会.作为中国及亚太地区规模最大.最具影响力的计算机科学教育与研究盛会之一,迄今为止该大会已在中国.

二十一世纪了,没有PR谁理你

摘要: 值谷歌PR更新之际,广大站长朋友都在忙活着为自己的网站添加友情链接,或买或换,不一而足.尽管PR值并非是衡量一个网站权重的唯一标准,但说到底也还处于标准的范围之内,在为 值谷歌PR更新之际,广大站长朋友都在忙活着为自己的网站添加友情链接,或买或换,不一而足.尽管PR值并非是衡量一个网站权重的唯一标准,但说到底也还处于"标准"的范围之内,在为自己的网站交换友情链接的时候,PR值这个条件仍然是众站长必须附带上的.尽管鄙人对于PR值不是十分看重,但是世人皆俗,自己也不能标新立异zhu

阿里巴巴集团1.7亿美元投资中信二十一世纪

1月23日消息,阿里巴巴集团宣布,联手云锋基金,对中信集团旗下 中信二十一世纪有限公司(下称中信21CN)进行总额1.7亿美元的战略投资.中信21CN公告显示,阿里巴巴集团将联合云锋基金通过认购中信21CN增发新股的方式,对其完成1.7亿美元战略投资.交易完成后,阿里巴巴和云锋基金将持有中信21CN 54.3%的股份,其中阿里巴巴集团持股38.1%,云锋基金持股16.2%.投资完成后,中信21CN与阿里云计算平台将进一步完成后台数据的打通和对接,联手推进国内药品信息化平台建设.这是阿里巴巴集团在

二十一世纪的计算 | 康奈尔大学教授Fred B. Schneider开讲计算机安全

雷锋网(公众号:雷锋网)按:本文根据Fred B. Schneider教授在韩国"Computing in the 21st Century 2016"大会上所做报告<A Science of Cyber – Security?>以及微软亚洲研究院首席研究员刘铁岩博士的解说编辑整理而来,在未改变原意的基础上略有删减. Fred B. Schneider是康奈尔大学计算机科学系系主任及Samuel B. Eckert讲席教授.他是美国科学进步协会(1992年),美国计算机协会

二十一世纪,游戏的年代!

人人是明星,明星也是人!!! 比赛:全民运动,只能说是个游戏加娱乐,千万别当真! 看完超男快女,知道了现在雌雄同体最吃香,当然传说中的佛也是雌雄同体!不知是人家变态还是我们心理变态就喜欢看和我们不一样的,所以想赢一定要怪,加超怪!超变态就更出名! 看完青歌赛,开始211.html">觉得终于可以看一回专业比赛了,等流行唱法比完大家都失望而归,连我妈和爸家都为第二名第三名叫怨,最差的永远当第一,亏得那么多的专家当评委,不过如此嘛!所以要赢一定要记住中国五千年文化雷打不动的一件大事就是:htt

二十一世纪企业战略的主要内涵

知识经济时代的现代企业里有两个重要问题,一个是战略问题,一个是经营性策略问题.经营性策略考虑的是短期问题,战略考虑的是长期问题,所以它决定了企业的可持续发展和产品的强竞争能力. 一.企业战略是现代企业立身之本研究世界企业发展史,我们会发现不同环境.不同性质和不同所有制的企业的生命周期是不同的.而影响企业寿命的除发展环境.产品结构.组织管理.技术创新.产品质量和资金规模外,企业战略研究的重视与成功与否是至关重要的.英国有一个300年俱乐部,企业年龄大都在200年以上.企业年龄低于100年的,名称前

二十一世纪14大数据泄露事件

安全从业者从专业角度出发票选出14起最严重数据安全事件     数据安全事故每天都在上演,统计数据分分秒秒在增加记录条目.但是,重大数据泄露和小型数据安全事故之间的差别在哪里呢?请看下列本世纪最重大数据泄露清单,你会发现其中关键. 该清单未必基于被泄记录数量,而是根据数据泄露事件对公司.保险公司.用户或账户持有者造成的破坏或风险定出的.某些案例中,口令和其他信息收到加密措施良好保护,因而口令重置就消弭了大部分风险. 1. 雅虎     时间:2013-2014 影响:15亿用户账户 2016年9