大数据时代,如何成为数据科学人才?

我今天的主题是给学生、给年轻人讲的,因为我觉得这些是最根本的。即使你管理阶层再好,你找不到人也什么也没有,而对于每个人来说最重要的就是把自己的价值提高,而不是地位,这是两回事。数据科学家的年薪是多少,这都不是我们的目标,也不是成功的标志,这是一种价值的标志。怎么样才能有价值?我们要有能力,谁都想要你,不是因为你是他的亲戚或者学生,他想要你这才是价值,我们要的是价值,而不是所谓的成功。

  什么是数据科学?

数据科学有很多很多定义,最基本的定义就是computer science,还有数学、统计、目标、知识,这是最基本的,再说多了就过分了。一般对于年轻人来说,现在不可能到那么细的程度,我们应该变成一个通才,哪个公司都愿意要我们。清华大学之所以现在变成这个样子,就是因为在1952年院系调整的时候,每一个专业就是一个生产线,弄的很细很细,没有一个更宽广的视野。大数据,所谓大就是这个样子。数学关键是逻辑而不是具体的方法,不是你怎么求多项式的根,而是它的基本逻辑,它的数学语言,这一点要懂。数学逻辑是各种学科当中最严格的逻辑,无论你学逻辑的,学物理的,学什么的,文科学逻辑的肯定是不如学物理的,学物理的逻辑肯定不如学数学的,所以你要跟学数学的辩论的话就很困难。文理分科造成没有逻辑的文章,没有逻辑的法官。

数据科学家是做什么的?

对那些高科技公司来说,数据科学家可以挖掘新的信息,帮助公司开源节流。每个公司都是要这样的,所以它需要的是人才,这是关键。我们说数据科学,当然科学也有艺术,这两个都有关系。科学意味着没有权威,不要迷信那些权威,中国人喜欢崇拜权威。任何科学研究的目的是基于数据,颠覆旧的理论,这样才能往前进,所以你必须要有科学精神。

诺贝尔物理奖没有一个是承认过去怎么样的,而是推翻过去的事情,这是科学,是颠覆性的。

什么样的人能成为数据科学家?

如果你擅长数学,有很清晰的逻辑思维能力,有技能组合,就可能当上数据科学家。投票显示,数据分析和数据挖掘是最大的求职法宝。数据科学火爆的原因是,尽管高科技公司都有自己的数据科学团队,但是那些非科技公司和很大的公司也需要做这些东西,他们需要能做这些东西的人。现在关键是人,关键是你们怎么样让自己成为被需要的人。

另外,你是不是做数据科学家的材料?相比专长于任何特定编程语言,泛型变成技巧更重要。最重要的素质就是能快速学习东西。在这个时代技术发展的突飞猛进,语言很快会过时,新的语言会迅速普及,所以学习东西快的人比单独领域的专家更有前途,你有这个潜力你能干什么事。我要看你这个人的潜力,而不是你知道什么。知识再多你也超不过一个硬盘吧?但是硬盘没有创造力。如果你每天花大量的时间编程,分析控制面板上的数据,获得相关知识和信息,如果你对这样的工作感兴趣你就适合干这行。现在我没事就处理编程数据,我看了这个以后觉得自己有点像。如果仅仅是想拿高工资,那可能觉得这样的日子就很苦了。实际上不光是这个工作,干任何工作,即使是坐牢你也要把它当成乐趣。我有一个朋友,他就被上级陷害之类的坐牢了,现在坐牢很容易。他后来就跟我说,他觉得这件事情很享受,就是你怎么看这个问题了。你要是发愁过一天也是一天,高高兴兴的过一天也是一天,所以你要考虑怎么活才合适。

真正适合干这一行的人,会在业余时间里编程序、分析数据,他的目的就是自娱自乐,而不是为了要拿着什么学位,拿到什么样的头衔,最终他自己把自己的价值就提高了。如果你爱的不是数据本身,而是它给你带来的高薪,那你很难跟上来的人来竞争了。要学会干一行爱一行,每个人都应该学会热爱数据,即使是为了自己的事业前途也应该这样想,为了自己的心理也应该这样想。

还需要什么呢?我刚说了,学习能力比知识更重要,欢迎挑战、乐于攀登。如果没有挑战了,没有古怪的数据,我觉得很无聊,有点挑战的我就很高兴,我相信很多人都这样,这样活着才有意义,像猪一样的活着没有意义。你像富二代开着宝马到处飙车,他是找不到活着的意义啊,穿名牌什么的,是让别人觉得你有点价值,实际上别人一看你更没有价值了。马克思的座右铭“怀疑一切”,在怀疑中成长,我们国家从来不倡导这个,为什么咱们不宣传这个?不要给自己贴标签,就是我学什么方向的,别的不搞,岁数大了,学不会了,很多人都有这样的借口,这实际上是借口,我现在每天都在网上学东西,所以我现在教的东西总是新的,我的书一版再版,我现在大概写了有30本书了,为什么再版,因为我发现原来的有错或者不全面,我一定要把事情说的更透彻一点,说的更好一点。

如何成为数据科学家?

计算机最根本的就是领域知识,你必须了解领域知识,你才能够知道该怎么做

如果你仅仅是一个干巴巴的统计学家,你不了解统计,你可以做很多荒谬的事,不了解实际问题。有一个例子,在医学杂志发表的一个很有名的文章,说如果父母在婴儿房间内睡觉总是开着灯,婴儿就会有高度近视。后来再发现,凡是父母高度近视的,往往有给小孩开灯的习惯。到底什么造成小孩高度近视,现在你们知道的,但是当时的人不知道,所以要有很深刻的领域知识,只有明白目标领域知识的人才能明白它的意义,知道往哪个方向努力,去判断分析结果的可能性。如果没有领域知识主导的人分析肯定有误导,无论什么地位。在中国院士到哪儿都去发表理论,就像金正恩到哪儿都发表指示一样。所以用数据来说话,其他的一切都是废话。我每年看到很多很多的文章,包括一些大赛,这个赛那个赛,好多都是莫名其妙的假定,就连31个省市自治区的数据都假设是正态分布,这31个省市自治区的就不是样本,更不用说是正态分布。

作为科学就这么多内容,对年轻人来说就是要明白这些基本的东西,太花哨的东西就没意义了,那就是扩展了也不是没意义,不要钻进去出不来了。

你离得越远看得越清楚,站得越高了解的全局越好

不要太具体了,不要迷信这些炒作的新名词、新概念,用自己的大脑,用常识判断,想想合不合理。过去某个人的经验是他的经验,不是你的经验,他在特定环境、特定时间有作用,但不是现在。如果你要跟风就意味着永远是跟随,也绝对不会有出息。 炒作没人管,只要有观众给你鼓掌,观众回去一脑袋浆糊,但是每个人自己不能糊涂。第一原料就是数据,什么是数据?照片都可以变成数据。

要有批判性思维

要有基于数据的批判性思维,而不是基于主观经验、权威或者是局部的知识,也不是迎合取宠式的思维。在中国取宠思维很厉害,你说GDP增加多少就是多少,这不是说的,要有人做。工具就是刚才说的能力加计算机系统加泛型。

个人还要有快速的自学能力和对数据分析的爱好

我从来没学过计算机,也没学过计算机编程。英文都没学过,全都是自学的,所以我对自学很相信。现在我教的东西都是最近这几年的东西,我现在实际上比一个全职教师教的课还多,但是我教的东西好多都是前一天网上才出现的,我觉得有价值,第二天就放到课堂上了。只有不断的自学,不断的学习才能当老师。如果你不断的跟学生演示80年前的推导过程,显示你的记忆力好,那不是好老师。

关于 “快乐”

什么人最快乐?被人需要,这是很重要的,就是你得有价值。因为你的专长、能力、善良、尊重、爱心、品质、性格、智力、分享。今天早上他们也讲了,就是在公司里跟人家能相处,至少你得是可爱的。还要关心他人,能让别人快乐的人是快乐的。如果买点东西在宿舍里藏在被窝里吃,那高兴吗?如果跟别人分享的话会更高兴。尊敬别人的人是快乐的,一定要尊敬别人。如果大家都尊敬别人的话,社会上任何犯罪都没有了,因为犯罪都是偷、抢、杀,侮辱别人这都是不尊敬别人的。诚实坦荡的人是快乐的,这就是不能撒谎,永远不能撒谎。还要心胸开阔,不去计较一些小事情。最关键的就是爱人如己,你爱人不是因为他能爱你回来,也不是因为他可爱,而是对任何事情都尊重,这是最根本的一点。如果这点你要做到了,如果人人都能做到,那世界就太理想了。不管怎么样,我希望大家能够快乐。

本文转自d1net(转载)

时间: 2024-08-01 11:52:56

大数据时代,如何成为数据科学人才?的相关文章

大数据时代,小数据中心

文章讲的是大数据时代,小数据中心,中国(上海)国际数据中心技术设备展览会在上海隆重开幕.紧跟德国工业4.0的新趋势,威图(Rittal)携绿色.节能.可靠的数据中心系统解决方案登陆本次展会.在变革的大数据时代,威图(Rittal)将引领数据中心行业健康稳步发展. 展会现场,威图针对模拟的微模块.通道封闭系统,进行了实时监测,参观者可以通过液晶屏,直接了解数据中心内部各项指标信息.威图(Rittal)的微模块,它可根据客户需求在工厂进行预制,并可灵活拆卸,快速组装.威图(Rittal)的LCP机柜

大数据时代下的“数据失控”危机

&http://www.aliyun.com/zixun/aggregation/37954.html">nbsp; 麻省理工学院的阿莱克斯·彭特兰教授说"赤裸裸地站在数字聚光灯下接受审查不是人们应该得到的待遇",这句话听起来既包含着对改善人类当前数字化生活尴尬处境的坚决,又透露出对人们失去个人数据控制力的无奈.频繁发生的数据泄漏事件已经宣告了"数据失控"时代的到来. 在过去差不多十几年的时间里,我们毫无保留地把个人信息交给了互联网,这些信息

大数据时代是相信数据科学还是领导的感觉

&http://www.aliyun.com/zixun/aggregation/37954.html">nbsp; 即使企业有开发大数据的能力(其实大部分并没有这个能力),他们还总是喜欢使用未经测试的想当然的想法,而非利用数据科学来做决策.视觉分析公司Atheon Analytics的总经理Guy Cuthbert认为,即使是在那些使用数据的公司中,许多仍然会有选择性的支持那些已经被认可的观点,而非真正数据验证的事实,而利用数据本身,只是靠想法制定决策的一种伪装罢了. 最近Act

“后大数据”时代,给数据加上智能

今年是人工智能大火之年,不仅有3月份AlphaGo 与李世石的人机大战让普罗大众知道了人工智能的巨大进步,更有各种有关自动驾驶.无人汽车的新闻不断给人工智能"添柴加火".人工智能的大火似乎让大数据有些相形见绌.不过,在大数据专业人士TalkingData CEO崔晓波看来,人工智能这一轮"行情"也可以纳入大数据的发展轨道,标志着大数据进入"后大数据时代",也称智能数据时代--这是TalkingData主办的"T11 2016暨Talki

大数据时代要有大数据思维

以大数据思维充分挖掘海量数据中的信息金矿,建设国家大数据综合试验区的步伐才能走得更加稳健. 记者日前从省发改委获悉,省委.省政府联合印发了<关于加快推进国家大数据综合试验区建设的若干意见>,明确提出我省要建成引领中部.特色鲜明的国家大数据综合试验区.(见5月22日本报报道) 大数据日渐成为社会发展的战略性资源和资本要素,我省位列全国8个国家大数据综合试验区之一,再次说明河南在全国发展大局中战略地位越来越重要.抓住难得机遇,推动大数据发展,对做好其他各项工作都有很大帮助.比如最近鸡蛋价格比20年

大数据时代 你的数据属于谁?

在这个所谓的DT(数据科技)时代,数据的价值正在为人所知,由此而来的个人信息泄露事件也层出不穷.然而,当人们将矛头指向黑客入侵系统漏洞.撞库拖库等,却忽略了掌握数据源的互联网企业. 记者调查:诸多网站默认可以转让你的信息个人数据至今无法确权 在这个所谓的DT(数据科技)时代,数据的价值正在为人所知,由此而来的个人信息泄露事件也层出不穷.然而,当人们将矛头指向黑客入侵系统漏洞.撞库拖库等,却忽略了掌握数据源的互联网企业. <IT时报>记者在调查中发现,数据价值虽已传递到产业链的各个环节,但数据交

大数据时代:挖掘飞行数据价值

大数据时代已经来临. 航空公司也同样拥有大量的数据,仅飞行数据就可以包含QAR(快速存取记录器)数据.运行签派数据和飞行计划数据等,数据规模巨大.然而,掌握这些庞大的数据信息只是基础,将这些有含义的数据进行专业化处理,挖掘其价值才能达到帮助航空公司经营决策的目的. 从2011年开始,山东航空公司尝试综合集成QAR.运行签派.飞行计划等飞行数据,搭建飞行数据综合利用系统这一综合平台.2013年,该系统建设完成.山航利用该平台监控临时航线的使用情况,合理安排临时航线.2013年,山航全年缩短飞行距离

大数据时代说来就来 数据垃圾变黄金

大数据时代是指以大数据为驱动,影响生产率增长和消费者盈余模式的一个新的时代.大数据是高容量,高速度和高品质的信息资产,需要新的处理形式,其难以采用常规工具进行采集和处理,大数据时代里,常利用软件工具对海量数据进行挖掘和运用,借此帮助进行决策.洞察发现和流程优化. 大数据时代的迟到 一般来讲,大数据的概念提出可以追溯到上世纪90年代,大数据一词在当时就已经开始流行.而知名的咨询公司麦肯锡在2011年提出"数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素"正式代表着大数据时

《大数据时代》让数据“说话”

题外:前天下午,从老大办公室出来,手里多了一本书--<大数据时代>,据说这是区上给每位校长发的书,老大的思想总是走在最前列的,或许他已经看过这本书,他决定给学校每位老师买一本<大数据时代>.去他办公室,见他桌上放着这本书,好奇心驱使我翻了起来,然后又放回原处,不料,老大说:"拿去看吧!"

大数据时代三种数据成摆设

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 在这个人人都高喊"大数据时代"的今天,数据似乎被提到一个前所未有的高度.无论是个人站长还是大中型公司,亦或是大型跨国集团,无论是网络营销还是线下的市场营销都在意识到数据的重要性,凡是都以数据来说话.但是,据小生了解,在很多中小型公司和个人站长中,对于数据重视有余,却利用不足.首先声明,本文在数据高手面前,都有点多余,都是小