很多企业都纷纷开始关注大数据和数据分析,但是人才难寻啊!事实上,要把一个编程新人训练成一个能力卓越的数据科学家是一件很简单的事,只需要几台云计算服务器,然后再跟数据专家在网上学上几周机器学习就可以了。
最著名的数据科学家培养案例要数“企业预测解决方案平台”Kaggle上最近的一次大奖得主Carter S。这名Kaggle用户利用简单但是效率非常高的方法开发出了一款“过度杀伤型”分析工具来预测保险行业的风险。
这是一款让人感到惊奇的工具,Carter将自己在网络课堂上学到的内容用于保险行业风险预测,并以此找到了好工作。他之前学过自然语言处理和社交网络分析,所以大数据分析根本就难不倒他。但是怎么把那些干刚走出大学校园而且还没有经验的毕业生培养成大数据科学家呢?网络课堂速成即可!
Luis Tandalla在Coursera等网络课堂上学习了一些免费课程之后,就利用自己所学的知识在Kaggle的比赛上获了奖,他的作品可以帮助教师批改简单题并评分。而他此前根本就不知道人工智能和机器学习是什么东西。
Luis Tandalla说要做数据科学家,首先要有学习的激情。所以他就在Coursera上选修了自然语言处理和概率模版课程,然后边学边在Kaggle上实践自己的观点。他将于明年毕业,取得机械工程学士学位,而非大家想象中的计算机科学专业。他说自己毕业后想创立一家自己的预测软件服务公司。
Tandalla可能不是唯一的例子。Kaggle上的获奖者大都在Coursera上学习了机器学习课程。新加坡人Xavier Conort去年决心转型数据科学家,他通过在网络课堂学习,仅仅用了一年的时间久成了Kaggle上数一数二的数据科学家。
数据分析领路人
Andrew Ng,斯坦福大学教授、Coursera联合创始人之一。他在Coursera上教授的机器学期课程是所有网络选修课程中完成度最高,这不仅仅是一个巧合。如果你想进跟大数据步伐,成为一个数据科学家,在本国没有优势资源的情况下,可以考虑Coursera、Udacity、EdX等网络课堂,免费进行学习。在中国,许多数据挖掘企业应该会非常喜欢这样的课程,可以省下一大笔培训费用。
Ng说,要成为一个数据科学家,首先要对代数、概率非常了解,前提条件还包括对编程有基本的了解。
他还提到:“机器学习正成为硅谷最受追捧的技术之一。”许多企业的人事官员说,因为企业目前急缺此类数据分析人才,所以只要一名员工能够按时保质完成网络课程就可以显著提高他的工资和职业展望。
为什么此类网络课程会风靡?为什么数据分析能够改变世界?
Ng认为当前之所以这些网络课程如此受欢迎,就是因为它将已有的、成熟的理论变成可以应用的技术,让已经学会前提条件的学生有施展才能的机会,而不是只会编程和写程序、写应用。除此以外,学生可以根据自己的学习能力调整学习步伐,论坛上的信息也可以帮助他们完成课程。
Ng说,如果不是有幸在硅谷与那些全球最聪明的计算机专家混在一起的话,他也不可能讲出这么出色的机器学习课程。在他的课程中,他很少谈及算法,说的更多地还是如何将机器学习应用于实践。他认为学会应用比学会知识更重要。这就好比学编程和学编程语言,一个是实践,一个只是理论知识而已。
好好学习,你可能就是下一个爱因斯坦
其实,成为一个数据科学家并不是终极目标,即使是Kaggle比赛的冠军也不能将其视作自己职业生涯的重点。通过网络课程还可以学到更多知识,让有能力的人学到真正有用的知识,创造更多成果。
“这事让我感到疑惑,”Ng说,“说不定下一个爱因斯坦就是一个坐在电脑前看教学视频的阿富汗小女孩。”
文章来源:GigaOM
(责任编辑:蒙遗善)