随着大数据的应用与发展,各行业对具有数据科学技能的开发人员的需求持续增长。而希望成为数据科学家的技术人员需要学习如何融入这个领域的职业生涯。
寻求扩大在技术领域的技能?据技术招聘网站Indeed Prime主管Shu Wu介绍,目前对拥有数据科学技能的开发人员的需求目前“非常强劲”,过去四年来,数据科学家的职位需求“大幅增长”。
Shu Wu说:“数据科学家就业前景看好,平均薪酬很高,但成为数据科学家是很艰难的。数据科学家是一个研究数据的伟大的专家,能够使整个组织的数据得到消化和解析。”
美国塔夫斯大学IEEE研究员兼研究生院院长Karen Panetta说,技术进步和大量的在线数据正在影响着每一个部门,对经济产生了巨大的影响。这种所谓的“数据雪崩”不仅仅是数据量的庞大,而且还包括其变化和发展的速度,以及可用的各种数据类型。
Panetta表示:“知道如何使用电子表格和传统数据库不足以应对新兴大数据革命。数据分析需要实时完成,这对决策可能至关重要,能够简单地知道如何使用软件工具只是这个挑战的一部分,了解跨学科的数据,能够传达其意义,并使用统计数字将是与传统‘数字纠正器’不同的因素。”
Forrester公司的分析师Mike Facemire表示:“在学习使用数据的编程语言方面,所有语言的标准是找到一些东西,并做到这一点。”“编写代码是一个伟大的事情,而做错是一个很好的学习经历。”Facemire建议开发人员去开源社区Github查看示例,并找到一个感兴趣的数据集并学习分析它。
最终,了解如何通过将其分解成较小的部分来了解如何解决问题,而不是了解该语言本身,Facemire说。他说:“最后,这只是一种与电脑接口的方法。计算机不在乎你使用哪种语言,它更关心是否正确地解决了问题,以获得正确的结果。”
Panetta表示,一些教育机构已经创建了数据科学学位课程,包括美国的东北大学,波士顿大学,纽约市立大学和莫瑞麦克学院。其中一些学校提供在线课程,通过IEEE计算机学会提供低成本课程和研讨会。
如果技术人员想从事数据科学方面的事职业,那么应该考虑学习这三种语言的一种。
(1)R语言
Panetta表示,R是一种用于数据挖掘人员开发统计软件和数据分析的语言和框架。
Facemire说,过去几年数据分析和数据科学变得越来越流行,这对编程语言发生了巨大的冲击。然而,其受欢迎程度已趋于平稳。R语言具有为数据科学家构建的工具,可以专门用于扩展和插件。
Panetta说:“学习像R语言的人们必须了解基本的数学技能。如果我们只是信任软件的输出,不知道我们真正测量的是什么,而不理解我们提供的数据作为输入,其结果将是灾难性的。”
(2)Python
Python是一种通用的语言,它已经很强大,并且包括可以适应需要在网站或移动设备上显示的可视化环境的工具,Facemire说。Python也比R更加易读。
技术人员如果问道,“如果在考虑我的职业生涯时,我想成为一名数据科学家,那么我应该学习哪种语言?”Facemire说,“那么我会推荐R和Python,看看哪个语言对你有意义,这二者都是绝对可行的”。他补充说,企业通常根据数据科学家的技能要求优先考虑编程语言。
(3)Java
根据WPEngine的一项调查,Java最近被列为最受欢迎和最通用的语言之一。它是另一种通用编程语言,它被专门设计为尽可能少地实现依赖关系。它可以用来构建任何东西,特别是可伸缩的多线程平台,并且具有强大的用户基础。
Panama说,Java也是一种解释语言。与C和C++不同,Java语言不需要对硬件有着更多的了解。这使得计算机科学与工程以外的学习人员更容易学习。事实上,Java在技术职位方面也是需求最多的编码语言。
本文转自d1net(转载)