2013年数据分析、数据挖掘、数据科学使用语言排行榜

 最受欢迎的语言仍然是R( KDnuggets 读者中有61%用户在用),python(39%),SQL(37%).SAS仍然稳定在20%之间。增长最快是:Pig/Hive/Hadoop为基础的语言、R、SQL,同时perl, C/C++, 与Unix 在下降。同时我们发现,R与python用户存在一定的重叠

之前的KDnuggets的调查主要是关注:统计与分析软件,但有时候一个全面与强大的编程语言是需要的。这也是最近一次的KDnuggets调查关注的重点,我们咨询:
在2013年中,什么样的程序或者统计语言你是在做分析、挖掘、科学计算的时候所需要的?
基于超过对700名会员的调查,最受欢迎的仍然是R语言(61%的调研会员在用),python(39%),SQL(37%),平均每个调研对象使用2.3种语言
趋势对比过去二年的调查结果,发现2013的趋势是一样的:

  • 2012年调查:什么样的语言可用于数据分析与数据挖掘。
  • 2011年调查:什么样的语言可用于数据分析与数据挖掘。

· 增长率最高的语言,对比2013 vs 2012是Julia,使用人员增加超过2倍。但仍然是一门小众语言,在2013年也仅有0,7%的用户使用。
· 在比较普通的使用语言中:增加相对较大的语言,对比 2013 vs 2012:
· 以hadoop为基础的语言:Pig Latin/Hive/other,19%的环比增长,从2012年的6.7%增加到2013。
· R,16%的环比增长。
· SQL,14%的增长(SQL的增长是的来源于Hadoop和其它的大数据系统中的SQL接口增长)。

语言的使用份额下降最大的是:

  • Lisp/Clojure, 77% 下降
  • Perl, 50%  下降
  • Ruby, 41%  下降
  • C/C++, 35%  下降
  • Unix shell/awk/sed, 25%  下降
  • Java, 22%  下降

R与PYTHON的使用者是否有重合呢?是的。在使用R语言的13%的用户中,更可能使用python与总体相比要高出13%。下面是哪些语言更可能被R语言用户使用(与总体相比)。

评论:

有一些评论说,比如:指出SPSS也是自己的语法和SAS一样--在下次的调研中,我们将会包括进来。
样本的区域分布为:

  • US/Canada, 50.8%,
  • Europe: 25.7%,
  • Asia: 11.8%,
  • Latin America: 6.7%,
  • AU/NZ: 3.2%,
  • Africa/Middle East: 1.5%

原文发布时间为:2013-08-30


本文来自合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

时间: 2024-10-18 12:11:33

2013年数据分析、数据挖掘、数据科学使用语言排行榜的相关文章

《数据科学R语言实践:面向计算推理与问题求解的案例研究法》一一2.3 数据清洗和变量格式化

2.3 数据清洗和变量格式化 本节我们考虑如何将特征矩阵列表menResMat转换为合适的格式以便于数据分析.目前,这些数据值都是字符型,这对于诸如找到参赛者年龄的中位数这样的数据分析是无益的.但是,我们可以利用as.numeric()函数很容易地将年龄转换为数值型.我们需要将整个矩阵都转换为数值型矩阵吗?事实并非如此,比如将参赛者的名字转换为数值型就毫无意义.为此,我们需要创建一个可以允许拥有不同类型变量的数据框.现在我们有6个变量:参赛者姓名.居住地.年龄以及3种类型的时间.正如刚才所说,我

《数据科学:R语言实战》一第2章 序列的数据挖掘2.1 模式

第2章 序列的数据挖掘 数据科学:R语言实战 数据挖掘技术一般用于检测数据中的序列或模式.本章中,我们将试图使数据遵循一种模式,在此模式中,一个或一系列事件可以通过一致的方式预测另一个数据点. 本章描述了在数据集中查找模式的不同方法: 查找模式 在数据中查找模式 约束条件 我们可以在很多较大的数据集中查找模式.这涵盖了很多区域,比如混合人口的变化.使用手机的频率.高速公路质量衰退.年龄因素造成的事故等.不过我们能明确地感受到,有很多模式和序列正等待我们去发现. 我们可以通过使用R编程中的一些工具

2016美国大选预测失败意味着什么?14位专家帮你分析数据科学的未来

雷锋网按:2016年眼看就要结束,外媒KDnuggets近期就机器学习.人工智能.大数据.数据科学和预测分析等领域在2016年取得的主要发展,以及2017年可能发生的变化趋势,询问了业内诸多的专家学者,组成了一个系列文章.昨天,雷锋网(公众号:雷锋网)编译了其中关于大数据的文章:<大数据领域在2016年都有哪些成果及趋势?听听8位专家怎么说>,今天带来关于数据科学和预测分析的部分. 本文中一共采访了14位数据科学和预测分析领域的专家.除了表示大数据和预测分析技术将在2017年度得到更大的发展之

《数据科学实战手册(R+Python)》一第2章 汽车数据的可视化分析(R)

第2章 汽车数据的可视化分析(R) 数据科学实战手册(R+Python) 本章涵盖如下内容. 获取汽车燃料效率数据 为了你的第一个项目准备好R 将汽车燃料效率数据导入R 探索和描述燃料效率数据 进一步分析汽车燃料效率数据 研究汽车的产量以及车型 简介 本书介绍的第一个项目是分析汽车燃料经济数据.我们首先用R对该数据集进行分析.R常常被称为数据科学通用语言,因为它是目前最流行的统计和数据分析语言.在本书前半部分的各个章节中,你将会看到R在数据处理.建模.可视化方面的过人之处,并开发一些有用的脚本,

资源总结——七步学习数据挖掘与数据科学

想知道如何学习数据挖掘和数据科学吗?本文概述了七个步骤,指出的资源能让你成为一名数据科学家. 作者为Gregory Piatetsky,是一名数据挖掘与数据科学方面的专家. 以下为7个步骤用于学习数据挖掘和数据科学.虽然有编号顺序,你也可以并行或以不同的顺序学习: 1 语音:学习R.Python以及SQL语音: 2 工具:了解如何使用数据挖掘和可视化工具: 3 教材:阅读介绍性的教科书,了解基础知识: 4 教育:观看网络研讨会,参加课程,考虑获得数据科学中的证书或学位: 5 数据:检查可用的数据

数据科学和机器学习工具和语言最新动态

文章讲的是数据科学和机器学习工具和语言最新动态,第18届年度KDnuggets软件投票又一次受到了分析.数据科学界和软件生产商的热情参与.与去年相似,约有2900人参与了此次投票.最近几年,Python的使用增长率一直比R快,到今年,Python终于以微弱的优势超过了R的使用率 (52.6% Vs 52.1%).然而最大的惊喜应该是深度学习工具的广泛共享和使用.2017年深度学习有32%的使用率,而在2016年只有18%,2015年9%.谷歌Tensorflow迅速成为深度学习平台的领头者,以2

一份语言选择指南带你玩数据科学,选出你心中支持的语言

更多深度文章,请关注:https://yq.aliyun.com/cloud 随着大数据时代的到来,网络每天会产生大量的数据,一些行业会对这些数据进行分析并协助企业不断地发展新业务.创建运营模式等,比如电子商务.推荐系统等.那么谁对这些大数据进行分析呢?对应的工作领域是数据科学(Data Science),该领域需要结合先进的统计知识.定量分析能力和编程能力.涉及到编程,大家都会面临一个问题,有太多的编程语言可供选择,那么哪些编程语言适合数据科学领域呢?虽然没有正确答案,但想成为一名成功的数据科

Python赶超R语言,成为数据科学、机器学习平台中最热门的语言?

近日,kdnuggets做了一个关于数据科学.机器学习语言使用情况的问卷调查,他们分析了954个回答,得出结论--Python已经打败R语言,成为分析.数据科学和机器学习平台中使用频率最高的语言.有关此次问卷更具体的情况如何?笔者将kdnuggets上发表的总结文编译整理如下: 之前我们在kdnuggets上做了这样一个问卷调查,2016.2017两年,在分析.数据科学和机器学习的工作中,你用R语言,还是Python,或两者都用,或选择其他的语言? 通过分析954个回答,我们得出了这样的结论:虽

为何Python攀上数据科学巅峰?调查显示Python超越R

根据KDnuggets 2017年最新调查,Python生态系统已经超过了R,成为了数据分析.数据科学与机器学习的第一大语言.本文对KDnuggets的此项调查结果做了介绍,并补充了一篇文章讲解为何Python能成为数据科学领域最受欢迎的语言. Python vs R:2017 年调查结果 近日,KDnuggets 发起了一项调查,问题是: 你在 2016 年到现在是否使用过 R 语言.Python(以及它们的封装包),或是其他用于数据分析.数据科学与机器学习的工具? 预料之内的是,Python