上篇博文已经介绍了如何安装Excel的高级数据分析功能,并且介绍了回归分析,说实话篇幅有点长,主要是安装那块截图比较多;这篇主要介绍一下描述统计、抽样分析和直方图。
一、描述统计
中位数、众数、数据分布区间可能还比较容易可以算出,但是标准差和方差等的计算就比较麻烦了,这些都是描述样本数据的常用变量,使用Excel数据分析中的”描述统计”可以得到这些数据。
举个例子:根据过去15天的电子商务转化率,想要得到它的数据分布区间、标准差、峰值和极差等描述统计指标。一般来说,电子商务网站的转换率在3%以下,转换率指的是订单除以访问数,注意不是除以pv,因为对于某些外贸站,访问深度可能比较深,每即次访问可能有>10的pv,所以用pv来做电子商务的转换率不合适。
数据源如下所示:
按照以下图例进行设置:
设置后,会得到如下所示的图表:(解释是我人为添加的,是对指标的解释)
指标数值解释
平均1.90%电子商务转换率的平均值
标准误差0.00201896电子商务转换率数值误差的平方和的平均值的平方根,又称为均方误差的平方根。
中位数0.019处于数列中间位置的值
众数0.018出现次数最多的数
标准差0.00781939是各数据偏离平均数的平均数,它是离均差平方和平均后的方根,用σ表示,标准差是方差的算术平方根
方差6.1143E-05各个数据与平均数之差的平方的平均数
峰度-0.4960863衡量数据分布起伏变化的指标,以正态分布为基准,比其平缓时值为正,反之则为负;
偏度-0.4923336衡量数据峰值偏移的指数,根据峰值在均值左侧或者右侧分别为正值或负值;
区域0.025最大值与最小值的差
最小值0.005
最大值0.03
求和0.285
观测数15数值的数量
最大(1)0.03
最小(1)0.005
置信度(95.0%)0.00433023所谓置信度,也叫置信水平,它是指特定个体对特定实例真实性相信的程度。
二、抽样分析
抽样分析工具以数据源区域为总体,从而为数据源创建一个样本。当总体太大而不能进行处理或绘制时,可以选用具有代表性的样本。
举个例子: 假设这样一种情况,要抽查电子商务转换率的情况是否正常。
数据源如下所示:
按照以下图例进行设置,注意是抽8个样本:
设置后,会得到如下所示的图表:
三、直方图
直方图是最适合描述数据在不同选定区间分布情况的图表。
数据源如下所示:
按照以下图例进行设置:
设置后,会得到数据和图表:
这样估计就很清晰的可以看出数据在哪个区间分布最广了。
Excel的高级数据分析功能是为了提高工作效率,如果有其他经常使用的工具可以实现这些功能,例如SPSS、SAS等,那就不要更换了。
如觉得有转载的价值,转载时请注明文章来源于深圳网站分析。有问题和建议可以随时提出,谢谢!
网站分析:Excel中的高级数据分析(一)