用Excel电子表做数据分析之抽样分析工具

  省教育厅派专家组进行某校检查学生考试试卷,专家组拟对总体进行抽样调查,对学校某班的全体同学随机抽取25名作为调查样本。为了保证结果的非人为性,采用Excel帮助专家组做出抽查的结果。

  抽样分析工具以数据源区域为总体,从而为其创建一个样本。当总体太大而不能进行处理或绘制时,可以选用具有代表性的样本。如果确认数据源区域中的数据是周期性的,还可以对一个周期中特定时间段中的数值进行采样。也可以采用随机抽样,满足用户保证抽样的代表性的要求。

  注:本功能需要使用Excel扩展功能,如果您的Excel尚未安装数据分析,请依次选择“工具”-“加载宏”,在安装光盘的支持下加载“数据分析库”。加载成功后,可以在工具的下拉菜单中看到“数据分析”选项。

    操作步骤:

  1. 打开原始数据表格,制作本实例的原始数据无特殊要求,只要满足行或列中为同一属性数值即可。实例中显示的是学生学号。


  原始数据表格

  2. 选择“工具”—“数据分析”—“抽样”后,出现对话框,依次选择:


  数据分析

  输入区域:把原始总体数据放在此区域中,数据类型不限,数值型或者文本型均可;

  抽样方法:有间隔和随机两种。间隔抽样需要输入周期间隔,输入区域中位于间隔点处的数值以及此后每一个间隔点处的数值将被复制到输出列中。当到达输入区域的末尾时,抽样将停止。(在本例题中没有采用);随机抽样是指直接输入样本数,电脑自行进行抽样,不用受间隔的规律限制;

  样本数:在此输入需要在输出列中显示需要抽取总体中数据的个数。每个数值是从输入区域中的随机位置上抽取出来的,请注意:任何数值都可以被多次抽取!所以抽样所得数据实际上会有可能小于所需数量。本文末尾给出了一种处理方法;

  输出区域:在此输入对输出表左上角单元格的引用。所有数据均将写在该单元格下方的单列里。如果选择的是“周期”,则输出表中数值的个数等于输入区域中数值的个数除以“间隔”。如果选择的是“随机”,则输出表中数值的个数等于“样本数”;

  3.然后单击确定就可以显示结果了(这是电脑自行随机抽样的结果)。


  随机抽样的结果

  

    需要说明的情况:

  由于随机抽样时总体中的每个数据都可以被多次抽取,所以在样本中的数据一般都会有重复现象,解决此问题有待于程序的完善。可以使用“筛选”功能对所得数据进行筛选。

  选中样本数据列,依次执行“数据”-“筛选”-“高级筛选”,如下图所示。


  高级筛选

  最后的样本结果如下图所示,请您根据经验适当调整在数据样本选取时的数量设置,以使最终所得样本数量不少于所需数量。


  最后的样本结果

  如有问题可以发信至: wangbigbird@163.com 与我交流。

时间: 2024-12-25 09:31:46

用Excel电子表做数据分析之抽样分析工具的相关文章

教你使用Excel做数据分析之回归分析方法

在数据分析中,对于成对成组数据的拟合是经常遇到的,涉及到的任务有线性描述,趋势预测和残差分析等等.很多专业读者遇见此类问题时往往寻求专业软件,比如在化工中经常用到的Origin和数学中常见的MATLAB等等.它们虽很专业,但其实使用Excel就完全够用了.我们已经知道在Excel自带的数据库中已有线性拟合工具,但是它还稍显单薄,今天我们来尝试使用较为专业的拟合工具来对此类数据进行处理. 注:本功能需要使用Excel扩展功能,如果您的Excel尚未安装数据分析,请依次选择"工具"-&qu

学习用Excel做数据分析之移动平均方法

某化工反应过程,每隔2分钟对系统测取一次压力数据.由于反应的特殊性,需要考察每8分钟的压力平均值,如果该压力平均值高于15MPa,则认为自属于该平均值计算范围内的第一个压力数据出现时进入反应阶段,请使用Excel给出反应阶段时间的区间. 移动平均就是对一系列变化的数据按照指定的数据数量依次求取平均,并以此作为数据变化的趋势供分析人员参考.移动平均在生活中也不乏见,气象意义上的四季界定就是移动平均最好的应用. 注:本功能需要使用Excel扩展功能,如果您的Excel尚未安装数据分析,请依次选择"工

用Excel做数据分析之相关系数与协方差

化学合成实验中经常需要考察压力随温度的变化情况.某次实验在两个不同的反应器中进行同一条件下实验得到两组温度与压力相关数据,试分析它们与温度的关联关系,并对在不同反应器内进行同一条件下反应的可靠性给出依据. 相关系数是描述两个测量值变量之间的离散程度的指标.用于判断两个测量值变量的变化是否相关,即,一个变量的较大值是否与另一个变量的较大值相关联(正相关);或者一个变量的较小值是否与另一个变量的较大值相关联(负相关);还是两个变量中的值互不关联(相关系数近似于零).设(X,Y)为二元随机变量,那么:

做数据分析时,R 用户如何学习 Python?

本文是帮助 R 用户增强技能和为数据科学进阶而学习 Python (从零开始).毕竟,R 和 Python 是数据科学从业者必需掌握的两门最重要的编程语言. Python 是一门功能强大和多用途的编程语言,在过去几年取得惊人发展.它过去用于 Web 开发和游戏开发,现在数据分析和机器学习也要用到它.数据分析和机器学习是 Python 应用上相对新的分支. 作为初学者,学习 Python 来做数据分析是比较痛苦的.为什么? 在谷歌上搜索"Learn Python ",你会搜到海量教程,但

创业公司如何做数据分析(六)数据仓库的建设

作为系列文章的第六篇,本文将重点探讨数据处理层中数据仓库的建设.在第二篇运营数据系统一文,有提到早期的数据服务中存在不少问题,虽然在做运营Dashboard系统时,对后台数据服务进行了梳理,构建了数据处理的底层公共库等,但是仍然存在一些问题: 中间数据流失,计算结果没有共享.比如在很多数据报告中都会对同一个功能进行数据提取.分析,但是都是各自处理一遍,没有对结果进行共享. 数据分散在多个数据源,如MySQL.MongoDB.Elasticsearch,很难对多个源的数据进行联合使用.有效组织.

创业公司做数据分析(四)ELK日志系统

作为系列文章的第四篇,本文将重点探讨数据采集层中的ELK日志系统.日志,指的是后台服务中产生的log信息,通常会输入到不同的文件中,比如Django服务下,一般会有nginx日志和uWSGI日志.这些日志分散地存储在不同的机器上,取决于服务的部署情况了.如果我们依次登录每台机器去查阅日志,显然非常繁琐,效率也很低,而且也没法进行统计和检索.因此,我们需要对日志进行集中化管理,将所有机器上的日志信息收集.汇总到一起.完整的日志数据具有非常重要的作用: 信息查找.通过检索日志信息,定位相应的bug,

《从Excel到R 数据分析进阶指南》一导读

序 从Excel到R 数据分析进阶指南 Excel是数据分析中最常用的工具.本书通过R与Excel的功能对比介绍如何使用R通过函数式编程完成Excel中的数据处理及分析工作.我们总结出最常用的50个函数.通过这些函数介绍如何通过R完成数据生成和导入.数据清洗.预处理,以及最常见的数据筛选,回归预测和假设检验等最常见的操作. 目 录 第1章 生成数据表1.1 导入数据表1.2 创建数据表第2章 数据表检查2.1 数据维度(行列)2.2 查看数据表2.3 查看特定列的格式2.4 查看空值2.5 查看

创业公司如何做数据分析(四)ELK日志系统

作为系列文章的第四篇,本文将重点探讨数据采集层中的ELK日志系统.日志,指的是后台服务中产生的log信息,通常会输入到不同的文件中,比如Django服务下,一般会有nginx日志和uWSGI日志.这些日志分散地存储在不同的机器上,取决于服务的部署情况了.如果我们依次登录每台机器去查阅日志,显然非常繁琐,效率也很低,而且也没法进行统计和检索.因此,我们需要对日志进行集中化管理,将所有机器上的日志信息收集.汇总到一起.完整的日志数据具有非常重要的作用: 信息查找.通过检索日志信息,定位相应的bug,

浅谈站长做数据分析需要注意的几点

做站长的想必大家都知道数据分析的重要性,但是想问一下大家,你们都知道做数据分析我们该尤其注意那几点吗?下面我就关公面前耍大刀,试着浅论一番了,希望能给大家带去帮助. 一.广告点击数据 先来说说淘宝客单页站吧,淘宝客单页站一般都是随便拿个程序,然后首页最上面挂一个广告页模板,现在一般做排行榜的比较多,网站来流量之后,有没有点击广告,点击了哪个,这些数据绝大部分站长都没有理会过,有些人是懒得去分析,有些人是不知道该怎么去统计这些数据,我这里简单说下,我们可以让这个广告链接到网站的一个页面,然后这个页