用Excel做数据分析之相关系数与协方差

  化学合成实验中经常需要考察压力随温度的变化情况。某次实验在两个不同的反应器中进行同一条件下实验得到两组温度与压力相关数据,试分析它们与温度的关联关系,并对在不同反应器内进行同一条件下反应的可靠性给出依据。

  相关系数是描述两个测量值变量之间的离散程度的指标。用于判断两个测量值变量的变化是否相关,即,一个变量的较大值是否与另一个变量的较大值相关联(正相关);或者一个变量的较小值是否与另一个变量的较大值相关联(负相关);还是两个变量中的值互不关联(相关系数近似于零)。设(X,Y)为二元随机变量,那么:


  为随机变量X与Y的相关系数。p是度量随机变量X与Y之间线性相关密切程度的数字特征。

  注:本功能需要使用Excel扩展功能,如果您的Excel尚未安装数据分析,请依次选择“工具”-“加载宏”,在安装光盘中加载“分析数据库”。加载成功后,可以在“工具”下拉菜单中看到“数据分析”选项。

    操作步骤

  1. 打开原始数据表格,制作本实例的原始数据需要满足两组或两组以上的数据,结果将给出其中任意两项的相关系数。


  2. 选择“工具”-“数据分析”-“描述统计”后,出现属性设置框,依次选择:

  输入区域:选择数据区域,注意需要满足至少两组数据。如果有数据标志,注意同时勾选下方“标志位于第一行”;

  分组方式:指示输入区域中的数据是按行还是按列考虑,请根据原数据格式选择;

  输出区域可以选择本表、新工作表组或是新工作簿;


  3.点击“确定”即可看到生成的报表。

  可以看到,在相应区域生成了一个3×3的矩阵,数据项目的交叉处就是其相关系数。显然,数据与本身是完全相关的,相关系数在对角线上显示为1;两组数据间在矩阵上有两个位置,它们是相同的,故右上侧重复部分不显示数据。左下侧相应位置分别是温度与压力A、B和两组压力数据间的相关系数。


  从数据统计结论可以看出,温度与压力A、B的相关性分别达到了0.95和0.94,这说明它们呈现良好的正相关性,而两组压力数据间的相关性达到了0.998,这说明在不同反应器内的相同条件下反应一致性很好,可以忽略因为更换反应器造成的系统误差。

  协方差的统计与相关系数的活的方法相似,统计结果同样返回一个输出表和一个矩阵,分别表示每对测量值变量之间的相关系数和协方差。不同之处在于相关系数的取值在 -1 和 +1 之间,而协方差没有限定的取值范围。相关系数和协方差都是描述两个变量离散程度的指标。

时间: 2024-09-27 07:21:46

用Excel做数据分析之相关系数与协方差的相关文章

用Excel做数据说明——相关系数与协方差

化学合成实验中经常需要考察压力随温度的变化情况.某次实验在两个不同的反应器中进行同一条件下实验得到两组温度与压力相关数据,试分析它们与温度的关联关系,并对在不同反应器内进行同一条件下反应的可靠性给出依据. 相关系数是描述两个测量值变量之间的离散程度的指标.用于判断两个测量值变量的变化是否相关,即,一个变量的较大值是否与另一个变量的较大值相关联(正相关);或者一个变量的较小值是否与另一个变量的较大值相关联(负相关);还是两个变量中的值互不关联(相关系数近似于零).设(X,Y)为二元随机变量,那么:

用Excel做数据分析——回归分析

实例 某溶液浓度正比对应于色谱仪器中的峰面积,现欲建立不同浓度下对应峰面积的标准曲线以供测试未知样品的实际浓度.已知8组对应数据,建立标准曲线,并且对此曲线进行评价,给出残差等分析数据. 这是一个很典型的线性拟合问题,手工计算就是采用最小二乘法求出拟合直线的待定参数,同时可以得出R的值,也就是相关系数的大小.在Excel中,可以采用先绘图再添加趋势线的方法完成前两步的要求. 选择成对的数据列,将它们使用"X.Y散点图"制成散点图. 在数据点上单击右键,选择"添加趋势线&quo

教你使用Excel做数据分析之回归分析方法

在数据分析中,对于成对成组数据的拟合是经常遇到的,涉及到的任务有线性描述,趋势预测和残差分析等等.很多专业读者遇见此类问题时往往寻求专业软件,比如在化工中经常用到的Origin和数学中常见的MATLAB等等.它们虽很专业,但其实使用Excel就完全够用了.我们已经知道在Excel自带的数据库中已有线性拟合工具,但是它还稍显单薄,今天我们来尝试使用较为专业的拟合工具来对此类数据进行处理. 注:本功能需要使用Excel扩展功能,如果您的Excel尚未安装数据分析,请依次选择"工具"-&qu

如何用Excel做数据分析

  1.Excel普遍的初级用户 Excel的作用就是运用基础制表功能和运算功能,提高报表制作及计算的效率.比用计算器快. 2Excel进阶用户 学习常用函数公式,和更复杂些的报表模型交互,大幅度提高数据结果处理的效率,提高数据分析的深度和广度,做更多的分析 3进行VBA程序的开发应用,进行十万数量级以上的数据处理分析,建议更智能,更强大的数据分析模型 4开发级用户 开发Excel本没有的插件功能,比如郭安定老师的OIIO效率专家,Excelhome的易用宝,罗版主的Excel百宝箱,及国外的o

学习用Excel做数据分析之移动平均方法

某化工反应过程,每隔2分钟对系统测取一次压力数据.由于反应的特殊性,需要考察每8分钟的压力平均值,如果该压力平均值高于15MPa,则认为自属于该平均值计算范围内的第一个压力数据出现时进入反应阶段,请使用Excel给出反应阶段时间的区间. 移动平均就是对一系列变化的数据按照指定的数据数量依次求取平均,并以此作为数据变化的趋势供分析人员参考.移动平均在生活中也不乏见,气象意义上的四季界定就是移动平均最好的应用. 注:本功能需要使用Excel扩展功能,如果您的Excel尚未安装数据分析,请依次选择"工

做数据分析时,R 用户如何学习 Python?

本文是帮助 R 用户增强技能和为数据科学进阶而学习 Python (从零开始).毕竟,R 和 Python 是数据科学从业者必需掌握的两门最重要的编程语言. Python 是一门功能强大和多用途的编程语言,在过去几年取得惊人发展.它过去用于 Web 开发和游戏开发,现在数据分析和机器学习也要用到它.数据分析和机器学习是 Python 应用上相对新的分支. 作为初学者,学习 Python 来做数据分析是比较痛苦的.为什么? 在谷歌上搜索"Learn Python ",你会搜到海量教程,但

浅谈站长做数据分析需要注意的几点

做站长的想必大家都知道数据分析的重要性,但是想问一下大家,你们都知道做数据分析我们该尤其注意那几点吗?下面我就关公面前耍大刀,试着浅论一番了,希望能给大家带去帮助. 一.广告点击数据 先来说说淘宝客单页站吧,淘宝客单页站一般都是随便拿个程序,然后首页最上面挂一个广告页模板,现在一般做排行榜的比较多,网站来流量之后,有没有点击广告,点击了哪个,这些数据绝大部分站长都没有理会过,有些人是懒得去分析,有些人是不知道该怎么去统计这些数据,我这里简单说下,我们可以让这个广告链接到网站的一个页面,然后这个页

创业公司如何做数据分析(六)数据仓库的建设

作为系列文章的第六篇,本文将重点探讨数据处理层中数据仓库的建设.在第二篇运营数据系统一文,有提到早期的数据服务中存在不少问题,虽然在做运营Dashboard系统时,对后台数据服务进行了梳理,构建了数据处理的底层公共库等,但是仍然存在一些问题: 中间数据流失,计算结果没有共享.比如在很多数据报告中都会对同一个功能进行数据提取.分析,但是都是各自处理一遍,没有对结果进行共享. 数据分散在多个数据源,如MySQL.MongoDB.Elasticsearch,很难对多个源的数据进行联合使用.有效组织.

Las Vegas精英100:集中做数据分析

文章讲的是Las Vegas精英100:集中做数据分析,所有的目光都集中在上周拉斯维加斯会议上信息周报公布的精英100的排名上,本次大会公布了一些IT领域的顶尖的项目并且所有人公认的前五名的项目都是大数据和分析领域的. 一些世界上顶尖的CIO和他们的团队正在因为这件事相聚庆祝并重新审视这些改变游戏规则的IT项目.让我们来看看其中的一部分是什么样子的. 联邦快递项目旨在加快商业客户的进出口进程.这个过程受到了内部系统不同的阻力同时也被许多地区复杂的海关环境阻碍.为了解决这个问题,联邦快递服务启动了