教你使用Excel做数据分析之回归分析方法

  在数据分析中,对于成对成组数据的拟合是经常遇到的,涉及到的任务有线性描述,趋势预测和残差分析等等。很多专业读者遇见此类问题时往往寻求专业软件,比如在化工中经常用到的Origin和数学中常见的MATLAB等等。它们虽很专业,但其实使用Excel就完全够用了。我们已经知道在Excel自带的数据库中已有线性拟合工具,但是它还稍显单薄,今天我们来尝试使用较为专业的拟合工具来对此类数据进行处理。

  注:本功能需要使用Excel扩展功能,如果您的Excel尚未安装数据分析,请依次选择“工具”-“加载宏”,在安装光盘支持下加载“分析数据库”。加载成功后,可以在“工具”下拉菜单中看到“数据分析”选项

  实例 某溶液浓度正比对应于色谱仪器中的峰面积,现欲建立不同浓度下对应峰面积的标准曲线以供测试未知样品的实际浓度。已知8组对应数据,建立标准曲线,并且对此曲线进行评价,给出残差等分析数据。

  这是一个很典型的线性拟合问题,手工计算就是采用最小二乘法求出拟合直线的待定参数,同时可以得出R的值,也就是相关系数的大小。在Excel中,可以采用先绘图再添加趋势线的方法完成前两步的要求。

  选择成对的数据列,将它们使用“X、Y散点图”制成散点图。


  X、Y散点图

  在数据点上单击右键,选择“添加趋势线”-“线性”,并在选项标签中要求给出公式和相关系数等,可以得到拟合的直线。


  给出公式和相关系数

  由图中可知,拟合的直线是y=15620x+6606.1,R2的值为0.9994。

  因为R2 >0.99,所以这是一个线性特征非常明显的实验模型,即说明拟合直线能够以大于99.99%地解释、涵盖了实测数据,具有很好的一般性,可以作为标准工作曲线用于其他未知浓度溶液的测量。

  为了进一步使用更多的指标来描述这一个模型,我们使用数据分析中的“回归”工具来详细分析这组数据。


  回归工具

  在选项卡中显然详细多了,注意选择X、Y对应的数据列。“常数为零”就是指明该模型是严格的正比例模型,本例确实是这样,因为在浓度为零时相应峰面积肯定为零。先前得出的回归方程虽然拟合程度相当高,但是在x=0时,仍然有对应的数值,这显然是一个可笑的结论。所以我们选择“常数为零”。

  “回归”工具为我们提供了三张图,分别是残差图、线性拟合图和正态概率图。重点来看残差图和线性拟合图。


  残差图、线性拟合图和正态概率图

  在线性拟合图中可以看到,不但有根据要求生成的数据点,而且还有经过拟和处理的预测数据点,拟合直线的参数会在数据表格中详细显示。本实例旨在提供更多信息以起到抛砖引玉的作用,由于涉及到过多的专业术语,请各位读者根据实际,在具体使用中另行参考各项参数,此不再对更多细节作进一步解释。

  残差图是有关于世纪之与预测值之间差距的图表,如果残差图中的散点在中州上下两侧零乱分布,那么拟合直线就是合理的,否则就需要重新处理。


  图表

  更多的信息在生成的表格中,详细的参数项目完全可以满足回归分析的各项要求。下图提供的是拟合直线的得回归分析中方差、标准差等各项信息。


  表格

时间: 2025-01-20 17:46:03

教你使用Excel做数据分析之回归分析方法的相关文章

用Excel做数据分析——回归分析

实例 某溶液浓度正比对应于色谱仪器中的峰面积,现欲建立不同浓度下对应峰面积的标准曲线以供测试未知样品的实际浓度.已知8组对应数据,建立标准曲线,并且对此曲线进行评价,给出残差等分析数据. 这是一个很典型的线性拟合问题,手工计算就是采用最小二乘法求出拟合直线的待定参数,同时可以得出R的值,也就是相关系数的大小.在Excel中,可以采用先绘图再添加趋势线的方法完成前两步的要求. 选择成对的数据列,将它们使用"X.Y散点图"制成散点图. 在数据点上单击右键,选择"添加趋势线&quo

如何用Excel做数据分析

  1.Excel普遍的初级用户 Excel的作用就是运用基础制表功能和运算功能,提高报表制作及计算的效率.比用计算器快. 2Excel进阶用户 学习常用函数公式,和更复杂些的报表模型交互,大幅度提高数据结果处理的效率,提高数据分析的深度和广度,做更多的分析 3进行VBA程序的开发应用,进行十万数量级以上的数据处理分析,建议更智能,更强大的数据分析模型 4开发级用户 开发Excel本没有的插件功能,比如郭安定老师的OIIO效率专家,Excelhome的易用宝,罗版主的Excel百宝箱,及国外的o

学习用Excel做数据分析之移动平均方法

某化工反应过程,每隔2分钟对系统测取一次压力数据.由于反应的特殊性,需要考察每8分钟的压力平均值,如果该压力平均值高于15MPa,则认为自属于该平均值计算范围内的第一个压力数据出现时进入反应阶段,请使用Excel给出反应阶段时间的区间. 移动平均就是对一系列变化的数据按照指定的数据数量依次求取平均,并以此作为数据变化的趋势供分析人员参考.移动平均在生活中也不乏见,气象意义上的四季界定就是移动平均最好的应用. 注:本功能需要使用Excel扩展功能,如果您的Excel尚未安装数据分析,请依次选择"工

用Excel做数据分析之相关系数与协方差

化学合成实验中经常需要考察压力随温度的变化情况.某次实验在两个不同的反应器中进行同一条件下实验得到两组温度与压力相关数据,试分析它们与温度的关联关系,并对在不同反应器内进行同一条件下反应的可靠性给出依据. 相关系数是描述两个测量值变量之间的离散程度的指标.用于判断两个测量值变量的变化是否相关,即,一个变量的较大值是否与另一个变量的较大值相关联(正相关);或者一个变量的较小值是否与另一个变量的较大值相关联(负相关);还是两个变量中的值互不关联(相关系数近似于零).设(X,Y)为二元随机变量,那么:

做数据分析时,R 用户如何学习 Python?

本文是帮助 R 用户增强技能和为数据科学进阶而学习 Python (从零开始).毕竟,R 和 Python 是数据科学从业者必需掌握的两门最重要的编程语言. Python 是一门功能强大和多用途的编程语言,在过去几年取得惊人发展.它过去用于 Web 开发和游戏开发,现在数据分析和机器学习也要用到它.数据分析和机器学习是 Python 应用上相对新的分支. 作为初学者,学习 Python 来做数据分析是比较痛苦的.为什么? 在谷歌上搜索"Learn Python ",你会搜到海量教程,但

从零开始教你用 Python 做词云

临渊羡鱼,不如退而结网.我们步步为营,从头开始帮助你用Python做出第一张词云图来.欢迎尝试哦!   需求 在大数据时代,你经常可以在媒体或者网站上看到一些非常漂亮的信息图. 例如这个样子. 或是这个样子的. 看过之后你有什么感觉?想不想自己做一张出来? 如果你的答案是肯定的,我们就不要拖延了,今天就来一步步从零开始做个词云分析图.当然,做为基础的词云图,肯定比不上刚才那两张信息图酷炫.不过不要紧,好的开始是成功的一半嘛.食髓知味,后面你就可以自己升级技能,进入你开挂的成功之路. 网上教你做信

从零开始教你用Python做词云

临渊羡鱼,不如退而结网.我们步步为营,从头开始帮助你用Python做出第一张词云图来.欢迎尝试哦! 需求 在大数据时代,你经常可以在媒体或者网站上看到一些非常漂亮的信息图. 例如这个样子. 或是这个样子的. 看过之后你有什么感觉?想不想自己做一张出来? 如果你的答案是肯定的,我们就不要拖延了,今天就来一步步从零开始做个词云分析图.当然,做为基础的词云图,肯定比不上刚才那两张信息图酷炫.不过不要紧,好的开始是成功的一半嘛.食髓知味,后面你就可以自己升级技能,进入你开挂的成功之路. 网上教你做信息图

做数据分析时,你的方法论是什么?

这是一篇方法论.是的,很枯燥. 在知乎.woshipm.pmcaff.产品100等搜索了大量的数据分析相关的文章,发现没有多少适合自己的,因为内容太过碎片化,就买了一套书,开始系统的学习. 当你完成一份数据分析报告时,不知领导是否有问过你,"你的分析方法论是什么?".如果分析方法论不正确或不合理,那分析结果参考价值几何呢? 困惑 相信很多人在做数据分析时,会经常遇到这几个问题:不知从哪方面入手开展分析;分析的内容和指标常常被质疑是否合理.完整,自己也说不出个所以然来.当然我也一样,处在

做数据分析时,你的方法论是什么?

这是一篇方法论.是的,很枯燥. 在知乎.woshipm.pmcaff.产品100等搜索了大量的数据分析相关的文章,发现没有多少适合自己的,因为内容太过碎片化,就买了一套书,开始系统的学习. 当你完成一份数据分析报告时,不知领导是否有问过你,"你的分析方法论是什么?".如果分析方法论不正确或不合理,那分析结果参考价值几何呢? ◆ ◆ ◆ 困惑 相信很多人在做数据分析时,会经常遇到这几个问题:不知从哪方面入手开展分析:分析的内容和指标常常被质疑是否合理.完整,自己也说不出个所以然来.当然我