《Excel数据可视化:一样的数据不一样的图表》——2.3 概率统计中的正态分布和偏态分布

2.3 概率统计中的正态分布和偏态分布

概率可以理解为随机出现的相对数。随机现象是相对于决定性现象而言的。在一定条件下必然发生某一结果的现象称为决定性现象。随机现象则是指在基本条件不变的情况下,每一次试验或观察前,不能肯定会出现哪种结果,呈现出偶然性,如常见的掷骰子试验。事件的概率是衡量该事件发生的可能性的量度。虽然在一次随机试验中某个事件的发生是带有偶然性的,但那些可在相同条件下大量重复的随机试验却往往呈现出明显的数量规律,其中正态分布和偏态分布就是数据有规律出现的两个代表。

左下图是正态分布图,右下图是偏态分布图。在Excel中通过折线图或散点图可以模拟出如下图所示的效果。要理解分布图形时,需要明白峰度与偏度系数,即它们表示的含义。峰度是用来反映频数分布曲线顶端尖峭或扁平程度的指标,而偏度是用来度量分布是否对称。

服从正态分布的随机变量的概率规律为取与μ邻近的值的概率大,而取离μ越远的值的概率越小;σ越小,分布越集中在μ附近;σ越大,分布越分散。

在Excel中若要绘制正态分布图,需要了解NORMDIST函数。该函数返回指定平均值和标准偏差的正态分布函数。此函数在统计方面应用范围广泛(包括假设检验),能建立起一定数据频率分布直方与该数据平均值和标准差所确定的正态分布数据的对照关系。

NORMDIST函数的语法:NORMDIST(x,mean,standard_dev,cumulative),x 为需要计算其分布的数值;mean是分布的均值;standard_dev是分布的标准偏差; cumulative 为一逻辑值,指明函数的形式。如果cumulative为TRUE,函数NORMDIST返回积累分布函数;如果为FALSE,返回概率密度函数。

概率密度函数是一个描述随机变量的输出值,在某个确定的取值点附近的可能性的函数,而积累分布函数就是概率密度函数的积分。

在正态分布中,有两个常在经济学中引用的概念:长尾和肥尾。美国人克里斯·安德森提出的长尾理论认为:只要存储和流通的渠道足够大,需求不旺或销量不佳的产品,共同占据的市场份额,就可以和那些数量不多的热卖品所占据的市场份额,相匹敌甚至更大。

实例 3 计算学生考试成绩的正态分布图

一般考试成绩具有正态分布现象。现假设某班有45个学生,在一次英语考试中学生的成绩分布在54~95分,他们的成绩按着学号依次递增,计算该班学生成绩的累积分布函数图和概率密度函数图。

频数分布有正态分布和偏态分布之分,如果频数分布的高峰向左偏移,长尾向右侧延伸称为正偏态分布,也称右偏态分布;同样的,如果频数分布的高峰向右偏移,长尾向左延伸则称为负偏态分布,也称左偏态分布。偏态分布常用于分析排队问题。

若要理解偏态分布,首先需要掌握的是“偏度”这一指标。偏态又称偏斜系数、偏态系数,是用来帮助判断数据序列的分布规律性的指标。在数据序列呈对称分布(正态分布)的状态下,其均值、中位数和众数重合。且在这三个数的两侧,其他所有的数据完全以对称的方式左右分布。如果数据序列的分布不对称,则均值、中位数和众数必定分处不同的位置。这时,若以均值为参照点,则要么位于均值左侧的数据较多,称之为右偏;要么位于均值右侧的数据较多,称之为左偏;除此无他。考虑到所有数据与均值之间的离差之和应为零这一约束,则当均值左侧数据较多的时候,均值的右侧必定存在数值较大的“离群”数据;同理,当均值右侧数据较多的时候,均值的左侧必定存在数值较小的“离群”数据。

实例 4 不均匀的收入分配

个人收入图常用来研究偏态分布。它在贫困水平、经济增长和不平等相关的社会经济学研究中有广泛的应用。

时间: 2024-09-20 08:03:50

《Excel数据可视化:一样的数据不一样的图表》——2.3 概率统计中的正态分布和偏态分布的相关文章

数据可视化平台 Plotly 开源强大的 JS 图表库

数据可视化平台 Plotly 开源旗下强大的 JavaScript 图表库,支持三种不同类型的图表,包括地图,箱形图和密度图,以及更常见的产品如,条状和线形图.源代码已发布在 GitHub.(已收录开源中国软件库 plotly.js)最新版本的 Plotly.js 可以免费.无限制地用于任何项目. 此前 Plotly 在 R, Python 和 MATLAB 的客户端一直是开源的,但核心图表层 plotly.js 却是闭源的.而现在 Plotly 可以 100%离线地用于 RStudio, MA

数据可视化设计:给数据穿上美丽的外衣

文章描述:如今,在设计,通讯,信息及数据新闻,用户界面多个领域都可以见到数据可视化的身影,引入视觉设计的数据大大提升了说服力,可读性和逻辑性都得到了增强,他带来的不仅仅是颠覆表格那么简单,而是一种思想理念,它不仅把可视化信息作为一种沟通工具:同时也是一种重要的 如今,在设计,通讯,信息及数据新闻,用户界面多个领域都可以见到数据可视化的身影,引入视觉设计的数据大大提升了说服力,可读性和逻辑性都得到了增强,他带来的不仅仅是颠覆表格那么简单,而是一种思想理念,它不仅把可视化信息作为一种沟通工具:同时也

《JavaScript数据可视化编程》——1.4 用离散图表绘制x/y值

1.4 用离散图表绘制x/y值 柱状图对于单一数据维度的可视化展现通常是非常有效的就像我们之前创建的展现胜利场次的柱状图.但如果我们想要探索两种不同类型数据之间的关系离散型图表会更有效.假设我们想要展示一个城市健康体检的花费一个维度和平均寿命另一个维度之间的关系.让我们通过一个例子一步步的看看用数据是如何创建离散型图表的. 就像在本书1.1节介绍的一样我们需要在我们的网页中加载Flotr2类库并设置一个div元素来放置我们将构建的图表. 1.4.1 第1步 定义数据 在这个例子中我们将使用经济合

数据可视化:用数据展示城市的生命力

  凤凰科技讯 2012年9月29日消息,"智慧城市"--2012北京国际设计周专题展在北京中华世纪坛开展.本次展览,展出了来自14个国家82件信息设计作品.这些作品,利用数字可视化方式,使人们可以通过一张3D动态图表,便直观的了解到发生在我们身边的事件. 数据可视化:掌握城市的脉搏 数据可视化技术是通过把信息和数据图形化,来传达和沟通信息.我们通常所看到的数据是大量复杂.枯燥的数字和图表.而数据可视化则用艺术的形式,把这些数据变为一段色彩绚烂的动画短片.在这个短片上,时间的流淌伴随着

Origami Logic:大数据可视化 帮助销售分析数据

大数据虽然对于计算机工程师来说并不是很陌生,但是它一直将http://www.aliyun.com/zixun/aggregation/38848.html">营销人员拒绝于门外.不过这种状况会逐渐得到改善,因为很多大数据领域的创业公司在不断崛起,他们很多都是致力于让更多的人以更简单的方式"消化"这些数据.Origami Logic就是一家让营销人员便于利用大数据的创业公司.通过数据可视化还有自助分析的方式,这个平台能够帮助营销人员作出更有效果的策略. 这家公司打算在明

快速入门 | 一篇文章带你掌握数据可视化方法

数据可视化可以帮助我们更好地去传递信息. 本篇要点: 数据可视化是什么 数据可视化的一般流程 常见的数据种类 通过可视化你想表达什么信息 选择具体的可视化形式 图表设计原则 常用的可视化工具 01|数据可视化是什么 数据可视化主要旨在借助于图形化手段,清晰有效地传达与沟通信息(来源于百度百科).也就是说可视化的存在是为了帮助我们更好地去传递信息. 02|数据可视化的一般流程 首先我们需要对我们现有的数据进行分析,得出自己的结论,明确要表达的信息和主题(即你通过图表要说明什么问题).然后根据这个目

盘点56个最实用的大数据可视化分析工具

俗话说的好:工欲善其事,必先利其器!一款好的工具可以让你事半功倍,尤其是在大数据时代,更需要强有力的工具通过使数据有意义的方式实现数据可视化,还有数据的可交互性:我们还需要跨学科的团队,而不是单个数据科学家.设计师或数据分析员:我们更需要重新思考我们所知道的数据可视化,图表和图形还只能在一个或两个维度上传递信息, 那么他们怎样才能与其他维度融合到一起深入挖掘大数据呢?此时就需要倚仗大数据可视化(BDV)工具,因此,笔者收集了适合各个平台各种行业的多个图表和报表工具,这些工具中不乏有适用于NET.

盘点最实用56个大数据可视化分析工具

俗话说的好:工欲善其事,必先利其器!一款好的工具可以让你事半功倍,尤其是在大数据时代,更需要强有力的工具通过使数据有意义的方式实现数据可视化,还有数据的可交互性;我们还需要跨学科的团队,而不是单个数据科学家.设计师或数据分析员;我们更需要重新思考我们所知道的数据可视化,图表和图形还只能在一个或两个维度上传递信息, 那么他们怎样才能与其他维度融合到一起深入挖掘大数据呢?此时就需要倚仗大数据可视化(BDV)工具,因此,笔者收集了适合各个平台各种行业的多个图表和报表工具,这些工具中不乏有适用于NET.

Python数据可视化1.1 数据、信息、知识和观点

摘要 数据可视化概念框架 当代,网络和社交媒体的兴起,产生了大量数据,而且数据量的增长已超乎想象.这种现象是怎么发生的?又是何时发生的? 十年前,一种处理问题的新方法演变为:跨企业的从数据源收集.整合大量数据,并进行运算的研究工作.他们这样做的目标是用海量数据改善决策过程.在此期间,促使Amazon.Yahoo和Google这样的公司在处理大量数据方面取得了显著进展.这些里程碑式的成就促使一些大数据分析技术的诞生.当然,我们不会追究大数据的细节问题,但是我们将尝试探索,为什么很多机构改变了他们以