四种类型的数据分析模式

在这篇博文中,我们聚焦于在数据科学领域所遇到的四种类型的数据分析模式:描述型、诊断型、预测型和指导型。

当我与刚涉足数据科学领域的年轻分析师们交谈时,通常,我会问他们认为什么是数据科学家最重要的能力。他们的答案相当多样化。

我想告诉他们的是,他们最重要的能力将是能够把数据转化为对非专业人士而言清楚而有意义的见解。瑞典统计学家Hans Rosling在这方面很有名。这种能力往往被忽略。下面Hans Rosling的这个TedTalk谈到了这些。

分析能辅助开发有价值的见解,很有必要用一些工具来让人们了解分析所起的作用。其中一种工具是分析四维图。

简单地来说,分析可被划分为4个重要的类别。下面我将详细解释这四个类别。

1. 描述型:发生了什么?

这是最常见的一种。在业务中,它向分析师们提供业务的重要衡量标准的概览。

一个例子是每月的利润和损失账单。类似地,分析师可以获得大批客户的数据。了解客户(如,30%的客户是自雇型)的地理信息也可认为是“描述型分析”。充分利用可视化工具能增强描述型分析所带来的信息。

2. 诊断型:为什么会发生?

这是描述型分析的下一步难题。通过评估描述型数据,诊断分析工具使得分析师们能够深入分析问题的核心原因。

设计良好的商业信息dashboard整合了时间序列数据(譬如,在多个联系时间点上的数据)的读入、特征的过滤和钻入功能,能够用于这类分析。

3. 预测型:可能发生什么?

预测型分析主要是进行预测。某事件在将来发生的可能性,预测一个可量化的值,或者是估计事情可能发生的某个时间点,这些都可以通过预测模型完成。

预测模型通常运用各种可变数据来作出预测。数据成员的多样化与可能预测的目标是相关联的(如,人的年龄越大,越可能发生心脏病,我们可以说年龄与心脏病风险是线性相关的)。随后,这些数据被放在一起,产生分数或预测。

在一个充满不确定性因素的世界里,能够预测允许人们作出更好的决定。预测模型在很多领域都被用到。

4. 指导型:我需要做什么?

在价值和复杂度上,下一步就是指导性模型。指导性模型基于发生了什么、为什么会发生以及一系列“可能发生什么”的分析,帮助用户确定要采取的最好的措施。很显然,指导性分析不是一个单独的行为,实际上它是其他很多行为的主导。

交通应用是一个很好的例子,它帮助人们选择最好的回家路线,考虑到了每条路线的距离、在每条路上的速度、以及很关键的目前的交通限制。

另一个例子是生成考试时间表,不让任何学生的时间表发生冲突。 

本文作者:Thomas Maydon

来源:51CTO

时间: 2024-10-23 05:08:15

四种类型的数据分析模式的相关文章

数据分析的四种类型模式

在这篇博文中,我们聚焦于在数据科学领域所遇到的四种类型的数据分析模式:描述型.诊断型.预测型和指导型. 当我与刚涉足数据科学领域的年轻分析师们交谈时,通常,我会问他们认为什么是数据科学家最重要的能力.他们的答案相当多样化. 我想告诉他们的是,他们最重要的能力将是能够把数据转化为对非专业人士而言清楚而有意义的见解.瑞典统计学家 Hans Rosling 在这方面很有名.这种能力往往被忽略.下面 Hans Rosling 的这个 TedTalk 谈到了这些: 分析能辅助开发有价值的见解,很有必要用一

Cisco四种类型的防火墙技术汇总

我们知道防火墙有四种类型:集成防火墙功能的路由器,集成防火墙功能的代理服务器,专用的软件防火墙和专用的软硬件结合的防火墙.Cisco的防火墙解决方案中包含了四种类型中的第一种和第四种,即:集成防火墙功能的路由器和专用的软硬件结合的防火墙. 一. 集成在路由器中的防火墙技术 1. 路由器IOS标准设备中的ACL技术 ACL即Access Control Lis t(访问控制列表),简称Access List(访问列表),它是后续所述的IOS Firewall Feature Set的基础,也是Ci

C#中方法参数的四种类型

C#中方法的参数有四种类型: -值参数:不含任何修饰符.方法中的形参是实参的一份拷贝,形参的改变不会影响到内存中实参的的值,实参是安全的. -引用参数:以ref修饰符声明.传递的参数实际上是实参的指针,所以在方法中的操作都是直接对实参进行的,而不是复制一个值:可以利用这个方式在方法调用时双向传递参数:为了以ref方式使用参数,必须在方法声明和方法调用中都明确地指定ref关键字,并且实参变量在传递给方法前必须进行初始化. -输出参数:以out修饰符声明.和ref类似,它也是直接对实参进行操作.在方

C#中方法参数的四种类型

C#中方法的参数有四种类型:-值参数:不含任何修饰符.方法中的形参是实参的一份拷贝,形参的改变不会影响到内存中实参的的值,实参是安全的.-引用参数:以ref修饰符声明.传递的参数实际上是实参的指针,所以在方法中的操作都是直接对实参进行的,而不是复制一个值:可以利用这个方式在方法调用时双向传递参数:为了以ref方式使用参数,必须在方法声明和方法调用中都明确地指定ref关键字,并且实参变量在传递给方法前必须进行初始化.-输出参数:以out修饰符声明.和ref类似,它也是直接对实参进行操作.在方法声明

C#方法传参数的四种类型总结

下面是c#常用的四种类型的参数,整理出来方便系统学习. 一.按值传递参数 值参数是通过将实参的值复制到形参,来实现按值传递到方法,也就是我们通常说的按值传递. 方法被调用时,CLR做如下操作: 1.在托管堆栈中为形参分配空间: 2.将实参的值复制到形参. 这个太常用了,按值传递参数,是复制一份,因此不影响原来参数的值.     class Program {     public static int Foo(int i, out int j)     {         i++;       

从被动反应到有自我意识,人工智能的四种类型

本文的作者Arend Hintze是密歇根州立大学生物医学工程系的助理教授.在下面的文章中,它对人工智能的发展现状以及未来展望,将人工智能进行了4种类型的分类,分别是:单一反应型.有限记忆型.具有心智型.自我意识型.   第一类AI 单一反应型(Reactive machines)   最基本的AI系统是纯反应型的,它既不能储存记忆也不能利用过去的经验来做决定.深蓝(Deep Blue)是IBM公司开发的国际象棋超级计算机,是这种类型机器的典型示例.它在90年代末曾击败了国际象棋大师Garry

四种类型的产品经理

今天我在跟一位产品经理聊天的时候聊到了产品经理在企业中的分类问题,其实细想一下,不同企业的性质.ceo的想法都是不同的,也因此,企业对于产品经理的定位其实均不同,而基于这种情况,个人认为根据产品经理的定位不同,所以可以粗略的分为以下四个类型,用来给大家做参考: 1.产品规划型产品经理 这类型的产品经理,一般都要有5年以上的产品经验,若要问原因?那就是,产品规划是对于产品的生命周期及蓝图的规划,需要拥有眼光和经验.而如果这类型的产品经理,能力要是达不到要求或者是一忽悠,那么造成的恶果就是一堆人跟着

网站分析销售归因模型的四种类型

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 LunaMetircs的Robbin提到网站分析销售归因有三种模型,即(第一次互动.平均分配.第一次互动和最后一次)模型,但其实是四种模型,默认忽略了最后一次互动的模型,目前大多数的网站分析工具和网站分析模型都将销售转换中的功劳归属于最后的互动渠道和来源(最后一次互动模型),当然这里的最后其实也不一定就是真实的最后,当最后的互动渠道是直接来源

分析四种类型的黑客攻击 预防黑客攻击

黑客,他们进行的攻击有许多形式,动机范围从金钱,政治到伦理.了解存在的不同类型的黑客可以帮助您识别您最容易受到攻击的人,并适当地保护自己和您的组织免受网络攻击 白帽黑客 这些也被称为网络世界的伦理黑客.这类黑客主要由安全研究人员和操作员组成,主要跟踪和监控威胁.它们可能是某个程序漏洞的站长,他们很可能不在法律范围内进行的各项操作,但他们的意图是阻止恶意黑客.那些在法律以外运作的人有时被称为"灰帽". 白帽黑客 网络雇佣兵 这些是网络世界的"军火商",作为其他攻击者的