企业经营数据的质量及其八个指标

随着大数据技术逐步在企业端应用,越来越多的企业在利用数据技术提升管理效率和决策的科学性。企业对数据分析人才的需求也越来越旺盛,对管理者的数据分析能力也提出了新的要求。

数据的质量直接影响着数据的价值,并且还影响着数据分析的结果以及我们依此做出的决策的质量。质量不高的数据会影响企业的经营管理决策;如果数据是错误的,那么还不如没有数据,因为没有数据时,我们会基于经验和常识做出不见得是错误的决策,而错误的数据会引导我们做出错误的决策。因此,数据质量是治理企业经营管理数据的关键所在。

数据的质量可以通过八个指标进行衡量,每一个指标都从一个侧面反映了数据的品相。这八个指标分别是:准确性、及时性、即时性、真实性、精确性、完整性、全面性和关联性。

我们在比较两个数据集的品相时往往采用如下图所示的这种图形表示。例如常规来讲,内部数据集的准确性、真实性、完整性高,而全面性、及时性、即时性、精确性和关联性方面取决于企业内部对数据的重视程度以及采集数据的技术手段;

而外部数据集(如微博数据、互联网媒体数据等)的全面性、及时性和即时性都可以通过技术手段如网络爬虫等得到提高,但在准确性、真实性、精确性上难以保证,也难以控制,而关联性取决于数据采集和挖掘的相关技术。

  数据的准确性

数据的准确性(Accuracy)是指数据的采集值或者观测值与真实值之间的接近程度,也叫误差值,误差值越大,数据的准确度越低。数据的准确性由数据的采集方法决定的。

数据的精确性

数据的精确性(Precision)是指对同一对象在重复测量时所得到的不同观测数据之间的接近程度。精确性,也叫精准性,它与数据采集的精度有关系。精度越高,要求数据采集的粒度越细,误差的容忍程度也越低。

例如在测量人的身高时,可以精确到厘米,多次测量结果之间的误差只会在厘米级别;在测量北京到上海的距离时,可以精确到千米,多次测量结果之间的误差会在千米级别;用游标卡尺测量一个零件的厚度时,可以精确到 1/50 毫米,多次测量结果之间的误差也只会在 1/50 毫米级别。因此,可以说采用的测量方法和手段直接影响着数据的精确性。

数据的真实性

数据的真实性,也叫数据的正确性(Rightness)。数据的正确性取决于数据采集过程的可控程度。数据采集过程可控程度高,可追溯情况好,数据的真实性就容易得到保证,而可控程度低或者无法追溯,则数据的真实性就难以得到保证。

为了提高数据的真实性,采用无人进行过程干涉的智能终端直接采集数据,能够更好地保证所采集的数据的真实性,减少人为干预,减少数据造假,从而让数据更加准确地反映客观事物。

数据的及时性

数据的及时性(In-time)是指能否在需要的时候获到数据。例如企业在月初会对上个月的经营和管理数据进行统计和汇总,此时的数据及时性是指这些数据能否及时处理完成,财务能否在月度关账后及时核算。数据的及时性是数据分析和挖掘及时性的保障。如果企业的财务核算流程复杂,核算速度缓慢,上个月的数据在本月月中才能统计汇总完成,那么等需要调整财务策略的时候,已经到月底了,一个月已经快过完了。特别是当企业做大了之后,业务覆盖多个市场、多个国家,如果数据不能及时汇总,则会影响到高层决策的及时性。数据的及时性与企业的数据处理速度及效率有直接的关系,为了提高数据的及时性,越来越多的企业采用管理信息系统,并在管理信息系统中附加各种自动数据处理功能,在数据上传到系统中之后自动完成绝大部分报表,从而提高了数据处理的效率。使用计算机自动处理中间层数据是提高企业数据处理效率的有效手段。

企业除要保证数据采集的及时性和数据处理的效率外,还需要从制度和流程上保证数据传输的及时性。数据报表制作完成后,要及时或者在要求的时间范围内发送到指定的部门,或者上传到指定的存储空间中。

数据的即时性

数据的即时性包括数据采集的时间节点和数据传输的时间节点,在数据源头采集数据后立即存储并立即加工呈现,就是即时数据,而经过一段时间之后再传输到信息系统中,则数据的即时性就稍差。例如一个生产设备的仪表即时地反映了设备的温度、电压、电流、气压等数据,这些数据生成数据流,随时监控设备的运行状况,这个数据可以看作即时数据。而

当将设备的即时运行数据存储下来,用来分析设备的运行状况与设备寿命的关系时,这些数据就成了历史数据。

数据的完整性

数据的完整性是指数据采集的程度,即应采集的数据和实际采集到的数据之间的比例。例如在采集员工信息数据时,要求员工填写姓名、出生日期、性别、民族、籍贯、身高、血型、婚姻状况、最高学历、最高学历专业、最高学历毕业院校、最高学历毕业时间共 12 项信息,而某个员工仅仅填写了部分信息,例如只填写了其中的 6 项,则该员工所填写数据的完整性只有一半。

一家企业中的数据的完整性体现着这家企业对数据的重视程度。要求采集的数据在实际中并未完整采集,这就是不完整的数据,这往往是企业对数据采集质量要求不到位导致的。

另外,对于动态数据,可以从时间轴去衡量数据的完整性。比如,企业要求每小时采集一次数据,每天应该形成 24 个数据点,记录为 24 条数据,但是如果只记录了 20 条数据,那么这个数据也是不完整的。

数据的全面性

数据的全面性和完整性不同,完整性衡量的是应采集的数据和实际采集到的数据之间的比例。而数据全面性指的是数据采集点的遗漏情况。例如,我们要采集员工行为数据,而实际中只采集了员工上班打卡和下班打卡的数据,上班时间员工的行为数据并未采集,或者没有找到合适的方法来采集,那么这个数据集就是不全面的。

再例如,我们记录一个客户的交易数据,如果只采集了订单中的产品、订单中产品的价格和数量,而没有采集客户的收货地址、采购时间,则这个数据采集就是不全面的。

腾讯 QQ 和微信的用户数据记录了客户的交流沟通数据;阿里巴巴和京东的用户数据记录了用户的交易数据;百度地图记录了用户的出行数据;大众点评和美团记录了客户的餐饮娱乐数据。对全面描述一个人的生活来说,这些公司的数据都是不全面的,而如果把他们的数据整合起来,则会形成更加全面的数据。所以说,数据的全面性是一个相对的概念。过度追求数据的全面性是不现实的。

数据的关联性

数据的关联性是指各个数据集之间的关联关系。例如员工的工资数据和绩效考核数据是通过员工关联在一起来的,而且绩效数据直接关系到工资数据。采购订单数据与生产订单数据之间通过物料的追溯机制进行关联,而生产订单又是由员工完成的,即通过员工作业数据与员工信息数据关联起来的。

本书探讨的企业经营数据,每个数据集都是相互关联的,有的是直接关联的,如员工工资数据和员工绩效数据;有的是间接关联的,如物料采购订单数据与员工工资数据。这些数据是由公司的资源,包括人、财、物和信息等关联起来的。如果有任何的数据集不能关联到其他的数据集,就会存在数据割裂或者数据孤岛。数据割裂和数据孤岛是企业经营数据关联性不足导致的。而数据的关联性直接影响到企业经营数据集的价值。

本文转自d1net(转载)

时间: 2024-10-29 17:54:26

企业经营数据的质量及其八个指标的相关文章

大数据助力制造业传承:像经营企业那样去经营数据

工业大数据的本质是"数据驱动的工业升级",即通过大数据分析激发研发创新.服务创新和制造创新,推进产业升级.目前全球制造业都在面临转型,对于中国来讲,2016年是"十三五"开局之年,也是中国制造2025全面落实最重要的一个战略点,那么工业大数据在中国制造业转型的道路上,到底扮演了一个什么角色? ▲3月10日,无界传媒智能媒体实验室联合制造业国际联盟打造工业大数据应用智造沙龙"制造企业如何做到心中有'数'"(无界新闻摄影记者原丽阳 摄) 3月10日,

大数据时代来临 数据改变企业经营

正在到来的数据革命将如何改变企业的经营.政府的服务乃至普通人的社会生活? 在你出生的那一刻:男孩.7斤8两,而你的父母不再争论你长得像谁,因为他们早就知道了关于你的一切.计算机通过计算你的基因.出生环境等遗传信息,数据分析的结果你会有43%像母亲.57%像父亲,而你的未来的一切更是清晰可见:你的智力水平决定你只会上当地大学(你就不用太努力读书考清华.北大或者耶鲁.哈佛了).你不擅长滑雪但擅长跑步(跳远也不太行).你是个异性恋会喜欢棕色头发的苗条女孩(根据GPS和其他信息的推断,她将会在你隔壁的隔

《SOA达人迷》—第2章2.9节第9个问题:企业的数据是否具备灵活性?您是否相信这些数据的质量?

2.9 第9个问题:企业的数据是否具备灵活性?您是否相信这些数据的质量?SOA达人迷我们从来没有听到过企业抱怨自己的数据太少,企业内部的每个应用程序都包含着很多的数据.虽然很多企业并不缺少数据,但是,当需要把每个部门的应用程序中的数据导出来的时候,往往会遇到很多困难.为了迁移到SOA,企业不能总拘泥于使用数据库和数据元素,而要开始使用数据服务,这样便于在实现各种功能时,保证数据的一致性:另外需要注意的是,必须要保证这些信息服务的正确性.数据质量很差的话,对于企业来说是非常致命的.为了迁移到SOA

《机器人操作系统ROS原理与应用》——3.1 企业大数据解决方案实现方式

3.1 企业大数据解决方案实现方式 工欲善其事必先利其器,企业大数据解决方案既包括大数据产品和工具层面,又包括服务层面.企业大数据解决方案根据实现方式的不同可分为完全独立研发.直接购买第三方解决方案和借助第三方的力量进行联合开发三种. 3.1.1 独立研发 独立研发指的是企业内部通过组建大数据中心或部门,独立进行大数据项目的研发.企业独立研发大数据平台,在数据安全.技术可控.后期扩展等方面具有重要意义. 数据安全:独立研发过程中的所有数据从输入端到输出端的整个流通都在企业内部进行,数据不会因为平

我国企业大数据的发展与应用总览

一.我国企业大数据产业发展现状 飞速发展的大数据产业除了改变人们生活的方方面面.促进社会快速进步之外,也为企业这个社会主体带来了更为直观和有效的影响. 近年,企业级大数据应用逐渐普及,消费者行为分析.精准营销.新业务新产品推广.广告推送.代言人选择.社交媒体.可视化.溢价收益.库存管理.信贷保险等相关应用不断丰富.伴随着一批致力于商业和企业应用服务的大数据初创企业迅速成长,大数据更广泛地应用到各领域企业中. 业务转型是目前大多数企业的普遍需求,大数据分析不仅可以优化访问.加快决策.最大程度提高可

贝恩:企业大数据战略指南

拥有优秀大数据能力的企业,做出正确决策的可能性高出竞争对手3倍.决策速度比竞争对手快5倍. 当某在线视频网站准备推出自制剧的时候,评论家纷纷嘲笑他们把握观众品味的能力.很难有谁会想到,该公司通过分析其积累的多年用户观影偏好的大数据,来指导制片人.主演选择和编剧内容并一炮走红,帮助其在一个季度内获取数百万新增用户,并在接下来的一两年内里获得数倍的股价提升. 打造大数据战略的四大挑战 我们正在迎来一个数据爆炸的时代:各类设备和互动产生的数据量正以年均大于50%的速度增长,预计在2020年可能会达到4

企业大数据的发展与应用

一.我国企业大数据产业发展现状 飞速发展的大数据产业除了改变人们生活的方方面面.促进社会快速进步之外,也为企业这个社会主体带来了更为直观和有效的影响. 近年,企业级大数据应用逐渐普及,消费者行为分析.精准营销.新业务新产品推广.广告推送.代言人选择.社交媒体.可视化.溢价收益.库存管理.信贷保险等相关应用不断丰富.伴随着一批致力于商业和企业应用服务的大数据初创企业迅速成长,大数据更广泛地应用到各领域企业中. 业务转型是目前大多数企业的普遍需求,大数据分析不仅可以优化访问.加快决策.最大程度提高可

《企业大数据系统构建实战:技术、架构、实施与应用》——第2章 企业大数据职能规划 2.1 大数据组织架构体系

第2章 企业大数据职能规划 第1章我们介绍了企业大数据在宏观和微观层面的定位,立足于解答企业大数据的商业模式.市场机会.延伸价值.内部功能定义等问题.当企业已经确定要实施大数据战略时,应该如何针对性地建立职能架构体系以保证企业大数据的有效实施和落地?各个职能部门的职责范畴如何定义?不同体系和部门间如何协同和流程化工作? 本章将详细讲解企业大数据职能规划体系,包括如何定义大数据部门在企业中的角色,常见的大数据职能及职责分工,不同职位的职责划分以及大数据制度和流程建设等问题. 2.1 大数据组织架构

【阿里在线技术峰会】李金波:企业大数据平台仓库架构建设思路

本文根据阿里云高级技术专家李金波在首届阿里巴巴在线峰会的<企业大数据平台仓库架构建设思路>的分享整理而成.随着互联网规模不断的扩大,数据也在爆炸式地增长,各种结构化.半结构化.非结构化数据的产生,越来越多的企业开始在大数据平台下进行数据处理.分享中,李金波主要从总体思路.模型设计.数加架构.数据治理四个方面介绍了如何利用大数据平台的特性,构建更贴合大数据应用的数据仓库. 直播视频: (点击图片查看视频) 幻灯片下载:点此进入 以下为整理内容. 总体思路 随着互联网规模不断的扩大,数据也在爆炸式