《Excel数据可视化:一样的数据不一样的图表》——1.2 数据的清洗

1.2 数据的清洗

对于一份庞大的数据来说,无论是手动录制还是从外部获取,难免会出现无效值、重复值、缺失值等情况。在Excel 2007以前的版本中,想要删除或更正这些不符合要求的数据,需要先将其筛选出来,之后再批量删除或修改,是一项很繁重的工程。随着Microsoft Excel组件的不断更新,功能的适应性也越来越高,对于这种常见的问题也有了新的处理方法,如批量删除重复值。

不符合要求的数据主要有缺失的数据、错误的数据、重复的数据三大类。面对这样的数据,就需要进行清洗,还包括数据一致性的检查,将其更正为有实际意义的数据。

想要清除这些有缺陷的数据,就需要根据它们的类型从不同角度进行操作,如填补遗漏的数据、消除异常值、纠正不一致的数据等。

在实际的数据收集中,数据项的缺失是很常见的。比如工作人员因为疏忽在统计数据时漏写了某个时期内的数据,或者是人为原因导致在某些时间段内传感器无法正常工作等,这些都会造成数据项的缺失。

实例 4寻找误删的数据

有一张员工表,第一列为员工编号,后面为员工信息。员工离职后就直接删除了该员工信息所在行,结果现在的员工编号不完整。比如被删除的 AE104、AE109、AE112,怎样添加这些缺失的员工编号呢?

在输入公式的时候经常会出现一些错误的信息,这些错误值通常是因为公式不能正确地计算结果或公式引用的单元格有错误造成的。下面列出Excel中错误值的类型、产生的原因及解决方法。


实例 5 将错误值显示为0

在实际工作中,由于对公式的不熟悉、单元格引用不当、数据本身不满足公式参数的要求等原因,难免会出现上述错误。但是有些情况出现的错误类型并不影响计算结果,即允许出现那样的错误形式。此时,就需要将错误值进行深度处理,可显示为空白或用0代替,以方便领导查阅。

重复值一般都是多余的数据,在数据统计过程中,要确保数据的唯一性,只有这样才能确保统计结果的正确性和可靠性。如果忽视了这一要点,所做的任何结果都将无济于事。

实例 6 删除重复值

现有一张客户考核统计表,因不同员工对相同客户进行了考核,导致出现了一样的客户编码,如果要统计月底对客户的考核覆盖率,统计有重复值的记录就是不正确的,需要将其删除。

时间: 2024-09-20 22:53:29

《Excel数据可视化:一样的数据不一样的图表》——1.2 数据的清洗的相关文章

数据可视化平台 Plotly 开源强大的 JS 图表库

数据可视化平台 Plotly 开源旗下强大的 JavaScript 图表库,支持三种不同类型的图表,包括地图,箱形图和密度图,以及更常见的产品如,条状和线形图.源代码已发布在 GitHub.(已收录开源中国软件库 plotly.js)最新版本的 Plotly.js 可以免费.无限制地用于任何项目. 此前 Plotly 在 R, Python 和 MATLAB 的客户端一直是开源的,但核心图表层 plotly.js 却是闭源的.而现在 Plotly 可以 100%离线地用于 RStudio, MA

《JavaScript数据可视化编程》——1.4 用离散图表绘制x/y值

1.4 用离散图表绘制x/y值 柱状图对于单一数据维度的可视化展现通常是非常有效的就像我们之前创建的展现胜利场次的柱状图.但如果我们想要探索两种不同类型数据之间的关系离散型图表会更有效.假设我们想要展示一个城市健康体检的花费一个维度和平均寿命另一个维度之间的关系.让我们通过一个例子一步步的看看用数据是如何创建离散型图表的. 就像在本书1.1节介绍的一样我们需要在我们的网页中加载Flotr2类库并设置一个div元素来放置我们将构建的图表. 1.4.1 第1步 定义数据 在这个例子中我们将使用经济合

《R数据可视化手册》一第2章 快速探索数据2.1 绘制散点图

第2章 快速探索数据 R数据可视化手册虽然本书中大部分图形都是通过ggplot2包绘制的,但这并不是R绘制图形的唯一方法.要快速探索数据,有时使用R基础包中的绘图函数会很有用.这些函数随R软件默认安装,无需另行安装附加包.它们简短易输入,处理简单问题时使用方便,且运行速度极快. 如果你想绘制较为复杂的图形,那么,转用ggplot2包通常是更好的选择.部分原因在于ggplot2提供了一个统一的接口和若干选项来替代基础绘图系统中对图形的修修补补和各种特例.一旦掌握了ggplot2的工作机制,你就可以

一文读懂数据可视化

数据可视化,是指将相对晦涩的的数据通过可视的.交互的方式进行展示,从而形象.直观地表达数据蕴含的信息和规律. 早期的数据可视化作为咨询机构.金融企业的专业工具,其应用领域较为单一,应用形态较为保守.步入大数据时代,各行各业对数据的重视程度与日俱增,随之而来的是对数据进行一站式整合.挖掘.分析.可视化的需求日益迫切,数据可视化呈现出愈加旺盛的生命力,表现之一就是视觉元素越来越多样,从朴素的柱状图/饼状图/折线图,扩展到地图.气泡图.树图.仪表盘等各式图形.表现之二是可用的开发工具越来越丰富,从专业

【独家】一文读懂数据可视化

前言 数据可视化,是指将相对晦涩的的数据通过可视的.交互的方式进行展示,从而形象.直观地表达数据蕴含的信息和规律. 早期的数据可视化作为咨询机构.金融企业的专业工具,其应用领域较为单一,应用形态较为保守.步入大数据时代,各行各业对数据的重视程度与日俱增,随之而来的是对数据进行一站式整合.挖掘.分析.可视化的需求日益迫切,数据可视化呈现出愈加旺盛的生命力,表现之一就是视觉元素越来越多样,从朴素的柱状图/饼状图/折线图,扩展到地图.气泡图.树图.仪表盘等各式图形.表现之二是可用的开发工具越来越丰富,

盘点56个最实用的大数据可视化分析工具

俗话说的好:工欲善其事,必先利其器!一款好的工具可以让你事半功倍,尤其是在大数据时代,更需要强有力的工具通过使数据有意义的方式实现数据可视化,还有数据的可交互性:我们还需要跨学科的团队,而不是单个数据科学家.设计师或数据分析员:我们更需要重新思考我们所知道的数据可视化,图表和图形还只能在一个或两个维度上传递信息, 那么他们怎样才能与其他维度融合到一起深入挖掘大数据呢?此时就需要倚仗大数据可视化(BDV)工具,因此,笔者收集了适合各个平台各种行业的多个图表和报表工具,这些工具中不乏有适用于NET.

盘点最实用56个大数据可视化分析工具

俗话说的好:工欲善其事,必先利其器!一款好的工具可以让你事半功倍,尤其是在大数据时代,更需要强有力的工具通过使数据有意义的方式实现数据可视化,还有数据的可交互性;我们还需要跨学科的团队,而不是单个数据科学家.设计师或数据分析员;我们更需要重新思考我们所知道的数据可视化,图表和图形还只能在一个或两个维度上传递信息, 那么他们怎样才能与其他维度融合到一起深入挖掘大数据呢?此时就需要倚仗大数据可视化(BDV)工具,因此,笔者收集了适合各个平台各种行业的多个图表和报表工具,这些工具中不乏有适用于NET.

数据可视化专家的七个秘密

数据可视化的道路上充满了不可见的陷阱和迷宫,最近ClearStory Data的两位数据可视化开发人员分享了他们总结出来的数据可视化开发的7个不宣之秘,普通开发者了解这些方法能提升视野,少走弯路. 数据可视化, 特别是基于Web的数据可视化的时代已经到来了. 类似JavaScript的可视化库如D3.js, Raphaël,以及Paper.js, 以及最新浏览器所支持的如Canvas和SVG, 以及使得那些过去只能由计算机专家和专业设计人员开发的复杂的可视化变得越来越简单了. 数据可视化如今成为

数据可视化专家的七个不宣之秘

       数据可视化的道路上充满了不可见的陷阱和迷宫,最近ClearStory Data的两位数据可视化开发人员分享了他们总结出来的数据可视化开发的7个不宣之秘,普通开发者了解这些方法能提升视野,少走弯路. 数据可视化, 特别是基于Web的数据可视化的时代已经到来了. 类似JavaScript的可视化库如D3.js, Raphaël, 以及Paper.js, 以及最新浏览器所支持的如Canvas和SVG, 以及使得那些过去只能由计算机专家和专业设计人员开发的复杂的可视化变得越来越简单了. 数

数据可视化的七个秘密

 数据可视化,特别是基于Web的数据可视化的时代已经到来了.类似JavaScript的可视化库如D3.js,Rapha?l,以及Paper.js,以及最新浏览器所支持的如Canvas和SVG,以及使得那些过去只能由计算机专家和专业设计人员开发的复杂的可视化变得越来越简单了. 数据可视化如今成为了很多网站项目的必备功能.而类似于Platfora,DatameerClearStoryData以及Chartio等初创公司则可以利用基于浏览器的分析平台融到数百万美元的投资. 数据可视化是数据探索以及数据