Excel数据清洗之五 去除多余的字符

今天介绍数据清洗需要处理的第二类问题,分类要一致。

我们先看分类不一致的结果,

上图中,很明显我们看到一个编号为“CA1001101”的客户,但是分别被归类到不同的客户中。

造成这种情况的原因就是因为这个编号在源数据中有各种表现形式,

今天介绍的方法就是要解决源数据中文本内容一致性的问题。

分类数据不一致,有很多原因,我们先来看其中的3个常见情形,

  • 多余的前后缀

  • 多余的空格

  • 多余的回车(换行)

对于这几种情况,我们用的最多的就是“查找和替换”,在某些特殊情况下,我们还需要使用函数来处理。

场景1 去掉多余的前缀(后缀)

一般来说,我们首先查找确定是否需要进行替换操作。例如:

确定某一列中是否包含一些特定的文本。比如,我们知道某个大区上传的数据总是会在客户编号中添加一些特定的前缀。我们就可以使用熟悉的“查找和替换”工具

如果发现有这些不必要的字符,就可以点击替换按钮,将这些文本替换为空:

点击“全部替换”即可。

场景2 去掉多余的空格

为了保证某列(或者某几列)中没有多余的空格,例如“回归线   ”中后面就有多余的空格,一般来说,这些空格是不必要的。

需要提醒的是,英文的空格和中文的空格是两个不同的字符,为了保证完全清除多余的空格,你应该执行两次分别清除英文空格和中文空格。

另外,这个方法用在英文文本中的时候,需要注意。因为英文中是通过空格来分隔单词的。如果你对英文文本使用了这个方法,就可能将一段这样的英文:

Move one cell to the right in a worksheet. Or, in a protected worksheet, move between unlocked cells.

处理为:

Moveonecelltotherightinaworksheet.Or,inaprotectedworksheet,movebetweenunlockedcells.

这显然不是我们的初衷(对于英文的空格处理,见本文下面的场景4)

场景3 去掉多余的回车(换行)

有时,源数据中会包含多余的回车,

这里的分行是通过输入Alt+Enter来实现的。我们可以将这里的回车替换掉:

要注意的是在替换对话框中,“查找内容”框中需要使用Ctrl+Enter输入回车。如果不行,就是用Ctrl+j来输入回车。

场景4 去掉英文文本中的多余空格

英文是通过空格来分割单词的。例如,"   Tropic Excel   "这个文本中,有3处空格,分别是T前面的空格,两个单词之间的空格,和l后面的空格。这里两个单词之间的空格是必要的,不能去掉。而开头和结尾处的空格是多余的,一般应该去掉。这里用替换工具行不通,我们可以使用一个函数,TRIM:

当然,这个方法也可以用来去掉中文文本中的多余空格。

有时候,这个空格的处理还比较麻烦,有些空格不能用这个方法去掉,我们就需要使用其他方法了。下一讲,我们在讲处理不可见字符时还会为大家介绍一种“空格”的处理。

总结

源数据中的“分类不统一”的问题非常常见,如果没有进行这个数据清洗的步骤,在后续的工作中必然面临很多麻烦。例如,进行VLOOKUP匹配时找不到正确结果;数据透视时产生了多余的分类;甚至没有办法使用数据透视进行汇总分析,只能绞尽脑汁写复杂的公式甚至VBA代码。

另一方面,查找和替换是一个几乎所有人都熟悉的工具,只要利用它对数据进行一点简单的处理,就可以在后续工作中减少很多不必要的麻烦。

(0)

相关推荐

  • 因为一个空格,Excel中的错误原因找到崩溃

    一提到问题,如何在Excel表格里面去除空格,大家都知道如何去除,但是在工作中,我们经常出现一些错误,然而发现不了它的根本原因是因为空格造成的,所以经常我们知道解决方法,但是并不能发现根本原因,这就是 ...

  • 脑洞大开,Excel用99+空格来提取单元格数据,你用过吗?

    [温馨提示]亲爱的朋友,阅读之前请您点击[关注],您的支持将是我最大的动力! 哈喽大家好!我是[Excel与财务]小编阿钟老师,一名70后财务男,今天分享的也是一个有意思的教程. 在Excel中,从单 ...

  • Excel数据清洗之六 去除不可见字符

    造成分类不统一的原因还有一种,叫做"不可见字符". 先看下面的例子.假设我们数据如下: 表中所有数据都是同一个ID,如果我们用数据透视表汇总它们的数量,我们期望会得到一个这样的结果 ...

  • Excel | TRIM函数去除多余空格

    利用TRIM函数去除单元格中多余的空格有关TRIM函数的应用,请参考:Excel | 区县名称在一个单元格中,如何分单元格显示

  • 【在职场中学Excel】FIND函数查找的字符重复,如何对条件进行判断?

    Excel情报局 Excel职场联盟 生产挖掘分享Excel基础技能 Excel爱好者大本营 用1%的Excel基础搞定99%的职场问题 做一个超级实用的Excel公众号 Excel是门手艺玩转需要勇 ...

  • Excel数据清洗实例智能填充应用

    Excel数据清洗实例智能填充应用

  • 教你用PS后期去除多余人物修图小技巧

    有需要下载PS软件的库友, 请添加资源君微信:psziyuanku10 回复:PS 即可. 更多的资源及教程,可以关注photoshop资源库 公众号 精彩继续,祝你们学习进步. 有需要下载PS软件的 ...

  • 【UN】Excel数据清洗之一 基础

    什么是数据清洗 数据清洗是我们在进行任何数据汇总分析之前的必备工作. 很多人已经认识到了,在我们拿到的原始数据中有大量的错误数据和不规范数据.也有很多人没有意识到这个问题.如果我们直接拿这样的原始数据 ...

  • Excel数据清洗之二 纠正错误的表格格式

    不规范的源数据中有一类是格式错误,我们清洗数据的第一步是纠正这些错误的格式. 空行或空列 其中一种非常常见的类型就是数据之间有空行或者空列. 这份数据中,橙色的竖线表示空列,蓝色的横线表示空行. 这份 ...

  • 在Excel中截取字段中的字符,我有3种方法供参考

    在Excel中截取字段中的字符,我有3种方法供参考.在平时的工作中,我们经常会遇到要截取某一个字段中的数字或者是文字.数据量小就无所谓方法,但数据量多的话,方法必须有讲究,同样的工作量,虽然最终结果相 ...

  • Excel数据清洗之三 横表转竖表(逆透视)

    前面我们介绍了对格式错误进行数据清洗的步骤,得到了结果--一个横表: 实际上,有可能我们一开始拿到的就是这样的"横表" 横表的问题我们可以通过下面的数据透视来为大家展示一下: 在这 ...