WPS Office Logo

表格去重大揭秘:让你的数据“轻装上阵”

admin
2025/7/26
WPS学堂
表格去重大揭秘
表格去重大揭秘:让你的数据“轻装上阵”

Excel:基础操作,一键去重

在数据处理领域,Excel 无疑是最为广泛使用的工具之一,其 “删除重复项” 功能堪称处理重复数据的基础且高效的利器 。

假设你手头有一份员工信息表,表中包含员工姓名、工号、部门等多列数据,现在需要删除其中重复的员工记录。操作步骤如下:

  1. 选中数据区域:这是第一步,也是关键的起始点。你可以用鼠标点击表格左上角的第一个单元格,然后按住鼠标左键并拖动,直至选中整个员工信息表的数据区域;倘若你知晓数据区域的起始与结束单元格,也可先点击起始单元格,接着按住 Shift 键,再点击结束单元格,以此选中完整的数据区域。
  2. 点击 “删除重复项” 按钮:在 Excel 的菜单栏中找到 “数据” 选项卡并点击,在 “数据工具” 组里,你便能轻易发现 “删除重复项” 按钮,点击它即可。
  3. 选择列:此时会弹出 “删除重复项” 对话框,Excel 会默认勾选所有列,这意味着它将依据所有列的数据来判断是否为重复项。但在某些特定场景下,你或许只需依据部分列判断,比如仅根据 “工号” 列来确定员工记录是否重复,那就可以取消勾选其他列,仅保留 “工号” 列的勾选。
  4. 执行删除:完成列的选择后,点击 “确定” 按钮,Excel 便会迅速扫描你选定的数据区域,精准找出重复项并删除,最后还会弹出提示框,告知你已删除的重复项数量以及保留下来的唯一值数量。

Excel:函数巧用法,UNIQUE 来帮忙

除了基础的 “删除重复项” 功能,Excel 还提供了强大的函数来处理重复数据,其中 UNIQUE 函数在删除重复项时表现得十分出色。

UNIQUE 函数是 Excel 2021 及以上版本新增的函数,其语法结构为:=UNIQUE (array,[by_col],[exactly_once])。下面为你详细介绍各参数的意义:

  • array:这是必选参数,表示要从中提取唯一值的数据区域,可以是单列数据,也可以是多列数据,甚至可以是多维数组。比如,你有一列学生姓名数据在 A1:A10 单元格区域,那这里的 array 就可以写成 A1:A10;要是还有学生的成绩数据在 B1:B10 单元格区域,想同时根据姓名和成绩来提取唯一记录,array 就可以写成 A1:B10。
  • by_col:该参数为可选参数,用于指定去重的方向。当 by_col 为 FALSE 或者省略时,表示按行去重返回唯一行;当 by_col 为 TRUE 时,表示按列去重返回唯一列 。比如,你的数据是按行排列的,每行代表一个学生的不同科目成绩,你希望按行去重,找出不同学生的成绩组合,那 by_col 就可以省略或者设为 FALSE;若你的数据是按列排列的,每列代表一个学生的成绩,你想按列去重,找出不同的学生成绩列,那 by_col 就设为 TRUE。
  • exactly_once:同样是可选参数,用于确定返回值的类型。当 exactly_once 为 FALSE 或者省略时,函数会返回去重后所有不同的行或列;当 exactly_once 为 TRUE 时,函数只返回那些只出现一次的行或列 。例如,在学生成绩表中,你想找出所有不重复的学生成绩记录,exactly_once 就可以省略;要是你只想找出那些只有一次成绩记录的学生,exactly_once 就设为 TRUE。
  • 举个具体的例子,假设有一份销售数据报表,A 列是销售人员姓名,B 列是销售日期,C 列是销售金额,现在需要获取不重复的销售人员姓名列表。操作如下:在任意空白单元格中输入公式 “=UNIQUE (A:A)”,然后按下回车键,Excel 就会自动在该单元格下方的区域返回不重复的销售人员姓名 。这个公式只使用了 UNIQUE 函数的第一个参数,因为我们只需要对 A 列数据进行按行去重,返回唯一的销售人员姓名,所以省略了后面两个参数。

Excel:高级筛选,灵活去重

Excel 的高级筛选功能就像是一位深藏不露的高手,在处理重复数据时展现出独特的灵活性和强大的筛选能力,让你可以更加精准地筛选出唯一记录 。

下面,我们通过一个案例来了解高级筛选的具体操作步骤。假设有一份客户信息表,其中包含客户姓名、联系方式、购买金额等多列数据,现在需要获取不重复的客户信息 。

  1. 设置筛选条件:虽然在删除重复项时,我们通常不需要设置复杂的筛选条件,但仍需在数据区域外的空白区域,如表格右侧或下方,创建一个条件区域。条件区域的第一行要与数据区域的列标题完全一致,在这个案例中,我们直接复制客户信息表的列标题到空白区域。从第二行开始,根据实际需求填写筛选条件,若要删除重复项,这里可以留空。
  2. 执行高级筛选:点击 “数据” 选项卡,在 “排序和筛选” 组中找到 “高级” 按钮并点击,此时会弹出 “高级筛选” 对话框。在对话框中,有几个关键的设置项:
    • 方式:选择 “将筛选结果复制到其他位置”,这样可以在保留原始数据的基础上,将筛选出的不重复数据复制到指定位置,避免误操作对原始数据造成破坏;若选择 “在原有区域显示筛选结果”,则会直接在原始数据区域显示筛选结果,覆盖原始数据。
    • 列表区域:Excel 会自动识别并填充数据区域,如果识别有误,可手动选中客户信息表的所有数据。
    • 条件区域:手动选中之前设置好的条件区域,确保条件正确应用。
    • 复制到:指定一个空白单元格,用于存放筛选出的不重复数据,比如选择一个新工作表的 A1 单元格 。
  3. 选择 “唯一记录”:在 “高级筛选” 对话框中,勾选 “选择不重复的记录” 选项,这是关键的一步,它告诉 Excel 我们要筛选出唯一的记录,即删除重复项 。
  4. 点击 “确定”:完成上述设置后,点击 “确定” 按钮,Excel 便会按照设置进行筛选,将不重复的客户信息复制到指定位置 。
  5. 高级筛选功能不仅能处理简单的数据去重,还能在设置筛选条件后,根据条件筛选出唯一记录,满足复杂的数据处理需求 。

Excel:数据透视表,别样去重法

Excel 的数据透视表功能宛如一座数据宝藏,不仅能进行数据的汇总与分析,还能以独特的方式实现数据去重 。

以一份包含商品销售记录的数据表为例,其中有商品名称、销售日期、销售数量、销售金额等字段,现在要获取不重复的商品名称列表 。操作如下:

  1. 选中数据区域:鼠标点击数据表的第一个单元格,按住鼠标左键拖动,直至选中整个销售记录数据区域;也可通过先点击起始单元格,再按住 Shift 键点击结束单元格的方式来精准选中 。
  2. 插入数据透视表:在 Excel 菜单栏中找到 “插入” 选项卡并点击,在 “表格” 组里点击 “数据透视表” 按钮,此时会弹出 “创建数据透视表” 对话框,确认数据区域无误后,选择将数据透视表放置在新工作表或者现有工作表的指定位置,然后点击 “确定” 。
  3. 字段拖动:在弹出的 “数据透视表字段” 窗格中,将 “商品名称” 字段拖动到 “行” 区域,由于数据透视表的特性,它会自动对行区域的字段进行去重处理 。
  4. 生成结果:完成字段拖动后,数据透视表会迅速生成,在 “行” 区域展示的就是不重复的商品名称,同时还会对其他相关字段进行默认的汇总计算,如求和、计数等 。若只关注商品名称的去重,这些汇总数据可忽略 。

WPS:简单操作,重复项消失

在国产办公软件领域,WPS 以其出色的兼容性和丰富的功能赢得了众多用户的青睐,其删除重复项的功能简洁明了,易于上手 。

假设你有一份学生成绩统计表格,里面记录了学生的姓名、学号、各科成绩等信息,现在需要删除重复的学生记录 。操作步骤如下:

  1. 打开表格并选中数据区域:用 WPS 打开学生成绩统计表格,通过鼠标拖动的方式选中包含重复项的数据区域,确保选中的数据完整且准确,比如从第一行表头开始,一直拖动到最后一条学生记录所在行 。
  2. 使用删除重复项功能:在 WPS 的菜单栏中找到 “数据” 选项并点击,在下拉菜单中可以看到 “删除重复项” 选项,点击它,此时会弹出一个对话框,询问你是否要删除选定区域内的重复项 。
  3. 确认并删除重复项:在弹出的对话框中,WPS 会默认勾选所有列,意味着它将依据所有列的数据来判断重复项 。若你只想根据 “学号” 列判断学生记录是否重复,那就取消勾选其他列,仅保留 “学号” 列的勾选,确认无误后,点击 “删除重复项” 按钮,WPS 会迅速执行删除操作,并弹出提示框,告知你删除的重复项数量 。

多软件通用技巧:条件格式,先标后删

条件格式功能宛如一位神奇的化妆师,能将符合特定条件的数据以独特的格式呈现出来,在 Excel 和 WPS 中都能实现通过条件格式高亮显示重复项,然后再手动删除的操作 。下面为你详细介绍其在 Excel 中的操作步骤:

  1. 选中数据区域:打开包含重复数据的表格,比如一份产品销售记录表,用鼠标精准选中需要检查重复项的数据列,如 “产品名称” 列;若要检查多列数据中的重复项,可同时选中多列 。
  2. 点击 “条件格式”:在 Excel 的菜单栏中,点击 “开始” 选项卡,在 “样式” 组里找到 “条件格式” 按钮并点击,会弹出一个下拉菜单 。
  3. 选择 “重复值”:在下拉菜单中,选择 “突出显示单元格规则”,然后点击 “重复值” 选项,此时会弹出 “重复值” 对话框 。
  4. 设置高亮样式:在 “重复值” 对话框中,Excel 提供了多种预设的高亮显示样式,如浅红填充色深红色文本、黄填充色深黄色文本等,你可以根据个人喜好和数据的辨识度来选择合适的样式,也可以点击 “自定义格式” 按钮,自行设置字体、字号、颜色、填充色等格式,设置完成后点击 “确定” 按钮 。瞬间,表格中的重复项就会以你设置的高亮样式显示出来 。
  5. 在 WPS 中的操作步骤与 Excel 类似:
  6. 选中数据范围:打开 WPS 表格,以一份员工考勤记录表为例,选中要检查重复值的单元格区域,比如 “员工姓名” 列 。
  7. 打开条件格式选项:在菜单栏中找到 “开始” 选项卡,点击它,在功能区找到 “条件格式” 选项并点击,会出现下拉菜单 。
  8. 选择 “重复值” 并设置格式:在条件格式的下拉菜单中,选择 “突出显示单元格规则”,接着点击 “重复值”,在弹出的对话框中,选择一种格式来突出显示重复值,既可以使用系统默认的格式,也能点击 “自定义格式” 进行个性化设置,设置好后点击 “确定” 。此时,WPS 表格中的重复项就会被高亮标记出来 。
  9. 通过条件格式高亮显示重复项后,你可以一目了然地看到哪些数据是重复的,然后手动删除这些重复项 。这种方法特别适合数据量不大,且需要直观查看重复数据分布的情况 。

操作小贴士,避坑指南

在数据处理的过程中,有一些操作小贴士和避坑指南需要牢记 :

  1. 备份数据:无论使用哪种方法删除重复项,在操作前一定要备份原始数据。因为数据一旦删除,若没有备份,误删重要数据后将难以恢复,可能会给后续的数据分析或业务处理带来严重影响 。比如,在处理一份公司财务报表数据时,删除重复项前先将原始报表另存为一个副本,以防操作失误。
  2. 了解去重依据:不同的去重方法依据不同,如 Excel 的 “删除重复项” 功能默认根据所选列的全部数据判断重复项,而 UNIQUE 函数可以根据设置按行或列去重 。在操作前,务必明确数据中的哪些字段组合能唯一标识一条记录,以此选择合适的去重依据 。例如,在学生成绩管理系统中,“学号” 和 “课程名称” 的组合可以唯一确定一条成绩记录,那去重时就可以依据这两列数据 。
  3. 注意数据格式:数据格式可能会影响去重结果,尤其是在使用函数或高级筛选去重时。确保数据格式一致,比如日期格式统一为 “YYYY-MM-DD”,数字格式统一为数值型等 。若数据格式不一致,可能会导致原本相同的数据被误判为不同,从而无法正确去重 。比如,在统计销售数据时,部分日期记录为 “MM/DD/YYYY” 格式,部分为 “YYYY-MM-DD” 格式,就会给去重带来困扰,需要先统一格式 。
  4. 选择合适方法:根据数据量大小、数据结构复杂程度以及个人对软件功能的熟悉程度,选择最合适的去重方法 。对于数据量较小且结构简单的数据表,使用 Excel 或 WPS 的 “删除重复项” 功能即可轻松完成;若数据量较大,且需要灵活设置筛选条件,高级筛选或 Power Query 可能更为合适 。例如,处理一份只有几百条记录的员工考勤表,用 “删除重复项” 功能即可;但处理上万条记录的电商订单数据,且需要根据多种条件筛选唯一订单时,Power Query 就能发挥其强大的数据处理能力 。