Большая часть аналитики данных связана с очисткой данных. Хорошо очищенные данные — это данные, в которых отсутствуют неполные, нерелевантные и избыточные записи. Чтобы удалить избыточность, вам нужно избавиться от дубликатов, чтобы у вас остался набор уникальных записей данных. Это уменьшает беспорядок и сводит к минимуму ошибки.

Хорошей новостью является то, что таблицы Google предоставляют вам несколько простых способов, позволяющих быстро находить уникальные значения в ваших данных.

Как найти уникальные значения в Google Таблицах

В этом руководстве я покажу вам два простых метода, которые вы можете использовать для быстрого поиска уникальных значений из данных одного столбца или данных нескольких столбцов.

  • С помощью встроенного в Google Таблицы инструмента « Удалить дубликаты ».
  • Использование функции UNIQUE .

Предположим, у нас есть следующий набор данных, из которого мы хотим удалить повторяющиеся записи:

Обратите внимание, что в строках 2 и 5, а также в строках 6 и 7 есть повторяющиеся записи.

Мы рассмотрим, как использовать два упомянутых метода для удаления этих повторяющихся записей из набора данных.

В этом руководстве я покажу вам, как найти уникальные значения, когда у вас есть несколько столбцов. Вы можете использовать те же методы, если у вас есть данные в одном столбце.

Поиск уникальных значений с помощью инструмента «Удалить дубликаты»

Google Таблицы предлагает пункт меню, который посвящен именно этой задаче — удалению дубликатов для поиска уникальных значений. Используя этот метод, вы можете удалить дубликаты всего за три клика.

Вот шаги, которые вам необходимо выполнить:

  • Выберите диапазон данных, с которыми вы хотите работать. В нашем примере мы выбрали столбцы A и B, перетащив указатель мыши на их заголовки.
  • В меню «Данные» выберите «Удалить дубликаты».
  • Откроется диалоговое окно «Удалить дубликаты».
  • Если ваш выбор также содержит заголовки столбцов, установите флажок рядом с параметром «Данные имеют строку заголовка».
  • В разделе «Столбцы для анализа» вы можете выбрать, хотите ли вы, чтобы инструмент считал все выбранные столбцы или несколько выбранных столбцов. Прямо сейчас, поскольку мы хотим избавиться от записей, в которых имя и фамилия совпадают, мы оставим для него значение «Выбрать все».
  • Нажмите кнопку «Удалить дубликаты».
  • Вы увидите окно сообщения с подробностями о том, сколько повторяющихся строк было удалено и сколько уникальных строк было сохранено.

Теперь вы должны обнаружить, что строки 5 и 7 удалены. Это связано с тем, что, когда инструмент «Удалить дубликаты» находит повторяющиеся значения, он сохраняет только первое вхождение значения, удаляя все остальные.

Если вы хотите удалить все строки, содержащие дубликаты имени, вы можете просто снять флажок рядом со столбцом B в диалоговом окне «Удалить дубликаты» (шаг 5).

В этом случае вам придется удалить три повторяющихся строки, поскольку строка, содержащая имя Пола Родригеса, также считается дубликатом.

Тогда ваш результирующий набор данных будет следующим.

Поиск уникальных значений с помощью функции UNIQUE

Инструмент «Удалить дубликаты» работает с исходным набором данных. Поэтому, когда он удаляет дубликаты, он изменяет исходные данные. Если, однако, вы хотите сохранить исходный набор данных, то лучшим вариантом будет использование функции UNIQUE.

Синтаксис функции UNIQUE

Синтаксис функции UNIQUE:

UNIQUE(range)

Здесь диапазон (range) — это диапазон данных, из которых вы хотите извлечь уникальные записи.

Диапазон может включать в себя либо диапазон имен столбцов, либо диапазон ссылок на ячейки. Функция покажет результат, начиная с ячейки, в которую вы ввели формулу.

Использование уникальной функции для поиска уникальных значений в Google Таблицах

Давайте поработаем с тем же набором данных, чтобы понять, как применяется функция UNIQUE.

Чтобы вы могли легко увидеть различия между исходными и результирующими данными, мы собираемся отобразить результат на том же листе (в соседнем диапазоне ячеек). Однако вы даже можете ввести УНИКАЛЬНУЮ формулу на новом листе и отобразить там уникальные записи.

Вот шаги, которые вам необходимо выполнить, если вы хотите использовать функцию UNIQUE для удаления дубликатов из указанного выше набора данных:

  • В ячейке D1 введите следующую формулу: =UNIQUE(A:B) or =UNIQUE(A1:B10).
  • Нажмите клавишу возврата.

Теперь вы должны увидеть, что набор уникальных записей занимает диапазон от ячейки D1 ​​до E8.

Обратите внимание, что функция UNIQUE позволяет динамически удалять дубликаты, поэтому любые изменения, которые вы вносите в исходный набор данных, автоматически обновляются для вывода функции.

Также обратите внимание, что вы не можете вносить какие-либо изменения в вывод. Попытка сделать это приведет к ошибке #REF.

Фактически, основное различие между двумя методами, описанными в этом руководстве, заключается в том, что инструмент «Удалить дубликаты» работает и изменяет исходный диапазон данных.

Функция UNIQUE, с другой стороны, отображает уникальные данные в новом диапазоне данных, тем самым сохраняя исходные данные неизменными.

Если вы хотите сохранить результаты функции UNIQUE (чтобы вы могли выполнять с ней последующие операции), вам необходимо преобразовать результат формулы в статические значения.

Для этого вам нужно выделить ячейки, содержащие результат, и скопировать их. Затем используйте сочетание клавиш CTRL + SHIFT + V (на ПК) или CMD + SHIFT + V (на Mac), чтобы вставить значения скопированных ячеек.

В этом руководстве мы показали вам два способа найти уникальные значения в Google Таблицах, удалив дубликаты. Первый метод использует встроенную функцию «Удаление дубликатов» в Google Таблицах. Вы можете использовать этот метод для удаления дубликатов и замены исходных данных только уникальными записями.

Второй метод использует УНИКАЛЬНЫЙ метод. Этот метод идеален, если вы не хотите вносить какие-либо изменения в исходные данные. Оба метода отлично работают и быстро справляются со своей задачей.

Мы надеемся, что это руководство было для вас полезным.