Функция DSTDEV в Google Таблицах полезна, если вам нужно вычислить стандартное отклонение генеральной совокупности на основе выборки, используя числа в поле (столбце) записей в списке или базе данных, которые соответствуют указанным вами условиям.

Функция DSTDEV — это встроенная функция, относящаяся к категории «Функция базы данных». Его можно использовать как функцию рабочего листа и ввести как часть формулы в ячейку рабочего листа.

Теперь вместо частичных данных (выборка совокупности), если вы работаете с полными данными (совокупностью), вы можете использовать другую функцию под названием DSTDEVP. Вы можете найти исчерпывающее руководство по этому же вопросу в одной из наших статей здесь.

Что такое стандартное отклонение?

Для заданных данных стандартное отклонение является мерой разброса статистики. «Дисперсия» показывает, насколько разбросаны ваши данные. Она демонстрирует, насколько ваши данные разбросаны по значению или среднему значению. Например, все ли ваши оценки близки к среднему? Или есть много баллов, которые намного выше (или намного ниже) среднего балла.

Возьмем пример.

Предположим, я пошел в центр по приему и приему собак, чтобы завести «Мопса». Доброволец показывает мне данные о спасенных мопсах в их центре, и они записывают каждый свой рост и вес отдельно. Я хочу понять, имеют ли мопсы обычно одинаковый рост для данного возраста или есть различия в том, насколько они вырастают. Поскольку я не могу собрать данные по всем мопсам в моей стране или регионе, мне приходится работать с ограниченной выборкой данных, собранных в центре.

Здесь мне на помощь приходит функция DSTDEV. Функция выводит стандартное отклонение роста мопсов в центре усыновления, которое является выборкой популяции мопсов в моей стране. Стандартное отклонение высоты составляет около 125,12 мм для средней высоты 294 мм. Поскольку значение умеренно высокое, я понимаю, что рост молодых мопсов действительно различается и в целом не находится на одном уровне.

Это всего лишь один пример. В реальной жизни есть множество других вариантов использования этой функции.

Давайте сразу же погрузимся в такие примеры использования в реальном бизнесе, где мы будем иметь дело с фактическими значениями, а также узнаем, как мы можем написать нашу собственную функцию DSTDEV в Google Таблицах для расчета отклонений в данных.

Особенности функции DSTDEV

Итак, синтаксис (то, как мы пишем) функции DSTDEV следующий:

=DSTDEV(database, field, criteria)

Давайте проанализируем это и поймем, что означает каждый из терминов:

  • = знак равенства — это то, как мы запускаем любую функцию в Google Таблицах.
  • DSTDEV () — это наша  функция. DSTDEV вернет дисперсию всей генеральной совокупности, выбранной из табличного массива или диапазона базы данных, используя SQL-подобный запрос.
  • Database относится к массиву или диапазону, содержащему данные, включая заголовки для значений каждого столбца
  • Field относится к столбцу данных, который содержит значения, которые необходимо извлечь и обработать.
    • Field может быть либо текстовой меткой, относящейся к требуемому заголовку столбца, либо числовым значением, указывающим, какой столбец рассматривать, где первый столбец имеет значение = 1.
  • Criteria относится к массиву или диапазону, содержащему критерии для фильтрации значений базы данных перед работой. Это можно оставить пустым.

Для лучшего понимания разницы между оценкой дисперсии по совокупности и выборке мы будем объяснять функцию, используя те же примеры из нашего руководства по функции DSTDEVP, чтобы вы могли сравнить их.

Реальный пример использования функции DSTDEV

Взгляните на приведенный ниже пример, чтобы увидеть, как функции DSTDEV используются в Google Таблицах.

 

Выше представлены пять из множества покупок, которые Линда сделала в продуктовом магазине на этой неделе. Как видно из закупленного количества, она немного переборщила с третьей покупкой, указанной здесь. Она хотела знать, находятся ли ее дорогие покупки в том же ценовом диапазоне, что и дешевые.

Прямо над захваченными данными я дал возможность ввести критерии, на основе которых данные будут фильтроваться. Это не обязательный критерий, и функция будет работать правильно, если мы оставим его пустым.

Функция DSTDEV даст ей желаемый результат на основе условий, указанных в A2: D3, как показано ниже:

 

Что здесь означает значение 0,71? Два перечисленных здесь заказа, стоимость единицы которых превышает 3 доллара, имеют идентификаторы 1 и 5 и стоят 5 и 6 долларов соответственно. Формула дает стандартное отклонение 0,5, что означает, что значения (5 и 6 долларов) не слишком отличаются от среднего значения (5,5 долларов). Это указывает на то, что все покупки, которые Линда совершила на сумму более 3 долларов, имеют примерно одинаковую стоимость, поскольку разброс не так велик.

Но почему это значение выше по сравнению со стандартным отклонением, полученным с помощью функции DSTDEVP?

Когда мы вычисляем стандартное отклонение для всей генеральной совокупности, знаменателем формулы является общее количество элементов. Однако, когда стандартное отклонение рассчитывается на основе выборочных данных, мы вычитаем значение 1 перед делением суммы квадратов отклонений. Именно по этой причине значение стандартного отклонения, рассчитанное на основе данных выборки, выше, чем значение, которое можно было бы определить с использованием данных о населении. Логика этого состоит в том, чтобы компенсировать недостаток информации о данных о населении. Когда выборочные данные берутся для большинства статистических целей, это сопровождается отсутствием информации о большинстве данных. Чтобы компенсировать это, значение стандартного отклонения выше в случае выборочных данных, чем стандартное отклонение от данных о генеральной совокупности.

Вы можете попробовать изменить критерии и посмотреть, как изменится результат.

Потрясающие! Давайте начнем нашу функцию DSTDEV в Google Таблицах.

Как использовать функцию DSTDEV в Google Таблицах

  • Давайте посмотрим, как написать свою собственную функцию DSTDEV, шаг за шагом. Прежде всего, я вставил данные о продажах из одного розничного магазина за три года, с 2018 по 2020 год, для трех брендов одежды — Nike, Adidas и Puma.

 

  • Теперь просто щелкните любую ячейку, чтобы сделать ее активной. В этом руководстве я выберу F14 , где я хочу показать свои результаты.
  • Затем просто введите знак равенства ‘ = ‘, чтобы начать функцию, а затем введите имя функции, которое является нашим DSTDEV.
  • Вы должны обнаружить, что появляется поле автоматического предложения с нашей интересующей функцией. Продолжите, введя первую открывающую скобку ‘(‘. Если вы получили огромное поле с текстом, просто нажмите стрелку в правом верхнем углу поля, чтобы свернуть его. Теперь вы должны увидеть это следующим образом:

 

  • Теперь самое интересное! Давайте дадим необходимые входные данные функции, чтобы получить стандартное отклонение в единичных продажах в соответствии с критериями фильтрации, которые мы привели выше данных:

 

  • Обратите внимание на то, как я указал условия для ограничения данных по бренду Nike (выбрав только 2019 и 2020 годы). Критерии для формулы вводятся как A1: F3 для учета всех упомянутых критериев, если таковые имеются.
  • После того, как вы ввели необходимые значения базы данных , полей и критериев или сделали то, что сделал я, не забудьте закрыть квадратные скобки ‘)’, как показано ниже.

 

  • Наконец, просто нажмите клавишу Enter . Если вы следовали моим инструкциям, вы должны были получить 316.23 в качестве выходных данных функции, что является не чем иным, как стандартным отклонением объединенных продаж Nike и Puma (для критериев, указанных выше в таблице данных).

Как объяснялось в предыдущем примере, обратите внимание, что стандартное отклонение здесь выше, поскольку мы рассматриваем данные как образец, а не всю генеральную совокупность.

Согласно указанным критериям, количество торговых единиц, которые могут быть рассмотрены, варьируется от 800 до 1500 единиц со средней стоимостью 1100 единиц. Полученное стандартное отклонение означает, что точки данных расположены не так близко друг к другу.

Это почти все. У вас есть все необходимое для начала работы с функцией DSTDEV в Google Таблицах. Я рекомендую поэкспериментировать с функцией DSTDEV, объединить ее с многочисленными доступными формулами Google Таблиц и посмотреть, что вы можете придумать.